Amazon 推出 Nova Act，一款可控制网页浏览器的 AI 代理

Amazon 发布了名为 Nova Act 的通用 AI 代理，可独立控制网页浏览器执行简单操作。同时推出 Nova Act SDK，供开发者构建原型。Nova Act 将为即将升级的 Alexa+ 提供核心功能。Amazon 称这是研究预览版，开发者可通过 nova.amazon.com 访问工具包。Nova Act 在内部测试中表现优异，是 Amazon AGI 实验室的首个公开产品。

Amazon 于周一发布了 Nova Act，这是一款通用型 AI 代理，能够接管网页浏览器并独立执行一些简单操作。与这款新型代理 AI 模型一同发布的还有 Nova Act SDK，这是一个允许开发者使用 Nova Act 构建代理原型的工具包。

Nova Act 由 Amazon 最近在旧金山成立的 AGI 实验室开发，将为该公司即将推出的 Alexa+ 升级版提供核心功能支持，这是 Amazon 流行语音助手的生成式 AI 增强版本。不过，今天发布的 Nova Act 版本相对不够完善，Amazon 将其称为研究预览版。

开发者可以通过新网站 nova.amazon.com 访问 Nova Act 工具包，该网站同时也展示了 Amazon 各种 Nova 基础模型。

Nova Act 是 Amazon 在通用 AI 代理技术领域对抗 OpenAI 的 Operator 和 Anthropic 的 Computer Use 的尝试。多家领先科技公司认为，能够为用户导航网页的 AI 代理将使当今的 AI 聊天机器人更加实用。

虽然 Amazon 并非最早开发这类代理技术的公司，但通过 Alexa+，它可能拥有最广泛的覆盖范围。

Amazon 表示，使用 Nova Act SDK 的开发者应该能够代表用户自动执行基本操作，比如从 Sweetgreen 订购沙拉或预订晚餐。通过 Nova Act 工具包，开发者可以整合各种工具，使 AI 代理能够浏览网页、填写表格或在日历上选择日期。

Amazon 声称，Nova Act 在公司的多项内部测试中的表现优于 OpenAI 和 Anthropic 的代理。例如，在测量 AI 代理如何与屏幕上的文本交互的 ScreenSpot Web Text 测试中，Nova Act 得分为 94%，超过了 OpenAI 的 CUA (88%) 和 Anthropic 的 Claude 3.7 Sonnet (90%)。

然而，Amazon 并未使用更常见的代理评估方法（如 WebVoyager）对 Nova Act 进行基准测试。

Nova Act 是 Amazon 上述 AGI 实验室推出的首个公开产品，该实验室由前 OpenAI 研究员 David Luan 和 Pieter Abbeel 共同领导。两人此前都创立过自己的创业公司——Luan 创立了 Adept，而 Abbeel 共同创立了 Covariant——去年被 Amazon 挖走后负责领导其 AI 代理项目。

虽然让 AGI 实验室开发能订购 SweetGreen 的 AI 代理可能看起来有些奇怪，但 Luan 告诉 TechCrunch，他认为代理是创建超智能 AI 系统的关键一步。Luan 将 AGI 定义为"能帮助你完成人类在计算机上所做任何事情的 AI 系统"。

Luan 表示，他的团队设计 Nova Act SDK 是为了可靠地自动化短小简单的任务，并为开发者提供工具，以精确定义何时需要人类介入代理工作流程。他希望这能让开发者创建更可靠的代理应用程序，尽管这些应用程序不一定是完全自主的。

Amazon 在一个竞争激烈的领域推出了首个通用型 AI 代理，这对公司来说是一项至关重要的技术。Nova Act 的早期测试可能会让我们窥见备受期待的 Alexa+ 的部分功能，这将是 Amazon AI 努力的一个关键时刻。

OpenAI、Google 和 Anthropic 早期 AI 代理的一个主要问题是它们在不同领域的可靠性。在 TechCrunch 的测试中，这些系统运行缓慢，难以长时间独立运作，并且容易犯人类不会犯的错误。不久我们就能看到 Amazon 是否已经找到解决方案，或者其代理是否也存在困扰竞争对手的相同缺陷。

来源：Techcrunch

0赞

好文章，需要你的鼓励

Amazon 推出 Nova Act，一款可控制网页浏览器的 AI 代理

来源：Techcrunch

2025

04/01

09:57

分享

点赞

数智时代，openGauss Summit 2025即将发布哪些技术创新破局

“算力+储能”深度融合：超智算发布分布式算力超级节点储能解决方案

联想推出DE6600系列：更智能的存储解决方案

创业公司如何在严格监管行业中实现生死攸关的创新

OpenAI发布GPT-5.2-Codex模型，软件工程自动化能力大幅提升

Waterfox浏览器宣布拒绝AI功能，瞄准Firefox忠实用户

TikTok美国业务出售交易将于下月完成

破局AI数据中心安全瓶颈：Fortinet联合NVIDIA引领隔离式加速新航向

智算中心进化论，科华数据如何做到“更懂”

更高负载、更快建设：2026年数据中心六大趋势

Snowflake数据库更新引发全球大规模服务中断

AI编程初创公司Lovable融资3.3亿美元，英伟达等科技巨头支持

企业专用 AI 语音模型新秀：aiOla 推出 Jargonic，号称在企业术语识别方面优于竞品

AI 视频新进展：Runway 推出 Gen-4 模型，声称实现了 AI 视频的连贯性突破

OpenAI 4o 图像生成器：AI 重塑动漫创作新时代

深度伪造技术会危害您的健康吗？

INCYMO 推出基于 AI 的移动游戏创意广告平台

Databricks 与 Anthropic、Palantir 达成企业 AI 合作

AI 时代，你是否面临主体性衰退的风险？

Apple 计划明年推出 Project Mulberry，打造"虚拟医生"服务

信用授予有方：深入解析 Experian 改变金融服务可及性的 AI 框架

AI 代理即将接管你的工作任务 - 这是应对之道

如果您非常迫切的想了解IT领域最新产品与技术信息，那么订阅至顶网技术邮件将是您的最佳途径之一

2025 re:Invent ：亚马逊云科技把Agentic AI生态梳理明白了

电子竞技瞬息万变，Team Liquid的“数据+AI”制胜秘籍

中国移动呼和浩特数据中心：只有高效存力先行，AI才能跑出全力

从“支撑工具”到“智能中枢”，AI原生ERP进化

关注官方公众号

关注官方微博

关注官方喜马拉雅

友情链接

业界热点: