Amazon 于周一发布了 Nova Act,这是一款通用型 AI 代理,能够接管网页浏览器并独立执行一些简单操作。与这款新型代理 AI 模型一同发布的还有 Nova Act SDK,这是一个允许开发者使用 Nova Act 构建代理原型的工具包。
Nova Act 由 Amazon 最近在旧金山成立的 AGI 实验室开发,将为该公司即将推出的 Alexa+ 升级版提供核心功能支持,这是 Amazon 流行语音助手的生成式 AI 增强版本。不过,今天发布的 Nova Act 版本相对不够完善,Amazon 将其称为研究预览版。
开发者可以通过新网站 nova.amazon.com 访问 Nova Act 工具包,该网站同时也展示了 Amazon 各种 Nova 基础模型。
Nova Act 是 Amazon 在通用 AI 代理技术领域对抗 OpenAI 的 Operator 和 Anthropic 的 Computer Use 的尝试。多家领先科技公司认为,能够为用户导航网页的 AI 代理将使当今的 AI 聊天机器人更加实用。
虽然 Amazon 并非最早开发这类代理技术的公司,但通过 Alexa+,它可能拥有最广泛的覆盖范围。
Amazon 表示,使用 Nova Act SDK 的开发者应该能够代表用户自动执行基本操作,比如从 Sweetgreen 订购沙拉或预订晚餐。通过 Nova Act 工具包,开发者可以整合各种工具,使 AI 代理能够浏览网页、填写表格或在日历上选择日期。
Amazon 声称,Nova Act 在公司的多项内部测试中的表现优于 OpenAI 和 Anthropic 的代理。例如,在测量 AI 代理如何与屏幕上的文本交互的 ScreenSpot Web Text 测试中,Nova Act 得分为 94%,超过了 OpenAI 的 CUA (88%) 和 Anthropic 的 Claude 3.7 Sonnet (90%)。
然而,Amazon 并未使用更常见的代理评估方法(如 WebVoyager)对 Nova Act 进行基准测试。
Nova Act 是 Amazon 上述 AGI 实验室推出的首个公开产品,该实验室由前 OpenAI 研究员 David Luan 和 Pieter Abbeel 共同领导。两人此前都创立过自己的创业公司——Luan 创立了 Adept,而 Abbeel 共同创立了 Covariant——去年被 Amazon 挖走后负责领导其 AI 代理项目。
虽然让 AGI 实验室开发能订购 SweetGreen 的 AI 代理可能看起来有些奇怪,但 Luan 告诉 TechCrunch,他认为代理是创建超智能 AI 系统的关键一步。Luan 将 AGI 定义为"能帮助你完成人类在计算机上所做任何事情的 AI 系统"。
Luan 表示,他的团队设计 Nova Act SDK 是为了可靠地自动化短小简单的任务,并为开发者提供工具,以精确定义何时需要人类介入代理工作流程。他希望这能让开发者创建更可靠的代理应用程序,尽管这些应用程序不一定是完全自主的。
Amazon 在一个竞争激烈的领域推出了首个通用型 AI 代理,这对公司来说是一项至关重要的技术。Nova Act 的早期测试可能会让我们窥见备受期待的 Alexa+ 的部分功能,这将是 Amazon AI 努力的一个关键时刻。
OpenAI、Google 和 Anthropic 早期 AI 代理的一个主要问题是它们在不同领域的可靠性。在 TechCrunch 的测试中,这些系统运行缓慢,难以长时间独立运作,并且容易犯人类不会犯的错误。不久我们就能看到 Amazon 是否已经找到解决方案,或者其代理是否也存在困扰竞争对手的相同缺陷。
好文章,需要你的鼓励
机器人和自动化工具已成为云环境中最大的安全威胁,网络犯罪分子率先应用自动化决策来窃取凭证和执行恶意活动。自动化攻击显著缩短了攻击者驻留时间,从传统的数天减少到5分钟内即可完成数据泄露。随着大语言模型的发展,"黑客机器人"将变得更加先进。企业面临AI快速采用压力,但多数组织错误地关注模型本身而非基础设施安全。解决方案是将AI工作负载视为普通云工作负载,应用运行时安全最佳实践。
MBZUAI研究团队发布了史上最大的开源数学训练数据集MegaMath,包含3716亿个Token,是现有开源数学数据集的数十倍。该数据集通过创新的数据处理技术,从网页、代码库和AI合成等多个来源收集高质量数学内容。实验显示,使用MegaMath训练的AI模型在数学推理任务上性能显著提升,为AI数学能力发展提供了强大支撑。
面对心理健康专业人士短缺问题,谷歌、麦肯锡和加拿大重大挑战组织联合发布《心理健康与AI现场指南》,提出利用AI辅助任务分担模式。该指南构建了包含项目适应、人员选择、培训、分配、干预和完成六个阶段的任务分担模型,AI可在候选人筛选、培训定制、客户匹配、预约调度和治疗建议等环节发挥作用。该方法通过将部分治疗任务分配给经过培训的非专业人员,并运用AI进行管理支持,有望缓解治疗服务供需失衡问题。
这项由多个知名机构联合开展的研究揭示了AI系统的"隐形思维"——潜在推理。不同于传统的链式思维推理,潜在推理在AI内部连续空间中进行,不受语言表达限制,信息处理能力提升约2700倍。研究将其分为垂直递归和水平递归两类,前者通过重复处理增加思考深度,后者通过状态演化扩展记忆容量。