OpenAI 通过新开发者 API 提升 AI 代理能力

AI 行业正在努力将“代理”——能够代表用户执行多步骤操作的 AI 驱动软件——变为现实。包括谷歌在内的多家科技公司最近强调了代理功能，OpenAI 首席执行官山姆·阿尔特曼在一月份表示，2025 年将是 AI 代理“加入劳动力”的一年。

AI 行业正在全力推动"代理"（agents）的发展——这些由 AI 驱动的软件可以代表用户执行多步骤操作。包括 Google 在内的多家科技公司最近都在强调代理特性，今年 1 月，OpenAI 首席执行官 Sam Altman 表示，2025 年将是 AI 代理"加入劳动力大军"的一年。

OpenAI 正在努力将这一承诺变为现实。周二，OpenAI 推出了新的"Responses API"，旨在帮助软件开发者创建能够使用该公司 AI 模型独立执行任务的 AI 代理。Responses API 最终将取代当前的 Assistants API，OpenAI 计划在 2026 年上半年停用后者。

通过这项新服务，用户可以开发自定义 AI 代理，使用文件搜索工具快速检索公司数据库（OpenAI 承诺不会用这些文件训练其模型），并浏览网站——这类似于 OpenAI 的 Operator 代理所提供的功能。开发者还可以访问其底层的计算机使用代理 (CUA) 模型，以实现数据录入等任务的自动化。

不过，OpenAI 承认其 CUA 模型在操作系统任务自动化方面尚不够可靠，可能会产生意外错误。该公司将这个新 API 描述为早期版本，并将继续改进。

使用 Responses API 的开发者可以访问驱动 ChatGPT Search 的相同模型：GPT-4o search 和 GPT-4o mini search。这些模型可以浏览网络来回答问题，并在回答中引用来源。

值得注意的是，OpenAI 表示，增加的网络搜索能力显著提高了其 AI 模型的事实准确性。在 OpenAI 的 SimpleQA 基准测试（旨在衡量虚构率）中，GPT-4o search 得分为 90%，GPT-4o mini search 达到 88%——两者都大大超过了没有搜索功能的更大型 GPT-4.5 模型的 63% 的得分。

尽管有这些改进，该技术仍存在重要限制。除了 CUA 在正确浏览网站方面的问题外，改进的搜索功能并未完全解决 AI 虚构的问题，GPT-4o search 仍有 10% 的事实错误率。

除了 Responses API，OpenAI 还发布了开源的 Agents SDK，为开发者提供免费工具，用于将模型与内部系统集成、实施安全保护措施，以及监控代理活动。这个工具包是继 OpenAI 早前发布的用于协调多个代理的 Swarm 框架之后的又一举措。

AI 代理领域仍处于早期阶段，未来可能会快速进步。然而，目前 AI 代理运动仍容易受到不切实际宣传的影响。本周早些时候，用户发现中国初创公司蝴蝶效应的 Manus AI 代理平台未能实现其许多承诺，突显了这一新兴技术类别中宣传主张与实际功能之间持续存在的差距。

来源：Arstechnica

0赞

好文章，需要你的鼓励

OpenAI 通过新开发者 API 提升 AI 代理能力

来源：Arstechnica

2025

03/12

16:20

分享

点赞

“4个9”韧性的背后，西云数据以技术与运营加速企业数字化创新

Google力推手机AI功能引发关注

Meta发布AI翻译功能，支持脸书和Instagram内容实时转换

HPE发布Nvidia Blackwell驱动的AI服务器，抢占AI市场需求

ISACA推出AI安全管理高级认证项目

谷歌推出智能体SOC系统提升安全事件响应速度

Lumen升级400GB数据中心连接基础设施助力AI发展

AI和流媒体推动，2030年面临"网络危机"

Pine64停产Pro手机转向RISC-V业务

日立Vantara将VSP One块存储扩展至Azure云平台

Finchetto光学数据包交换机：光无法存储的技术挑战与突破

Python开发者调查显示增长强劲，但基金会资金面临困境

AI 时代的数据中心：未来十年规划展望

AI 编程助手拒绝写代码，建议用户自学编程

超越 ChatGPT：通往通用人工智能的 5 大挑战

Oracle 在 AI 主流化方面具有重大优势

Snap 推出基于自研生成模型的 AI 视频滤镜

Google 的 Gemma 3：一款支持 128K 上下文窗口的开源单 GPU AI 模型

精灵宝可梦 GO 迎来新东家，而 Niantic 正借助 AI 和 AR 重塑地图业务

Google 的 Gemini 2.0 Flash 原生多模态 AI 图像生成功能给人留下深刻印象

Google 推出两款全新 AI 机器人控制模型

Nvidia 赢得了 AI 训练竞赛，但推理市场仍未尘埃落定

如果您非常迫切的想了解IT领域最新产品与技术信息，那么订阅至顶网技术邮件将是您的最佳途径之一

关于AI Agent落地，李开复强调了两件事：“价值交付”和“一把手工程”

AWS re:Inforce：费城这天不只拼进球，还拼生成式AI安全

在欧洲之门马德里，我们再次见证了SAP激活企业增长的“飞轮”

IEEE专家委员胡凝：消解AI幻觉“阴影”，洞见“超级个体”价值锚点

关注官方公众号

关注官方微博

关注官方喜马拉雅

友情链接

业界热点: