OpenAI 推出新工具助力企业构建 AI 代理

OpenAI于周二发布了新工具，旨在帮助开发者和企业使用公司的AI模型和框架构建AI代理——能够独立完成任务的自动化系统。

本周二，OpenAI 发布了新工具，旨在帮助开发者和企业使用该公司的 AI 模型和框架构建 AI 代理 - 这些代理是能够独立完成任务的自动化系统。

这些工具是 OpenAI 新推出的 Responses API 的一部分，企业可以通过该 API 开发自定义 AI 代理，实现网络搜索、公司文件扫描和网站导航等功能，类似于 OpenAI 的 Operator 产品。Responses API 将有效替代 OpenAI 的 Assistants API，后者计划在 2026 年上半年停用。

尽管科技行业还在努力向人们展示或定义"AI 代理"的真正含义，但近年来围绕 AI 代理的热度却显著增长。最近的一个例子是，中国初创公司蝴蝶效应本周早些时候因其新的 AI 代理平台 Manus 而走红，但用户很快发现该平台并未实现公司承诺的许多功能。

换句话说，OpenAI 在 AI 代理领域面临着很大的压力。

OpenAI 的 API 产品负责人 Olivier Godemont 在接受 TechCrunch 采访时表示："展示 AI 代理的 demo 很容易，但要实现规模化却很困难，让人们经常使用更是难上加难。"

今年早些时候，OpenAI 在 ChatGPT 中引入了两个 AI 代理：能够代表用户浏览网站的 Operator 和能够编写研究报告的深度研究工具。这两个工具展示了代理技术的潜力，但在"自主性"方面仍有待提高。

现在通过 Responses API，OpenAI 希望出售支持 AI 代理的底层组件，让开发者能够构建自己的类似 Operator 和深度研究的代理应用。OpenAI 希望开发者能够使用其代理技术创建比当前更具自主性的应用。

使用 Responses API，开发者可以调用与 OpenAI ChatGPT 搜索工具相同的 AI 模型 (预览版)：GPT-4o search 和 GPT-4o mini search。这些模型可以浏览网页寻找问题的答案，并在生成回复时引用来源。

OpenAI 表示，GPT-4o search 和 GPT-4o mini search 具有很高的事实准确性。在该公司的 SimpleQA 基准测试中 (用于衡量模型回答简短事实性问题的能力)，GPT-4o search 得分为 90%，GPT-4o mini search 得分为 88% (分数越高越好)。相比之下，OpenAI 最近发布的更大型模型 GPT-4.5 仅得分 63%。

AI 搜索工具比传统 AI 模型更准确并不令人意外 - 理论上，GPT-4o search 可以直接查找正确答案。但是，网络搜索并未完全解决幻觉问题。除了事实准确性之外，AI 搜索工具在处理简短的导航查询时 (如"湖人队今天比分")仍然存在困难，最近的报告也表明 ChatGPT 的引用并不总是可靠的。

Responses API 还包括一个文件搜索工具，可以快速扫描公司数据库中的文件以检索信息 (OpenAI 表示不会使用这些文件训练模型)。此外，使用 Responses API 的开发者可以调用支持 Operator 的 Computer-Using Agent (CUA) 模型。该模型可以生成鼠标和键盘操作，使开发者能够自动化数据输入和应用工作流等计算机使用任务。

OpenAI 表示，企业可以选择在自己的系统上本地运行 CUA 模型 (研究预览版)。Operator 中提供的消费者版 CUA 只能在网络上执行操作。

需要明确的是，Responses API 不会解决当前困扰 AI 代理的所有技术问题。

在博客文章中，OpenAI 表示 CUA 模型"在操作系统任务自动化方面的可靠性尚未达到较高水平"，而且容易出现"无意"的错误。

但是，OpenAI 表示这些只是其代理工具的早期版本，公司正在不断改进。

随着 Responses API 一起发布的还有一个名为 Agents SDK 的开源工具包，为开发者提供免费工具，用于将模型与内部系统集成、设置安全措施，以及监控 AI 代理活动以进行调试和优化。Agents SDK 是 OpenAI 去年年底发布的多代理编排框架 Swarm 的一个后续产品。

Godemont 表示，他希望 OpenAI 今年能够弥合 AI 代理演示和产品之间的差距，他认为"代理是 AI 最具影响力的应用"。这呼应了 OpenAI CEO Sam Altman 在一月份的宣言：2025 年将是 AI 代理进入劳动力市场的一年。

无论 2025 年是否真的会成为"AI 代理之年"，OpenAI 的最新发布表明该公司希望从炫目的代理演示转向实用的工具。

来源：Techcrunch

0赞

好文章，需要你的鼓励

OpenAI 推出新工具助力企业构建 AI 代理

来源：Techcrunch

2025

03/12

14:50

分享

点赞

CES 2026：日立与英伟达、谷歌云、Nozomi Networks达成合作协议

2026年科技行业多元化发展前景与挑战预测

智能体AI推动云安全策略根本性变革

Salesforce推出AI能力框架助力企业数字化转型

大众汽车牵手高通打造智能网联座舱体验

Ruby 4.0.0发布：引入ZJIT编译器和Ruby Box隔离技术

Meta签约三家核能公司为AI数据中心提供6.6吉瓦电力

大多数开发者不信任AI生成代码却不检查

大规模数据中心安全防护中人员因素的关键作用

HPE OneView严重漏洞遭野外攻击利用

安联保险与Anthropic达成全球合作加速负责任AI应用

智能硬件助力Apple Home：Flic物理按钮控制解决方案

AI 时代的数据中心：未来十年规划展望

AI 编程助手拒绝写代码，建议用户自学编程

超越 ChatGPT：通往通用人工智能的 5 大挑战

Oracle 在 AI 主流化方面具有重大优势

Snap 推出基于自研生成模型的 AI 视频滤镜

Google 的 Gemma 3：一款支持 128K 上下文窗口的开源单 GPU AI 模型

精灵宝可梦 GO 迎来新东家，而 Niantic 正借助 AI 和 AR 重塑地图业务

Google 的 Gemini 2.0 Flash 原生多模态 AI 图像生成功能给人留下深刻印象

Google 推出两款全新 AI 机器人控制模型

Nvidia 赢得了 AI 训练竞赛，但推理市场仍未尘埃落定

如果您非常迫切的想了解IT领域最新产品与技术信息，那么订阅至顶网技术邮件将是您的最佳途径之一

CES 2026

2025 re:Invent ：亚马逊云科技把Agentic AI生态梳理明白了

电子竞技瞬息万变，Team Liquid的“数据+AI”制胜秘籍

中国移动呼和浩特数据中心：只有高效存力先行，AI才能跑出全力

关注官方公众号

关注官方微博

关注官方喜马拉雅

友情链接

业界热点: