OpenAI 最新开发者 AI 为 AI 代理带来搜索能力

OpenAI 发布了新的 Responses API，简化了创建和部署能独立执行任务的 AI 代理的过程。这项技术允许开发者构建具有文件搜索和互联网搜索能力的 AI 代理，以提高模型的准确性。尽管仍处于早期阶段，但 OpenAI 希望通过这一工具扩大其语言模型的市场份额，并推动 AI 代理技术的普及。

人工智能的未来将由 AI 代理主导，OpenAI 现在正通过让开发者构建自己的 AI 代理来加速这一进程。

今天，这家 AI 公司宣布推出新的 "Responses API"，该接口简化了创建和部署能够独立为用户执行任务的 AI 代理的过程。

Responses API 允许开发者创建由 OpenAI 大语言模型驱动的 AI 代理。该公司表示，这将最终取代现有的 Assistants API，后者将在约一年后退役。

OpenAI 表示，这项新服务将促进创建能够使用文件搜索工具来扫描公司内部数据集并搜索互联网的 AI 代理。这些功能类似于 OpenAI 最近发布的 Operator 代理，后者依赖于计算机使用代理 (CUA) 模型来帮助自动化数据输入等任务。

值得注意的是，OpenAI 此前已承认 CUA 模型在尝试自动化操作系统任务时不太可靠，且容易出错。因此，OpenAI 提醒开发者 Responses API 仍应被视为"早期迭代"，并表示其可靠性将随时间推移而提高。

在使用 Responses API 创建 AI 代理时，开发者可以选择两种模型：GPT-4o search 和 GPT-4o mini search。据该公司介绍，这两种模型都能够自主浏览网络以寻找问题的答案，并会引用其响应所依据的来源。

这是一项重要功能，因为 OpenAI 表示，搜索网络和扫描公司私有数据集的能力可以显著提高其模型的准确性，从而提高基于这些模型的代理的性能。该公司在其自己的 SimpleQA 基准测试中展示了具有搜索功能的模型的优越性，该基准测试旨在衡量 AI 系统的虚构率。

根据 OpenAI 的数据，GPT-4o search 达到了 90% 的得分，而 GPT-4o mini search 得分为 88%。相比之下，拥有更多参数且更强大的新 GPT-4.5 模型在同样的基准测试中仅得到 63% 的分数，这是因为它缺乏搜索额外信息的能力。

尽管如此，开发者应当记住，虽然这些模型带来了改进，但搜索功能并不能完全解决 AI 的虚构或幻觉问题。基准测试分数表明，GPT-4o search 在其响应中仍有约 10% 的事实性错误。对于许多代理式 AI 工作负载来说，这样的错误率可能高得令人无法接受。

不过，OpenAI 至少希望鼓励开发者开始尝试。除了 Responses API，它还发布了一个开源的 Agents SDK，提供了将 AI 模型和代理与内部系统集成的工具。它还提供了实施安全保护和监控 AI 代理活动的工具。这是继另一个名为 Swarm 的工具发布之后的举措，Swarm 为开发者提供了管理和编排多个 AI 代理的框架。

这些新工具都是为了增加 OpenAI 大语言模型的市场份额。根据代理式 AI 创业公司 SOCi Inc. 的市场洞察总监 Damian Rollison 的说法，该公司已经在新的 Apple Intelligence 套件中将 ChatGPT 嵌入到 Apple Inc. 的 Siri 中时使用了类似的策略，使其接触到新的用户群。

"新的 Responses API 为更广泛地接触和适应 AI 代理概念打开了可能性，这些 AI 代理可能会嵌入到他们已经在使用的各种工具中，" Rollison 说。

毫无疑问，一些开发者会急于看看他们能创造出什么样的 AI 代理，但重要的是要记住这些技术仍处于初期阶段，并不总是像一些用户声称的那样有效。本周早些时候，一家中国初创公司推出的名为 Manus 的 AI 代理在互联网上引起轰动，让一些早期使用者感到惊艳，但在更广泛使用后很快就显露出不足。

来源：SiliconANGLE

0赞

好文章，需要你的鼓励

OpenAI 最新开发者 AI 为 AI 代理带来搜索能力

来源：SiliconANGLE

2025

03/12

16:19

分享

点赞

情感AI的十字路口：从马斯克的虚拟伴侣到腾讯的共情革命

CoDesign 2025国际研讨会在大阪召开 共探高性能计算与AI融合新路径

自写互联网：Dfinity的Caffeine AI是否为应用开发者敲响警钟

Meta利用AI创造低碳混凝土并用于数据中心地板浇筑

Slack宣称其AI能够理解公司的专业术语和行话

Adobe新AI工具将搞怪噪音转换成逼真音效

AI是新的Android恶意软件吗？手机厂商争夺用户注意力的战争

NetBox Labs获得3500万美元融资推动基础设施运营现代化

边缘计算趋势：采用现状、挑战与未来展望

Liqid发布支持CXL 2.0内存池的可组合GPU服务器

Uber携手Lucid和Nuro部署2万辆自动驾驶出租车

Mistral的Le Chat聊天机器人推出"深度研究"模式，生产力大幅提升

AI 时代的数据中心：未来十年规划展望

AI 编程助手拒绝写代码，建议用户自学编程

超越 ChatGPT：通往通用人工智能的 5 大挑战

Oracle 在 AI 主流化方面具有重大优势

Snap 推出基于自研生成模型的 AI 视频滤镜

Google 的 Gemma 3：一款支持 128K 上下文窗口的开源单 GPU AI 模型

精灵宝可梦 GO 迎来新东家，而 Niantic 正借助 AI 和 AR 重塑地图业务

Google 的 Gemini 2.0 Flash 原生多模态 AI 图像生成功能给人留下深刻印象

Google 推出两款全新 AI 机器人控制模型

Nvidia 赢得了 AI 训练竞赛，但推理市场仍未尘埃落定

如果您非常迫切的想了解IT领域最新产品与技术信息，那么订阅至顶网技术邮件将是您的最佳途径之一

AWS re:Inforce：费城这天不只拼进球，还拼生成式AI安全

在欧洲之门马德里，我们再次见证了SAP激活企业增长的“飞轮”

IEEE专家委员胡凝：消解AI幻觉“阴影”，洞见“超级个体”价值锚点

生成式AI催生新物种，SaaS CRM掀起下半场变革战

关注官方公众号

关注官方微博

关注官方喜马拉雅

友情链接

业界热点:

CoDesign 2025国际研讨会在大阪召开共探高性能计算与AI融合新路径