OpenAI 发布 Responses API 和开源 Agents SDK，让开发者能够构建自己的 Deep Research 和 Operator

OpenAI 正在推出一套新的 API 和工具，旨在帮助开发者和企业更高效地构建基于 AI 的代理，这些代理基于 OpenAI 自家首个 AI 代理 Deep Research 和 Operator 的技术。Deep Research 独立搜索互联网，生成丰富、组织良好且有引用的报告，而 Operator 则根据用户的文本指令自主控制网页浏览器光标并执行诸如查找体育票或进行预订等操作。

OpenAI 正在推出一套全新的 API 和工具，旨在帮助开发者和企业更高效地构建 AI 代理。这些技术正是驱动其自家 AI 代理 Deep Research (可以独立搜索互联网，生成深入研究、组织完善且有引用的报告) 和 Operator (基于用户文本指令控制网页浏览器光标，自主执行如查找体育票务或预订等操作) 的核心技术。

现在，开发者可以访问这些强大的 OpenAI 一方代理背后的构建模块，从而开发自己的第三方竞品，或者针对特定用例和受众开发更专业的产品和服务。

OpenAI 在推理、多模态处理和安全机制方面的最新进展，特别是其"o"系列推理模型 (o1 和 o3)，为这些功能奠定了基础。

OpenAI 平台产品负责人 Olivier Godement 在与 VentureBeat 的视频通话中表示："很难夸大推理模型对于实现 AI 代理的重要性。此前最大的限制之一是处理长期规划等任务。"

为了解决这些障碍，OpenAI 推出了几项新产品：Responses API、内置的网络和文件搜索工具、计算机使用工具以及开源的 Agents SDK。

这些工具旨在通过减少大量提示工程和自定义编排逻辑的需求，来简化 AI 代理的开发。即使面对来自中国玩家如 Manus、阿里巴巴的 Qwen、DeepSeek，以及本土竞争对手如 Anthropic 和 Google 的日益激烈的竞争，这些工具仍然使得继续在 OpenAI 平台上构建成为一个极具吸引力的选择。

Agents SDK 提供开源工具，支持构建基于非 OpenAI 模型的代理

OpenAI 以开源方式重返市场，发布了 Agents SDK，这是一个帮助开发者管理、协调和优化代理工作流程的工具包。该工具包甚至支持构建由其他非 OpenAI 模型驱动的代理，如来自竞争对手 Anthropic 和 Google 的模型，或来自 DeepSeek、Qwen、Mistral 和 Meta 的 Llama 系列开源模型。

SDK 提供以下关键特性： o 可配置代理 - 具有预定义指令和工具访问权限的 AI 模型 o 智能交接 - 根据上下文在代理之间转移任务的机制 o 内置护栏 - 用于输入验证和内容审核的安全措施 o 追踪和可观察性 - 用于调试和优化代理性能的工具

Responses API 提供的新功能

这次更新的核心是 Responses API，它将 OpenAI 的 Chat Completions API 的特性与 Assistants API 的工具使用功能相结合。该集成允许开发者在单个 API 调用中利用多个内置工具，更容易构建需要复杂、多步骤交互的应用程序。

Responses API 最初支持三个内置工具： o 网络搜索 - 通过从网络获取信息提供实时、带引用的答案 o 文件搜索 - 使用元数据过滤和优化的查询处理从大型文档库中检索相关信息 o 计算机使用工具 - 使 AI 代理能够在计算机上执行操作，如浏览、数据输入和导航软件界面

网络搜索：提供实时信息和引用

网络搜索工具允许开发者将实时搜索功能集成到他们的应用中，这对研究助手、购物指南和内容聚合工具很有用。它为其响应提供来源，确保用户可以验证信息的准确性。

文件搜索：私有云上的智能文档检索

使用文件搜索工具，AI 代理可以从大型文档集合中快速检索相关信息。该工具支持多种文件格式，包括查询优化、元数据过滤和自定义排名等功能，以获得更精确的结果。

文件搜索工具的定价为每千次查询 2.50 美元，存储费用为每 GB 每天 0.10 美元 (第一个 GB 免费)。

计算机使用工具：访问 OpenAI Operator 的核心技术

计算机使用工具通过允许 AI 与计算机界面交互，将代理功能扩展到简单的基于文本的任务之外。该工具由 OpenAI 的计算机使用代理 (CUA) 模型驱动，将 AI 生成的操作转换为可执行命令，实现数据输入和网络导航等任务的自动化。

该工具目前作为研究预览版向使用层级 3-5 的选定开发者开放。定价为每百万输入 token 3 美元，每百万输出 token 12 美元。

对企业领导者的意义

对于 IT 团队领导、CTO 和中层管理者来说，OpenAI 的新工具为自动化和扩展 AI 驱动的流程提供了清晰的路径，而无需大量自定义开发。

内置的网络搜索和文件搜索功能允许企业快速将 AI 驱动的信息检索集成到现有系统中，而计算机使用工具则能够实现与缺乏 API 访问的传统应用程序的自动化交互。

开源 Agents SDK 进一步赋能组织协调团队间的 AI 驱动工作流程，使部署能够提高客户支持、文档处理和市场研究等领域效率的代理变得更加容易。

未来展望

OpenAI 将这些新发布视为构建全面 AI 代理平台的第一步。该公司计划在未来几个月推出更多工具和集成，以帮助开发者更有效地部署、评估和扩展代理应用。

OpenAI 还表示将继续改进代理应用的安全功能，包括防止提示注入和未授权数据访问的保护措施。

感兴趣的开发者现在就可以探索 OpenAI 的文档和 API 演练场开始使用这些新工具。

来源：VentureBeat

0赞

好文章，需要你的鼓励

OpenAI 发布 Responses API 和开源 Agents SDK，让开发者能够构建自己的 Deep Research 和 Operator

来源：VentureBeat

2025

03/12

17:00

分享

点赞

WAIC2026 现场直击：开普勒顶流人气王，麒麟系列火爆出圈

面壁智能将密度定律带入具身智能

龙磁科技拟投3.58亿元扩建越南永磁铁氧体基地

首创一层Scale-up网络256卡全互联，摩尔线程MTT C256超节点为万卡及十万卡级集群夯实底座

从高血压诊疗入手，北京安贞医院让医疗大模型走出聊天框

西门子肖松：以场景为牵引，推动工业AI从单点实效迈向生产力跃迁

打造Token极致性价比 新华三震撼亮相2026世界人工智能大会

机器人管家系统上线！傅利叶携多款康养陪伴新品方案亮相WAIC 2026

赛那德“ 自主作业机器人天团” 登陆 WAIC：iLoabot-X+模型双升级，秀出具身场景落地硬实力

西门子Eigen工程智能体中国首发首展，荣获2026 WAIC SAIL之星奖

NVIDIA Cosmos 推动物理 AI 前沿发展

PPIO亮相WAIC 2026：发布智能模型网关，打造面向Agent时代的智能Token工厂

AI 时代的数据中心：未来十年规划展望

AI 编程助手拒绝写代码，建议用户自学编程

超越 ChatGPT：通往通用人工智能的 5 大挑战

Oracle 在 AI 主流化方面具有重大优势

Snap 推出基于自研生成模型的 AI 视频滤镜

Google 的 Gemma 3：一款支持 128K 上下文窗口的开源单 GPU AI 模型

精灵宝可梦 GO 迎来新东家，而 Niantic 正借助 AI 和 AR 重塑地图业务

Google 的 Gemini 2.0 Flash 原生多模态 AI 图像生成功能给人留下深刻印象

Google 推出两款全新 AI 机器人控制模型

Nvidia 赢得了 AI 训练竞赛，但推理市场仍未尘埃落定

如果您非常迫切的想了解IT领域最新产品与技术信息，那么订阅至顶网技术邮件将是您的最佳途径之一

三一集团：数字化是必选项，AI是生存项

因湃电池 × 达索系统：如何共创出一套电池产业最佳实践

AI走进真实世界之后：安全、健康与产业的新命题

CES 2026

关注官方公众号

关注官方微博

关注官方喜马拉雅

友情链接

业界热点:

打造Token极致性价比新华三震撼亮相2026世界人工智能大会