OpenAI于周三宣布对其Agents SDK进行重大更新,将这一原本功能相对基础、设计较为宽松的模型无关SDK,升级为一套面向生产环境的完整智能体工具箱。
最初版本SDK推出距今已逾一年。据OpenAI Responses API技术负责人Steve Coffey介绍,最初的SDK本质上是为聊天机器人场景而构建的。彼时,模型在一次工作流中大约只能执行五到七个步骤,难以更进一步。"而现在,我们的模型已经可以持续工作数小时、数天乃至数周。"
过去一年间,OpenAI陆续为SDK增添了多项功能,包括对MCP的支持、Temporal的持久化执行工具,以及其他第三方工具和服务的集成。不过Coffey也坦言,该SDK目前仍处于1.0之前的阶段,"我们计划进一步完善它。"
沙盒隔离:本次更新的核心亮点
本次更新最受瞩目的特性,是开发者现在可以为智能体提供受控的独立工作空间。其核心理念在于将智能体运行框架与计算资源相分离,从而保障安全性与持久性,同时支持系统在需要时灵活扩展。
这些沙盒几乎可以是任意类型的容器或虚拟机。开发者可以沿用自有容器基础设施,也可以借助Blaxel、Cloudflare、Daytona、E2B、Modal、Runloop和Vercel等平台的工具来创建智能体沙盒。智能体既可使用单一沙盒,也可在需要时启动额外沙盒,或是启动在各自独立沙盒环境中运行的子智能体。
Coffey解释道,借助这一机制,SDK可以作为Temporal任务运行,智能体则在Modal沙盒或Docker容器中执行。"这两者彼此高度隔离。工具调用运行在非特权环境中,而Modal生成的所有代码则运行在特权环境中。"
安全与企业级部署
安全性同样是此次更新的重要考量,尤其对大型企业而言。Coffey指出,个人开发者在处理一次性任务时或许不太在意安全问题,"但另一个极端是大规模企业部署场景,在那里你会非常关注智能体是否运行在完全经过审批的环境中。沙盒中不应存放任何API密钥或敏感凭证,整个环境需要完全隔离,在很多情况下还需要与网络隔离,禁止任何出站访问。"
在沙盒内部,智能体可以调用Shell和文件系统,处理文本文件、图像或PDF等内容。开发者当然也可以自定义智能体可使用的其他工具。
数据访问与状态管理
智能体同样需要访问数据。开发者可以挂载本地文件、AWS S3存储桶、Google Cloud Storage、Azure Blob Storage以及Cloudflare R2,这也使沙盒具备一定的状态保持能力。"如果你希望对容器进行快照,关闭后再以相同的文件系统重新启动,我们正在为此添加支持,"Coffey表示。
即便不使用沙盒,基于Agents SDK构建的智能体现在也支持可配置的记忆功能,以及对文件和文档的处理能力,不过OpenAI预计大多数生产系统仍将采用沙盒化部署方式。
与此前一样,Agents SDK本身不额外收费,用户按照OpenAI标准定价,仅为通过API消耗的Token和工具调用付费。
Q&A
Q1:OpenAI Agents SDK的沙盒功能是什么?有什么用?
A:沙盒是为智能体提供的受控独立工作空间,核心目的是将智能体运行框架与计算资源分离,保障安全性与可持续性,同时支持按需扩展。沙盒可以是任意类型的容器或虚拟机,支持Cloudflare、Vercel、Modal等多个平台,智能体可在其中访问文件系统、执行Shell命令,并可挂载AWS S3、Google Cloud Storage等外部存储。
Q2:使用OpenAI Agents SDK需要额外付费吗?
A:不需要。Agents SDK本身不额外收费,用户只需按照OpenAI的标准定价,为通过API实际消耗的Token数量和工具调用付费即可,没有平台附加费用。
Q3:OpenAI Agents SDK更新后和之前版本相比有哪些主要变化?
A:原版SDK主要面向聊天机器人场景,模型单次工作流只能执行约五到七个步骤。新版本引入了沙盒隔离环境、可配置记忆、文件与文档支持,并集成了MCP、Temporal持久化执行等工具,使智能体能够持续运行数小时乃至数周,真正面向生产环境部署。
好文章,需要你的鼓励
穆拉蒂时隔18个月首次接受重大媒体采访,介绍其创立的Thinking Machines Lab正在开发的"交互模型"。该模型能以200毫秒间隔处理音频、文本和视频流,捕捉人类交流中的中断、修正和停顿。她还谈及OpenAI"政变周"经历,强调行业决策权过于集中的担忧,并回应了公司近期研究人员离职问题,表示这是初创实验室的正常波动。
STATE16研究院这篇综述发现,物理AI系统存在"静默失效"风险——AI以高度自信执行基于错误世界信息的动作,却不触发任何报警,并提出在AI输出与物理执行之间建立独立授权层的框架。
本期《Quick Charge》播客涵盖多个热点话题:特斯拉疑似试图删除FSD欺诈相关证据以规避巨额赔付;卡特彼勒持续推进建筑领域电气化布局;住宅太阳能30%税收抵免即将到期。此外,嘉宾Tom Pacheco就高压系统与电池技术培训展开探讨,强调电动车技术人才培养的紧迫性。节目同时提醒有意安装太阳能的用户尽快行动,可通过EnergySage平台比较多家安装商报价。
UIUC与微软联合研发的OpenWebRL框架让4B小模型仅凭400条初始数据,通过在真实网站上边做边学的强化学习方式,在网页智能体基准上超越了用27万条数据训练的竞争对手。