OpenAI于周三宣布对其Agents SDK进行重大更新,将这一原本功能相对基础、设计较为宽松的模型无关SDK,升级为一套面向生产环境的完整智能体工具箱。
最初版本SDK推出距今已逾一年。据OpenAI Responses API技术负责人Steve Coffey介绍,最初的SDK本质上是为聊天机器人场景而构建的。彼时,模型在一次工作流中大约只能执行五到七个步骤,难以更进一步。"而现在,我们的模型已经可以持续工作数小时、数天乃至数周。"
过去一年间,OpenAI陆续为SDK增添了多项功能,包括对MCP的支持、Temporal的持久化执行工具,以及其他第三方工具和服务的集成。不过Coffey也坦言,该SDK目前仍处于1.0之前的阶段,"我们计划进一步完善它。"
沙盒隔离:本次更新的核心亮点
本次更新最受瞩目的特性,是开发者现在可以为智能体提供受控的独立工作空间。其核心理念在于将智能体运行框架与计算资源相分离,从而保障安全性与持久性,同时支持系统在需要时灵活扩展。
这些沙盒几乎可以是任意类型的容器或虚拟机。开发者可以沿用自有容器基础设施,也可以借助Blaxel、Cloudflare、Daytona、E2B、Modal、Runloop和Vercel等平台的工具来创建智能体沙盒。智能体既可使用单一沙盒,也可在需要时启动额外沙盒,或是启动在各自独立沙盒环境中运行的子智能体。
Coffey解释道,借助这一机制,SDK可以作为Temporal任务运行,智能体则在Modal沙盒或Docker容器中执行。"这两者彼此高度隔离。工具调用运行在非特权环境中,而Modal生成的所有代码则运行在特权环境中。"
安全与企业级部署
安全性同样是此次更新的重要考量,尤其对大型企业而言。Coffey指出,个人开发者在处理一次性任务时或许不太在意安全问题,"但另一个极端是大规模企业部署场景,在那里你会非常关注智能体是否运行在完全经过审批的环境中。沙盒中不应存放任何API密钥或敏感凭证,整个环境需要完全隔离,在很多情况下还需要与网络隔离,禁止任何出站访问。"
在沙盒内部,智能体可以调用Shell和文件系统,处理文本文件、图像或PDF等内容。开发者当然也可以自定义智能体可使用的其他工具。
数据访问与状态管理
智能体同样需要访问数据。开发者可以挂载本地文件、AWS S3存储桶、Google Cloud Storage、Azure Blob Storage以及Cloudflare R2,这也使沙盒具备一定的状态保持能力。"如果你希望对容器进行快照,关闭后再以相同的文件系统重新启动,我们正在为此添加支持,"Coffey表示。
即便不使用沙盒,基于Agents SDK构建的智能体现在也支持可配置的记忆功能,以及对文件和文档的处理能力,不过OpenAI预计大多数生产系统仍将采用沙盒化部署方式。
与此前一样,Agents SDK本身不额外收费,用户按照OpenAI标准定价,仅为通过API消耗的Token和工具调用付费。
Q&A
Q1:OpenAI Agents SDK的沙盒功能是什么?有什么用?
A:沙盒是为智能体提供的受控独立工作空间,核心目的是将智能体运行框架与计算资源分离,保障安全性与可持续性,同时支持按需扩展。沙盒可以是任意类型的容器或虚拟机,支持Cloudflare、Vercel、Modal等多个平台,智能体可在其中访问文件系统、执行Shell命令,并可挂载AWS S3、Google Cloud Storage等外部存储。
Q2:使用OpenAI Agents SDK需要额外付费吗?
A:不需要。Agents SDK本身不额外收费,用户只需按照OpenAI的标准定价,为通过API实际消耗的Token数量和工具调用付费即可,没有平台附加费用。
Q3:OpenAI Agents SDK更新后和之前版本相比有哪些主要变化?
A:原版SDK主要面向聊天机器人场景,模型单次工作流只能执行约五到七个步骤。新版本引入了沙盒隔离环境、可配置记忆、文件与文档支持,并集成了MCP、Temporal持久化执行等工具,使智能体能够持续运行数小时乃至数周,真正面向生产环境部署。
好文章,需要你的鼓励
无人机食品配送服务商Flytrex与全球知名披萨连锁品牌Little Caesars宣布合作,推出全新Sky2无人机,最大载重达4公斤,可一次配送两个大披萨及饮料,满足全家用餐需求。Sky2支持最远6.4公里的配送范围,平均从起飞到送达仅需4.5分钟。首个试点门店已在德克萨斯州怀利市上线,并实现与Little Caesars订单系统的直接集成。
FORTIS是专门测量AI代理"越权行为"的基准测试,研究发现十款顶尖模型普遍选择远超任务需要的高权限技能,端到端成功率最高仅14.3%。
法国社会住房项目ViliaSprint?已正式完工,成为欧洲最大的3D打印多户住宅建筑,共12套公寓,建筑面积800平方米。项目由PERI 3D Construction使用COBOD BOD2打印机完成,整体工期较传统建造缩短3个月,实际打印仅用34天(原计划50天),现场操作人员从6人减至3人,建筑废料率从10%降至5%。建筑采用可打印混凝土,集成光伏板及热泵系统,能源自给率约达60%。
荷兰Nebius团队提出SlimSpec,通过低秩分解压缩草稿模型LM-Head的内部表示而非裁剪词汇,在保留完整词汇表的同时将LM-Head计算时间压缩至原来的五分之一,端到端推理速度超越现有方法最高达9%。