OpenAI一直公开谈论其打造统一AI超级应用的计划,旨在将ChatGPT与Codex编程智能体、Atlas浏览器以及面向企业的全新智能体AI工具整合为一体。如今,随着Codex桌面应用迎来重大更新,这一愿景的第一批拼图已开始落地,而这款桌面应用也将成为未来超级应用的核心基础。
OpenAI于2025年5月首次将Codex作为软件工程智能体推出。起初发展势头较为平稳,但进入2026年后,尤其是今年2月公司专属Codex模型上线后,该产品迅速成为OpenAI的爆款产品。
Codex目前每周活跃用户已达300万,每月新增用户约100万,且增长势头持续加速。OpenAI Codex业务负责人Thibault Sottiaux在周三发布会前的媒体简报会上介绍了上述数据。
"我们其实在公开场合悄悄做着一件事——那就是把超级应用从Codex里慢慢长出来。"Sottiaux说道。
Codex桌面应用是构建这款超级应用的天然落脚点。尽管OpenAI将本次更新定位于编程与开发者使用场景,但其中许多功能同样适用于商业用户和个人用户。
电脑操控能力
Codex现在可以直接操控你的电脑——目前仅限Mac设备,其他平台暂未开放。借助这一能力,Codex可以操作桌面应用,无论是用于测试用编程智能体构建的内容,还是自动化处理其他任务。
值得关注的是,Codex还能在后台完成所有这些操作,不会打断你的正常使用。其他电脑操控智能体往往会接管整个桌面,而这类智能体通常运行速度较慢,反而容易影响工作效率。
"你会开始感觉到,Codex能做的事情已经没有边界了。"Sottiaux表示,"它变得非常非常有创造性,能让你保持专注状态。它能理解你的目标和上下文,跨越你所有的应用程序和浏览器协同工作,始终与你保持同步。它不仅能在后台持续完成各类任务,还能在日常生活的方方面面真正帮到你,而不仅限于软件开发工作。"
"它字面意义上就是Codex在构建它自己。"——OpenAI Thibault Sottiaux
OpenAI还将这一功能用于Codex自身的质量保障工作,由智能体来验证每一项功能是否已在应用中正确实现。"它字面意义上就是Codex在构建它自己。"他说。
需要注意的是,要启用电脑操控功能,用户需进入Codex设置并下载相应插件。
Atlas浏览器集成
OpenAI为Atlas专门打造了自有浏览器,目前也正在逐步将其引入Codex。虽然目前推进节奏较慢,但已有一些显而易见的应用场景超越了当前的应用预览功能。在新版Codex中,用户可以直接对浏览器中看到的任何内容添加评论,OpenAI表示这对向智能体反馈前端工作内容尤为实用。
未来,Codex将全面接入这款浏览器,实现页面打开、用户操作流程逐步执行以及自我工作分析等功能。届时,内置浏览器对开发者的价值将更加凸显,同时也将为需要填写表单或在不同网页应用之间复制粘贴数据的商业用户拓展更多使用场景。
Sottiaux特别强调,这只是Atlas与Codex未来发展方向的一次预览。"目前还没有完全发挥出它的潜力,更像是对未来的一次小小预告。"他说。
图像生成能力
在前端工作方面,Codex现在还可以调用OpenAI的gpt-image-1.5图像生成模型。这一功能适用于为在Codex中生成的网站添加视觉素材(或用作占位图),OpenAI团队也提到,它还可用于制作产品原型或生成游戏素材等场景。
OpenAI表示,图像生成功能不会产生额外费用。
插件生态扩展
本次更新还新增了90款插件支持。这些由OpenAI精心整合的插件,涵盖技能包、系统集成与MCP服务器等多种形态。新增插件包括用于管理JIRA的Atlassian Rovo,以及CircleCI、CodeRabbit、GitLab Issues、Microsoft Suite、Neon by Databricks、Remotion、Render和Superpowers等。
负责Codex应用开发的Andrew Ambrosio表示:"我们的目标是让Codex自然地融入人们的工作方式,而不是让他们为了用Codex而改变自己的习惯。"
插件本身或许并不抢眼,但它们构成了将众多非编程场景引入Codex的核心基础设施。目前,相关生态已远超常规办公和邮件服务,涵盖了MyRegistry.com、United Rentals、FINN汽车订阅、Readwise,以及来自Pitchbook、Morningstar、Scite等机构的多种研究工具。
OpenAI团队特别指出,当这些插件与Codex的"自动化"功能结合使用时效果尤为突出——"自动化"功能允许用户按计划定期执行提示词,类似于Claude Code中的Routines功能。
心跳自动化机制
"自动化"功能同样迎来了重大更新,新增了受OpenClaw启发的"心跳"机制,允许用户为某个对话线程设置自动跟进任务。
"你可以设置一个专门用于每日简报的线程,或者一个专门用于处理Slack消息分类的线程。"Ambrosio说,"你也可以将其设置为一个每五分钟触发一次心跳的私人助手,并通过插件执行一系列任务。这为处理持续性日常任务提供了极强的个性化定制能力。"
这些心跳任务在同一线程内运行,这一点尤为值得关注。OpenAI竞争对手的类似工具通常会为每次运行新建独立的工作树,导致丢失此前对话的上下文信息。
在OpenAI内部,心跳自动化已成为部署近实时持续运行智能体的重要方式,用于监控Slack频道、处理收件箱分类,或追踪GitHub与Notion上的动态。Sottiaux表示,他自己同时运行了好几个这样的智能体,本质上就像是在跟一群队友协作。
主动建议与个性化记忆
今后,Codex还将更频繁地主动提出后续行动建议,包括为任务安排自动化计划。"Codex现在会主动提议有价值的后续工作,帮助你接续之前的进度。结合对项目、已连接插件和记忆的理解,Codex可以建议你如何开始新的一天,或者从哪里继续推进之前的项目。"团队在今日公告中写道。
例如,Codex可能会建议你跟进Google文档中尚未回复的评论,并从Slack和Notion等应用中提取相关上下文来协助完成这项工作。
配合全面升级的记忆系统——它现在能更好地记住用户偏好和历史交互上下文——对于Codex在开发者工作流程之外的日常使用来说,这可能是本次更新中影响最深远的改变之一。它也预示着OpenAI对这款应用长期发展方向的清晰布局。
开发者专属新功能
尽管本次更新的重点在于拓展编程之外的使用场景,但针对开发者的新功能和体验优化同样十分丰富。
"我们持续在开发者已经花费大量时间的场景上深入投入。"Ambrosio说。
例如,用户现在可以直接在Codex中处理GitHub的代码审查评论;支持开启多个终端标签页;可通过SSH连接远程开发环境(目前处于Alpha阶段);可在侧边栏打开文件,查看PDF、表格、幻灯片等各类文档。此外还新增了摘要面板,方便用户追踪计划进度、参考来源和生成的产出物。
"这些改进共同加速了软件开发全生命周期各阶段之间的流转,包括编写代码、查看输出、审查变更,以及在同一工作空间内与智能体协作。"OpenAI团队表示。
超越编程的内部实践
在OpenAI内部,Codex的应用早已超越了编程这一起点。Codex团队表示,公司内部超过80%的员工在使用Codex,而且不仅限于工程师——使用场景涵盖撰写周报、整理反馈、起草产品需求文档、合同审阅,甚至发送安全培训提醒等。
使用方式与上线计划
更新后的Codex应用现已面向所有通过ChatGPT账号登录的Codex用户开放。部分功能,包括上下文感知建议和记忆等个性化功能,将在稍后向企业版、教育版用户及欧盟、英国用户推出。电脑操控功能在发布时暂不对欧盟和英国用户开放,但将"尽快"跟进。
Sottiaux表示,未来还将推出Codex网页版和移动端应用。
Q&A
Q1:Codex的电脑操控功能有什么特别之处?
A:Codex的电脑操控功能允许智能体在后台自动操作Mac桌面应用,无需占用用户屏幕,不影响正常工作流程。这与其他同类智能体不同——大多数竞品会直接接管桌面,导致用户无法同时操作电脑。目前该功能仅支持Mac设备,欧盟和英国用户暂时无法使用,需在设置中下载对应插件后启用。
Q2:Codex的"心跳自动化"功能是怎么运作的?
A:心跳自动化允许用户为某个对话线程设置定时触发任务,例如每五分钟自动执行一次,用于监控Slack消息、处理邮件分类或追踪GitHub动态。与竞品不同,心跳任务在同一线程内持续运行,不会因新建工作树而丢失上下文,因此智能体能保持对任务历史的完整理解,更像是一个持续在线的团队成员。
Q3:Codex超级应用目前向哪些用户开放?
A:更新后的Codex应用已面向所有通过ChatGPT账号登录的Codex用户开放。但部分功能(如上下文感知建议和记忆功能)仅向企业版、教育版及欧盟、英国用户在后续阶段开放;电脑操控功能目前也不对欧盟和英国用户提供,将"尽快"推出。未来还计划上线网页版和移动端应用。
好文章,需要你的鼓励
无人机食品配送服务商Flytrex与全球知名披萨连锁品牌Little Caesars宣布合作,推出全新Sky2无人机,最大载重达4公斤,可一次配送两个大披萨及饮料,满足全家用餐需求。Sky2支持最远6.4公里的配送范围,平均从起飞到送达仅需4.5分钟。首个试点门店已在德克萨斯州怀利市上线,并实现与Little Caesars订单系统的直接集成。
FORTIS是专门测量AI代理"越权行为"的基准测试,研究发现十款顶尖模型普遍选择远超任务需要的高权限技能,端到端成功率最高仅14.3%。
法国社会住房项目ViliaSprint?已正式完工,成为欧洲最大的3D打印多户住宅建筑,共12套公寓,建筑面积800平方米。项目由PERI 3D Construction使用COBOD BOD2打印机完成,整体工期较传统建造缩短3个月,实际打印仅用34天(原计划50天),现场操作人员从6人减至3人,建筑废料率从10%降至5%。建筑采用可打印混凝土,集成光伏板及热泵系统,能源自给率约达60%。
荷兰Nebius团队提出SlimSpec,通过低秩分解压缩草稿模型LM-Head的内部表示而非裁剪词汇,在保留完整词汇表的同时将LM-Head计算时间压缩至原来的五分之一,端到端推理速度超越现有方法最高达9%。