Codex上线还不到一年,但这款AI编程平台或许正是OpenAI打造超级应用梦想的关键所在。OpenAI设想中的超级应用将整合ChatGPT、Atlas浏览器和Codex,而OpenAI明确表示,Codex而非ChatGPT,将成为这款应用的核心基础。
"我们实际上正在做一件悄悄推进的事——在公开场合构建超级应用,并从Codex应用中逐步演化出来。"Codex工程负责人Thibault Sottiaux本周在媒体简报会上如此表示。
Codex一直是AI开发者和氛围编程爱好者的首选工具。OpenAI透露,目前Codex每周活跃用户已超过300万。值得关注的是,其中近一半的使用场景并非编程任务。为此,OpenAI于本周四宣布了一系列更新,旨在让Codex融入用户工作日常的每一个环节,而不仅限于编程本身。此次最重大的变化在于:Codex现可跨越用户电脑上的众多应用程序运行,而非仅限于ChatGPT。Sottiaux表示,这是将Codex打造为未来超级应用基础的"第一阶段"。
在多智能体协作方面,Codex现已支持跨桌面应用运行多个智能体。面向开发者的新增插件超过100个,涵盖Atlassian Rovo、CircleCI、CodeRabbit、GitLab Issues、微软套件以及Databricks旗下的Neon等工具。用户还可授权Codex访问Slack、Notion和Google应用。背后的逻辑很直接:接入用户数字工作生活的维度越多,Codex能提供的帮助就越大。此外,Codex还升级了记忆能力,可学习并适应用户的工作习惯。
Codex还可充当个人助理角色,其智能体特性使其能够自主处理任务。全新的"Automations"自动化工具支持用户为Codex设置周期性提醒,让其执行重复性任务,官方称之为"心跳"(heartbeats)——例如持续扫描消息并自动按优先级排序。用户还可设置每日工作前后的简报推送。
对于开发者而言,Codex新增了应用内浏览器功能,用户可直接在应用中预览正在构建的项目,效果与实际网页浏览器中的呈现一致,大幅降低了查看最终效果和迭代修改的门槛。用户可在浏览器页面中直接留下批注,Codex的智能体将据此执行相应修改。此外,AI图像生成功能(GPT Image 1.5)也即将上线,让用户同样能对图片素材进行迭代调整。
编程平台领域今年已成为AI公司竞相布局的热门赛道。Anthropic早些时候推出了Claude Code,其出色的能力令技术爱好者和华尔街人士印象深刻。OpenAI近期还推出了月费100美元的新订阅计划,Codex使用额度更高,价格仅为常规ChatGPT Pro计划的一半。由于开发者和氛围编程用户的请求往往消耗更多Token,计算资源需求也更为密集,这类高阶订阅计划对他们而言尤为必要。
Q&A
Q1:Codex目前有多少用户?主要用来做什么?
A:根据OpenAI的数据,Codex目前每周活跃用户已超过300万。虽然Codex定位为AI编程平台,但有趣的是,近一半的使用场景并非编程任务,而是其他日常工作需求。正因如此,OpenAI才推出了一系列新功能,致力于让Codex渗透到用户工作日常的更多环节。
Q2:Codex的"超级应用"计划具体是什么?
A:OpenAI计划将Codex打造为一款超级应用的核心基础,整合ChatGPT、Atlas浏览器和Codex本身。目前的功能更新被称为"第一阶段",核心是让Codex跨越多个桌面应用运行,支持100多个插件,并接入Slack、Notion、Google等工具,从而覆盖用户更广泛的数字工作场景。
Q3:Codex新推出的Automations自动化工具有什么用?
A:Automations工具允许用户为Codex设置周期性提醒,让其自动执行重复性任务,官方将这些任务称为"心跳"(heartbeats)。例如,Codex可以持续扫描用户的消息并按优先级排序,还可以在每天工作开始和结束时自动生成简报,相当于一个能自主运作的智能体助理。
好文章,需要你的鼓励
Replit与RevenueCat达成合作,将订阅变现工具直接集成至Replit平台。用户只需通过自然语言提示(如"添加订阅"),即可完成应用内购和订阅配置,无需离开平台。RevenueCat管理超8万款应用的订阅业务,每月处理约10亿美元交易。此次合作旨在让"氛围编程"用户在构建应用的同时即可实现商业变现,月收入未达2500美元前免费使用,超出后收取1%费用。
LiVER是由北京大学、北京邮电大学等机构联合提出的视频生成框架,核心创新是将物理渲染技术与AI视频生成结合,通过Blender引擎计算漫反射、粗糙GGX和光泽GGX三种光照图像构成"场景代理",引导视频扩散模型生成光影物理准确的视频。框架包含渲染器智能体、轻量化编码器适配器和三阶段训练策略,支持对光照、场景布局和摄像机轨迹的独立精确控制。配套构建的LiVERSet数据集含约11000段标注视频,实验显示该方法在视频质量和控制精度上均优于现有方法。
所有人都说AI需要护栏,但真正在构建它的人寥寥无几。SkipLabs创始人Julien Verlaguet深耕这一问题已逾一年,他发现市面上多数"护栏"不过是提示词包装。为此,他打造了专为后端服务设计的AI编程智能体Skipper,基于健全的TypeScript类型系统与响应式运行时,实现增量式代码生成与测试,内部基准测试通过率超90%。他认为,编程语言的"人类可读性时代"正走向终结,面向智能体的精确工具链才是未来。
这项由蒙特利尔学习算法研究所(Mila)与麦吉尔大学联合发布的研究(arXiv:2604.07776,2026年4月)提出了AGENT-AS-ANNOTATORS框架,通过模仿人类数据标注的三种角色分工,系统化生成高质量网页智能体训练轨迹。以Gemini 3 Pro为教师模型,仅用2322条精选轨迹对90亿参数的Qwen3.5-9B模型进行监督微调,在WebArena基准上达到41.5%成功率,超越GPT-4o和Claude 3.5 Sonnet,并在从未见过的企业平台WorkArena L1上提升18.2个百分点,验证了"数据质量远比数量重要"这一核心结论。