OpenAI认为编程智能体正在超越终端的局限性。
该公司于周一发布了Codex软件开发智能体的macOS桌面应用程序,其重点不再是代码本身,而是并行管理多个软件开发智能体。
此前,与Codex交互的主要方式是通过终端,这与Anthropic的Claude Code或Google的Gemini CLI类似。虽然新的桌面应用程序仍允许开发者进入VS Code等IDE或终端进行实际操作,但OpenAI开发这款应用的目标是让智能体编程对更广泛的用户群体变得更加易用,甚至包括那些可能永远不想接触代码本身的用户。
正如OpenAI首席执行官Sam Altman在周一发布前的新闻发布会上指出的那样,在过去几个月中,软件智能体已经"跨越了真正实用性的门槛"。
他表示,已有超过一百万人定期使用Codex,但由于这些智能体现在功能如此强大,团队还希望寻找方法让更广泛的受众能够使用它们。
Altman解释说:"Codex 5.2特别是一个我们许多人发现能够做极其复杂事情的模型。我们意识到开始感受到界面的限制。因此,当我们拥有了这些具有不可思议推理能力的模型时,我们一直在思考需要做什么来让人们轻松使用这种能力。我们制作了这个Codex应用程序,这是一种与模型协作并管理智能体的方式,让它们在你的笔记本电脑上执行这些长期任务。"
Codex团队还认为,随着开发者开始信任他们的智能体处理更复杂的工作,像Codex这样的应用程序对于帮助他们编排和监督智能体是必要的。
OpenAI在其公告中表示:"现有的IDE和基于终端的工具并非为支持这种工作方式而构建。"
开发者可以将Codex应用程序指向现有存储库,它与GitHub直接集成以创建拉取请求。多个智能体可以并行运行,开发者可以在不同任务之间来回切换,就像他们在IDE中切换文件一样,因为所有智能体都在单独的线程中运行。
由于Codex支持Git工作树,多个智能体可以在同一个存储库上并行工作,每个都使用该代码的隔离副本。
正如Altman提到的,公司一直在问自己的一个问题是,这些智能体是否能够从随意编程转向严肃的软件工程。Altman相信可以。
他说:"我认为我们已经跨越了这个门槛。我认为这将是大多数专业程序员从现在开始很快就会采用的工作方式。"
Codex的一个有趣方面是它不仅仅是编写代码。正如Anthropic通过Claude Code快速意识到的那样,驱动这些工具的核心智能体循环对于自动化其他类型的工作流程也很有用。Anthropic为此用例推出了Cowork作为单独的应用程序,但OpenAI指出Codex用户可以使用智能体技能来扩展Codex来做到这一点。
通过技能,用户可以"将Codex扩展到代码生成之外,处理需要收集和综合信息、解决问题、写作等任务",团队写道。
这并不是OpenAI在此次发布中强调的内容,但鉴于该公司已将目光投向企业用例,我们很可能在未来听到更多相关信息。
Codex现在对任何拥有ChatGPT账户的用户开放,包括在有限时间内对ChatGPT免费和Go用户开放。对于付费ChatGPT Plus、Pro、Business、Enterprise和Edu计划的用户,OpenAI在此期间将速率限制加倍。
Q&A
Q1:OpenAI Codex桌面版应用的主要功能是什么?
A:Codex桌面版应用专注于并行管理多个软件开发智能体,而不是代码本身。它可以让多个智能体同时运行在不同线程中,开发者可以像在IDE中切换文件一样在不同任务间切换,并且支持Git工作树让多个智能体在同一存储库上并行工作。
Q2:为什么OpenAI要推出桌面版而不继续使用终端?
A:OpenAI认为现有的IDE和终端工具并非为支持智能体工作方式而构建。随着软件智能体跨越实用性门槛,超过百万用户定期使用Codex,团队希望通过桌面应用让智能体编程对更广泛用户群体变得易用,甚至包括不想接触代码的用户。
Q3:Codex桌面版支持哪些用户使用?
A:Codex现在对任何拥有ChatGPT账户的用户开放,包括在有限时间内对ChatGPT免费和Go用户开放。对于付费的ChatGPT Plus、Pro、Business、Enterprise和Edu计划用户,OpenAI还将在此期间提供双倍的速率限制。
好文章,需要你的鼓励
企业AI搜索公司Glean宣布年度经常性收入(ARR)达3亿美元,较15个月前的1亿美元增长三倍。尽管谷歌、微软、OpenAI等科技巨头纷纷入局企业AI搜索市场,Glean凭借"上下文图谱"技术深度理解企业业务需求,并帮助客户显著降低AI计算成本。该公司提供按用量计费和混合定价两种模式,客户涵盖Databricks、Reddit、Pinterest及三星等企业。Glean上轮融资后估值达72亿美元。
香港中文大学与MiniMax提出ClaimDiff-RL框架,将图像描述的AI训练从整体打分升级为逐条核查,有效解决了传统方式导致AI"少说保平安"的问题,同时在多项基准测试上超越Gemini-3-Pro-Preview。
杰夫·贝索斯旗下的蓝色起源公司在佛罗里达卡纳维拉尔角进行静态点火测试时,新格伦重型火箭发生爆炸。这是美国历史上最大规模的火箭爆炸之一,也是蓝色起源公司遭遇的最严重失败。所有人员安全,但该事故可能导致新格伦火箭项目长期暂停。此前该火箭已成功完成三次发射,并实现了助推器回收和重复使用。
ParaVT是一个由南洋理工等多校联合提出的并行视频工具调用框架,通过让AI同时分析多段视频并引入PARA-GRPO算法解决训练中的格式崩溃与工具跳过问题,在六项长视频理解测试中平均提升约7.9%。