OpenAI推出了独立的Codex应用,用于管理多个项目中的AI编程智能体,这一举措超越了基于对话的代码生成,正值企业评估更自主工具对开发工作流程和治理影响之际。
此举正值OpenAI面临来自Anthropic和GitHub等竞争对手的激烈竞争。上个月,Anthropic推出了Cowork,这是一个研究预览功能,将Claude Code从编程扩展到更广泛的企业工作流程。
"Codex应用为智能体多任务处理提供了专门的空间,"OpenAI在声明中表示,智能体"在按项目组织的独立线程中运行",允许开发者在不丢失上下文的情况下在任务间切换。
Codex应用目前在macOS上向OpenAI付费ChatGPT计划用户提供。OpenAI表示计划在Windows上推出该应用。
该公司补充说,Codex还在超越代码生成,具备"技能"功能,允许智能体收集信息、解决问题,并在开发者的计算机上执行更广泛的任务。
基于智能体的AI编程在更多企业开发团队中获得关注,推动工作流程超越传统的以IDE为中心的模式。
"这些智能体驱动的开发shell可以加速编码、调试和部署,尽管它们带来了更高的企业风险,"Counterpoint Research研究副总裁Neil Shah表示。
根据早期迹象,OpenAI在AI辅助开发方面通过Codex迈出了有意义但渐进的一步,而非根本性变革,Kadence International高级副总裁Tulika Sheel说。
"它没有改变代码编写或审查的基本方式,但确实通过让开发者在一个地方管理更长、更复杂的编码任务,而不是通过分散的IDE提示来简化工作流程,"Sheel表示。"随着时间推移,这可能通过将AI视为持续合作者而非临时助手,从而微妙地重塑开发者规划、审查和维护代码的方式。"
独立应用也标志着从AI辅助单行代码到处理更大工作块的转变,Everest Group实践总监Abhivyakti Sengar说。"开发者花更少时间打字,更多时间审查和指导,更像是管理初级工程师而非使用自动完成工具,"Sengar说。
使用AI的风险在企业中仍是争议话题。随着多智能体系统在软件开发生命周期中发挥更大作用,担忧可能会增加。
"自主AI编程者需要与人类程序员同样水平的监督,"Sheel补充说。"这包括审查、问责制和对其产生代码的明确所有权。"
公司还需要在知识产权所有权和许可方面的明确性,以避免在重用或发布AI生成代码时出现意外。
"保持对工作流程层的控制也很重要,"Shah补充说。"企业应该选择支持与GitHub等现有系统开放集成的工具,以避免被锁定在垂直集成的AI IDE中。"
分析师表示,随着模型和智能体深入学习企业的代码和工作流程,供应商锁定也可能成为真正的担忧。
"优先选择拥抱智能体协议和工作流程开放标准,并承诺在数据和知识产权处理方面保持透明的工具应该是不可妥协的,"Shah说。"这与更强的治理框架相结合,包括Token使用监控、政策执行和可审计控制,将是确保这些工具不会损害企业主权或安全的关键。"
Q&A
Q1:Codex应用有什么特殊功能?
A:Codex应用提供了专门的空间来管理多个项目中的AI编程智能体,智能体在按项目组织的独立线程中运行,允许开发者在任务间切换而不丢失上下文。此外,Codex还具备"技能"功能,能收集信息、解决问题并执行更广泛的任务。
Q2:使用AI编程工具会带来哪些风险?
A:主要风险包括更高的企业风险、需要同等水平的监督和问责制、知识产权所有权和许可的不确定性,以及可能的供应商锁定问题。随着多智能体系统在软件开发中发挥更大作用,这些担忧可能会增加。
Q3:Codex应用目前在哪些平台可用?
A:Codex应用目前在macOS上向OpenAI付费ChatGPT计划用户提供。OpenAI表示计划在Windows平台上推出该应用。
好文章,需要你的鼓励
Replit与RevenueCat达成合作,将订阅变现工具直接集成至Replit平台。用户只需通过自然语言提示(如"添加订阅"),即可完成应用内购和订阅配置,无需离开平台。RevenueCat管理超8万款应用的订阅业务,每月处理约10亿美元交易。此次合作旨在让"氛围编程"用户在构建应用的同时即可实现商业变现,月收入未达2500美元前免费使用,超出后收取1%费用。
LiVER是由北京大学、北京邮电大学等机构联合提出的视频生成框架,核心创新是将物理渲染技术与AI视频生成结合,通过Blender引擎计算漫反射、粗糙GGX和光泽GGX三种光照图像构成"场景代理",引导视频扩散模型生成光影物理准确的视频。框架包含渲染器智能体、轻量化编码器适配器和三阶段训练策略,支持对光照、场景布局和摄像机轨迹的独立精确控制。配套构建的LiVERSet数据集含约11000段标注视频,实验显示该方法在视频质量和控制精度上均优于现有方法。
所有人都说AI需要护栏,但真正在构建它的人寥寥无几。SkipLabs创始人Julien Verlaguet深耕这一问题已逾一年,他发现市面上多数"护栏"不过是提示词包装。为此,他打造了专为后端服务设计的AI编程智能体Skipper,基于健全的TypeScript类型系统与响应式运行时,实现增量式代码生成与测试,内部基准测试通过率超90%。他认为,编程语言的"人类可读性时代"正走向终结,面向智能体的精确工具链才是未来。
这项由蒙特利尔学习算法研究所(Mila)与麦吉尔大学联合发布的研究(arXiv:2604.07776,2026年4月)提出了AGENT-AS-ANNOTATORS框架,通过模仿人类数据标注的三种角色分工,系统化生成高质量网页智能体训练轨迹。以Gemini 3 Pro为教师模型,仅用2322条精选轨迹对90亿参数的Qwen3.5-9B模型进行监督微调,在WebArena基准上达到41.5%成功率,超越GPT-4o和Claude 3.5 Sonnet,并在从未见过的企业平台WorkArena L1上提升18.2个百分点,验证了"数据质量远比数量重要"这一核心结论。