OpenAI推出了独立的Codex应用,用于管理多个项目中的AI编程智能体,这一举措超越了基于对话的代码生成,正值企业评估更自主工具对开发工作流程和治理影响之际。
此举正值OpenAI面临来自Anthropic和GitHub等竞争对手的激烈竞争。上个月,Anthropic推出了Cowork,这是一个研究预览功能,将Claude Code从编程扩展到更广泛的企业工作流程。
"Codex应用为智能体多任务处理提供了专门的空间,"OpenAI在声明中表示,智能体"在按项目组织的独立线程中运行",允许开发者在不丢失上下文的情况下在任务间切换。
Codex应用目前在macOS上向OpenAI付费ChatGPT计划用户提供。OpenAI表示计划在Windows上推出该应用。
该公司补充说,Codex还在超越代码生成,具备"技能"功能,允许智能体收集信息、解决问题,并在开发者的计算机上执行更广泛的任务。
基于智能体的AI编程在更多企业开发团队中获得关注,推动工作流程超越传统的以IDE为中心的模式。
"这些智能体驱动的开发shell可以加速编码、调试和部署,尽管它们带来了更高的企业风险,"Counterpoint Research研究副总裁Neil Shah表示。
根据早期迹象,OpenAI在AI辅助开发方面通过Codex迈出了有意义但渐进的一步,而非根本性变革,Kadence International高级副总裁Tulika Sheel说。
"它没有改变代码编写或审查的基本方式,但确实通过让开发者在一个地方管理更长、更复杂的编码任务,而不是通过分散的IDE提示来简化工作流程,"Sheel表示。"随着时间推移,这可能通过将AI视为持续合作者而非临时助手,从而微妙地重塑开发者规划、审查和维护代码的方式。"
独立应用也标志着从AI辅助单行代码到处理更大工作块的转变,Everest Group实践总监Abhivyakti Sengar说。"开发者花更少时间打字,更多时间审查和指导,更像是管理初级工程师而非使用自动完成工具,"Sengar说。
使用AI的风险在企业中仍是争议话题。随着多智能体系统在软件开发生命周期中发挥更大作用,担忧可能会增加。
"自主AI编程者需要与人类程序员同样水平的监督,"Sheel补充说。"这包括审查、问责制和对其产生代码的明确所有权。"
公司还需要在知识产权所有权和许可方面的明确性,以避免在重用或发布AI生成代码时出现意外。
"保持对工作流程层的控制也很重要,"Shah补充说。"企业应该选择支持与GitHub等现有系统开放集成的工具,以避免被锁定在垂直集成的AI IDE中。"
分析师表示,随着模型和智能体深入学习企业的代码和工作流程,供应商锁定也可能成为真正的担忧。
"优先选择拥抱智能体协议和工作流程开放标准,并承诺在数据和知识产权处理方面保持透明的工具应该是不可妥协的,"Shah说。"这与更强的治理框架相结合,包括Token使用监控、政策执行和可审计控制,将是确保这些工具不会损害企业主权或安全的关键。"
Q&A
Q1:Codex应用有什么特殊功能?
A:Codex应用提供了专门的空间来管理多个项目中的AI编程智能体,智能体在按项目组织的独立线程中运行,允许开发者在任务间切换而不丢失上下文。此外,Codex还具备"技能"功能,能收集信息、解决问题并执行更广泛的任务。
Q2:使用AI编程工具会带来哪些风险?
A:主要风险包括更高的企业风险、需要同等水平的监督和问责制、知识产权所有权和许可的不确定性,以及可能的供应商锁定问题。随着多智能体系统在软件开发中发挥更大作用,这些担忧可能会增加。
Q3:Codex应用目前在哪些平台可用?
A:Codex应用目前在macOS上向OpenAI付费ChatGPT计划用户提供。OpenAI表示计划在Windows平台上推出该应用。
好文章,需要你的鼓励
企业谈AI基础设施时,注意力往往首先集中在模型、GPU和算力集群上。但当大模型应用走向规模化推理,一个瓶颈开始浮现:算力采购完成,并不意味着Token能够被稳定、低成本、可控地交付出去。
STATE16研究院这篇综述发现,物理AI系统存在"静默失效"风险——AI以高度自信执行基于错误世界信息的动作,却不触发任何报警,并提出在AI输出与物理执行之间建立独立授权层的框架。
穆拉蒂时隔18个月首次接受重大媒体采访,介绍其创立的Thinking Machines Lab正在开发的"交互模型"。该模型能以200毫秒间隔处理音频、文本和视频流,捕捉人类交流中的中断、修正和停顿。她还谈及OpenAI"政变周"经历,强调行业决策权过于集中的担忧,并回应了公司近期研究人员离职问题,表示这是初创实验室的正常波动。
UIUC与微软联合研发的OpenWebRL框架让4B小模型仅凭400条初始数据,通过在真实网站上边做边学的强化学习方式,在网页智能体基准上超越了用27万条数据训练的竞争对手。