OpenAI推出了独立的Codex应用,用于管理多个项目中的AI编程智能体,这一举措超越了基于对话的代码生成,正值企业评估更自主工具对开发工作流程和治理影响之际。
此举正值OpenAI面临来自Anthropic和GitHub等竞争对手的激烈竞争。上个月,Anthropic推出了Cowork,这是一个研究预览功能,将Claude Code从编程扩展到更广泛的企业工作流程。
"Codex应用为智能体多任务处理提供了专门的空间,"OpenAI在声明中表示,智能体"在按项目组织的独立线程中运行",允许开发者在不丢失上下文的情况下在任务间切换。
Codex应用目前在macOS上向OpenAI付费ChatGPT计划用户提供。OpenAI表示计划在Windows上推出该应用。
该公司补充说,Codex还在超越代码生成,具备"技能"功能,允许智能体收集信息、解决问题,并在开发者的计算机上执行更广泛的任务。
基于智能体的AI编程在更多企业开发团队中获得关注,推动工作流程超越传统的以IDE为中心的模式。
"这些智能体驱动的开发shell可以加速编码、调试和部署,尽管它们带来了更高的企业风险,"Counterpoint Research研究副总裁Neil Shah表示。
根据早期迹象,OpenAI在AI辅助开发方面通过Codex迈出了有意义但渐进的一步,而非根本性变革,Kadence International高级副总裁Tulika Sheel说。
"它没有改变代码编写或审查的基本方式,但确实通过让开发者在一个地方管理更长、更复杂的编码任务,而不是通过分散的IDE提示来简化工作流程,"Sheel表示。"随着时间推移,这可能通过将AI视为持续合作者而非临时助手,从而微妙地重塑开发者规划、审查和维护代码的方式。"
独立应用也标志着从AI辅助单行代码到处理更大工作块的转变,Everest Group实践总监Abhivyakti Sengar说。"开发者花更少时间打字,更多时间审查和指导,更像是管理初级工程师而非使用自动完成工具,"Sengar说。
使用AI的风险在企业中仍是争议话题。随着多智能体系统在软件开发生命周期中发挥更大作用,担忧可能会增加。
"自主AI编程者需要与人类程序员同样水平的监督,"Sheel补充说。"这包括审查、问责制和对其产生代码的明确所有权。"
公司还需要在知识产权所有权和许可方面的明确性,以避免在重用或发布AI生成代码时出现意外。
"保持对工作流程层的控制也很重要,"Shah补充说。"企业应该选择支持与GitHub等现有系统开放集成的工具,以避免被锁定在垂直集成的AI IDE中。"
分析师表示,随着模型和智能体深入学习企业的代码和工作流程,供应商锁定也可能成为真正的担忧。
"优先选择拥抱智能体协议和工作流程开放标准,并承诺在数据和知识产权处理方面保持透明的工具应该是不可妥协的,"Shah说。"这与更强的治理框架相结合,包括Token使用监控、政策执行和可审计控制,将是确保这些工具不会损害企业主权或安全的关键。"
Q&A
Q1:Codex应用有什么特殊功能?
A:Codex应用提供了专门的空间来管理多个项目中的AI编程智能体,智能体在按项目组织的独立线程中运行,允许开发者在任务间切换而不丢失上下文。此外,Codex还具备"技能"功能,能收集信息、解决问题并执行更广泛的任务。
Q2:使用AI编程工具会带来哪些风险?
A:主要风险包括更高的企业风险、需要同等水平的监督和问责制、知识产权所有权和许可的不确定性,以及可能的供应商锁定问题。随着多智能体系统在软件开发中发挥更大作用,这些担忧可能会增加。
Q3:Codex应用目前在哪些平台可用?
A:Codex应用目前在macOS上向OpenAI付费ChatGPT计划用户提供。OpenAI表示计划在Windows平台上推出该应用。
好文章,需要你的鼓励
谷歌近期悄然调整账户存储政策:新注册用户若未绑定手机号,免费存储空间将从原来的15GB缩减至5GB。用户需验证手机号后,方可获得完整的15GB空间,用于Gmail、Drive和Photos的共享使用。谷歌表示,此举旨在确保存储空间"每人仅限一份",有效防止滥用。有分析认为,存储硬件成本上升也是推动此次政策调整的重要原因之一。
FORTIS是专门测量AI代理"越权行为"的基准测试,研究发现十款顶尖模型普遍选择远超任务需要的高权限技能,端到端成功率最高仅14.3%。
AT&T、Verizon和T-Mobile宣布计划组建合资企业,利用卫星技术消除美国境内的网络覆盖盲区,重点服务农村及网络欠发达地区。该合资企业将整合知识产权与地面频谱资源,推动下一代直连设备(D2D)通信发展。目前三方尚未签署正式协议,现有运营商与卫星服务协议不受影响。此前,T-Mobile已与SpaceX合作推出星链卫星服务,美国联邦通信委员会也刚批准了价值400亿美元的EchoStar频谱出售案。
荷兰Nebius团队提出SlimSpec,通过低秩分解压缩草稿模型LM-Head的内部表示而非裁剪词汇,在保留完整词汇表的同时将LM-Head计算时间压缩至原来的五分之一,端到端推理速度超越现有方法最高达9%。