OpenAI集团今日发布了其热门智能体编程工具GPT-5.3-Codex的轻量化版本,专门针对快速推理进行优化。快速推理是指人工智能模型响应提示并采取行动的过程。
这款新模型名为GPT-5.3-Codex-Spark,是本月早些时候发布的原版GPT-5.3-Codex的精简版本。通过推出更加精简的版本,OpenAI借鉴了谷歌的策略,后者提供Gemini Flash系列大语言模型作为更快速、成本更低的替代方案,适用于不需要太多处理能力的应用场景。
OpenAI在博客文章中表示,GPT-5.3-Codex-Spark是首个运行在人工智能芯片制造商Cerebras Systems专用芯片上的模型。该公司上月与ChatGPT制造商建立了合作关系。两家公司宣布了一项价值超过100亿美元的多年协议,现在我们知道了原因。当时,OpenAI表示"将Cerebras整合到我们的计算解决方案组合中,完全是为了让我们的AI响应速度更快",而Spark已成为这一合作关系的"第一个里程碑"。
该公司解释说,Spark由Cerebras的Wafer Scale Engine 3芯片驱动,专为快速实时协作和快速迭代而设计。WSE-3芯片是Cerebras的第三代AI处理器。与该公司早期的芯片一样,这是一块巨大的、餐盘大小的硅片,拥有超过4万亿个晶体管。
除了芯片之外,Spark的另一个显著特点是它在"创造自己的过程中发挥了重要作用"。OpenAI的意思是,该模型的早期版本被用来帮助调试自己的训练过程、管理部署、诊断测试结果和进行评估。"我们的团队对Codex Spark能够加速自身开发的程度感到震惊,"该公司表示。
不仅仅是编程
GPT-5.3-Codex-Spark旨在成为"日常生产力驱动器",主要为快速原型开发而设计。这意味着它能够处理的不仅仅是基础编程任务。该公司解释说,它是一个AI智能体,几乎可以执行开发人员在计算机上可能做的所有事情。这包括"调试、部署、监控、编写PRD、编辑文案、用户研究、测试、指标等等",OpenAI表示。此外,该模型还强调能够在任务执行中途进行调整并提供频繁的状态更新。
在性能方面,OpenAI表示Spark的推理能力超越了完整版GPT-5.2-Codex模型和目前为ChatGPT提供支持的标准GPT-5.2模型。其输出生成速度平均快25%。此外,GPT-5.3-Codex-Spark在产生某些类型输出时,仅消耗早期模型约一半的"Token"。Token是AI模型处理和生成数据时使用的基本信息单位。
在Terminal-Bench 2.0基准测试中,GPT-5.3-Codex-Spark得分77.3%,相比GPT-5.2-Codex的64%准确率有所提升。OpenAI表示,该模型在游戏和网页开发方面也显示出类似的改进。
GPT-5.3-Codex-Spark目前仅向ChatGPT付费订阅用户开放,很快也将通过该公司的应用程序编程接口提供。与标准GPT-5.3-Codex模型相比,定价或用户限制没有变化。
"Codex-Spark是迈向双模式Codex的第一步:当你需要快速迭代时的实时协作模式,以及当你需要更深入推理和执行时的长时间运行任务模式,"OpenAI表示。该公司补充说,Cerebras的芯片在协助"需要极低延迟的工作流程"方面表现出色。
Cerebras已成为AI计算业务中英伟达最突出的竞争对手之一。上周,这家芯片制造商宣布在一轮融资中筹集了额外的10亿美元资金,使其估值达到230亿美元。这很可能是其最后一轮重大融资,因为该公司已提交了首次公开募股的文件,预计将在今年上半年进行。展望未来,这家芯片制造商期待与OpenAI展开更多合作。
"GPT-5.3-Codex-Spark最让我们兴奋的是与OpenAI和开发者社区合作,探索快速推理的可能性,"Cerebras联合创始人兼首席技术官Sean Lie表示。"新的交互模式、新的用例和根本不同的模型体验,而这次预览只是一个开始。"
Q&A
Q1:GPT-5.3-Codex-Spark与原版GPT-5.3-Codex有什么区别?
A:GPT-5.3-Codex-Spark是原版GPT-5.3-Codex的轻量化版本,专门针对快速推理进行优化。它的输出生成速度平均快25%,消耗的Token约为早期模型的一半,推理能力甚至超越了GPT-5.2-Codex模型。
Q2:GPT-5.3-Codex-Spark除了编程还能做什么?
A:该模型不仅能处理编程任务,还是一个全能的AI智能体,可以执行开发人员在计算机上的几乎所有工作,包括调试、部署、监控、编写PRD、编辑文案、用户研究、测试、指标分析等多种任务。
Q3:如何使用GPT-5.3-Codex-Spark?
A:目前GPT-5.3-Codex-Spark仅向ChatGPT付费订阅用户开放,很快也将通过OpenAI的应用程序编程接口提供。定价和用户限制与标准GPT-5.3-Codex模型相同,没有额外费用。
好文章,需要你的鼓励
研究人员意外发现,标准MOSFET晶体管可同时模拟神经元和突触行为,形成"神经突触随机存取存储器"(NSRAM)。该技术仅需一至两个晶体管即可实现传统需数十乃至数百个元件才能完成的神经信号处理,且与现有硅基制造工艺完全兼容,良率达100%。未来有望应用于边缘AI及高能效神经形态芯片,长远或可挑战GPU地位。
CoffeeBench是Sakana AI与毕马威联合构建的多智能体经济基准测试,让六个AI企业在90天咖啡供应链模拟中自主经营,评估大语言模型的长期商业决策能力。
本文提出一种评估人工智能风险的新方法,借鉴生态学与演化论视角,从理论生态模型中推导出三项风险指标,涵盖种群模型与生态系统模型。研究旨在为AI治理策略提供量化工具,并对分析局限性及政策改进方向进行了深入探讨,为构建更科学的AI风险评估体系提供参考框架。
牛津大学提出PHYSIFORMER,一种扩散变换器模型,通过三维网格顶点轨迹直接在世界坐标空间预测刚性与弹性物体的物理运动,一次性生成全序列轨迹,超越自回归基线。