OpenAI集团今日发布了其热门智能体编程工具GPT-5.3-Codex的轻量化版本,专门针对快速推理进行优化。快速推理是指人工智能模型响应提示并采取行动的过程。
这款新模型名为GPT-5.3-Codex-Spark,是本月早些时候发布的原版GPT-5.3-Codex的精简版本。通过推出更加精简的版本,OpenAI借鉴了谷歌的策略,后者提供Gemini Flash系列大语言模型作为更快速、成本更低的替代方案,适用于不需要太多处理能力的应用场景。
OpenAI在博客文章中表示,GPT-5.3-Codex-Spark是首个运行在人工智能芯片制造商Cerebras Systems专用芯片上的模型。该公司上月与ChatGPT制造商建立了合作关系。两家公司宣布了一项价值超过100亿美元的多年协议,现在我们知道了原因。当时,OpenAI表示"将Cerebras整合到我们的计算解决方案组合中,完全是为了让我们的AI响应速度更快",而Spark已成为这一合作关系的"第一个里程碑"。
该公司解释说,Spark由Cerebras的Wafer Scale Engine 3芯片驱动,专为快速实时协作和快速迭代而设计。WSE-3芯片是Cerebras的第三代AI处理器。与该公司早期的芯片一样,这是一块巨大的、餐盘大小的硅片,拥有超过4万亿个晶体管。
除了芯片之外,Spark的另一个显著特点是它在"创造自己的过程中发挥了重要作用"。OpenAI的意思是,该模型的早期版本被用来帮助调试自己的训练过程、管理部署、诊断测试结果和进行评估。"我们的团队对Codex Spark能够加速自身开发的程度感到震惊,"该公司表示。
不仅仅是编程
GPT-5.3-Codex-Spark旨在成为"日常生产力驱动器",主要为快速原型开发而设计。这意味着它能够处理的不仅仅是基础编程任务。该公司解释说,它是一个AI智能体,几乎可以执行开发人员在计算机上可能做的所有事情。这包括"调试、部署、监控、编写PRD、编辑文案、用户研究、测试、指标等等",OpenAI表示。此外,该模型还强调能够在任务执行中途进行调整并提供频繁的状态更新。
在性能方面,OpenAI表示Spark的推理能力超越了完整版GPT-5.2-Codex模型和目前为ChatGPT提供支持的标准GPT-5.2模型。其输出生成速度平均快25%。此外,GPT-5.3-Codex-Spark在产生某些类型输出时,仅消耗早期模型约一半的"Token"。Token是AI模型处理和生成数据时使用的基本信息单位。
在Terminal-Bench 2.0基准测试中,GPT-5.3-Codex-Spark得分77.3%,相比GPT-5.2-Codex的64%准确率有所提升。OpenAI表示,该模型在游戏和网页开发方面也显示出类似的改进。
GPT-5.3-Codex-Spark目前仅向ChatGPT付费订阅用户开放,很快也将通过该公司的应用程序编程接口提供。与标准GPT-5.3-Codex模型相比,定价或用户限制没有变化。
"Codex-Spark是迈向双模式Codex的第一步:当你需要快速迭代时的实时协作模式,以及当你需要更深入推理和执行时的长时间运行任务模式,"OpenAI表示。该公司补充说,Cerebras的芯片在协助"需要极低延迟的工作流程"方面表现出色。
Cerebras已成为AI计算业务中英伟达最突出的竞争对手之一。上周,这家芯片制造商宣布在一轮融资中筹集了额外的10亿美元资金,使其估值达到230亿美元。这很可能是其最后一轮重大融资,因为该公司已提交了首次公开募股的文件,预计将在今年上半年进行。展望未来,这家芯片制造商期待与OpenAI展开更多合作。
"GPT-5.3-Codex-Spark最让我们兴奋的是与OpenAI和开发者社区合作,探索快速推理的可能性,"Cerebras联合创始人兼首席技术官Sean Lie表示。"新的交互模式、新的用例和根本不同的模型体验,而这次预览只是一个开始。"
Q&A
Q1:GPT-5.3-Codex-Spark与原版GPT-5.3-Codex有什么区别?
A:GPT-5.3-Codex-Spark是原版GPT-5.3-Codex的轻量化版本,专门针对快速推理进行优化。它的输出生成速度平均快25%,消耗的Token约为早期模型的一半,推理能力甚至超越了GPT-5.2-Codex模型。
Q2:GPT-5.3-Codex-Spark除了编程还能做什么?
A:该模型不仅能处理编程任务,还是一个全能的AI智能体,可以执行开发人员在计算机上的几乎所有工作,包括调试、部署、监控、编写PRD、编辑文案、用户研究、测试、指标分析等多种任务。
Q3:如何使用GPT-5.3-Codex-Spark?
A:目前GPT-5.3-Codex-Spark仅向ChatGPT付费订阅用户开放,很快也将通过OpenAI的应用程序编程接口提供。定价和用户限制与标准GPT-5.3-Codex模型相同,没有额外费用。
好文章,需要你的鼓励
企业AI搜索公司Glean宣布年度经常性收入(ARR)达3亿美元,较15个月前的1亿美元增长三倍。尽管谷歌、微软、OpenAI等科技巨头纷纷入局企业AI搜索市场,Glean凭借"上下文图谱"技术深度理解企业业务需求,并帮助客户显著降低AI计算成本。该公司提供按用量计费和混合定价两种模式,客户涵盖Databricks、Reddit、Pinterest及三星等企业。Glean上轮融资后估值达72亿美元。
香港中文大学与MiniMax提出ClaimDiff-RL框架,将图像描述的AI训练从整体打分升级为逐条核查,有效解决了传统方式导致AI"少说保平安"的问题,同时在多项基准测试上超越Gemini-3-Pro-Preview。
杰夫·贝索斯旗下的蓝色起源公司在佛罗里达卡纳维拉尔角进行静态点火测试时,新格伦重型火箭发生爆炸。这是美国历史上最大规模的火箭爆炸之一,也是蓝色起源公司遭遇的最严重失败。所有人员安全,但该事故可能导致新格伦火箭项目长期暂停。此前该火箭已成功完成三次发射,并实现了助推器回收和重复使用。
ParaVT是一个由南洋理工等多校联合提出的并行视频工具调用框架,通过让AI同时分析多段视频并引入PARA-GRPO算法解决训练中的格式崩溃与工具跳过问题,在六项长视频理解测试中平均提升约7.9%。