OpenAI发布GPT-5.3-Codex-Spark快速推理编程模型

OpenAI今日发布轻量版AI编程工具GPT-5.3-Codex-Spark，专为快速推理设计。该模型基于Cerebras公司的WSE-3芯片，推理速度提升25%，令牌消耗减半。除基础编程外，还可处理调试、部署、监控等开发任务。在Terminal-Bench 2.0基准测试中准确率达77.3%，超越前代模型。目前仅向ChatGPT付费用户开放，API接口即将推出。

OpenAI集团今日发布了其热门智能体编程工具GPT-5.3-Codex的轻量化版本，专门针对快速推理进行优化。快速推理是指人工智能模型响应提示并采取行动的过程。

这款新模型名为GPT-5.3-Codex-Spark，是本月早些时候发布的原版GPT-5.3-Codex的精简版本。通过推出更加精简的版本，OpenAI借鉴了谷歌的策略，后者提供Gemini Flash系列大语言模型作为更快速、成本更低的替代方案，适用于不需要太多处理能力的应用场景。

OpenAI在博客文章中表示，GPT-5.3-Codex-Spark是首个运行在人工智能芯片制造商Cerebras Systems专用芯片上的模型。该公司上月与ChatGPT制造商建立了合作关系。两家公司宣布了一项价值超过100亿美元的多年协议，现在我们知道了原因。当时，OpenAI表示"将Cerebras整合到我们的计算解决方案组合中，完全是为了让我们的AI响应速度更快"，而Spark已成为这一合作关系的"第一个里程碑"。

该公司解释说，Spark由Cerebras的Wafer Scale Engine 3芯片驱动，专为快速实时协作和快速迭代而设计。WSE-3芯片是Cerebras的第三代AI处理器。与该公司早期的芯片一样，这是一块巨大的、餐盘大小的硅片，拥有超过4万亿个晶体管。

除了芯片之外，Spark的另一个显著特点是它在"创造自己的过程中发挥了重要作用"。OpenAI的意思是，该模型的早期版本被用来帮助调试自己的训练过程、管理部署、诊断测试结果和进行评估。"我们的团队对Codex Spark能够加速自身开发的程度感到震惊，"该公司表示。

不仅仅是编程

GPT-5.3-Codex-Spark旨在成为"日常生产力驱动器"，主要为快速原型开发而设计。这意味着它能够处理的不仅仅是基础编程任务。该公司解释说，它是一个AI智能体，几乎可以执行开发人员在计算机上可能做的所有事情。这包括"调试、部署、监控、编写PRD、编辑文案、用户研究、测试、指标等等"，OpenAI表示。此外，该模型还强调能够在任务执行中途进行调整并提供频繁的状态更新。

在性能方面，OpenAI表示Spark的推理能力超越了完整版GPT-5.2-Codex模型和目前为ChatGPT提供支持的标准GPT-5.2模型。其输出生成速度平均快25%。此外，GPT-5.3-Codex-Spark在产生某些类型输出时，仅消耗早期模型约一半的"Token"。Token是AI模型处理和生成数据时使用的基本信息单位。

在Terminal-Bench 2.0基准测试中，GPT-5.3-Codex-Spark得分77.3%，相比GPT-5.2-Codex的64%准确率有所提升。OpenAI表示，该模型在游戏和网页开发方面也显示出类似的改进。

GPT-5.3-Codex-Spark目前仅向ChatGPT付费订阅用户开放，很快也将通过该公司的应用程序编程接口提供。与标准GPT-5.3-Codex模型相比，定价或用户限制没有变化。

"Codex-Spark是迈向双模式Codex的第一步：当你需要快速迭代时的实时协作模式，以及当你需要更深入推理和执行时的长时间运行任务模式，"OpenAI表示。该公司补充说，Cerebras的芯片在协助"需要极低延迟的工作流程"方面表现出色。

Cerebras已成为AI计算业务中英伟达最突出的竞争对手之一。上周，这家芯片制造商宣布在一轮融资中筹集了额外的10亿美元资金，使其估值达到230亿美元。这很可能是其最后一轮重大融资，因为该公司已提交了首次公开募股的文件，预计将在今年上半年进行。展望未来，这家芯片制造商期待与OpenAI展开更多合作。

"GPT-5.3-Codex-Spark最让我们兴奋的是与OpenAI和开发者社区合作，探索快速推理的可能性，"Cerebras联合创始人兼首席技术官Sean Lie表示。"新的交互模式、新的用例和根本不同的模型体验，而这次预览只是一个开始。"

Q&A

Q1：GPT-5.3-Codex-Spark与原版GPT-5.3-Codex有什么区别？

A：GPT-5.3-Codex-Spark是原版GPT-5.3-Codex的轻量化版本，专门针对快速推理进行优化。它的输出生成速度平均快25%，消耗的Token约为早期模型的一半，推理能力甚至超越了GPT-5.2-Codex模型。

Q2：GPT-5.3-Codex-Spark除了编程还能做什么？

A：该模型不仅能处理编程任务，还是一个全能的AI智能体，可以执行开发人员在计算机上的几乎所有工作，包括调试、部署、监控、编写PRD、编辑文案、用户研究、测试、指标分析等多种任务。

Q3：如何使用GPT-5.3-Codex-Spark？

A：目前GPT-5.3-Codex-Spark仅向ChatGPT付费订阅用户开放，很快也将通过OpenAI的应用程序编程接口提供。定价和用户限制与标准GPT-5.3-Codex模型相同，没有额外费用。

来源：SiliconANGLE

0赞

好文章，需要你的鼓励

OpenAI发布GPT-5.3-Codex-Spark快速推理编程模型

来源：SiliconANGLE

2026

02/13

14:13

分享

点赞

WAIC2026 现场直击：开普勒顶流人气王，麒麟系列火爆出圈

面壁智能将密度定律带入具身智能

龙磁科技拟投3.58亿元扩建越南永磁铁氧体基地

首创一层Scale-up网络256卡全互联，摩尔线程MTT C256超节点为万卡及十万卡级集群夯实底座

从高血压诊疗入手，北京安贞医院让医疗大模型走出聊天框

西门子肖松：以场景为牵引，推动工业AI从单点实效迈向生产力跃迁

打造Token极致性价比 新华三震撼亮相2026世界人工智能大会

机器人管家系统上线！傅利叶携多款康养陪伴新品方案亮相WAIC 2026

赛那德“ 自主作业机器人天团” 登陆 WAIC：iLoabot-X+模型双升级，秀出具身场景落地硬实力

西门子Eigen工程智能体中国首发首展，荣获2026 WAIC SAIL之星奖

NVIDIA Cosmos 推动物理 AI 前沿发展

PPIO亮相WAIC 2026：发布智能模型网关，打造面向Agent时代的智能Token工厂

OpenAI首次在Cerebras芯片上部署AI模型

OpenAI绕过英伟达，发布超高速AI编程模型

YouTube Music 推出生成式AI播放列表功能

苹果研究团队解析用户如何期待与AI智能体交互

Chrome自动浏览智能体实测：AI代理能否替你完成网络任务

内存价格暴涨引发企业抢购PC浪潮

e&集团借助Oracle云驱动AI优先的员工队伍转型

英国金融科技投资2025年大幅下滑21%

Claude AI 发现 500 个高危软件漏洞

Anthropic承诺保护消费者免受电价上涨影响

如果您非常迫切的想了解IT领域最新产品与技术信息，那么订阅至顶网技术邮件将是您的最佳途径之一

三一集团：数字化是必选项，AI是生存项

因湃电池 × 达索系统：如何共创出一套电池产业最佳实践

AI走进真实世界之后：安全、健康与产业的新命题

CES 2026

关注官方公众号

关注官方微博

关注官方喜马拉雅

友情链接

业界热点:

打造Token极致性价比新华三震撼亮相2026世界人工智能大会