OpenAI首次在Cerebras芯片上部署AI模型

OpenAI推出GPT-5.3-Codex-Spark模型，这是首个运行在Cerebras Systems AI加速器上的模型。该轻量级模型利用Cerebras的SRAM芯片内存技术，响应速度超过每秒1000个token，为Codex代码助手提供更互动的体验。OpenAI上月与Cerebras签署100亿美元合同，部署最多750兆瓦定制AI芯片。尽管Cerebras芯片速度极快，但内存容量仅44GB，因此GPU仍是大模型运行的主要选择。

OpenAI于周四发布了GPT-5.3-Codex-Spark，这是其首个运行在Cerebras Systems餐盘大小AI加速器上的模型。该加速器搭载了世界上最快的片上内存技术。

这款轻量级模型旨在通过Cerebras的SRAM封装CS3加速器为OpenAI的Codex代码助手用户提供更具交互性的体验，生成响应速度超过每秒1000个Token。

上个月，OpenAI与Cerebras签署了100亿美元的合同，部署多达750兆瓦的定制AI芯片来服务Altman团队的最新一代GPT模型。

Cerebras的晶圆级架构采用了一种名为SRAM的超快片上内存，其速度比英伟达今年CES上发布的即将推出的Rubin GPU中的HBM4内存快约1000倍。

结合推理和应用管道的优化，OpenAI的最新模型能够在眨眼间生成答案。

由于Spark是专有模型，我们无法获得参数数量等详细信息，不像OpenAI去年8月在HuggingFace上发布gpt-oss时那样。我们知道的是，与那个模型一样，它是一个纯文本模型，拥有128,000个Token的上下文窗口。

模型的上下文窗口是指它能同时跟踪的Token（词汇、标点符号、数字等）数量，通常被称为模型的短期记忆。

虽然128K个Token听起来很多，但由于模型必须跟踪现有代码和新生成的代码，像Codex这样的代码助手可能很快就会用完。即使从空白开始，以每秒1000个Token的速度，大约两分钟就会超出上下文限制。

这可能是OpenAI表示Spark默认采用"轻量级"风格的原因，只进行最小的针对性编辑，除非特别要求，否则不会运行调试测试。

快速的模型如果不能编写有效代码就没有太大价值。据OpenAI称，Spark模型在Terminal-Bench 2.0测试中比GPT-5.1-Codex-Mini提供更高的准确性，同时比更智能的GPT-5.3-Codex模型快得多。

OpenAI可能正在寻求GPU之外的选择，但短期内肯定不会放弃GPU。

OpenAI写道："GPU在我们的训练和推理管道中仍然是基础，为广泛使用提供最具成本效益的Token。Cerebras通过在需要极低延迟的工作流程中表现出色来补充这一基础。"

这不仅仅是表面文章。尽管Cerebras的CS3加速器速度很快，但在内存容量方面无法与现代GPU匹敌。SRAM虽然快速，但空间效率不高。整个餐盘大小的芯片仅包含44GB内存。相比之下，英伟达的Rubin将配备288GB的HBM4，而AMD的MI455X将搭载432GB。

这使得GPU在运行大型模型时更经济，特别是在速度不是优先考虑因素的情况下。话虽如此，OpenAI建议随着Cerebras提供更多计算资源，它将把更大的模型引入该计算平台，这大概是为那些愿意为高速推理付费的用户准备的。

GPT-5.3-Codex-Spark目前向Codex Pro用户提供预览版，并通过API向特定的OpenAI合作伙伴开放。

Q&A

Q1：GPT-5.3-Codex-Spark有什么特别之处？

A：GPT-5.3-Codex-Spark是OpenAI首个运行在Cerebras Systems AI加速器上的模型，该加速器采用SRAM片上内存技术，速度比英伟达GPU中的HBM4内存快约1000倍。该模型专为代码助手设计，能以每秒超过1000个Token的速度生成响应，为用户提供更具交互性的编程体验。

Q2：为什么OpenAI选择与Cerebras合作而不是继续只用GPU？

A：OpenAI与Cerebras签署了100亿美元合同，主要是为了获得极低延迟的推理能力。虽然GPU在训练和推理管道中仍然是基础且更具成本效益，但Cerebras的SRAM技术在需要极速响应的工作流程中表现出色，两者形成互补关系而非替代关系。

Q3：GPT-5.3-Codex-Spark的上下文窗口有什么限制？

A：该模型拥有128,000个Token的上下文窗口，虽然看似很大，但由于需要跟踪现有代码和新生成的代码，在每秒1000个Token的生成速度下，大约两分钟就会达到上下文限制。因此模型默认采用"轻量级"风格，只进行最小的针对性编辑。

来源：The Register

0赞

好文章，需要你的鼓励

OpenAI首次在Cerebras芯片上部署AI模型

来源：The Register

2026

02/13

14:13

分享

点赞

WAIC2026 现场直击：开普勒顶流人气王，麒麟系列火爆出圈

面壁智能将密度定律带入具身智能

龙磁科技拟投3.58亿元扩建越南永磁铁氧体基地

首创一层Scale-up网络256卡全互联，摩尔线程MTT C256超节点为万卡及十万卡级集群夯实底座

从高血压诊疗入手，北京安贞医院让医疗大模型走出聊天框

西门子肖松：以场景为牵引，推动工业AI从单点实效迈向生产力跃迁

打造Token极致性价比 新华三震撼亮相2026世界人工智能大会

机器人管家系统上线！傅利叶携多款康养陪伴新品方案亮相WAIC 2026

赛那德“ 自主作业机器人天团” 登陆 WAIC：iLoabot-X+模型双升级，秀出具身场景落地硬实力

西门子Eigen工程智能体中国首发首展，荣获2026 WAIC SAIL之星奖

NVIDIA Cosmos 推动物理 AI 前沿发展

PPIO亮相WAIC 2026：发布智能模型网关，打造面向Agent时代的智能Token工厂

OpenAI绕过英伟达，发布超高速AI编程模型

YouTube Music 推出生成式AI播放列表功能

苹果研究团队解析用户如何期待与AI智能体交互

Chrome自动浏览智能体实测：AI代理能否替你完成网络任务

内存价格暴涨引发企业抢购PC浪潮

e&集团借助Oracle云驱动AI优先的员工队伍转型

英国金融科技投资2025年大幅下滑21%

Claude AI 发现 500 个高危软件漏洞

Anthropic承诺保护消费者免受电价上涨影响

思科欧洲大会：五大发布彰显向AI公司转型决心

如果您非常迫切的想了解IT领域最新产品与技术信息，那么订阅至顶网技术邮件将是您的最佳途径之一

三一集团：数字化是必选项，AI是生存项

因湃电池 × 达索系统：如何共创出一套电池产业最佳实践

AI走进真实世界之后：安全、健康与产业的新命题

CES 2026

关注官方公众号

关注官方微博

关注官方喜马拉雅

友情链接

业界热点:

打造Token极致性价比新华三震撼亮相2026世界人工智能大会