世界上最大的芯片创下 AI 速度记录，超越 NVIDIA

Cerebras WSE 芯片拥有 40 亿晶体管，推理速度达到 NVIDIA 集群的约 2.5 倍，刷新了全球 AI 推理速度记录，为复杂 AI 代理应用提供高性能计算支持。

今天我亲手握住了世界上最大的计算机芯片。虽然它的体积令人印象深刻，但其速度更为惊人，也更为重要。大多数计算机芯片都很小，只有邮票大小甚至更小。相比之下， Cerebras WSE (Wafer Scale Engine) 是一个巨大正方形，每边长 8.5 英寸或 22 厘米，而最新型号在单个芯片上拥有惊人的 40 亿个晶体管。正是因为有了这数十亿个晶体管，WSE 才创造了 AI 推理操作的世界速度记录，比一个大体上性能相当的 NVIDIA 集群快约 2.5 倍。

“这是全球最快的推理速度，” Cerebras 首席信息安全官 Naor Penso 今天在温哥华 Web Summit 上对我说。 “上周 NVIDIA 宣布在 Llama 4 上实现了每秒 1,000 个 token 的速度，这令人印象深刻。而我们今天刚刚发布的基准测试达到了每秒 2,500 个 token。”

如果你对这些概念感到陌生，可以把“推理”理解为思考或行动：根据你的输入或提示构建句子、图像或视频。把“token”看作思维的基本单元：一个单词、一个字符或一个符号。

AI 引擎每秒能处理的 token 越多，它返回结果的速度也就越快。而速度至关重要。也许对你个人来说意义不大，但当企业客户希望在购物车中加入 AI 引擎，以便即时告诉你只需再加一种配料就能做出完美的韩式烧烤牛肉塔可时，他们必须能够为成千上万的人迅速提供服务。

有趣的是，速度即将变得更加关键。

我们正迈入一个代理时代，届时 AI 将能为我们执行复杂的多步骤任务，例如规划并预订去奥斯汀观看一级方程式比赛的周末旅行。代理并非魔法：他们对待大任务的方式和你一样……一步一步来。也就是说，需要将一个庞大的任务分解为 40、50 或甚至 100 个子任务，这就意味着工作量会大幅增加。

“AI 代理需要处理更多的工作，而且各个任务之间需要相互通信，” Penso 告诉我。 “你不能忍受推理速度缓慢。”

WSE 上的 40 亿个晶体管正是实现这种高速性能的关键部分。作为对比，英特尔 Core i9 拥有 33.5 亿个晶体管，而 Apple M2 Max 芯片也仅提供 67 亿个晶体管。但构建出高速计算怪兽的关键不仅仅在于晶体管数量，更在于系统的协同布局：将所有组件整合在同一芯片上，同时配备 44GB 的最快型 RAM（内存）。

“AI 计算需要大量的内存，” Penso 说。 “NVIDIA 需要外部存储，而使用 Cerebras 你不需要外部存储。”

独立机构 Artificial Analysis 验证了这一速度数据，他们称在 Llama 4 上测试该芯片时达到了每秒 2,522 个 token，而 NVIDIA Blackwell 的速度只有每秒 1,038 个 token。

“我们测试了数十家供应商，而 Cerebras 是唯一在 Meta 旗舰模型推理中表现优于 Blackwell 的解决方案，” Artificial Analysis 首席执行官 Micah Hill-Smith 表示。

WSE 芯片展示了计算机芯片设计的一次有趣演进。

自 1950 年代开始制造集成电路和 1960 年代开始制造微处理器以来，CPU 曾长期主导着计算领域。直到最近，GPU（图形处理单元）才从图形和游戏领域的辅助工具转变为 AI 开发中关键的处理组件。Cerebras 首席营销官 Julie Shin 告诉我，WSE 并非采用 x86 或 ARM 架构，而是一种全新架构，用于加速 GPU 计算。

“这不是一项渐进式技术，” 她补充道。 “这是芯片领域的又一次跨越性飞跃。”

来源：Forbes

0赞

好文章，需要你的鼓励

世界上最大的芯片创下 AI 速度记录，超越 NVIDIA

来源：Forbes

2025

05/29

17:33

分享

点赞

WAIC2026 现场直击：开普勒顶流人气王，麒麟系列火爆出圈

面壁智能将密度定律带入具身智能

龙磁科技拟投3.58亿元扩建越南永磁铁氧体基地

首创一层Scale-up网络256卡全互联，摩尔线程MTT C256超节点为万卡及十万卡级集群夯实底座

从高血压诊疗入手，北京安贞医院让医疗大模型走出聊天框

西门子肖松：以场景为牵引，推动工业AI从单点实效迈向生产力跃迁

打造Token极致性价比 新华三震撼亮相2026世界人工智能大会

机器人管家系统上线！傅利叶携多款康养陪伴新品方案亮相WAIC 2026

赛那德“ 自主作业机器人天团” 登陆 WAIC：iLoabot-X+模型双升级，秀出具身场景落地硬实力

西门子Eigen工程智能体中国首发首展，荣获2026 WAIC SAIL之星奖

NVIDIA Cosmos 推动物理 AI 前沿发展

PPIO亮相WAIC 2026：发布智能模型网关，打造面向Agent时代的智能Token工厂

数据目录为非结构化数据带来全新改变

Salesforce 斥资80亿美元收购 Informatica 支持 agentic AI 策略

Bit Cloud 为 AI 生成应用程序提供更高的可视性和控制力

基于放射影像的临床诊断中，AI模型尚未达到实际应用水平

Nvidia 与瑞典财团合作：AI 工厂重新定义经济

VAST Data 挑战企业 AI 工厂

人人都在追逐 vibe coding——Google 推出 Stitch，继 Jules 之后的新作

外包信心：下一个大热 AI 趋势？

PEAK:AIO 利用 CXL 内存拯救受 HBM 限制的 AI 模型

人工智能可能已经在缩减科技行业的入门级岗位，新研究显示

如果您非常迫切的想了解IT领域最新产品与技术信息，那么订阅至顶网技术邮件将是您的最佳途径之一

三一集团：数字化是必选项，AI是生存项

因湃电池 × 达索系统：如何共创出一套电池产业最佳实践

AI走进真实世界之后：安全、健康与产业的新命题

CES 2026

关注官方公众号

关注官方微博

关注官方喜马拉雅

友情链接

业界热点:

打造Token极致性价比新华三震撼亮相2026世界人工智能大会