英伟达展示Rubin CPX推理性能预览

英伟达发布新款Rubin CPX GPU，专为大规模上下文处理而设计，可支持百万级token的软件编程和生成视频。该产品将搭载于Vera Rubin NVL 144 CPX平台，承诺高能效和卓越推理性能，每投资1亿美元可获得50亿美元token收入。同时，英伟达展示了Blackwell Ultra GB300系统的基准测试结果，DeepSeek-R1推理性能较前代提升1.4倍。

英伟达于周二展示了其新款和计划发布GPU的推理优势，该公司正为数据中心从密集AI训练工作负载向更多样化推理需求的转变做准备。

英伟达凭借其先进的GPU在AI训练市场占据主导地位。但随着需求转向推理工作负载——使用训练好的模型进行预测——不同的用例将需要各种硅解决方案。

这家位于加利福尼亚州圣克拉拉的GPU巨头发布了Rubin CPX，这是一款专为处理大规模上下文而构建的新型GPU。这将使AI系统能够处理百万Token的软件编程和生成式视频。

新设备还承诺为推理任务提供能效和高性能，投资1亿美元可获得50亿美元的Token收入。

Rubin CPX将在英伟达新的Vera Rubin NVL 144 CPX平台内运行。

该公司表示，其由Blackwell Ultra和即将推出的Vera Rubin GPU驱动的新推理数据中心平台将解决最繁重的工作负载。

转向推理市场

随着市场转变，英伟达在数据中心市场份额主导地位可能面临更多来自专注各种推理需求公司的竞争。因此，该制造商押注其顶级GPU为驱动所谓"AI工厂"的专家混合(MoE)大语言模型架构提供所需性能。

根据Markets and Markets报告，全球AI推理市场2025年估值为1060亿美元，预计到2030年将增长至2550亿美元。

"我喜欢英伟达向推理领域倾斜，因为那是市场发展方向，"Moor Insights & Strategy副总裁兼首席分析师Matt Kimball在接受Data Center Knowledge采访时表示。

"Rubin是一个强大的组件...就像Blackwell相比Hopper一样强大。你说的是开启更快更大的推理，开启那些Token窗口。"

但Kimball表示，该产品并非针对普通企业用户。"这是采用Rubin并创建专门的推理组件，真正面向高端市场，"他补充说，超大规模云服务商和大型企业可能构成Rubin客户的主体。

英伟达AI和数据中心GPU营销总监Shar Narasimhan表示："[Rubin CPX]解锁了智能编程系统和视频生成等高端用例的新层级。它将大幅提高AI工厂的生产力和性能。"

Blackwell Ultra的推理性能提升

周二，英伟达还分享了其Blackwell Ultra驱动的GB300 NVL72机架级系统的基准测试结果，显示DeepSeek-R1推理性能比前代产品提升1.4倍。

该公司表示，该系统还在MLPerf Inference v5.1套件新增的所有数据中心基准测试中创下记录，包括Llama 3.1 405B Interactive、Llama 3.1 8B和Whisper。

英伟达加速计算产品总监Dave Salvatore在新闻发布会上表示："我对这些数字非常满意。随着我们继续优化Blackwell Ultra软件栈，我们预计这些数字会随时间增长。"

英伟达表示，Blackwell Ultra的基准测试结果展示了硬件提高AI工厂生产力、增加收入并降低拥有成本的潜力。

Q&A

Q1：Rubin CPX是什么？有什么特殊功能？

A：Rubin CPX是英伟达发布的一款专为处理大规模上下文而构建的新型GPU。它能够使AI系统处理百万Token的软件编程和生成式视频，专门针对大规模推理工作负载设计，承诺为推理任务提供高能效和高性能。

Q2：AI推理市场前景如何？

A：根据Markets and Markets报告，全球AI推理市场2025年估值为1060亿美元，预计到2030年将增长至2550亿美元。随着市场从AI训练转向推理应用，这个领域正成为重要的增长点。

Q3：Blackwell Ultra相比前代产品有什么提升？

A：Blackwell Ultra驱动的GB300 NVL72系统在DeepSeek-R1推理性能上比前代产品提升1.4倍，并在MLPerf Inference v5.1套件的所有新增数据中心基准测试中创下记录，包括Llama 3.1 405B Interactive、Llama 3.1 8B和Whisper等测试项目。

来源：DataCenterKnowledge

0赞

好文章，需要你的鼓励

英伟达展示Rubin CPX推理性能预览

来源：DataCenterKnowledge

2025

09/15

08:06

分享

点赞

AI智能体漏洞挖掘成本骤降，Anthropic呼吁AI防御

Spotify年度盘点2025首次推出多人互动功能"盘点派对"

英国SAP用户因商业套件重启授权迷局感到困惑

AWS发布Graviton5定制CPU，为云工作负载带来强劲性能

美光放弃Crucial品牌：告别消费级存储市场

手机里的NPU越来越强，为什么AI体验还在原地踏步？

如何使用现有基础设施让数据做好AI准备

IT领导者快问快答：思科光网络公司首席数字信息官Craig Williams分享AI转型经验

Anthropic CEO警告AI行业泡沫化，批评"YOLO"式投资

雅虎利用AI实时总结橄榄球比赛精彩内容

押注AI智能体，奇奇科技跨越十年的“换挡”与远航

联想天禧AI及创新终端设备在2025 AIE博览会获两项大奖，引领个人AI体验创新

诺基亚推出AI优化数据中心网络解决方案

梅赛德斯-奔驰推出AI驱动的全电动GLC车型

思科Splunk大会：智能体驱动的SOC安全运营愿景正式发布

PEC 2025 AI创新者大会暨第二届提示工程峰会启幕，叩问AGI前夜关键命题

OpenAI与微软签署初步协议修订合作条款

国产R1人形机器人亮相，挑战特斯拉Optimus霸主地位

智能化追踪研究：AI与人类智慧的融合

生命科学企业如何成功实施生成式AI

Cisco收购Splunk后平台扩展显著加速

F5以1.8亿美元收购CalypsoAI强化AI安全能力

如果您非常迫切的想了解IT领域最新产品与技术信息，那么订阅至顶网技术邮件将是您的最佳途径之一

电子竞技瞬息万变，Team Liquid的“数据+AI”制胜秘籍

中国移动呼和浩特数据中心：只有高效存力先行，AI才能跑出全力

从“支撑工具”到“智能中枢”，AI原生ERP进化

阿里要用AI将云计算重做一遍

关注官方公众号

关注官方微博

关注官方喜马拉雅

友情链接

业界热点: