英伟达GTC 2026发布Vera Rubin AI平台，目标2027年营收万亿美元

英伟达在GTC 2026大会上发布Vera Rubin AI基础设施平台，这是一个垂直整合的五机架系统，旨在为AI的各个阶段提供动力，包括下一波代理推理。CEO黄仁勋将营收预期从2026年的5000亿美元上调至2027年的1万亿美元。该平台集成了英伟达收购Groq后的低延迟处理器，结合了GPU、CPU和专用推理加速器，为代理AI工作负载进行优化。英伟达还预览了将AI基础设施扩展到轨道的计划。

加利福尼亚圣何塞——英伟达周一推出了Vera Rubin AI基础设施平台，这是一个垂直集成系统，旨在为AI的每个阶段提供动力支持，包括下一波智能体推理。该公司还预览了将其AI基础设施扩展到轨道的计划，勾勒出未来太空数据中心的发展路径。

英伟达首席执行官黄仁勋在圣何塞SAP中心的两小时主题演讲中阐述了这一路线图，拉开了GTC 2026会议的序幕，将全面的技术愿景与乐观的财务前景相结合。去年，基于Blackwell和Rubin GPU的强劲表现，他预测到2026年销售额将达到5000亿美元，现在他将这一预测提高到2027年1万亿美元，理由是推理经济的激增。

"最终，AI能够进行生产性工作，因此推理的拐点已经到来，"黄仁勋告诉GTC与会者。"AI现在必须思考。为了思考，它必须进行推理。AI现在必须行动。为了行动，它必须进行推理。每次它需要推理...生成Token时，它都必须进行推理。这已经远远超越了训练阶段。"

黄仁勋表示，过去两年计算需求增长了10000倍，使用量可能增长了100倍。"这是我们所有人都有的感受，"他说。"这是每个初创公司的感受。这是OpenAI的感受。这是Anthropic的感受...如果他们能获得更多容量，就能生成更多Token，收入就会增长。"

智能体AI的五机架平台

Vera Rubin是英伟达迄今为止最全面的系统，将五个机架级系统整合为一个AI超级计算机。这也是继英伟达2025年12月授权协议后首个集成Groq的产品，将Groq的低延迟处理器引入实时、大上下文推理领域。

据英伟达高管介绍，Vera Rubin平台包括：

集成72个Rubin GPU和36个Vera CPU的NVL72 GPU机架；

配备256个液冷Vera CPU的Vera CPU机架，专为智能体AI工作负载和强化学习任务设计；

配备256个LPU处理器的英伟达Groq 3 LPX推理加速器机架，用于低延迟、大上下文智能体系统；

BlueField-4 DPU存储机架；

以及支持Quantum-X800 InfiniBand或Spectrum-X以太网交换配置的Spectrum-6 SPX以太网网络机架。

"当我们考虑Vera Rubin时，我们考虑的是整个系统，完全垂直集成软件，端到端扩展，作为一个巨型系统进行优化，"黄仁勋说道。

Moor Insights & Strategy的分析师Matt Kimball将这一设计描述为承认推理工作负载多样性的有意解耦。

"推理不是一刀切的工作负载，"Kimball告诉Data Center Knowledge。"他们悄然承认他们的GPU不是所有工作负载的答案，尤其是智能体AI。这就是为什么他们在机架中加入Groq的原因。"

这一策略反映了英伟达进军快速增长的推理市场，超大规模厂商和专用芯片初创公司正在加剧竞争。

Vera Rubin平台内部结构

英伟达超大规模和高性能计算副总裁Ian Buck在媒体简报中表示，Vera Rubin专为加速AI的四个阶段而构建：大规模预训练、后训练微调、测试时间扩展（在推理时应用额外计算以提高推理质量），以及他称为"智能体扩展"的新阶段，即AI系统与其他AI系统和工具交互。

Buck概述了几项性能声明：

与之前的Blackwell平台相比，NVL72 GPU机架可以用四分之一的GPU数量训练模型，并以十分之一的每Token成本提供10倍更高的每瓦推理吞吐量。

当与NVL72一起部署时，Groq 3 LPX机架通过为每个输出Token联合计算每一层来加速解码，提升智能体系统的响应生成。Groq 3 LPX机架计划于2026年下半年提供。

Vera CPU——英伟达Grace的后继者——与x86 CPU相比，每核心提供两倍的能效和三倍的内存带宽，计划于2026年下半年全面上市。Buck强调GPU和CPU在智能体工作流程中发挥互补作用，CPU处理工具调用、SQL查询和代码编译等任务。

BlueField-4 STX存储机架引入了AI原生存储架构，英伟达称其每瓦性能提升四倍；英伟达为存储合作伙伴提供实施的参考架构。

第五个机架Spectrum-6 SPX提供低延迟、高吞吐量的机架到机架连接，将系统整合在一起。

Cambrian AI Research创始人兼首席分析师Karl Freund表示，Groq集成很重要，但更广泛的意义是战略性的。

"我认为更大的新闻是英伟达正在进行根本性转变，以在智能体AI领域确立公司的领导地位，"Freund告诉Data Center Knowledge。他补充说，五机架架构让客户通过将工作负载与最合适的处理器和网络匹配来定制基础设施。

商业案例：更多Token，更多层级

在主题演讲中，黄仁勋使用一个假设的1 GW AI工厂为Vera Rubin提出了财务论证。他指出，AI服务通常按层级定价——如免费、中级、高级和高端——并断言在每个层级，Vera Rubin都能比之前的Blackwell和Hopper系统生成更多Token。

黄仁勋表示，将Vera Rubin机架与Groq LPX机架结合，创造了3000亿美元的年收入机会——是单独Vera Rubin的两倍，是Blackwell的10倍。它还能实现额外的超级层级服务，为AI公司创造更多收入。总体而言，他说，1 GW工厂的Token生成可能从Hopper系统的每秒约200万Token增加到Vera Rubin系统的每秒约7亿Token。这350倍的增长降低了每Token成本，同时提高了吞吐量。

分析师警告说，收入场景取决于买家对高端层级的需求。Futurum Group分析师Brendan Burke指出，每百万Token 150美元的隐含超级层级价格比每百万Token 3美元的中级层级价格高出50倍。

"该公司仍然依赖应用层客户来证明Jensen设定的Rubin和Groq组合系统50倍Token价格增长目标的合理性，"Burke告诉Data Center Knowledge。

将AI基础设施带入轨道

英伟达还披露了基于Rubin GPU的英伟达Vera Rubin太空模块的早期工作，这是轨道数据中心长期愿景的一部分。黄仁勋表示，英伟达技术已经在卫星上飞行，但在太空创建数据中心面临独特挑战。

"我们正在与合作伙伴合作...当然，在太空中没有传导。没有对流。只有辐射，所以我们必须想办法在太空中冷却这些系统，"他指出，英伟达有工程师专注于这个问题。

Freund称太空雄心是"有抱负的"，但表示如果能克服延迟障碍，考虑到地面数据中心的能源需求和在太空中利用丰富太阳能的潜力，这可能很有吸引力。

更多GTC公告

英伟达还推出了Vera Rubin DSX AI工厂参考设计，指导运营商建设AI工厂，并发布了英伟达Omniverse DSX蓝图，用于创建这些设施的物理精确数字孪生。

在软件方面，英伟达宣布英伟达Dynamo 1.0正式上市，这是一个被描述为AI工厂操作系统的AI推理软件平台。该公司还推出了用于OpenClaw智能体平台的NemoClaw堆栈，以及Nemotron联盟，这是一项汇集开放模型构建者和开发者的倡议，通过共享专业知识、数据和计算来推进开放模型。

分析师表示，GTC公告基本符合预期。

"英伟达在新的Groq 3推理芯片、扩展和扩容光学支持以及开源智能体框架方面满足了高期望，同时确认了Blackwell和Rubin平台的巨大代际提升，"Burke说道。

Q&A

Q1：Vera Rubin是什么？它有哪些主要功能？

A：Vera Rubin是英伟达推出的AI基础设施平台，这是一个垂直集成系统，将五个机架级系统整合为一个AI超级计算机。它能支持AI的各个阶段，包括大规模预训练、后训练微调、测试时间扩展和智能体推理，并首次集成了Groq的低延迟处理器用于实时推理。

Q2：英伟达为什么预测2027年能实现万亿美元营收？

A：黄仁勋认为AI推理的拐点已经到来，计算需求在过去两年增长了10000倍。Vera Rubin结合Groq系统能创造3000亿美元年收入机会，是单独Vera Rubin的两倍。同时AI服务的多层级定价模式和更高的Token生成效率为实现万亿美元营收目标提供了基础。

Q3：Vera Rubin平台的五个机架分别有什么作用？

A：五个机架各有专门功能：NVL72 GPU机架用于训练和推理；Vera CPU机架处理智能体工作负载；Groq 3 LPX机架提供低延迟推理；BlueField-4存储机架提供AI原生存储；Spectrum-6网络机架提供高吞吐量连接。这种设计让客户能根据不同工作负载选择最合适的处理器和网络配置。

来源：DataCenterKnowledge

0赞

好文章，需要你的鼓励

英伟达GTC 2026发布Vera Rubin AI平台，目标2027年营收万亿美元

来源：DataCenterKnowledge

2026

03/18

11:37

分享

点赞

WAIC2026 现场直击：开普勒顶流人气王，麒麟系列火爆出圈

面壁智能将密度定律带入具身智能

龙磁科技拟投3.58亿元扩建越南永磁铁氧体基地

首创一层Scale-up网络256卡全互联，摩尔线程MTT C256超节点为万卡及十万卡级集群夯实底座

从高血压诊疗入手，北京安贞医院让医疗大模型走出聊天框

西门子肖松：以场景为牵引，推动工业AI从单点实效迈向生产力跃迁

打造Token极致性价比 新华三震撼亮相2026世界人工智能大会

机器人管家系统上线！傅利叶携多款康养陪伴新品方案亮相WAIC 2026

赛那德“ 自主作业机器人天团” 登陆 WAIC：iLoabot-X+模型双升级，秀出具身场景落地硬实力

西门子Eigen工程智能体中国首发首展，荣获2026 WAIC SAIL之星奖

NVIDIA Cosmos 推动物理 AI 前沿发展

PPIO亮相WAIC 2026：发布智能模型网关，打造面向Agent时代的智能Token工厂

超大规模云服务商资本支出激增至7000亿美元，押注AI算力建设

压力过大的AI模型能否帮我们战胜科技巨头？

罗氏与英伟达合作加速AI技术在制药领域的应用

英国必须从AI竞赛中吸取教训并留住量子计算人才

Available公司50亿美元Project Qestrel项目将部署1000个边缘数据中心

澳洲联邦银行自建AI威胁狩猎智能体应对新兴威胁

Picsart推出智能体市场，创作者可"雇佣"AI助手

Nvidia自动驾驶汽车的"ChatGPT时刻"来临及GTC 2026核心AI发布

英伟达NemoClaw平台或解决OpenClaw安全难题

英伟达GTC 2026主题演讲三大亮点：NemoClaw、DLSS 5和Vera CPU

如果您非常迫切的想了解IT领域最新产品与技术信息，那么订阅至顶网技术邮件将是您的最佳途径之一

三一集团：数字化是必选项，AI是生存项

因湃电池 × 达索系统：如何共创出一套电池产业最佳实践

AI走进真实世界之后：安全、健康与产业的新命题

CES 2026

关注官方公众号

关注官方微博

关注官方喜马拉雅

友情链接

业界热点:

打造Token极致性价比新华三震撼亮相2026世界人工智能大会