加利福尼亚圣何塞——英伟达周一推出了Vera Rubin AI基础设施平台,这是一个垂直集成系统,旨在为AI的每个阶段提供动力支持,包括下一波智能体推理。该公司还预览了将其AI基础设施扩展到轨道的计划,勾勒出未来太空数据中心的发展路径。
英伟达首席执行官黄仁勋在圣何塞SAP中心的两小时主题演讲中阐述了这一路线图,拉开了GTC 2026会议的序幕,将全面的技术愿景与乐观的财务前景相结合。去年,基于Blackwell和Rubin GPU的强劲表现,他预测到2026年销售额将达到5000亿美元,现在他将这一预测提高到2027年1万亿美元,理由是推理经济的激增。
"最终,AI能够进行生产性工作,因此推理的拐点已经到来,"黄仁勋告诉GTC与会者。"AI现在必须思考。为了思考,它必须进行推理。AI现在必须行动。为了行动,它必须进行推理。每次它需要推理...生成Token时,它都必须进行推理。这已经远远超越了训练阶段。"
黄仁勋表示,过去两年计算需求增长了10000倍,使用量可能增长了100倍。"这是我们所有人都有的感受,"他说。"这是每个初创公司的感受。这是OpenAI的感受。这是Anthropic的感受...如果他们能获得更多容量,就能生成更多Token,收入就会增长。"
智能体AI的五机架平台
Vera Rubin是英伟达迄今为止最全面的系统,将五个机架级系统整合为一个AI超级计算机。这也是继英伟达2025年12月授权协议后首个集成Groq的产品,将Groq的低延迟处理器引入实时、大上下文推理领域。
据英伟达高管介绍,Vera Rubin平台包括:
集成72个Rubin GPU和36个Vera CPU的NVL72 GPU机架;
配备256个液冷Vera CPU的Vera CPU机架,专为智能体AI工作负载和强化学习任务设计;
配备256个LPU处理器的英伟达Groq 3 LPX推理加速器机架,用于低延迟、大上下文智能体系统;
BlueField-4 DPU存储机架;
以及支持Quantum-X800 InfiniBand或Spectrum-X以太网交换配置的Spectrum-6 SPX以太网网络机架。
"当我们考虑Vera Rubin时,我们考虑的是整个系统,完全垂直集成软件,端到端扩展,作为一个巨型系统进行优化,"黄仁勋说道。
Moor Insights & Strategy的分析师Matt Kimball将这一设计描述为承认推理工作负载多样性的有意解耦。
"推理不是一刀切的工作负载,"Kimball告诉Data Center Knowledge。"他们悄然承认他们的GPU不是所有工作负载的答案,尤其是智能体AI。这就是为什么他们在机架中加入Groq的原因。"
这一策略反映了英伟达进军快速增长的推理市场,超大规模厂商和专用芯片初创公司正在加剧竞争。
Vera Rubin平台内部结构
英伟达超大规模和高性能计算副总裁Ian Buck在媒体简报中表示,Vera Rubin专为加速AI的四个阶段而构建:大规模预训练、后训练微调、测试时间扩展(在推理时应用额外计算以提高推理质量),以及他称为"智能体扩展"的新阶段,即AI系统与其他AI系统和工具交互。
Buck概述了几项性能声明:
与之前的Blackwell平台相比,NVL72 GPU机架可以用四分之一的GPU数量训练模型,并以十分之一的每Token成本提供10倍更高的每瓦推理吞吐量。
当与NVL72一起部署时,Groq 3 LPX机架通过为每个输出Token联合计算每一层来加速解码,提升智能体系统的响应生成。Groq 3 LPX机架计划于2026年下半年提供。
Vera CPU——英伟达Grace的后继者——与x86 CPU相比,每核心提供两倍的能效和三倍的内存带宽,计划于2026年下半年全面上市。Buck强调GPU和CPU在智能体工作流程中发挥互补作用,CPU处理工具调用、SQL查询和代码编译等任务。
BlueField-4 STX存储机架引入了AI原生存储架构,英伟达称其每瓦性能提升四倍;英伟达为存储合作伙伴提供实施的参考架构。
第五个机架Spectrum-6 SPX提供低延迟、高吞吐量的机架到机架连接,将系统整合在一起。
Cambrian AI Research创始人兼首席分析师Karl Freund表示,Groq集成很重要,但更广泛的意义是战略性的。
"我认为更大的新闻是英伟达正在进行根本性转变,以在智能体AI领域确立公司的领导地位,"Freund告诉Data Center Knowledge。他补充说,五机架架构让客户通过将工作负载与最合适的处理器和网络匹配来定制基础设施。
商业案例:更多Token,更多层级
在主题演讲中,黄仁勋使用一个假设的1 GW AI工厂为Vera Rubin提出了财务论证。他指出,AI服务通常按层级定价——如免费、中级、高级和高端——并断言在每个层级,Vera Rubin都能比之前的Blackwell和Hopper系统生成更多Token。
黄仁勋表示,将Vera Rubin机架与Groq LPX机架结合,创造了3000亿美元的年收入机会——是单独Vera Rubin的两倍,是Blackwell的10倍。它还能实现额外的超级层级服务,为AI公司创造更多收入。总体而言,他说,1 GW工厂的Token生成可能从Hopper系统的每秒约200万Token增加到Vera Rubin系统的每秒约7亿Token。这350倍的增长降低了每Token成本,同时提高了吞吐量。
分析师警告说,收入场景取决于买家对高端层级的需求。Futurum Group分析师Brendan Burke指出,每百万Token 150美元的隐含超级层级价格比每百万Token 3美元的中级层级价格高出50倍。
"该公司仍然依赖应用层客户来证明Jensen设定的Rubin和Groq组合系统50倍Token价格增长目标的合理性,"Burke告诉Data Center Knowledge。
将AI基础设施带入轨道
英伟达还披露了基于Rubin GPU的英伟达Vera Rubin太空模块的早期工作,这是轨道数据中心长期愿景的一部分。黄仁勋表示,英伟达技术已经在卫星上飞行,但在太空创建数据中心面临独特挑战。
"我们正在与合作伙伴合作...当然,在太空中没有传导。没有对流。只有辐射,所以我们必须想办法在太空中冷却这些系统,"他指出,英伟达有工程师专注于这个问题。
Freund称太空雄心是"有抱负的",但表示如果能克服延迟障碍,考虑到地面数据中心的能源需求和在太空中利用丰富太阳能的潜力,这可能很有吸引力。
更多GTC公告
英伟达还推出了Vera Rubin DSX AI工厂参考设计,指导运营商建设AI工厂,并发布了英伟达Omniverse DSX蓝图,用于创建这些设施的物理精确数字孪生。
在软件方面,英伟达宣布英伟达Dynamo 1.0正式上市,这是一个被描述为AI工厂操作系统的AI推理软件平台。该公司还推出了用于OpenClaw智能体平台的NemoClaw堆栈,以及Nemotron联盟,这是一项汇集开放模型构建者和开发者的倡议,通过共享专业知识、数据和计算来推进开放模型。
分析师表示,GTC公告基本符合预期。
"英伟达在新的Groq 3推理芯片、扩展和扩容光学支持以及开源智能体框架方面满足了高期望,同时确认了Blackwell和Rubin平台的巨大代际提升,"Burke说道。
Q&A
Q1:Vera Rubin是什么?它有哪些主要功能?
A:Vera Rubin是英伟达推出的AI基础设施平台,这是一个垂直集成系统,将五个机架级系统整合为一个AI超级计算机。它能支持AI的各个阶段,包括大规模预训练、后训练微调、测试时间扩展和智能体推理,并首次集成了Groq的低延迟处理器用于实时推理。
Q2:英伟达为什么预测2027年能实现万亿美元营收?
A:黄仁勋认为AI推理的拐点已经到来,计算需求在过去两年增长了10000倍。Vera Rubin结合Groq系统能创造3000亿美元年收入机会,是单独Vera Rubin的两倍。同时AI服务的多层级定价模式和更高的Token生成效率为实现万亿美元营收目标提供了基础。
Q3:Vera Rubin平台的五个机架分别有什么作用?
A:五个机架各有专门功能:NVL72 GPU机架用于训练和推理;Vera CPU机架处理智能体工作负载;Groq 3 LPX机架提供低延迟推理;BlueField-4存储机架提供AI原生存储;Spectrum-6网络机架提供高吞吐量连接。这种设计让客户能根据不同工作负载选择最合适的处理器和网络配置。
好文章,需要你的鼓励
Replit与RevenueCat达成合作,将订阅变现工具直接集成至Replit平台。用户只需通过自然语言提示(如"添加订阅"),即可完成应用内购和订阅配置,无需离开平台。RevenueCat管理超8万款应用的订阅业务,每月处理约10亿美元交易。此次合作旨在让"氛围编程"用户在构建应用的同时即可实现商业变现,月收入未达2500美元前免费使用,超出后收取1%费用。
LiVER是由北京大学、北京邮电大学等机构联合提出的视频生成框架,核心创新是将物理渲染技术与AI视频生成结合,通过Blender引擎计算漫反射、粗糙GGX和光泽GGX三种光照图像构成"场景代理",引导视频扩散模型生成光影物理准确的视频。框架包含渲染器智能体、轻量化编码器适配器和三阶段训练策略,支持对光照、场景布局和摄像机轨迹的独立精确控制。配套构建的LiVERSet数据集含约11000段标注视频,实验显示该方法在视频质量和控制精度上均优于现有方法。
所有人都说AI需要护栏,但真正在构建它的人寥寥无几。SkipLabs创始人Julien Verlaguet深耕这一问题已逾一年,他发现市面上多数"护栏"不过是提示词包装。为此,他打造了专为后端服务设计的AI编程智能体Skipper,基于健全的TypeScript类型系统与响应式运行时,实现增量式代码生成与测试,内部基准测试通过率超90%。他认为,编程语言的"人类可读性时代"正走向终结,面向智能体的精确工具链才是未来。
这项由蒙特利尔学习算法研究所(Mila)与麦吉尔大学联合发布的研究(arXiv:2604.07776,2026年4月)提出了AGENT-AS-ANNOTATORS框架,通过模仿人类数据标注的三种角色分工,系统化生成高质量网页智能体训练轨迹。以Gemini 3 Pro为教师模型,仅用2322条精选轨迹对90亿参数的Qwen3.5-9B模型进行监督微调,在WebArena基准上达到41.5%成功率,超越GPT-4o和Claude 3.5 Sonnet,并在从未见过的企业平台WorkArena L1上提升18.2个百分点,验证了"数据质量远比数量重要"这一核心结论。