英伟达加速生产Vera Rubin平台，打造下一代AI工厂基础架构

英伟达在台北Computex大会宣布，新一代Vera Rubin平台正式进入量产阶段。该平台以全新Rubin GPU为核心，集成Vera CPU、NVLink 6交换机、BlueField-4数据处理器等组件，较上代Grace Blackwell平台，智能体AI吞吐量提升10倍，推理成本降至十分之一。平台专为"智能体AI"工作负载设计，支持全栈机密计算与硬件级安全防护，首批系统预计今年秋季交付。

英伟达公司在台北Computex大会上宣布，正在加速生产即将推出的Vera Rubin平台，该平台将成为新一代人工智能工厂的基础，并在未来数年主导企业基础设施领域。

英伟达今年3月在年度GTC开发者大会上首次发布了Vera Rubin，此次宣布系统进入批量生产阶段，意味着该平台离正式面世更近一步。

Vera Rubin以首位发现暗物质证据的天文学家命名，它不仅仅是英伟达上一代图形处理器的简单升级。该公司表示，这是一次完整的架构革新，旨在推动企业向"智能体AI"转型——在这个世界中，自主AI智能体能够进行推理、使用第三方软件工具并代表人类执行复杂工作负载。

全新架构设计

Vera Rubin平台以英伟达新一代Rubin图形处理器为核心，这是Grace Blackwell GPU的继任者，但平台远不止于此。它还包括英伟达新推出的Vera中央处理器、NVLink 6交换机、ConnectX-9 SuperNIC、BlueField-4数据处理单元和Spectrum-6以太网交换机，以及专为支持万亿参数模型推理的确定性、低延迟需求而设计的Nvidia Groq 3语言处理单元。这些组件整合成一个完全集成的系统，在规模化部署时可提供比上一代Grace Blackwell平台高10倍的"智能体AI"吞吐量。

英伟达创始人兼首席执行官黄仁勋在Computex主题演讲中解释说，智能体AI是一种全新的工作负载类型，因此需要全新的基础架构。"一个提示词可以启动包含推理、检索、工具使用和响应生成的千步旅程，"他说。"Vera Rubin正是为这一时刻而生——一个能够大规模提供智能的AI工厂引擎，具备推动下一次工业革命所需的性能、效率和安全性。"

大规模量产启动

Vera Rubin是英伟达MGX机架级系统的第三代产品，将以前所未有的规模进行大规模生产，涉及分布在30个国家的350多家供应链合作伙伴。其主要合作伙伴包括戴尔科技、慧与科技、超微电脑和联想集团，这些公司都在制造Vera Rubin服务器，并将于今年晚些时候交付给英伟达的云和企业客户。

全新的Vera Rubin NVL72机架级系统是Vera Rubin平台的核心。这是一个液冷机架级系统，由72个Rubin GPU和36个Vera CPU组成,通过高速NVLink 6互连实现"突破性效率"。

例如，英伟达表示，Vera Rubin NVL72平台可用于训练大型专家混合模型，所需GPU数量仅为上一代Blackwell芯片的四分之一。在推理方面，该公司表示Vera Rubin将提供10倍的吞吐量，而每个Token的成本仅为十分之一。

为支持其设想的大规模AI工厂部署，英伟达推出了全球首款基于共封装光学技术的网络交换机——Nvidia Spectrum-X以太网光子学。这是新一代交换技术，据称可提供比传统收发器网络高5倍的能效、5倍的AI正常运行时间和1.3倍的部署速度。

该平台还集成了英伟达新推出的BlueField 4数据处理单元，其软件定义网络速度高达每秒800GB，并内置多租户隔离功能，可简化网络操作并提高底层Vera Rubin GPU的效率。英伟达表示，BlueField-4 STX存储机架旨在充当专用的"上下文内存"层，AI智能体可以使用它在大规模多轮交互中保持连贯性。通过将缓存数据卸载到BlueField-4芯片，企业可以将推理吞吐量提高多达5倍。

机架级安全保障

BlueField-4 STX在帮助保护英伟达AI工厂方面也发挥着至关重要的作用，这些工厂越来越多地处理敏感且受到高度监管的数据，这些数据不能暴露给第三方AI系统。此类工作负载需要增强的安全措施，这就是为什么Vera Rubin被设计为在机架级实现全栈机密计算，数据在GPU和CPU之间通过高速互连传输时进行加密。

基础安全由一个新的可编程软件层提供，该软件层旨在在整个系统中执行、编排和调整安全策略。这由BlueField-4 STX中的新Nvidia DOCA安全创新提供支持，在硅层执行安全策略。据称，DOCA能够实现多租户网络隔离、零信任策略执行、运行时威胁检测以及高达每秒800GB的加密速度。

"智能体AI将企业数据转变为一个实时运行的系统——而这个系统必须在数据移动、上下文存储和智能体行动的地方受到保护，"黄仁勋说。"通过Vera BlueField-4 STX，英伟达及其生态系统正在构建安全设计的存储基础设施，以AI的速度在硅层执行信任。"

智能体工作负载专用处理器

Vera Rubin平台的另一个关键元素是Vera CPU，这是一类专门为大规模运行智能体工作负载而设计的新型处理器，与标准x86芯片相比具有更高的速度和能效。

Vera CPU是英伟达Grace CPU的继任者，早期基准测试表明，它可以在关键智能体工作负载(包括代码编译和数据库处理)中提供出色的性能。这些类型的工作负载将成为大多数AI工厂的核心业务，为更高的吞吐量和更高效的单个AI智能体铺平道路。

"AI智能体将成为计算资源的最大用户，"黄仁勋解释说。"Vera是为这一未来设计的首款CPU——专为以超大规模运行智能体AI而构建，具有非凡的性能、效率和可编程性。"

英伟达认为，Vera CPU还将帮助加速AI工厂经济学从每美元核心数向每美元Token数的转变。它基于一个名为Olympus的新型定制CPU核心，专为Python运行时和沙盒代码执行到编排逻辑和分析管道等任务而设计。

英伟达表示，Olympus使Vera能够处理更多指令、预测应用程序行为并实时在大量并发环境中移动数据。每个CPU配备88个Olympus核心、空间多线程和支持每秒1.2TB带宽的LPDDR5X内存子系统，确保智能体在CPU密集型步骤上的等待时间大大减少，从而提高AI工厂的整体效率。

此外，Vera CPU与BlueField-4 STX处理器紧密集成，以受益于其嵌入式硅安全功能。

Vera Rubin平台的最后一个组件是Nvidia DSX，这是一个架构蓝图，为现代AI工厂提供完整的设计和运营基础。它统一了参考设计、模拟、基础设施软件和生态系统技术，帮助服务器制造商开发针对性能和更低Token成本优化的节能AI系统。

通过采用DSX，英伟达的合作伙伴(包括戴尔、慧与、联想和超微等)都在加速生产首批Vera Rubin系统，英伟达预计首批完整系统将在秋季交付给客户。

Q&A

Q1：Vera Rubin平台是什么？它有什么特别之处？

A：Vera Rubin是英伟达推出的新一代AI工厂基础平台，以发现暗物质证据的天文学家命名。它不是简单的GPU升级，而是完整的架构革新，专为智能体AI设计。该平台整合了Rubin GPU、Vera CPU、NVLink 6交换机等多个组件，可提供比上一代高10倍的智能体AI吞吐量，推理成本仅为十分之一。

Q2：Vera Rubin平台什么时候能投入使用？

A：英伟达已宣布Vera Rubin进入批量生产阶段，涉及30个国家的350多家供应链合作伙伴。戴尔、慧与、联想和超微等主要合作伙伴正在制造Vera Rubin服务器，预计首批完整系统将在今年秋季交付给云和企业客户。

Q3：Vera CPU相比传统处理器有什么优势？

A：Vera CPU是专门为大规模运行智能体工作负载设计的新型处理器，相比标准x86芯片具有更高速度和能效。它基于Olympus定制核心，每个CPU配备88个核心，支持每秒1.2TB的内存带宽，在代码编译和数据库处理等智能体核心工作负载中表现出色，能大幅减少AI智能体的等待时间。

来源：SiliconANGLE

0赞

好文章，需要你的鼓励

英伟达加速生产Vera Rubin平台，打造下一代AI工厂基础架构

来源：SiliconANGLE

2026

06/01

17:43

分享

点赞

Waymo因洪水问题发布召回，近4000辆自动驾驶车辆受影响

AI驱动的"地面情报"系统：Samsara如何帮助城市主动修复坑洼路面

特斯拉Robotaxi披露两起远程操控事故

特斯拉FSD自动驾驶软件加速进军欧洲市场

Waymo暂停高速公路服务，因自动驾驶出租车难以应对施工区

Waymo自动驾驶车辆注册数量领跑德克萨斯，特斯拉远落后

Siri AI、ChatGPT、Claude真实横评，谁才是最强AI助手？

Uber年度遗失物报告揭示：数千件物品遗留在无人驾驶出租车中

Uber今年将部署500辆数据采集车辆，助力自动驾驶发展

Uber、Wayve与Waymo的伦敦无人驾驶出租车大战即将开启

Mobileye计划2027年在美国推出自动驾驶出租车服务

Waymo召回近4000辆无人出租车，原因是其进入高速公路施工区域

英伟达为开发者提供构建安全可扩展自主AI智能体的工具

英伟达将1万亿参数AI超算压缩至桌面工作站

英伟达工厂运营蓝图为制造业注入AI大脑

Cosmos 3如何帮助物理AI在行动前进行思考

AI基础设施为何转向800 VDC供电架构

Cognition创始人吴思齐：AI编程智能体不应取代人类

Google推出开源Agent Executor支持企业级AI智能体部署

DeepSeek V4-Pro大幅降价加剧AI价格战

谷歌推出开源Agent Executor支持生产环境AI智能体运行

欧洲央行警告银行注意AI带来的新风险

如果您非常迫切的想了解IT领域最新产品与技术信息，那么订阅至顶网技术邮件将是您的最佳途径之一

三一集团：数字化是必选项，AI是生存项

因湃电池 × 达索系统：如何共创出一套电池产业最佳实践

AI走进真实世界之后：安全、健康与产业的新命题

CES 2026

关注官方公众号

关注官方微博

关注官方喜马拉雅

友情链接

业界热点: