Nvidia宣布Vera Rubin与Vera CPU按期推进,发布AI工厂操作系统DSX OS

英伟达在GTC台北大会上宣布,其Vera Rubin智能体AI平台和Vera CPU已进入全面生产阶段,计划今年秋季出货。同时推出DSX OS操作系统,帮助组织更高效地管理和运营AI工厂。DSX MaxLPS技术可在相同功耗下部署多达40%的GPU。Anthropic、OpenAI等成为Vera CPU早期采用者。

英伟达(Nvidia)周一宣布,旗下Vera Rubin智能体AI平台及Vera CPU已进入全面量产阶段,预计将于今年秋季如期出货。与此同时,英伟达还发布了DSX OS——一款专为AI工厂设计的全新操作系统,旨在帮助企业更高效地管理和运营AI基础设施。上述发布均在CEO黄仁勋出席台北GTC大会主题演讲期间正式宣布。

DSX OS发布:AI工厂的管理基础

英伟达推出了DSX OS,这是一款模块化开源软件,专为AI工厂运营商而设计,支持大规模AI基础设施的配置、运维与监控。英伟达表示,DSX OS具备完整的生命周期管理、健康自动化、弹性容错及多租户运营能力。

"这是一个稳定的基础平台,新的服务、智能体和AI应用都可以在其上构建。"英伟达超大规模计算与高性能计算副总裁Ian Buck在媒体发布会上如此表示。

英伟达还同步推出了DSX MaxLPS——一套面向下一代Vera Rubin AI平台的优化技术组合,专为在固定功耗预算内最大化Token处理性能而设计。"借助MaxLPS,AI工厂可以在相同功耗范围内安全部署多达40%的GPU。"Buck说道,"这意味着40%更强的算力、40%更多的Token处理量,以及40%更高的潜在收益。"

英伟达此次的系列发布进一步扩展了其硬件与软件产品矩阵,助力云服务商、AI企业及大型机构构建和运营AI基础设施,并提供用于开发和运行AI智能体及其他AI应用的工具链。

英伟达从芯片公司迈向基础设施公司

在主题演讲中,黄仁勋强调英伟达的定位已远不止于一家芯片或系统供应商。

"英伟达已经真正成为一家基础设施公司——不只是GPU公司,不只是系统公司,而是一家帮助客户实现最大收益、最大利润,并尽快达成目标的基础设施公司。"黄仁勋如此阐述公司定位。

英伟达最初于今年3月圣何塞GTC大会上首次公布了DSX平台、Vera Rubin AI平台及Vera CPU。此前,公司已发布DSX参考设计,用于指导运营商构建AI工厂,并推出了DSX蓝图,用于创建这些设施的高精度数字孪生模型。

据英伟达介绍,Vera Rubin平台被定位为公司迄今为止最全面的AI系统,将五种机架级系统整合为一台AI超级计算机,涵盖:搭载72块Rubin GPU与36块Vera CPU的NVL72 GPU机架、Vera CPU机架、Groq 3 LPX推理加速机架、BlueField-4 STX存储机架,以及Spectrum-6 SPX以太网网络机架。

黄仁勋力推Vera Rubin与Vera CPU

在主题演讲中,黄仁勋再次为英伟达即将推出的硬件产品打Call,称Vera Rubin是"公司历史上最宏大的项目",并表示Vera CPU将成为英伟达下一个重要增长引擎。"此前所有CPU都是为人类服务的,而这款CPU是为智能体而生的。"黄仁勋对现场观众说道。

黄仁勋表示,智能体对响应速度有着极高要求,而Vera正是为此而来。在最新基准测试中,Vera CPU的性能达到x86 CPU的1.8倍。"智能体没有耐心,它们不活在秒的世界里,它们活在纳秒的世界里。将CPU的延迟压到最低至关重要,因此我们为AI时代打造了Vera CPU。"他说。

黄仁勋还透露,来自各方的Vera订单将使其成为"公司历史上速度最快、最成功的产品发布"。英伟达周一宣布,Anthropic、OpenAI和SpaceXAI已成为Vera CPU的早期采用者,其他客户还包括Oracle云基础设施(Oracle Cloud Infrastructure)、字节跳动(ByteDance),以及新兴云服务商CoreWeave、Nebius、Nscale和Lambda。

强劲的客户牵引力

Moor Insights & Strategy副总裁兼首席分析师Matt Kimball在接受Data Center Knowledge采访时表示,Vera系列发布中最具意义的部分在于客户的认可度。他特别指出,Oracle Cloud支持基于Arm架构的Vera CPU尤为值得关注,因为Oracle此前长期采用Ampere Arm CPU。

"英伟达拥有真实的客户群、大型客户、实际部署案例,以及Vera的新增品牌认知。"Kimball如此评价。

在服务器硬件厂商方面,戴尔科技(Dell Technologies)、慧与(HPE)、联想(Lenovo)和超微(Supermicro)均在构建独立的Vera CPU系统。这些由Vera驱动的系统预计将于第三季度上市,提供液冷机架形态,面向大规模智能体AI与强化学习工作负载,同时提供双插槽风冷系统,适用于企业、云端、数据处理及AI工厂的部署需求。

英伟达表示,Vera的设计目标是"驱动跨行业的多样化工作负载",涵盖智能体AI、强化学习与数据处理等场景。在Kimball看来,这一措辞颇具深意——他认为英伟达正在努力将Vera定位为不仅擅长AI工作负载、还能广泛胜任企业级任务的CPU,并有意在长期与AMD Epyc及Intel Xeon CPU展开竞争。

"他们希望Vera被认为不仅在AI领域表现出色,还能支持比AI更广泛的工作负载类型。这向我传递了一个信号——他们确实将目光瞄准了企业市场。"

就Vera Rubin而言,系统构建商及软件、存储合作伙伴涵盖戴尔、慧与、联想、超微、日立万创(Hitachi Vantara)、IBM、Nutanix、NetApp和VAST Data,产品将于今年秋季开始出货。

在DSX OS与DSX MaxLPS方面,Kimball表示这两项发布切中了企业部署AI时面临的最大挑战之一:如何按需部署合适的基础设施,并在规模扩张过程中高效利用资源。DSX OS的设计目标正是更好地管理基础设施的生命周期、作业调度与资源利用率。

"当资源从少数扩展到数千、数万时,规模化效率损耗便会显现,这正是DSX OS试图解决的问题。"他说。

英伟达的其他发布动态

英伟达周一还同步发布了多项更新内容:

Nvidia DGX Station:一款桌面侧AI超级计算机,支持在Windows环境下开发和运行智能体。

全新Nvidia智能体工具包软件,包括Nvidia NemoClaw蓝图、Nemotron模型、OpenShell安全运行时,以及集成智能体技能的CUDA-X库。

面向物理AI的全新开源智能体工具与技能集。

台积电(TSMC)正在利用英伟达的加速计算与AI技术,推进半导体设计与制造的升级。

富士康(Foxconn)正将英伟达AI部署至台湾多个顶级医疗中心。

Q&A

Q1:DSX OS是什么?主要解决什么问题?

A:DSX OS是英伟达推出的一款模块化开源操作系统,专门面向AI工厂运营商设计。它的核心功能包括大规模AI基础设施的配置、运维与监控,同时提供生命周期管理、健康自动化、弹性容错及多租户运营能力。当企业的AI资源从少量扩展到数万台时,规模化带来的效率损耗问题十分突出,DSX OS正是为解决这一挑战而生,帮助运营商更高效地调度作业、管理资源利用率,从而实现稳定、高效的大规模AI工厂运营。

Q2:Vera CPU和普通x86 CPU相比性能如何?针对哪些场景设计?

A:根据英伟达最新基准测试数据,Vera CPU的性能达到同类x86 CPU的1.8倍。Vera CPU专为AI智能体时代设计,强调超低延迟响应能力,黄仁勋将其定位为"为智能体而生的CPU"。应用场景涵盖智能体AI、强化学习及数据处理等工作负载,同时英伟达也在积极将其推向更广泛的企业级应用市场,与AMD Epyc和Intel Xeon CPU展开竞争。戴尔、慧与、联想、超微等主流服务器厂商均已加入Vera CPU的硬件生态。

Q3:DSX MaxLPS能带来哪些实际收益?

A:DSX MaxLPS是英伟达专为下一代Vera Rubin AI平台推出的一套优化技术组合,核心目标是在固定功耗预算内最大化Token处理性能。根据英伟达官方数据,借助MaxLPS技术,AI工厂可以在相同功耗范围内安全部署多达40%的GPU,这意味着算力提升40%、Token处理量增加40%,同时潜在商业收益也可提升40%,帮助AI工厂在不增加能耗的前提下实现更高的运营效率和投资回报。

来源:DataCenterKnowledge

0赞

好文章,需要你的鼓励

2026

06/02

14:58

分享

点赞

邮件订阅