Nvidia宣布Vera Rubin平台正式投产,并推出AI工厂操作系统DSX OS

英伟达在GTC台北大会上宣布,其Vera Rubin智能体AI平台和Vera CPU已全面投产,计划今年秋季出货。同时推出DSX OS操作系统,帮助企业更高效地管理和运营AI基础设施。DSX MaxLPS技术可在相同功耗下部署多达40%的GPU。Anthropic、OpenAI等成为Vera CPU早期采用者。

英伟达周一宣布,其Vera Rubin智能体AI平台与Vera CPU已全面投产,并按计划于今年秋季出货。与此同时,英伟达还推出了全新操作系统DSX OS,专为帮助企业更高效地管理和运营AI工厂而设计。上述消息均由CEO黄仁勋在台北GTC大会主题演讲中正式发布。

DSX OS发布:AI工厂的基础操作系统

英伟达发布了DSX OS,这是一款模块化、开源的软件系统,面向AI工厂运营商,支持大规模部署、运营和监控AI基础设施。据该公司介绍,DSX OS具备生命周期管理、健康自动化、弹性恢复及多租户运营等核心能力。

英伟达超大规模与高性能计算副总裁Ian Buck在媒体简报会上表示:"它是构建新服务、智能体和AI应用的稳定基础。"

此外,英伟达还发布了DSX MaxLPS,这是一套专为下一代Vera Rubin AI平台设计的技术方案,旨在固定功耗预算内最大化Token处理性能。"借助MaxLPS,AI工厂可在相同功耗范围内安全部署多达40%的GPU,"Buck表示,"这意味着40%更多的算力、40%更多的Token处理能力,以及较此前增加40%的潜在收益。"

英伟达的系列发布,持续扩展其软硬件产品组合,助力云服务商、AI企业及各类机构构建和运营AI基础设施,同时为开发和运行AI智能体及其他AI应用提供工具支撑。

黄仁勋:英伟达已成为基础设施公司

在主题演讲中,黄仁勋表示,英伟达的定位已远超芯片和系统公司的范畴。

"英伟达已真正成为一家基础设施公司,不仅仅是GPU公司,也不仅仅是系统公司,而是一家帮助客户实现最大收益、最大利润,并尽快达成目标的基础设施公司。"黄仁勋说道。

英伟达最早在今年3月圣何塞GTC大会上发布了DSX平台、Vera Rubin AI平台和Vera CPU。此前,公司已推出DSX参考设计,用于指导运营商构建AI工厂,并提供了DSX蓝图,支持创建AI工厂设施的高精度数字孪生。

据英伟达介绍,Vera Rubin平台是该公司迄今为止最全面的AI系统,将五类机架级系统整合为一台AI超级计算机,包括:NVL72 GPU机架(含72块Rubin GPU和36颗Vera CPU)、Vera CPU机架、Groq 3 LPX推理加速器机架、BlueField-4 STX存储机架,以及Spectrum-6 SPX以太网网络机架。

黄仁勋力推Vera Rubin与Vera CPU

在主题演讲中,黄仁勋再次为即将推出的硬件产品背书,称其专为智能体AI而生。他将Vera Rubin称为"公司历史上最具雄心的项目",并表示Vera CPU将成为英伟达下一个重要增长引擎。"此前所有CPU都是为人类设计的,这款CPU是为智能体而生的。"黄仁勋对现场观众说道。

黄仁勋表示,智能体需要极低的响应延迟,而Vera正是为此而来。英伟达在最新基准测试中表明,Vera CPU的性能达到x86 CPU的1.8倍。"智能体没有耐心,它们不活在以秒计算的世界里,而是活在以纳秒计算的世界里,"他说,"让CPU尽可能低延迟至关重要,因此我们为AI时代打造了Vera CPU。"

黄仁勋还透露,Vera的订单量将使其成为"公司历史上推出速度最快、最成功的产品"。英伟达周一宣布,Anthropic、OpenAI和SpaceXAI已成为Vera CPU的早期采用者,其他客户还包括Oracle云基础设施、字节跳动,以及CoreWeave、Nebius、Nscale和Lambda等新兴云服务商。

Vera CPU赢得主要客户青睐

Moor Insights & Strategy副总裁兼首席分析师Matt Kimball在接受Data Center Knowledge采访时表示,Vera公告中最重要的部分是其客户吸引力。他指出,Oracle云对基于Arm架构的Vera CPU的支持尤为值得关注,毕竟Oracle长期以来一直使用Ampere Arm CPU。

"英伟达拥有真实的客户、大客户、真实的部署项目,以及Vera平台的新客户群体,"Kimball说。

戴尔科技、HPE、联想和超微等硬件厂商正在基于Vera CPU构建独立系统,预计于第三季度上市。这些系统将以液冷机架形式提供,支持大规模智能体AI和强化学习工作负载;同时提供双插槽风冷系统,适用于企业、云端、数据处理和AI工厂场景。

英伟达表示,Vera旨在"驱动跨行业的多元化工作负载",涵盖智能体AI、强化学习和数据处理。在Kimball看来,这一表述颇具深意。他认为,英伟达正努力将Vera塑造成不仅适用于AI工作负载、同时能胜任广泛企业任务的处理器,并有意在长期与AMD EPYC和Intel Xeon CPU展开竞争。

"他们试图将Vera定位为AI领域的强者,同时也能支持比纯AI更广泛的工作负载,"他说,"这表明他们的视野已明确指向企业市场。"

在Vera Rubin整机系统方面,系统集成商、软件与存储合作伙伴包括戴尔、HPE、联想、超微、日立万达、IBM、Nutanix、NetApp和VAST Data,将于今年秋季开始出货。

对于DSX OS和DSX MaxLPS,Kimball表示,此次发布正是为了应对企业在部署AI时面临的最大挑战之一:如何按需部署合适的基础设施,并在规模扩展过程中高效利用资源。DSX OS旨在优化基础设施的生命周期管理、任务调度和资源利用率。

"当资源数量从少量扩展到数千、乃至数万时,规模效率会大幅下降,而DSX OS正是为解决这一问题而生的。"他说。

英伟达其他重要发布

英伟达周一还发布了多项其他公告:

Nvidia DGX Station——面向Windows平台的桌面级AI超级计算机,专为开发和运行智能体而设计。

全新Nvidia智能体工具包软件,包括Nvidia NemoClaw蓝图、Nemotron模型、OpenShell安全运行时,以及集成智能体技能的CUDA-X库。

面向物理AI的全新开源智能体工具与技能集。

台积电正在利用英伟达的加速计算与AI技术推进半导体设计与制造。

富士康正在台湾主要医疗中心部署英伟达AI技术。

Q&A

Q1:英伟达DSX OS是什么?能解决什么问题?

A:DSX OS是英伟达推出的一款模块化、开源操作系统,专为AI工厂运营商设计。它支持大规模AI基础设施的部署、运营和监控,提供生命周期管理、健康自动化、弹性恢复及多租户运营等功能。当AI资源从少量扩展到数万规模时,效率损耗会显著增加,DSX OS正是为解决大规模部署下的资源管理和调度难题而生,帮助运营商最大化基础设施利用率。

Q2:英伟达Vera CPU和普通x86 CPU有什么区别?

A:Vera CPU是英伟达专为AI智能体时代设计的处理器,基于Arm架构构建,核心优势在于极低延迟和高性能。英伟达最新基准测试显示,Vera CPU性能达到x86 CPU的1.8倍。与传统CPU面向人类用户设计不同,Vera CPU专为AI智能体优化,因为智能体需要纳秒级的响应速度,而非人类可感知的秒级延迟。目前Anthropic、OpenAI、SpaceXAI、Oracle云、字节跳动等头部客户已确认采用。

Q3:英伟达DSX MaxLPS有什么作用?

A:DSX MaxLPS是英伟达专为下一代Vera Rubin AI平台设计的技术套件,目标是在固定功耗预算内最大化Token处理性能。根据英伟达的数据,采用MaxLPS后,AI工厂可在相同功耗范围内安全部署多达40%的GPU,相应地实现40%更多算力、40%更多Token吞吐量,以及40%的潜在收益增长,有效提升了AI工厂的能效比和商业回报。

来源:DataCenterKnowledge

0赞

好文章,需要你的鼓励

2026

06/02

15:02

分享

点赞

邮件订阅