英伟达(Nvidia)周一宣布,旗下Vera Rubin智能体AI平台及Vera CPU已进入全面量产阶段,预计将于今年秋季如期出货。与此同时,英伟达还发布了DSX OS——一款专为AI工厂设计的全新操作系统,旨在帮助企业更高效地管理和运营AI基础设施。上述发布均在CEO黄仁勋出席台北GTC大会主题演讲期间正式宣布。
DSX OS发布:AI工厂的管理基础
英伟达推出了DSX OS,这是一款模块化开源软件,专为AI工厂运营商而设计,支持大规模AI基础设施的配置、运维与监控。英伟达表示,DSX OS具备完整的生命周期管理、健康自动化、弹性容错及多租户运营能力。
"这是一个稳定的基础平台,新的服务、智能体和AI应用都可以在其上构建。"英伟达超大规模计算与高性能计算副总裁Ian Buck在媒体发布会上如此表示。
英伟达还同步推出了DSX MaxLPS——一套面向下一代Vera Rubin AI平台的优化技术组合,专为在固定功耗预算内最大化Token处理性能而设计。"借助MaxLPS,AI工厂可以在相同功耗范围内安全部署多达40%的GPU。"Buck说道,"这意味着40%更强的算力、40%更多的Token处理量,以及40%更高的潜在收益。"
英伟达此次的系列发布进一步扩展了其硬件与软件产品矩阵,助力云服务商、AI企业及大型机构构建和运营AI基础设施,并提供用于开发和运行AI智能体及其他AI应用的工具链。
英伟达从芯片公司迈向基础设施公司
在主题演讲中,黄仁勋强调英伟达的定位已远不止于一家芯片或系统供应商。
"英伟达已经真正成为一家基础设施公司——不只是GPU公司,不只是系统公司,而是一家帮助客户实现最大收益、最大利润,并尽快达成目标的基础设施公司。"黄仁勋如此阐述公司定位。
英伟达最初于今年3月圣何塞GTC大会上首次公布了DSX平台、Vera Rubin AI平台及Vera CPU。此前,公司已发布DSX参考设计,用于指导运营商构建AI工厂,并推出了DSX蓝图,用于创建这些设施的高精度数字孪生模型。
据英伟达介绍,Vera Rubin平台被定位为公司迄今为止最全面的AI系统,将五种机架级系统整合为一台AI超级计算机,涵盖:搭载72块Rubin GPU与36块Vera CPU的NVL72 GPU机架、Vera CPU机架、Groq 3 LPX推理加速机架、BlueField-4 STX存储机架,以及Spectrum-6 SPX以太网网络机架。
黄仁勋力推Vera Rubin与Vera CPU
在主题演讲中,黄仁勋再次为英伟达即将推出的硬件产品打Call,称Vera Rubin是"公司历史上最宏大的项目",并表示Vera CPU将成为英伟达下一个重要增长引擎。"此前所有CPU都是为人类服务的,而这款CPU是为智能体而生的。"黄仁勋对现场观众说道。
黄仁勋表示,智能体对响应速度有着极高要求,而Vera正是为此而来。在最新基准测试中,Vera CPU的性能达到x86 CPU的1.8倍。"智能体没有耐心,它们不活在秒的世界里,它们活在纳秒的世界里。将CPU的延迟压到最低至关重要,因此我们为AI时代打造了Vera CPU。"他说。
黄仁勋还透露,来自各方的Vera订单将使其成为"公司历史上速度最快、最成功的产品发布"。英伟达周一宣布,Anthropic、OpenAI和SpaceXAI已成为Vera CPU的早期采用者,其他客户还包括Oracle云基础设施(Oracle Cloud Infrastructure)、字节跳动(ByteDance),以及新兴云服务商CoreWeave、Nebius、Nscale和Lambda。
强劲的客户牵引力
Moor Insights & Strategy副总裁兼首席分析师Matt Kimball在接受Data Center Knowledge采访时表示,Vera系列发布中最具意义的部分在于客户的认可度。他特别指出,Oracle Cloud支持基于Arm架构的Vera CPU尤为值得关注,因为Oracle此前长期采用Ampere Arm CPU。
"英伟达拥有真实的客户群、大型客户、实际部署案例,以及Vera的新增品牌认知。"Kimball如此评价。
在服务器硬件厂商方面,戴尔科技(Dell Technologies)、慧与(HPE)、联想(Lenovo)和超微(Supermicro)均在构建独立的Vera CPU系统。这些由Vera驱动的系统预计将于第三季度上市,提供液冷机架形态,面向大规模智能体AI与强化学习工作负载,同时提供双插槽风冷系统,适用于企业、云端、数据处理及AI工厂的部署需求。
英伟达表示,Vera的设计目标是"驱动跨行业的多样化工作负载",涵盖智能体AI、强化学习与数据处理等场景。在Kimball看来,这一措辞颇具深意——他认为英伟达正在努力将Vera定位为不仅擅长AI工作负载、还能广泛胜任企业级任务的CPU,并有意在长期与AMD Epyc及Intel Xeon CPU展开竞争。
"他们希望Vera被认为不仅在AI领域表现出色,还能支持比AI更广泛的工作负载类型。这向我传递了一个信号——他们确实将目光瞄准了企业市场。"
就Vera Rubin而言,系统构建商及软件、存储合作伙伴涵盖戴尔、慧与、联想、超微、日立万创(Hitachi Vantara)、IBM、Nutanix、NetApp和VAST Data,产品将于今年秋季开始出货。
在DSX OS与DSX MaxLPS方面,Kimball表示这两项发布切中了企业部署AI时面临的最大挑战之一:如何按需部署合适的基础设施,并在规模扩张过程中高效利用资源。DSX OS的设计目标正是更好地管理基础设施的生命周期、作业调度与资源利用率。
"当资源从少数扩展到数千、数万时,规模化效率损耗便会显现,这正是DSX OS试图解决的问题。"他说。
英伟达的其他发布动态
英伟达周一还同步发布了多项更新内容:
Nvidia DGX Station:一款桌面侧AI超级计算机,支持在Windows环境下开发和运行智能体。
全新Nvidia智能体工具包软件,包括Nvidia NemoClaw蓝图、Nemotron模型、OpenShell安全运行时,以及集成智能体技能的CUDA-X库。
面向物理AI的全新开源智能体工具与技能集。
台积电(TSMC)正在利用英伟达的加速计算与AI技术,推进半导体设计与制造的升级。
富士康(Foxconn)正将英伟达AI部署至台湾多个顶级医疗中心。
Q&A
Q1:DSX OS是什么?主要解决什么问题?
A:DSX OS是英伟达推出的一款模块化开源操作系统,专门面向AI工厂运营商设计。它的核心功能包括大规模AI基础设施的配置、运维与监控,同时提供生命周期管理、健康自动化、弹性容错及多租户运营能力。当企业的AI资源从少量扩展到数万台时,规模化带来的效率损耗问题十分突出,DSX OS正是为解决这一挑战而生,帮助运营商更高效地调度作业、管理资源利用率,从而实现稳定、高效的大规模AI工厂运营。
Q2:Vera CPU和普通x86 CPU相比性能如何?针对哪些场景设计?
A:根据英伟达最新基准测试数据,Vera CPU的性能达到同类x86 CPU的1.8倍。Vera CPU专为AI智能体时代设计,强调超低延迟响应能力,黄仁勋将其定位为"为智能体而生的CPU"。应用场景涵盖智能体AI、强化学习及数据处理等工作负载,同时英伟达也在积极将其推向更广泛的企业级应用市场,与AMD Epyc和Intel Xeon CPU展开竞争。戴尔、慧与、联想、超微等主流服务器厂商均已加入Vera CPU的硬件生态。
Q3:DSX MaxLPS能带来哪些实际收益?
A:DSX MaxLPS是英伟达专为下一代Vera Rubin AI平台推出的一套优化技术组合,核心目标是在固定功耗预算内最大化Token处理性能。根据英伟达官方数据,借助MaxLPS技术,AI工厂可以在相同功耗范围内安全部署多达40%的GPU,这意味着算力提升40%、Token处理量增加40%,同时潜在商业收益也可提升40%,帮助AI工厂在不增加能耗的前提下实现更高的运营效率和投资回报。
好文章,需要你的鼓励
今天讲的出海案例是晶方科技,这家传感器先进封装公司通过 WaferTek 在马来西亚建设生产基地,并把新增 3000 万美元投向设备和产线。
这项研究揭示了大语言模型执行演绎推理时,仅约3%的注意力头构成关键"逻辑电路",分工明确,层层协作,一旦关闭这些电路,AI推理能力即刻崩溃。
随着企业将预算向AI倾斜,并大量采用AI编程助手,持H-1B签证的软件开发者正面临日益收窄的就业空间。Meta、亚马逊等科技巨头的裁员潮使工程类岗位需求进一步萎缩,招聘方越来越倾向于具备机器学习、数据科学等AI相关技能的候选人。分析人士指出,AI工具正压缩初级开发者的成长空间,企业也更偏向雇用绿卡持有者和本地公民,H-1B开发者须及早规划签证策略与技能升级路径。
Clark Hash是一种无需训练的句子嵌入压缩工具,将384维向量从1536字节压缩至48字节,通过稀疏随机投影与标量量化实现32倍压缩,同时保持高相似度相关性。