戴尔发布基于英伟达Vera Rubin GPU的AI服务器

戴尔发布PowerEdge XE8812高端服务器,采用英伟达Vera Rubin NVL4架构,每机架最高支持144块GPU,是"戴尔AI工厂with英伟达"解决方案的核心。该服务器采用液冷设计,内存容量较上代提升50%,支持大型AI模型和HPC仿真全内存运行。戴尔表示,随着AI基础设施投资预计在2026年同比增长44%,该平台旨在满足企业级AI规模化部署需求。

戴尔推出的高端英伟达AI服务器,是其面向有重大AI基础设施规划的企业客户所打造的集成AI平台的核心产品。

戴尔PowerEdge XE8812搭载英伟达Vera Rubin NVL4架构,每机架最高可扩展至144块GPU,将成为"戴尔AI工厂(Dell AI Factory)with Nvidia"预配置方案的核心组件,该方案涵盖服务器、存储、网络及软件基础设施。

戴尔AI工厂通常包含戴尔PowerEdge AI服务器、英伟达GPU(涵盖H100、H200、Blackwell等型号)、高速以太网或InfiniBand网络、戴尔PowerScale与PowerStore存储,以及英伟达AI Enterprise和NIM推理微服务等AI软件。

采用液冷设计的XE8812在计算密度和内存容量方面实现了"代际飞跃"。戴尔表示:"从英伟达GB200 NVL4升级至英伟达Vera Rubin NVL4后,平台的主机内存得到扩展,核心数从144增加至176,GPU显存和计算性能均有所提升。配合英伟达CUDA-X库,高性能计算机构能够将最大规模的模型和仿真任务完整运行于内存中,具备无与伦比的处理能力。"

新服务器每插槽内存及GPU显存均比上一代提升50%。戴尔指出,内存容量的提升"使企业能够在内存中完整运行更大规模的模型和仿真任务,无需依赖数据暂存(从主机内存或存储流式传输数据)或数据交换(驱逐并重新加载数据)——这两种方式都会引入微秒至毫秒级延迟,并显著降低有效带宽,对现代AI和高性能计算工作负载的影响尤为突出。"

该方案还配备了集成戴尔远程访问控制器(iDRAC),便于IT团队部署、更新和监控PowerEdge服务器。在机架级可视化方面,系统提供戴尔集成机架控制器和OpenManage Enterprise,可通过实时遥测和自动泄漏检测及早发现问题。

戴尔表示:"随着AI与高性能计算仿真工作负载的融合,这些工作负载的规模和速度已超出渐进式基础设施升级所能承载的范围。"

AI创新的全球浪潮正加速推动对高性能基础设施的需求。戴尔引用高德纳近期研究报告指出,随着AI增长机会提速,AI投资预计将在2026年实现同比44%的增长,同时87%的企业表示创新与AI是其业务战略的核心所在。

高德纳在其2026年1月发布的《全球AI支出预测:2024—2029》报告中写道:"仅AI基础设施建设一项,就将推动2026年AI优化服务器支出增长49%,占AI总支出的17%。此外,随着技术厂商持续构建AI基础设施,2026年AI基础设施领域的支出将新增4010亿美元。"

此次戴尔发布公告,是英伟达Vera Rubin架构更大规模发布计划的组成部分,英伟达于今年3月对该架构进行了详细介绍。英伟达表示,Vera Rubin平台将计算、网络与数据处理整合为机架级部署方案,面向大型AI数据中心。该平台集成了Vera CPU、Rubin GPU、NVLink 6交换机、ConnectX-9超级网卡、BlueField-4 DPU、Spectrum-6以太网交换机,以及新加入的Groq 3 LPU,构成一套以AI超算为目标的统一系统。

该架构旨在支持AI工作负载的全流程,涵盖大规模训练、后训练直至实时推理,主要面向AI工厂类部署或大规模数据中心应用。

与此同时,超微(Super Micro)也宣布计划推出基于英伟达Vera Rubin架构的AI服务器,该服务器将在液冷机架中配置最多1152块英伟达Rubin GPU和576颗英伟达Vera CPU,成为超微数据中心构建模块解决方案(DCBBS)蓝图的核心,为AI基础设施建设提供涵盖计算、网络、高级液冷、配电及选址的全套参考方案。

超微表示:"DCBBS蓝图涵盖了超微用于以创纪录速度完成大规模液冷项目的完整端到端流程。超微专家将现场开展设施勘察,评估装卸区通道、数据机房尺寸与净空、地板承重等级以及现有供电与制冷基础设施,据此提出针对每个项目量身定制的设计方案。"

超微还表示:"英伟达Vera Rubin NVL4平台正是为这种融合趋势而生,而面向高性能计算的DCBBS蓝图则明确了成功部署所需的每一个步骤,背后有超微构建全球最大液冷超算集群(GPU数量逾10万块)的卓越经验作为支撑。"

Q&A

Q1:戴尔PowerEdge XE8812服务器有哪些核心性能提升?

A:戴尔PowerEdge XE8812搭载英伟达Vera Rubin NVL4架构,每机架最高支持144块GPU。与上一代GB200 NVL4相比,核心数从144增至176,每插槽内存及GPU显存均提升50%,并增加了更多计算资源。内存容量的大幅提升使企业可将大型模型和仿真任务完整运行于内存中,无需数据暂存或交换,从而有效降低延迟、提升带宽效率。

Q2:戴尔AI工厂(Dell AI Factory)with Nvidia包含哪些组件?

A:戴尔AI工厂是一套面向企业的预配置集成方案,主要包括:戴尔PowerEdge AI服务器(含新款XE8812)、英伟达GPU(涵盖H100、H200、Blackwell及Vera Rubin等型号)、高速以太网或InfiniBand网络、戴尔PowerScale与PowerStore存储,以及英伟达AI Enterprise和NIM推理微服务等AI软件,为企业提供一站式AI基础设施部署能力。

Q3:超微基于英伟达Vera Rubin架构的服务器方案有何特点?

A:超微计划推出的Vera Rubin架构AI服务器,在液冷机架中最多可配置1152块英伟达Rubin GPU和576颗英伟达Vera CPU。该服务器是超微DCBBS蓝图的核心,蓝图涵盖计算、网络、液冷、配电及选址建议等完整部署流程,并由超微曾成功构建逾10万块GPU液冷超算集群的丰富经验提供背书。

来源:Networkworld

0赞

好文章,需要你的鼓励

2026

06/23

07:50

分享

点赞

邮件订阅