云基础设施服务商Vultr在2025年HPE Discover大会上宣布,已选定慧与科技(HPE)与英伟达的技术方案,用于新一轮AI基础设施的大规模部署。此举背景是企业对AI的需求正从早期实验阶段快速转向实际生产环境。
根据协议,Vultr计划部署英伟达GB300 NVL72系统,该系统通过HPE旗下的"Nvidia AI Computing by HPE"产品组合提供。本次部署还将整合英伟达Spectrum-X以太网网络技术及HPE液冷技术,共同构建面向AI的新型数据中心环境。三方均未披露合同金额、部署时间表及设施选址等具体信息。
HPE总裁兼首席执行官安东尼奥·内里(Antonio Neri)表示:"Vultr代表着新一代AI云服务提供商,其选择HPE,印证了专为支撑全球AI发展下一波浪潮而设计的AI数据中心架构的重要价值。"
生产推理成为主角
Vultr首席执行官J.J. Kardwell在HPE Discover的媒体简报会上表示,过去一年中,客户需求已从AI实验性探索明显转向生产级部署。三年前,GPU需求的主要来源是初创公司和AI开发者,用于构建和训练新模型;如今,越来越多的需求来自于运行面向客户应用程序和企业业务运营的生产AI服务的组织,其中推理工作负载占据重要位置。
Kardwell指出,传统企业的采购周期通常为6至18个月,面对AI基础设施的快速演进,这一节奏明显滞后——往往在采购决策最终确定时,所需算力已告罄。这正是云端AI基础设施更受青睐的原因:它能以更快的速度完成部署。
HyperFrame Research网络与基础设施研究副总裁Ron Westfall也指出:"推理正从次要的运营环节演变为AI基础设施投资的核心长期驱动力。整个行业的支出重心正在向生产吞吐量优化、成本效益以及机架间网络架构转移,而不再仅仅聚焦于原始训练算力。"
混合策略取代非此即彼
Kardwell表示,越来越多的企业正在转向混合基础设施策略,而非在云端与本地部署之间二选一。"企业策略只走本地部署或只走云端的时代已经结束,最终的选择往往是两者并行。"大型组织在自建AI基础设施的同时,也借助云服务商更快速地获取最新GPU平台和额外算力。
网络能力在大规模AI集群中的战略价值同样日益凸显。Kardwell指出,一旦工作负载超出单台服务器或单个机架的边界,性能瓶颈便会随之出现,高带宽互联网络因此成为AI基础设施设计中的关键要素。他强调,东西向流量在大型AI集群中的重要性正与日俱增。
Westfall亦表示:"当AI集群扩展到单个机架之外,网络就从标准基础设施组件演变为性能瓶颈,同时也成为关键竞争优势所在。"
未来部署将采用支持400GbE和800GbE连接的英伟达Spectrum-X网络,专为大型AI集群和机架级GPU架构提供高性能支撑。
全球算力版图持续扩张
在全球布局方面,Kardwell表示,随着企业将AI系统深度融入核心业务流程,数据主权合规要求正变得愈发重要。目前,Vultr在全球17个国家的33个数据中心节点运营云基础设施,这一广泛的覆盖范围有助于满足客户在数据本地化存储和区域化部署方面的需求。
Vultr自称是全球规模最大的私营云基础设施企业。近年来,随着企业对AI算力需求的持续加速,该公司已大幅扩展其GPU产品阵容。
Q&A
Q1:Vultr这次和HPE合作,具体要部署什么硬件?
A:根据协议,Vultr计划部署英伟达GB300 NVL72系统,该系统通过HPE旗下的"Nvidia AI Computing by HPE"产品组合提供,同时还将整合英伟达Spectrum-X以太网网络技术和HPE液冷技术,用于构建专注于AI推理的新型数据中心环境。
Q2:为什么企业现在更关注AI推理,而不是模型训练?
A:因为越来越多的企业已经完成了AI实验阶段,开始将AI能力正式部署到客户服务和业务运营中,推理工作负载随之大幅增长。同时,AI推理对企业利润的正向影响也愈发明显,促使大型企业重新审视人员配置和运营效率,推理基础设施的投资优先级因此显著上升。
Q3:Vultr的全球数据中心布局对企业客户有什么意义?
A:Vultr目前在全球17个国家运营33个数据中心节点。随着数据主权和数据本地化合规要求日益严格,这种广泛的地理覆盖能帮助企业客户将数据存储和处理限定在特定区域或国家内,有效满足合规要求,同时也能降低跨境数据传输带来的法律风险。
好文章,需要你的鼓励
在基于Chiplet的架构中,可观测性正成为系统设计的关键缺失环节。多位半导体行业专家指出,AI可从硅层遥测数据中挖掘价值,但前提是架构须提供一致的检测手段、近传感器数据压缩及可编程采集能力。专家们强调,多供应商Chiplet生态系统需要标准化、安全的遥测模式,以实现跨芯片、封装和互联域的故障定位,同时保护敏感运营数据。目前,AI在遥测分析阶段已展现出显著价值,但可观测性的扩展本质上仍是架构问题。
这项研究系统比较了四种AI图像分词策略在640000张星系图像上的表现,发现重建质量与物理属性预测能力之间存在根本性解耦,为天文基础模型的分词器选择提供了实验依据。
生命科学企业在全渠道战略和AI平台上投入巨大,但成效往往不尽如人意。问题根源不在于技术本身,而在于组织架构、数据治理和工作方式未能同步演进。许多转型项目止步于试点阶段,原因是各部门数据孤立、职责不清。要实现从传统CRM向智能互动的真正转型,企业需优先建立统一的数据基础和跨团队协作机制,并将AI能力嵌入日常工作流程,而非将其视为独立模块。
阿里Qwen团队研究如何将大模型的规模化训练思路迁移到机器人操作领域,通过统一多机器人表示与38100小时数据预训练,让机器人在陌生场景和陌生机型上也能完成复杂操作任务。