随着AI工作负载持续加速,AI工厂的建设正推动机架级功率密度达到前所未有的水平。英伟达MGX是一种开放式模块化架构,能够加快系统设计速度、提升可扩展性,并加速下一代AI基础设施的部署。作为MGX生态系统的重要成员,亚德诺半导体(ADI)正与英伟达携手合作,提供支撑日益严苛的AI工厂部署所需的电源技术。
向800 VDC转型:赋能AI工厂规模化
随着AI工厂对性能需求的不断攀升,传统48V架构已无法满足现代GPU集群的供电需求。为维持性能持续提升,基于MGX的AI工厂正向800 VDC机架级架构迁移。这一架构能够有效降低电流损耗与功率损失,实现更紧凑的配电设计,并支持面向兆瓦级机架的可扩展方案。这种供电架构的转变,是未来英伟达平台持续提升性能的基础保障,其性能增益直接依赖于供电效率的优化。
MGX与模块化电源架构
MGX开放式模块化的特性不仅体现在计算层面,同样延伸至电源交付领域。新型架构正日益将电源与计算机架解耦分离,从而实现以下目标:与不断演进的GPU平台相适配的灵活系统配置;在整个生态系统中更快速地采纳新技术;以及优化机架空间以服务于计算需求。
800 VDC热插拔:保障AI基础设施持续运行
AI工厂需要全天候不间断运行,因此在线可维护性至关重要。热插拔控制器能够在不中断系统运行的前提下,安全地插拔服务器托盘,是实现这一目标的关键组件。然而在800 VDC环境下,这一需求面临全新挑战,包括:对高能量浪涌电流的精准控制、稳健的故障检测与系统保护机制,以及用于系统监控的实时遥测能力。
ADI:为MGX系统提供800 VDC电源支持
ADI正将其在电源保护、控制与遥测领域的技术积累延伸至下一代AI基础设施。依托数十年的持续创新,ADI正在研发高压热插拔及DC-DC解决方案,致力于实现以下目标:为先进计算平台提供高密度集成能力;在高压环境中提供快速、精准的保护机制;以及支持系统优化与预测性维护的高级遥测功能。
赋能AI工厂的未来
随着AI基础设施持续向基于英伟达MGX构建的模块化开放架构演进,800 VDC供电交付已成为可扩展性与高效性的核心基石。通过在MGX生态系统内的深入合作,ADI正助力打造下一代AI工厂,提供先进AI系统稳定运行所需的保护、转换与智能化能力。
Q&A
Q1:英伟达MGX架构是什么?它在AI工厂中起到什么作用?
A:英伟达MGX是一种开放式模块化架构,旨在加快AI系统的设计速度、提升可扩展性,并加速下一代AI基础设施的部署。在AI工厂中,MGX支持800 VDC机架级架构,有助于降低电流损耗、优化配电设计,并支持面向兆瓦级机架的可扩展方案,是未来英伟达平台持续提升性能的重要基础。
Q2:为什么AI工厂要从48V架构转向800 VDC架构?
A:传统48V架构已无法满足现代GPU集群日益增长的供电需求。800 VDC机架级架构能够有效降低电流和功率损耗,支持更紧凑的配电设计,同时具备更强的可扩展性,可应对兆瓦级机架的需求。这一转变直接关系到AI工厂性能的持续提升与供电效率的优化。
Q3:ADI在800 VDC热插拔技术上解决了哪些难题?
A:在800 VDC高压环境下,热插拔面临多项技术挑战。ADI通过研发高压热插拔及DC-DC解决方案,实现了对高能量浪涌电流的精准控制,提供快速、稳健的故障检测与系统保护,同时支持实时遥测功能,满足系统监控、优化及预测性维护的需求。
好文章,需要你的鼓励
全球数据中心建设需求持续高涨。北美方面,美国数据中心建设支出年化达510亿美元,微软在威斯康星州开放33亿美元设施,亚马逊和谷歌宣布在密苏里州合计投资250亿美元。欧洲方面,SoftBank将在法国建设5GW AI数据中心,投资额达750亿欧元。亚太地区,AirTrunk计划在印度投资210亿美元建设3GW数据中心。中东与非洲地区也有多项大规模项目落地。
这项研究提出Epi2Diff方法,通过将大型推理模型的解题思考过程拆解为认知片段序列,提取过程特征预测考题对人类的难度,在四个真实考试数据集上超越了所有对比基线。
随着企业将AI融入机器人、工业设备等物理基础设施,边云协同架构正成为关键课题。以Luminous Robotics和先正达为例:前者在太阳能农场部署的机器人每秒做出10次决策,数据定期上传云端持续优化模型;后者通过Cropwise平台整合卫星、无人机、拖拉机传感器数据,辅助农民完成约150项农业决策。两家公司均强调,边缘端负责实时响应,云端负责模型训练与更新,同时保持人工监督以确保安全与准确性。
南京大学与阿里巴巴提出MIMFlow,将掩码图像建模与标准化流端到端融合,让生成模型专注语义建模,以更少参数和更少令牌在ImageNet上取得FID 2.50的优异表现。