人工智能、大语言模型和GPU的进步在近几个月占据了新闻头条。但连锁反应正在持续,数据中心中与AI工作负载相关的一切都需要重新思考——包括维持这些系统运行的基础电力设施。
为了通过GPU和大语言模型支持加速计算,可持续增长需要仔细审视为不断发展的AI数据中心提供电力的最佳方式。随着设施规模越来越大、耗电量越来越高,这个存在了一个世纪的老问题重新浮现,并变得更加紧迫:交流电(AC)还是直流电(DC)是未来数据中心的最佳选择?
据一些专家表示,答案是虽然交流电由于其传输便利性和标准化设备,在几十年来一直主导着商业和数据中心的电力分配,但随着AI工作负载将传统基础设施推向极限,直流电正在获得发展势头。
Vertiv全球电力副总裁Peter Panfil解释说:"直流电在一些数据中心中已经存在约20年了。400V和800V在UPS中已经使用了很长时间,但为了应对AI中的动态负载变化而开始出现的是直流电的新应用。"
据Panfil介绍,供应商和超大规模云服务商社区都在积极开发400V、800V和1500V直流电架构。从公用事业到机架的全栈直流电模拟也在进行中,以验证在AI工作负载和高密度计算场景下的性能。
电源管理公司Eaton的数据中心首席架构师Joshua Buzzell在讨论直流电的优点时表示,它提供更高的效率,并消除了对基于交流电的UPS系统的需求。这释放了机架空间并减少了转换损失。
他补充说,基于直流电的系统设计已经在太阳能光伏、燃料电池和电池储能系统中得到广泛测试和部署。
直流电采用路径上的技术挑战
在直流电在数据中心实现广泛采用之前,必须克服几个技术障碍。最明显的挑战是组件重新设计。从变压器到断路器,几乎每个组件都必须重新设计以适应直流电操作。这给变压器、PDU、变电站、UPS、转换器、调节器和其他电气设备供应商带来了重大负担。
高压直流电也带来了安全挑战。电弧抑制和故障隔离更加复杂。正在设计内部模型来通过固态断路器和混合保护方案解决这个问题。此外,数据中心直流电分配没有通用标准,这使互操作性和认证变得复杂。
Apolo.us首席执行官兼AFCOM数据中心世界主席Bill Kleyman表示:"安全和监管合规是重大障碍,特别是在较高的直流电压下,由于与交流系统相比具有不同的电弧闪络特性和故障管理要求。同时,缺乏商业上可获得的、现成的接受原生高压直流输入的IT设备,导致依赖专门的、通常是定制的解决方案。"
短期成本与长期节省
直流电转换的价格标签将是巨大的。但前期资本支出必须与长期收益和潜在节省进行权衡。
由于直流电系统更高效,它们为高功率机架释放空间,并消除了对交流UPS和变压器的需求。
Kleyman指出,由于直流电系统需要更少和更小的电力转换单元,故障点将更少。在新建设场景中,这些综合的效率和运营改进通常超过初始设置成本。
Kleyman说:"转换为直流电的初始资本支出可能很大,主要是由于需要专门的基础设施和电力转换系统。然而,长期运营支出节省是显著的——由于减少了电力转换损失和更低的冷却需求,通常在7-20%的范围内。"
在可持续性方面,直流电具有明显优势。直流电导致更低的转换损失,相当于更少的能源浪费。此外,直流电与太阳能光伏和电池储能更兼容,减少了长期运营支出和碳成本。
更好地与可再生能源集成的能力使得更容易将太阳能、燃料电池和电池储能直接连接到直流母线。最后,更少的转换阶段意味着产生更少的热量,减少整体冷却需求。
转换现有数据中心
几乎所有现有数据中心都使用交流电。将数据中心从交流电转换为直流电可能具有挑战性,但并非不可能。
数据中心管理者需要更换或绕过交流UPS、变压器和PDU。由于建筑规范和UL认证仍在跟上,存在需要克服的合规和监管障碍。
因此,一些数据中心正在考虑分阶段迁移路径。增量转换——如为高密度工作负载实施隔离的直流电区域或引入直流微电网——可以是一个实用的策略。这些部分直流电实施使数据中心能够获得一些效率和容量优势,而无需完全改造所需的巨大资本投资。
但混合交流/直流安排和分阶段迁移对于那些急于在AI时代获得竞争优势的人来说太慢了。完全的直流数据中心已经与我们同在。Mt. Diablo倡议——Meta、微软和开放计算项目之间的合作——是从电动汽车电力基础设施衍生的±400 VDC机架电力分配实验。初步发现是有希望的。它支持1 MW机架,减少转换损失,与传统交流电供电设置相比,机架空间利用率提高约3%。
ABB为Green Datacenter AG进行的另一个试点使用集中整流和母线分配提供了近1 MW的直流电。虽然主要是研究导向的安装,但它证明了高压直流电在整个设施中的可行性。
一家名为Claros的初创公司正在开发模块化直流电力传输技术,包括直接向服务器芯片提供直流电的集成电压调节器。这种方法消除了多个中间转换阶段。
与此同时,开放计算项目的开放机架标准在Meta和谷歌等超大规模云服务商中得到广泛使用,采用48 VDC母线分配直接到服务器。
Eaton正在与英伟达合作,实现AI数据中心向高压直流电(HVDC)电力基础设施的转变。
这种合作包括设计最佳实践、参考架构和电源管理,以支持高密度GPU部署,如配备英伟达Rubin Ultra GPU的英伟达Kyber机架级系统。目标是过渡到800V HVDC电力基础设施,以支持1 MW机架及更高配置。
数据中心中的混合交流/直流
也许有一天,我们会看到巨大的AI数据中心完全在直流电上运行。但在未来许多年里,混合架构是最可能的结果。
Buzzell说:"未来的数据中心越来越倾向于直流电——特别是高压直流电(HVDC)——但不是完全如此。"
Kleyman同意这一观点。他认为AI工作负载和新兴的AI工厂将推动直流电的日益采用,因为它们的电力需求非常大。他补充说,直流电也天然适合集成先进的冷却解决方案和电池储能,解决机架级密度要求和更广泛的电网稳定性问题,因为AI数据中心在规模和复杂性上急剧扩大。
Kleyman说:"由于其成熟性、广泛的基础设施和高压传输的便利性,交流电对于设施级电力仍将至关重要。然而,直流电,特别是在更高电压如±400 VDC下,很可能在数据中心内部变得突出,主要由高密度AI和以GPU为中心的工作负载的效率需求驱动。"
Q&A
Q1:为什么AI数据中心需要考虑从交流电转向直流电?
A:随着AI工作负载和大语言模型的发展,数据中心的电力需求大幅增加,传统交流电基础设施被推向极限。直流电提供更高效率,减少转换损失,释放机架空间,消除对交流UPS系统的需求,更适合支持高密度GPU部署和1MW以上的机架配置。
Q2:直流电数据中心面临哪些主要技术挑战?
A:主要挑战包括组件重新设计(从变压器到断路器都需重新设计)、高压直流电的安全问题(电弧抑制和故障隔离更复杂)、缺乏通用标准导致互操作性和认证困难,以及商业上缺乏现成的接受高压直流输入的IT设备。
Q3:直流电转换的成本效益如何?
A:虽然初始资本支出巨大,主要用于专门基础设施和电力转换系统,但长期运营支出节省显著,通常可节省7-20%。这得益于减少电力转换损失、降低冷却需求、释放机架空间,以及更好地集成可再生能源,减少长期运营和碳成本。
好文章,需要你的鼓励
随着谷歌搜索和亚马逊主页在电商领域影响力下降,AI助手如ChatGPT、Claude等成为消费者新的购物入口。品牌必须掌握生成式引擎优化(GEO)技术才能保持可见性。传统SEO策略已失效,AI系统更青睐结构化、问答式的高质量内容。研究显示,来自AI助手的流量转化率比其他渠道高9倍。品牌需要基于真实客户问题创建内容,采用结构化问答格式,并建立信任度,才能在这个新的电商秩序中脱颖而出。
斯坦福大学研究发现,主要用英语训练的大型语言模型竟能自发学会处理其他语言任务,无需明确教学。这种跨语言迁移能力随模型规模增大而显著提升,通过形成"通用语义空间"实现不同语言间的知识迁移。研究为降低多语言AI开发成本、支持资源稀缺语言提供了新途径,但仍面临性能不均衡、文化适应性等挑战。
2025年第一季度网络攻击激增126%,英国新法案要求数据中心强制报告网络安全事件。现代威胁已演变为同时攻击IT和OT系统,而许多数据中心的备用电源系统仍使用90年代的过时技术。电池储能系统(BESS)通过分布式架构、加密通信和自主运行能力提供网络弹性防护。BESS即服务模式将网络安全维护转移给专业提供商,同时通过需求响应和能源套利创造收益。随着全球法规要求将网络安全与能源安全相结合,数据中心需要现代化基础设施来应对日益严峻的威胁环境。
阿姆斯特丹大学与Salesforce合作开发的奖励引导推测解码(RSD)技术,通过让小模型处理简单任务、大模型解决复杂问题的智能分工,在保持推理准确率的同时大幅提升计算效率。该技术在数学推理等任务中表现出色,计算量最多可减少75%,为AI应用的普及和成本降低提供了重要技术支撑。