全球数据中心的电力需求正在急剧增长,生成式AI比传统互联网应用(如搜索查询或云存储)消耗更多电力。
传统数据中心使用10到25兆瓦的电力,而超大规模AI工厂的需求可能超过100兆瓦。数据中心规模正在快速增长,下一代设施预计需要1千兆瓦或更多电力。
AI工作负载的增长正在改变数据中心内芯片和服务器机架的构建方式。在接下来的几年里,我们将看到从目前已经很强大的千瓦级机架转向某些AI工厂中的1兆瓦机架。每个机架将消耗大约1000个普通家庭的用电量。
传统的低压电力传输已经不能满足现代服务器机房的需求。高效大规模的电力传输需要在电力分配技术和架构方面取得重大进展。
领先的AI芯片制造商、科技巨头、数据中心运营商和电力系统供应商正在合作寻找解决方案。英伟达最近通过提出800伏直流架构,明确支持采用更高电压的方法。
更高电压直流数据中心的想法并不新鲜。十多年前我们就在讨论300伏直流架构。但今天,紧迫性要大得多。从千瓦级机架到千兆瓦级数据中心的转变,由大规模GPU部署推动,迫使我们采用更积极的电力系统升级方法。
为了维持这一发展轨迹,科技行业不能再依赖数据中心电力系统的渐进式改进。我们必须迅速做出大胆的改变,以提供维持这种增长所需的电力。
问题所在:转换步骤过多,浪费严重
传统数据中心电力传输受到传统交流电力传输的限制。电力以中压交流电的形式从公用事业流出,但在到达机架之前,需要经历多阶段转换过程:从交流电转换为直流电供不间断电源和电池备份使用,直流电再转换回交流电进行设施分配,最后在机架处交流电再转换为低压直流电。典型的传统机架电力系统涉及五个或更多转换步骤,在每次转换中,宝贵的能源都会丢失。
每损失一瓦特电力,你需要消耗更多能源来冷却其产生的热量。随着机架功率密度超过目前的100千瓦阈值并接近预计的1兆瓦标记,这些损失变得不可持续。
数据中心运营商的主要关注点不再是节省空间,而是能源效率。节省电力最直接的方法之一是消除整个电力链中的交流/直流转换。例如,消除其中三个转换可以在千兆瓦规模上将端到端能源效率提高3%到5%,这种差异可能带来数千万美元的电力节约。
解决方案:直接的更高电压直流电
行业内许多人认为,对抗过程中能源损失的明智方法是在数据中心内和机架中直接分配更高电压的直流电。英伟达专注于800伏直流电,但科技行业也在考虑未来使用1000伏直流电或1500伏直流电。
这种转变是由物理定律驱动的。通过提高主要配电母线的电压,传输相同功率所需的电流大幅减少。更低的电流允许使用显著更细的导体和母线槽,从而减少铜的使用量。这听起来可能不多,但仅母线就可以为每个1兆瓦机架减少约200公斤的铜。将此扩展到1千兆瓦数据中心可以节省多达50万吨铜。
向更高电压直流配电的转变是一次变革性升级。它代表了一种范式转变,需要大量令人兴奋和颠覆性的创新。一些基本构建模块目前在商业上并不存在。该架构面临技术障碍,包括安全问题和挑战性的操作条件。行业必须就通用电压范围、连接器接口和安全实践达成一致。
使高压直流基础设施可行的最重要技术之一是在数据中心周边将13.8千伏交流电网电力转换为800伏直流电。这需要一种先进的电力变压器,使用功率半导体器件和先进控制电路来管理和转换电力。二十年前,拥有能在如此高电压下运行的设备是可行的,但高度复杂、体积庞大且昂贵。然而,现在在这个领域有大量的积极研究和开发,公司已经开发出测试原型。
路线图的第二部分是将直流电分配到机架。数据中心不能使用交流断路器来做到这一点。直流保护比交流保护更加困难。传统的交流断路器可以轻松中断电流,因为交流波形每隔几毫秒就会穿过零点。在直流系统中,电流永远不会穿过零点。要中断高压直流系统中的故障,你需要一个能够瞬间断开电流且在正常运行期间不产生大量热损失的设备。防止短路的最佳方法是使用先进的半导体技术创建适合用途的固态断路器。
满足AI能源需求从现在开始
AI是当今能源世界最重要的话题之一,因为它根本上是一个电力挑战,而不仅仅是计算挑战。随着AI主导地位的高速推进,电气化合作伙伴需要快速、可靠地开发这些基础组件,并具备确保安全和性能所需的深厚技术专业知识。
Q&A
Q1:为什么数据中心需要从交流电转向直流电?
A:传统数据中心电力系统需要经历五个或更多转换步骤,每次转换都会损失宝贵能源。消除三个转换步骤可以在千兆瓦规模上将端到端能源效率提高3%到5%,带来数千万美元的电力节约。
Q2:800伏直流架构相比传统架构有什么优势?
A:通过提高电压,传输相同功率所需的电流大幅减少,允许使用更细的导体,减少铜使用量。每个1兆瓦机架可减少约200公斤铜,扩展到1千兆瓦数据中心可节省多达50万吨铜。
Q3:实现高压直流基础设施面临哪些技术挑战?
A:主要挑战包括需要将13.8千伏交流电转换为800伏直流电的先进变压器,以及由于直流电流不会穿过零点而需要固态断路器来保护系统免受短路影响,这些基本构建模块目前在商业上还不完全存在。
好文章,需要你的鼓励
前OpenAI首席技术官Mira Murati创办的AI初创公司Thinking Machines Lab宣布推出"交互模型"技术。不同于现有AI的轮流对话方式,该模型采用"全双工"技术,能在接收输入的同时生成响应,实现类似真实电话通话的自然交互。其模型TML-Interaction-Small响应速度达0.40秒,优于OpenAI和谷歌同类产品。目前仍处于研究预览阶段,计划数月内开放有限测试,年内正式发布。
香港大学与哈尔滨工业大学联合发布的这项研究(arXiv:2605.06196)发现,大语言模型在扮演不同社会层级角色时,内部神经网络存在一条清晰的"粒度轴",从普通个人视角延伸至全球机构视角。这条轴是AI角色空间的主导几何方向,可被测量、被跨模型复现,并通过激活引导技术加以操控,为AI社会模拟的可信度评估和角色视角的主动调控提供了新工具。
澳大利亚各州及联邦能源部长在近期会议上达成共识,要求数据中心通过投资新建可再生能源和储能设施,完全抵消其电力需求。除昆士兰州外,所有州均支持该提议。联邦能源部长克里斯·鲍文表示,数据中心是新增能源需求的最大驱动力之一,应成为电网的助力而非负担。澳大利亚能源市场委员会将于7月前提交具体实施建议。数据显示,到2030年数据中心用电量预计将增至现在的三倍。
华盛顿大学研究团队发现,在AI数学推理训练中,将随机拼凑的拉丁文占位词(Lorem Ipsum)添加到题目前,能帮助AI突破"全部答错、训练停滞"的困境,在多个模型上平均提升推理得分2.8至6.2分。研究揭示了有效扰动的两个关键特征:使用拉丁语词汇避免语义干扰,以及保持较低困惑度确保AI能正确理解题目内容。