电力基础设施面临AI推理工作负载带来的全新挑战

AI基础设施热潮正在重塑电力需求格局。曾预期数万兆瓦的数据中心用电需求,在强制要求客户提供具有约束力的财务承诺后,大幅缩水。训练与推理两类AI工作负载呈现截然不同的用电特征:训练依赖大规模同步GPU集群,推理则更靠近用户、更灵活分散。电力公司正面临预测失准风险,如何在不确定性中做出长期基础设施投资决策,成为当前最大挑战。

在过去两年里,AI基础设施建设热潮始终围绕着一个核心逻辑:规模越大越占优势。

超大规模云服务商、公用事业公司、开发商和电力供应商竞相为大型AI园区争夺数吉瓦(GW)的电力资源。这些园区主要服务于前沿模型训练,数以万计的GPU在高度同步的集群中协同运转。多个地区的电力公司在AI驱动的数据中心扩张浪潮下,相继上调了用电需求预测。电网规划人员建立了负荷大幅增长的预测模型,开发商则在德克萨斯州、弗吉尼亚州、俄亥俄州、乔治亚州及卡罗莱纳州等地大规模圈地备用。

模型训练推动了第一波围绕大型同步园区的电网规划;而模型推理的兴起,如今正从地理分布层面重塑需求格局,政策焦点也随之转向互联规则、灵活/可中断电价及需求响应机制。

然而,一些电力公司正在发现,这些假设有多么不稳定。

今年2月,AEP Ohio在向俄亥俄州监管机构提交的报告中披露:最初超过30,000兆瓦(MW)的投机性数据中心接入申请,在该公司推出新的数据中心电价(DCT)机制、要求客户提供具有法律效力的财务承诺后,最终只剩下5,642兆瓦的签约承诺量。

AEP Ohio在报告中写道:"DCT程序的主要目的,正是为了筛除那些投机性、无实质承诺的数据中心负荷。"

该公司表示,剩余的已承诺负荷将用于PJM互联输电规划。

这一大幅缩水,揭示了电力公司如今面临的深层问题:哪些AI工作负载能够形成持续稳定、达到输电规模的用电需求,哪些又无法做到?

模型训练与推理:两种负荷形态,两套应对方案

这种不确定性在很大程度上集中于推理环节。

前沿AI模型训练依赖通过超高速互联网络紧密耦合的GPU集群,其中延迟和同步开销直接影响性能表现;而推理工作负载在某些情况下可以更靠近人口密集区或区域电力市场部署,无需同等程度的同步要求。

前美国能源部贷款项目办公室主任吉格尔·沙阿(Jigar Shah)向《数据中心知识》表示,电力公司目前的规划方向存在偏差,针对的是错误类型的AI负荷。

"训练与推理的区别,不仅影响负荷落地的位置,更影响哪些政策工具真正有效。"沙阿说。

训练园区通常依赖长期电力采购协议和与吉瓦级部署挂钩的表后自备发电策略;而分布式推理基础设施,沙阿认为,更多依赖灵活的并网规则、可中断电价以及需求响应项目,从而使规模较小的设施能够在更广泛的电网区域内运营。

Epoch AI的研究进一步增添了变数。该机构近期估算,截至2025年底,亚马逊、谷歌、Meta、微软和甲骨文共同掌控了全球约71%的AI算力,高于2024年初的63%。

这在行业内部催生了一个日益突出的矛盾:AI算力基础设施的所有权持续集中化,而部分推理工作负载却可能随时间推移走向地理上的分散化。

英伟达首席执行官黄仁勋越来越倾向于将推理定位为AI基础设施增长的下一个主要阶段,而非训练需求的"轻量化替代品"。在英伟达今年2月的财报会议上,黄仁勋表示,随着企业扩展AI服务,"算力等于营收"。

在今年早些时候举办的GTC大会上,黄仁勋宣称"推理的拐点已经到来",并描绘了一个AI智能体系统大幅提升Token生成量和持续算力需求的未来图景。

推理工作负载在地理部署上或许比前沿训练集群更具灵活性,但这并不意味着基础设施需求会因此萎缩,而是可能改变负荷在电网中的物理分布形态。

电力公司的实际观察:来自并网队列的早期信号

EPRI首席技术执行官汤姆·威尔逊(Tom Wilson)向《数据中心知识》表示,目前绝大多数数据中心并网申请的规模,远低于那些占据媒体头条的多吉瓦级项目。"当前数据中心并网申请的平均规模在100至200兆瓦之间,而非那些动辄1至5吉瓦的明星项目。"他说。

他补充道,集聚在人口中心附近的面向终端用户的推理设施,即便规模较小,仍可能造成局部集中的负荷增长。随着时间推移,AI硬件的效率提升将使更小规模的数据中心得以在更靠近终端用户的位置承担关键推理工作负载。

目前,EPRI、英伟达、InfraPartners和普洛斯(Prologis)正在联合推进一项分布式算力示范项目,围绕5至20兆瓦规模、选址于现有电网容量附近的AI数据中心网络展开验证。

威尔逊表示,规模较小的AI设施开发商越来越多地寻求配电层级的并网接入,要么作为永久方案,要么作为获得输电接入的过渡路径。这一趋势可能将部分基础设施压力从主干输电系统转移至地方配电网络。

与此同时,电力公司也在努力应对AI需求预测波动带来的规划风险。能源与环境经济咨询公司(E3)近期发布的白皮书警告称,电力公司正在AI需求模式、利用率及部署模式高度不确定的背景下,做出规模庞大且影响深远的基础设施投资决策。报告指出,与AI基础设施预测挂钩的电力规划假设存在数吉瓦级别的波动,并警告需求高估可能导致搁浅成本,低估则可能威胁供电可靠性。

杜克大学近期的一项研究也发现,若数据中心在高峰需求时段仅削减0.5%的年度用电量,全国范围内约100吉瓦的搁浅电网容量有望得到盘活利用。

EPRI推出的DCFlex计划正在美国和欧洲开展电网互动型数据中心示范项目,以评估AI工作负载如何帮助电力公司更高效地利用现有基础设施。

在不确定中精准把握负荷形态:规划的新命题

对电力公司而言,这场博弈的影响远不止于数据中心本身。输电走廊、燃气电厂、变电站、供水系统、税收激励政策及土地收购,都在围绕AI工作负载未来十年的物理布局假设进行规划。

第一波AI规划假设以大型同步训练园区为核心;下一阶段的走向,则取决于推理工作负载究竟更接近超大规模工业负荷、灵活云服务,还是介于两者之间的某种新形态。

Q&A

Q1:AI推理工作负载和模型训练工作负载在电网规划上有什么区别?

A:模型训练依赖大型同步GPU集群,需要集中式、稳定的大规模电力供应,通常与长期采购协议和吉瓦级园区挂钩。推理工作负载则可更灵活地分布于靠近用户的区域,无需相同的同步要求,更依赖灵活并网规则和可中断电价机制。两者对电网的影响截然不同:训练推动集中式大型负荷,推理则可能带来分散化、中小规模的地理分布负荷,从而重塑整体电网需求格局。

Q2:AEP Ohio的数据中心电价(DCT)机制为何导致申请量大幅缩水?

A:AEP Ohio在新的DCT机制下,要求客户提供具有法律约束力的财务承诺,而非仅凭意向申报并网资源。结果显示,最初超过30,000兆瓦的投机性申请,在强制履约要求下骤降至5,642兆瓦的实际签约量。这说明此前大量申请属于"占坑"式投机行为,并无真实落地意图。该案例揭示了电力行业在AI浪潮下,需求预测与实际承诺之间存在巨大落差。

Q3:EPRI的DCFlex计划具体在做什么?

A:DCFlex是EPRI主导的示范计划,旨在通过电网互动型数据中心实验,评估AI工作负载如何辅助电力公司更高效地利用现有基础设施。该计划在美国和欧洲同步开展,探索数据中心在电网高峰期主动调节用电、参与需求响应的可行性。EPRI还联合英伟达、InfraPartners和普洛斯,推进以5至20兆瓦分布式AI数据中心为核心的算力网络示范项目。

来源:DataCenterKnowledge

0赞

好文章,需要你的鼓励

2026

05/27

06:42

分享

点赞

邮件订阅