美国能源部(DOE)近日发布了一个测试平台,专门用于模拟当前全国最重要的基础设施冲突之一:超大规模AI园区接入本已不堪重负的电网时所产生的一系列问题。
该平台名为Agora,能够复现大型数据中心的电气行为,包括正在重塑美国各地电力公司规划格局的高密度、高波动性功耗需求。Agora不仅着眼于电力采购与并网接入环节,更重点关注这些设施在正式投入运行后对电网产生的实际影响。
过去约两年间,AI用电问题的讨论始终围绕供给侧展开:电力公司四处争购燃气轮机,开发商力推核电重启,监管机构围绕输电并网队列争执不休,各大科技巨头则竭力寻找一切可用的吉瓦级电力资源。Agora的出现,将目光引向了另一层挑战——如何阻止AI负载的剧烈波动向整个电网蔓延。
电力公司日益担忧,超大规模AI园区的表现更接近于工业级负载,而非传统数据中心,其用电需求几乎可以在瞬间出现大幅攀升。GPU集群可以在数秒内从接近空载骤升至满负荷运行。与此同时,运营商在设施内部越来越多地部署储能电池、自备发电机组和复杂电力电子设备,而电力公司对这些系统的建模能力仍十分有限。
ERCOT着手建立AI负载模型
这一担忧已进入电网运营商的工程规划议程。德克萨斯州电力可靠性委员会(ERCOT)已针对其定义的"大型电子负载"启动专项建模工作,并围绕AI数据中心及其他电力电子密集型设施发布了仿真框架与技术研究报告。ERCOT警告称,这类负载"与传统负载存在本质差异,且规模已足以影响电网稳定性"。
这一举措是ERCOT在AI相关大型负载预测与规划领域持续深化工作的组成部分。ERCOT与德克萨斯A&M大学联合编制的最新建模手册更进一步:这份长达105页的报告将AI数据中心定义为"高度动态的电力电子负载",认为其对"电力系统运行与稳定性构成重大挑战"。报告将其建模为由"电网并网设备、功率变换器、储能系统、计算负载与冷却负载"紧密耦合而成的电气系统。
该报告的风格更接近电力系统工程手册,而非传统数据中心规划指南。ERCOT与德克萨斯A&M在报告中对并网型逆变器、协调储能系统、动态重连行为、电压与频率穿越能力、变换器控制、故障恢复以及暂态稳定性行为均进行了详细建模。
报告明确指出,其目标在于研究扰动穿越行为、故障后恢复、电网控制交互、次同步振荡以及系统稳定性等问题。
电力公司加紧应对快速功率波动
施耐德电气AI与数据中心首席倡导者史蒂文·卡尔利尼表示,随着电网中低惯量可再生能源比例不断上升,大型AI负载与电网的交互给电力公司带来了日益严峻的挑战。
"AI训练工作负载会产生快速、几乎瞬时的功率骤升与骤降,"卡尔利尼说,"GPU集群可以在瞬间从接近空载跃升至满负荷,若电网或电源系统未能针对此类情况进行设计,将导致电压和频率出现波动。"
卡尔利尼指出,故障穿越系统、储能电池、超级电容器以及AI负载平滑控制等技术,正在成为维护电网稳定的关键手段。在超大规模场景下,风险进一步放大:集中部署了同步GPU基础设施的吉瓦级设施,若电力公司无法精细管控重连行为,可能在故障恢复过程中引发大规模需求波动。
"对于整流器重连,这一过程在本质上等同于将负载重新接入电网,因此功率爬升速率必须加以限制,"ERCOT与德克萨斯A&M的报告如此指出。
卡尔利尼表示,电力公司正越来越多地要求超大规模运营商采取措施,抑制极端功率波动引发的"同步振荡",并提供更多运营数据,以协助保护电网基础设施。
电网与计算基础设施的深度融合
这一趋势正推动电力公司、监管机构与运营商共同探索一种新模式——让大型AI设施更主动地参与电网运行。
"未来的电网必须支持大型能源用户扮演好'电网好公民'的角色,"国家实验室韧性基础设施项目在Agora发布公告中如此表示。这一理念已出现在多份电力公司备案文件和监管程序中。美国联邦能源监管委员会(FERC)已就大型负载并网改革展开讨论。
ERCOT正在探索针对大客户的可控负载机制,多个州的电力公司也在为超大规模园区研究需求灵活响应、限电协议及电网感知运营模式。
从历史上看,电力公司负责发电,数据中心负责消费。而现代AI设施正在打破这一界限。储能系统、微电网、先进电力管理系统、工作负载编排软件与电网感知控制技术,正将大型园区转变为与电网紧密耦合的工业级能源平台。
"随着备用电源系统、功率平滑系统和主供电系统的不断引入,数据中心将成为电力生态体系的组成部分,"卡尔利尼说。
Agora平台、ERCOT大型电子负载项目以及德克萨斯A&M的建模研究,均指向同一方向:电网运营商正在吉瓦级AI园区大规模落地之前,抢先构建新的运营框架。
在花费两年时间寻找足够电力来支撑AI运行之后,电力公司现在正在模拟这些负载在发生故障时穿越、重新并网、爬升至满负荷,并与电网控制系统实时交互的全过程。
Q&A
Q1:Agora平台是什么?它能解决哪些问题?
A:Agora是美国能源部开发的测试平台,专门模拟大型AI数据中心的电气行为,包括高密度、高波动性的功耗需求。它的核心目标是帮助电网运营商和电力公司提前了解AI设施并网后的实际表现,防止AI负载的剧烈波动影响整体电网稳定性,为电网规划与韧性建设提供数据支撑。
Q2:AI数据中心的GPU集群为什么会对电网造成压力?
A:GPU集群的用电特性与传统数据中心截然不同,可以在数秒内从接近空载骤升至满负荷,产生几乎瞬时的功率骤升与骤降。这种快速波动会导致电网出现电压和频率异常,尤其在低惯量可再生能源比例较高的电网中,影响更为显著。多个吉瓦级设施同时发生功率变化时,潜在风险将进一步放大。
Q3:ERCOT针对AI数据中心做了哪些应对措施?
A:ERCOT专门启动了"大型电子负载"建模项目,并与德克萨斯A&M大学联合发布了一份105页的建模手册,将AI数据中心定义为高度动态的电力电子负载,对并网型逆变器、储能系统、故障恢复、次同步振荡等关键环节进行详细建模,同时还在探索针对大客户的可控负载机制,以更好地管理AI设施对电网的影响。
好文章,需要你的鼓励
伊朗裔英国导演Ash Koosha耗时两个半月,以不足2000美元的成本,借助AI技术完成了一部关于伊朗反政府抗议镇压事件的75分钟剧情片《紫罗兰之梦》。该片即将在纽约翠贝卡电影节首映,成为首部入围顶级电影节的全AI真人故事片。导演认为,AI技术可大幅降低独立电影制作门槛,有望重塑整个影视行业格局。
耶路撒冷希伯来大学研究团队提出PhyGenHOI框架,将人体运动生成与物理仿真结合,让虚拟人物与三维物体之间的接触互动同时满足视觉自然性和物理真实性。
MIT与MIT-IBM计算研究实验室联合开发了专为图表理解设计的数据集ChartNet,包含逾百万张多样化图表及对应代码、文字描述、数值表格和问答对。研究团队利用两步合成数据生成流程,从单张图表出发可扩展出数百种变体。实验表明,基于ChartNet训练的小型开源视觉语言模型在数据提取、图表摘要等任务上显著超越体量更大的商业模型,有望帮助预算有限的中小企业低成本接入AI图表分析能力。
本文介绍了弗莱堡大学等机构提出的3D-SC框架,通过引入三维基础模型的几何先验,无需人工标注即可解决AI图像匹配中的左右混淆和重复部件分不清的问题。