数据中心正面临电力供应限制时期,这影响了其增长以及所提供IT服务的发展。虽然低功耗IT设备有所帮助,但AI所需的GPU比X86服务器消耗更多电力。超大规模云服务商可以建设自己的数据中心能源发电设施,但其他企业依赖国家电网,而电网是发展缓慢的系统,这意味着随着IT服务需求超过电力供应增长,我们面临企业和消费者IT服务增长的限制。
数据中心增长仍在继续。Dell'Oro Group的研究显示,2025年第一季度数据中心物理基础设施(DCPI)市场同比增长17%。这标志着连续第四个季度实现两位数增长,由超大规模云服务商和托管服务提供商持续投资推动,以构建应对人工智能工作负载需求的容量。研究指出液体冷却采用激增(DLC收入翻倍)、高密度电源机架接近600千瓦,以及母线槽等配电系统增长超过40%。
虽然所有地区都实现增长,但北美以23%的同比增长率领先其他地区。美国能源部报告发现,数据中心在2023年消耗了美国总电力的约4.4%,预计到2028年将消耗美国总电力的约6.7%到12%。报告显示,数据中心总电力使用量从2014年的58太瓦时增长到2023年的176太瓦时,预计到2028年将增长到325至580太瓦时。
Dell'Oro Group研究总监Alex Cordovil Araujo表示:"向加速计算的转变正在重塑数据中心格局。AI不仅是推动力,更是驱动新基础设施范式需求的结构性力量。液体冷却正快速获得关注,高密度电源架构正在快速演进,机架预计很快将达到600千瓦,1兆瓦配置已在考虑中。"
其2025年1月数据中心IT资本支出5年预测报告显示,全球数据中心资本支出预计到2029年复合年增长率为21%。用于AI训练和特定领域工作负载的加速服务器可能到2029年占数据中心基础设施支出的近一半。
Dell'Oro Group预测全球数据中心资本支出预计到2029年将超过1万亿美元。尽管持续的可持续发展努力,AI基础设施支出将保持强劲增长势头。该机构认为:"支持AI和机器学习工作负载的加速计算激增已成为DCPI市场的主要驱动力,显著增加了数据中心的电力和热管理需求。例如,目前平均机架功率密度约为15千瓦/机架,但AI工作负载需要60-120千瓦/机架来支持近距离加速服务器。虽然机架功率密度的跳跃将触发配电方面的创新和产品开发,但热管理方面正在发生更大变化——从空气冷却向液体冷却的转变。"
这些新数据中心需要电力供应,而国家电网系统正成为供电瓶颈。数据中心目前使用全球约3%的电力,到2030年可能翻倍,造成严重的发电和供电问题以及环境影响问题。
从某种意义上说,我们在能源生成方面并不受限,因为我们有石油、天然气和煤炭发电站,还有核能、水力发电、风能和太阳能发电。然而,煤炭、石油和天然气发电这三种化石燃料对环境有害,其中煤炭是最糟糕的。发电趋势是逐步淘汰煤炭发电站,石油和天然气发电站较少,可再生能源、风能和太阳能成为主流。它们都可以扩展,而水力发电因场地可用性限制而受限。由于辐射和核燃料污染及处置问题,核能发电一直受到限制,但正显示出复苏迹象,小型模块化反应堆发挥作用。Pure International首席技术官Alex McMullan表示,三大超大规模云服务商消耗超过60太瓦时,现在都拥有(或正在拥有)自己的核电站。
然而,即使能够产生足够的电力,其输送也带来新问题。国家电网连接发电站点与耗电站点,如数据中心。这些电网供应企业和家庭用户、大小消费者,必须维持供需平衡。总需求在白天上升,夜间下降,因为数百万消费者遵循昼夜活动模式。对于可再生能源,可能出现短缺和过剩,因为风速可能增减,太阳能发电仅在白天供电。
在此背景下,电网运营商必须平衡供需,开关发电以及发电机与电网的连接。这不是简单操作,正如2025年西班牙电网故障所证明的。
他们还必须升级电网线路和开关/变压基础设施,以应对全年需求变化,建设新电缆,建造和部署新的核心和边缘(变电站)单元。McMullan表示,随着越来越多的计算由耗电GPU而非相对节能的x86 CPU执行,数据中心的电力需求正在增长。AI正在推动使用量上升。
他认为一个GPU代表一个"标准"4人家庭约30千瓦时的日常能耗。NVIDIA每季度出货数十万个GPU。一个GPU机架现在需要超过100千瓦,相当于约200块太阳能电池板的输出或核反应堆输出的约0.01%。
数据中心一直以电力使用效率(PUE)术语衡量。PUE值通过将数据中心总能耗除以其IT设备使用的能源计算得出。较低的PUE值表示更高的能源效率。它由绿色网格(TGG)于2007年引入,在行业和政府中得到广泛认可。然而,它不反映当地气候差异;寒冷气候中的数据中心需要较少冷却。
绿色考虑
数据中心电力供应问题通常被视为更广泛关注的一部分,即碳排放。数据中心运营商,就像我们大多数人一样,希望减少碳排放以缓解全球变暖。他们也可能希望拥有更普遍的可持续运营,这可能意味着降低设备冷却中的水消耗。
转向可再生能源供应可以减少碳排放。转向空气冷却并远离水冷却将降低水消耗,并可能降低电力使用,因为风扇和散热器比泵、散热器风扇和水库使用更少电力。但水冷却可以处理更高的热负荷,因此GPU服务器可能需要它。此外,赤道地区的数据中心会发现空气冷却不如温带和寒冷地区的数据中心有效。
我们不能仅为冷却效率而定位数据中心,因为它们可能距离用户数千英里,由于网络传输时间导致数据访问时间过长。它们还需要不距离发电源太远,因为生成的电力百分比会因电网传输和升压、降压变压器操作而丢失。
优化数据中心成本、IT设备性能、用户数据访问时间、数据中心电力供需和水消耗,是一个复杂的练习。
数据中心电力使用
数据中心的电力预算是固定的;其电网供电和边缘连接设备是硬件,因此有不可逾越的上限。如果其内部基础设施的一部分占用更多电力,如从CPU转换到GPU,那么其他事物的可用电力就会减少。电力效率正成为关键考虑因素。
据估计,数据中心电力供应的26%用于服务器(20%)和存储(6%),其余由冷却和UPS(50%)、电力转换(11%)、网络硬件(10%)和照明(3%)消耗。这些是近似数字,因为数据中心显然在规模和冷却需求方面有所不同;寒冷气候中的数据中心需要较少冷却。
运营商可以查看各个设备类别以减少其功耗,冷却和UPS电力效率是关键关注点,因为它占平均数据中心所需电力的一半。服务器、存储和网络设备也可以优化以使用更少电力。例如,Pure Storage DirectFlash技术与现成SSD相比降低了NAND存储电力需求。
不仅仅是数据中心是问题。为了使经济脱碳,各国需要将制造业、食品生产和工业活动从化石燃料动力能源生成中转移。他们需要采用电动汽车,仅此一项就可能需要高达100倍的发电量增长。
整个电力供应链,从开采电缆用铜、发电和输电设备用铝和钢、发电本身、建设端到端电网基础设施、更好地管理其运营、发展更多弹性和更有效地供应大用户,都需要更新。这将是数十亿甚至万亿美元的项目。
各国政府需要意识到这个问题,并使其发电和供应组织能够应对。IT供应商可以通过游说国家和州政策制定者发挥作用,但从根本上说,一个国家的整个商业部门都需要参与这一努力。
好文章,需要你的鼓励
ChatGPT发布三年后,物理AI成为行业最新热词。物理AI是指在硬件中实现的AI系统,能够感知周围世界并进行推理以执行操作。与传统机器人不同,物理AI具备推理、行动和与环境交互的能力。智能眼镜是物理AI的典型代表,能够看到和听到用户所体验的内容。高通专家指出,AI可穿戴设备可以为机器人提供基于真实人类体验的高质量数据集,形成良性生态系统。
德国弗劳恩霍夫研究院提出ViTNT-FIQA人脸质量评估新方法,无需训练即可评估图像质量。该方法基于Vision Transformer层间特征稳定性原理,通过测量图像块在相邻层级间的变化幅度判断质量。在八个国际数据集上的实验显示其性能可媲美现有最先进方法,且计算效率更高,为人脸识别系统提供了即插即用的质量控制解决方案,有望广泛应用于安防监控和身份认证等领域。
来自加州大学伯克利分校和康奈尔大学的研究团队,通过分析130万篇学术论文发现,使用ChatGPT等AI工具的科学家论文产出平均提升40-60%,且英语非母语研究者受益最大。
布朗大学联合图宾根大学的研究团队通过系统实验发现,AI医疗助手的角色设定会产生显著的情境依赖效应:医疗专业角色在急诊场景下表现卓越,准确率提升20%,但在普通医疗咨询中反而表现更差。研究揭示了AI角色扮演的"双刃剑"特性,强调需要根据具体应用场景精心设计AI身份,而非简单假设"更专业等于更安全",为AI医疗系统的安全部署提供了重要指导。