随着AI规模扩张，传统冷却技术能否跟上？

随着AI与高性能计算需求激增，数据中心散热压力急剧上升。加速器服务器功耗远超传统CPU系统，长时间满负荷运行使热管理成为关键瓶颈。风冷方案在高密度机架场景下局限日益凸显，液冷技术加速普及，但水资源消耗与泄漏风险带来新挑战。两相直接接触式冷却等无水化方案正受到关注，有望在降低水耗的同时提升散热效率。据Uptime Institute调查，已有22%的机构采用直接液冷技术。

AI与高性能计算（HPC）正在重新定义数据中心的"常态"。专为AI训练和推理设计的加速服务器，其功耗远超传统CPU系统，且往往在较长时间内接近峰值负载运行。

这种持续高负载使散热成为运营商扩充容量速度的关键制约因素。一旦温度超过芯片的承受极限，系统将触发降频机制，性能下滑，可靠性风险随之上升。此外，AI工作负载还会在GPU芯片上形成高度动态的热分布，局部热点的热流密度可达平均值的数倍，且在毫秒级时间内迅速转移。

与此同时，外部压力也在持续增加。电力供应是否充足，已成为决定新数据中心能否落地、能否快速投产的重要因素。国际能源署（IEA）预测，全球数据中心电力消耗到2030年可能达到约945太瓦时，较2024年水平翻番以上，AI是这一增长的主要驱动力。

在部分面临干旱和资源竞争的地区，水资源的可用性也日益成为讨论焦点。

随着需求持续增长，一个核心问题浮出水面：当前的冷却方案，能否与AI需求同步扩展？

空气冷却的局限

风冷在许多场景下仍然有效，但随着机架功率的提升，其局限性愈发凸显。

要用空气带走更多热量，就需要驱动更大体积的气流，这意味着风扇能耗大幅攀升，运维容错空间随之收窄。AI工作负载长期维持高利用率，气流或功耗稍有波动便可能触发降频。因此，越来越多的运营商在高密度部署场景中转向液冷方案。

液冷的权衡取舍

液冷系统将散热点直接移至芯片附近，降低了对机房气流和环境温度的依赖。目前许多部署采用基于水的直接到芯片（Direct-to-Chip）冷却系统，虽然性能表现良好，但也带来了额外的运营复杂性。

水与IT设备共处一室，意味着泄漏和宕机风险后果更为严重。运营商还需长期管理水质、防腐及系统维护等事项。据部分估算，一座100兆瓦的设施每天可消耗约110万加仑水，具体数字因冷却设计和当地条件而异。

在欧洲，《能源效率指令》的报告要求规定，大型运营商须披露能耗和用水数据，这使冷却方案的选择进一步与可持续性及社区影响挂钩。

无水冷却方案的兴起

上述压力正推动业界对"无水冷却"方案的关注。这里的"无水"，是指将水从数据机房中移除，并减少对蒸发冷却的依赖——后者是许多设计方案中水耗的主要来源。典型做法包括采用密闭循环系统、在条件允许时使用干式散热，以及在设施水系统与IT设备之间实现物理隔离。

两相直接到芯片冷却（Two-Phase Direct-to-Chip Cooling）是其中一种代表性技术路线。

冷板直接贴合处理器表面，内含介电导热液体。当处理器升温时，液体在受控温度下沸腾，以蒸汽形式将热量带走；蒸汽随后冷凝并回流至冷板，形成持续循环。

由于相变过程承担了大部分散热工作，与主要依靠大流量液体循环的单相系统相比，两相系统所需的流量可能更低。

支持者认为，这一方案可以降低泵送需求，在工作负载变化时维持更稳定的芯片温度，并规避水基系统在水处理和防腐管理方面的部分挑战。

随着机架功率持续攀升，分配架构的重要性也日益凸显。面向多个机架的共享分配系统，可在减少基础设施重复建设的同时，保持机架级别的监控与管控能力。

这对改造项目尤为关键。大多数现有设施最初围绕风冷架构设计，对重大基础设施改造的适应空间有限。在密度最高的区域率先引入液冷，既可延长现有设施的使用寿命，也为热能回收利用创造潜在机会。

行业的采用步伐仍在持续加快。在Uptime Institute 2025年冷却系统调查中，22%的受访机构表示已在使用直接液冷，机架密度提升是主要驱动因素。

随着液冷逐渐普及，业界的关注点可能将转向运营成熟度，包括为AI、HPC及托管环境设计的标准接口、遥测系统和服务模式。

高密度基础设施的规划之道

AI正以超出大多数设施改建速度的节奏，持续推高芯片与机架的功耗需求。冷却决策，正在与电力供应、用水量和运营效率一道，成为基础设施规划的核心议题。

对于新建设施，这意味着需要评估能够支撑下一代加速芯片、同时不造成资源过度消耗的冷却方案。对于现有设施，则可能意味着在密度最高的环境中逐步引入液冷，同时调整运维流程和监控系统，以支撑相关部署。

运营商如何应对散热挑战，将在很大程度上决定新AI基础设施的部署速度，以及这些基础设施在监管机构、客户和当地社区眼中的形象与认可度。

Q&A

Q1：两相直接到芯片冷却技术是如何工作的？

A：两相直接到芯片冷却技术通过将冷板直接贴合处理器表面来实现散热。冷板内含介电导热液体，当处理器升温时，液体在受控温度下沸腾，以蒸汽形式将热量带走；蒸汽随后冷凝并回流至冷板，形成持续循环。由于相变过程承担了大部分散热工作，该系统所需液体流量比传统单相系统更低，同时能在工作负载变化时维持更稳定的芯片温度。

Q2：液冷数据中心每天大约会消耗多少水？

A：据部分估算，一座100兆瓦的数据中心设施，采用液冷方案后每天可消耗约110万加仑水，具体数字因冷却系统设计方式和当地实际条件的不同而存在差异。正因如此，在面临干旱和资源竞争压力的地区，水资源的消耗问题已成为数据中心冷却方案选择中不可忽视的重要因素。

Q3：目前有多少数据中心机构在使用直接液冷技术？

A：根据Uptime Institute 2025年冷却系统调查报告，目前已有22%的受访机构表示正在使用直接液冷技术，机架密度不断提升是推动采用该技术的主要原因。随着液冷逐渐普及，业界的关注重点预计将从部署本身转向运营成熟度，包括标准接口、遥测系统以及专为AI、HPC和托管环境设计的服务模式。

来源：DataCenterKnowledge

0赞

好文章，需要你的鼓励

随着AI规模扩张，传统冷却技术能否跟上？

来源：DataCenterKnowledge

2026

06/05

13:47

分享

点赞

WAIC2026 现场直击：开普勒顶流人气王，麒麟系列火爆出圈

面壁智能将密度定律带入具身智能

龙磁科技拟投3.58亿元扩建越南永磁铁氧体基地

首创一层Scale-up网络256卡全互联，摩尔线程MTT C256超节点为万卡及十万卡级集群夯实底座

从高血压诊疗入手，北京安贞医院让医疗大模型走出聊天框

西门子肖松：以场景为牵引，推动工业AI从单点实效迈向生产力跃迁

打造Token极致性价比 新华三震撼亮相2026世界人工智能大会

机器人管家系统上线！傅利叶携多款康养陪伴新品方案亮相WAIC 2026

赛那德“ 自主作业机器人天团” 登陆 WAIC：iLoabot-X+模型双升级，秀出具身场景落地硬实力

西门子Eigen工程智能体中国首发首展，荣获2026 WAIC SAIL之星奖

NVIDIA Cosmos 推动物理 AI 前沿发展

PPIO亮相WAIC 2026：发布智能模型网关，打造面向Agent时代的智能Token工厂

Helion获4.65亿美元融资，为微软建设核聚变电站【AI】

Poke成为首个获批在Apple Messages for Business运行的AI智能体

Meta借鉴特斯拉战术，在帐篷中建造数据中心

工程师正转型为AI智能体驱动工作的战略顾问

思科 Cloud Control 究竟是什么？为何值得客户关注

我用谷歌云盘新AI整理工具清理14年的文件杂乱，结果如何？

利用智能手机前置摄像头被动监测心率的研究系统

AI时代如何避免网络管理工具的重叠与混乱

英特尔凭借机器人芯片重磅杀入物理AI赛道

PATH计划：推动AI培训与职业发展，助力行业人才培育

如果您非常迫切的想了解IT领域最新产品与技术信息，那么订阅至顶网技术邮件将是您的最佳途径之一

三一集团：数字化是必选项，AI是生存项

因湃电池 × 达索系统：如何共创出一套电池产业最佳实践

AI走进真实世界之后：安全、健康与产业的新命题

CES 2026

关注官方公众号

关注官方微博

关注官方喜马拉雅

友情链接

业界热点:

打造Token极致性价比新华三震撼亮相2026世界人工智能大会