数据中心运营商一直面临的关于 AI 硬件的全方位难题主要是电力和散热供应不足。但现在另一个问题正在悄然逼近,这就是设备的重量。
AI 服务器机架的密集度远高于标准计算机架。这不仅需要更多的电力,同时也意味着在一个空间内挤满了更多的金属和塑料。结果是设备重量增加,从而影响了数据中心的设计和建设。
根据 Uptime Institute 的统计,平均一台 42U 服务器机架(标准配置了计算、网络和存储设备)的重量在 1500 至 2500 磅之间。但是 AI 设备,包括多块 GPU、智能网卡和液冷设备等,其重量轻易超过 4000 磅。
如果将这个数字乘以构成超大规模数据中心数十甚至数百个满载 AI 设备的机架,你就能看出这对地板设计会产生怎样的影响。
坚实的基础
Dell’Oro Group 数据中心物理基础设施及液冷领域的研究总监 Alex Cordovil 表示,他观察到的第一个问题是数据中心机房中提升地板变得越来越少。
Cordovil 在接受 Data Center Knowledge 采访时表示:“加强提升地板的承重能力成本相当高,因此已不太合理。所以,我们看到越来越多的数据中心选择直接在混凝土板上建造。”
他补充道:“我曾与一家工程公司交流,他们反映某个多层数据中心在结构上并非为容纳 3000 或 4000 磅重的机架而设计,那些结构原本是为了其他用途建造的。现在根本无法再放置这种【超密集设备】。”
数据中心建设专家 JLL 的技术服务董事总经理 Peter Skae 表示,提升地板并未完全被淘汰,只是其使用方式发生了变化。“还有一些地方仍在采用【提升地板】,因为现在大部分机柜都直接连接有冷却水管,而大家又不希望将冷却水置于顶部,”他说。
根据 Skae 的说法,数据中心运营商需要提升地板用于布置水管和线缆,但提升高度可能仅为 1 英尺,而不是传统设计所要求的 2 英尺。
重达 4000 磅的 AI 服务器机架正迫使数据中心设计师重新考虑传统的多层建筑设计。(图片来源:CyrusOne)
单层建筑的优势
AI 数据中心不仅在降低地板承重要求,同时在建筑高度上也做出了调整。Skae 表示,越来越多的数据中心放弃多层设计,转而选择单层建筑。
他说:“我认为大多数人考虑的是单层建筑,主要原因在于多层设计的复杂性。”
选择单层数据中心的原因在于,多层设施建设成本大幅上涨,因为需要投入更多资金以提高地板的承重能力。
Skae 说:“我们每天都会为客户讨论这些选项,比如是否可以建设两层。而大多数情况下,我们认为不会采用多层设计,因为建造第二层的成本将会非常高。”
为下一代容量改造数据中心
高密度 AI 数据中心设备的影响不仅作用于新建数据中心,也波及到现有空间的改造。建筑公司必须进行更多结构分析,以确保现有建筑的地板承重能力能够满足设备重量的要求。
Skae 表示:“问题不仅仅在于重量,还涉及到高度以及其他一些因素,使得许多想要改造为数据中心的建筑实际上并不可行。”
Cordovil 指出,结果就是对棕地场址的重新兴趣。所谓绿地通常指未开发的土地,而棕地则是指曾被开发但现已废弃的场所,比如工厂、医院或购物中心。
改造旧工业场所的一个优势是,这些地方通常配备了变电站,电力供应已到位。如果是工厂,建筑时通常会有坚固而沉重的地板。
Cordovil 说:“从发电机传输电力,并且能直接连接变电站,对大多数市场来说是一个巨大的优势。”
“一切都在重新评估”
Skae 表示,虽然 AI 数据中心可能需要更强的地板加固,但这不会影响开发进度。
他说:“使用不同强度的混凝土、不同规格的钢材,不过这些变化并不会实质上影响施工进度。”他还补充道,他从未遇到客户因建造场地的材料成本而拒绝报价的情况。
Cordovil 认为,AI 硬件对数据中心设计的影响依然显著。考虑到数据中心通常设计使用寿命为 10 至 20 年,建筑商也深知他们的设施不可能在两年内就变得过时。
这位分析师表示:“无疑正在经历一次重大转变或重新评估。没有人停止建设,但他们确实在重新审视如何建设,以确保他们的场地符合未来的需求。”
他补充道:“这真的改变了很多先入为主的观念。一切都在重新衡量,一切都在重新评估。”
好文章,需要你的鼓励
CoreWeave发布AI对象存储服务,采用本地对象传输加速器(LOTA)技术,可在全球范围内高速传输对象数据,无出口费用或请求交易分层费用。该技术通过智能代理在每个GPU节点上加速数据传输,提供高达每GPU 7 GBps的吞吐量,可扩展至数十万个GPU。服务采用三层自动定价模式,为客户的AI工作负载降低超过75%的存储成本。
IDEA研究院等机构联合开发了ToG-3智能推理系统,通过多智能体协作和双重进化机制,让AI能像人类专家团队一样动态思考和学习。该系统在复杂推理任务上表现优异,能用较小模型达到卓越性能,为AI技术的普及应用开辟了新路径,在教育、医疗、商业决策等领域具有广阔应用前景。
谷歌DeepMind与核聚变初创公司CFS合作,运用先进AI模型帮助管理和改进即将发布的Sparc反应堆。DeepMind开发了名为Torax的专用软件来模拟等离子体,结合强化学习等AI技术寻找最佳核聚变控制方式。核聚变被视为清洁能源的圣杯,可提供几乎无限的零碳排放能源。谷歌已投资CFS并承诺购买其200兆瓦电力。
上海人工智能实验室提出SPARK框架,创新性地让AI模型在学习推理的同时学会自我评判,通过回收训练数据建立策略与奖励的协同进化机制。实验显示,该方法在数学推理、奖励评判和通用能力上分别提升9.7%、12.1%和1.5%,且训练成本仅为传统方法的一半,展现出强大的泛化能力和自我反思能力。