数据中心运营商一直面临的关于 AI 硬件的全方位难题主要是电力和散热供应不足。但现在另一个问题正在悄然逼近,这就是设备的重量。
AI 服务器机架的密集度远高于标准计算机架。这不仅需要更多的电力,同时也意味着在一个空间内挤满了更多的金属和塑料。结果是设备重量增加,从而影响了数据中心的设计和建设。
根据 Uptime Institute 的统计,平均一台 42U 服务器机架(标准配置了计算、网络和存储设备)的重量在 1500 至 2500 磅之间。但是 AI 设备,包括多块 GPU、智能网卡和液冷设备等,其重量轻易超过 4000 磅。
如果将这个数字乘以构成超大规模数据中心数十甚至数百个满载 AI 设备的机架,你就能看出这对地板设计会产生怎样的影响。
坚实的基础
Dell’Oro Group 数据中心物理基础设施及液冷领域的研究总监 Alex Cordovil 表示,他观察到的第一个问题是数据中心机房中提升地板变得越来越少。
Cordovil 在接受 Data Center Knowledge 采访时表示:“加强提升地板的承重能力成本相当高,因此已不太合理。所以,我们看到越来越多的数据中心选择直接在混凝土板上建造。”
他补充道:“我曾与一家工程公司交流,他们反映某个多层数据中心在结构上并非为容纳 3000 或 4000 磅重的机架而设计,那些结构原本是为了其他用途建造的。现在根本无法再放置这种【超密集设备】。”
数据中心建设专家 JLL 的技术服务董事总经理 Peter Skae 表示,提升地板并未完全被淘汰,只是其使用方式发生了变化。“还有一些地方仍在采用【提升地板】,因为现在大部分机柜都直接连接有冷却水管,而大家又不希望将冷却水置于顶部,”他说。
根据 Skae 的说法,数据中心运营商需要提升地板用于布置水管和线缆,但提升高度可能仅为 1 英尺,而不是传统设计所要求的 2 英尺。
重达 4000 磅的 AI 服务器机架正迫使数据中心设计师重新考虑传统的多层建筑设计。(图片来源:CyrusOne)
单层建筑的优势
AI 数据中心不仅在降低地板承重要求,同时在建筑高度上也做出了调整。Skae 表示,越来越多的数据中心放弃多层设计,转而选择单层建筑。
他说:“我认为大多数人考虑的是单层建筑,主要原因在于多层设计的复杂性。”
选择单层数据中心的原因在于,多层设施建设成本大幅上涨,因为需要投入更多资金以提高地板的承重能力。
Skae 说:“我们每天都会为客户讨论这些选项,比如是否可以建设两层。而大多数情况下,我们认为不会采用多层设计,因为建造第二层的成本将会非常高。”
为下一代容量改造数据中心
高密度 AI 数据中心设备的影响不仅作用于新建数据中心,也波及到现有空间的改造。建筑公司必须进行更多结构分析,以确保现有建筑的地板承重能力能够满足设备重量的要求。
Skae 表示:“问题不仅仅在于重量,还涉及到高度以及其他一些因素,使得许多想要改造为数据中心的建筑实际上并不可行。”
Cordovil 指出,结果就是对棕地场址的重新兴趣。所谓绿地通常指未开发的土地,而棕地则是指曾被开发但现已废弃的场所,比如工厂、医院或购物中心。
改造旧工业场所的一个优势是,这些地方通常配备了变电站,电力供应已到位。如果是工厂,建筑时通常会有坚固而沉重的地板。
Cordovil 说:“从发电机传输电力,并且能直接连接变电站,对大多数市场来说是一个巨大的优势。”
“一切都在重新评估”
Skae 表示,虽然 AI 数据中心可能需要更强的地板加固,但这不会影响开发进度。
他说:“使用不同强度的混凝土、不同规格的钢材,不过这些变化并不会实质上影响施工进度。”他还补充道,他从未遇到客户因建造场地的材料成本而拒绝报价的情况。
Cordovil 认为,AI 硬件对数据中心设计的影响依然显著。考虑到数据中心通常设计使用寿命为 10 至 20 年,建筑商也深知他们的设施不可能在两年内就变得过时。
这位分析师表示:“无疑正在经历一次重大转变或重新评估。没有人停止建设,但他们确实在重新审视如何建设,以确保他们的场地符合未来的需求。”
他补充道:“这真的改变了很多先入为主的观念。一切都在重新衡量,一切都在重新评估。”
好文章,需要你的鼓励
zip2zip是一项创新技术,通过引入动态自适应词汇表,让大语言模型在推理时能够自动组合常用词组,显著提高处理效率。由EPFL等机构研究团队开发的这一方法,基于LZW压缩算法,允许模型即时创建和使用"超级tokens",将输入和输出序列长度减少20-60%,大幅提升推理速度。实验表明,现有模型只需10个GPU小时的微调即可适配此框架,在保持基本性能的同时显著降低计算成本和响应时间,特别适用于专业领域和多语言场景。
这项研究创新性地利用大语言模型(LLM)代替人类标注者,创建了PARADEHATE数据集,用于仇恨言论的无毒化转换。研究团队首先验证LLM在无毒化任务中表现可与人类媲美,随后构建了包含8000多对仇恨/非仇恨文本的平行数据集。评估显示,在PARADEHATE上微调的模型如BART在风格准确性、内容保留和流畅性方面表现优异,证明LLM生成的数据可作为人工标注的高效替代方案,为创建更安全、更具包容性的在线环境提供了新途径。
这项研究由中国科学技术大学的研究团队提出了Pro3D-Editor,一种新型3D编辑框架,通过"渐进式视角"范式解决了现有3D编辑方法中的视角不一致问题。传统方法要么随机选择视角迭代编辑,要么同时编辑多个固定视角,都忽视了不同编辑任务对应不同的"编辑显著性视角"。Pro3D-Editor包含三个核心模块:主视角采样器自动选择最适合编辑的视角,关键视角渲染器通过创新的MoVE-LoRA技术将编辑信息传递到其他视角,全视角精修器修复并优化最终3D模型。实验证明该方法在编辑质量和准确性方面显著优于现有技术。
这项研究提出了ComposeAnything,一个无需重新训练的框架,可显著提升AI图像生成模型处理复杂空间关系的能力。该技术由INRIA、巴黎高师和CNRS的研究团队开发,通过三个创新步骤工作:首先利用大型语言模型创建包含深度信息的2.5D语义布局,然后生成粗略的场景合成图作为先验指导,最后通过物体先验强化和空间控制去噪引导扩散过程。在T2I-CompBench和NSR-1K基准测试中,该方法远超现有技术,特别是在处理复杂空间关系和多物体场景时表现卓越,为AI辅助创意设计开辟新可能。