随着人工智能的迅猛崛起,全球数据中心建设正经历前所未有的扩张。预计到本十年末,数据中心的用电量将占美国总用电量的9%至17%。而在当前数据中心的电力消耗中,约有三分之一被用于冷却运行AI模型的芯片。
正是这一环节,成为初创公司Ferveret致力于优化的核心目标。该公司由麻省理工学院(MIT)核工程专业前博士后研究员Reza Azizian,以及MIT核科学与工程系副教授Matteo Bucci共同创立。他们将核反应堆中的冷却技术迁移应用于芯片散热领域,实现了零水耗、低能耗的突破性方案。
Ferveret的冷却系统将计算机服务器浸入一种特殊液体中,该液体的导热效率远超传统风扇的空气冷却方式。与其他液冷方案相比,Ferveret的自适应相变冷却(APC)技术有其独特之处:它能在服务器表面产生更细小的气泡,这些气泡脱离频率更高,从而大幅加速热量传递过程。
目前,Ferveret已与多家企业展开合作测试,包括数据中心开发商和运营商CleanSpark、AI加速器公司FuriosaAI,以及美国最大数据中心运营商之一Switch。
在最近一项与加州大学洛杉矶分校Samueli计算机科学系合作开展的研究中,Ferveret发现其APC解决方案与当前最先进的液冷系统相比,计算功率效率提升了15%。结合Ferveret的功耗控制系统对运行条件进行优化后,该公司表示,数据中心在相同功耗下,能够从AI模型中多获取35%的Token——即文本或数据的基本处理单元。
"我们的目标是让数据中心尽可能实现可持续运营,帮助它们将每一瓦电力都用于生成Token这一最有价值的输出,"Azizian表示,"我们的系统可以支持更高性能芯片的运行,帮助数据中心大幅减少能源浪费,而且整个过程实现了零水耗。"
从核反应堆到人工智能
2013年,还在MIT从事博士后研究的Azizian结识了当时担任研究科学家的Bucci,两人随即开展了核反应堆热传递领域的合作研究。此后,Azizian进入工业界,将研究方向转向芯片冷却技术。他先后参与了微软HoloLens增强现实头显的研发工作,随后加入英伟达——这家公司为各企业提供用于训练和运行最新AI模型的图形处理器。与此同时,Bucci继续在MIT深耕学术研究,并于2016年晋升为助理教授。
2017年,Azizian第一次走进数据中心,眼前那些轰鸣运转的巨型冷却风扇令他深感震撼。
"我当时的第一反应是:'天哪,冷却设施怎么能这样搞?'"Azizian回忆道,"空气冷却仍会消耗数据中心40%的电力。这种方式效率低得惊人,但因为不影响性能,没人在意这套冷却技术已经用了50年。"
Azizian随即与Bucci展开深入探讨,双方决定将核反应堆热传递优化领域积累的知识应用于数据中心冷却。几十年来,科学家们一直在探索更高效的核反应堆散热方式。
"热传递直接决定了能从反应堆堆芯提取多少能量,这也直接关系到经济收益,"Azizian解释道。
两位创始人于2021年正式创立Ferveret。自Azizian第一次踏入数据中心以来,行业已发生了翻天覆地的变化。随着人工智能的爆发式增长,芯片厂商不断提升芯片集成度,在有限的电力供应下,最大化计算性能成为行业追求的核心目标。
这一趋势推动数据中心运营商转向液冷技术,其中一种被称为浸没式冷却的方式——即将芯片完全浸入液体中——应用尤为广泛,而将液体煮沸的方式被认为是效果最佳的浸没式冷却方案。
"液体是比空气更好的导热介质。这就是为什么把手伸入室温水中仍然会感到凉爽,"Bucci解释道,"液体沸腾时,散热效果会进一步增强,因为相变过程需要消耗大量能量,而这些能量正是从芯片中带走的热量。这样一来,在芯片与液体之间温差极小的情况下,就能实现大量热量的高效传递。"
然而,沸腾液体也带来了系统复杂性的挑战,运营商必须在捕获并液化气泡的同时,对压力、温度和液体容量进行精确控制。
Ferveret的系统源自核反应堆中一种名为"过冷沸腾"的技术。该系统采用低沸点液体,且不含其他方案中普遍使用的、具有毒性的全氟烷基化合物(PFAS)"永久性化学物质"。在芯片表面,Ferveret的液体所产生的气泡比其他浸没式冷却方案更细小,这些气泡脱离更加频繁,并能在周围液体中迅速重新冷凝,从而加快芯片表面的气泡再润湿循环,进一步提升散热效率。
Ferveret以小型箱体为单位交付APC系统,每个箱体容纳一台服务器。创始人表示,模块化的设计有利于系统的灵活部署,同时大幅简化日常维护工作。
"正是物理原理使我们得以实现过去难以想象的产品形态,"Azizian表示,"大多数浸没式冷却方案都采用大型储液槽,将服务器整体浸入其中。而我们提供的是更紧凑的模块化机架式解决方案,能够适配现有基础设施,让用户更轻松地部署我们的技术。"
此外,Ferveret还提供配套的控制软件,可实时动态调整每台服务器的功耗分配,进一步提升整体能效。
"我们提供的是全栈式系统,涵盖冷却箱体、机架、冷却分配单元,以及用于检测温度和压力的传感器,"Bucci介绍道,"我们的软件持续监测这些传感器数据,并对每个箱体内部的运行条件进行优化,确保整个系统的能耗降至最低。"
以更少资源赋能AI发展
除提升数据中心运营效率外,Ferveret的技术还通过降低偏远地区数据中心建设门槛,为可持续发展注入新动力。
"阳光充沛的地方往往水资源匮乏,而我们零水耗的优势,让那些拥有太阳能资源却缺乏冷却用水的地区也能建设数据中心,"Bucci表示,"这项技术将推动数据中心向传统上不具备相应资源的地区延伸,包括非洲、中东,以及美国部分地区,这将是一次重大突破。"
目前,Ferveret正与各大云计算巨头(即所谓的超大规模云服务商)积极洽谈合作,并已加入英伟达面向初创企业的Inception计划。公司计划在今年晚些时候宣布更多合作伙伴关系。创始人表示,未来将快速扩大技术规模,助力AI产业持续增长,同时减少对地球资源的消耗。
"计算行业面临的电力获取瓶颈日益突出,在许多地区,水资源获取同样面临严峻挑战,"Azizian表示,"随着行业规模持续扩大,这些制约因素只会愈发突出。数据中心运营商的核心诉求,就是从现有电力中获取更多Token的输出。而我们已经证明,这完全可以实现。"
Q&A
Q1:Ferveret的自适应相变冷却(APC)技术与传统液冷方案有什么区别?
A:Ferveret的APC技术源自核反应堆中的"过冷沸腾"原理,核心差异在于其液体在芯片表面产生的气泡更细小,脱离频率更高,能在周围液体中迅速重新冷凝,加速芯片表面的热量传递。相比之下,传统浸没式冷却通常采用大型储液槽,系统更复杂。此外,Ferveret采用模块化机架式箱体,每个箱体容纳一台服务器,部署更灵活,维护也更简单。
Q2:Ferveret的冷却系统能带来多大的性能提升?
A:根据Ferveret与加州大学洛杉矶分校合作开展的研究,APC方案与当前最先进的液冷系统相比,计算功率效率提升了15%。结合Ferveret的功耗控制软件对运行条件进行动态优化后,数据中心在相同功耗下,能够从AI模型中多获取35%的Token输出。
Q3:Ferveret的技术为什么适合在偏远地区或水资源匮乏的地区部署数据中心?
A:Ferveret的冷却系统实现了零水耗,不依赖水资源进行散热,这使其天然适合在太阳能资源丰富但水资源匮乏的地区部署数据中心。Bucci指出,非洲、中东以及美国部分地区都符合这一条件。相较于传统冷却方案受限于水资源可用性,Ferveret的技术大幅拓宽了数据中心的可建设范围,为这些地区接入算力基础设施提供了可能。
好文章,需要你的鼓励
Instagram正在推出一项备受期待的新功能,允许用户手动调整个人主页网格中帖子的排列顺序。用户只需点击主页网格中的任意照片,选择"重新排列网格",即可进入拖拽界面自由调整照片顺序,完成后点击左上角返回按钮即可保存更改。该功能本周起开始向用户推出,部分用户可能尚未获得访问权限。
耶鲁大学研究团队证明两层神经网络在学习有限群运算时,梯度下降自发驱动每个神经元收敛到单一不可约群表示,并在傅里叶域实现秩一旋转对齐,揭示了特征学习的表示论机制。
iOS 27代码中发现"休息提醒"相关字符串,暗示Siri AI可能在对话持续过长时向用户发出休息提示,并提醒用户Siri并非真实的人。目前,OpenAI、Anthropic、Google等公司已陆续为旗下AI产品添加类似功能。苹果尚未官方确认该功能,触发条件也可能不仅限于对话时长。此举表明苹果正关注AI聊天机器人带来的用户健康责任问题。
强化学习训练的大语言模型可在无任何指令的情况下自发发现社会规章制度漏洞,现有安全机制对此几乎无效,这一现象或将重塑AI安全防护框架。