AI驱动的算力需求正推动数据中心竭力榨取每一组GPU机架的性能,而这一趋势也带来了一个意想不到的副作用——细菌滋生问题。
用于液冷芯片的冷却液,通常是水与抑菌剂的混合物。为了让芯片在更高温度下运行,数据中心管理员可以提高冷却液中的水比例,因为水的导热性更好,但这也为细菌繁殖创造了条件,最终导致管路堵塞。解决这一问题的常规手段是冲洗整个系统,而这往往意味着一个机架需要停机五到六个小时,潜在损失可能高达数百万美元。
Omen AI为此提出了一套解决方案:一款微型光谱仪,可实时监测冷却液的健康状态,在细菌大规模爆发之前就发出预警。该公司CEO兼创始人扎克·拉伯格(Zach Laberge)表示:"如果对冷却液的化学状态毫无了解,就面临着巨大的停机风险。"
Omen AI近日宣布完成3100万美元的A轮融资,本轮由Nava Ventures领投,CRV、范德堡大学、Mann+Hummel、Starhill Holdings、Hard Launch Capital等机构跟投,同时还获得了普利司通、通用汽车、江森自控及Tensorwave高管的个人投资。
拉伯格的创业经历颇为传奇。2020年,年仅14岁的他创办了第一家公司,通过为工程机械安装传感器成功融资300万美元,并最终选择从高中退学。他的父母——其母曾任加拿大安大略省教育部长——对他另辟蹊径的人生选择给予了充分支持。
第一家公司关闭后,拉伯格于2024年创立了Omen,最初的设想是将流体系统作为核心切入点,赋予工程机械实时感知自身维修需求的能力,以取代耗时费力的人工采样送检流程。除细菌检测外,该设备还能通过检测铜或铬的含量来判断泵是否老化,通过检测硅含量来识别密封件是否磨损。
卡特彼勒(Caterpillar)经销商是Omen重型车辆业务的早期核心客户。由于卡特彼勒同时也是数据中心本地供电所用燃气轮机和发电机的主要供应商,Omen很快嗅到了新的市场机遇。
"这就是我们转型的契机,"拉伯格在接受TechCrunch采访时说道。大约六个月前,"许多经销商开始询问:'我们正在给涡轮机装传感器,你们能不能在建筑侧做点什么?'"
Omen由此发现,数据中心建筑内部充斥着各类流体系统,从暖通空调到芯片冷却无所不包。看准这一快速增长的潜在客户群体,Omen将战略重心转向了数据中心市场。
Nava Ventures合伙人、Omen董事会成员科里·雷拉斯(Cory Rellas)表示:"在这样一个节奏相对缓慢的行业里,能看到一位如此年轻的创始人赢得大型成熟企业的认可,实属罕见。对于Omen而言,我们大部分的尽职调查都来自与大客户的直接交流,这很快验证了他们方案的可行性。"
Omen自2024年成立以来已累计融资4000万美元,目前正与十余家数据中心客户合作,共同完善其产品体系,其中包括基于AMD芯片构建AI算力云的TensorWave。
"流经这些庞大系统的冷却液,是整个行业几乎都在盲目依赖的关键变量,"TensorWave总裁皮奥特·托马西克(Piotr Tomasik)在声明中表示,"Omen对基础设施未来的判断与我们高度一致——通过更好的监测来为算力客户提供最优支撑。"
目前,许多机构仍依赖将液体样本邮寄至实验室的方式来获取分析数据。不过,Omen并非这一领域的唯一玩家——老牌水质监测企业Pyxis也于本月初推出了其数据中心冷却液监测产品。
推动这一技术路线得以实现的关键,在于近年来光学技术和信号处理软件的双重突破。"硬件已经便宜到足以支撑规模化部署,而信号处理则帮助我们从噪声中提取出更有价值的信息,"拉伯格说道。
Q&A
Q1:Omen AI的微型光谱仪是如何监测数据中心冷却液健康状态的?
A:Omen AI的微型光谱仪通过实时光学检测与信号处理软件,对冷却液的化学成分进行持续分析。它不仅能提前发现细菌滋生迹象,还能通过检测铜、铬含量判断泵的磨损情况,以及通过硅含量识别密封件老化问题,从而在问题扩大之前发出预警,避免因停机冲洗造成的巨额损失。
Q2:数据中心冷却液中的细菌问题为什么会造成那么大的损失?
A:为了让芯片在更高温度下稳定运行,数据中心通常会提高冷却液中水的比例,而水比抑菌剂混合液更利于细菌繁殖。一旦细菌大量滋生,就会堵塞冷却管路,迫使运维人员对整个系统进行冲洗,单个机架的停机时间长达五到六个小时,潜在经济损失可能高达数百万美元。
Q3:Omen AI目前有哪些数据中心客户,融资情况如何?
A:Omen AI目前正与十余家数据中心客户合作,其中包括基于AMD芯片构建AI算力云的TensorWave。在融资方面,公司本轮完成3100万美元A轮融资,由Nava Ventures领投;自2024年成立以来,累计融资总额已达4000万美元。
好文章,需要你的鼓励
"影子AI"是指员工在未经公司批准的情况下使用AI工具办公。虽然ChatGPT等工具能提升效率,但将内部文件、客户数据或源代码输入未授权平台,可能导致企业数据失控。IBM报告显示,20%的企业存在未授权AI工具,63%尚无AI治理政策。专家建议,一味封禁效果有限,企业应明确哪些工具可用、哪些数据禁止上传,员工也应主动核查AI输出内容,避免将敏感信息粘贴至公共AI平台。
阿里Qwen团队通过引入强化学习和在线策略蒸馏,将Qwen-Image-2.0升级为Qwen-Image-2.0-RL,让图像生成模型真正学会人类审美,文生图Elo评分提升78分,图像编辑提升93分。
Hirebotics联合Fanuc发布首款基于无代码Beacon平台的防爆协作喷涂机器人Cobot Painter。该方案适用于金属制造商,无需专用喷涂房或复杂编程,可在现有人工喷涂环境中数日内完成部署。操作人员通过平板或手机的"点击示教"功能即可引导机器人完成路径学习,实现液体涂料、粉末涂装等高精度重复作业,帮助制造商将涂装业务收回自主管理。
港科大与快手联合提出NormGuard,针对流匹配模型强化学习训练中速度范数膨胀问题,通过训练时单向惩罚约束,在保留奖励的同时改善图像真实感。