AI热潮面临着功耗问题,而这不仅仅是电力问题。随着生成式模型规模不断扩大,数据中心竞相跟上发展步伐,讨论大多集中在计算能力上:更多GPU、集群和芯片。但深入研究后会发现,真正的制约因素并非机器思考速度,而是基础设施层面的其他问题。
为大语言模型提供超大规模高维数据需要能够以最小损耗和功耗传输每秒TB级数据的基础设施。作为互联网时代默认连接方式的铜质interconnect正开始在这种负载下出现问题。这就是为什么基础设施建设者和投资者将新赌注押在硅光子技术上:这是一种基于光纤的替代方案,使用光而非电来更快、更冷、更高效地传输数据。
周二,以色列硅光子初创公司Teramount宣布完成5000万美元A轮融资,获得AMD Ventures、三星Catalyst基金、Koch Disruptive Technologies和日立创投的支持。他们的主张简单但影响深远:让使用光子而非电子连接芯片变得更容易,从而防止AI的物理系统成为其限制因素。
核心问题在于,铜线在数十年中表现出人意料地良好。但在当今的AI集群中——GPU数量达到数千个,训练运行可能持续数周——传统布线开始看起来不像基础设施,更像瓶颈。功率泄漏、热输出和带宽上限都随着系统规模扩大而加剧。
硅光子技术提供了出路。通过光纤发送光信号,这些系统减少能耗、降低热量并大幅扩展数据吞吐量。Teramount的方法专注于可拆卸的光纤到芯片连接器,针对共封装光学器件进行优化——这是一种将光学组件直接与计算硅集成的设计架构。
根据Yole集团数据,共封装光学器件市场预计到2028年将达到21亿美元,更广泛的硅光子市场预计到2030年将增长至96.5亿美元——几乎是2023年规模的四倍。
Nvidia、英特尔、AMD和博通等科技巨头已经在构建这一未来。但大规模部署的可维护性仍是悬而未决的问题。这就是Teramount等公司开辟空间的地方,不仅构建快速interconnect,还要让它们适合现场应用。
Teramount融资的时机并非偶然。过去两年中,AI的成本(无论是美元还是瓦特)一直在持续上升。
国际能源署估计,到2026年数据中心总用电量可能跃升至1000太瓦时,几乎是目前水平的两倍,主要由生成式AI系统驱动。作为对比,这大约相当于日本的电力需求。
与此同时,路透社Breakingviews专栏最近论证,AI热潮与其说是关于算法,不如说是关于基础设施。它预测未来几年全球数据中心投资可能超过3.7万亿美元——凸显了在提升带宽的同时削减功耗的迫切需求。
关键在于:大部分功耗并非用于计算,而是用于数据传输——在处理器、机架、存储阵列和内存池之间。没有更快、更低功耗的interconnect,AI的规模优势就会变成能源负担。
人们很容易认为AI的未来就是能够编写代码、起草文档或分析图像的强大模型。但在所有这些智能工具背后,是传输数据、管理热量并保持一切平稳运行的物理系统。如果这个基础不牢固,整个系统就会开始出现裂缝。
然而,硅光子技术并非即插即用的解决方案。在成为主流之前,它仍需要新标准、更好的封装技术和更先进的制造工艺。这就是为什么从实验室实验转向现实世界产品需要数年时间。
但这种情况正在改变。Meta、微软和亚马逊等公司已经在其一些最新AI系统中使用光子连接——虽然悄然进行,但越来越一致。
当投资者开始支持AI中艰难、不起眼的部分(如硅光子技术)时,这是行业将其视为必需而非可选的强烈信号。
Teramount的融资反映了更广泛AI基础设施领域的巨大推动力,以及这如何可能成为这个时代赢家的最大决定因素。他们不仅是训练最智能模型的人,更是构建能够大规模、高速处理这些模型而不会使电网过热的系统的人。
"如果AI要从营销流行语演变为持久的创新引擎,其成功将取决于与其支持的算法一样智能高效的基础设施,"Taha说道。"简而言之,AI的未来取决于重新思考将其连接在一起的布线。"
Q&A
Q1:硅光子技术是什么?为什么它对AI很重要?
A:硅光子技术是一种基于光纤的数据传输方案,使用光而非电来传输数据。它对AI很重要是因为能够减少能耗、降低热量并大幅扩展数据吞吐量,解决传统铜质连接在AI大规模应用中的瓶颈问题。
Q2:Teramount公司的核心技术是什么?
A:Teramount专注于可拆卸的光纤到芯片连接器,针对共封装光学器件进行优化。这种设计架构将光学组件直接与计算硅集成,让使用光子而非电子连接芯片变得更容易。
Q3:AI基础设施的功耗问题有多严重?
A:国际能源署估计,到2026年数据中心总用电量可能跃升至1000太瓦时,几乎是目前水平的两倍,大约相当于日本的电力需求。而且大部分功耗并非用于计算,而是用于数据传输。
好文章,需要你的鼓励
美国网络安全和基础设施安全局指示联邦机构修补影响思科ASA 5500-X系列防火墙设备的两个零日漏洞CVE-2025-20362和CVE-2025-20333。这些漏洞可绕过VPN身份验证并获取root访问权限,已被黑客积极利用。攻击与国家支持的ArcaneDoor黑客活动有关,黑客通过漏洞安装bootkit恶意软件并操控只读存储器实现持久化。思科已发布补丁,CISA要求机构清点易受攻击系统并在今日前完成修补。
康考迪亚大学研究团队通过对比混合量子-经典神经网络与传统模型在三个基准数据集上的表现,发现量子增强模型在准确率、训练速度和资源效率方面均显著优于传统方法。研究显示混合模型的优势随数据集复杂度提升而增强,在CIFAR100上准确率提升9.44%,训练速度提升5-12倍,且参数更少。该成果为实用化量子增强人工智能铺平道路。
TimeWave是一款功能全面的计时器应用,超越了苹果自带时钟应用的功能。它支持创建流式计时器,让用户可以设置连续的任务计时,帮助专注工作。应用采用简洁的黑白设计,融入了Liquid Glass元素。内置冥想、番茄工作法、20-20-20护眼等多种计时模式,支持实时活动显示和Siri快捷指令。免费版提供基础功能,高级版需付费订阅。
沙特KAUST大学团队开发了专门针对阿拉伯语的AI模型家族"Hala",通过创新的"翻译再调优"技术路线,将高质量英语指令数据转化为450万规模的阿拉伯语语料库,训练出350M到9B参数的多个模型。在阿拉伯语专项测试中,Hala在同规模模型中表现最佳,证明了语言专门化策略的有效性,为阿拉伯语AI发展和其他语言的专门化模型提供了可复制的技术方案。