谷歌周二宣布了一项新的登月计划——发射由太阳能驱动的卫星星座,这些卫星搭载自主研发的张量处理单元(TPU),组成轨道AI数据中心。
"未来,太空可能是扩展AI计算的最佳场所,"谷歌高管在博客文章中写道。他们解释说,太阳能电池板在太空中的效率比在地球上高8倍,并且可以持续产生电力。
能源可用性已成为地面数据中心建设的限制因素,因此拥有丰富的清洁不间断能源的前景无疑相当有吸引力。
然而,正如谷歌指出的,实现这一计划需要克服重大挑战,其中之一是找到足够的火箭将有用数量的基础设施送入轨道。尽管SpaceX今年有望进行超过140次发射,但发射能力仍然不易获得。
发射成本是另一个考虑因素。假设到2030年代中期发射价格降至每公斤200美元,谷歌认为基于太空的数据中心在能源成本方面将与地面数据中心大致相当。目前的发射价格是谷歌期望成本的十倍以上。
AI基础设施还需要快速和弹性的网络连接,目前供应商通过光纤和/或铜线提供这种连接。对于"阳光捕手"项目,谷歌将通过地球轨道的近真空环境无线传输数据。
通过部署空间复用技术(一种使用多个独立数据流增加吞吐量的技术),谷歌预计能够以"每秒数十太比特"的速度将大量卫星连接在一起。
谷歌表示已经证明这项技术可以使用800 Gbps光学系统有效工作,但承认这些系统需要大量能源。
"实现这种带宽需要接收功率水平比传统远程部署中的典型水平高数千倍,"谷歌解释道。"由于接收功率与距离的平方成反比,我们可以通过让卫星以非常紧密的编队飞行——几公里或更少的距离来克服这一挑战。"
换句话说,这些计算星座需要相当密集。在一次模拟中,谷歌建议由81颗卫星组成的集群,这些卫星在海拔650公里处以相互间距100-200米的排列飞行,整个阵列跨度为两公里。
如果谷歌成功将足够大规模的TPU舰队送入轨道并能使基于太空的通信网络可靠运行,设备仍需要在太空的严酷环境中生存。
使基于太空的AI超级计算机概念如此吸引人的能源来源也恰好会喷射出电离辐射,这对电子设备并不友好。在地球上,我们受到行星电磁场和厚厚大气层的保护,免受大部分辐射影响。然而,在轨道上,这些保护远没有那么强。
谷歌已经在研究其TPU的抗辐射版本。事实证明,该公司可能不需要做太多工作来保持它们的运行。在测试中,谷歌将其TPU v6e(代号Trillium)加速器暴露在67兆电子伏光子束下,以观察其如何应对辐射。
结果显示,加速器最敏感的部分是其高带宽内存模块,在累积剂量达到2 krad(Si)后开始出现异常,这几乎是芯片在屏蔽环境中五年任务期间预期承受剂量的3倍。
谷歌在地球上进行了系统测试,并在这份预发表论文中记录了这些努力。该公司计划在2027年发射一对原型卫星,以进一步评估其硬件和轨道数据中心的可行性。
谷歌并非第一个建议将太空作为下一个数据中心前沿的公司。
我们在2017年报道过一家希望这样做的初创公司,但该努力从未进入轨道。
惠普企业(HPE)多年来一直在研发太空计算平台。其首个单元Spaceborne于2017年发射,在国际空间站上停留了近两年,但在四个冗余PSU中的一个出现故障,20个SSD中有九个出现故障。Axiom Space也在8月向国际空间站发射了类似的计算原型。
就在上个月,亚马逊创始人兼执行董事长杰夫·贝索斯预测,在未来二十年内,千兆瓦级数据中心将充满天空,由来自太阳的无限光子流提供动力。上周六,埃隆·马斯克表示SpaceX将建造轨道数据中心。
Q&A
Q1:谷歌的轨道AI数据中心项目有什么优势?
A:太阳能电池板在太空中的效率比在地球上高8倍,可以持续产生电力。由于地面数据中心建设受到能源可用性限制,太空中丰富的清洁不间断能源前景相当有吸引力,为AI计算提供了更好的扩展空间。
Q2:实现轨道数据中心面临哪些主要挑战?
A:主要挑战包括发射能力不足、成本过高(目前发射价格是谷歌期望成本的十倍以上)、需要克服太空中的电离辐射对电子设备的影响,以及需要通过空间复用技术实现卫星间的高速无线数据传输。
Q3:谷歌何时会实际部署这个轨道数据中心?
A:谷歌计划在2027年发射一对原型卫星,以进一步评估硬件和轨道数据中心的可行性。目前该公司已经在地球上进行了系统测试,并研究TPU的抗辐射版本,但大规模商业部署时间尚未确定。
好文章,需要你的鼓励
Fractal AI Research实验室开发了Fathom-DeepResearch智能搜索系统,该系统由两个4B参数模型组成,能够进行20多轮深度网络搜索并生成结构化报告。研究团队创新了DUETQA数据集、RAPO训练方法和认知行为奖励机制,解决了AI搜索中的浅层化、重复性和缺乏综合能力等问题,在多项基准测试中显著超越现有开源系统,为AI助手向专业研究工具转变奠定了基础。
AI正在革命性地改变心脏疾病治疗领域。从设计微创心脏瓣膜手术到预防原理定位,机器学习和神经网络的洞察力推动了巨大进步,甚至可以构建新型移植解剖结构。数字孪生技术为个性化心血管护理提供持续预测管理。哈佛干细胞研究所的研究人员利用纳米材料和类似棉花糖机的设备,能在10分钟内制造心脏瓣膜,相比传统3周制造时间大幅缩短。这些突破性技术为每年4万名先天性心脏畸形儿童带来新希望。
快手科技与清华大学合作发现当前AI语言模型训练中存在严重的权重分配不平衡问题,提出了非对称重要性采样策略优化(ASPO)方法。该方法通过翻转正面样本的重要性权重,让模型把更多注意力放在需要改进的部分而非已经表现良好的部分,显著提升了数学推理和编程任务的性能,并改善了训练稳定性。