当前的轨道数据中心,准确来说更像是太空中的计算中心,其形态更接近卫星星座,而非传统意义上的地面数据中心。
AI数据中心需要消耗大量电力、水资源和物理空间,但这些空间未必要建在地面,也不必依赖大气环境。
将服务器送入轨道,可以绕开数据中心在地面面临的诸多棘手问题:居民不希望数据中心建在自家附近;地方和国家层面存在严格的法规限制;数据中心需要大量水资源用于冷却,以及海量电力用于驱动和散热服务器机架,这些都推高了建设和运营成本。
正因如此,越来越多的计算能力正被接入卫星星座,或部署于专门建造的轨道单元。
Infineon Technologies航空航天与国防部门研究员兼副总裁Helmut Puchner表示:"我们将其称为太空数据中心,但实际上它将是太空计算中心。由于AI系统和AI数据中心的增长速度已超过地面能源和资源的供给能力,我们希望转向太空。SpaceX宣布了Terafab自研芯片计划,Blue Origin也宣布了TeraWave卫星网络。'太拉(Tera)'似乎成了新的关键词。SpaceX对太空数据中心是认真的。他们的目标非常清晰——宣布发射百万颗卫星,是为了在太空中安装100吉瓦的计算能力。就目前的卫星而言,专家告诉我每颗卫星最多能达到40千瓦,或许可以推高到100千瓦,乘以一百万颗,就是100吉瓦。"
然而,这一构想面临诸多技术挑战。Rambus研究员兼杰出发明家Steven Woo指出:"最大的障碍包括充足的电力供应、热管理、辐射环境下的长期可靠性,以及日益增多的太空碎片。在地面,我们依赖气流、液体冷却和便捷的可维护性,这些方式在轨道数据中心中都难以直接复用。先进节点和存储器受到的辐射效应,又增加了一层复杂性,要求采用加固设计和冗余机制。"
Texas Instruments计算能源技术专家Pradeep Shenoy也认为"太空数据中心"这一说法并不准确:"更像是功能强化的卫星,或者卫星星座。从各公司已公布的方案来看,他们会提升单颗卫星的功率和计算能力,但同时要部署百万颗,才能达到所需的总计算量。"
Synopsys 5G/6G与空间项目总监Shawn Carpenter表示,这一目标能否实现尚存疑问:"想到要真正运行当代AI芯片所需的电力,我对那块用于供电的太阳能采集板究竟要做多大,感到有些不安。这是相当繁重的工程任务。把设备送上去的吸引力显而易见——太空寒冷,在阴影面散热效果极好。但同时,你又依赖太阳能采集来获取所需能量,这块采集板需要做多大?当这些阵列大到一定程度时,地面天文学家会开始强烈抗议吗?这些都有待观察。"
此外还存在通信挑战。Synopsys产品管理总监Lang Lin指出:"由于光纤电缆在轨道中不可行,大量数据需要通过无线方式传输,这涉及频谱管理问题。电磁脉冲或其他因素也可能造成通信中断。维护同样是难题——在地面,你可以拔掉线缆、更换机架或更换计算机。但在太空中,如果某个设备损坏,维修成本远高于去本地数据中心换个零件,费用高昂。"
太空中的散热难题
尽管低温有利于电子设备性能,散热仍是太空计算的核心工程挑战。Puchner介绍道:"驱动100块英伟达GPU,需要33平方米的太阳能板和16平方米的辐射散热板来向外辐射热量。无论怎么做热力学计算,结论都是一样的:这些计算中心本质上就是在把电能转换成热能。"
强制液冷方案与地面数据中心类似,同样可以应用于太空,但热量必须传输至散热板,再向太空中辐射。Synopsys流体产品管理高级总监Jeremy McCaslin解释说:"空气对流冷却被液体对流冷却取代,后者效率更高。在太空中仍可依靠传导和辐射。热量通过固体材料从芯片或热端传至冷端,再经由热管或流体回路导出,最终通过大型散热板以红外辐射的方式释放到太空中。"
优化芯片架构以降低热量
与地面情况类似,更高能效的芯片在太空中同样可以从源头减少热量产生。Imagination Technologies产品管理总监Matthew Bubis表示:"太空中散热之难,既独特又出乎意料。但如果芯片效率更高,产生的热量就更少,散热也更容易,所需的散热板和换热系统也会更少。"
专为地理空间智能和自主太空操作设计的加速芯片架构,需要借助边缘AI的最新进展,在尺寸、重量和功耗(SWaP)受限的环境中榨取更高性能。经过辐射加固的汽车级边缘AI GPU,非常适合用于轨道计算和存储。
Bubis指出:"即便在辐射加固之前——毕竟可做的加固程度有限——IP本身就能提供传统的安全架构特性。存储器纠错、硬件内部测试环路等技术,可确保系统持续正确地计算输入并输出结果。我们看到很多原本用于汽车高级驾驶辅助系统的安全机制,正在被评估用于太空场景。"
NASA近期宣布与Microchip联合研发了经辐射加固的高可靠性高性能航天计算处理器,采用先进以太网连接多个传感器或集群多颗芯片,使航天器能够在轨自主实时处理海量数据。英伟达也宣布推出专用平台,为Aetherflux、Axiom Space、Kepler Communications、Planet Labs、Sophia Space和Starcloud等公司提供数据中心级太空计算能力。
归根结底,技术成本和资金成本都必须纳入考量。Bubis表示:"太空数据中心构想的根本驱动力,是地面能源和基础设施的高昂成本。但太空中免费且持续的太阳能,需要与发射成本相抵消。关键在于运载物的重量、计算系统的功耗,以及如何应对辐射问题。"
太阳同步轨道供电
如果计算中心依靠太阳能供电,就需要持续与太阳保持同步,运行在南北极的太阳同步轨道上,而非像普通卫星那样在两极间来回运动、有时关机省电。
星座卫星通常不覆盖极区。Puchner说明道:"主要星座通常飞行在北纬或南纬15到20度的范围内,不覆盖极区——尽管加拿大的Terrestar星座计划在该区域运行。对于太空计算中心而言,问题在于要么配备大容量电池,要么飞行在太阳同步轨道上,也就是不断绕经南北极,以持续获取太阳能,因为计算中心需要不间断的电力,无法储能。普通星座卫星飞越大洋等低活动区域时会关机,飞越人口密集区再开机,90分钟绕地一圈。"
轨道数据中心无法采用临时关机的方案。Puchner指出:"数据中心仍需依赖常规星座进行数据上传和下载。假设你发出一个ChatGPT请求,由太空计算中心实时处理,那么数据返回的延迟至关重要。这要求太阳同步计算中心与全球低延迟访问网络协同工作。目前最后一跳数据传输仍在标准星座的网状网络中完成,如何协调管理,尚不明朗。"
多跳传输方案很可能在新的解决方案出现之前占据主导地位。Imagination Technologies的Bubis指出:"很可能出现这样一种模式:全球数据流按照太阳能供应位置和实际计算位置进行分配,而计算位置需要处于能够持续获取电力的固定轨道上。"
以Axiom Space为例,其卫星采集原始数据(如图像或遥测数据),通过能力达2.5 Gbps的光学星间链路(OISL,未来可达10 Gbps)发送至附近的轨道数据中心节点;轨道数据中心执行处理和推理任务,包括图像过滤、特征检测、文件压缩或运行AI/机器学习模型,再通过近地轨道和地球静止轨道的商业中继星座将数据送回地面。Axiom Space不仅部署了轨道数据中心,还在国际空间站上安装了数据中心节点,并正在积极建造商业空间站。
Synopsys的Lin还提到了利用核能为轨道数据中心供电的可能性。尽管放射性同位素热电发生器(RTG)已用于深空探测器供电,但核动力轨道数据中心仍面临重重障碍。
太阳同步定位仿真
Synopsys近期与Cesium合作,为NASA月球网络部署提供支持。Cesium业务发展总监Alex Paulson介绍,该公司将客户的设计数据、机械计算机辅助设计模型、现实捕捉数据和训练数据转换为开放标准的3D Tiles格式,支持异构大规模三维地理空间数据集的实时流式传输。生成的模型是四维的,能够呈现三维模型在一天中随时间变化的动态效果。
"我们可以在任务仿真软件中进行时间同步,"Paulson介绍,"可以跳转到任意世界时刻,查看所有行星、卫星、月球等天体的精确方位。"
对于需要太阳能供电的卫星、航天器和轨道数据中心,该模型有助于判断太阳能板的受光时机。Synopsys的Carpenter表示:"这样我就能根据峰值功率时段来安排操作。没有太阳照射时就没有电力,必须谨慎地关闭或保护卫星上的某些系统。我们可以通过四维模型的运动学仿真来完成这一任务。"
先进芯片中的存储器与可靠性
即便太阳能阵列与太阳保持同步,组件可以遮蔽热量,存储器依然脆弱。Puchner解释道:"电子设备处于封装屏蔽环境中,热力学挑战可以解决,并非大问题。但在太阳同步轨道飞行时,会进入极区,磁场将质子汇聚至脉冲区,辐射环境显著增强。许多公司声称已将英伟达设备送上太空,但至今没有成功运行的报告。发射容易,但能否正常工作是另一回事。"
尽管英伟达设备已经过辐射测试,极区存储器的表现仍是持续变量。Puchner指出:"关键部件是存储器,包括DRAM、DDR5、HBM以及NorFlash启动代码存储器,它们都容易受到辐射偏移影响。一旦被击中导致系统宕机,或击中频率过高无法正常计算,设备就毫无用处。在赤道附近500至600千米的常规轨道上,问题不大,SpaceX星链、亚马逊Leo等星座目前都能正常运行。但在太阳同步轨道上,情况可能截然不同。"
先进电子器件成本高昂,三重冗余意味着三倍成本。亚利桑那州立大学美国国防部ME Commons SWAP Hub极端环境可靠性研究负责人Hugh Barnaby表示:"如何以商用现货(COTS)技术应对单粒子翻转,是个现实挑战——使用采购自台积电或英特尔先进制程的处理器,这些处理器未经加固,现在需要进行辐射加固或至少提升耐受性。过去NASA和喷气推进实验室不在意这些,因为他们的系统并不复杂,对零部件数量需求有限。"
对于FinFET或GAA这类高端芯片,单颗价格从2万到10万美元甚至更高,数量有限时还可接受。但Barnaby强调:"如果要在太空建设大规模数据中心或计算中心,就需要大量采购和运输零部件。对于FinFET和GAA存储器中的单粒子翻转,目前唯一可靠的应对方式是三模冗余,成本极为高昂。"
降低在地球磁层中运行的稳健电子组件成本,才是真正的挑战所在。Barnaby表示:"SpaceX和高科技公司都在努力压低成本、承担风险,远不如NASA谨慎。目前为止还没有出现特别严重的太空故障,所以他们认为风险是值得的。"
迄今为止,SpaceX的大多数失败都发生在火箭发射阶段,这与其"快速失败、快速学习"的研发理念一脉相承。
近未来展望
轨道数据中心已以卫星附加计算的形式存在,用于在轨过滤和处理空间数据。而规模更大、类似地面数据中心、主要用于训练或推理供地面人类使用的AI模型的太空数据中心,目前尚未实现。
Rambus的Woo表示:"尽管太空计算在技术上确实可行,但经济性和可靠性挑战将使其在近期内难以成为主流。"
例如,据报道谷歌正就利用SpaceX发射太空数据中心进行洽谈,但亚马逊的杰夫·贝索斯认为埃隆·马斯克所说的两到三年时间表"有些过于激进"。
Puchner总结道:"大型机构希望在太空建设计算中心和数据中心,是因为不想受制于地球上的种种限制——法规、许可证和能源问题。地方电力公司还没准备好升级电网来支撑数据中心,而数据中心本身已经就绪,令人沮丧。AI在工作和日常生活中的预期增长持续攀升,需求和商业价值都在,只是推进太慢。因此,未来五年内,太空中将安装相当可观的计算能力。"
TI的Shenoy也表示,业界对此充满兴趣和投资热情:"从理论上看,太空计算解决了部分能源供应难题——在太阳同步轨道上可以充分利用太阳能,不受电力限制。但太空环境极为恶劣,所处轨道高度决定了辐射强度。这绝非易事,而且还没有考虑发射成本。如何维护太空中的计算能力,仍是开放性问题。地面数据中心可以热插拔更换故障设备,太空中如何高效且经济地实现同等维护能力,目前没有定论。"
太空制造或许是下一步。Barnaby表示:"在制造方面,有人提出要在太空中建立洁净室进行芯片制造。我给这个想法打个'存疑的也许'。优势在于低压真空环境有助于沉积等工艺,污染水平会更低。但物料运输、设备维修,加上辐射和温度的影响,都是现实挑战。设施规模需要足够大以容纳散热装置,电力需求也相当可观。"
Q&A
Q1:轨道数据中心与地面数据中心有什么本质区别?
A:轨道数据中心目前更接近功能强化的卫星或卫星星座,而非传统地面数据中心。它们主要作为卫星上的附加计算单元,用于过滤和处理空间数据。真正意义上用于训练或推理AI模型、供地面用户使用的大规模太空数据中心,目前尚未实现。核心挑战包括电力供应、散热、辐射环境下的可靠性以及高昂的发射和维护成本。
Q2:太空计算中心如何解决散热问题?
A:太空中无法使用空气对流冷却,主要依靠液体对流冷却替代。热量从芯片通过固体材料传导至热管或流体回路,再由大型散热板以红外辐射方式向太空散热。以100块英伟达GPU为例,需要约33平方米的太阳能板和16平方米的辐射散热板。提升芯片能效也是降低热量产生的重要手段,效率更高的芯片所需的散热设备也更少。
Q3:太空中的辐射环境对芯片存储器有哪些影响?
A:太阳同步轨道需飞经极区,该区域磁场最弱,质子通量高,辐射环境显著强于赤道附近轨道。DRAM、DDR5、HBM及NorFlash等存储器都容易受到辐射影响,发生单粒子翻转,导致系统宕机或计算错误。目前对FinFET和GAA芯片存储器中单粒子翻转最可靠的应对方式是三模冗余,但成本极高,是原来的三倍。
好文章,需要你的鼓励
机器人智能公司Inbolt将于2026年6月在芝加哥Automate展会上发布两项新能力:Inbolt机器人编程功能和扩展版机器人控制模块。新功能可让工程师直接基于CAD模型构建程序,结合视觉模型实时定位实体零件并自动调整运动路径,彻底消除传统调试中耗时数周的手动示教环节。此次更新还将原生支持安川机器人,使平台覆盖品牌扩展至六个。
这项来自新加坡科学技术研究局的研究提出了κ-SwiGLU,通过路由确信度动态调整专家门控灵敏度,在多种MoE模型上稳定提升性能,新增计算开销不足4%。
本文提供了一套完整的笔记本电脑深度清洁方案。硬件方面,介绍了如何用温和洗涤剂清洁机身、用微纤维布擦拭屏幕、用压缩空气清理键盘及清洁充电线的正确方法。软件方面,建议及时更新操作系统与驱动程序,删除冗余文件与临时下载内容,并通过开启Windows Storage Sense功能实现自动清理,同时将剩余文件整理归类,保持系统整洁高效运行。
研究系统揭示多智能体LLM工作流强化学习训练的成败规律:独立策略峰值更高但易崩溃,共享策略失败更隐蔽,根源在角色梯度动力学。