美国国家航空航天局(NASA)宣布,将于2026年9月提前八个月发射南希·格雷斯·罗曼太空望远镜。该望远镜在其服役期间预计将向天文学家传回多达20000太字节的数据。
这一数据量将叠加在詹姆斯·韦伯太空望远镜每日下传的57吉字节高清图像之上——韦伯望远镜自2021年起正式投入运行。与此同时,位于智利山区的薇拉·鲁宾天文台也将于今年晚些时候启动巡天观测,预计每晚采集20太字节的数据。
相比之下,曾经作为行业标杆的哈勃太空望远镜,每天仅能传回1至2吉字节的传感器数据。手动处理如此海量的数据早已成为历史,如今和其他各行各业面对大数据的机构一样,天文学家们也开始借助GPU来应对这一挑战。
加州大学圣克鲁兹分校天体物理学家布兰特·罗伯逊,长期参与上述多项太空任务的数据支持与使用工作,亲历了这一科学研究方式的深刻变革。过去15年间,他持续与英伟达合作,将GPU技术应用于宇宙探索领域,从早期模拟超新星爆炸理论,到如今开发用于处理最新天文台海量数据的分析工具。
"整个演进过程经历了从观测少量天体,到基于CPU对大规模数据集进行分析,再到对同类分析进行GPU加速的转变,"他在接受TechCrunch采访时表示。
罗伯逊与当时还是研究生的瑞安·豪森共同开发了一款名为Morpheus的深度学习模型,能够自动扫描大规模数据集并识别其中的星系。他们基于韦伯望远镜数据进行的早期AI分析,发现了出乎意料数量的特定类型盘状星系,为宇宙演化理论增添了新的研究维度。
如今,Morpheus正随着技术发展不断迭代升级:罗伯逊正将其底层架构从卷积神经网络切换至支撑大语言模型崛起的Transformer架构。升级后,该模型的分析覆盖范围将扩大数倍,显著提升处理效率。
此外,罗伯逊还在研究基于太空望远镜数据训练的生成式AI模型,旨在提升地面望远镜观测图像的质量——由于地球大气层的干扰,地面观测数据往往存在一定程度的失真。尽管火箭技术持续进步,将一块直径8米的镜面送入轨道依然极为困难,因此借助软件手段来改善鲁宾天文台的观测质量,成为目前最为可行的替代方案。
然而,罗伯逊也切实感受到了全球GPU资源争夺所带来的压力。他通过美国国家科学基金会(NSF)在加州大学圣克鲁兹分校搭建了一套GPU集群,但随着越来越多的研究人员希望将计算密集型技术应用于各自的研究,这套集群正在加速过时。更令人担忧的是,特朗普政府在最新预算提案中提出将NSF的预算削减50%。
"大家都想做AI和机器学习分析,而GPU正是实现这一目标的关键所在,"罗伯逊说,"你必须具备创业精神……尤其是当你处于技术前沿的时候。大学机构普遍风险厌恶,因为资源本就有限,所以你必须主动出击,向他们证明:'这就是我们这个领域未来的发展方向。'"
Q&A
Q1:Morpheus模型是什么?它在天文研究中有什么作用?
A:Morpheus是由布兰特·罗伯逊与瑞安·豪森共同开发的深度学习模型,专门用于扫描大规模天文数据集并自动识别星系。基于詹姆斯·韦伯太空望远镜的数据,Morpheus已成功识别出数量超出预期的特定类型盘状星系,为宇宙演化理论提供了新的研究依据。目前,该模型正将底层架构从卷积神经网络升级为Transformer,升级后分析覆盖范围将扩大数倍。
Q2:生成式AI如何改善地面望远镜的观测质量?
A:由于地球大气层对光线的干扰,地面望远镜采集的图像往往存在失真问题。罗伯逊正在研究基于太空望远镜数据训练的生成式AI模型,通过软件算法对地面观测数据进行修正和增强,从而提升图像清晰度和科学价值,弥补无法将大口径镜面送入轨道的技术局限。
Q3:天文学研究面临的GPU资源短缺问题有多严重?
A:随着詹姆斯·韦伯、鲁宾天文台等新一代观测设备产生海量数据,越来越多的研究人员需要使用GPU进行计算密集型的AI和机器学习分析,导致资源竞争日趋激烈。加州大学圣克鲁兹分校现有的GPU集群已逐渐过时,而特朗普政府提议将美国国家科学基金会预算削减50%,进一步加剧了科研计算资源的紧张局面。
好文章,需要你的鼓励
企业AI搜索公司Glean宣布年度经常性收入(ARR)达3亿美元,较15个月前的1亿美元增长三倍。尽管谷歌、微软、OpenAI等科技巨头纷纷入局企业AI搜索市场,Glean凭借"上下文图谱"技术深度理解企业业务需求,并帮助客户显著降低AI计算成本。该公司提供按用量计费和混合定价两种模式,客户涵盖Databricks、Reddit、Pinterest及三星等企业。Glean上轮融资后估值达72亿美元。
香港中文大学与MiniMax提出ClaimDiff-RL框架,将图像描述的AI训练从整体打分升级为逐条核查,有效解决了传统方式导致AI"少说保平安"的问题,同时在多项基准测试上超越Gemini-3-Pro-Preview。
杰夫·贝索斯旗下的蓝色起源公司在佛罗里达卡纳维拉尔角进行静态点火测试时,新格伦重型火箭发生爆炸。这是美国历史上最大规模的火箭爆炸之一,也是蓝色起源公司遭遇的最严重失败。所有人员安全,但该事故可能导致新格伦火箭项目长期暂停。此前该火箭已成功完成三次发射,并实现了助推器回收和重复使用。
ParaVT是一个由南洋理工等多校联合提出的并行视频工具调用框架,通过让AI同时分析多段视频并引入PARA-GRPO算法解决训练中的格式崩溃与工具跳过问题,在六项长视频理解测试中平均提升约7.9%。