宇宙中的星系数量远超任何人的预期,而且它们似乎在一夜之间全部涌现出来。
2022年,詹姆斯·韦伯太空望远镜(JWST)传回首批图像时,布兰特·罗伯逊与他的同事们做了天文学家一贯会做的事:凝视星空,试图理解眼前所见。只不过这一次,映入眼帘的"星空"是以TB为单位计量的海量数据。
"星系无处不在,"罗伯逊回忆道,"数量之多、距离之远,令我们真的感到震惊。"
罗伯逊是加州大学圣克鲁兹分校的天文学与天体物理学教授,他带领的研究团队专注于探索宇宙大爆炸后最早期星系的形成过程。
这正是"春季天文日"活动所致力推广的科学方向。得益于他的团队公开发布的数据集,任何有意在今年这一天参与探索的人,都能以几年前无法企及的深度去了解宇宙的早期面貌。
过去数年间,他的团队曾多次打破"已知最遥远星系"的记录,每一次突破都将人类的观测视野推向更接近宇宙初始之光的边界。
若没有如此规模的计算能力支撑,这些数据将只会不断堆积,无从处理。
观测的局限,需要依靠计算来弥补。当年哥白尼用数学解决了观测中的矛盾,如今罗伯逊用的是计算模型。
詹姆斯·韦伯太空望远镜是有史以来发射升空的最强大天文观测设备,能够捕捉红外光,接收那些历经逾130亿年漫长旅程才抵达地球的光线。每一张深场图像中密布着数十万个星系,其中一些已有130亿年的历史。
数据的丰富,恰恰成为了最大的难题。
"这些数据集规模庞大、结构复杂,根本无法靠人工逐一分析,"罗伯逊表示,"即便是专家团队,完成现在几天内就需要完成的工作,也可能需要耗费数年时间。"
Q&A
Q1:詹姆斯·韦伯太空望远镜观测到的星系数据有多大?
A:詹姆斯·韦伯太空望远镜传回的数据量以TB为单位,每一张深场图像中密布着数十万个星系,部分星系距今已有逾130亿年历史。数据规模如此庞大,即便是专家团队也无法通过人工方式完成分析,必须借助大规模计算能力才能在合理时间内处理完毕。
Q2:罗伯逊团队在早期星系研究方面取得了哪些成果?
A:布兰特·罗伯逊带领的团队过去数年间多次打破"已知最遥远星系"的记录,每次突破都将人类的观测极限推向更接近宇宙诞生初期的位置。此外,该团队还将相关数据集公开发布,供公众和研究人员自由探索宇宙早期面貌。
Q3:为什么分析詹姆斯·韦伯太空望远镜的数据需要用到大规模计算?
A:詹姆斯·韦伯太空望远镜产生的数据规模极大、结构极为复杂,人工分析根本无法跟上数据产出的速度。据罗伯逊表示,若依靠专家团队手动处理,完成目前几天内必须完成的任务可能需要数年时间,因此高性能计算是处理这些天文数据不可或缺的工具。
好文章,需要你的鼓励
超过140家金融、支付及科技公司,包括Visa、Stripe和贝莱德,联合支持推出名为Open USD(OUSD)的新稳定币,直接挑战市场领导者Tether和Circle。OUSD由独立机构Open Standard LLC运营,主打零费用、无限额铸造与赎回,且储备收益大部分归合作伙伴所有,而非由发行方独占。Mastercard、美国运通、谷歌、Shopify、Coinbase等巨头均已加入。Circle股价在消息公布后下跌约13%。
这项研究系统比较了四种AI图像分词策略在640000张星系图像上的表现,发现重建质量与物理属性预测能力之间存在根本性解耦,为天文基础模型的分词器选择提供了实验依据。
Anthropic正式推出中端大语言模型Claude Sonnet 5,其编程能力在SWE-Bench Pro和Terminal-Bench 2.1两项基准测试中分别提升5.1%和13.4%。该模型具备更强自主性,能主动核查输出结果,并在抵御恶意请求和提示注入攻击方面表现更优。Sonnet 5将成为Claude免费版和Pro版的默认模型,定价为每百万输入token 3美元。此外,此前因美国出口管制而暂停推出的Mythos 5和Fable 5模型,管制已解除,将于近期恢复访问。
阿里Qwen团队研究如何将大模型的规模化训练思路迁移到机器人操作领域,通过统一多机器人表示与38100小时数据预训练,让机器人在陌生场景和陌生机型上也能完成复杂操作任务。