除极少数例外,大规模天气预报一直是拥有大型超级计算机的政府机构的专属领域。但这种情况正在发生变化。
英伟达今日发布了两个开源天气预报模型:Earth-2中期预报模型和Earth-2临近预报模型。此外,还推出了一个能显著加速这些模型初始条件生成的工具。
英伟达气候模拟总监迈克·普里查德告诉记者:"天气预报的重要性怎么强调都不为过。气候变化导致的极端天气恶化正在影响我们所有人和现代生活的方方面面。预报影响着我们每个人,能够推动农业、能源、航空和应急响应的改善,但预报科学正在发生变化。"
普里查德认为,AI已经在天气预报领域引发了"科学革命",但研究人员一直难以将这项工作从实验室转化为实际解决方案。"我们需要降低准入门槛,让开发者能够在开放环境中构建工具。"
这并非英伟达首次涉足天气预报业务。作为构建地球数字孪生计划Earth-2的一部分,该公司此前已发布了两个其他模型。第一个是Earth-2 CoreDiff,该模型能将大陆尺度预测降尺度到高分辨率局部预测,速度比传统方法快500倍。第二个是Earth-2 FourCastNet3,这是一个高效的全球预报模型,可以在单个英伟达H100 GPU上运行。
准确的预报不仅仅是决定是否带伞的问题。这些模型是航空公司、保险公司、能源供应商和农业的关键基础设施。
Transformer架构的应用
以往的模型和大多数其他现有的基于AI的预报模型都使用专门的模型架构,不采用现在大语言模型的默认Transformer方法。对于新的中期预报和临近预报模型,英伟达采用了完全相同的Transformer架构。毕竟,基于Transformer的架构得到了几乎所有其他AI公司的性能和工程工具支持。
普里查德表示:"从哲学和科学角度来看,这是对简单性的回归。我们正在摆脱手工定制的小众AI架构,转向简单、可扩展的Transformer架构的未来。"
中期预报模型的性能表现
顾名思义,中期预报模型旨在提供未来15天的高精度预报。
英伟达尚未向媒体提供详细的基准测试结果,但普里查德声称,中期预报模型在"超过70个天气变量"(包括温度、压力和湿度)方面优于DeepMind的GenCast(该领域当前的领导者)。
临近预报模型可能更加有趣:它能以公里级分辨率生成国家尺度的预报——对任何现代模型来说都是非常高的分辨率。为欧洲或北美天气预报提供信息的大多数模型分辨率为2公里或更高,而美国国家海洋和大气管理局的GFS模型(免费提供,通常是免费天气应用的默认选择)分辨率为13公里(尽管NOAA最近也开始实施AI预报)。
以色列气象局计划使用临近预报模型,今后每天生成多达8次高分辨率预报。该组织已经在使用英伟达较早的CoreDiff模型。同样,Weather Company(weather.com背后的公司)计划将临近预报用于本地化恶劣天气应用。
模型的计算需求
中期预报模型有几个变体,参数从24亿到33亿不等,训练在32个80GB A100/H100 GPU上完成。但要运行该模型,只需要26GB GPU内存,A100 GPU就能运行覆盖6或12小时的单时间步预测。根据不同模型,GenCast模型只需140秒,另外两个中期预报变体(称为Atlas-SI和Atlas EDM)需要94秒和88秒,Atlas-CRPS模型(具有额外噪声调节功能,参数略大,为33亿)需要不到4秒。
对于临近预报模型,每个6公里分辨率模型只需要5GB GPU内存,在单个H100 GPU上以最高精度运行需33秒。英伟达发言人告诉我们:"我们预计通过蒸馏和/或降低精度等技术,推理速度将大大加快。"
数据同化的重要性
对于天气预报,模型开始生成预报的起始数据至关重要。这可能包括卫星图像、雷达数据、气象气球、飞机和浮标的传感器数据。所有这些数据都需要标准化和转换,以便模型能够处理。
气候科学家称这个过程为"数据同化"。为了加速这个长达数小时的过程,英伟达还推出了全球数据同化模型,能在几秒钟内生成全球天气的初始快照。
普里查德说:"虽然AI社区和研究社区在过去五年里非常关注预测模型,但这个数据同化任务、这个状态估计任务在很大程度上仍未被AI解决,但它消耗了传统天气预报大约50%的超级计算负载。"
同化模型实际上相当小,只有3.3亿参数。使用一个H100 GPU,它可以在不到一秒的时间内运行完整的推理流水线,同时使用少于20GB的GPU内存。
即使这些高效模型也不太可能让爱好者很快开始创建自己的预报。毕竟,简单地获取和管理起始数据就是一个重大的数据问题。但对于有合适用例和资源的企业来说,这可能会为创建本地预报打开大门,而无需访问超级计算集群。
Q&A
Q1:英伟达发布的Earth-2天气预报模型有什么特点?
A:英伟达发布了两个开源天气预报模型:Earth-2中期预报模型和Earth-2临近预报模型。这些模型采用了与大语言模型相同的Transformer架构,摆脱了手工定制的小众AI架构。中期预报模型可提供未来15天的高精度预报,而临近预报模型能以公里级分辨率生成国家尺度的预报。
Q2:这些AI天气预报模型对计算资源的要求高吗?
A:相比传统超级计算机,这些模型的计算需求大大降低。中期预报模型只需要26GB GPU内存,A100 GPU就能运行预测。临近预报模型更轻量,每个6公里分辨率模型只需要5GB GPU内存,在单个H100 GPU上运行需33秒。数据同化模型只有3.3亿参数,使用不到20GB GPU内存就能在一秒内完成推理。
Q3:AI天气预报模型相比传统方法有什么优势?
A:AI天气预报模型在多个方面优于传统方法。英伟达的CoreDiff模型将大陆尺度预测降尺度到高分辨率局部预测的速度比传统方法快500倍。新的中期预报模型在超过70个天气变量方面优于当前领先的DeepMind GenCast模型。同时,AI模型能够显著降低对超级计算机的依赖,让更多机构能够进行高质量天气预报。
好文章,需要你的鼓励
企业AI搜索公司Glean宣布年度经常性收入(ARR)达3亿美元,较15个月前的1亿美元增长三倍。尽管谷歌、微软、OpenAI等科技巨头纷纷入局企业AI搜索市场,Glean凭借"上下文图谱"技术深度理解企业业务需求,并帮助客户显著降低AI计算成本。该公司提供按用量计费和混合定价两种模式,客户涵盖Databricks、Reddit、Pinterest及三星等企业。Glean上轮融资后估值达72亿美元。
香港中文大学与MiniMax提出ClaimDiff-RL框架,将图像描述的AI训练从整体打分升级为逐条核查,有效解决了传统方式导致AI"少说保平安"的问题,同时在多项基准测试上超越Gemini-3-Pro-Preview。
杰夫·贝索斯旗下的蓝色起源公司在佛罗里达卡纳维拉尔角进行静态点火测试时,新格伦重型火箭发生爆炸。这是美国历史上最大规模的火箭爆炸之一,也是蓝色起源公司遭遇的最严重失败。所有人员安全,但该事故可能导致新格伦火箭项目长期暂停。此前该火箭已成功完成三次发射,并实现了助推器回收和重复使用。
ParaVT是一个由南洋理工等多校联合提出的并行视频工具调用框架,通过让AI同时分析多段视频并引入PARA-GRPO算法解决训练中的格式崩溃与工具跳过问题,在六项长视频理解测试中平均提升约7.9%。