当下,AI几乎无处不在——无论是你打字时被数字"助手"不断打断,还是想买一台不需要联网的冰箱却发现难觅踪影。面对这股浪潮,你或许会忍不住发问:我们究竟是站在了一场技术飞跃的门槛上,还是只是在为一堆泡沫摇旗呐喊?
那么,AI在天气预报和气候建模领域日益广泛的应用,又该如何看待?
今年年初,一件事让这场讨论开局不利——美国国家气象局某办公室发布了一张预报地图,图上出现了几个莫名其妙的爱达荷州城市名称,比如"Whata Bod"和"Orangeotild"。好在这只是用于社交媒体的AI生成图片,并非真正的预报模型。气象学家和气候科学家目前还没有被大语言模型的提示词工程师所取代。
但AI确实已经以机器学习的形式进入了这些领域。研究人员对这些技术已有多年的深入研究,其优势与局限也相对清晰。值得注意的是,天气预报模型与气候模拟模型在AI技术的应用方式上有所不同,这背后自有其合理逻辑。
在这些模型中,"AI"指的就是机器学习。无需深入其众多技术变体的细节,其核心思路其实很简单:让计算机从数据中发现规律。
将数据拟合成一条趋势直线——即线性回归——是识别规律的最基础方法。当然,我们也可以用更复杂的曲线和方程来进行回归分析。机器学习真正的魅力(以及潜在的风险)在于:算法能够处理远比人工更高维度的复杂性,挖掘出那些我们凭直觉难以察觉的关联关系。
机器学习的起点是从零开始训练模型。首先为模型确定一个结构——比如神经网络——其中包含大量可独立调节的参数,用于精细控制算法行为。随后,模型会被输入海量带标注的样本数据,例如数千张按物种分类的鸟类照片。模型通过反复迭代,找到最优参数组合,从而将图像内容与正确的物种标签对应起来。
这其中存在一些显而易见的局限。这套算法无法识别训练数据中从未出现过的物种,也无法处理与训练样本差异过大的亚群体。训练数据的质量同样至关重要——如果我们只用松树上的山雀照片来训练模型,它可能会把松针也纳入"山雀特征"的定义之中。
此外,如果不投入大量额外工作,我们往往无法得知模型是如何得出结论的。其内部机制大多数时候都是一个"黑盒"。
不过,机器学习的优势也是实实在在的。机器学习算法往往能超越我们精心设计的人工算法——至少在计算效率上如此,有时在精度上也不例外。关键在于是否使用得当,一旦方法失当,其局限性便会暴露无遗。
在天气预报模型中,机器学习的应用方式与鸟类识别并无太大差异,只是模型所训练的是两组相邻时间点的气象数据。由于无需在每个地点求解大量物理方程,这类模型的运行速度远超传统气象模型。
谷歌、英伟达、华为、微软等多家公司已陆续开发出初代机器学习天气模型——有些还与独立学术机构合作完成——其预报效果可与现有模型相媲美。随着研究人员逐步摸清这些模型的优势与短板,多个主要天气预报中心也开始着手自主研发。
欧洲中期天气预报中心(ECMWF)于2025年2月正式投入使用其首个基于机器学习的模型,并与其长期运行的综合预报系统(IFS)并行运作。
这一名为AIFS的模型以再分析数据集为基础进行训练。所谓再分析数据集,是通过整合所有可用的气象观测数据,在缺乏实测的区域补全一幅物理上自洽的全球气象图景。这一关键工具极大简化了机器学习的任务:基于过去的气象快照,预测下一个时间节点(六小时后)的全球气象状态。
Q&A
Q1:机器学习在天气预报模型中是如何工作的?
A:天气预报中的机器学习模型,通过学习两组相邻时间点的气象数据来训练,使其能够预测下一个时间节点的天气状况。由于不需要在每个地点求解大量物理方程,这类模型运行速度远快于传统气象模型。目前谷歌、英伟达、华为、微软等公司均已开发出相关模型,欧洲中期天气预报中心也于2025年2月正式启用了自研的AIFS机器学习模型。
Q2:机器学习算法有哪些主要局限性?
A:机器学习算法存在几个明显局限:首先,模型无法识别训练数据中从未出现过的类别或差异过大的子群体;其次,训练数据的质量直接影响模型效果,偏差数据会导致错误的特征关联;此外,模型内部的决策机制通常是"黑盒",在不投入大量额外工作的情况下,很难解释模型为何给出某个特定结论。
Q3:ECMWF的AIFS模型是用什么数据训练的?
A:AIFS模型使用"再分析数据集"进行训练。再分析数据集是通过整合所有可用的气象观测数据,在没有实测数据的区域补全一幅物理上自洽的全球气象图景所构建的数据集。这种数据处理方式大大简化了机器学习的任务,让模型能够基于历史气象快照,有效预测六小时后的全球气象状态。
好文章,需要你的鼓励
美国连锁超市巨头Albertsons正在基于Databricks构建商品智能平台,整合产品、定价、促销与陈列等决策功能,目标是在2026年底前全面向门店运营商落地。该平台以Databricks Lakehouse存储零售数据,通过Unity Catalog与AI Gateway实现数据治理,并借助AI智能体Genie支持自然语言查询,帮助商家洞察销售趋势,提升决策效率。此举是Albertsons今年四项AI核心战略投资之一。
阿里Qwen团队通过引入强化学习和在线策略蒸馏,将Qwen-Image-2.0升级为Qwen-Image-2.0-RL,让图像生成模型真正学会人类审美,文生图Elo评分提升78分,图像编辑提升93分。
微软正将Windows 11打造成真正的AI操作系统。在Build大会上,微软展示了AI模型与智能代理如何深度融合进Windows 11,让用户通过自然语言完成系统操作。借助Windows ML框架,超过5亿台PC已可在本地离线运行AI任务,无需联网、无token费用、数据不离设备。Office、Photos、Teams等应用已支持本地AI能力,Adobe、WhatsApp、Canva等第三方也在积极跟进,企业级AI PC采购需求有望加速。
港科大与快手联合提出NormGuard,针对流匹配模型强化学习训练中速度范数膨胀问题,通过训练时单向惩罚约束,在保留奖励的同时改善图像真实感。