当下,AI几乎无处不在——无论是你打字时被数字"助手"不断打断,还是想买一台不需要联网的冰箱却发现难觅踪影。面对这股浪潮,你或许会忍不住发问:我们究竟是站在了一场技术飞跃的门槛上,还是只是在为一堆泡沫摇旗呐喊?
那么,AI在天气预报和气候建模领域日益广泛的应用,又该如何看待?
今年年初,一件事让这场讨论开局不利——美国国家气象局某办公室发布了一张预报地图,图上出现了几个莫名其妙的爱达荷州城市名称,比如"Whata Bod"和"Orangeotild"。好在这只是用于社交媒体的AI生成图片,并非真正的预报模型。气象学家和气候科学家目前还没有被大语言模型的提示词工程师所取代。
但AI确实已经以机器学习的形式进入了这些领域。研究人员对这些技术已有多年的深入研究,其优势与局限也相对清晰。值得注意的是,天气预报模型与气候模拟模型在AI技术的应用方式上有所不同,这背后自有其合理逻辑。
在这些模型中,"AI"指的就是机器学习。无需深入其众多技术变体的细节,其核心思路其实很简单:让计算机从数据中发现规律。
将数据拟合成一条趋势直线——即线性回归——是识别规律的最基础方法。当然,我们也可以用更复杂的曲线和方程来进行回归分析。机器学习真正的魅力(以及潜在的风险)在于:算法能够处理远比人工更高维度的复杂性,挖掘出那些我们凭直觉难以察觉的关联关系。
机器学习的起点是从零开始训练模型。首先为模型确定一个结构——比如神经网络——其中包含大量可独立调节的参数,用于精细控制算法行为。随后,模型会被输入海量带标注的样本数据,例如数千张按物种分类的鸟类照片。模型通过反复迭代,找到最优参数组合,从而将图像内容与正确的物种标签对应起来。
这其中存在一些显而易见的局限。这套算法无法识别训练数据中从未出现过的物种,也无法处理与训练样本差异过大的亚群体。训练数据的质量同样至关重要——如果我们只用松树上的山雀照片来训练模型,它可能会把松针也纳入"山雀特征"的定义之中。
此外,如果不投入大量额外工作,我们往往无法得知模型是如何得出结论的。其内部机制大多数时候都是一个"黑盒"。
不过,机器学习的优势也是实实在在的。机器学习算法往往能超越我们精心设计的人工算法——至少在计算效率上如此,有时在精度上也不例外。关键在于是否使用得当,一旦方法失当,其局限性便会暴露无遗。
在天气预报模型中,机器学习的应用方式与鸟类识别并无太大差异,只是模型所训练的是两组相邻时间点的气象数据。由于无需在每个地点求解大量物理方程,这类模型的运行速度远超传统气象模型。
谷歌、英伟达、华为、微软等多家公司已陆续开发出初代机器学习天气模型——有些还与独立学术机构合作完成——其预报效果可与现有模型相媲美。随着研究人员逐步摸清这些模型的优势与短板,多个主要天气预报中心也开始着手自主研发。
欧洲中期天气预报中心(ECMWF)于2025年2月正式投入使用其首个基于机器学习的模型,并与其长期运行的综合预报系统(IFS)并行运作。
这一名为AIFS的模型以再分析数据集为基础进行训练。所谓再分析数据集,是通过整合所有可用的气象观测数据,在缺乏实测的区域补全一幅物理上自洽的全球气象图景。这一关键工具极大简化了机器学习的任务:基于过去的气象快照,预测下一个时间节点(六小时后)的全球气象状态。
Q&A
Q1:机器学习在天气预报模型中是如何工作的?
A:天气预报中的机器学习模型,通过学习两组相邻时间点的气象数据来训练,使其能够预测下一个时间节点的天气状况。由于不需要在每个地点求解大量物理方程,这类模型运行速度远快于传统气象模型。目前谷歌、英伟达、华为、微软等公司均已开发出相关模型,欧洲中期天气预报中心也于2025年2月正式启用了自研的AIFS机器学习模型。
Q2:机器学习算法有哪些主要局限性?
A:机器学习算法存在几个明显局限:首先,模型无法识别训练数据中从未出现过的类别或差异过大的子群体;其次,训练数据的质量直接影响模型效果,偏差数据会导致错误的特征关联;此外,模型内部的决策机制通常是"黑盒",在不投入大量额外工作的情况下,很难解释模型为何给出某个特定结论。
Q3:ECMWF的AIFS模型是用什么数据训练的?
A:AIFS模型使用"再分析数据集"进行训练。再分析数据集是通过整合所有可用的气象观测数据,在没有实测数据的区域补全一幅物理上自洽的全球气象图景所构建的数据集。这种数据处理方式大大简化了机器学习的任务,让模型能够基于历史气象快照,有效预测六小时后的全球气象状态。
好文章,需要你的鼓励
英国政府在AI采纳峰会上宣布设立2亿英镑专项基金,旨在帮助企业提升AI技能并推广AI应用。资金将用于多项举措,包括为中小企业提供AI培训、设立AI采纳成长实验室、扩大Sparck AI奖学金计划等。思科、IBM、BT、劳斯莱斯等30余家企业参与其中。政府还与谷歌、微软、Anthropic及OpenAI签署联合声明,共同推动AI负责任发展,并设立"亲劳工AI采纳奖",表彰在提升生产力和员工技能方面表现突出的企业。
纽约大学推出PAINTBENCH测试体系,用像素级打分评估AI图像编辑的精确能力,发现最强模型在20类基础操作上也只得了17.1分,远未达到实用水准。
Anthropic首次将其最强AI模型向普通用户开放,但设有严格安全限制。Claude Fable 5在软件工程、知识工作和视觉任务方面表现突出,但在网络安全、生物、化学等高风险领域会自动屏蔽响应并回退至Claude Opus 4.8。该模型通过API和企业计划提供访问,定价为每百万输入令牌10美元、输出令牌50美元。Anthropic同时要求对所有流量保留30天数据,以防范新型越狱攻击。
清华大学提出Agent libOS,将操作系统的进程、能力和审计机制引入AI智能体运行时,将工具可见性与资源权限严格分离,让长期运行的AI智能体可被调度、授权、恢复和审计。