洪水是全球最具破坏性的自然灾害之一,往往来袭突然,造成长期损失。多年来,谷歌研究院持续构建先进的AI模型,以提升洪水预报的精准度,确保这一技术能够及时触达一线应急响应人员,为其争取更多反应时间。为进一步保护脆弱社区,谷歌现已在GitHub上开源其水文建模框架,供全球开发者使用和拓展。
开源框架的核心功能
此次开源的建模框架,允许研究人员和预报人员使用与谷歌洪水预警平台(Flood Hub)相同的模型架构及类似训练数据,来训练AI洪水预报模型。该框架专为水文科学家设计,支持在谷歌研究成果基础上新增和测试模型、数据与方法。此外,负责特定区域洪水预警的业务预报人员,也可将本地数据和专业经验融入这套基于AI的先进预报体系。
谷歌认为,科学突破只有当它赋能他人去复现和延伸研究成果时,才能真正发挥出全部潜力,从而使创新成为推动全球进步的催化剂。为此,谷歌在内部开发了该框架,并与捷克水文气象研究所(CHMI)等合作伙伴共同完成测试。此次开源模型架构与训练流程,标志着全球洪水防灾准备工作迈入新阶段——各国气象和水文服务机构(NMHSs)及其他相关部门,可在完全掌控本地数据的同时,充分利用本地专业知识对模型进行精细化调优。
技术架构详解
谷歌的水文模型是一个Python软件包,基于开源机器学习框架PyTorch构建,实现了驱动Flood Hub的河流预报模型。这些模型将气候、土壤、地形、土地覆盖等地理特征,以及降水、气温等气象预报数据作为输入,预测全球各地河流的日流量。
该水文建模包采用基于长短期记忆网络(LSTM)的模型架构,并配备完整的训练流程,支持使用开源Caravan数据集中的历史河流数据进行训练。研究人员和洪水预报机构还可向该开源数据库补充自有数据,以针对本地流域进行模型训练或微调。
如需上手使用,可参考配套的Python交互式教程笔记本,以及YouTube上的视频教程。
新旧模型双版本并行
此次代码库包含两个版本的水文模型:一是2024年发表的基准测试研究中所用的原始版本;二是目前驱动Flood Hub实时全球洪水预报的升级版本。新版模型在前期研究基础上进行了架构升级,能够将多源、多类型气象输入整合至统一的洪水预测系统中。最新基准测试显示,新模型在已布设水文站的流域中,可靠预报时效延长了6天;在未布设水文站的流域中,也延长了1天。
新版v2模型采用ME-LSTM架构,将不同来源的气象数据整合为统一的洪水预测结果。每类气象数据由独立网络进行嵌入处理,输出结果汇入LSTM网络后,生成河流流量的概率分布。系统集成了多种全球气象产品,包括:GraphCast(GC)、欧洲中期天气预报中心(IFS)、NASA卫星降雨估算(IMERG),以及美国国家海洋和大气管理局气候预测中心的基于站点的日降水数据(CPC)。
推动早期预警系统的全球普及
世界气象组织在2025年《全球多灾种早期预警系统现状》报告中指出,本地数据与原住民及地方知识(ILK)是有效灾害预警的关键组成部分,并特别提到"将ILK系统性融入风险知识体系仍属例外,而非常态"。谷歌此次开源的洪水预报工作流,正是对这一发现的积极回应——它让区域预报人员能够直接、亲手掌控基于AI的预报模型。这些框架训练成本相对低廉、上手门槛不高,在无需依赖复杂传统水文预报模型的前提下,实现了较高精度,同时支持用户导入自有专业数据进行训练与预测。
易于采用的开源工具,对于弥合技术创新与洪水灾害系统实际效能之间的差距至关重要,尤其有助于加速早期预警系统相关能力的建设。
与捷克水文气象研究所的合作实践
此次开源成果的实际应用潜力,在与CHMI的合作中得到了充分验证。双方合作有效证明了谷歌的AI模型可提供与传统本地校准概念模型相当的预报质量。CHMI还专门开发了一个适配器,将该水文开源框架集成至Delft-FEWS平台——这是一款被各国及地方洪水预报机构、非政府组织和私营企业广泛使用的业务化洪水预报工具,由荷兰三角洲研究所(Deltares)负责运营和维护。这一集成方案,为全球各地水文服务机构将机器学习纳入日常水资源管理工作流程,提供了可复制的参考范本。
对于资源有限的地区和小型本地团队而言,此次开源模型的发布同样意义重大——它提供了一个可扩展、可访问的工具,使其无需投入高昂的传统预报基础设施,即可获取高质量的洪水预测能力,真正实现了先进预报技术的普惠化。
世界气象组织水文模型与预报部门负责人金惠琳博士对此表示欢迎:"开源水文建模工具的不断丰富,对于支持社会管理水资源、应对环境挑战至关重要。世界气象组织积极支持开源、可互操作、由各成员主导的模型与工具,希望这些工具能够帮助拯救生命,推动全球使命——让每个社区都能提前获得灾害预警,保护人民的生命与生计。"
开放获取方式
该模型架构、完整文档及培训材料现已在GitHub上以Apache 2.0许可证正式发布,研究人员和业务预报专业人员均可免费访问使用。
谷歌相信,将水文模型交到全球水文学界手中,将帮助人类共同构建一个更能抵御洪水风险的世界。关于谷歌更广泛洪水预报项目的详细信息,可访问谷歌研究院官网查阅。谷歌诚邀全球水文学界共同基于这些开源工具持续创新。
Q&A
Q1:谷歌开源的水文建模框架具体能做什么?
A:该框架是一个基于PyTorch构建的Python软件包,支持研究人员和预报机构使用与谷歌Flood Hub相同的模型架构训练AI洪水预报模型。它能整合气候、土壤、地形等地理特征和气象预报数据,预测全球河流日流量。同时支持本地数据导入,方便各国气象机构结合本地知识进行模型微调,适配自身流域特点。
Q2:新版v2水文模型相比旧版有哪些提升?
A:新版v2模型采用ME-LSTM架构,能够将GraphCast、ECMWF IFS、NASA IMERG等多源气象数据整合为统一的洪水预测系统。与2024年发布的原始版本相比,新模型在已布设水文站的流域中可靠预报时效延长了6天,在未布设水文站的流域中延长了1天,显著提升了全球洪水预报的时效性和覆盖范围。
Q3:资源有限的地区或小型机构如何使用谷歌的洪水预报框架?
A:该框架专门考虑了可及性,训练成本低、上手门槛不高,无需依赖复杂昂贵的传统水文预报基础设施。机构可通过GitHub免费获取完整代码、文档和培训材料,并可参考Python交互式教程和YouTube视频教程快速上手,还可利用开源Caravan数据集或补充自有本地数据进行模型训练。
好文章,需要你的鼓励
牛津大学提出PHYSIFORMER,一种扩散变换器模型,通过三维网格顶点轨迹直接在世界坐标空间预测刚性与弹性物体的物理运动,一次性生成全序列轨迹,超越自回归基线。
随着医疗数据数字化与互操作性的进步,跨机构纵向患者数据的研究应用成为可能。本研究通过对20位领域专家的访谈,识别出8种数据收集方法,涵盖智能手机应用、结构化数据导出、区域/全国研究查询及聚合数据源等。研究发现,各方法均有其优缺点,无单一最优方案。参与者中介交换方式可绕过复杂治理安排,但存在数据缺口;全国性网络尚不支持研究查询。公共政策的持续推进将对该领域发展起关键作用。
研究发现主流奖励模型对同等质量答案给出差异悬殊的分数,并提出"奖励聚类"算法通过蒙特卡洛随机失活将连续分数离散化,在不重训模型的前提下有效减少AI训练中的奖励作弊现象。