ArchesWeatherGen：基于流匹配扩散模型的概率天气预报新范式

首页今日动态人才市场新技术专栏中国科学人云展台
BioHot
云讲堂直播会展中心特价专栏技术快讯免费试用

生物通官微
陪你抓住生命科技
跳动的脉搏

生物通首页 > 今日动态 > 正文

《SCIENCE ADVANCES》：ArchesWeatherGen: Skillful and compute-efficient probabilistic weather forecasting with machine learning

【字体：大中小】 时间：2026年04月24日 来源：SCIENCE ADVANCES 12.5

编辑推荐：

　　为解决确定性AI模型平滑化严重、无法表征极端天气及初始条件不确定性的问题，研究人员开展了基于流匹配（Flow Matching）的概率天气预报研究。他们提出ArchesWeatherGen模型，在WeatherBench指标上超越IFS ENS和NeuralGCM，且训练成本降低约20倍，推动了生成式模型在气象领域的民主化应用。

天气AI的“想象力”革命：当扩散模型教会机器“画”出暴雨与台风

曾几何时，天气预报的“水晶球”掌握在复杂的物理方程手中。如今，人工智能（AI）正掀起一场静默的革命：只需输入当前的大气状态，深度学习模型就能像下棋一样，一步步推演出未来的天气。Pangu-Weather、GraphCast等模型在精度和速度上已开始超越传统的数值天气预报（NWP）。然而，这些“天才少年”有一个致命的弱点——它们太“乖”了。

确定性模型的“平滑”诅咒

目前的AI气象模型大多是确定性模型。它们训练的目标是尽可能准确地预测下一个时刻的大气状态（如温度、风速），追求的是最小化均方根误差（RMSE）。这导致了一个严重的问题：模型输出的天气图过于平滑，缺乏真实大气中应有的“纹理”和“噪点”。

这种平滑化在物理上是失真的。真实的天气系统是混沌的，微小的初始扰动可能导致截然不同的结果（即“蝴蝶效应”）。确定性模型给出的只是一个“最可能”的平均解，它无法描绘出暴雨、台风等极端事件的狰狞面目，也无法覆盖因初始条件不确定性带来的各种可能路径。对于依赖概率决策的能源、农业和应急部门来说，一个没有“误差棒”的预报，参考价值大打折扣。

从“猜数字”到“画分布”：生成式AI的入场

为了解决这个问题，研究者将目光投向了生成式模型。如果说确定性模型是在“猜下一个具体的数字”，那么生成式模型就是在“学习画出整个概率分布”。它不再只输出一个值，而是生成一堆可能的天气场景（集合预报），告诉我们“台风有多大可能登陆A地，又有多大可能转向B地”。

在各类生成式模型中，扩散模型（Diffusion Models） 因其在图像生成领域的巨大成功而备受青睐。其核心思想是“去噪”：先给一张清晰的天气图加噪声变成一团混沌，然后训练神经网络学会把这个混沌一步步还原成清晰的天气图。在推理时，从随机噪声出发，利用训练好的模型反复“去噪”，就能“画”出一张全新的、但物理上合理的天气图。

ArchesWeatherGen的破局之道

本文提出的ArchesWeatherGen模型，正是这一思路的集大成者。它没有从零开始“画”天气，而是巧妙地采用了残差学习策略：

1.
先学“骨架”，再学“细节”：首先训练一个高效的确定性模型ArchesWeather（骨架），让它学会预测天气变化的“主旋律”（均值）。
2.
专攻“残差”：用真实数据（ERA5）减去确定性模型的预测值，得到“残差”（即模型学不会的随机波动和细节）。
3.
生成“灵魂”：使用流匹配（Flow Matching）——一种比传统扩散模型更高效、性能更好的生成技术，专门学习这些残差的分布。

这样一来，ArchesWeatherGen既能保证大尺度天气形势的准确性（继承自确定性骨架），又能通过生成式“画笔”添加上逼真的细节和不确定性（极端天气、小尺度涡旋），完美解决了平滑化问题。

低成本的“学术级”超算预报

除了性能优异，该研究的另一大贡献是计算效率的民主化。像GraphCast、Pangu-Weather这样的庞然大物，训练需要数千张顶级GPU（图形处理器）跑上好几个月，是普通科研机构无法承受的“奢侈品”。

而ArchesWeatherGen仅需约45个V100 GPU天（其中大部分用于预训练确定性模型），就能完成训练。它证明了无需“暴力堆算力”，通过精巧的算法设计（如全局交叉层注意力CLA），同样能在1.5°分辨率下取得与顶级模型媲美的成绩。这为更多高校和研究所打开了高性能气象AI研究的大门。

关键技术与方法

本研究主要依托以下技术路线：

1.
数据基础：使用ECMWF的ERA5再分析数据作为训练集和验证基准。
2.
两阶段架构：第一阶段训练确定性模型ArchesWeather（基于改进的Swin Transformer架构，引入全局交叉层注意力CLA）；第二阶段基于确定性模型的预测残差，训练基于流匹配（Flow Matching） 的概率生成模型ArchesWeatherGen。
3.
评估体系：在WeatherBench 2基准上，使用RMSE（均方根误差）、CRPS（连续分级概率评分）和Brier Score等指标，与IFS HRES、IFS ENS、NeuralGCM等模型进行对比。

研究结果

1. 确定性模型（ArchesWeather）的高性价比优势

在24小时预报的对比中，ArchesWeather展现出了惊人的效率。在1.5°的较粗分辨率下，其训练成本仅为9-18个V100 GPU天，比分辨率相近的SphericalCNN模型低了40倍，但RMSE指标却全面优于后者。一个由4个模型简单平均得到的ArchesWeather-Mx4版本，其表现甚至能与由50个成员组成的NeuralGCM集合预报相媲美，且在部分变量上接近了0.25°高分辨率模型（如Pangu-Weather）的水平。这表明其设计的CLA层有效提升了特征提取能力，用极小的计算代价换取了高性能。

2. 概率模型（ArchesWeatherGen）的全面超越

ArchesWeatherGen在3-10天的中期预报中展现了生成式模型的威力。在衡量概率预报质量的fCRPS（公平连续分级概率评分）指标上，它显著优于ECMWF的官方集合预报系统（IFS ENS）和混合物理-AI模型NeuralGCM。特别是在温度（T850）、湿度（Q700）和风场（U850/V850）等关键变量上，其概率分布的刻画更为精准。唯一的例外是位势高度（Z500），NeuralGCM因其内置的物理动力核心而在该传统强项上保持微弱优势。

3. 计算资源的断崖式下降

研究给出了直观的成本对比：训练一个完整的ArchesWeatherGen系统（包括底座的确定性模型）仅需约45个V100 GPU天，这比同类型的概率预报模型（如GenCast）节省了约20倍的计算资源。单次24小时预报的推理时间在A100显卡上仅需3.5秒，极大地降低了业务化部署的门槛。

结论与展望

ArchesWeatherGen的成功标志着气象AI从“精准模仿”迈向了“概率想象”的新阶段。它证实了流匹配等先进生成式技术在处理地球系统混沌特性上的巨大潜力，为解决确定性模型的平滑化顽疾提供了可复制的技术路径（残差学习+生成建模）。

更重要的是，这项工作极大地降低了高性能气象AI的研发门槛。它证明无需依赖超大规模的算力堆砌，通过算法创新（如CLA层）和高效的训练策略，学术界的有限资源同样可以产出世界领先的预报模型。这不仅会加速AI在气象领域的落地，更将催生更多基于概率预测的下游应用，如可再生能源功率预测、极端天气风险预警等，让天气预报真正成为一个可量化的风险决策工具。

联系信箱：

粤ICP备09063491号

天气AI的“想象力”革命：当扩散模型教会机器“画”出暴雨与台风

研究结果

结论与展望

热点排行