《Frontiers in Marine Science》:Deep learning-based correction of global ocean forecasts for the South China Sea
编辑推荐:
南海(SCS, South China Sea)在全球地缘政治、经济及环境层面具有重要地位,因此对其海洋变量进行精确预报对有效的海洋管理与灾害减缓至关重要。传统数值模式虽是海洋预报的基础,但常受限于高计算复杂度与低效率。近年来,基于深度学习的 data-dri
南海(SCS, South China Sea)在全球地缘政治、经济及环境层面具有重要地位,因此对其海洋变量进行精确预报对有效的海洋管理与灾害减缓至关重要。传统数值模式虽是海洋预报的基础,但常受限于高计算复杂度与低效率。近年来,基于深度学习的 data-driven 全球海洋预报系统(GOFS, Global Ocean Forecasting System),如XiHe,展现出与传统数值模式相当甚至更优的预报精度且计算成本大幅降低。然而,尽管基于深度学习的GOFS能高效捕捉大尺度海洋变率,其直接应用于动力过程复杂的区域海域(如具复杂岸线梯度、中尺度结构及局地误差型的边缘海)仍具挑战性,因区域海岸梯度、中尺度结构及局地误差型往往解析不足。为此,研究人员提出一种Swin Transformer订正器(Swin-Transformer Corrector, STC),作为针对SCS区域深度学习基GOFS海表多变量冻结预报进行区域后处理的专用模型。STC并非替代原预报系统,而是被设计为轻量级插件式订正器,在保留全球模式大尺度预测先验的同时提升区域预报保真度。具体而言,其采用分层Swin Transformer骨干网捕获多尺度空间误差结构,显式利用高分辨率特征保留海岸及中尺度信息,并应用残差校正(residual correction)高效精化基准预报。实验表明STC显著提升了预报精度,平均均方根误差(RMSE, Root Mean Square Error)降低20.35%,且在台风"海葵(Haikui)"等极端条件下也表现出强适应性。
《Deep learning-based correction of global ocean forecasts for the South China Sea》论文解读——发表于Frontiers in Marine Science
一、研究背景与意义
南海(SCS, South China Sea)是半封闭边缘海,受季风、频繁台风、复杂地形及海陆相互作用影响,动力过程极为复杂。传统数值海洋预报系统(GOFS, Global Ocean Forecasting System)虽物理机制明确,但计算昂贵、效率低。近年基于深度学习的全球海况预报模型如XiHe(1/12°分辨率,基于分层Transformer架构,利用GLORYS12再分析资料训练)能以极低计算代价获得具竞争力的全球预报能力,可较好模拟大尺度环流与中尺度涡。但由于其训练目标是全球平均性能,对SCS这类具强海岸梯度、复杂热盐结构与活跃中尺度现象的区域海,局地系统偏差(systematic bias)与误差空间结构解析不足。专门针对深度学习基GOFS的区域后处理(post?processing)/偏差订正(bias correction)研究较少,且需在保留GOFS已编码的大尺度环流先验前提下进行区域精细化。为此,研究人员开展此项研究,提出轻量级区域订正模型Swin?Transformer Corrector(STC),旨在对冻结(frozen)的XiHe全球海表预报做多变量残差订正,以提升SCS区域SSS(sea surface salinity)、SST(sea surface temperature)、U0(zonal current)、V0(meridional current)及SSH(sea surface height)的预报准确度。研究结论显示STC平均RMSE较原始XiHe降低20.35%(SSH降幅达37.70%),系统偏差(Bias)几近消除,且在台风等极端天气下具稳健性,经独立观测与统计检验验证具显著性与实用价值。
二、主要关键技术方法简述
研究时段为2021–2023年,使用GLORYS12再分析(1/12°,作为真值/训练目标)、OSTIA SST产品及ERA5大气强迫驱动已训练好的冻结XiHe模型生成全球24小时提前量海表预报,裁剪至SCS区域(2°N–26°N,99°E–123°E)。按时间顺序切分:2021年–2022年上半年训练,2022年下半年验证(早停、超参选择),2023年全年独立测试。订正模型输入为XiHe输出的五维海表变量场(C=5, H×W对应SCS网格),输出同维度残差Δ,最终订正预报为基线预报加残差(residual learning)。STC以Swin?Transformer(Tiny)为骨干,Patch Partition将4×4邻域映射为token,经4个Stage(Block数2?2?6?2)的Window?based Self?Attention与Patch Merging做分层特征提取;订正阶段特别取Stage?1最高分辨率特征(保留海岸与中尺度细部),经Flatten→LayerNorm→Multi?Head Attention(MHA)→残差连接→MLP(Multilayer Perceptron)→残差连接,再Reshape并双线性上采样恢复原始分辨率得Δ。损失函数为掩膜均方误差(masked MSE),使用固定海?陆二值掩膜排除陆地格点。对照基线含XiHe、WenHai(另一深度学习GOFS)、Persistence、经验分位数映射(EQM, Empirical Quantile Mapping)、PredRNN、BiLSTM(patch?wise)、ConvGRU及CNN、U?Net,评估指标为masked RMSE与Bias,统计显著性采用配对双样本Wilcoxon符号秩检验。另用CMEMS(Copernicus Marine Environment Monitoring Service)独立观测(Argo—SSS/SST、drifter—U0/V0、卫星高度计—SSH)作第三方验证。
三、研究结果
4.1 Evaluation method
定义RMSE与Bias计算公式,均在有效海面网格点上求取,并逐变量与整体平均评估。
4.2 Experimental setup
详述软硬件环境(PyTorch, NVIDIA A100)、数据时空划分、海?陆掩膜生成方式(global_land_mask包)、训练超参(Adam, lr=0.001, batch=32, ReduceLROnPlateau, early stopping patience=10, 最大epoch=100, 随机种子42)及公平对比设置。
4.3 Overall result
对比表中STC在五变量RMSE及平均RMSE(RMSEavg)与Bias上均为最优:SSS由0.5056降至0.4180(↓17.33%),SST由0.7712降至0.5810(↓24.66%),U0由0.1079降至0.1007(↓6.67%),V0由0.1039降至0.0980(↓5.68%),SSH由0.0687降至0.0428(↓37.70%),平均RMSE由0.3115降至0.2481(↓20.35%);Bias由?0.0314改善至0.0017(系统偏差削减94.59%)。经STC订正后的XiHe预报总体优于WenHai原始预报。计算效率方面XiHe做10天全球推理仅需3.17 s,STC对单日SCS区域订正耗时0.46 s,具实时业务应用潜力。
4.4 Ablation Study
去除MHA或MLP均致性能下降,说明全局空间上下文建模与非线性通道映射均必要。选用Backbone不同Stage特征(Stage?1至Stage?4)做对比,发现随着Stage加深空间分辨率降低(从H/4×W/4到H/32×W/32),RMSE递增——证实区域海况订正须保留高分辨率Stage?1特征以捕捉中尺度锋面与岸界信息,全模型(Stage?1+MHA+MLP)效果最佳。
4.5 Spatial and temporal error distribution analysis
将SCS域划分为17×17子区绘RMSE热力图,XiHe误差在岸区与近岸集中(标量场SSS/SST/SSH)及开阔海域散布(矢量场U0/V0);STC使全域误差降低,"XiHe?STC"差值图显示岸区与高动力区改进最显著。月际分析显示XiHe夏季SSS误差增大(季风降水与径流),冬季SST/SSH/U0/V0误差增大(强风混合并中尺度活跃);STC全年各月RMSE均低于XiHe且波动更小,证明其对SCS季节动力特征的适应能力。
4.6 Case study
选取2023年2月26日个例可视化XiHe、STC与GLORYS再分析场及误差分布,STC残差场幅值明显小于XiHe,岸区SST与全域SSH改进尤为突出,证实STC能更好还原局地海洋结构。
4.7 SST result under typhoon conditions
以2023年台风"海葵(Haikui)"影响期为例,计算台风路径缓冲区SST RMSE。STC在该区显著降低RMSE(9月3日改进幅度超越所有对照模型),而部分时序RNN类模型(BiLSTM/ConvGRU)个别日期订正结果差于原始XiHe,表明STC对极端天气下海表温度变异模式具更强辨识与适应能力。
4.8 Independent observational and statistical validation
以CMEMS独立观测为基准,STC各变量RMSE最低(SSS 0.0914, SST 0.4643, U00.1776, V00.1751, SSH 0.0502, 均值0.1917),优于XiHe(0.2303)、U?Net(0.2131)及EQM(0.2097)。Wilcoxon检验显示STC相对全部9种基线模型在所有变量及平均值上p<0.05,具统计显著性。
四、讨论与结论(翻译并浓缩)
研究人员提出Swin?Transformer Corrector(STC)——一种轻量级基于深度学习的区域订正模型,用于改进SCS上海深度学习基全球海洋预报(GOFS)之表现。STC不作为独立预报系统取代基线GOFS,而是设计成插件式订正器,在保留全球模式之大尺度预测结构同时精化区域预报误差。通过结合分层Swin Transformer特征抽取与残差精化,STC有效捕获基线预报与参考再分析场间的复杂差异。综合实验证明STC持续提升基线XiHe系统预报性能,优于Persistence、WenHai、EQM、CNN、U?Net、PredRNN、BiLSTM及ConvGRU等参照方法与订正基线。整体精度上,STC使五个关键海表变量(SSS, SST, U0, V0, SSH)平均RMSE降低20.35%,其中SSH的RMSE降幅达37.70%。独立观测验证与统计显著性检验进一步确认所提模型的稳健性与实用价值。此外,台风"海葵(Haikui)"等极端条件下的结果表明STC能更好地保留锐利区域梯度与动态演变的海洋结构。总体而言,所提STC为基于深度学习的全球海洋预报之区域精细化提供了一种有效且计算高效的解决方案,对诸如SCS般具复杂动力过程的边缘海支持高保真海洋预测具重要意义,可服务于海上安全、灾害减缓及海洋环境管理。未来工作拟扩展STC至其他GOFS、多时效预报及三维海洋状态订正。