SGD-SST 2.0:2003年至2025年间生成的跨传感器无缝全球日海表温度产品

《Expert Systems with Applications》:SGD-SST 2.0: Seamless Global Daily Sea Surface Temperature Products Cross-Sensors Generating from 2003 to 2025

【字体: 时间:2026年04月07日 来源:Expert Systems with Applications 7.5

编辑推荐:

  海表温度数据填补模型研究。针对MODIS和VIIRS卫星数据因云层遮挡导致的缺失问题,提出基于贝叶斯优化的自适应卷积LSTM时空重建模型,创新性地融合动态时间步选择机制与纬度效应自适应后处理策略,构建2003-2025年连续无缝全球每日海表温度产品(SGD-SST 2.0),空间分辨率达9公里。实验表明其与实测数据相关系数0.994,均方根误差0.916K,较前版本在低中纬度区域精度提升显著。

  
王琦|张强|杨同德|孙伟珍|袁强强
大连海事大学信息科学与技术学院,中国大连,116026

摘要

海表温度是地球系统的关键参数,但由于云层覆盖和传感器限制,存在严重的数据缺失问题。为了解决这个问题,本研究通过贝叶斯优化开发了一种自适应的卷积长短期记忆(ConvLSTM)时空重建模型。该模型生成了无缝的全球每日海表温度(SGD-SST 2.0)产品,空间分辨率为9公里,支持跨传感器数据融合,并覆盖了2003年至2025年的数据。模型采用基于数据缺失率的动态时间步长选择机制,并引入了考虑纬度效应的自适应后处理策略。特别是针对中分辨率成像光谱辐射计数据的高缺失率问题,本研究采用了可见光红外成像辐射计套件预训练模型的迁移学习策略,实现了中分辨率成像光谱辐射计海表温度(2003-2012年)与可见光红外成像辐射计海表温度(2013-2025年)之间的无缝重建,生成了22年的全球每日海表温度产品。验证实验采用了四种方法:现场验证、时间序列一致性分析、与其他方法的比较以及纬度分层比较。验证结果显示,相关系数为0.994,均方根误差为0.916 K,平均绝对误差为0.602 K。与之前的SGD-SST 1.0产品相比,SGD-SST 2.0产品在低纬度地区的重建精度显著提高。SGD-SST 2.0产品可在以下链接下载:https://huggingface.co/datasets/namelesswang/SGD-SST_2.0/tree/main

引言

海表温度(SST)是表征海洋-大气界面能量交换的关键物理量,也是揭示全球气候系统多尺度过程的重要因素(Minnett等人,2019年)。SST直接调节海洋与大气之间的热量、动量和气体通量交换,对大气环流、海洋热结构和生态系统产生深远影响。从社会角度来看,SST的时空变化驱动极端天气事件、长期气候趋势和区域环境现象。因此,准确监测SST对于天气预报、生态评估、渔业管理等领域具有重要意义(O’carroll等人,2019年)。
通常,SST数据主要通过两种方式获得:现场测量和卫星遥感反演。卫星遥感技术自1981年起开始实际应用,由于其高空间和时间分辨率的优势,已成为获取全球海洋温度分布特征的核心手段(Haghbin、Sharafati、Motta、Al-Ansari、Noghani,2021年;Zhang、Zheng、Yuan、Song、Yu、Xiao,2024b年)。它在精度和区域覆盖范围上补充了现场测量。然而,这两种技术都有固有的局限性。现场测量受观测平台密度的限制,导致时空覆盖不连续;卫星反演虽然能够实现大范围监测,但受云层遮挡、气溶胶干扰和太阳反射效应的影响,存在严重的数据缺失问题。这些问题成为其在多个领域应用的瓶颈(Kolbe、Dybkj?r、Tonboe、Eastwood、Nielsen-Englyst、H?yer、Jensen、Suhr,2025年;Luo、Minnett、Nalli,2021年;Nielsen-Englyst、H?yer、Kolbe、Dybkj?r、Lavergne、Tonboe、Skarpalezos、Karagali,2023年;Zhang、Yuan、Li、Li、Shen、Zhang,2020年)。
SST是海洋-大气相互作用的核心参数,其高精度重建和预测为气候监测、生态评估和灾害预警提供了重要基础。近年来,相关研究主要分为两类方法:物理驱动方法和数据驱动方法。
在物理驱动方法方面,HYCOM是一种基于物理机制的先进数据同化系统,其核心优势在于结合了混合坐标建模和多源数据融合,为缺失卫星SST数据的动态修复提供了物理约束框架(Gao,2008年)。尽管HYCOM在数据同化精度上取得了突破,但它依赖于传统的插值方法,在极端数据缺失情况下仍存在系统性偏差。此外,计算成本随分辨率提高而呈指数级增长。统计模型代表有数据插值经验正交函数(DINEOF),通过时空特征分解实现缺失数据修复,无需先验假设,成为主流的时空缺失数据重建方法之一(Ping、Su、Meng,2016年)。Ping、Su和Meng提出了变分最优EOF改进算法(VE-DINEOF),通过动态选择时空特征模式显著提升了复杂海洋环境中缺失数据重建的性能。然而,VE-DINEOF在海洋数据上表现优异,但依赖于预设的最大EOF数量和子区域划分,导致参数敏感性问题(Shi、Wang、Wang、Jia、Zheng、Leng、Du,2024年;Sukresno,2010年;Zhang、Dong、Zheng、Yu、Song、Zhang、Yuan,2024a年)。
在数据驱动方法方面,长短期记忆(LSTM)神经网络因其对时间序列数据的有效建模能力成为研究热点。例如,Jia等人(2022年)基于LSTM构建了适用于东海复杂动态环境的5天短期SST预测模型。通过敏感性实验和区域迁移分析,该模型为中小尺度海域的SST预测提供了新的参考方法。LSTM在单点时间序列建模中能有效捕捉季节周期和短期趋势,但其主要局限在于仅关注时间维度特征,未能充分利用SST的空间相关性和动态过程的空间传播机制(Koner、Harris、Maturi,2016年;Xiao、Chen、Hu、Wang、Gong、Chen,2019年;Zhang、Yuan、Song、Yu、Zhang,2022年)。
为了解决LSTM的这些问题,Hirahara、Sonogashira和Iiyama(2021年)提出了一种结合对抗性物理模型损失的生成对抗网络(GAN),以解决卫星SST数据中的云层遮挡问题。该方法融合了数据同化的物理约束和深度学习的高效重建能力,实现了高精度的SST恢复,同时避免了传统数据同化方法的高计算成本。然而,该方法受限于固定的3天时间窗口,仅能捕捉短期时间特征,且仅适用于64×64像素的局部区域重建,无法处理全球尺度SST场的时空连续特征(Gavahi、Foroumandi、Moradkhani,2023年;Marullo、Santoleri、Ciani、Le Borgne、Péré、Pinardi、Tonani、Nardone,2014年)。
为了系统总结上述SST重建方法,其核心特征、优势和局限性见表1。
尽管上述方法在特定场景下具有优势,但高精度全球尺度每日SST重建仍面临三个主要挑战:
  • 1) 在极端缺失情况下难以消除插值偏差;
  • 2) 现有的时空建模存在碎片化问题(例如,LSTM仅关注单点时间序列,而GAN仅限于局部区域重建);
  • 3) 长期产品因传感器更换导致序列不连续。
  • 因此,在复杂的海洋动态环境中,必须实现三个关键目标:时空建模的适应性、长期序列连续性和多维度精度验证。如何解决这些问题成为当前研究的重点。为此,本研究提出了以下创新方案:开发了一种基于贝叶斯优化的自适应ConvLSTM时空重建模型,该模型采用基于数据缺失率的动态时间步长选择机制,并引入了考虑纬度效应的自适应后处理策略,显著提高了高数据缺失区域的重建精度,同时有效保留了关键海洋特征(如海洋锋面)。
  • 实现了跨传感器多源数据重建,生成了无缝的全球每日SST产品(命名为SGD-SST 2.0),覆盖2003–2025年,空间分辨率为9公里,整合了MODIS(2003–2012年)和VIIRS(2013–2025年)数据集。为了解决MODIS数据的高缺失率问题,采用了VIIRS预训练模型的跨传感器策略,将重建时间延长至22年。
  • 采用多维度验证策略评估SGD-SST 2.0产品的性能,包括四个方面:(a) 现场验证,(b) 时间序列一致性分析,(c) 与DINEOF方法的比较,(d) 纬度分层比较。验证结果表明,与之前的SGD-SST 1.0产品相比,SGD-SST 2.0在低纬度地区的重建精度显著提高,同时具有更好的时空连续性。
  • 本文的其余部分结构如下:第2节介绍使用的数据,第3节描述重建模型和验证方法,第4节展示实验结果和验证对比,第5节提供结论和未来展望。

    部分片段

    MODIS海表温度产品

    中分辨率成像光谱辐射计(MODIS)是NASA地球观测系统的核心载荷,搭载在Terra(1999年12月18日发射)和Aqua(2002年5月4日发射)卫星上。通过早晚(当地时间10:30和13:30)的互补轨道实现高频全球海表覆盖。该传感器具有36个波段(0.4–14.4μm),主要用于SST反演的波段包括中波红外(MWIR)波段20(3.75μm)、波段22(3.959μm)等。

    重建方法

    重建方法的总体流程如图2所示。包括以下步骤:首先进行数据预处理——从原始数据中筛选出纯海洋区域,选择符合时间窗口要求的缺失数据样本,使用掩码模拟缺失数据,并生成数据对以构建样本数据集;其次定义参数空间:通过贝叶斯优化迭代生成参数,并配置ConvLSTM。

    实验结果和验证

    在本节中,我们展示了实验结果和相关验证,证明了所提出重建框架的有效性。通过该框架,成功生成了2003年1月1日至2025年12月12日期间Aqua MODIS和S-NPP VIIRS的海表温度长期产品。SGD-SST 2.0产品以NetCDF4格式存储,可从提供的链接下载。
    在本节的实验中,标准差

    结论

    为了解决SST数据缺失问题,本研究通过贝叶斯优化构建了一种自适应ConvLSTM时空重建模型,生成了2003年至2025年的无缝全球每日产品(SGD-SST 2.0)。进行了现场验证、时间序列一致性分析和与DINEOF方法的比较。这些分析证实了SGD-SST 2.0在精度、时间一致性和空间连续性方面的优势。

    未引用参考文献

    表5。

    作者声明

    王琦:数据处理、方法论、写作。张强:概念化、方法论、审稿。杨同德:软件、审稿。孙伟珍:概念化、审稿、验证。袁强强:审稿、验证。

    利益冲突声明

    作者声明以下可能的财务利益/个人关系可能构成潜在的利益冲突:张强报告称获得了国家自然科学基金的支持。如果还有其他作者,他们声明没有已知的可能影响本文工作的财务利益或个人关系。
    相关新闻
    生物通微信公众号
    微信
    新浪微博
    • 搜索
    • 国际
    • 国内
    • 人物
    • 产业
    • 热点
    • 科普

    热点排行

      今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

      版权所有 生物通

      Copyright© eBiotrade.com, All Rights Reserved

      联系信箱:

      粤ICP备09063491号