《Environmental Modelling & Software》:A Novel Adaptive Time-Scale Decomposition Fused LSTM-Transformer Framework (ATSD-LT) for TCWV Prediction
编辑推荐:
总水汽预测中提出ATSD-LT框架,通过自适应时间尺度分解与LSTM-Transformer融合建模,显著提升冬季预测精度(R2提升18%-55%,MAE减少64%-76%),并成功再现全球典型气候特征。
许龙浩|毛克彪|郭中华|史建成|Sayed M. Bateni|袁子金
宁夏大学土木与水利工程学院,中国银川市750021
摘要:
总柱水汽(TCWV)对水循环、降水和极端天气事件至关重要。本研究提出了一种新颖的自适应时间尺度分解融合LSTM-Transformer框架(ATSD-LT)。ATSD利用梯度优化的滤波器将序列分解为趋势和多尺度波动,从而抑制混叠和频率泄漏。通过异构集成建模,LSTM提取趋势演变,而Transformer捕捉全局长程时空相关性。结果表明,该框架性能优越,尤其是在春季和夏季(R2分别为0.959和0.967)。与Autoformer、Informer、Transformer和LSTM相比,ATSD-LT在冬季表现出更显著的改进(R2提高了约18%-55%,MAE降低了64%-76%)。消融实验确认ATSD模块对夏季MAE的降低贡献了79.4%,而特征加权进一步提高了12.3%的拟合优度。空间映射再现了热带高压区(例如亚马逊盆地)和高纬度低压区(例如北美洲北部);交叉验证和站点验证进一步证明了该框架的稳健性。ATSD-LT有效支持全球气候监测和水资源管理。
引言
总柱水汽(TCWV)是全球陆地气候系统中的关键参数,在水循环、降水分布和极端天气事件中起着重要作用(Allan, 2011; Saleem et al., 2024)。特别是在农业生态系统中,TCWV调节作物蒸腾作用和土壤水分平衡,这对优化灌溉策略以及影响农业产量和生态稳定性至关重要(Simpson et al., 2024)。准确测量和预测TCWV为长期气候监测、季节性降水预报和灾害预警提供了基础数据。在全球气候变暖加剧的背景下,理解其时空动态特性有助于制定有效的适应策略(Chen et al., 2025; Dai, 2021)。然而,TCWV受多种尺度气象因素(如温度和降水)和地表特征的复杂相互作用影响,其预测面临重大挑战,需要开发高精度模型来应对这些复杂性。
在大气总柱水汽预测领域,研究方法包括传统的数值模拟、机器学习和深度学习技术。传统方法主要依赖于统计回归和数值天气预报模型,例如欧洲中期天气预报中心的ECMWF再分析产品,这些模型通过参数化大气过程来模拟短期水汽变化(Dee et al., 2011; Kalnay et al., 1996)。物理驱动模型结合辐射传输方程和地面观测数据,以提高区域预测的物理一致性,但它们对复杂地表条件的适应性仍然有限(Teixeira et al., 2021)。研究表明,在极端气候事件(如厄尔尼诺现象)中,这些方法的预测偏差可达10-15%(Bauer et al., 2015)。为了提高传统方法的预测性能,机器学习算法引入了数据驱动策略,如支持向量机(SVM)和随机森林(RF),这些方法提高了局部区域预测的准确性,特别是在亚洲地区的短期预报中表现出稳健性(Manandhar et al., 2019)。深度学习模型进一步提升了预测能力,长短期记忆网络(LSTM)和门控循环单元(GRU)在捕捉TCWV时间依赖性方面表现出色(Dong et al., 2025; Li et al., 2022),而时间卷积网络(TCN)和Transformer模型分别通过局部特征提取和多头注意力机制处理空间和全局相互作用(Ma and Yin, 2025; Zhao et al., 2025)。然而,单个模型在泛化能力和计算效率方面存在挑战,尤其是在模拟多尺度时空动态和处理高维全球数据时,这限制了它们在复杂气候系统中的应用。
为了解决单一模型的局限性,混合架构通过整合多个模型组件来优化TCWV预测性能。将LSTM与卷积神经网络(CNN)结合的融合架构结合了时间序列建模和空间特征提取,增强了区域TCWV预测中对非线性动态的捕捉(Pu et al., 2022)。同样,GRU和CNN的组合通过简化的循环结构提高了计算效率,并已应用于东亚的季节性水汽分析(Xiao et al., 2022)。为了进一步整合物理约束,传统方法与深度学习的结合也取得了进展。例如,传统统计回归与GRU的组合通过将物理约束与时间序列建模相结合,提高了亚洲地区水汽预测的稳定性(Shi et al., 2025)。此外,Kalman滤波与LSTM的融合利用状态估计和长期依赖特性,增强了南美洲降水相关时间序列预测的动态捕捉能力(Bakhshi Ostadkalayeh et al., 2023)。然而,这些混合模型的研究主要集中在特定区域(如南美洲和东亚),缺乏全球范围的泛化能力(Wan et al., 2024)。此外,一些模型仅限于时间序列分析,没有充分优化空间预测功能,且对数据质量的敏感性和高计算复杂性限制了其在全球陆地范围内的稳健性。因此,现有方法仍需在全局范围泛化和时空动态的全面建模方面进行改进。
尽管现有模型在TCWV预测方面取得了进展,但它们在全球陆地地区的实际应用仍受到多尺度时空建模能力和计算复杂性的限制;为了解决这个问题,本研究提出了一种自适应时间尺度分解集成LSTM-Transformer(ATSD-LT)预测框架,通过整合多源气象变量和提取多尺度特征,实现了全球陆地TCWV的高精度时空预测。本研究的主要创新包括:(1)构建了自适应时间尺度分解(ATSD)机制,通过梯度优化的滤波器权重和多尺度残差校正,将原始序列高保真地分解为趋势和多尺度波动成分,有效抑制了复杂气候背景下的模式混合和频率泄漏,为深度学习提供了更高保真的输入特征;(2)设计了LSTM-Transformer异构集成建模架构,基于“物理属性对齐”,实现了趋势演变惯性和全球遥相关信号的解耦建模,分别利用LSTM和Transformer捕捉序列的系统性演变模式和长程时空耦合特征,从而弥补了单个模型在处理高维全球网格数据时的特征提取不足;(3)建立了基于ERA5、NOAA和IGRA观测数据的全球范围多源数据验证系统,证实了该框架在包括热带、温带和寒冷地区在内的不同气候环境中的稳定性,为高精度全球陆地TCWV预测提供了技术基准。通过提高预测准确性和泛化能力,该模型为全球气候监测和灾害预警提供了可靠的支持。
研究区域和数据
本研究关注全球陆地地区,构建复杂水汽变化的预测模型。如图1所示,研究区域涵盖了从赤道到高纬度的陆地表面,包括热带季风雨林、温带农业带和极地苔原等多种气候和地形类型,代表了全球水汽分布的多样性和复杂性。选择该区域是基于其广泛的代表性
TCWV性能和意义分析
在本研究中,使用MAE、RMSE、MASE等指标定量评估了2013-2023年测试期间各种模型的预测性能(Dai et al., 2025; Waqas et al., 2025),季节性统计结果总结在表3中。评估表明,基线模型在捕捉TCWV的多尺度非平稳波动方面存在固有局限性。气象信号的强非平稳性干扰限制了
模型框架和性能协同
ATSD-LT框架在全球陆地TCWV预测中的优越性能根本在于物理特征解耦和多尺度深度建模的深度整合。通过ATSD模块,该框架首先对水汽序列进行动态成分剥离,有效分解出长期趋势项、季节性残差和嵌入在复杂信号中的随机波动。这种预处理缓解了成分混叠问题
结论
本研究提出并验证了一种基于自适应时间尺度分解(ATSD-LT)的LSTM-Transformer时空预测框架,用于月度全球陆地TCWV预测。通过将物理分解策略与深度学习架构相结合,该框架在复杂气候背景下有效提高了水汽预测的准确性。主要结论如下:
(1)ATSD模块成功地将原始水汽序列分解为趋势
CRediT作者贡献声明
毛克彪:写作——审稿与编辑、验证、项目管理、资金获取、数据管理、概念构思。许龙浩:写作——审稿与编辑、初稿撰写、可视化、验证、软件、资源、方法论、调查、形式分析、数据管理、概念构思。史建成:调查、数据管理。郭中华:资源管理、调查。袁子金:监督、项目管理。Sayed M. Bateni:资源管理,
利益冲突声明
作者声明没有利益冲突。
软件和数据可用性
软件:ATSD-LT;操作系统:Windows、Linux、macOS。
依赖软件:Python 3.8–3.11及PyTorch(≥2.10)、NumPy、SciPy、scikit-learn和Pandas。
数据来源:
IGRA无线电探空仪
利益冲突声明
? 作者声明他们没有已知的竞争性财务利益或个人关系可能影响本文所述的工作。
致谢
作者感谢欧洲中期天气预报中心(ECMWF)、美国国家海洋和大气管理局(NOAA)以及TensorFlow对这项研究的重要贡献。我们还要感谢中国国家重点研发计划(编号2023YFB3906202)的支持,这对本研究至关重要。