结合卫星被动微波与光学观测的基于Transformer深度学习模型的蒸散发增强型逐日反演

首页今日动态人才市场新技术专栏中国科学人云展台
BioHot
云讲堂直播会展中心特价专栏技术快讯免费试用

生物通官微
陪你抓住生命科技
跳动的脉搏

生物通首页 > 今日动态 > 正文

《ISPRS JOURNAL OF PHOTOGRAMMETRY AND REMOTE SENSING》：Enhanced daily retrieval of Evapotranspiration from a Transformer-based deep learning model combined with satellite passive microwave and optical observations

【字体：大中小】 时间：2026年05月22日 来源：ISPRS JOURNAL OF PHOTOGRAMMETRY AND REMOTE SENSING 12.2

编辑推荐：

　　蒸散发（Evapotranspiration，ET）是影响地球水文循环与能量平衡的关键组分。尽管将深度学习模型与多源遥感数据集成，代表了端到端定量反演ET的一种前沿方法，但同时由卫星多通道被动微波和光学观测共同驱动的逐日尺度深度学习模型仍鲜有研究。该研究提出了

蒸散发（Evapotranspiration，ET）是影响地球水文循环与能量平衡的关键组分。尽管将深度学习模型与多源遥感数据集成，代表了端到端定量反演ET的一种前沿方法，但同时由卫星多通道被动微波和光学观测共同驱动的逐日尺度深度学习模型仍鲜有研究。该研究提出了一种新型轻量化模型以实现逐日ET估算，该模型结合了用于局地时间特征提取的卷积神经网络（Convolutional Neural Networks，CNNs）与用于长时间依赖建模的Transformer自注意力机制（self-attention mechanism）。研究人员采用中国风云三号D星（Fengyun-3D）被动微波X波段、Ku波段和Ka波段的发射率差分植被指数（Emissivity Difference Vegetation Indices，EDVIs）作为分层植被含水量的表征指标，并采用MODIS光学增强型植被指数（Enhanced Vegetation Index，EVI）作为绿色叶面积状态的代理变量，这些指标为模型学习提供了差异化且互补的植被特征。该混合CNN-Transformer模型在全球108个森林、农田、湿地、稀树草原和草地通量站点上进行了训练与测试，并与三种广泛使用的深度学习模型（Transformer、CNN-LSTM和LSTM）进行了比较。结果表明，CNN-Transformer模型实现了逐日ET估算，总体均方根误差（root mean square error，RMSE）< 35%，偏差（bias）< 5%，尤其在北半球表现突出，其R² = 0.86，RMSE = 0.52 mm day^?1或34%。与其他深度学习模型相比，该模型在南半球表现出更稳健的泛化能力，R² = 0.71，RMSE = 0.58 mm day^?1或35%；而其他模型的R²为0.59–0.66，RMSE为0.62–0.70 mm day^?1或38–42%。在4—5月过渡时期以及植被状态和气象条件快速变化的生长季中期，该模型呈现出显著增强效果。联合使用卫星微波与光学植被指数为CNN-Transformer模型带来了额外增益，从而提升了逐日ET估算能力。该模型的时空格局与北半球FLUXCOM-X ET结果高度一致。这些发现凸显了由时间卷积—注意力机制与卫星多源植被数据共同构成的混合模型在稳健逐日ET反演中的价值，并显示出其全球应用的巨大潜力。

该论文发表于《ISPRS JOURNAL OF PHOTOGRAMMETRY AND REMOTE SENSING》，聚焦于陆地蒸散发（Evapotranspiration，ET）逐日遥感反演这一关键问题。ET是陆气相互作用中的核心通量，控制着水分从土壤和植被向大气的传输过程，对地表能量分配、水文循环、干旱监测以及农业水资源管理具有基础意义。相较于月尺度或更长时间尺度，逐日ET更能表征短时水热波动、植被活动变化及突发性水文气象响应，因此对于高时间变率地区的水资源调度、预报和早期预警尤为重要。现有基于遥感的ET估算方法虽然已广泛发展，包括地表能量平衡模型、Penman-Monteith（PM）模型、Priestley-Taylor（PT）模型及经验模型等，但这些方法通常依赖关键生理或空气动力学参数化方案，如气孔阻力、冠层阻力和地表粗糙度等，而这些参数在区域到全球尺度上往往难以准确获取，从而带来较大的不确定性。

在此背景下，数据驱动的机器学习（Machine Learning，ML）和深度学习（Deep Learning，DL）方法为ET端到端估算提供了新的技术路径。这类方法能够从多源输入中自动学习ET与环境因子之间复杂的非线性映射关系，避免显式物理参数化的局限。然而，已有逐日ET深度学习研究仍存在明显不足。一方面，浅层ML模型难以充分刻画复杂时序过程；另一方面，单一结构的深度网络，如卷积神经网络（Convolutional Neural Networks，CNNs）或长短期记忆网络（Long Short-Term Memory，LSTM），往往难以同时兼顾短时高频波动与长时低频周期变化。LSTM在长序列处理中还可能受到梯度衰减、记忆饱和和过拟合等问题影响，从而削弱对逐日ET快速变化的响应能力。与此同时，现有研究中植被信息输入多依赖光学植被指数，虽然这类指数对冠层绿度、叶绿素和覆盖度敏感，但其应用易受云污染和大气条件制约。相较之下，被动微波观测可在全天空条件下获取信息，并能够反映植被内部水分状态，不同频段还具有不同穿透深度，因此可为ET建模提供与光学信息互补的植被水分约束。正因如此，开展融合多通道被动微波与光学植被信息、并针对逐日时序特征设计混合深度学习框架的研究，具有明确的方法学价值与应用意义。

研究人员围绕这一问题，构建了一种轻量化混合CNN-Transformer模型，用于逐日ET反演。该模型的核心思想是：利用一维CNN提取时间序列中的局部时序特征，以刻画短期变化和高频扰动；同时借助Transformer编码器中的自注意力机制建立长距离时间依赖关系，从而增强对季节演变、跨期关联和复杂动态过程的表征能力。为提高植被状态刻画的全面性，研究引入了中国风云三号D星（Fengyun-3D）多通道被动微波发射率差分植被指数（Emissivity Difference Vegetation Indices，EDVIs），涵盖X、Ku和Ka波段，用于反映不同层次植被含水量信息；并结合MODIS增强型植被指数（Enhanced Vegetation Index，EVI）作为植被绿度和叶片状态的代理。模型训练与测试基于2020—2022年全球108个通量观测站点的涡度协方差（eddy covariance）实测数据，站点数据来自FLUXNET、AmeriFlux、OzFlux、ICOS和AsiaFlux，覆盖森林、农田、湿地、稀树草原和草地等多种植被类型，并跨越50°S至60°N的广泛纬度范围。研究同时将所提模型与Transformer、CNN-LSTM和LSTM三类常用深度学习模型进行了系统比较，以评估其精度、泛化性及多源遥感输入的增益效应。

方法上，该研究主要采用三类关键技术。其一，基于一维CNN与Transformer编码器构建混合时序深度学习架构，以联合建模逐日ET中的局地时序信号和长程依赖关系。其二，融合地面观测、风云三号D星多频段被动微波EDVIs以及MODIS EVI等多源数据，形成兼具植被含水状态与冠层绿度信息的驱动变量体系。其三，依托2020—2022年全球108个涡度协方差通量站样本开展训练、测试与跨模型对比评估，并通过不同输入组合情景分析多源植被信息对ET反演性能的贡献。

在结果部分，论文首先通过“Validations of CNN-Transformer model against in-situ daily ET measurements”验证了模型相对于站点逐日ET实测值的表现。结果显示，无论仅使用站点地面数据，还是进一步加入卫星微波EDVIs，抑或同时加入微波EDVIs与光学EVI，CNN-Transformer模型均能获得较好的逐日ET估算精度。总体上，随着植被遥感信息的加入，模型精度进一步提升，表明多源卫星植被观测能够有效补充地面驱动信息，增强模型对ET动态变化的感知能力。这一结果直接说明，光学与微波植被指数在ET估算中具有协同价值，而不是简单替代关系。

在“Capability of CNN-Transformer model for daily ET retrievals”部分，研究进一步证明了所提模型在不同植被类型和区域上的可靠性。综合地面数据、卫星微波与光学植被数据作为输入时，CNN-Transformer在森林、草地和农田等类型上的R²达到0.82–0.90，RMSE为0.46–0.59 mm day^?1，显示出较高的逐日尺度模拟能力。与Transformer、LSTM和CNN-LSTM相比，该模型在多个地表覆盖类型上均降低了RMSE，说明混合CNN-Transformer结构在表征ET多尺度时间变化方面优于单一结构模型。论文特别指出，该模型在北半球表现尤为突出，R² = 0.86，RMSE = 0.52 mm day^?1或34%；在南半球也表现出更好的泛化能力，R² = 0.71，RMSE = 0.58 mm day^?1或35%，优于对比模型的R² = 0.59–0.66和RMSE = 0.62–0.70 mm day^?1。这一结果说明，该方法不仅在样本丰富区域有效，也具有较强的跨区域迁移和泛化潜力。

论文还指出，模型性能提升在特定时间窗口更加明显，特别是在4—5月过渡期以及生长季中期。这些时期通常伴随着植被物候快速演变及气象条件显著波动，传统模型较难稳定捕捉相关ET变化，而混合模型通过短期卷积特征与长期注意力依赖的联合建模，更适合表征这类复杂非平稳过程。因此，该研究并非仅在总体统计指标上改进模型表现，也在关键生态水文转换阶段体现出更强的响应能力。

关于输入数据效应，研究表明，卫星微波与光学植被指数的联合使用可为逐日ET反演带来额外增益。微波EDVIs反映植被内部水分状态和分层结构信息，光学EVI则更偏重表征冠层绿度和叶片生长状况，两者从不同维度描述植被过程，共同增强了模型对ET形成机制相关状态变量的识别能力。特别是被动微波观测受云和气溶胶影响小，能够弥补光学数据在多云条件下时序连续性不足的问题。因此，多源植被指标融合不仅提升了精度，也增强了模型时序稳定性和全天候适用性。

在空间一致性分析中，研究人员发现，该模型模拟得到的时空分布格局与北半球FLUXCOM-X ET产品高度一致。这一结果表明，模型并非仅在站点尺度上拟合较好，还具备一定的区域尺度一致性和推广应用能力。对于全球逐日ET遥感产品的发展而言，这意味着所提方法有潜力成为连接站点观测、卫星多源信息与大范围连续制图的重要技术路径。

讨论部分的核心可归纳为两点。其一，混合CNN-Transformer结构的优势在于同时处理局部时序波动和长程依赖，从而更适合逐日ET这种兼具快速响应和季节周期性的变量。其二，多源卫星植被数据，特别是被动微波与光学观测的协同，为ET估算提供了互补约束，增强了模型鲁棒性与泛化性。不过，论文也明确将相关分析建立在已有观测数据和评估结果基础上，强调模型表现仍受训练样本代表性、输入数据质量及区域观测覆盖度等因素影响。

结论部分指出：深度学习模型与卫星多源数据的集成，对于实现全球陆地ET逐日尺度端到端反演至关重要。该研究提出了一种新型轻量化CNN-Transformer模型，能够同时捕捉多变量时间序列中的局地时间特征和长期依赖关系。以卫星被动微波和光学植被指数以及地面观测作为主要输入时，该模型在全球多类型生态系统站点上实现了稳健的逐日ET估算，整体误差较低，并在北半球和南半球均展现出良好性能，尤其在南半球体现出优于其他深度学习模型的泛化能力。联合使用微波与光学植被信息可进一步提高模型表现。总体而言，该研究证明了时间卷积—注意力混合机制与多源卫星植被数据融合在逐日ET反演中的有效性，为未来全球尺度高时效ET遥感估算提供了有力支撑。

联系信箱：

粤ICP备09063491号

热点排行