基于Transformer的Sentinel-1时间序列深度学习土壤水分反演算法

首页今日动态人才市场新技术专栏中国科学人云展台
BioHot
云讲堂直播会展中心特价专栏技术快讯免费试用

生物通官微
陪你抓住生命科技
跳动的脉搏

生物通首页 > 今日动态 > 正文

《Science of Remote Sensing》：A time series deep learning algorithm for soil moisture retrieval from Sentinel-1 data using Transformer

【字体：大中小】 时间：2026年03月20日 来源：Science of Remote Sensing 5.2

编辑推荐：

　　土壤水分（SM)反演为理解陆地水文与生态系统提供了关键信息。研究人员开发了一种新型时间序列深度学习模型，利用200 m分辨率Sentinel-1（S1）影像立方体（每个时相为20×20像素、10 m分辨率）进行美国本土（CONUS）农田和草地土壤水分估算。该模

土壤水分（SM)反演为理解陆地水文与生态系统提供了关键信息。研究人员开发了一种新型时间序列深度学习模型，利用200 m分辨率Sentinel-1（S1）影像立方体（每个时相为20×20像素、10 m分辨率）进行美国本土（CONUS）农田和草地土壤水分估算。该模型基于Transformer架构，可处理不同地点年S1获取次数变化的问题，并充分利用季节植被变化模式进行反演，摒弃了传统方法中要求两次获取间植被变化最小的假设。训练数据来源于2017—2022年181个国际土壤水分网络（ISMN）站点共34,711个高质量日测量值。六折交叉验证结果显示，模型皮尔逊相关系数（CC)达0.581，无偏均方根误差（ubRMSE)为0.093 m³/m³，优于美国国家航空航天局（NASA)土壤水分主动被动（SMAP)/S1 1 km（CC=0.416，ubRMSE=0.124 m³/m³）和3 km（CC=0.496，ubRMSE=0.113 m³/m³）产品。Transformer模型与SMAP/S1标记为"优质"的产品的表现相当，但显著优于"低质"反演结果。200 m农田土壤水分图中可辨识作物田块边界。该方法在具有广泛实地测量用于模型训练的地区提供了一种互补选项。

土壤水分（SM）是陆地水文与生态系统中至关重要的变量，在农业、干旱与洪水监测以及水文气象模型等科学应用中具有广泛用途。卫星遥感、地面原位测量和陆面模型/再分析数据是估算土壤水分的三种重要来源。尽管地面原位测量能提供最为可靠的数据，但其空间覆盖范围有限且成本高昂、劳动密集。陆面模型与再分析产品因计算约束通常空间分辨率较低（>10 km），难以满足农业及水文应用对高空间分辨率的需求。

遥感数据用于土壤水分反演已有数十年历史。当前卫星土壤水分产品空间分辨率通常≥1 km，无法满足田块尺度应用需求。以美国本土为例，其平均和中位田块面积分别仅为0.193 km2和0.278 km2。被动微波辐射计如日本宇宙航空研究开发机构（JAXA)的先进微波扫描辐射计2（AMSR2，10 km）、欧洲空间局（ESA)的土壤水分与海洋盐度卫星（SMOS，35 km）以及NASA的土壤水分主动被动卫星（SMAP，36 km）等产品均受限于天线尺寸难以提高分辨率。主动微波传感器如合成孔径雷达（SAR）可提供10 m至数千米级的高空间分辨率。SMAP任务曾搭载1-3 km的L波段雷达传感器，但发射不久后失效；目前SMAP数据与SAR数据（如Sentinel-1）融合生产3 km和1 km产品，并将与NASA-ISRO合成孔径雷达（NISAR）数据融合以生产200 m产品。基于高分辨率光学数据的降尺度方法同样发展，但面临传感器间波段、获取时间、入射角和刈幅差异等挑战。

ESA的Sentinel-1A和Sentinel-1B分别于2014年和2016年发射，每6天提供10 m分辨率的C波段（约5 cm波长）SAR数据。Sentinel-1C和Sentinel-1D分别于2024年12月和2025年11月发射，以弥补Sentinel-1B于2021年12月的损失。高空间分辨率SAR数据的土壤水分反演更为复杂，因为SAR后向散射受作物冠层结构、土壤类型与表面纹理以及局部地形等多种属性影响。基于辐射传输模型的高分辨率Sentinel-1土壤水分反演研究通常局限于小块均质地表区域；而时间变化检测方法更适用于多种地表覆盖，常用于大区域或全球尺度制图。变化检测方法基于Wagner等人（1999）的工作，假设短期内（<1个月）植被或表面粗糙度无显著变化时SAR信号变化可归因于土壤水分变化，但快速植被生长期该假设常被违反，且这些方法无法考虑植被随时间的变化。实际上，植被变化多遵循季节性物候规律，可通过光学和微波卫星数据建模，但将季节动态建模融入变化检测以改进土壤水分估算的潜在优势尚未被探索。

机器学习虽已被应用于土壤水分反演，但主要使用单日影像而未对时间序列或季节动态建模。传统神经网络或卷积神经网络（CNN）需要固定长度时间序列输入，难以直接处理年获取次数和获取日期随地点和年份变化的非规律Sentinel-1时间序列——这种变化由卫星寿命差异、 maintenance schedules的空间差异以及刈幅重叠等因素导致。针对上述问题，研究人员开发了新型土壤水分反演模型，以非规律Sentinel-1时间序列作为输入，充分利用季节植被变化模式，无需假设获取间植被变化最小。该时间序列模型采用Transformer架构，最初为处理变长词语的机器翻译而开发，近期被 Zhang等人（2024）调整用于直接分类因云污染导致时间分布不规律的Landsat反射率时间序列。

该研究使用了国际土壤水分网络（ISMN）数据集作为参考土壤水分数据用于模型训练与评估。ISMN是最大的标准化土壤水分测量数据集之一，将各测量网络的土壤水分数据重采样至协调世界时（UTC）小时时间步，以体积土壤水分（m³/m³）形式提供，并生成质量标志以检测可疑测量值，主要包括C（超出合理地球物理范围）、D（可疑/存疑）、M（缺失）或G（良好）等类别。研究仅纳入质量标志为G的数据，并排除土壤温度记录所示冻结期（<0 °C）的测量值，因SAR数据对冻土中的水分不敏感。

研究区域涵盖美国本土的农田和草地，城市区域因微波数据不适于土壤水分反演被排除，森林因Sentinel-1 C波段数据冠层穿透能力有限被排除。研究人员利用美国农业部（USDA）作物数据层（CDL）识别农田和草地，CDL为30 m分辨率年度美国作物类型数据集，主要作物类型精度达85%-95%。本研究181个ISMN站点覆盖2017年1月1日至2022年12月31日期间，共计34,711个日样本。

用于模型训练与评估的Sentinel-1数据为ESA Sentinel-1A和1B一级地距探测（GRD）产品（升轨和降轨），以及美国地质调查局（USGS）10 m数字高程模型（DEM）数据，均从Google Earth Engine（GEE）平台直接获取。Sentinel-1 GRD为经过辐射定标和地理编码的多视平均数据，GEE平台还进行了边界噪声去除、热噪声去除和地形校正（正射校正）等处理，并计算了dB单位的后向散射系数（σ⁰）。以每个ISMN样本站点为中心，下载500×500 m²区域（10 m分辨率下50×50像素）的所有可用Sentinel-1数据、元数据及DEM用于模型训练与评估；实际模型中使用中心200×200 m²区域数据推导土壤水分，更大区域用于考察模型对不同空间分辨率的敏感性。最终将34,711个时间匹配的小时土壤水分数据在S1过境时间前后2小时四小时内平均，得到日样本。

模型输入为一年期时间序列10 m Sentinel-1影像和静态DEM影像块（20×20像素，10 m分辨率），输出200×200 m区域在每个S1获取日期的单一土壤水分值。DEM与各空间重叠的Sentinel-1影像堆叠生成4波段（VV：垂直极化发射与接收、VH：垂直极化发射水平极化接收、入射角、10 m DEM）影像块。S1获取日期也作为输入预测因子以校准观测。输入数据集采用Z-score标准化处理。研究以六个月为间隔采样年度数据以增强训练样本，共获得1,987个独特年度时间序列样本。为应对不同地点和时间S1观测数（T）的变化并满足深度学习并行计算需求，研究实施了固定长度（T_max）时间序列结构，超出T的时间点以占位值（-9999）填充并在模型计算中排除，T_max设为研究数据集中一年最多182次S1获取。

该新型时间序列反演模型基于Transformer架构，可处理可变时间序列长度（即固定时间序列长度T_max但含可变数量（T_max-T）填充值）。通过自注意力机制和掩码策略排除缺失观测的贡献，仅利用观测数据推导模型输出。模型结构包含两个编码、若干掩码Transformer块及输出层。两个编码分别处理时间序列影像块（T_max×20×20×4）和获取日期时间序列（T_max×2）两种不同输入结构。第一编码为CNN后接全局池化层以导出长度d的特征向量；第二编码为普通全连接网络。编码输出求和得到各时间点的单个特征向量（编码特征表示），输入掩码Transformer块。Transformer块包含自注意力、前馈、残差连接、Dropout和层归一化子层。自注意力机制中，每个Transformer块导出一组新的时间序列特征向量Z（T_max×d），各时间点需要T_max个注意力权重，共T_max×T_max个权重。掩码矩阵M（T_max×T_max）对缺失观测对应时间点赋大负值，使其对Softmax计算贡献 effectively 为零。最终所有最后一层Transformer块的输出特征向量通过全连接层连接输出土壤水分变量（m³/m³），输出层采用Sigmoid激活函数将输出约束于物理意义区间（土壤水分通常<0.7）。

训练采用传统小批量梯度下降法，损失函数为反演值与ISMN实测土壤水分间的均方根误差（RMSE）。学习率动态设置为随epoch线性预热后余弦衰减的函数，使用改进的Adam优化器（AdamW），其权重和偏置系数更新受L2正则化约束。CNN编码采用三层卷积层各后接2×2平均池化层；全连接编码同样为三层。通过实验确定的 Transformer块数为2，编码表示长度d为128，多头注意力头数为8。初始学习率0.0001，训练epoch 100，批量大小256，Dropout率0.2，L2参数0.0001。

模型应用时，以200×200 m²窗口在图像行列方向以200 m步长滑动获取必要影像块。给定S1获取日期，使用两个时间序列进行反演：同年1月1日至12月31日，以及当年7月1日至次年6月30日，最终反演结果为两个时间序列反演值的平均。

评估采用六折空间交叉验证，将181个ISMN站点随机分为六组，每组以其他五组训练的模型进行反演，确保训练和测试数据来自不同站点。重复六次使每组均作为测试组一次，得到34,711个样本的评估指标：皮尔逊相关系数（CC）、平均偏差、RMSE和无偏RMSE（ubRMSE）。与NASA SMAP/Sentinel-1 1 km和3 km产品的比较使用26,616个同时具有SMAP/S1产品的样本。

26,616个三个产品均有的样本比较结果显示，200 m土壤水分反演CC为0.581，ubRMSE为0.093 m³/m³，优于SMAP/S1 1 km产品（CC=0.416，ubRMSE=0.124 m³/m³）和3 km产品（CC=0.496，ubRMSE=0.113 m³/m³）。对于标记为"优质"的10,977个样本，200 m、1 km和3 km反演的CC分别为0.593、0.601和0.657，3 km产品略优于200 m和1 km；对于15,639个非"优质"样本，200 m反演表现最佳（CC=0.557，偏差-0.001，ubRMSE=0.095），而SMAP/S1产品CC仅0.312-0.408、ubRMSE 0.127-0.141。农田样本（11,463）和草地样本（12,111）间各产品精度无显著差异。

代表性站点半干旱地中海气候的Corvallis-10-SSW站和湿润副热带气候的Medford站，模型反演与观测季节性吻合良好，而SMAP/S1产品常低估冬季土壤水分；Bushland#1站和Youmans Farm站等反演较差站点，模型显示季节性波动但存在低估或高估，SMAP/S1产品则冬季低估且全年波动剧烈。96%站点土壤水分与ISMN有正相关，61%站点CC>0.5，54%站点CC≥0.6且ubRMSE<0.093，4%站点（7个）为负相关。

视觉评估选取南达科他州192 km²（12×16 km）和内布拉斯加州216 km²（12×18 km）两个农田区域。200 m土壤水分图的空间模式比1 km产品更接近真实彩色影像中的作物田块边界，表明模型能有效捕捉S1数据中的精细空间格局。S1数据不适于水体上空的土壤水分反演，故河流区域显示较低土壤水分。SMAP/S1产品中"优质"与"低质"反演比例约2:3，反映约40%像素为"优质"数据。

输入影像块尺寸敏感性分析显示，仅使用S1数据时200 m分辨率（平均CC=0.556，平均RMSE=0.095）略优于100 m（平均CC=0.541）和500 m（平均CC=0.548）；结合DEM时200 m分辨率表现最优（平均CC=0.574，平均RMSE=0.094），DEM整合略微提升了200 m分辨率模型估算土壤水分的相关性和一致性。

讨论部分指出，该模型核心优势在于利用Transformer架构处理不同地点年S1获取次数变化，通过全年S1数据表征季节植被动态，无需传统变化检测方法中两次获取间植被变化最小的假设。与SMAP/S1产品相比，模型在全部样本和"低质"样本上表现更优，在"优质"样本上与SMAP/S1相当；且模型独立于低分辨率SMAP数据，避免了SMAP/S1产品因需满足SMAP数据质量及S1与SMAP获取时间和入射角对齐等多重条件而导致仅约40%"优质"像素的问题。200 m空间分辨率使作物田块边界可辨识。

未来工作将探索更先进的物理预处理（如水体和城镇掩膜、角度归一化、斑点滤波）以及整合和谐陆地卫星与Sentinel-2（HLS）光学数据和NISAR L波段SAR数据以实现更精细时空分辨率的土壤水分制图。HLS数据有助于估算植被光学厚度，但其时间分辨率不足以保证与S1同日观测，需借助时间序列重建技术；NISAR L波段SAR（1.26 GHz，约24 cm波长）较C波段具有更强的植被和土壤穿透能力，有望实现更高空间分辨率的土壤水分反演。

研究结论部分指出，该新型土壤水分反演模型将经验变化检测方法从使用两次短时间间隔S1获取扩展至利用全年S1数据，通过深度学习消除了最小植被变化假设的需满足条件。目前美国本土尚无公开可用的基于变化检测的土壤水分产品，因此需要开展该方法与传统变化检测方法的比较研究以更好理解新方法的优缺点，此类比较研究亦可从NASA为SMAP验证设计的野外活动测量中获益。通过与NASA SMAP/S1产品比较发现，SMAP/S1标记为"非优质"的反演结果可能源于处理SMAP与Sentinel-1数据差异的算法局限，而非不利的S1观测条件，因为模型在"优质"和"非优质"标记数据上均获得了可比的精度。这些发现表明传统变化检测方法或可受益于植被季节动态信息的融入。未来路径包括改进工作流程以生成近实时的200 m土壤水分图，以及通过整合HLS光学和（可能的）NISAR L波段SAR影像增强时间序列深度学习模型，以生产更精细时空分辨率的土壤水分图。

联系信箱：

粤ICP备09063491号

热点排行