《Journal of Geophysical Research: Biogeosciences》:Improved Joint Estimation of Daily Actual Evapotranspiration and Gross Primary Production by Integrating Landsat, Sentinel-2, Sentinel-1, and Climate Data With Machine Learning
编辑推荐:
准确获取精细空间分辨率的蒸散发(ET)和总初级生产力(GPP)估算结果有助于理解水-碳相互作用,并优化水资源管理以提升生态与农业应用。然而,以往研究通常在相对较粗的空间或时间分辨率下单独估算ET或GPP,难以满足农业管理需求。此外,尽管Landsat可提供精细
准确获取精细空间分辨率的蒸散发(ET)和总初级生产力(GPP)估算结果有助于理解水-碳相互作用,并优化水资源管理以提升生态与农业应用。然而,以往研究通常在相对较粗的空间或时间分辨率下单独估算ET或GPP,难以满足农业管理需求。此外,尽管Landsat可提供精细尺度数据,但单一Landsat光学卫星可获取的观测数量有限。为应对这些问题,本研究尝试通过整合Landsat、Sentinel-2、Sentinel-1及气候数据,并采用机器学习方法,联合估算30米分辨率的日尺度实际ET和GPP。首先,利用线性模型和随机森林(RF)模型将多源光学与雷达数据融合为统一的Sentinel-2植被指数(VIs)。随后,采用双向迭代方法,结合气候数据与时序相邻的多源卫星VIs生成改进的日尺度VIs。最后,利用改进的日尺度VIs和气候数据联合估算日尺度实际ET和GPP。结果表明,双向迭代模型有效改进了日尺度VIs(R2 > 0.882;RMSE < 0.077)。与Sentinel-2及融合多源卫星VIs相比,利用改进的日尺度VIs后,日尺度实际ET和GPP的有效估算数量大幅增加(N = 23,669,对比3,657和8,771)。在六种评估的机器学习算法中,RF模型在估算ET(R2 = 0.815;RMSE = 0.716 mm/d)和GPP(R2 = 0.753;RMSE = 2.011 gC/m2/d)方面表现最优。该研究提出了一个可行的方法框架,用于联合估算30米分辨率的日尺度实际ET和GPP,在监测小尺度水分胁迫和植物生长方面具有巨大潜力。
该研究发表于《Journal of Geophysical Research: Biogeosciences》,旨在解决高分辨率水碳通量联合估算的关键科学问题。
研究背景方面,区域和全球尺度的植物生产力与生物量正日益受到干旱、极端温度事件和空气污染等灾害的威胁。植物通过光合作用吸收大气二氧化碳生成碳水化合物,同时在此过程中蒸腾水分,因此植物生物量与蒸散发(ET)代表的水分消耗以及总初级生产力(GPP)代表的碳吸收密切相关。基于过程的植物生长模型正是利用这些关系来模拟植物生物量。为获取准确的植物生物量估算,监测ET和GPP并将其用于优化植物生长管理至关重要。ET和GPP受地表特征和大气条件共同影响,如植被绿度、气温和太阳辐射,这构成了其遥感估算的物理基础。然而,以往研究中的常见问题在于ET和GPP常被单独估算,使用不同的卫星数据源和算法,而非在统一的方法框架内联合估算。这种分离的水碳通量估算会导致时空分辨率不一致,增加水分利用效率解释的难度,限制了其在生态和农业系统中的实际应用。虽然已有研究采用基于过程的生态系统模型进行ET和GPP的联合估算,但这些模型通常由粗空间分辨率的重分析数据驱动,限制了其在精细尺度生态和农业应用中的适用性。
现有遥感估算ET或GPP的算法主要包括半物理算法、基于过程的算法和经验算法三大类。半物理算法借助辐射传输模型估算水和碳通量;基于过程的算法试图将物理机制纳入ET和GPP估算模型;经验算法则直接利用遥感观测与ET、GPP之间的经验关系建立估算模型,因其简单、有效和易用而广受欢迎。随着人工智能技术的发展,机器学习方法越来越多地应用于表征这些经验关系,但关于哪种常用机器学习模型表现更优尚未达成共识。在数据源方面,MODIS光学图像被广泛用于建立地表通量模型,但其受云和云阴影影响,且空间分辨率仅为500-1000米,导致ET和GPP产品时空分辨率较粗。尽管Landsat和Sentinel-2等精细分辨率卫星可用于估算ET或GPP,但单一光学卫星回访周期较长,云和云阴影进一步减少了可用观测数量。Sentinel-1 SAR卫星的发射实现了10米分辨率的全天候观测,为精细尺度光学数据提供了有价值的补充,但将其整合用于联合估算精细尺度ET和GPP的研究尚未见报道。
研究人员开展了以下研究:首先整合Landsat-7/8/9光学数据与Sentinel-1 SAR数据以提高植被指数观测频率,然后利用气候数据和时序相邻的多源卫星VIs通过双向迭代方法生成改进的日尺度VIs,最后基于改进的日尺度VIs和气候数据联合估算ET和GPP,并比较六种机器学习模型的性能。研究得出以下主要结论:双向迭代模型显著提高了日尺度VIs的精度;改进的日尺度VIs使有效ET和GPP估算数量大幅增加;RF模型在ET和GPP估算中表现最优;该框架具有监测小尺度水分胁迫和植物生长的巨大潜力。这一研究对于精准灌溉、干旱监测和作物产量预测等农业应用,以及理解生态系统水碳耦合过程具有重要意义。
主要关键技术方法包括:研究使用北美地区47个涡度相关通量站2016至2022年的数据,涵盖常绿针叶林、落叶阔叶林、稀树草原、草地、农田、湿地、开阔灌木林和木本稀树草原等8种植被类型,共168个站点年数据。卫星数据包括通过Google Earth Engine获取的Landsat-7/8/9大气层顶反射率数据、Sentinel-2反射率数据,以及Sentinel-1 SAR后向散射系数数据。气候数据为Daymet数据集提供的日太阳辐射、最低和最高气温、水汽压和白天时长。研究人员采用线性回归校正整合Landsat与Sentinel-2数据,利用RF模型将Sentinel-1 SAR数据整合为统一的Sentinel-2 VIs。通过RF算法建立初始日VIs生成模型,再采用基于RF的双向迭代时间重建方法,结合前向和后向迭代生成改进的日尺度VIs。最后使用改进的日尺度VIs和气候数据,基于六种机器学习模型联合估算ET和GPP,采用10折交叉验证评估模型性能。
研究结果部分按照以下小标题展开:
"利用基于RF的双向时间重建方法结合时序相邻多源卫星VIs改进日尺度VIs":线性校正后的Landsat-7 VIs与Sentinel-2 VIs具有高度一致性,EVI2的R
2达0.801,NDWI为0.871,NIRv为0.839。Landsat-8/9数据也可准确整合入统一的Sentinel-2 VIs,R
2范围为0.836-0.904。Sentinel-1 SAR数据生成的VIs与Sentinel-2 VIs相比具有合理精度,EVI2的R
2为0.663,NDWI为0.716,NIRv为0.628。VIs与气候数据存在显著相关关系,EVI2与最低气温相关性最高(r = 0.602)。基于气候数据生成的初始日VIs精度有限,EVI2的R
2为0.614。而时序相邻VIs间存在显著相关(r > 0.79)。双向迭代模型进一步提升了日VIs精度,EVI2的R
2达到0.892,NDWI为0.899,NIRv为0.882,优于前向或后向单一迭代模型。
"利用改进的日VIs、仅Sentinel-2 VIs及融合多源卫星VIs数据估算ET和GPP":仅使用气候数据的ET模型验证R
2为0.768,仅使用改进日VIs为0.492,而联合使用气候数据和改进日VIs后ET估算精度提升至R
2 = 0.815、RMSE = 0.716 mm/d、MAE = 0.504 mm/d。GPP估算呈现类似规律,联合模型验证R
2 = 0.753、RMSE = 2.011 gC/m
2/d、MAE = 1.307 gC/m
2/d。相比初始日VIs,改进日VIs显著提升了ET和GPP估算精度。与仅Sentinel-2 VIs(有效样本N = 3,657)和融合多源卫星VIs(N = 8,771)相比,改进日VIs大幅增加了有效估算数量(N = 23,669),同时保持了相似或更优的估算精度。
"不同模型的性能比较":在六种测试的机器学习模型中,RF模型表现最佳,ET估算R
2 = 0.815,GPP估算R
2 = 0.753。次优模型为SVM,RF模型相较SVM使ET的RMSE和MAE分别降低10.72%和10.32%,GPP分别降低12.18%和14.30%。
讨论部分主要涵盖以下方面:研究意义方面,精细分辨率日尺度ET和GPP估算对精准灌溉、产量监测和预测日益重要,本研究首次将多源异构光学与SAR数据联合用于提高实际日ET和GPP估算的有效观测数量,提出的框架可生成改进的日VIs从而联合估算ET和GPP。威斯康星州农田的案例显示30米分辨率ET和GPP空间分布清晰,季节验证表明夏季误差最大、冬季最小。VIs与气候数据的强季节相关性为利用气候数据增强VIs重建提供了物理基础,两者共同作为输入显著提升了ET和GPP建模精度。
数据不确定性及其影响方面,Sentinel-2大气层顶反射率不确定性不超过5%,卫星VIs经双向迭代模型处理后精度较高,对ET和GPP估算影响较小。Daymet数据集精度较高,但1千米分辨率气候数据重采样至30米可能在地表异质区域引入不确定性。未来需发展日尺度30米分辨率气候数据集。Sentinel-1衍生VIs与光学VIs相关性相对较低,但通过双向迭代方法结合时序相邻多源光学观测和气候数据进一步改进后,引入的不确定性对后续ET和GPP估算影响较小。
不同模型比较方面,RF模型表现最优的原因包括:集成多棵决策树减少过拟合并提高泛化能力;能有效处理多维非线性关系;对噪声和异常值具有鲁棒性;且可并行化处理适用于遥感大数据。其他五种模型在处理复杂、高维、非线性和异构数据集时建模能力和估算精度通常低于RF集成模型。
与前期研究对比方面,传统VIs时间重建方法未整合气候数据,而本方法融合气候驱动因素和机器学习框架。MODIS与Landsat/Sentinel-2的时空融合模型无法整合SAR数据,且近期研究表明融入气候数据的重建VIs精度优于七种时空融合模型。空间交叉验证显示ET估算R
2 = 0.712,GPP估算R
2 = 0.617。与仅Sentinel-2 VIs和融合多源卫星VIs相比,改进日VIs的空间交叉验证精度相当但有效样本量大幅增加。不同生物群落中农田水碳通量估算不确定性最大,主要由于作物光合效率较高且受农业管理措施显著影响。
未来工作建议方面,研究人员指出需收集更多实测数据扩展模型适用范围;建议融合机器学习与基于过程的算法以平衡估算精度与物理机制;提出整合多源ET和GPP遥感产品并利用预训练深度学习模型进行迁移学习;讨论了近邻效应和分别建模带来的不确定性及潜在改进方向;分析了粗粒度到细粒度分解策略的挑战;建议结合作物生长模型模拟深入探究作物产量与ET、GPP的定量关系。
研究结论部分:本研究通过整合Landsat、Sentinel-2、Sentinel-1及气候数据,利用机器学习方法在北美地区联合估算日尺度实际ET和GPP,改进了估算精度。首先将Landsat-7/8/9光学数据和Sentinel-1 SAR后向散射系数分别整合为统一的Sentinel-2 VIs;其次利用气候数据与多源卫星整合VIs的关系生成初始日VIs;进而采用双向迭代模型结合初始日VIs与时序相邻真实多源卫星VIs观测生成改进的日VIs,该模型比单向迭代模型精度更高。改进的日尺度EVI2验证R
2为0.892、RMSE为0.051、MAE为0.034;NDWI的R
2 = 0.899、RMSE = 0.077、MAE = 0.053;NIRv的R
2 = 0.882、RMSE = 0.030、MAE = 0.018。基于改进的日VIs和气候数据联合推导日尺度实际ET和GPP,有效估算数量较仅Sentinel-2 VIs(N = 3,657)和融合多源卫星VIs(N = 8,771)大幅增加至23,669,同时保持了相似估算精度。RF模型在ET(R
2 = 0.815,RMSE = 0.716 mm/d,MAE = 0.504 mm/d)和GPP(R
2 = 0.753,RMSE = 2.011 gC/m
2/d,MAE = 1.307 gC/m
2/d)估算中均优于其他五种评估模型。因此,该研究推荐使用RF模型进行水碳通量建模。
本研究在日尺度实际ET和GPP联合估算方面的改进主要包括四个方面:利用多源光学和SAR卫星提高VIs观测频率;利用气候数据和时序相邻真实多源卫星VIs生成改进的日VIs;利用改进的日VIs增加日尺度实际ET和GPP有效估算数量;以及利用RF模型提升ET和GPP估算精度。总体而言,该研究提出了一个高效的框架以联合估算精细尺度日尺度实际ET和GPP,促进了精准灌溉、干旱监测和作物产量预测等农业应用。