基于智能学习的不同土壤特性的光滑干燥土壤表面的光谱反射率模型 马静文、 李向东、 邱欣欣、 吴卓、 李炳泽、 李新彪、 严璐璐、 姜然哲、 陈思、 郑兴明 + 其他6位作者

《Sensors》:A Spectral Reflectance Model of Smooth Dry Soil Surfaces for Varied Soil Properties Based on Intelligent Learning Jingwen Ma, Xiangdong Li, Xinxin Qiu, Zhuo Wu, Bingze Li, Xinbiao Li, Lulu Yan, Ranzhe Jiang, Si Chen and Xingming Zheng + 6 authors

【字体: 时间:2026年04月30日 来源:Sensors 3.5

编辑推荐:

  **亮点** **主要发现是什么?** 基于智能学习方法开发了一种干土壤反射模型(EEDSR),通过纳入母质和地理位置信息提高了模型的准确性。使用ISRIC数据库在全球范围内验证了EEDSR的适用性和泛化能力。 **主要发现的意义是什么?** EEDSR支持对土

  **亮点**
**主要发现是什么?**
基于智能学习方法开发了一种干土壤反射模型(EEDSR),通过纳入母质和地理位置信息提高了模型的准确性。使用ISRIC数据库在全球范围内验证了EEDSR的适用性和泛化能力。

**主要发现的意义是什么?**
EEDSR支持对土壤反射率的准确建模,有效解决了冠层辐射传输模型中的简化问题。该模型为精准农业和土壤属性反演提供了技术支持,增强了人们对土壤物理化学性质与光谱特征之间复杂关系的理解。

**摘要**
干土壤的光谱反射率为表征土壤光学性质和利用遥感技术获取土壤属性提供了稳定的基准。然而,尽管关于土壤光谱反射率的研究很多,但大多数现有研究主要集中在光谱与土壤属性之间的经验关系上。在环境因素影响下,干土壤反射率的表示和预测仍不够充分,现有模型的泛化能力也有待提高。因此,本研究收集了来自中国东北地区的700个干土壤样本,并使用SHAP方法定量分析了环境协变量(土壤性质、母质和地理位置)的贡献。随后,基于梯度提升回归(GBR)开发了一个涵盖400–2500纳米波长的环境和土壤因素驱动的平滑干土壤反射模型(EEDSR),并使用全球ISRIC土壤数据集对其准确性进行了评估。研究结果表明:
(1) 干土壤的反射率与可见光到短波红外(VIS至SWIR)范围内的土壤性质密切相关;400–2500纳米波长的干土壤反射率与粘土含量、经度和母质呈正相关,而与纬度、沙粒含量和粉粒含量呈负相关;其与其它变量(如土壤有机质、pH值和电导率EC)的相关性随波长而变化。
(2) EEDSR模型在400–2500纳米光谱范围内的预测准确性很高(R2 = 0.93,RMSE = 0.018);加入母质和地理因素后,干土壤反射率预测的准确性提高了13.4%。
(3) 中国东北地区预测的土壤反射率与卫星观测结果的空间一致性表明,EEDSR模型在预测土壤反射率方面表现良好,从西到东反射率的逐渐增加与该地区的降水量分布一致。
(4) 全球ISRIC数据集的验证表明,EEDSR模型的泛化能力较强(R = 0.94),优于基于深度学习的土壤光学生成模型(SOGM,R = 0.27)。

**总体而言,**本研究提出了一个高效且易于解释的干土壤光谱反射率建模框架,为土壤反射率预测和基于遥感的土壤属性反演提供了可靠的参考。

**1. 引言**
土壤光谱反射率反映了土壤表面反射入射辐射的能力,是揭示土壤组成和表面性质的关键参数。土壤的反射率提供了有关其矿物组成、质地结构、有机质含量和盐度条件的宝贵信息,从而反映了其物理和化学性质。准确的土壤反射率模型在多种应用中具有重要意义,包括土壤物理化学性质的获取、土地退化评估以及土壤盐碱化的监测。因此,开发高精度的土壤反射率建模方法至关重要。

**土壤反射率受多种因素共同控制,**这些因素可大致分为环境因素、矿物组成、土壤物理性质和土壤化学性质。
**在环境因素中,**母质反映了该地区的成土过程和物质来源,被认为是重要的成土因素。研究表明,母质会影响土壤组成和光学性质,进而影响干旱和半干旱环境中短波红外(SWIR)光谱行为。虽然母质不是土壤形成的唯一或主导因素,但它仍然是解释土壤变异性的重要因素。
**观测条件包括观测几何结构(入射角、观测角度和相对方位角)、地形、天气和光照,**这些因素虽然不会改变土壤的固有性质,但会改变光与土壤表面的相互作用,影响光谱曲线的形状。因此,它们是不同观测条件下同一土壤光谱不一致性的重要外部因素。矿物组成是近红外(NIR)和短波红外(SWIR)区域吸收特征的主要决定因素。粘土矿物、碳酸盐和铁氧化物具有特征性的吸收位置,其丰度和类型——受成土环境的影响——直接决定了相应波段的吸收深度和形态。
**土壤物理性质中,**表面粗糙度通过改变光散射路径和反射方向影响反射强度和光谱行为。土壤湿度会增加光谱吸收并减少散射,导致土壤反射率总体下降,尤其是在近红外-短波红外(NIR-SWIR)区域。粘土、粉粒和沙粒的比例主要通过改变土壤结构和孔隙度来影响光谱响应,从而间接影响可见光(VIS)和红边波段的反射率。
**关于土壤化学性质,**土壤有机质(SOM)在可见光区域表现出强吸收,显著降低反射率。土壤pH值反映化学活性,并影响特定矿物官能团的吸收特性。电导率(EC)会显著改变可见光和短波红外区域的反射率。

**土壤反射率建模方法**大致可分为三类:经验模型、物理模型和智能学习模型。经验模型主要通过统计关系或经验函数描述土壤光谱反射率与土壤组成或观测条件之间的关系;Price模型建立了反射率与土壤组成变量之间的经验回归关系;General Spectral Vectors(GSV)模型将光谱反射率映射到向量空间,以表示不同土壤条件下的光谱差异;Walthall模型拟合经验函数来描述反射率、观测几何结构和土壤表面条件之间的关系。
**物理模型基于辐射传输理论,**模拟光与物质之间的相互作用,并从物理机制角度模拟土壤反射率的形成过程。具体来说,Hapke双向反射模型描述了颗粒尺度上的光吸收和多次散射过程;多层分析不均匀目标辐射模型(MARMIT)使用多层辐射传输框架表示反射率形成,考虑了不同土壤层的贡献;其改进版本MARMIT-2进一步纳入了界面效应和更复杂的多次散射过程;双线性土壤模型(BSM)通过线性和非线性机制的结合来描述土壤成分对反射率的综合影响。
**智能学习模型以数据驱动的方式建立土壤性质与光谱反射率之间的非线性关系。**土壤光学生成模型(SOGM)利用机器学习方法学习输入土壤特征与输出光谱反射率之间的复杂映射关系,实现反射率的生成和预测。

**随着建模方法的进步,**准确模拟干土壤反射率对于深入理解土壤光谱机制至关重要。与湿润土壤相比,干土壤的反射率更清晰地揭示了其内在的光学性质。干土壤反射率被广泛视为土壤光谱建模和遥感应用中的基准参数,不仅反映了土壤组成和结构的固有信息,还为模拟不同湿度条件下的光谱动态提供了基础。基于经验方法的GSV模型通过矩阵分解提取三个代表性的干土壤向量来模拟干土壤光谱;物理模型则通过明确描述光与土壤颗粒之间的相互作用,从辐射传输理论推导出土壤反射率。Hapke模型及其改进版本是平衡物理可解释性和计算效率的半经验物理模型,通过纳入光学常数(n和k)、颗粒大小分布和几何参数来模拟多次散射和吸收过程,重建干土壤的双向反射率。基于Hapke框架,SOILSPECT模型引入勒让德多项式来近似土壤表面散射特性;后续研究使用SOILSPECT考察了不同表面粗糙度条件下土壤的双向反射行为。随着人工智能的发展和大规模数据集的普及,智能学习方法(尤其是机器学习和生成模型)越来越多地应用于土壤反射率建模。与传统物理模型不同,这些方法不依赖于预定义的物理方程,而是直接从大量光谱样本中学习非线性映射关系。BSM将土壤光谱分解为亮度和光谱形状两个关键组成部分,并使用从大量干土壤库中获得的经验主成分函数重建反射率曲线,仅需少量参数即可高效模拟自然干土壤的光谱变异性。SOGM进一步实现了根据选定土壤属性生成干土壤光谱的功能。

**尽管已经开发了一系列干土壤反射率模拟方法,**但仍存在一个持续挑战:缺乏将土壤性质与反射率直接且一致联系起来的机制,这限制了实现精确像素级模拟和更广泛遥感应用的能力。
**大多数冠层辐射传输模型(如PROSPECT [35]、4SAIL [36] 和LESS [37])通常使用实验室测量的或从光谱库中获得的指定土壤光谱曲线来简化土壤反射率,**这种简化忽略了土壤物理化学性质(如土壤质地、有机质、盐度和母质)与光谱反射率之间的复杂耦合,因此无法捕捉不同地区和土壤类型的干土壤光谱变异性。因此,准确表征干土壤反射率的空间变异性并开发出既可解释又能泛化的建模框架成为土壤光谱建模中的主要挑战。**

**本研究聚焦于中国东北地区的农田土壤,**提出了一种环境驱动的智能预测模型(EEDSR)。该模型结合了多种信息来源(包括土壤物理化学性质、空间坐标和母质),以表征干土壤反射率的空间变异性。预测的干土壤反射率旨在作为冠层辐射传输模型的更丰富输入,不仅替代了传统的简化光谱曲线,还揭示了驱动光谱变化的关键土壤性质,从而实现对光谱模拟和土壤性质表征的统一理解。在此基础上,干土壤反射率可作为进一步模拟不同湿度条件下湿润土壤光谱特性的基准,支持对土壤光谱动态的全面表征。这些变量不是作为独立特征进行处理,而是被解释为对土壤形成和空间异质性的不同程度的影响因素。具体来说,土壤物理化学性质代表局部土壤条件,地理坐标捕捉空间梯度,母质反映了成土背景信息。通过整合这些多源环境控制因素,EEDSR模型提高了土壤反射率模拟的准确性和泛化能力,实现了更符合物理规律的土壤光谱变异性建模,减少了当前冠层辐射传输模型中常见的简化,并为模拟不同湿度条件下的土壤光谱响应提供了可靠的基础。2.2.1. 田间土壤数据(1)土壤样本的采集与处理
本研究汇总了2017年5月至2024年5月期间在中国东北地区采集的土壤样本,共包括三次野外采样活动。其中,2017年在东北地区采集了122个样本,2021年在四合镇采集了499个样本,2024年在龙赵镇、乌兰图嘎镇和黑林子镇采集了80个样本,总计700个土壤样本。采样地点的空间分布如图1所示。

图1. 研究区域及土壤采样点的空间分布。主图显示了中国东北地区黑龙江、吉林和辽宁三省的土壤pH值(范围为4.9–9.0)。绿色点表示土壤采样位置,青色线条表示省级边界。左上角的插图显示了研究区域在中国境内的位置。子图(a–d)展示了四个代表性采样区域的高分辨率遥感图像:(a)大安,(b)齐国,(c)榆树,(d)公主岭。绿色点标记了每个区域的采样点。比例尺单位为英里。

为了提高地面样本的代表性,在选择采样地点时综合考虑了土壤类型、颗粒大小(PM)及其他环境因素,以确保这些地点能够反映中国东北地区典型农田土壤的空间变异性。采样点的纬度范围为40.94°N至46.87°N,经度范围为121.83°E至130.67°E,涵盖了辽宁、吉林和黑龙江三省的典型农田土壤类型,从而捕捉到了这些地区农田土壤的空间异质性。在每个农田地块内,设置了30米×30米的采样区域,并采用五点采样方法采集了0–5厘米深度的表层土壤样本。所有混合后的土壤样本在实验室中混合均匀,去除杂质后于85°C下烘干,并通过2毫米筛网过滤。每个混合土壤样本被分成两部分,分别用于实验室物理化学性质分析和光谱测量。pH值按照ISO 10390:2021标准进行电位法测定[39]。土壤有机质(SOM)采用外部加热重铬酸钾氧化法测定[40]。颗粒大小分布根据ASTM D7928标准通过比重计方法分析[41,42]。电导率(ECe)则使用标准饱和土壤浆提取法测定[43]。图2展示了各项物理化学性质的分布范围和样本数量。平均黏粒、粉粒和砂粒含量分别为20.93%、50.40%和28.67%,其变化范围分别为2.17–43.98%、9.01–59.46%和8.30–88.82%。土壤有机质、电导率和pH值的平均值分别为3.40克/千克、0.15 dS·米和6.52,其相应变化范围分别为0.12–23.08克/千克、0.01–1.60 dS·米和5.46–8.89。主要的土壤类型包括白化土、草地土和黑土,这些土壤主要形成于富含黏粒的黄土(来源于珊瑚礁沉积物)、冲积-坡积沉积物以及风化后的浅色结晶岩。

(2)室内土壤光谱反射率
土壤样本的光谱反射率测量是在一个暗室中使用的ASD FieldSpec-4光谱辐射计(Analytical Spectral Devices, Inc., Boulder, CO, USA)上进行的,测量波长范围为350–2500纳米。每个土壤样本被放置在一个直径60毫米、深度10毫米的黑色培养皿中,以确保表面均匀平整。图3展示了12个具有明显颜色差异的土壤样本,进一步体现了本研究中使用的数据集的异质性和代表性。在光谱采集过程中,光纤探头垂直安装在样本表面上方3厘米处,以保持测量几何结构的稳定性。为减少测量误差,仪器在数据采集前预热30分钟,并每30分钟进行一次白色参考校准,以抑制信号漂移和减少噪声。每个土壤样本分别测量10次,每次间隔1秒,最终使用平均光谱值作为该样本的反射率[44]。总共对所有700个土壤样本进行了光谱反射率测量。

2.2.2. ISRIC数据
国际土壤参考与信息中心(ISRIC)是一个全球性的土壤光谱和物理化学性质数据存储库,整合了来自世界各地不同地理区域的土壤信息[45]。该数据库已被广泛用于土壤光谱建模和遥感反演研究。ISRIC在ICRAF实验室使用ASD FieldSpec FR光谱辐射计测量了400–2500纳米范围内的反射光谱。

2.2.3. 中国东北地区农田的土壤性质
为了空间表征中国东北地区农田干燥土壤的反射率,本研究旨在利用环境和土壤相关协变量来预测干燥土壤的光谱反射率。具体选取了十个代表性特征作为输入变量,包括黏粒含量、粉粒含量、砂粒含量、电导率(EC)、pH值、土壤类型和母质(PM),这些数据来源于空间分辨率为1公里的Harmonized World Soil Database版本2.0(HWSDv2.0)[46]。此外,土壤有机质(SOM,单位:克/千克)数据也来自同一空间分辨率的中国土壤有机质数据集[47]。基于这些变量,首先生成了中国东北地区土壤性质和环境协变量的空间分布图,然后将其整合并作为模型输入,以预测区域尺度的干燥土壤反射率。最终得到了中国东北地区农田干燥土壤反射率的连续空间分布图。

所有数据集首先被重新投影到统一的UTM坐标参考系统中,并重新采样到1公里×1公里的空间分辨率,以确保空间一致性。根据标准化栅格数据,在投影坐标系统内计算每个像素中心的地理坐标,生成相应的经度(Lon)和纬度(Lat)栅格层。最后,将所有十个预测变量进行空间配准并叠加成一个多波段栅格数据集,用于后续的模型输入。利用统一的空间分辨率和对齐的多波段栅格数据集,采用机器学习算法对干燥土壤反射率进行逐像素建模。这种方法实现了对中国东北地区农田干燥土壤反射率的连续空间预测,从而有助于准确模拟区域尺度的土壤光谱特征。

2.2.4. Sentinel-2地表反射率
S2_HARMONIZED反射率数据被用来生成农田裸土的最大反射率,作为与EEDSR模型模拟的干燥土壤光谱反射率进行比较的参考。S2_HARMONIZED数据集已经过全面的辐射度、大气和几何校正,因此可以直接用于合成处理。值得注意的是,第10波段(1375纳米)专门用于卷云检测,在后续分析中被排除[48]。选取了2015年至2025年春季耕作期(4月1日至5月20日)获取的图像。春季耕作期通常对应于作物尚未生长或植被覆盖度非常低的阶段,在此期间地表主要为裸土且相对平坦,有利于在区域尺度上获得可比的裸土反射率信息。云覆盖度超过10%的图像被舍弃。此外,还使用了场景分类层(SCL)来屏蔽不透明的云层和卷云,确保提取的像素不受云层污染。在反射率的时间合成过程中,应用了第90百分位数方法[49](P90,定义为时间序列中反射率分布的第90百分位数,表示为rP90),以减轻云层、雾霾、作物残余物和传感器不确定性的影响,从而得到稳健的最大反射率合成图像。

(1)表示波段b和时间t处像素的反射率,T表示该像素在研究期间的有效观测总数。为了消除非农田和植被覆盖的影响,根据ESA World Cover 2020数据集[50]得出的农田范围,并结合归一化植被指数(NDVI)阈值(NDVI < 0.2)[51]进行掩膜处理[50]。合成后的反射率被均匀重采样到1000米的空间分辨率。在重采样过程中,仅保留了经过掩膜处理的有效像素;Google Earth Engine在统计处理过程中自动排除了NoData值,因此对于被云层或非农田土壤掩膜遮挡的像素没有进行插值或填充处理。

2.2.5. 降水量数据和地表土壤湿度数据
降水量数据来自CHIRPS(Climate Hazards Group红外降水与站点数据),这是由加州大学圣塔芭芭拉分校(UCSB CHG)的气候灾害小组发布的每日降水量产品。该数据集整合了卫星遥感和地面气象站观测数据,覆盖范围从1981年延续至2025年,空间分辨率为大约5公里,时间分辨率为每日一次,非常适合区域尺度的降水量分析[52]。地表土壤湿度数据来自欧洲中期天气预报中心(ECMWF)生成的ERA5-Land再分析数据集,使用了0–7厘米深度土壤层的每日数据,对应的变量为volumetric_soil_water_layer_1(单位:立方米/米3)。ERA5-Land通过在一个基于物理的陆地表面建模框架内融合多源气象观测数据,提供了空间和时间上一致的土地表面变量,适用于区域尺度的土壤湿度分析。ERA5-Land的空间分辨率为大约9公里,时间分辨率为每日一次,数据记录从1981年开始连续至今[53]。

2.3. 干燥土壤反射率建模方法
本研究中的干燥土壤反射率模型构建主要包括三个部分(图4):数据收集、模型构建以及模型评估和适用性验证。首先,采集并处理土壤样本,以获得土壤的物理和化学性质以及实验室测量的光谱反射率,形成本研究的基础数据集。接下来,分析了土壤性质与土壤反射率之间的相关性,并基于梯度提升回归(GBR)方法构建了一个干燥土壤反射率预测模型,称为环境和土壤因素驱动的平滑干燥土壤反射率模型(EEDSR)。最后,使用ISRIC数据库验证了模型的泛化能力和实际适用性。此外,还将中国东北地区模型预测的干燥土壤反射率(rEEDSR)与Sentinel-2最大反射率合成图像(rS2_P90)进行了比较,进一步证明了模型的适用性和稳健性。

2.3.1. 基于相关性和重要性的模型指标
土壤的物理化学性质影响地表特性,这些特性在微观尺度上调节电磁波的散射和吸收过程。这些相互作用在宏观上表现为不同的光学行为,产生覆盖可见光到短波红外(VIS到SWIR)区域的特征光谱反射率曲线[54]。基于以往的研究成果[55],本研究选择了十个预测干燥土壤反射率的特征:土壤质地成分(黏粒、粉粒和砂粒)、土壤有机质(SOM)、pH值、电导率(EC)、土壤类型和母质(PM),以及经度(Lon)和纬度(Lat)。为了定量评估土壤特征与光谱反射率之间的关系,计算了每个土壤性质与350–2500纳米波长范围内反射率之间的皮尔逊相关系数(R)。每个波长的R值使用以下公式计算:

其中,表示第j个土壤属性与波长处的反射率之间的皮尔逊相关系数;表示第i个样本在第j个土壤属性和波长处的反射率值(j = 1, 2, …, 10);表示第j个土壤属性在波长处的平均值;n表示样本总数。

此外,还采用了Shapley Additive Explanations(SHAP)方法来分析每个特征对干燥土壤反射率的重要性和平均贡献,从而识别关键驱动因素并阐明其背后的机制[56]。

2.3.2. 环境和土壤因素驱动的平滑干燥土壤反射率模型(EEDSR)
根据皮尔逊相关分析和SHAP重要性的结果,选择了第2.3.1节中描述的十个特征作为输入变量,用于预测不同波长的干燥土壤反射率。应用梯度提升回归(GBR)框架开发了一个环境和土壤因素驱动的平滑干燥土壤反射率模型(EEDSR)。在350–2500纳米范围内,每隔10纳米建立一个独立模型,共得到了215个特定波长的子模型。数据集被随机分为训练集(70%)和测试集(30%)。为了减轻由于样本分布不均可能导致的偏差,在模型训练期间应用了基于电导率(EC)的分层采样策略,以确保表示的平衡,从而最小化其对模型开发的影响。通过在训练集上使用网格搜索结合10折交叉验证来优化超参数。对于全光谱的215个子模型,超参数是独立调整的,表1展示了从Sentinel-2中心波长得出的超参数范围。为了平衡计算效率和建模一致性,超参数搜索空间基于Sentinel-2的优化结果进行了限制。这些波段覆盖了可见光、近红外和短波红外区域,有效地代表了控制土壤反射率变化的关键光谱域,使得参数范围可以用于全光谱优化。搜索空间包括提升树的数量(n estimators = 900, 1100, 1300)、学习率(0.01, 0.05, 0.1)、最大树深度(max depth = 5, 6, 7)、分割内部节点的最小样本数(min samples split = 2, 5, 10)以及每个叶子的最小样本数(min samples leaf = 1, 2, 4)。每个特定波长的子模型都在这个受限的搜索空间内独立优化。最终选择了具有最佳平均交叉验证性能的超参数集来构建模型。使用决定系数(R2)和均方根误差(RMSE)在独立测试集上评估了模型性能,以量化整个光谱范围内干土壤反射率预测的准确性和稳健性。表1. 最优参数(基于Sentinel-2中心波长)。

2.4. EEDSR的准确性评估
为了验证所提出的EEDSR模型在异构数据上的预测可靠性和适用性,采用了SGOM作为基准进行比较。SGOM是一个基于物理信息的、数据驱动的生成框架,它根据土壤的物理化学性质从可见光(VIS)到短波红外(VIS–SWIR)区域合成干土壤反射光谱。它结合了光谱嵌入编码和基于扩散的重建过程来生成土壤反射光谱[28]。SGOM在一个包含大约180,000个样本的全球数据库上进行了训练,这些样本来自17个土壤光谱数据集,展示了在光谱生成和重建方面的强大能力,有效地捕捉了土壤属性与光谱响应之间的复杂非线性关系。为了确保与模型输入要求的兼容性,并在异构条件下进行公平和一致的比较,从ISRIC全球土壤数据库中选择了70个样本。这些样本来自六个国家:中国(n = 20)、美国(n = 15)、匈牙利(n = 10)、赞比亚(n = 8)、阿曼(n = 7)和罗马尼亚(n = 10),代表了与EEDSR区域训练域不同的多种土壤类型和环境设置。所有选定的样本同时包含了完整的土壤物理化学性质(粘土、粉砂、沙子、有机质SOM、pH值和电导率EC)以及覆盖400–2500纳米波长范围的测量光谱反射数据。

EEDSR和SGOM都在相同的输入约束下进行了评估,使用了相同的土壤属性集、相同的光谱范围(400–2500纳米)和相同的样本划分策略。模型预测的干土壤反射光谱与相应的ISRIC参考光谱进行了比较,从而建立了一个独立的、异构的验证框架,用于评估模型在不同地理和环境条件下的泛化能力和适用性。

3. 结果
3.1. 模型指标的皮尔逊相关性和基于SHAP的重要性
十个特征在350–2500纳米的光谱范围内与干土壤反射率表现出不同的皮尔逊相关性(图5)。粘土、经度(Lon)和母质(PM)在整个光谱范围内与反射率呈正相关,且随着波长的增加相关性增强。相反,粉砂、沙子、pH值和土壤类型通常呈负相关。其中,粉砂和pH值的绝对相关性随波长增加而增加,而沙子和土壤类型在波长上的变化最小。土壤有机质(SOM)和纬度(Lat)在可见光(VIS)区域与反射率呈负相关,但在近红外–短波红外(NIR–SWIR)区域呈现弱正相关。电导率(EC)在VIS区域呈正相关,在NIR–SWIR区域则变为弱负相关。总体而言,这些结果表明土壤特征与光谱反射率之间的相关性依赖于波长,突显了波长对土壤光谱响应模式的显著影响。

基于皮尔逊相关性分析,进一步采用了SHAP(Shapley Additive Explanations)方法来评估这些特征对干土壤反射率预测的总体重要性和贡献(图6)。结果表明,所有特征都对干土壤反射率的预测有所贡献,其重要性从高到低排序如下:经度(Lon)、纬度(Lat)、粉砂、粘土、有机质SOM、母质PM、电导率EC、沙子、pH值和土壤类型。空间因素(经度和纬度)的贡献最大,其次是土壤质地成分,最后是土壤化学性质和土壤类型。总体而言,选定的十个特征显示出很强的合理性,这一点通过相关性和重要性分析得到了验证。这些发现揭示了光谱带依赖性和干土壤反射率的多因素驱动因素,为构建干土壤反射率模型提供了坚实的理论和实证基础。

3.2. 使用EEDSR模型的干土壤反射率性能
对EEDSR模型在训练和测试数据集上的性能评估显示,R2值最初较低,然后随着波长在VIS–SWIR光谱区域的增加而上升并稳定(图7a)。在较短波长处RMSE相对较低,在大约600至1000纳米之间显著上升,随后在较长波长处下降,保持在较低水平(图7b)。总体而言,EEDSR模型表现出高拟合准确性和稳定性,在400–2500纳米波长范围内,两个数据集的平均R2值为0.93,平均RMSE值为0.018。

使用EEDSR模型对干土壤反射率的预测性能在12个Sentinel-2光谱带进行了评估,使用了训练和测试数据集。在可见光(VIS)波段(443、490、560和665纳米;图8a–d),决定系数(R2)的范围为0.76至0.83,均方根误差(RMSE)值在0.01至0.02之间。在红边波段(705、740和783纳米;图8e–g)观察到性能提升,其中R2通常超过0.84,RMSE保持在0.02附近。在近红外(NIR)波段(842、865和945纳米;图8h–j),R2进一步增加,始终超过0.88,RMSE值在0.01至0.02范围内。短波红外(SWIR)波段(1610和2190纳米;图8k,l)表现出最高的拟合准确性,R2超过0.96,RMSE保持在较低水平。这些发现共同证明了EEDSR模型在多光谱Sentinel-2波段上的稳健性和可靠性,突显了机器学习方法在干土壤反射率建模方面的潜力。

3.3. EEDSR模型的外推能力:与SGOM的比较
在相同的输入条件下,使用ISRIC数据库比较了EEDSR和SGOM的干土壤反射率模拟(图9)。尽管本研究没有完全复制SGOM的完整训练条件,但在一致的输入参数下可以直接进行性能比较。结果表明,EEDSR与测量反射率的相关系数显著更高(R = 0.94, RMSE = 0.038, ubRMSE = 0.038),而SGOM的相关系数为R = 0.27, RMSE = 0.218, ubRMSE = 0.143。EEDSR在再现观察到的土壤反射率方面表现出更好的保真度,而SGOM则存在一定的偏差,这可能是由于输入属性有限所致。总体而言,这些发现表明所提出的EEDSR具有很强的泛化能力,并在异构数据集上具有很好的适用性。

4. 讨论
4.1. 母质和地理位置对预测干土壤反射率的调节作用
本研究的结果表明,干土壤反射率在区域尺度上表现出显著的空间变异性,显示出明显的空间依赖性。经度和纬度作为空间位置的代理,可以有效捕捉环境梯度,并已被广泛用于数字土壤制图,以表示气候和地形的变化[57]。这些环境梯度影响土壤的物理和化学性质,进而影响干土壤反射率的空间变异性[52]。具体来说,纬度的变化导致太阳辐射强度和日照时间的显著差异,从而产生不同的纬度温度和降水量梯度[58]。地理变量如纬度代表环境梯度,而不是光谱反射率的直接驱动因素。这些梯度与气候和地形的变化有关,这些变化影响土壤形成过程和土壤的物理化学性质。正是这些土壤性质最终决定了干土壤的光谱响应特性。这些气候条件影响土壤有机质含量、水分状态和矿物组成[59]。经度的变化反映了大陆和海洋分布的差异,导致不同的气候类型;靠近海洋的地区通常湿度较高且降水量较多,而内陆地区则较为干燥。此外,经度差异还可以影响盛行风向和气流模式,从而调节土壤水分和盐分积累[60]。这些影响与经典的土壤形成因素范式一致,其中气候和地形在塑造土壤性质方面起主导作用[61]。

气候和地形作为与经度和纬度密切相关的关键环境因素,决定了PM的空间分布模式。母质决定了土壤的初始质地,而随后的土壤形成过程可能会随时间改变颗粒大小分布和土壤结构。土壤母质是影响土壤形成初始条件的关键因素;然而,土壤质地也可以通过土壤形成过程(如粘土和粉砂在土壤剖面中的迁移)进行修改[62]。这些过程共同影响土壤结构和光散射特性,从而影响土壤结构和光谱反射特性[63]。此外,母质还影响土壤风化阶段、pH值和有机质积累能力,所有这些都在干土壤的光谱响应机制中起着重要作用。在去除经度、纬度和母质作为特征后,模型的平均R2值为0.82(图10)。相比之下,全特征模型的R2值为0.93(图7),表明在排除这些关键空间变量后预测准确性显著下降。总之,土壤的物理、化学和生物性质在地理空间中表现出规律的带状或区域模式,这种现象称为“带状分布”或“土壤带性”[64]。这种模式主要由自然因素如气候、地形和母质驱动。

4.2. EEDSR模型在中国东北部农田的适用性:与Sentinel-2反射率的比较
根据第2.2.3节中详细的方法,在Sentinel-2中心波长443纳米、842纳米和1610纳米处,将预测的干土壤反射率(rEEDSR)的空间分布映射到了中国东北部的农田区域(图11a–c)。干土壤反射率表现出依赖于波长的趋势,在VIS范围(400–700纳米)内较低,然后在进入NIR区域(700–1300纳米)时显著增加。在SWIR区域(1300–2500纳米),反射率曲线由于羟基团、粘土矿物和碳酸盐的特征吸收而显示出明显的波动,在1400纳米、1900纳米和2200纳米附近有显著的吸收特征,导致整体呈现下降趋势(图A1),西部地区的反射率高于东部地区。图11展示了来自EEDSR模型的模拟干土反射率、Sentinel-2的最大土壤反射率以及它们在中国东北部作物区域的偏差。(a–c):预测的干土反射率(rEEDSR),(d–f):Sentinel-2 P90农田裸土反射率(rS2_P90),(g–i):rEEDSR与rS2_P90之间的偏差空间分布。这种空间变异性主要由土壤物理化学性质的分布驱动。中国东北西北部的土壤含有高比例的沙子,保水能力低,盐分高,导致在NIR和SWIR波段的反射率增加。相比之下,东南部的土壤有机质含量高且颜色较深,这增强了在VIS和NIR波段的吸收,从而降低了反射率。图11d–f显示了Sentinel-2在443纳米、842纳米和1610纳米中心波长处的P90农田裸土反射率(rS2_P90)。rS2_P90通常低于rEEDSR,但表现出一致的光谱模式和空间分布,表明两个数据集在光谱响应特性和地理差异方面有很强的对应性(图A2)。图11g–i显示了443纳米、842纳米和1610纳米处rEEDSR与rS2_P90之间偏差的空间分布。总体而言,偏差从西向东逐渐增加,东部农田区域的平均偏差高于西部地区(图A3)。图12展示了2015–2025年间4月1日至5月20日期间,443纳米、842纳米和1610纳米波段干土反射率偏差的经度变化,以及根据累计降雨数据计算的平均降水量;详细方法在第2.2.5节中有描述。这种空间差异证实了地表土壤湿度和降水驱动的土壤湿度模式对反射率的影响[65]。在东部地区,较高的降水量导致土壤湿度增加,使得土壤表面更湿润且颜色更深,从而导致rS2_P90相对于rEEDSR被低估,从而增加了两者之间的差异。相反,西部地区的土壤往往较干燥,局部盐碱化增强了表面反射率,使得rS2_P90与rEEDSR更为接近。图12显示了2015–2025年间4月10日至5月20日,基于EEDSR模型预测的干土反射率、Sentinel-2 P90反射率以及平均每日降水量与经度的关系,针对Sentinel-2的443纳米、842纳米和1610纳米中心波长。

5. 结论

本研究通过开发一个针对中国东北黑土地区的智能学习模型(EEDSR)来强调干土表面光谱反射率的建模。该模型综合了多种土壤属性(沙子、粘土、粉砂、有机质、pH值、电导率、类型和颗粒大小)以及地理坐标,以预测400–2500纳米光谱范围内的干土反射率。关于模型准确性和评估的关键发现总结如下:

- EEDSR模型在400–2500纳米光谱范围内的平均R2值为0.93,RMSE为0.018。
- 该研究将母质(颗粒大小)和地理坐标(经度和纬度)作为辅助预测变量纳入土壤反射率建模。加入颗粒大小后,平均R2值从0.82提高到了0.93(提高了13.4%)。
- 使用ISRIC全球土壤数据库进行的独立验证进一步证实了EEDSR模型的优越准确性和泛化能力(R = 0.94),优于现有的土壤光学生成模型(SOGM,R = 0.27)。
- EEDSR预测的干土反射率的空间分布模式与Sentinel-2农田裸土的最大反射率非常吻合,偏差从西向东逐渐增加,这与地表降水的空间变异性一致。这种对应关系间接验证了所提出的EEDSR模型的合理性。
- 通过利用机器学习技术,EEDSR模型有效地建立了土壤属性与光谱反射率之间的关系,为土壤光谱建模提供了坚实的技术基础。

未来的工作应考虑纳入海拔和地形相关因素,作为重要的扩展,以更好地捕捉土壤的空间异质性。此外,整合土壤湿度、表面粗糙度和观测几何形状等变量将进一步提高与卫星观测的一致性,并提高土壤反射率模拟的准确性。
相关新闻
生物通微信公众号
微信
新浪微博

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号