基于机器学习的塞尔维亚伏伊伏丁那地区日参考蒸散发估算

《Earth》:Machine Learning-Based Estimation of Daily Reference Evapotranspiration in Vojvodina, Serbia

【字体: 时间:2026年06月09日 来源:Earth 3.4

编辑推荐:

  参考蒸散发(ET0)最常用的估算方法是FAO-56 Penman-Monteith(PM)方程。然而,由于所需气象参数的缺乏,其应用往往受到限制。鉴于机器学习模型具有灵活性、能够在有限输入条件下运行以及估算ET0的高

  
参考蒸散发(ET0)最常用的估算方法是FAO-56 Penman-Monteith(PM)方程。然而,由于所需气象参数的缺乏,其应用往往受到限制。鉴于机器学习模型具有灵活性、能够在有限输入条件下运行以及估算ET0的高精度等特点,其在科学研究中的相关性日益增强,在数据有限条件下提供了实用的替代方案。本研究中,研究人员将人工神经网络(ANN)应用于塞尔维亚伏伊伏丁那地区诺维萨德气象站的日常ET0估算,利用了与蒸散发过程相关的八个气象变量。分析表明,部分变量对ET0预测的影响强于其他变量。为评估其综合效应,研究人员开发并测试了一系列具有不同输入组合的ANN模型。随机森林、梯度提升和k近邻模型被用作基准,模型性能通过R2、NSE、RMSE和MAE进行评估。当包含所有变量时,模型获得了最高精度,提供了最大信息量的输入。最佳性能通过具有两个隐藏层(神经元数分别为32和16)的架构实现,结果达到R2 = 0.97、NSE = 97.07%、RMSE = 0.23 mm/day和MAE = 0.21 mm/day。结果表明,仅使用三个输入变量即可实现高精度的ET0估算,R2值达到0.95。因此,本研究 findings 可为更精确且经济高效的灌溉调度和水平衡估算做出贡献,为塞尔维亚的农业水资源管理和农民提供实际效益。
蒸散发(ET)是水文循环的关键组成部分,控制着水分向大气的转移,并影响着陆地生态系统的关键特征,如径流、土壤湿度和植物生长,这些因素对水资源可用性至关重要。ET是一个复杂的过程,因为它依赖于大气、土壤和植物参数之间的相互作用。由于这种复杂性,准确估算ET在水资源优化利用、作物产量模拟、灌溉与管理系统设计、水文平衡评估以及提高农业用水效率等研究领域具有重要价值,其中精确的ET估算对于高效的灌溉管理尤为关键。参考蒸散发(ET0)是一个气候参数,代表参考表面的蒸散大气需求,该参考表面被定义为高度0.12 m、固定表面阻力70 s m?1、反照率0.23的假拟草地作物。准确估算ET0对于模拟全球水循环和制定灌溉决策至关重要。

ET0可通过直接测量(如蒸渗仪)确定,但这些方法在时间、成本和资源方面要求较高,因此实践中通常使用经验方法,其中FAO-56 Penman-Monteith(FAO-56 PM)方程被认为是最可靠的。然而,FAO-56 PM方法需要众多气象参数,这限制了其在缺乏完整输入数据地区的应用。除FAO-56 PM方法外,研究者们还考虑了在输入参数有限的情况下计算ET0的替代方法,包括使用简化经验公式替代FAO-56 PM方程,以及利用机器学习技术基于减少的输入集直接模拟ET0

机器学习(ML)是人工智能领域中的一种技术,其核心理念是系统可以从数据中学习、识别模式并以最少的人为干预做出决策。该技术通常应用于涉及大规模数据集和众多随时间变化变量的场景,尤其是在难以使用预定义公式或方程的领域。ML模型可基于广泛的气候数据集预测日ET,即使在缺乏详细物理ET过程认知的情况下也能应用。特别是人工神经网络(ANN)在模拟ET等水文过程中的应用已引起研究人员的广泛关注。本研究中,研究人员使用了三种在实践已证明有效的ML模型:随机森林、梯度提升和k近邻模型,作为神经网络性能的基准。

人工神经网络(ANN)是受人类大脑生物神经系统功能启发的算法结构,是ML中用于模式识别、预测和预测的主要工具之一,已被成功应用于各种科学研究领域。ANN由称为神经元的处理单元网络组成,这些单元协同工作以解决特定问题。通常,ANN包含输入变量和输出变量,以及一个或多个隐藏层。每层通过连接权重与后续层完全连接,这些权重最初随机分配,然后在训练过程中进行调整。神经网络层包含多个节点,结构如下:(i)用于向系统引入数据的输入层,(ii)用于学习期间数据处理的一个或多个隐藏层,以及(iii)用于生成预测和决策的输出层。

Mallikarjuna等人研究了线性回归和ANN模型估算ET0的适用性,识别出气温、风速、相对湿度和日照时数为最具影响力的气候变量。Dimitriadou和Nikolakopoulos考察了ANN在冬夏季估算ET0的应用,旨在评估减少输入参数数量是否能获得令人满意的ET0预测。Makwana等人研究了ANN在有限气象输入参数下估算ET0的有效性,结果表明使用五个输入变量训练的ANN模型实现了高精度。Naresh等人评估了ANN模型在长期气象数据下估算ET0的性能,最佳配置为使用Levenberg-Marquardt算法训练的单隐藏层13个神经元。El-Magd等人开发和测试了七个使用不同气象输入参数组合的ANN模型,结果表明包含温度相关输入时ANN模型提供了准确估算。Kumar等人使用ANN模型在三个气象站模拟ET0,测试了不同输入参数组合。Skhiri等人基于突尼斯多个气象站的气象数据,使用ANN模型估算月ET0,识别出最高气温为影响模型精度的最显著气象参数。基于上述研究,本研究旨在评估ANN模型在气象数据有限条件下估算ET0的有效性, Ryan经与标准FAO-56 PM方法比较来验证。

研究区域为塞尔维亚伏伊伏丁那地区的诺维萨德气象站,地理位置为北纬45.33°、东经19.85°,海拔84 m。该区域属温带大陆性气候,拥有广泛的天然水道和运河网络,是Danube-Tisa-Danube水利系统的一部分。该地区以农业为主,可耕地超过17,500 km2,约占总面积的75%。研究使用了1950年至2023年6月的日气象数据,包括最高气温(Tmax)、最低气温(Tmin)、平均气温(Tmean)、相对湿度(RH)、风速(WS)、全球辐射(GR)、降水量(P)和平均海平面气压(SLP),数据来源为哥白尼气候变化服务(C3S)。

研究中,FAO-56 PM方法被用作计算ET0的标准方法,该方法结合能量平衡和空气动力学分量,纳入表面阻力和空气动力学阻力两项。研究人员使用了八种不同的输入变量组合方案(S1-S8)来测试ANN模型的性能,这些方案代表了从完整数据到极端缩减数据的渐进式数据可用性递减情况:S1包含全部八个变量;S2排除海平面气压;S3排除最低气温;S4排除平均气温;S5排除降水量;S6仅包含最高气温、风速和全球辐射;S7仅包含最高气温和全球辐射;S8仅包含最高气温。

ANN模型采用双曲正切(tanh)激活函数的隐藏层和线性激活函数的输出层,使用均方误差(MSE)作为损失函数,采用Adam优化算法(学习率1 × 10?4),并应用L2正则化改善模型泛化能力。训练采用1024的批量大小,每10或50个epoch验证一次。与ANN对比的基准机器学习模型包括随机森林(RF)、极端梯度提升(XGBoost)和k近邻(KNN)模型。

**FAO-56 PM方法结果**:1950年至2023年6月期间的日ET0值显示,ET0在冬季维持低位,春季逐渐升高,7月达到峰值8.4 mm/day。夏季异常值较多,可能源于年际气候变异性和偶发的极端天气事件。这些发现与温带大陆性气候ET季节动态预期一致,突显了温度、辐射和风等气象因素对日ET0值的影响。

**ANN模型性能结果**:八种输入场景的全模型性能比较显示,所有ML模型均表现出强而一致的高预测性能,但在大多数场景中ANN均优于其他模型或位列第二。对于全输入场景(S1),ANN模型达到最高精度,R2 = 0.971、RMSE = 0.30 mm/day、MAE = 0.21 mm/day、NSE = 0.971,略优于随机森林(R2 = 0.971)、梯度提升(R2 = 0.968)和k近邻(R2 = 0.965)。各测试模型间预测性能差异较小,在所有八种输入变量场景中保持一致,表明结果具有稳健性,不依赖于单一建模方法的特性,高预测精度反映了气象数据中的真实关系而非模型特定的过拟合。

变量重要性分析(基于随机森林平均不纯度减少准则)表明,最高气温(Tmax;重要性=17,099)和全球辐射(GR;15,015)是ET0最具影响力的预测因子,其次是平均气温(Tmean;13,319)和最低气温(Tmin;7016)。相对湿度(RH;5408)对模型性能也有实质性贡献,而海平面气压(SLP;1281)、风速(WS;814)和降水量(P;284)的重要性值相对较低。这些发现与蒸散发过程的物理本质一致,即蒸散发主要由地表能量可用性(由辐射和温度相关变量代表)和大气湿度条件(部分由RH反映)控制。

辐射和温度变量的主导地位解释了为何机器学习模型在仅包含温度和辐射相关预测因子的缩减输入场景(S3-S7)下仍保持高预测精度。当从特征集中移除GR、仅保留Tmax(S8)时,所有模型的性能均显著下降。仅包含Tmax作为输入变量的配置在单输入模型中表现最佳,R2 = 0.85、NSE = 85.01%、RMSE = 0.68 mm/day、MAE = 0.53 mm/day,但其精度仍显著低于多输入场景。这表明单气象参数估算ET0存在局限性,无法捕捉ET动态的全部复杂性。随着输入维度减少,性能逐渐下降,RMSE增加、R2降低。

与已有研究的比较表明,本研究结果与Makwana等人的发现一致,他们证明了五个输入变量的ANN模型优于更简单的配置;Dimitriadou和Nikolakopoulos评估的十九个多层感知器(MLP)和径向基函数(RBF)模型获得了R2 = 0.961-0.980的高预测精度;Naresh等人在印度哈里亚纳邦半干旱地区的研究中,使用Levenberg-Marquardt算法训练的单隐藏层13个神经元模型达到R2 = 0.986;El-Magd等人、Kumar等人和Skhiri等人的研究也证实了温度相关变量对ET0估算的重要性。Raimondi等人在意大利威尼托地区的研究中,SVR、XGBoost和ANN表现出最佳预测能力,R2和NSE接近0.96,与本研究结果几乎相同。

对于塞尔维亚地区,Goci?等人应用ANN模型估算ET0,基于1980-2010年气象数据,但预测性能较低(R2 = 0.911)。Goci?和Arab Amiri开发的使用不同时间滞后的ANN模型在诺维萨德站分别达到R2 = 0.81、0.93和0.95。本研究获得的改进精度可能归因于使用了更大且更新的数据集(1950-2023年)以及不同的ANN架构。

**讨论与结论**:参考蒸散发是水文循环和农业水管理的重要组成部分。准确估算ET0对于理解环境变化和水文过程具有关键作用,特别是在作物灌溉调度和流域尺度的水资源管理中。作为农业水文应用中的关键变量,ET0估算常面临直接测量成本高、复杂以及间接方法(如FAO-56 PM)气象数据需求广泛的挑战。因此,本研究结果可用于更精确且经济高效地管理塞尔维亚的灌溉调度和水平衡估算,为农民提供实际效益。

研究结论表明,ANN模型能够有效估算ET0,尤其是在包含较多气象参数时。使用全部八个输入变量(Tmax、Tmin、Tmean、RH、WS、GR、P、SLP)的双隐藏层结构达到最高性能(R2 = 0.97、NSE = 97.07%、RMSE = 0.23 mm/day、MAE = 0.21 mm/day),表明模型精度随输入多样性和适当网络设计而提高。缩减输入集的模型也表现出满意性能,特别是包含部分温度和辐射特征的场景(S1-S7)。GR被证明是携带大量ET0估算关键信息的非常重要的变量,移除GR后所有机器学习模型的性能均显著下降(S8)。研究结果证实了ANN模型作为ET0估算可靠工具的潜力,表明其适用于气象数据有限地区的应用。未来研究可探索额外ML模型的应用、纳入多个气象站数据以及包含时间序列分析,以进一步提高ET0估算精度。
相关新闻
生物通微信公众号
微信
新浪微博

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号