干旱影响区地下水水位(Groundwater Level, GWL)预测的独立与混合深度学习(Hybrid Deep Learning)方法研究——以孟加拉国受旱地区为例

《Information》:Standalone and Hybrid Deep Learning Approaches for Groundwater Level Projection in a Drought-Affected Region of Bangladesh

【字体: 时间:2026年06月17日 来源:Information 2.9

编辑推荐:

  准确预测干旱易发及数据匮乏地区地下水水位(Groundwater Level, GWL)的波动仍是可持续地下水管理面临的主要挑战。受时空变异性和观测数据有限影响的非线性、动态地下水系统的复杂性,进一步增加了建立可靠预测模型的难度。地下水是孟加拉国西北部干旱易发

  
准确预测干旱易发及数据匮乏地区地下水水位(Groundwater Level, GWL)的波动仍是可持续地下水管理面临的主要挑战。受时空变异性和观测数据有限影响的非线性、动态地下水系统的复杂性,进一步增加了建立可靠预测模型的难度。地下水是孟加拉国西北部干旱易发地区灌溉和生活用水的关键资源,因此需要准确预测GWL动态以实现可持续管理。为应对这一挑战,本研究评估了七种深度学习(Deep Learning, DL)方法:GRU、LSTM、混合LSTM–GRU及其遗传算法(Genetic Algorithm, GA)和粒子群优化(Particle Swarm Optimization, PSO)变体,使用来自九个观测井的时间序列数据。所开发模型以广泛使用的单变量时间序列预测模型ARIMA为基准进行比对。模型性能存在空间差异。GA-LSTM模型在Bagha–Arani表现最佳(R = 0.879,IOA = 0.906,NRMSE = 0.149),而独立LSTM在Bagmara–Auchpara取得更优结果(R = 0.940,IOA = 0.958,NRMSE = 0.155)。所有DL模型在所有位置均优于基准ARIMA模型。总体而言,最佳模型达到R = 0.724–0.940,IOA = 0.707–0.958,NRMSE = 0.149–0.285,MAD = 0.369–1.369 m,表明具有较强的预测能力。优化(GA、PSO)提高了精度,特别是对基于GRU的模型,尽管LSTM在若干站点仍具竞争力。混合及优化模型因迭代调参需要更高计算成本,但通常可提升精度。基于六项统计指标的CRITIC–EDAS多准则决策框架未发现普遍最优模型;最优选择随位置变化。所选模型成功预测未来GWL趋势,捕捉到时间变异性。该集成建模–排序框架为数据匮乏、受旱影响地区的地下水管理提供了稳健且可扩展的方法。
论文解读:《Standalone and Hybrid Deep Learning Approaches for Groundwater Level Projection in a Drought-Affected Region of Bangladesh》(发表于《Information》)
一、研究背景与意义
地下水是全球水资源安全的重要支柱,尤其在地表水不足或不稳定的地区发挥关键缓冲作用。孟加拉国西北部的"Barind Tract"属半干旱气候,地下水是灌溉与生活用水的主要来源,但该区域受更新世Barind黏土限制,入渗率低(2–3 mm/d),自然补给受限,农业超量开采导致地下水持续下降。传统数值模型需大量参数与详细水文地质资料,经验模型难以刻画地下水系统的非线性与非平稳时序特征;传统统计模型(如ARIMA)及经典机器学习方法在捕捉复杂时间依赖上存在局限。在数据有限、干旱频发的背景下,亟需发展稳健的数据驱动建模框架以实现可靠的地下水水位(Groundwater Level, GWL)预测,支持可持续地下水规划与管理。因此研究人员以孟加拉国Rajshahi地区九个观测井的双周GWL时间序列为对象,系统比较独立、混合及元启发式优化深度学习(Deep Learning, DL)模型的表现,并引入多准则决策方法客观遴选最优模型,进而开展超越观测期的长期递归预测。
二、主要关键技术方法
研究人员收集孟加拉国Barind Multipurpose Development Authority(BMDA)九个Upazila(亚县)观测井的双周GWL实测数据,缺失值(约0.35%–0.60%)采用分段三次Hermite插值填补,异常值用广义ESD检验识别处理。数据按时间顺序以90:10划分为训练集与测试集,经z-score标准化。构建七种DL模型:独立长短期记忆网络(Long Short-Term Memory, LSTM)(128隐单元)、独立门控循环单元(Gated Recurrent Unit, GRU)(128隐单元)、混合LSTM–GRU(LSTM 128单元+GRU 64单元)、遗传算法(Genetic Algorithm, GA)优化LSTM(GA-LSTM)、GA优化GRU(GA-GRU)、粒子群优化(Particle Swarm Optimization, PSO)优化LSTM(PSO-LSTM)、PSO优化GRU(PSO-GRU);以ARIMA为基准对照。GA与PSO用于搜索GRU/LSTM的最优隐单元数(20–200)、学习率(10?4–10?2)与训练轮数(100–1000),适应度函数为均方误差(Mean Squared Error, MSE)。模型评价采用相关系数(R)、一致性指数(Index of Agreement, IOA)、a20指数、归一化均方根误差(Normalized Root Mean Squared Error, NRMSE)、平均绝对误差(Mean Absolute Error, MAE)、中位绝对偏差(Median Absolute Deviation, MAD)六项指标,并以CRITIC(Criteria Importance Through Intercriteria Correlation)法确定指标客观权重,再以EDAS(Evaluation based on Distance from Average Solution)法对各站点模型综合排序。最优模型采用递归(闭环)策略做五年(120个时间步)超前预测。
三、研究结果
3.1 Model Performance on Test Dataset(测试集上模型预测性能)
研究人员在Bagha–Arani站对比各模型测试集表现:GA-LSTM取得最高R(0.879)、IOA(0.906)及a20(0.739),最低NRMSE(0.149)、MAE(0.735 m)、MAD(0.433 m);PSO-GRU次之(R = 0.846,IOA = 0.891,NRMSE = 0.153)。独立GRU表现最弱(R = 0.724,NRMSE = 0.285),混合LSTM–GRU介于两者之间。ARIMA全面劣于所有DL模型(R = 0.366,NRMSE = 0.348)。时序对比图、回归散点图与绝对误差箱线图表明优化模型(GA-LSTM、PSO-GRU)预测曲线贴合观测值,点簇更接近1:1线,误差中位数小且离散度低,验证元启发式调参可显著提升GRU/LSTM对非线性时序关系的捕捉能力,而单纯堆叠架构(LSTM–GRU)若无优化未必优于独立模型。
3.2 Selection of the Best Models(最优模型遴选)
CRITIC法计算的指标权重在各站略有差异,R与IOA普遍权重较高,NRMSE与MAE亦有贡献,MAD权重偏低。EDAS综合排序显示无全局最优模型:Bagha–Arani最优为PSO-GRU,Bagmara–Auchpara为LSTM,Charghat–Charghat为GA-LSTM,Durgapur–Deluabari为GRU,Godagari–Godagari为GRU,Mohanpur–Raighati为GA-LSTM,Paba–Haripur为PSO-LSTM,Puthia–Shilmaria为LSTM–GRU,Tanore–Talondo为GRU。研究表明模型适用性高度依赖站点水文地质条件与GWL变幅——强季节波动及抽取应力大的井受益于优化或混合架构,较稳定含水层独立LSTM/GRU已足够,强调需按区位选模而非通用单一模型。
3.3 Forecasting Performance of the Models Beyond the Available Data(超出现有数据范围的预测能力)
各站CRITIC–EDAS选出的最优模型执行递归五年超前预测,结果与历史时段连续衔接,能保持季节性振荡与总体趋势,未见物理不合理发散,虽极短时段瞬变未完全复现,但主要系统动态被保留。证明经适当训练的DL模型可在无非观测输入下外延GWL演化趋势,为长期地下水资源预警提供指示性依据(但累积误差使远期确定性降低,宜作趋势参考)。
四、讨论与结论总结
研究人员指出:①七种DL模型中,GA-LSTM与PSO-GRU在多数井表现突出(R可达0.94,NRMSE低至0.149),所有DL模型一致优于ARIMA;②元启发式优化(GA、PSO)尤其改善GRU基模型精度,LSTM在某些站点即便无优化亦竞争性强;③混合LSTM–GRU未必然优于优化独立模型,架构复杂度须配适参数校准;④CRITIC–EDAS多准则排序确认最优模型具空间异质性,须因地制宜选模;⑤递归预测可合理外推GWL时序趋势,适用于干旱区地下水管理的情景分析。研究创新在于在同一框架下系统比独立/混合/元启发式优化DL、引入CRITIC–EDAS解决单指标评价不一致问题、实现超观测期递归投影。局限含未纳入气象与开采量等驱动因子、递归预测误差累积、未做显式不确定性量化。该集成建模–排序框架为数据有限受旱区地下水预测提供了可迁移的方法学参考,对支撑灌溉调度、地下水限采与旱情应对具实际管理价值。
相关新闻
生物通微信公众号
微信
新浪微博

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号