干旱影响区地下水水位(Groundwater Level, GWL)预测的独立与混合深度学习(Hybrid Deep Learning)方法研究——以孟加拉国受旱地区为例

《Information》：Standalone and Hybrid Deep Learning Approaches for Groundwater Level Projection in a Drought-Affected Region of Bangladesh

【字体：大中小】 时间：2026年06月17日 来源：Information 2.9

编辑推荐：

　　准确预测干旱易发及数据匮乏地区地下水水位(Groundwater Level, GWL)的波动仍是可持续地下水管理面临的主要挑战。受时空变异性和观测数据有限影响的非线性、动态地下水系统的复杂性，进一步增加了建立可靠预测模型的难度。地下水是孟加拉国西北部干旱易发

准确预测干旱易发及数据匮乏地区地下水水位(Groundwater Level, GWL)的波动仍是可持续地下水管理面临的主要挑战。受时空变异性和观测数据有限影响的非线性、动态地下水系统的复杂性，进一步增加了建立可靠预测模型的难度。地下水是孟加拉国西北部干旱易发地区灌溉和生活用水的关键资源，因此需要准确预测GWL动态以实现可持续管理。为应对这一挑战，本研究评估了七种深度学习(Deep Learning, DL)方法：GRU、LSTM、混合LSTM–GRU及其遗传算法(Genetic Algorithm, GA)和粒子群优化(Particle Swarm Optimization, PSO)变体，使用来自九个观测井的时间序列数据。所开发模型以广泛使用的单变量时间序列预测模型ARIMA为基准进行比对。模型性能存在空间差异。GA-LSTM模型在Bagha–Arani表现最佳（R = 0.879，IOA = 0.906，NRMSE = 0.149），而独立LSTM在Bagmara–Auchpara取得更优结果（R = 0.940，IOA = 0.958，NRMSE = 0.155）。所有DL模型在所有位置均优于基准ARIMA模型。总体而言，最佳模型达到R = 0.724–0.940，IOA = 0.707–0.958，NRMSE = 0.149–0.285，MAD = 0.369–1.369 m，表明具有较强的预测能力。优化（GA、PSO）提高了精度，特别是对基于GRU的模型，尽管LSTM在若干站点仍具竞争力。混合及优化模型因迭代调参需要更高计算成本，但通常可提升精度。基于六项统计指标的CRITIC–EDAS多准则决策框架未发现普遍最优模型；最优选择随位置变化。所选模型成功预测未来GWL趋势，捕捉到时间变异性。该集成建模–排序框架为数据匮乏、受旱影响地区的地下水管理提供了稳健且可扩展的方法。

论文解读：《Standalone and Hybrid Deep Learning Approaches for Groundwater Level Projection in a Drought-Affected Region of Bangladesh》（发表于《Information》）

一、研究背景与意义

地下水是全球水资源安全的重要支柱，尤其在地表水不足或不稳定的地区发挥关键缓冲作用。孟加拉国西北部的"Barind Tract"属半干旱气候，地下水是灌溉与生活用水的主要来源，但该区域受更新世Barind黏土限制，入渗率低（2–3 mm/d），自然补给受限，农业超量开采导致地下水持续下降。传统数值模型需大量参数与详细水文地质资料，经验模型难以刻画地下水系统的非线性与非平稳时序特征；传统统计模型（如ARIMA）及经典机器学习方法在捕捉复杂时间依赖上存在局限。在数据有限、干旱频发的背景下，亟需发展稳健的数据驱动建模框架以实现可靠的地下水水位(Groundwater Level, GWL)预测，支持可持续地下水规划与管理。因此研究人员以孟加拉国Rajshahi地区九个观测井的双周GWL时间序列为对象，系统比较独立、混合及元启发式优化深度学习(Deep Learning, DL)模型的表现，并引入多准则决策方法客观遴选最优模型，进而开展超越观测期的长期递归预测。

二、主要关键技术方法

研究人员收集孟加拉国Barind Multipurpose Development Authority(BMDA)九个Upazila（亚县）观测井的双周GWL实测数据，缺失值（约0.35%–0.60%）采用分段三次Hermite插值填补，异常值用广义ESD检验识别处理。数据按时间顺序以90:10划分为训练集与测试集，经z-score标准化。构建七种DL模型：独立长短期记忆网络(Long Short-Term Memory, LSTM)（128隐单元）、独立门控循环单元(Gated Recurrent Unit, GRU)（128隐单元）、混合LSTM–GRU（LSTM 128单元+GRU 64单元）、遗传算法(Genetic Algorithm, GA)优化LSTM(GA-LSTM)、GA优化GRU(GA-GRU)、粒子群优化(Particle Swarm Optimization, PSO)优化LSTM(PSO-LSTM)、PSO优化GRU(PSO-GRU)；以ARIMA为基准对照。GA与PSO用于搜索GRU/LSTM的最优隐单元数（20–200）、学习率（10^?4–10^?2）与训练轮数（100–1000），适应度函数为均方误差(Mean Squared Error, MSE)。模型评价采用相关系数(R)、一致性指数(Index of Agreement, IOA)、a₂₀指数、归一化均方根误差(Normalized Root Mean Squared Error, NRMSE)、平均绝对误差(Mean Absolute Error, MAE)、中位绝对偏差(Median Absolute Deviation, MAD)六项指标，并以CRITIC（Criteria Importance Through Intercriteria Correlation）法确定指标客观权重，再以EDAS（Evaluation based on Distance from Average Solution）法对各站点模型综合排序。最优模型采用递归（闭环）策略做五年（120个时间步）超前预测。

三、研究结果

3.1 Model Performance on Test Dataset（测试集上模型预测性能）

研究人员在Bagha–Arani站对比各模型测试集表现：GA-LSTM取得最高R（0.879）、IOA（0.906）及a₂₀（0.739），最低NRMSE（0.149）、MAE（0.735 m）、MAD（0.433 m）；PSO-GRU次之（R = 0.846，IOA = 0.891，NRMSE = 0.153）。独立GRU表现最弱（R = 0.724，NRMSE = 0.285），混合LSTM–GRU介于两者之间。ARIMA全面劣于所有DL模型（R = 0.366，NRMSE = 0.348）。时序对比图、回归散点图与绝对误差箱线图表明优化模型（GA-LSTM、PSO-GRU）预测曲线贴合观测值，点簇更接近1:1线，误差中位数小且离散度低，验证元启发式调参可显著提升GRU/LSTM对非线性时序关系的捕捉能力，而单纯堆叠架构（LSTM–GRU）若无优化未必优于独立模型。

3.2 Selection of the Best Models（最优模型遴选）

CRITIC法计算的指标权重在各站略有差异，R与IOA普遍权重较高，NRMSE与MAE亦有贡献，MAD权重偏低。EDAS综合排序显示无全局最优模型：Bagha–Arani最优为PSO-GRU，Bagmara–Auchpara为LSTM，Charghat–Charghat为GA-LSTM，Durgapur–Deluabari为GRU，Godagari–Godagari为GRU，Mohanpur–Raighati为GA-LSTM，Paba–Haripur为PSO-LSTM，Puthia–Shilmaria为LSTM–GRU，Tanore–Talondo为GRU。研究表明模型适用性高度依赖站点水文地质条件与GWL变幅——强季节波动及抽取应力大的井受益于优化或混合架构，较稳定含水层独立LSTM/GRU已足够，强调需按区位选模而非通用单一模型。

3.3 Forecasting Performance of the Models Beyond the Available Data（超出现有数据范围的预测能力）

各站CRITIC–EDAS选出的最优模型执行递归五年超前预测，结果与历史时段连续衔接，能保持季节性振荡与总体趋势，未见物理不合理发散，虽极短时段瞬变未完全复现，但主要系统动态被保留。证明经适当训练的DL模型可在无非观测输入下外延GWL演化趋势，为长期地下水资源预警提供指示性依据（但累积误差使远期确定性降低，宜作趋势参考）。

四、讨论与结论总结

研究人员指出：①七种DL模型中，GA-LSTM与PSO-GRU在多数井表现突出（R可达0.94，NRMSE低至0.149），所有DL模型一致优于ARIMA；②元启发式优化（GA、PSO）尤其改善GRU基模型精度，LSTM在某些站点即便无优化亦竞争性强；③混合LSTM–GRU未必然优于优化独立模型，架构复杂度须配适参数校准；④CRITIC–EDAS多准则排序确认最优模型具空间异质性，须因地制宜选模；⑤递归预测可合理外推GWL时序趋势，适用于干旱区地下水管理的情景分析。研究创新在于在同一框架下系统比独立/混合/元启发式优化DL、引入CRITIC–EDAS解决单指标评价不一致问题、实现超观测期递归投影。局限含未纳入气象与开采量等驱动因子、递归预测误差累积、未做显式不确定性量化。该集成建模–排序框架为数据有限受旱区地下水预测提供了可迁移的方法学参考，对支撑灌溉调度、地下水限采与旱情应对具实际管理价值。

热点排行