基于优化深度学习模型和Coati算法的地下水水位预测改进
《Environmental Modelling & Software》:Improving Groundwater Level Prediction based on Optimized Deep Learning Model with Coati Algorithm
【字体:
大
中
小
】
时间:2026年06月12日
来源:Environmental Modelling & Software 4.6
编辑推荐:
拉纳·穆罕默德·阿德南 | 汉静成 | 王莫 | 桑迪普·萨曼塔拉伊 | 阿比纳什·萨胡 | 萨贾德·菲拉斯·阿卜杜勒阿米尔 | 穆罕默德·阿尔-苏瓦扬 | 扎赫尔·蒙德赫·亚辛
中国深圳大学化学与环境工程学院水科学与环境研究中心,518060
**摘要**
准确估
拉纳·穆罕默德·阿德南 | 汉静成 | 王莫 | 桑迪普·萨曼塔拉伊 | 阿比纳什·萨胡 | 萨贾德·菲拉斯·阿卜杜勒阿米尔 | 穆罕默德·阿尔-苏瓦扬 | 扎赫尔·蒙德赫·亚辛
中国深圳大学化学与环境工程学院水科学与环境研究中心,518060
**摘要**
准确估计地下水位(GWL)对于实现综合水资源管理和可持续发展目标具有重要意义。近年来,在人工智能(AI)领域,受自然启发的优化方法已被应用于水文学中,用于训练(校准)统计模型和基于过程的模型。本研究探讨了一种混合深度学习技术——卷积神经网络(CNN)与Coati优化算法(COA)结合的模型(CNN-COA)在地下水位预测中的性能。将CNN-COA的结果与改进后的CNN-HHO(Harris Hawks优化)、支持向量回归(SVR)与COA和HHO结合的模型(SVR-COA、SVR-HHO)以及独立的CNN和SVR模型进行了比较。使用纳什-萨特克利夫效率(NSE)、决定系数(R2)、均方根误差(RMSE)和平均绝对误差(MAE)等评估指标来衡量模型的准确性。结果表明,由于CNN-COA能够有效探索搜索空间并避免局部最小值,其准确性优于其他方法。特别是在所有观测井中,CNN-COA取得了最佳效果(Patyale Chak:NSE:0.9932,MAE:0.0468,R2:0.9953,RMSE:0.0978);而在Badsoo则表现最差(NSE:0.9923,MAE:1.0051,R2:0.9945,RMSE:1.0517)。这些结果显著提升了预测准确性,凸显了所提出方法的有效性。
**引言**
全球范围内,家庭和农业用水的主要来源是地下水[1]。这一重要资源在人类生活的多个方面发挥着关键作用,包括饮用水供应、工业发展和农业支持[2][3][4]。然而,由于自然和人为活动的影响,这一自然资源正面临巨大压力[5]。此外,随着人口增长(预计到2050年将达到95亿),地下水资源开发速度加快。气候变化和人类活动加剧了地下水资源的压力,尤其是在干旱和半干旱地区[6][7][8][9]。在这些地区,最难以有效管理的自然资源之一就是地下水枯竭,这是一个全球性的问题[10]。对这一资源的管理不善会对环境和供水产生负面影响[11]。过度开采和长期地下水抽取速度超过补给速度会导致地下水位持续下降[12]。因此,必须高度重视全球地下水资源管理[13]。过去,物理模型是用于这一目的的主要工具,但创建这些模型耗时较长。例如,为了模拟降雨-径流动态的物理机制,基于物理的方法需要构建概念性和确定性模型,并使用复杂的数学工具和大量校准数据(如时空数据、物理过程参数和边界条件)。由于基于物理的方法涉及复杂的物理现象、有限的数值数据和具有挑战性的数学概念,因此迫切需要替代方案。随着数值模型的发展,更精确的地下水位建模成为可能[14][15][16]。然而,运行大型高分辨率数值模型计算成本较高[17]。尽管这些方法需要大量数据,但它们比基于物理的模型更精确[18]。基于人工智能的技术所需数据较少,构建时间与成本也低于物理模型,属于第三类地下水位建模技术。
通过分析历史数据中的水文成分之间的统计相关性,数据驱动的方法可以在不依赖物理机制的情况下预测未来的水文过程[19]。近几十年来,已经采用了多种基于数据的方法,包括统计和机器学习(ML)方法及其集成,用于预测水文过程(如地下水模拟[20])。特别是人工神经网络(ANN)的应用日益增多,因为先进的ML算法在水文预测中表现优于传统的统计建模技术[21]。为了模拟地下水位,研究人员对三种机器学习模型(如ANN和SVM)与MaxEnt数值模型进行了比较分析[21]。总体而言,ML模型的性能优于数值模型。然而,早期的ANN模型隐藏层较少,容易陷入局部最优解[22]。在印度东部进行每周地下水位预测时,研究人员使用Levenberg–Marquardt(LM)、自适应学习率反向传播和贝叶斯正则化(BR)作为训练算法,创建了三种不同的ANN模型[23][24]。支持向量机(SVM)常用于分类问题,但支持向量回归(SVR)也可用于回归问题。SVR基于与SVM相同的概念,但专注于预测连续输出。研究人员使用韩国沿海含水层的潮位、降水量和历史地下水位数据开发了ANN和SVM模型来预测地下水位变化[25]。他们还指出,SVR的性能优于ANN,其中最佳的输入变量按降序为降水量、潮位和地下水位[25]。另一项研究使用加权误差函数提高了ANN和SVM模型的性能[26]。结果表明,加权误差函数方法增强了预测模型的稳定性和准确性,尤其是ANN模型。另一项分析探讨了小波分析对ANN、多线性回归(MLR)和SVR方法训练的影响,并将其结果与简单MLR、ANN和SVR在模拟一个月后地下水位方面的表现进行了比较[27]。使用来自孟加拉国844个站点的每周地下水位数据,研究了ANN、回归树、MLR、SVM和高斯过程回归(GPR)在地下水位建模中的应用[28]。结果比较显示,ANN的表现优于其他模型。另一项研究旨在建立印度IIT Roorkee水文部门某井的地下水位与时间重力变化之间的关系,使用了随机森林、多项式回归(PR)、K-最近邻(KNN)、XG-Boost和SVM-RBF[29]。这些模型被用于预测地下水位,研究结果强调了XG-Boost模型在地下水位预测中的有效性。
**深度学习**
深度学习是一种基于多层ANN的ML算法,随着计算能力的显著提升和水文数据在大型数据库中的日益普及而发展起来[30]。深度学习可以从原始数据中识别抽象特征并自动获取合适的表示形式。循环神经网络(RNN)和CNN这两种先进的深度学习技术分别因其在提取特征和构建时间序列依赖关系方面的潜力而受到国际关注[31][32]。研究人员引入了图卷积网络(GCN)与LSTM结合的方法(GCN-LSTM),利用中国湘潭市东北部16口井的数据预测地下水位[31]。还提出了一种结合模糊逻辑和元启发式算法的FL-IWO方法(Invasive Weed Optimization)用于Betwa河流域的地下水位预测[32]。他们发现FL-IWO模型能够提供准确的地下水位波动估计。然而,单独使用时,在训练阶段可能会错过最优解,因为大多数DL模型需要大量数据进行训练[33]。研究人员采用元启发式方法来提升DL模型的性能。元启发式算法通过试错过程、随机操作和问题解决空间的随机扫描来寻找有效的优化方案[34]。现实世界中最复杂的非线性和多目标优化问题通常通过元启发式优化算法解决。目前已有多种元启发式算法被提出,包括Coati优化算法(COA)[35]、Reptile Search算法[36]、Mountain Gazelle Optimizer[37]、人工水母搜索优化器(BWO)[38]和Beluga鲸优化(BWO)[39]。这些算法因其全局搜索能力和动态搜索行为而在解决不同优化问题方面表现出色。元启发式优化策略可以提高独立DL模型预测地下水位的准确性。
为了解决模式识别难题,强大的DL模型(如CNN)至关重要[40]。然而,学习过程受参数值的影响较大,从而影响预测模型的准确性。本文提出了两种元启发式优化技术(COA和HHO)来调整CNN的超参数,提高预测准确性,克服手动选择参数设置的局限性。最近发现HHO是确定最优值的另一种有效方法。HHO的优点包括简单性、参数数量少以及易于与其他优化方法结合[34][35][36]。COA算法也有诸多优势:(1)无需任何参数控制,因为它设计时没有控制参数;(2)适用于多种科学领域中的复杂高维优化问题;(3)具有出色的研究搜索过程平衡能力,能够快速收敛,为优化应用中的决策变量提供合适的值[37][38]。
**研究方法**
本研究应用了HHO和COA两种优化技术,以提高印度查谟和克什米尔地区原始CNN模型的预测能力。CNN-HHO和CNN-COA是两种新模型,能够提高CNN模型的预测准确性并产生高度可靠的预测结果。通过将它们与传统的SVR和CNN模型以及混合SVR-HHO和SVR-COA模型进行对比,评估了这些模型的优越性。本研究与其他研究的主要区别在于,CNN-HHO和CNN-COA模型是首次用于地下水位预测。研究结果对其他相关研究以及研究区域的地下水管理具有参考价值。
**研究区域**
查谟市位于喜马拉雅山脉山脚下塔维河畔,地理坐标为东经74°24′至75°18′,北纬32°50′至33°30′(图1)。作为通往克什米尔山谷等主要旅游景点的关键通道,查谟起着重要作用。该地区夏季炎热,冬季寒冷[41]。
**支持向量回归(SVR)**
Cortes和Vapnik创建了支持向量机(SVM),这是一种监督学习模型[42]。该模型广泛应用于回归和分类任务[43][44][45]。SVM最初是为分类设计的,后来扩展到回归分析[46]。支持向量回归(SVR)通过训练函数来最小化测试误差,使学习到的值落在厚度曲线(ε)内[47]。
**结果与讨论**
表3、表4、表5、表6、表7和表8分别展示了SVR、CNN、SVR-HHO、CNN-HHO、SVR-COA和CNN-COA模型在训练和测试阶段预测Bhagwanchak、Badsoo、Patyale Chak、Bega、Bassi Kalan和Allah站地下水位的结果。从表格分析可知,使用Coati优化算法优化的SVR和CNN模型的性能优于使用HHO优化的模型,而独立模型的表现最差。
**结论**
越来越多的因素(如补给量、流量、降水量和其他水文及水文地质特征)影响地下水位波动的复杂性和非线性行为,使得基于数据的方法变得越来越必要,因为它们具有较低的输入要求且节省时间和成本。本研究预测了Bhagwanchak、Badsoo、Patyale Chak、Bega、Bassi Kalan和Allah测站的地下水位变化。
**作者贡献声明**
扎赫尔·蒙德赫·亚辛:撰写原始草稿、监督、方法论、概念化。
桑迪普·萨曼塔拉伊:撰写原始草稿、方法论、概念化。
阿比纳什·萨胡:撰写原始草稿、方法论、概念化。萨贾德·菲拉斯·阿卜杜勒阿米尔(Sajjad Firas Abdulameer):撰写工作——初稿、方法论、概念构建。穆罕默德·萨利赫·阿尔-苏瓦扬(Mohammad Saleh Al-Suwaiyan):撰写工作——初稿、方法论、概念构建。拉纳·穆罕默德·阿德南(Rana Muhammad Adnan):撰写工作——初稿、方法论、概念构建。
利益冲突:不适用
资金支持:
本研究得到了中国国家重点研发计划(项目编号:2022YFC3201803)、国家自然科学基金(项目编号:52479019)、青海省科技重大基础研究发展计划(项目编号:2021-SF-A6)、深圳市科技创新委员会基础研究基金(项目编号:20220807162217001)以及广东省自然科学基金一般项目(项目编号:2023A1515011520)的财政支持。
利益冲突声明:
? 作者声明他们没有已知的可能会影响本文所述工作的财务利益冲突或个人关系。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号