机器学习模型在煤矿区水质预测中的应用:对印度东部丹巴德地区氟化物和苯酚污染情况的分析
《Environmental Pollution》:Application of machine learning models for water quality prediction in a coal-mining region: Insights into fluoride and phenol contamination in Dhanbad District, Eastern India
【字体:
大
中
小
】
时间:2026年06月11日
来源:Environmental Pollution 7.3
编辑推荐:
尼蒂什·库马尔|阿洛克·辛哈|斯里尼瓦斯·帕苏普莱蒂印度理工学院(印度矿业学院)土木工程系,印度丹巴德摘要:在以采矿为主的地区,由于地质作用和人类活动的共同影响,水质恶化成为一个严峻问题。然而,目前仅有少数研究将水文地球化学分析与数据驱动建模相结合,以量化煤炭开采区域中特定污染物
尼蒂什·库马尔|阿洛克·辛哈|斯里尼瓦斯·帕苏普莱蒂印度理工学院(印度矿业学院)土木工程系,印度丹巴德摘要:在以采矿为主的地区,由于地质作用和人类活动的共同影响,水质恶化成为一个严峻问题。然而,目前仅有少数研究将水文地球化学分析与数据驱动建模相结合,以量化煤炭开采区域中特定污染物的影响,尤其是像酚类这样的污染物。本研究评估了印度东部煤炭资源丰富的丹巴德地区的饮用水质量,并确定了主要的污染途径。共分析了262份水样,依据质量控制规范检测了其物理化学参数和痕量金属。通过Piper和Gibbs图进行水文地球化学特征分析,结果表明该地区以Ca2+–Mg2+–Cl-–SO42-型水系为主,这种分布受岩石与水的相互作用以及局部蒸发和人类活动的影响。熵水质指数分析显示,由于氟化物和酚类浓度过高,54.96%的样本不适合作为饮用水,而排除这两项指标后,这一比例降至3.44%,凸显了它们带来的巨大影响。选择这两项指标是因为它们毒性高、允许浓度低,且来源既有地质因素也有人为因素。斯皮尔曼等级相关分析结果显示,氟化物与主要离子之间的关联较弱(|ρ| < 0.2),表明其受地质因素控制,而酚类则与电导率和主要离子存在中等程度的正相关(ρ ≈ 0.24–0.32),反映出人类活动的影响。研究人员建立了三种机器学习模型——支持向量回归、随机森林和极端梯度提升,用于预测熵水质指数,其中极端梯度提升模型的性能最佳(R2 = 0.97 ± 0.02,RMSE=27.20 ± 13.57,MAE=15.45 ± 4.51)。这一框架有助于在受采矿影响的地区快速进行水质评估并实现可持续的水资源管理。引言地下水是人类不可或缺的资源,它满足了69%的农业用水需求、22%的工业用水需求,还为全球家庭提供了大约8%的用水量(Das等人,2020;Jha和Tripathi,2021)。地下水为约15亿人提供饮用水,由此可见这一水源对公共健康和人类福祉具有极其重要的意义(Adimalla和Qian,2019)。安全饮用水的可用性通常被视为一项基本人权,同时它也是社会经济繁荣的重要指标,尤其是在农村和城郊地区(Kerdoun等人,2022)。人口快速增长、城市化进程加快、农业集约化、采矿活动以及工业扩张等诸多因素使得对淡水的需求大幅上升。与此同时,所有这些活动都给本就负担沉重的地下水系统带来了更大压力(Khan等人,2020;Rao等人,2022)。污染源包括未经处理的工业废水、含有化肥和农药的农业径流、未经妥善处理的固体废物渗滤液,以及化粪池和污水池中的污染物。这些污染物会通过裂缝和多孔介质渗透到地下,最终进入含水层,改变其水文地球化学特性。因此,维持地下水的质量和数量已成为一项全球性挑战,这也促使人们开展大量科学研究,寻求可持续的地下水管理策略(Maurya等人,2020;Subramaniyan等人,2022;Mukherji,2022;Das等人,2023;Subba Rao,2021)。由于砷、铬、硝酸盐、铁、氟化物以及其他微量金属等有害物质的存在,地下水质量常常受到影响(Dhillon,2019;Poonia等人,2021;Singh等人,2022;Anjali等人,2024)。在这些污染物中,氟化物因其对人类健康的双重影响而备受关注。在极低浓度下(约0.5–1.0毫克/升),氟化物有益于牙齿和骨骼健康,但当浓度超过1.5毫克/升的推荐限值时,就会引发牙齿和骨骼氟中毒(世界卫生组织,2011;Singh等人,2018;Giri和Singh,2022)。长期摄入氟化物会导致牙齿和骨骼氟中毒,还可能与低钙血症、肾功能障碍、肌肉骨骼疾病、神经系统损伤、儿童认知发育迟缓以及其他系统性健康问题有关(Yousefi等人,2018;Mandal等人,2021;Aktar等人,2025)。地下水中的氟化物污染主要源于地质作用,这是水与岩石长时间相互作用的结果,此类作用会溶解萤石、氟磷灰石、黑云母、角闪石、白云母和硅氟石等含氟矿物(Subba Rao等人,2020;Hu等人,2022)。此外,地下水呈碱性,钙含量极低,同时富含碳酸氢盐,离子交换反应和氧化还原过程也会促进氟化物从含水层中释放出来(Adimalla等人,2018;Dehbandi等人,2017;Jha和Tripathi,2021)。虽然也有自然因素会导致氟化物出现,但人类活动往往更为重要,比如磷酸盐肥料的施用、工业废水的排放、煤矿开采以及工业污泥的处理,这些都可能使当地地下水中氟化物含量升高(Maurya等人,2020;Kashyap等人,2021)。据估计,全球有超过2亿人患有不同程度的牙齿和骨骼氟中毒,而在印度,约有6600万人受到此病困扰(Adeyeye等人,2021)。印度氟化物污染问题的严重程度极高,已有报告指出,不同州的270多个地区都存在这一问题,有些地方的氟化物浓度甚至超过了40毫克/升(Dhingra和Shah,2021;De等人,2022)。在地质学和环境领域的研究中,人们发现贾坎德邦的地下水中,尤其是在采矿活动附近,氟化物含量较高(Giri和Singh,2022;Kumar等人,2022)。根据相关数据,丹巴德区某些地区的氟化物浓度超过14毫克/升,主要集中在巴利亚普尔地区,这给饮用水安全带来了极大威胁(Patolia和Sinha,2017;Thapa等人,2019)。在全球范围内,对水质进行监测至关重要,尤其是在那些以地下水作为饮用水和灌溉水源的地区。通过各种指数可以确定水中的化学和物理参数,从而便于政策制定者进行评估(Ganguli等人,2022;Kouser等人,2022)。其中,熵水质指数因其运用信息熵技术对参数进行客观赋权而受到科学家们的青睐。由于这一特点,在评估饮用水质量时,评估结果不会受到主观因素的影响。除了评估饮用水质量外,还可以通过钠含量百分比、钠吸附比、残留碳酸钠、渗透率指数、Kelly比率以及镁吸附比等水文地球化学指数来评估水体的灌溉适用性(Rawat等人,2018;Subba Rao,2021;Raj等人,2025)。这类指数有助于识别与土壤肥力和农作物生长相关的盐碱化问题(Subba Rao,2021)。在采矿区和农业区,也采用了类似的方法来分析水质及灌溉适用性(Omeka等人,2024;Aghamelu等人,2023)。近年来,得益于人工智能领域的技术突破,人们能够更高效地预测水质。随机森林、支持向量回归和集成树等方法在处理复杂的水文地球化学数据集时表现出色(Jaydhar等人,2022;Ling等人,2022)。这些方法也被广泛应用于预测地下水质量及评估灌溉适用性,充分体现了其在模拟复杂环境系统方面的优势(El-Kenawy等人,2023;Takieldeen等人,2022;Ibrahim等人,2025)。这些研究证明了将地理空间分析和机器学习相结合用于水质预测的有效性,不过大多数研究主要集中在灌溉适用性或脆弱性分析方面(Omeka等人,2024;Omeka和Egbueri,2023)。此外,基于熵值和地理空间建模的方法也被用于评估复杂含水层系统中的地下水污染脆弱性及水文地球化学过程(Aghamelu等人,2023;Omeka等人,2024;Omeka等人,2022;Igwe和Omeka,2022)。这些方法已被广泛用于预测单一污染物并生成脆弱性地图,但在预测诸如熵水质指数之类的综合指标方面,尤其是在涉及主要离子和痕量金属的数据集中,应用仍然有限。目前,关于丹巴德区部分地区的氟化物和痕量金属含量的研究还比较有限,无法全面了解它们对水质的 regional-scale影响。目前尚未有研究在区域尺度上结合水文地球化学分析、饮用水质量指数、灌溉适用性评估以及基于机器学习的预测方法来进行全面研究。现有的研究大多集中在特定区域或单一污染物上,缺乏将水文地球化学方法和机器学习有效结合以预测综合水质的能力。目前关于丹巴德区氟化物和痕量金属含量的信息仍然不足,难以全面了解它们对该地区水质的影响。因此,亟需在区域尺度上进行一项涵盖水文地球化学分析、饮用水质量指数、灌溉适用性评估以及基于机器学习预测的综合性研究。大多数现有研究仅聚焦于特定区域或单一污染物,难以全面了解采矿活动和人类活动对水质的负面影响。此外,煤炭开采及相关产业产生的酚类化合物的分布情况也尚未在区域尺度上进行过研究,相关研究十分匮乏。本研究旨在通过在印度贾坎德邦的丹巴德区应用综合性评估框架,填补这些研究空白。本研究的目标包括:(一)确定地下水和地表水中的物理化学参数,如氟化物、酚类物质及重金属;(二)利用熵水质指数评估饮用水质量;(三)通过水文地球化学指数评估水的灌溉适用性;(四)确定控制水质的主要水文地球化学过程;(五)构建支持向量回归、随机森林和极端梯度提升三种机器学习模型,用于预测熵水质指数数值。将基于熵值的指数方法、水文地球化学分析以及机器学习相结合,可为受采矿影响的地区提供全面的区域尺度水质评估框架,该框架经过适当调整后也可应用于其他地区。研究区域与地貌本研究在印度贾坎德邦的丹巴德区开展,该地区位于印度最大的煤矿区,被誉为“印度煤炭之都”。该区地处北纬23°37′至24°04′、东经86°06′至86°50′之间(见图1),属于达莫达尔河流域东部乔塔纳格普尔高原的一部分。该地区属于湿润亚热带气候,年平均降雨量为1,200–1,400毫米,主要集中在西南季风期间。地下水和地表水的特征水质参数的统计分析结果显示(见表S3),研究区域内存在显著的空间差异,这反映了地质条件、采矿活动以及人类活动共同造成的影响。样品的pH值在6.17到8.20之间,平均值为6.92 ± 0.32,说明这些样品总体呈中性或微碱性。这种pH值特征常见于结晶质硬岩含水层中的地下水,尤其是片麻岩中的地下水。结论本研究对印度东部以煤炭开采为主的丹巴德地区的地下水和地表水质量进行了综合水文地球化学分析与数据驱动评估。水文地球化学分析表明,大部分水样属于Ca2+–Mg2+–Cl-–SO42-型水系,这主要是长期水与岩石相互作用的结果,而在高盐度区域,蒸发作用和人类活动也可能对水质产生影响。熵水质指数显示,该地区的水质存在大规模退化现象。致谢作者贡献说明斯里尼瓦斯·帕苏普莱蒂:撰写——审阅与编辑、监督、资源协调、项目管理、调查研究、资金筹集。尼蒂什·库马尔:撰写——审阅与编辑、原始稿撰写、数据可视化、结果验证、软件应用、方法设计、调查研究、正式分析、数据整理、概念构建。阿洛克·辛哈:撰写——审阅与编辑、结果验证、监督、项目管理、调查研究、资金筹集。未引用参考文献Akter等人,2025;BIS,2012;Domenico和Schwartz,1997;Elzain等人,2022;Equeenuddin和Pattnaik,2020;Kumari等人,2024;Lapworth等人,2012;Lopez等人,2021;Maurya等人,2021;Menció等人,2016;Mukherji,2020;Nafouanti等人,2021;Omeka,2024;Omeka和Egbueri,2022;Omeka等人,2024;Podgorski等人,2022;Rao,2021;Rao等人,2020;Szaboles和Darab,1964;Vapnik,2000;Zhang等人,2020。资金支持本研究得到了Anusandhan国家研究基金会核心研究基金项目的资助(批准文件编号:CRG/2023/002739)。该资助机构并未参与研究设计、数据收集与分析、结果解读、论文撰写,也未参与决定是否将文章投稿发表。利益冲突声明:作者声明自己不存在任何可能影响本文所述工作的已知财务利益或个人关系。致谢:作者衷心感谢Anusandhan国家研究基金会(ANRF)在核心研究资助计划下提供的资金支持(文件编号:CRG/2023/002739)。同时,作者也感谢印度理工学院丹巴德分校为研究提供的实验室设施及机构支持。此外,作者还诚挚感谢在采样和分析过程中给予支持和帮助的现场及实验室工作人员。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号