《Agriculture》:GIS and Remote Sensing Applications for Assessing Soil Contamination in South African Agriculture: A Machine Learning-Enhanced Scoping Review
Gift Siphiwe Nxumalo,
Tondani Sanah Ramabulana and
Attila Nagy
编辑推荐:
这篇综述采用机器学习(ML)辅助的PRISMA-ScR框架,系统性回顾了2003-2025年间发表的228项研究,首次对南非农业土壤污染的地理信息系统(GIS)、遥感(RS)及机器学习应用证据库进行了量化与图谱绘制。研究发现,遥感是该领域的核心方法(占研究总数的62.3%),而机器学习自2020年起成为应用最广泛的技术。研究揭示了明显的证据缺口:深度学习在所有技术和污染物矩阵中均无应用,农药/除草剂、酸性矿山废水等关键污染物研究极少。综述还识别了研究的空间不均衡性,成果高度集中在夸祖鲁-纳塔尔省和东开普省。作者呼吁未来研究应优先投资于欠发达省份的实地验证、针对特定污染物的高光谱与深度学习技术应用,并构建可解释的模型以支持监管决策。
1. 引言
土壤污染是全球可持续农业、生态系统完整性和公共健康的普遍且日益严重的威胁。在南非,这一全球性压力与殖民和种族隔离后的工业遗产交织在一起。南非庞大的采矿部门产生了广泛的矿山废物、酸性矿山排水(AMD)和尾矿,将具有植物毒性的镉、铅、砷、锌和镍等重金属沉积到邻近的农业土壤和水体中。与此同时,商业化农区日益增加的农用化学品施用也带来了持续的农药残留和硝酸盐负荷,损害土壤微生物群落,抑制养分循环,并进入食物链。
传统土壤质量评估依赖于基于点的田间采样和后续的实验室理化分析,这种方法成本高昂,时空覆盖范围有限,无法满足大面积异质景观下的精准土壤管理或监管执法需求。地理信息系统(GIS)和卫星遥感(RS)通过提供从田间到大陆尺度的空间连续、时间重复的观测,极大地扩展了土壤监测的范围。土壤在可见光、近红外(NIR)和短波红外(SWIR)波段的反射特性携带了与污染状况、侵蚀风险和土地退化严重程度相关的诊断信息。
机器学习(ML)作为GIS和遥感的变革性分析补充,能够从高维地理空间特征空间中非线性、多变量地建模土壤属性。随机森林(RF)、梯度提升决策树(XGBoost)和支持向量机(SVM)等算法在预测重金属浓度和污染指数方面表现出卓越的性能。然而,ML在南非农业土壤污染评估中的应用仍然零散且缺乏系统性评估。本研究旨在通过一项机器学习增强的范围综述,填补这一知识空白,系统性地绘制、量化和综合2010年至2025年间发表的关于GIS和RS在南非农业土壤污染评估中应用的同行评议研究。
2. 材料与方法
本研究设计为范围综述,遵循PRISMA-ScR框架。检索策略涵盖了Web of Science核心合集和非洲期刊在线(AJOL)两个数据库,时间跨度为2003年至2025年。采用基于人口-概念-背景(PCC)框架的资格标准。筛选工作流程包括三个阶段:1)自动预筛选;2)机器学习辅助筛选(使用支持向量机SVM分类器);3)人工验证。最终纳入228项合格研究。
从每项纳入研究中提取元数据,包括地理范围、污染物类型、遥感平台、分析方法和关键发现。采用机器学习文本挖掘和主题建模(潜狄利克雷分配,LDA)来识别语料库中的潜在研究主题。此外,还进行了逻辑增长建模,以表征该领域的成熟度,并构建了技术-污染物和技术-省份证据缺口矩阵,以可视化研究空白。
3. 结果
3.1. 研究选择与语料库特征
经过筛选,最终语料库包含228项研究。土地退化是最常涉及的污染物/压力源类别(n=31),其次是侵蚀和沉积物运移(n=23)、重金属(n=17)。遥感是最常用的方法(n=142),其次是GIS和空间分析(n=84)以及机器学习(n=42)。
3.2. 出版物产出与方法学采纳的时间趋势
年出版物数量从2003年的2项增长到2021年的峰值22项。对年度出版物系列的逻辑增长模型估计,其承载能力为K=292.3项研究,增长率为r=0.275,拐点年份为t0=2020.2,预计到2028年达到90%的饱和度。在整个审查期间,遥感一直是主导的方法类别。大约从2020年开始,机器学习在采纳排名中升至第一位。
3.3. 关键词共现网络结构
关键词共现分析将网络划分为五个主题社区,分别对应重金属和采矿污染、入侵物种检测和养分制图、土地覆盖变化和侵蚀监测、综合土地覆盖分类和管理以及地理空间土壤监测和污染制图。
3.4. LDA主题建模:k=7时的潜在研究主题
LDA主题建模确定了七个潜在研究主题:1)采矿与植被影响;2)土壤评估与地下水;3)用于矿山和水监测的遥感;4)土壤-土地侵蚀与指数建模;5)植被与土地覆盖制图;6)侵蚀与退化监测;7)空间水与土地变化。这些主题与南非环境监测文献中可识别的学科划分相一致。
3.5. 证据缺口分析:技术-污染物与技术-省份矩阵
技术×污染物证据矩阵显示,GIS/制图是应用于土地退化、侵蚀/沉积物、重金属等类别最频繁的技术。遥感在土地退化、入侵物种、侵蚀/沉积物等方面记录了最高的单元格计数。机器学习被应用于土地退化、入侵物种、重金属等。深度学习在所有污染物类别中均为零记录。农药/除草剂、塑料/废物和酸性矿山排水是技术单元格最少的类别,代表了明显的研究空白。技术×省份证据矩阵显示,研究努力高度集中在夸祖鲁-纳塔尔省和东开普省,而北开普省等地则覆盖极少。
4. 讨论
4.1. 研究领域的成熟:全球背景下的增长轨迹
南非语料库的逻辑增长轨迹与全球数字土壤制图、土地退化遥感和土壤科学中机器学习应用的类似S型增长模式相当。然而,南非的拐点较晚(约2020年),反映了在开放获取卫星数据基础设施、研究资金和历史分散的国家土壤监测框架方面的结构性滞后。这意味着该领域仍处于增长阶段,当前在数据基础设施和方法标准化方面的投资将产生不成比例的高回报。
4.2. 主题优先级及其与国家背景的关系
土地退化和侵蚀/沉积物共占纳入研究的近四分之一,这反映了真实的国家优先级。重金属研究的突出地位与南非金、铂和煤炭开采带的空间足迹一致。农药/除草剂和酸性矿山排水在研究中的低代表性需要审慎解读,它们反映了光谱和学科两方面的制约,而非根本性的方法学障碍。在所有污染物类别和省份中,深度学习的零记录表明,南非农业土壤研究尚未建立负责任地部署深度学习所需的标注训练数据集或计算基础设施。
4.3. 验证缺口与可解释性问题
在2003年至2025年整个期间,田间/实验室研究数量持续偏低(每年1-3项),而机器学习采纳量增长了近十倍,这代表了南非语料库中最关键的结构性矛盾。这种分离在2016年后随着Sentinel-2和多源融合研究的激增而扩大。随机森林和集成分类器主导了南非的机器学习文献,但它们提供的变量重要性输出不等于因果推断。在采用可解释的建模框架之前,该语料库中最复杂的计算研究的输出在法律上仍然不可操作。
4.4. 研究覆盖的空间不平等
技术×省份矩阵揭示了研究努力明显集中在夸祖鲁-纳塔尔省和东开普省,而北开普省等地则代表极少。这种空间不平等并不完全对应污染风险。这种研究集中模式与撒哈拉以南非洲土壤制图综述中记录的机构引力效应一致,即研究系统性地围绕城市学术中心而非需求最高的景观聚集。
4.5. 新污染物与当前遥感的局限
塑料/废物类别尽管是全球增长最快的研究前沿之一,但在南非语料库中技术成熟度最低。南非在该类别中的研究似乎主要依赖于空间邻近建模和废物积累热点的机器学习分类,而非直接光谱检测。盐碱化提出了一个不同但更易解决的技术挑战,南非语料库对此的关注度低于方法学上可达到的国际水平。
4.6. 参与式和嵌入式方法:真实但欠发达的贡献
南非语料库的一个显著特点是参与式GIS和社区脆弱性评估的整合。这些方法在全球土壤污染遥感文献中很少见,反映了后种族隔离政策环境。然而,这些方法在地理上受限,主要集中在夸祖鲁-纳塔尔省和东开普省,这错失了将其推广到服务不足省份的机会。
5. 结论
这项范围综述综合了2003年至2025年间发表的228项同行评议研究,首次为南非农业土壤污染评估中的GIS、遥感和机器学习应用绘制了量化、可重复的证据图谱。逻辑增长模型表明该领域在2020年左右通过了其年出版物峰值,预计到2028年达到90%饱和度,这意味着塑造聚合证据基础构成的窗口期很短。研究发现存在主题和地理上的双重不平等。综合证据揭示的不是方法学雄心的缺失,而是地理覆盖范围、计算复杂性和实地基础这三个维度之间的结构性脱节。解决这些缺陷需要研究重点的有意重新定位。光谱和算法前沿也提出了独特但同样可应对的挑战。逻辑轨迹的更深层意义在于,聚合证据基础的结构构成——其地理分布、验证密度和污染物覆盖范围——将在剩余的增长窗口期内被决定:现在将这一构成重新导向空间公平、实地基础和监管问责性是当务之急。