《Remote Sensing Applications: Society and Environment》:A multi-model deep learning framework for urban waste detection in sub-Saharan Africa using Sentinel-2 imagery
编辑推荐:
基于Sentinel-2影像的撒哈拉以南非洲四城垃圾场智能检测框架研究,提出HRNet与DeepLabv3+语义分割结合XGBoost分类的多模型集成架构,创新性引入纹理与指数过滤模块,有效抑制密集城市环境中光谱相似背景干扰,验证显示模型召回率0.66-0.74、F1值0.65-0.77,成功识别面积从18.9m2至416800m2不等的垃圾场,为资源匮乏地区废弃物监测提供可扩展解决方案。
Sachit Desa|Angela Harris|Jonathan J. Huck|Matt D. Tomkins
曼彻斯特大学环境、教育与发展学院(SEED)地理系,MCGIS,英国曼彻斯特牛津路,M13 9PL
摘要
在撒哈拉以南非洲的许多快速城市化城市中,未受管理和非正式的垃圾堆积仍然没有得到测绘。目前的方法通常依赖于精心策划的训练数据集和商业影像,这限制了它们在数据稀缺地区的适用性。本研究通过开发一个基于深度学习的框架来解决这一难题,该框架利用开放获取的Sentinel-2影像来检测撒哈拉以南非洲四个城市中的正式和非正式垃圾堆放点。该框架在四个城市——阿克拉、阿比让、达喀尔和拉各斯进行了性能评估。该网络整合了语义分割模型(HRNet和DeepLabv3+)、分类算法(XGBoost)以及基于纹理和索引的过滤模块。使用高分辨率影像和手动注释对每个城市大约10%的城市范围进行了地面真实值验证。网络取得了稳健的性能,召回率在0.66到0.74之间,精确度在0.64到0.85之间,F1分数在0.65到0.77之间,交并比(IoU)在0.48到0.64之间。检测到的垃圾堆放点面积从18.9平方米到超过416,800平方米不等,大多数位于城市边缘、道路走廊或靠近植被和水体的地方。这些结果代表了迄今为止对这些四个城市垃圾堆积最全面的测绘。所提出的框架展示了开放获取的卫星影像和机器学习工具在监测土地利用变化和跟踪快速城市化及形态密集区域中的空间动态方面的潜力。
引言
非法和不受控制的固体废物处理与环境退化、温室气体排放、食物链污染和海洋污染有关(Manfredi等人,2009年;Strokal等人,2023年)。到2050年,全球废物产生量预计将以人口增长速度的两倍增长(Kaza等人,2018年),加剧了未经管理的废物处理的影响。这些影响在低收入国家的快速发展的城市中最为严重,因为这些城市的废物管理系统没有随着人口和空间的扩张而相应扩展。在这些情况下,据记录有高达90%的废物被露天倾倒或焚烧(Kaza等人,2018年)。尽管单个废物堆放点通常规模较小,但其累积影响却相当大:估计表明,不受监管的废物处理服务了大约40亿人,并占全球废物总量的40%以上(世界银行,2016年),随着人口持续增长,这一负担可能会加剧。
不受监管的废物处理与城市化、发展轨迹和卫生基础设施密切相关(Sun等人,2023年)。在快速城市化的地区,人口增长往往超过了正式废物管理系统的扩展,这些压力尤为明显。在此背景下,撒哈拉以南非洲(SSA)是废物处理研究和监测的关键区域,因为预计到2050年,该地区将占全球人口增长的一半以上(联合国,2024年)。区域估计显示,平均废物收集率和人口覆盖率分别为约65%和67%(Adedara、Taiwo和Bork,2023年),而一些主要城市的收集率低至10%(Kaza等人,2018年)。服务提供不均衡和数据稀缺,加上露天倾倒废物对人类和环境的影响,凸显了需要可扩展、空间明确的测绘方法。
遥感和计算机视觉为大规模检测和表征废物堆放点提供了一条途径。高分辨率的商业影像能够详细识别大型、由市政管理的垃圾填埋场,但成本和许可限制限制了其在资源匮乏地区的适用性(Lavender,2022年;Torres和Fraternali,2023年)。开放获取的卫星影像提供了一个更可扩展的替代方案,但其中等空间分辨率(10–60米)在检测小型、非正式或分散的废物堆放点时存在挑战。在这种情况下,检测性能不仅取决于空间分辨率,还取决于区分复杂光谱和纹理模式与异质城市背景的能力(Fraternali等人,2024年)。
废物检测研究主要依赖于传统的机器学习方法,包括随机森林、支持向量机和极端梯度提升(Liu等人2025a;Liu等人2025b;Lu等人2024),这些方法在受限的、特定于地点的应用中取得了良好的性能,例如河流塑料倾倒和局部废物热点测绘(Sakti等人,2023年;Magyar等人,2023年)。最近的深度学习方法通过学习分层空间和上下文表示,支持在密集城市环境中的语义分割和多阶段检测流程(Li等人,2023年;Zhou等人,2023年;Sun等人,2023年)。架构发展越来越注重多尺度特征表示和后处理优化,以抑制误报,包括结合分割和基于索引或纹理的过滤的级联和混合框架(Lavender,2022年;Kruse等人,2023年;Zhang等人,2025年)。尽管取得了这些进展,大多数研究仍然主要关注大型、市政控制的废物堆放点,对小型、非正式废物堆积或跨区域泛化的关注相对较少(Fraternali等人,2024年)。
几个挑战继续限制废物检测系统的可扩展性和可转移性。依赖地理特定的训练数据集限制了在不同土地覆盖类型、城市形态和处理方式的区域之间的泛化能力。将检测扩展到多城市或国家范围需要处理极端类别不平衡问题,每个真正例检测需要处理数百万个假阴性像素(Kruse等人,2023年)。在密集的城市环境中,这些挑战更加突出,因为光谱反射表面和形态复杂的居住区增加了模糊性,导致系统性过度预测。因此,即使是最可扩展的全球系统在其训练领域之外也表现出明显的性能下降,包括在非正式废物处理普遍的撒哈拉以南非洲城市(Kaza等人,2018年)。进一步加剧与可扩展检测系统相关的挑战是废物研究的区域不平衡。Fraternali等人(2024年)的最新综述发现,50项废物检测研究中有21项集中在欧洲,12项集中在亚洲,只有2项集中在非洲,其中只有4项研究了多个国家。
为了解决上述问题,本研究引入了一个针对撒哈拉以南非洲密集城市环境的集成检测框架,该地区正经历快速的人口和经济增长,城市中心产生了全国大部分的废物(Lu等人,2022年)。与之前要么空间受限要么可转移性有限的方法不同,所提出的框架使用开放获取的Sentinel-2影像,在一个透明、开源的流程中检测正式和非正式废物堆放点。
方法论的贡献是一个分阶段的检测流程,它明确分离了召回率和精确度,以解决密集城市环境中的一个主要故障模式:由光谱和形态模糊性驱动的系统性过度预测。所提出的框架识别高敏感度的候选区域,通过训练有素的机器学习模型细化预测,并应用最终的对象级表面和纹理过滤器。这些组件共同使得在密集、异质的城市环境中可靠地检测废物成为可能,而在这些环境中,简单的分割方法往往失效。
部分摘录
检测网络架构
所提出的检测网络在阿比让、阿克拉、达喀尔和拉各斯进行了评估,如图1所示。在预处理步骤中,应用了一个建筑足迹掩模1来排除城市区域内的非相关建筑区域。一组语义分割模型(包括修改后的HRNet和DeepLabv3+)对掩蔽后的图像进行预测
绘制的废物堆放点
网络检测到的最终验证废物堆放点集在图5中展示。检测使用2024年1月至3月期间捕获的Sentinel-2数据生成的合成图像进行。每个红色标记对应一个废物堆放点,标记大小根据废物表面积进行缩放。作为参考,图5中还包括了OSM和GPW在阿克拉、阿比让、达喀尔和拉各斯城市范围内绘制的现有废物堆放点。
结论
本研究提出了一个用于检测撒哈拉以南非洲城市景观中废物堆放点的网络。由于难以将废物与具有相似光谱特征的异质陆地背景和各种自然及人造材料区分开来,废物检测仍然是一项复杂的任务。通过逐步细化来优先处理误报,所提出的网络提高了在密集和形态复杂环境中的检测可靠性
CRediT作者贡献声明
Sachit Desa:撰写——审阅与编辑、撰写——初稿、可视化、验证、方法论、调查、形式分析、数据管理、概念化。Matt Tomkins:撰写——审阅与编辑、监督。Angela Harris:撰写——审阅与编辑、监督。Jonny Huck:撰写——审阅与编辑、监督
未引用的参考文献
Liu等人,2025年;Liu等人,2024年;联合国经济和社会事务部人口司,2024年;Wang等人,2021年。
伦理声明
作者声明他们没有已知的竞争性财务利益或个人关系可能影响本手稿中报告的工作。所有分析均基于公开可用的卫星影像、遥感产品和地理空间数据集。没有使用人类主体、个人标识符或敏感的个体级别信息,因此不需要机构伦理批准。
利益冲突声明
? 作者声明他们没有已知的竞争性财务利益或个人关系可能影响本论文中报告的工作。