基于无人机遥感的采煤沉陷区地表裂缝检测增强型YOLO11n网络

《Processes》:Enhanced YOLO11n for UAV-Based Surface Crack Detection in Mining Subsidence Areas

【字体: 时间:2026年06月19日 来源:Processes 2.8

编辑推荐:

  采煤沉陷引发的地表裂缝对生态系统、基础设施稳定性及矿山安全构成重大威胁。裂缝具有细长、不连续、低对比度等特征,导致基于无人机(UAV)影像的精确检测面临挑战,尤其在复杂环境条件下。本研究提出了一种增强型YOLO11n框架用于采煤沉陷区地表裂缝检测。研究人员引入

  
采煤沉陷引发的地表裂缝对生态系统、基础设施稳定性及矿山安全构成重大威胁。裂缝具有细长、不连续、低对比度等特征,导致基于无人机(UAV)影像的精确检测面临挑战,尤其在复杂环境条件下。本研究提出了一种增强型YOLO11n框架用于采煤沉陷区地表裂缝检测。研究人员引入可切换空洞卷积(Switchable Atrous Convolution, SAConv)以强化多尺度特征提取,引入级联组注意力机制(Cascaded Group Attention, CGA)以抑制背景干扰并提升特征判别能力,采用Shape-IoU损失函数以增强对细长裂缝目标的定位精度。该模型基于准格尔矿区采集的5000张标注UAV影像进行评估,取得了85.6%的精确率(Precision)、77.9%的召回率(Recall)、84.3%的mAP@0.5以及81.6%的F1分数。与基准YOLO11n相比,精确率、召回率和mAP@0.5分别提升了1.4、4.6和3.2个百分点。在公开Crack500数据集上的跨数据集评估进一步验证了该模型在域迁移条件下的鲁棒性。上述结果表明,所提框架改善了复杂采矿环境中对细长及不连续裂缝的检测与定位能力,支持其在基于UAV的地质灾害监测中的应用。
本研究聚焦于采煤沉陷区地表裂缝的智能检测问题,发表期刊为《Processes》。采煤活动在全球范围内可引发地面变形与地表裂缝,对生态系统、基础设施稳定性及矿山安全构成严重威胁,尤其在煤炭主产区如中国西部地区,大规模高强度开采使得裂缝监测的时效性需求尤为突出。传统监测手段主要依赖人工调查、干涉合成孔径雷达(InSAR)及卫星遥感解译,但InSAR与卫星影像空间分辨率不足,难以检测狭窄且不连续的裂缝,人工调查则难以满足大范围应用需求;加之复杂地形与环境变异性进一步降低监测可靠性,导致及时准确的裂缝检测仍具挑战性,制约了地质灾害评估与预警效能。随着无人机(UAV)技术的快速发展,低空遥感为矿区地质灾害监测提供了新途径,其灵活部署、高效作业及高分辨率影像获取能力显著提升了地表裂缝检测的空间精度与监测效率;然而UAV影像处理与解译仍面临挑战,尤其从大量高分辨率影像中准确提取裂缝信息尚存困难。深度学习技术的进步使智能化地表裂缝检测成为矿区地质灾害监测的有效途径,但采矿诱发裂缝具有细长形态、大尺度变化及复杂背景干扰等特点,现有方法仍面临细长不连续裂缝特征提取不足、易受背景干扰、小目标及细长目标定位不准三大关键挑战。

为应对上述问题,研究人员基于YOLO11n框架提出增强型检测网络,通过系统性评估卷积结构、注意力机制及损失函数进行优化。研究所用关键技术方法包括:以YOLO11n为基线网络,在其骨干网络(Backbone)的C3k2模块中嵌入SAConv模块形成C3k2_SAConv,实现自适应感受野的多尺度特征提取;在颈部网络(Neck)的特征融合层后插入CGA注意力机制,增强对细长不连续裂缝结构的特征表示与背景抑制能力;采用Shape-IoU损失函数替代CIoU进行边界框回归,引入形状感知权重与方向距离惩罚以提升对细长裂缝目标的定位稳定性。数据集方面,研究人员采用飞马D20无人机搭载D-OP3000五镜头倾斜摄影系统,于准格尔矿区东北部约6.0 km2范围内开展航拍,飞行高度400 m、地面采样距离(GSD)5–7 cm,经亮度与对比度调整等数据增强后构建含5000张影像的自建数据集,按7:2:1划分为训练、验证与测试集;同时在公开Crack500数据集上进行跨域泛化评估。

实验部分,消融实验结果与分析显示:单独引入SAConv模块(Configuration C)使召回率和mAP@0.5分别提升5.4%和2.3%,但参数量、模型大小及浮点运算量(FLOPs)显著增加,帧率(FPS)下降51.57%;单独引入CGA机制(Configuration B)使召回率和mAP@0.5分别提升1.9%和0.7%,参数量减少0.03 M,但FPS下降18.92%;单独采用Shape-IoU(Configuration A)仅提升精确率0.7%,其余指标有所下降。组合使用SAConv与CGA(Configuration D)使精确率、召回率和mAP@0.5分别提升2.0%、3.5%和2.8%。最终整合三模块的模型精确率达85.6%、召回率77.9%、mAP@0.5为84.3%、F1分数81.6%,相较基线YOLO11n分别提升1.4、4.6、3.2个百分点及3.2个百分点,但参数量从2.83 M增至12.32 M,FLOPs从10.2 G增至38.6 G,模型大小从5.76 MB增至23.9 MB,FPS从127.4降至57.2。Grad-CAM可视化对比表明,增强模型在植被覆盖、阴影干扰、细小不连续裂缝及复杂纹理背景四类场景下,激活图更集中于裂缝结构,背景干扰显著降低;特征图可视化显示SAConv增强了裂缝连续性表示,CGA进一步抑制背景干扰并强化裂缝特征判别。

与其他算法对比分析表明,增强模型在YOLO系列检测器中F1分数最高(81.6%),超过YOLO11n基线(78.4%)3.2个百分点。五次独立训练的种子随机性与统计显著性分析显示,增强模型各指标均值优于基线且方差更低,独立样本t检验确认改进具有统计学显著性(p < 0.05)。在Crack500数据集上的泛化评估中,增强模型精确率、召回率、mAP@0.5及F1分数(78.4%)均为对比方法中最高,相较YOLO11n(74.4%)提升4.0个百分点,表明其跨域鲁棒性。

讨论部分深入阐释了结果含义与机制。增强模型主要通过三方面机制提升性能:SAConv自适应感受野增强长程上下文与多尺度特征提取,改善细长不连续裂缝连续性感知;CGA通过分组通道子空间注意力与级联聚合提升特征判别、抑制植被阴影等背景干扰;Shape-IoU引入形状感知几何约束改善边界框回归稳定性。然而这些增益伴随明确计算代价,模型应被视为精度导向的增强方案而非严格轻量级检测器,适用于航后处理或半实时工作站检测场景,边缘设备实时部署仍需轻量精简、知识蒸馏等技术优化。主要误差机制包括:视觉歧义(阴影、车辙、侵蚀边界类似裂缝)、不完全可见性(植被或严重阴影遮挡裂缝连续性)、空间证据不足(狭窄低对比度裂缝接近分辨率极限)。失败案例分析表明,密集植被或阴影下的部分遮挡裂缝易产生假阴性,强阴影与纹理边界易引发假阳性。研究局限性在于:SAConv显著增加计算复杂度导致推理速度降低55.1%;数据集仅来自准格尔矿区特定区域,地质与环境多样性有限,煤层分布、土壤颜色、植被覆盖及变形模式在其他矿区(如神东、新疆、西南矿区)可能存在差异,极端条件下模型泛化能力需进一步验证。未来研究将聚焦于轻量化网络设计、模型压缩、知识蒸馏以降低计算开销,并探索UAV影像、激光雷达(LiDAR)及多光谱信息的多源数据融合,以提升复杂采矿环境下裂缝检测的鲁棒性与泛化能力。

研究结论部分指出,本研究提出一种增强型YOLO11n框架用于无人机遥感采煤沉陷区地表裂缝检测。通过整合SAConv、CGA及Shape-IoU损失,该方法改善了复杂环境条件下的裂缝定位与检测精度。实验结果表明,与基线模型相比,精确率、召回率和mAP@0.5分别提升1.4%、4.6%和3.2%。然而,精度提升伴随着参数量、模型大小、FLOPs的增加及FPS的降低,且数据集在区域多样性方面仍存在局限。未来工作将聚焦于轻量化模型设计、剪枝、知识蒸馏、边缘人工智能(Edge-AI)部署、多区域无人机数据集构建、数字孪生集成及预测性地质灾害监测系统开发。
相关新闻
生物通微信公众号
微信
新浪微博
  • 搜索
  • 国际
  • 国内
  • 人物
  • 产业
  • 热点
  • 科普

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号