《PLOS One》:Detection of submarine pipeline and cable targets based on depth feature of high resolution sonar image
编辑推荐:
针对侧扫声呐(Side-Scan Sonar,SSS)潜艇管道与电缆目标特征提取存在的实时性差、误检率高及边缘设备部署困难等问题,研究人员将深度特征技术引入检测任务,基于YOLO11n-seg模型进行改进,融入A2C2f与DSConv模块,结合目标影像特征,实
针对侧扫声呐(Side-Scan Sonar,SSS)潜艇管道与电缆目标特征提取存在的实时性差、误检率高及边缘设备部署困难等问题,研究人员将深度特征技术引入检测任务,基于YOLO11n-seg模型进行改进,融入A2C2f与DSConv模块,结合目标影像特征,实现了SSS影像中潜艇管道与电缆的实时检测。该方法有效降低了SSS影像中潜艇管道特征的误检率,减少了参数量并实现轻量化部署。在Marine-PULSE潜艇管道与电缆数据集上进行的消融实验与对比实验结果显示,相较于原始YOLO11n-seg模型,改进模型的边界框召回率提升9.7%,mAP@50-95提升1.6%;实例分割召回率提升10.3%,mAP@50提升3.6%。检测精度与完整性同步增强,参数量减少15%,实时性优势显著。在目标检测任务中,该模型的mAP@50较YOLO12n-seg提升5.2%,较YOLO13n-seg提升12.5%。实验表明,本研究设计的模型是SSS潜艇管道与电缆目标实时检测的有效方法,具有良好的发展前景与推广价值。
该研究发表于《PLOS One》,聚焦海洋基础设施“生命线”——潜艇管道与电缆的安全检测需求。由于地质变化、海水腐蚀及沉积物掩埋等因素,潜艇管道易发生泄漏,造成巨大经济损失与环境危害,因此需定期巡检。传统SSS影像目标检测依赖人工解译,在复杂地形下误检率高、效率低,无法实现在线实时检测。水下光学成像受光照、水体浑浊度限制,难以在深海无光及近岸浑浊水域作业,而侧扫声呐依靠声波传播成像,不受光照与水透明度影响,可在全水深及复杂海洋环境中稳定获取高分辨率海底影像,且具有更长探测距离与更广覆盖范围,适合搭载自主水下航行器(AUV)进行长距离大规模管线巡检。深度特征目标检测方法凭借深度神经网络的自动特征学习能力,可从海量海底影像数据中挖掘有效特征,提升处理效率与精度,实现端到端的潜艇管道与电缆目标自动提取与检测。当前主流的两阶段检测算法(如R-CNN、Faster R-CNN)虽精度较高,但推理速度慢,难以满足AUV嵌入式平台的实时需求;单阶段算法中,YOLO系列因推理速度快而被广泛应用,其中YOLO11n-seg兼具检测与实例分割分支、轻量化参数规模及模块化设计优势,被选为本研究的基线模型。
研究人员采用的关键技术方法包括:以Marine-PULSE渤海海域海洋工程地质公开SSS数据集(含323幅标注的潜艇管道影像)为基础,通过旋转、翻转、加噪等数据增强扩充至1615幅训练样本;在YOLO11n-seg基线模型中,以A2C2f(区域注意力增强跨特征)模块替换原C3K2模块,引入区域自注意力机制捕捉细长线性目标的连续结构与空间位置信息,并通过R-ELAN优化梯度传播与特征表达;以DSConv(深度可分离卷积)模块替换标准卷积层,由DWConv(深度卷积)提取空间特征、PWConv(逐点卷积)融合通道特征,降低计算复杂度与参数量;采用CIoU损失函数优化边界框回归,结合分类损失、目标置信度损失及像素级二值交叉熵分割损失,实现检测与分割任务的均衡优化。
研究结果如下:
基线模型:YOLO11n-seg的骨干网络采用C3K2模块(CSP瓶颈架构的快速实现)优化浅层特征提取,Neck部分通过C3K2聚合多分辨率特征,Head完成预测;C2PSA模块引入位置敏感注意力机制(PSABlock),通过多头注意力与前馈神经网络增强特征提取能力,但标准卷积模块计算复杂度高,不利于实时检测。
A2C2f模块:基于Transformer注意力构建,核心ABlock包含区域注意力(A2)与MLP层,将特征图划分为g个区域进行局部注意力计算,在保留全局感受野的同时将计算复杂度降至全局自注意力的1/g;R-ELAN通过残差连接与特征聚合优化,提升梯度流动与特征表达能力,适配潜艇管道的弯曲、断裂及部分掩埋形态。
DSConv模块:由DWConv与PWConv组成,先对各输入通道独立进行空间卷积,再通过1×1卷积融合跨通道特征,参数量与计算量降至标准卷积的1/(Dk2+1/N)(Dk为卷积核尺寸,N为输出通道数),显著提升推理速度。
轻量化网络模型:将原C3K2模块替换为A2C2f模块,在P3浅层网络末端增强边缘与纹理特征传输,在P4中层网络末端通过区域注意力抑制无关背景特征,同时引入DSConv模块降低计算成本,实现精度与效率的平衡。
实时检测方法流程:预处理阶段将SSS影像统一缩放至640×640像素并保留原始长宽比,采用高斯滤波抑制斑点噪声;数据集按7:2:1划分为训练集、验证集与测试集,无重叠且特征分布一致;通过端到端训练完成模型迭代与性能评估。
实验评估:消融实验显示,单独引入A2C2f模块提升检测框精度3.0%,分割mAP@50与mAP@50-95同步提升;单独引入DSConv模块使召回率提升3.4%,参数量显著降低;二者融合后,边界框召回率提升9.7%,分割召回率与精度同步增强,参数量减少15%。梯度消融实验证实,仅需50%训练样本即可达到全样本性能的95%,30%样本时仍保留90%以上性能,对标注数据依赖低。对比实验表明,该模型mAP@50优于YOLO11n-seg、YOLO12n-seg及YOLO13n-seg,参数量减少15%,GFLOPs降低6%,推理速度达70 FPS,适合AUV边缘设备实时部署。过拟合分析与鲁棒性评估显示,模型通过数据增强、轻量化设计及严格数据集划分有效抑制过拟合,在复杂背景、低对比度及目标遮挡场景下均保持稳定检测性能。
讨论部分指出,现有模型仍有优化空间,未来可通过风格迁移增强数据多样性,进一步提升实时检测场景下的精度与轻量化水平。研究结论为:基于YOLO11n-seg改进的A2C2f+DSConv模型,在Marine-PULSE数据集上实现了潜艇管道与电缆的高效实时检测,分割mAP@50提升3.6%、边界框mAP@50-95提升1.6%,召回率分别提升10.3%与9.7%,参数量减少15%,为海洋调查与管线目标特征提取提供了可靠技术方案,具有重要工程应用价值。