基于结构保持增强与自适应锚点的鲁棒近岸SAR舰船检测统一框架

《Applied Sciences》:DN-AnchorNet: A Unified Framework with Structure-Preserving Enhancement and Adaptive Anchors for Robust Coastal SAR Ship Detection

【字体: 时间:2026年06月19日 来源:Applied Sciences 2.5

编辑推荐:

  合成孔径雷达(Synthetic Aperture Radar, SAR)图像中的舰船检测是海洋工程与近岸安全领域不可或缺的全天候技术,但在复杂近岸场景中仍面临耦合的散斑噪声、海陆杂波、剧烈尺度变化与极端类别失衡等挑战。现有解耦式流程无法联合缓解这些退化因素,

  
合成孔径雷达(Synthetic Aperture Radar, SAR)图像中的舰船检测是海洋工程与近岸安全领域不可或缺的全天候技术,但在复杂近岸场景中仍面临耦合的散斑噪声、海陆杂波、剧烈尺度变化与极端类别失衡等挑战。现有解耦式流程无法联合缓解这些退化因素,导致虚警率高且泛化能力差。本研究提出DN-AnchorNet,一种端到端统一框架,集成面向检测的结构保持增强分支、尺度自适应锚点机制与自适应加权Smooth L1(Adaptive Weighted Smooth L1, ASL1)损失。该检测引导的增强分支无需配对干净数据即可保留关键舰船结构。尺度自适应锚点设计增强了对小型、细长及任意朝向舰船的匹配能力,而定制化的损失函数通过动态阈值调整与有效正样本回归掩码改善了类别失衡下的回归鲁棒性。研究者在RSDD-SAR与SSDD+所采用的固定近岸压力测试协议下开展了广泛实验,结果表明DN-AnchorNet在该评估设定下的代表性 oriented object detector 中取得了最优综合性能,AP50值分别为0.699和0.610,F1分数分别为0.757和0.689。在HRSID上的严格零样本跨数据集评估为DN-AnchorNet向未知海洋SAR条件的迁移能力提供了补充证据。这些结果表明,联合优化能够在具有挑战性的近岸SAR检测条件下实现准确度与虚警检测之间的良好性权衡。
本研究针对近岸合成孔径雷达(Synthetic Aperture Radar, SAR)图像中舰船检测面临的耦合退化问题,提出了一种名为DN-AnchorNet的端到端统一检测框架,相关成果发表在《Applied Sciences》期刊。近岸水域对海上运输、经济活动和国家海洋安全具有重要战略意义,使可靠高效的沿岸舰船监视成为高优先级任务。SAR作为一种主动微波成像模态,具备全天候、全天时及高分辨率成像能力,已成为复杂海洋环境中舰船检测不可或缺的工具。然而,由于近岸成像条件高度复杂且目标特征呈现极端变异性,准确的近岸SAR舰船检测仍面临严峻挑战。

当前近岸SAR舰船检测性能主要受三种相互关联的挑战制约。其一,近岸背景引入来自陆地、港口、岛屿、码头及海杂波的强烈干扰,与SAR图像固有的乘性散斑噪声共同作用,容易掩盖微弱舰船响应并降低检测器的有效信杂比(Signal-to-Clutter Ratio, SCR);但传统去噪方法通常作为独立预处理步骤应用,与下游检测优化解耦,往往以牺牲目标结构保留为代价抑制噪声。其二,舰船目标在尺度、长宽比和朝向方面呈现广泛变化,从近岸小型渔船到大型远洋货轮均有覆盖,而常用的固定尺度和固定长宽比锚点设置仍无法良好适应这种连续几何变化,尤其当目标小型、细长或密集分布时更为突出。其三,近岸SAR图像中的训练样本分布高度失衡,稀疏的舰船目标被大量背景像素包围,引发严重的学习偏差和对小型或弱目标判别能力不足的问题;与此同时,标准回归损失如Smooth L1无法在不同尺度目标间提供一致的敏感度,在这种极端失衡下对困难样本的有效性有限。更为关键的是,这些问题通常被孤立处理,而近岸SAR检测中观测到的性能退化很少由单一因素造成,其源于去噪、候选区域生成和回归学习之间的耦合效应,这意味着仅优化流程中的某一阶段本质上不足以在复杂沿海环境中实现稳定鲁棒的性能。此外,许多近期检测框架以大幅增加架构复杂度为代价追求精度提升,而其在真实沿海监视场景中的鲁棒性和部署适用性仍有待探索。这些考量促使研究人员开发了统一框架DN-AnchorNet,以联合优化检测流程的多个阶段而非将其视为孤立组件。

该研究的主要技术方法包括:采用ResNet-50作为骨干网络,结合特征金字塔网络(Feature Pyramid Network, FPN)提取多尺度特征;设计面向检测的结构保持增强分支,通过高频保护模块、双路通道与空间注意力模块以及L1与结构相似性指数(Structural Similarity Index Measure, SSIM)组合损失函数实现无配对干净数据的去噪;构建尺度自适应锚点生成机制,建立特征金字塔层级与锚点尺度分布之间的动态映射关系,并引入中心偏移补偿技术;提出自适应加权Smooth L1(ASL1)损失,采用基于指数移动平均(Exponential Moving Average, EMA)的动态阈值调整策略和有效正样本回归掩码机制;以Oriented R-CNN为基准检测器,包含区域候选网络(Region Proposal Network, RPN)和旋转ROI头模块;使用RSDD-SAR、SSDD+和HRSID三个公开数据集进行评估,其中在RSDD-SAR和SSDD+上采用固定近岸压力测试协议,在HRSID上实施严格的零样本跨数据集评估。

研究结果部分按照以下结构展开:

**增强分支的有效性分析**:通过消融实验验证结构保持增强模块的贡献。在RSDD-SAR测试集上,该模块将召回率(Recall)从0.723提升至0.787(提升8.9%),F1分数从0.663提升至0.735(提升10.8%),同时将误检率(False Discovery Rate, FDR)从38.77降至31.13(降低19.7%),每图假阳性数(False Positives Per Image, FPPI)从1.71降至1.33(降低22.2%)。在SSDD+测试集上,该模块使精确率(Precision)从0.582提升至0.713(提升22.5%),F1分数从0.609提升至0.665(提升9.2%),FDR从41.80降至28.67(降低31.4%),FPPI从1.72降至0.93(降低45.9%)。这些结果表明,检测引导的增强分支在抑制背景干扰的同时有效保留了目标结构,显著提升了特征可区分性并降低了噪声相关虚警。

**自适应锚点机制的有效性分析**:自适应锚点配置在RSDD-SAR上将召回率提升至0.752(提升4.0%),F1分数提升至0.688(提升3.8%);在SSDD+上使AP50从0.579提升至0.591,F1分数从0.609提升至0.629。该机制通过建立特征金字塔层级感受野与锚点尺度的动态对应关系,使高层特征图生成大尺度锚点以覆盖大型远洋舰船,低层特征图生成小尺度锚点以增强小型近岸目标的检测,配合中心偏移校正和灵活长宽比设计,显著改善了多尺度、细长及任意朝向舰船的提案匹配质量。

**ASL1损失的有效性分析**:ASL1损失在RSDD-SAR上将F1分数从0.663提升至0.676(提升2.0%),FDR从38.77降至37.04(降低4.5%);在SSDD+上将AP50提升至0.588,FPPI从1.72降至1.46(降低15.1%)。该损失通过EMA机制动态调整Smooth L1过渡阈值,并引入有效正样本回归掩码排除无效背景回归监督,在不同训练阶段自动适配回归误差分布,为噪声和失衡条件下的小型、弱目标提供了回归导向的优化策略。

**组合模块消融分析**:在RSDD-SAR上,去噪模块与自适应锚点组合实现0.799的召回率和0.750的F1分数;去噪模块与ASL1组合使FDR进一步降至26.91、FPPI降至1.06;三个模块全部集成达到最优综合结果:召回率0.762、精确率0.752、AP50 0.699、F1分数0.757、FDR 24.83、FPPI 0.94。相较于基线,完整配置使AP50提升8.0%,F1分数提升14.2%,FDR降低36.0%,FPPI降低45.0%。在SSDD+上,三模块集成同样取得最优表现:召回率0.685、精确率0.726、AP50 0.610、F1分数0.689、FDR 25.39、FPPI 0.80,较基线AP50提升5.4%,F1分数提升13.1%,FDR降低39.3%,FPPI降低53.5%。

**与代表性检测器的对比性能**:与Faster R-CNN、RoI Transformer、Gliding Vertex、YOLOv8-OBB和H2RBOX-URC等代表性oriented object detector的比较表明,DN-AnchorNet在RSDD-SAR和SSDD+上均取得最高的平均AP50和F1分数。在RSDD-SAR上达到0.699±0.007的AP50和0.757±0.006的F1分数;在SSDD+上达到0.610±0.009的AP50和0.689±0.009的F1分数。虽然YOLOv8-OBB和H2RBOX-URC在两项数据集上取得更低的FDR/FPPI,但其召回率和AP50显著较低,表明其保守的检测行为降低了目标覆盖能力。DN-AnchorNet在保持检测覆盖能力的同时维持了具有竞争力的精确率和相对较低的虚警指标,实现了更优的权衡。

**跨数据集泛化性能**:在严格的HRSID零样本跨数据集评估中,所有模型仅在RSDD-SAR训练集上训练并直接在完整官方HRSID测试集的1962幅图像上评估。DN-AnchorNet将基线Oriented R-CNN的召回率从0.651提升至0.668,精确率从0.685提升至0.716,AP50从0.594提升至0.619,F1分数从0.668提升至0.689,同时FDR从18.93降至17.94,FPPI从0.51降至0.42。在所有对比方法中,DN-AnchorNet在HRSID上取得最高的召回率、精确率、AP50和F1分数,以及最低的FDR和FPPI,证明了框架跨数据集的迁移能力和鲁棒性。

**计算复杂度与推理效率分析**:DN-AnchorNet完整模型相较基线Oriented R-CNN,参数量从41.13 M增加至55.60 M,浮点运算量(FLOPs)从63.28 G增加至104.64 G,峰值GPU内存从0.256 GB增加至0.516 GB。其中去噪模块为主要开销来源,而自适应锚点机制仅引入微小计算开销(参数量41.15 M,FLOPs 63.75 G),ASL1仅在训练时使用不影响推理。完整模型在512×512输入下达到25.9 FPS的推理速度和38.5 ms的延迟,保持了可接受的贴片级推理效率。

讨论部分,研究人员进一步分析了各模块的协同作用机制。去噪模块主要提升精确率并降低FDR和FPPI,表明其核心贡献在于抑制杂波相关虚假响应;自适应锚点机制在召回率和AP50方面产生更明显改进,与其提升多尺度、多形状舰船提案覆盖的设计意图一致;ASL1通过稳定正样本回归优化提供AP50和F1分数的补充提升。三模块执行不同但互补的功能而非产生无差别的累积增益,其联合应用在所采用的评估设定下产生最优综合结果。

研究结论部分指出,本研究针对海洋工程和近岸安全应用中的近岸SAR舰船检测所面临耦合的散斑噪声、剧烈尺度变化、海陆背景杂波和严重样本失衡等挑战,提出了DN-AnchorNet端到端统一检测框架,联合集成结构保持去噪分支、尺度自适应锚点生成机制和自适应加权Smooth L1回归损失。在RSDD-SAR和SSDD+挑战性近岸子集上的实验结果表明,DN-AnchorNet在所采用的评估设定下较对比的代表性oriented object detector实现了更高的AP50和F1分数,同时保持了具有竞争力的精确率和相对较低的虚警指标。这些结果表明,在检测导向增强、锚点自适应和回归精修之间的协同优化在挑战性近岸条件下是有效的。此外,在完整官方HRSID测试集上的严格零样本评估为框架的跨数据集迁移能力提供了补充证据。需要指出的是,RSDD-SAR和SSDD+上的对比结果是在所采用的固定近岸压力测试协议下获得的,而非完整官方测试分布,因此报告的性能优势应仅在此评估设定内解读,并不确立普适的基准级优越性。未来工作将考虑在完整官方测试集上进行评估以提供更广泛的框架评估。
相关新闻
生物通微信公众号
微信
新浪微博

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号