STAR-IOD:面向遥感增量目标检测( Remote Sensing Incremental Object Detection, RS-IOD )的比例解耦拓扑对齐与伪标签精炼方法
《ISPRS JOURNAL OF PHOTOGRAMMETRY AND REMOTE SENSING》:STAR-IOD: Scale-decoupled topology alignment with pseudo-label refinement for Remote Sensing Incremental Object Detection
编辑推荐:
摘要:遥感影像通常以连续数据流的形式到达。传统检测器在学习新类别时往往会遗忘先前已学类别,因此遥感增量目标检测(Remote Sensing Incremental Object Detection, RS-IOD)的研究具有重要意义。然而,现有方法大多忽略了
摘要:遥感影像通常以连续数据流的形式到达。传统检测器在学习新类别时往往会遗忘先前已学类别,因此遥感增量目标检测(Remote Sensing Incremental Object Detection, RS-IOD)的研究具有重要意义。然而,现有方法大多忽略了遥感场景中普遍存在的类内尺度变化(intra-class scale variations),这削弱了知识迁移与旧知识保留的效果。此外,RS-IOD还受到标注缺失问题的困扰,导致模型将旧类实例误分类为背景。为应对上述挑战,研究人员提出了一种新颖框架——STAR-IOD。首先,引入子空间解耦拓扑蒸馏(Subspace-decoupled Topology Distillation, STD)模块进行结构化知识迁移,显式对齐类间拓扑关系,并缓解由尺度偏移引起的类内表征差异。其次,提出聚类驱动伪标签生成器(Clustering-driven Pseudo-label Generator, CPG),这是一个即插即用模块,利用K-Means聚类动态确定各类别的自适应置信度阈值,从而准确区分真阳性目标与背景噪声,缓解旧类标注缺失问题。研究人员还构建了两个RS-IOD数据集DIOR-IOD和DOTA-IOD以推动该领域研究。大量实验表明,该方法在DIOR-IOD和DOTA-IOD上分别比现有最优方法提升1.7% mAP和2.1% mAP,有效缓解了灾难性遗忘(catastrophic forgetting),并在基类与新类上均保持了较强的检测性能。
本文发表于《ISPRS JOURNAL OF PHOTOGRAMMETRY AND REMOTE SENSING》。
论文解读:STAR-IOD——面向遥感增量目标检测的比例解耦拓扑对齐与伪标签精炼方法
一、研究背景与意义
传统的深度学习遥感目标检测(Remote Sensing Object Detection, RS-OD)方法通常假设训练数据服从静态分布且可一次性获取(离线训练)。然而在实际场景中,遥感影像数据往往以连续数据流的形式顺序到达,新类别的目标需不断加入模型识别范畴。当模型在新任务上微调时,会遭受灾难性遗忘(Catastrophic Forgetting),即严重丢失对已学旧类别的知识。增量目标检测(Incremental Object Detection, IOD)旨在解决此问题,但现有IOD方法主要针对自然图像设计,未考虑遥感影像特有的大范围类内尺度变异(同一类别因拍摄高度、分辨率及物体自身物理尺寸不同,在影像上表现出极小至极大的框面积差异)及复杂背景下的密集分布与遮挡。类内尺度差异导致特征空间中同类别样本分散且具有强尺度依赖性,若直接应用常规特征或响应蒸馏(Knowledge Distillation, KD)会无差别压缩尺度相关特征,模糊类间拓扑结构并干扰旧知识保留;同时,增量学习中新阶段数据仅标注新类,旧类实例被标为背景(missing annotations),产生前景-背景歧义,常规伪标签(Pseudo-labeling)方法在遥感场景下又含大量噪声,加剧遗忘。此外,该领域缺乏标准化数据集与评估协议。为此,西北工业大学Yaoteng Zhang、Qing Zhou、Junyu Gao及Qi Wang开展了本研究,提出STAR-IOD框架,并构建DIOR-IOD与DOTA-IOD基准数据集,以系统解决RS-IOD中的尺度敏感蒸馏偏差与伪标签噪声问题。
二、主要关键技术方法
研究人员以Grounding DINO为基线检测器,提出STAR-IOD框架,核心含两大模块:(1) 子空间解耦拓扑蒸馏(Subspace-decoupled Topology Distillation, STD):通过尺度自适应实例划分(Scale-adaptive Instance Partitioning, SIP)依据边界框面积将目标实例划分为小、中、大三个尺度子空间(subspace),在各子空间内基于解码器输出特征分别构建教师与学生模型的类间拓扑矩阵(inter-class topological matrix),并对齐学生与教师的类间拓扑关系,实现尺度解耦的结构化知识迁移;(2) 聚类驱动伪标签生成器(Clustering-driven Pseudo-label Generator, CPG):将旧类置信度阈值估计建模为聚类问题,对模型对新类数据产生的旧类预测置信度执行K-Means二聚类,动态确定自适应决策边界以筛选可靠伪标签,抑制噪声伪监督信号。实验采用自建DIOR-IOD(基于NWPU VHR-10及DIOR子集按类别分阶段拆分)与DOTA-IOD(基于DOTA v1.0按类别分阶段拆分)数据集,设计标准增量划分策略与统一评估管线,对比主流通用IOD方法(基于KD与回放范式),并进行模块消融实验。
三、研究结果
Object detection
综述两类经典目标检测范式——双阶段(Two-stage,如Faster R-CNN)与单阶段(One-stage,如YOLO系列),指出其均假设闭集静态训练,无法适应遥感数据流增量场景,引出对IOD的需求。
Incremental object detection
形式化定义IOD训练过程为n个顺序阶段,每阶段引入互不相交的新类别集合Ct,仅标注当前阶段类别,目标是在不访问旧数据前提下使模型Mt能同时检测所有已学类别。指出现有IOD三大范式——知识蒸馏(KD)、基于回放(Replay-based)及架构适配(Architecture adaptation)——在自然图像上有效,但直接迁移至RS-IOD会因尺度变化和伪标签噪声失效。
Overall architecture of STAR-IOD
说明STAR-IOD以Grounding DINO为基础,联合STD模块(在特征空间严格对齐教师与学生解码器输出,保留旧类关系知识)与CPG模块(修正监督信号保证前景一致性),共同抵御灾难性遗忘。
Experiment
在DIOR-IOD与DOTA-IOD上进行与SOTA通用IOD方法(如Faster IOD with KD、ORE等)的定量对比与可视化分析,并做消融实验验证STD与CPG各自贡献。结果表明STAR-IOD在最终阶段所有类别平均精度均值(mean Average Precision, mAP)上分别超越SOTA方法1.7%(DIOR-IOD)和2.1%(DOTA-IOD),且在旧类mAP与新类mAP间取得更优平衡;单独去除STD会导致旧类性能显著下降,单独去除CPG则引入伪标签噪声降低整体精度,证明两模块有效性。
Conclusion
总结传统检测器在增量学习时易受遥感特有尺度变化与背景噪声干扰而遗忘旧知。本研究系统探讨RS-IOD,构建DIOR-IOD与DOTA-IOD基准,并提出STAR-IOD框架通过尺度解耦拓扑蒸馏与聚类驱动伪标签精炼有效缓解上述问题,为后续RS-IOD研究提供可比基础与参考方法。
四、讨论与结论翻译
常规目标检测范式在增量学习阶段易发生灾难性遗忘,而遥感影像中目标尺度变化及背景噪声干扰会进一步加剧此问题。为应对这些挑战,本文对遥感增量目标检测(RS-IOD)进行了系统性研究。具体而言,研究人员构建了两个标准化RS-IOD基准数据集——DIOR-IOD和DOTA-IOD,为未来研究奠定了坚实基础;提出STAR-IOD框架,包含子空间解耦拓扑蒸馏(STD)以对齐各尺度子空间内的类间拓扑结构从而减轻类内尺度变异导致的偏置知识迁移,以及聚类驱动伪标签生成器(CPG)通过K-Means动态确定自适应阈值以过滤不可靠伪标签噪声。大量实验证明所提方法优于现有最优方法,有效缓解灾难性遗忘同时在基类与新类上保持强劲检测性能。代码与数据集已开源:https://github.com/zyt95579/STAR-IOD