DSTR-Net: 用于滚动轴承缺陷检测的双流语义-纹理网络

《Neurocomputing》:Dual-stream semantic-texture network for rolling bearing defect detection

【字体: 时间:2026年05月27日 来源:Neurocomputing 6.5

编辑推荐:

  在自动化制造过程中,滚动轴承的表面在线缺陷检测对于保障产品良品率和出厂质量至关重要。然而,现有的自监督方法难以应对跨尺度缺陷变化、复杂纹理以及高反光背景等挑战。该文提出了一种基于双流异构特征交互的鲁棒轴承异常检测网络DSTR-Net(Dual-stream S

  
在自动化制造过程中,滚动轴承的表面在线缺陷检测对于保障产品良品率和出厂质量至关重要。然而,现有的自监督方法难以应对跨尺度缺陷变化、复杂纹理以及高反光背景等挑战。该文提出了一种基于双流异构特征交互的鲁棒轴承异常检测网络DSTR-Net(Dual-stream Semantic-Texture network,DST-Net)。具体而言,设计了多尺度核融合注意力模块(Multi-Scale Kernel Fusion Attention, MSKFA),通过分解式大核卷积扩展感受野,实现从微小点蚀到大面积剥落等跨尺度缺陷特征的有效建模;构建了语义-纹理交互模块(Semantic-Texture Interaction Module, STIM),在语义流与纹理流之间建立双向信息交互机制,利用语义先验引导纹理特征的判别,抑制纹理密集区域的误响应;此外,引入自适应多尺度融合模块(Adaptive Multi-Scale Fusion, AMF),通过像素级门控机制动态平衡双流特征的贡献权重,增强模型对反光和噪声干扰的适应能力。研究在MVTec-AD、VisA、Real-IAD及自建Bearing-Real数据集上进行了系统实验,结果表明DST-Net优于现有最先进方法:在具有挑战性的MVTec-AD数据集上,该方法达到了99.7%的图像级AUROC(Area Under the Receiver Operating Characteristic curve,受试者工作特征曲线下面积)。实验结果验证了该方法在自动化产线高精度质检中的潜在应用价值。
研究背景与问题分析:在智能制造领域,无监督异常检测(Unsupervised Anomaly Detection, UAD)是保障自动化产线产品一致性和生产稳定性的关键环节。滚动轴承作为精密制造典型代表,其加工过程涉及车削、热处理、磨削及超精加工等多道工序,表面质量直接决定产品良品率与出厂等级。然而,受原材料纯度波动、磨削工艺不稳定或装配过程机械损伤等因素制约,轴承表面极易出现磨损、剥落、裂纹及变形等缺陷。若此类缺陷未能在生产端及时识别剔除,不仅会降低产线一次通过率,更会导致缺陷品流入市场,引发严重质量投诉甚至安全隐患。因此,实现制造端轴承表面缺陷的高精度自动化在线检测,对提升工业生产效率和质控标准具有重要工程意义。

尽管缺陷检测在多种工业场景中已得到广泛探索——涵盖印刷电路板(Printed Circuit Boards, PCBs)焊点缺陷检测、变电站表面缺陷检测,以及基于双模型融合的嵌入式目标检测等——但滚动轴承特定领域因极端尺度变化与复杂反光金属纹理的共存而呈现独特挑战。传统监督学习方法依赖大规模像素级标注数据,而实际生产中异常样本具有稀缺性和不可预知性,难以构建完备的异常数据集。与之相对,仅依靠正常样本训练的无监督异常检测逐渐成为工业质检的主流方向。即便如此,针对滚动轴承产线场景,现有UAD方法仍面临多重严峻挑战:缺陷尺度的极端跨度与复杂环境干扰往往并存,轴承表面可能同时存在微小加工点蚀和大面积剥落,这种巨大的尺度差异使特征提取器难以在全球语义与局部细节间取得平衡;此外,金属表面固有的加工刀纹和强反光特性极易与缺陷产生视觉混淆,导致高反光环境或纹理密集区域出现大量误检或漏检。

现有方法的局限性:针对上述挑战,现有方法常受限于特征表征能力不足。以逆向蒸馏(Reverse Distillation, RD4AD)为代表的方法试图通过构建教师-学生网络学习正常样本的紧凑特征流,该范式在简单纹理场景表现有效,但面对金属表面复杂的准周期性加工纹理时,学生网络难以在有限瓶颈层中同时保留高频纹理细节与低频语义特征,推理阶段微小点蚀缺陷易被过滤为高频噪声或被过度泛化为正常背景,从而引发漏检。以UniAD为代表的统一检测框架倾向于利用Transformer架构捕获长程依赖以实现跨类别通用检测,但该基于Query的全局机制在增强语义一致性的同时,往往弱化了对局部纹理扰动的敏感性,尤其在金属表面存在强反光或油渍干扰时,缺乏局部归纳偏置(Inductive Bias)的全局注意力机制易在非缺陷区域产生错误激活响应。简言之,现有主流方法难以在抑制环境噪声与保留微小缺陷特征之间取得平衡,且缺乏对跨尺度缺陷的显式建模能力。

研究方法与核心技术:为-resolve these issues,该文提出了基于双流异构特征交互的滚动轴承缺陷检测网络DST-Net。该网络摒弃传统单流架构,采用由Vision Transformer (ViT) 和WideResNet组成的双分支异构结构作为重建框架的核心编码器,将ViT的全局语义表征能力与WideResNet的强局部纹理建模能力相结合。

DST-Net包含三个关键技术创新点:

第一,多尺度核融合注意力模块(MSKFA)。该模块通过分解式大核卷积显式扩展感受野,构建渐进式多尺度核金字塔,实现对从微小点蚀到大面积剥落等跨尺度缺陷特征的有效建模。其数学本质在于利用等价大核分解近似,在不显著增加计算开销的前提下捕获多尺度空间上下文。

第二,语义-纹理交互模块(STIM)。该模块在ViT编码的全局语义流与WideResNet编码的局部纹理流之间建立双向动态交互机制。具体而言,语义信息作为先验锚点,对纹理流中的局部响应进行约束和引导,有效抑制纹理密集区域的假阳性激活;同时,纹理细节反馈至语义流以细化空间定位,形成语义-纹理的协同增强效应。这一设计针对金属表面复杂准周期性纹理与缺陷的视觉混淆问题,实现了全局-局部信息的数学解耦与动态调和。

第三,自适应多尺度融合模块(AMF)。针对产线高反光背景和环境干扰,该模块通过像素级门控机制动态平衡异构双分支及多尺度特征的贡献权重。其本质为空间自适应的特征选择机制,根据局部区域的光照条件和纹理复杂度,自适应地增强或抑制特定分支的响应,从而有效衰减强反光区域的不稳定响应和背景噪声干扰。

实验设计与结果分析:为验证方法的有效性和泛化能力,研究人员在多个标准数据集和工业数据集上进行了系统实验,包括MVTec-AD、VisA、Real-IAD以及自建的Bearing-Real数据集。所有实验在相同环境下进行以确保公平性和可复现性。

在MVTec-AD数据集上,DST-Net取得了99.7%的图像级AUROC,显著优于现有最先进方法。在VisA测试集上的性能对比显示(见原文Fig. 3),DST-Net在图像级和像素级AUROC两个指标上均较代表性UAD基线方法有显著提升。在Real-IAD和自建的Bearing-Real数据集上的进一步实验验证了该方法在真实工业场景中的鲁棒性和实用性。

消融实验验证了各模块的有效性:去除MSKFA模块后,模型对跨尺度缺陷特别是极端大小缺陷的检测性能明显下降;禁用STIM模块后,纹理密集区域的误检率显著上升;省略AMF模块后,高反光环境下的检测稳定性降低。这些结果证明了双流异构设计和各功能模块在解决特定工业挑战中的必要性。

DST-Net还被集成至自动化分选平台,在完整的感知-决策-执行闭环中实现了高精度在线检测指导,验证了其工程应用价值。

研究结论:针对滚动轴承检测中遇到的缺陷尺度变化大、表面纹理复杂和高反光背景干扰等挑战,该文提出了基于双流异构特征交互的无监督异常检测框架DST-Net。该框架构建了统一的重建学习机制,协调全局语义先验与细粒度局部纹理信息,显著提升了检测性能。通过设计多尺度核融合注意力模块(MSKFA)显式建模跨尺度缺陷,语义-纹理交互模块(STIM)建立双向信息交互以抑制复杂纹理干扰,以及自适应多尺度融合模块(AMF)动态平衡异构特征响应,DST-Net在多个基准数据集上取得了优于现有最先进方法的性能,尤其在MVTec-AD数据集上达到99.7%的图像级AUROC。该方法为自动化产线中滚动轴承的高精度表面缺陷检测提供了有效的技术路径,具296有重要的工程应用价值和推广前景。
相关新闻
生物通微信公众号
微信
新浪微博

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号