OAD-YOLOv8n:一种面向钢带表面缺陷检测的轻量化方向自适应框架

《Metals》:OAD-YOLOv8n: A Lightweight Direction-Adaptive Framework for Steel Strip Surface Defect Detection

【字体: 时间:2026年06月19日 来源:Metals 2.5

编辑推荐:

  摘 要:钢带表面缺陷检测仍具挑战性,原因在于缺陷常呈细长状、弱边界、低对比度且对照明退化和成像劣化敏感。为此,本文提出正交方向自适应YOLOv8n(Orthogonal Direction-Adaptive YOLOv8n,OAD-YOLOv8n),一种基于Y

  
摘 要:钢带表面缺陷检测仍具挑战性,原因在于缺陷常呈细长状、弱边界、低对比度且对照明退化和成像劣化敏感。为此,本文提出正交方向自适应YOLOv8n(Orthogonal Direction-Adaptive YOLOv8n,OAD-YOLOv8n),一种基于YOLOv8n(You Only Look Once version 8 nano)的轻量化检测器,其核心为正交方向自适应高效多尺度注意力模块(Orthogonal Direction-Adaptive Efficient Multi-Scale Attention,OA-EMA)。该模块融合了去偏条形描述子(debiased strip descriptors)、自适应方向选择(adaptive direction selection)及局部方向卷积(local directional convolution)。网络中进一步集成了基于可学习采样的动态上采样(Dynamic Upsampling by learning to Sample,DySample)、轻量化颈部结构SlimNeck(采用GSConv与VoV-GSCSP)以及自适应阈值焦点损失(Adaptive Threshold Focal Loss,ATFL),以分别改善细节保持型上采样、高效多尺度融合及难分样本优化。在NEU-DET数据集上五次独立重复实验中,相较YOLOv8n,OAD-YOLOv8n的精确率(Precision)、召回率(Recall)、mAP50、mAP50:95分别提升5.0、3.6、4.4和3.7个百分点,同时浮点运算量(FLOPs)与参数量分别降低约10.3%和7.0%。在GC10-DET上的补充实验、跨数据集迁移/自适应测试、模拟实际图像扰动、失败案例分析及实测推理速度进一步表征了该模型在基准级泛化性、鲁棒性及部署相关行为方面的表现。结果表明,OAD-YOLOv8n为轻量化钢带表面缺陷检测提供了有效的精度—效率权衡方案。
论文解读:OAD-YOLOv8n——面向钢带表面缺陷检测的轻量化方向自适应YOLOv8n框架
钢带是现代制造业的基础材料,其表面质量直接影响下游加工与产品可靠性。传统表面缺陷检测依赖人工目检或传统机器视觉与非破坏性检测技术(如涡流、漏磁、红外成像及基于纹理或频域的分析),这些方法在受控条件下有一定效果,但对光照变化、背景噪声及缺陷形态多样性敏感,且依赖手工特征导致泛化性不足。随着深度学习发展,基于卷积神经网络的目标检测器(如Faster R-CNN、SSD及YOLO系列)和基于Transformer的集合预测检测器(如DETR、Deformable DETR、DINO及RT-DETR)逐渐被引入工业表面缺陷检测。卷积类检测器因推理效率高、训练稳定及易于边缘设备部署而在工业在线检测中仍被广泛采用。然而现有轻量化检测器多未对钢带表面常见的裂纹、划痕等细长且具方向敏感性(direction-sensitive)的缺陷结构进行显式建模;此外,自上而下特征传播与上采样过程中小目标及低对比度缺陷易丢失边缘纹理细节,单纯堆叠增强模块会增加计算开销不利于在线部署,且分类分支中前景—背景不平衡及难分样本优化不足亦限制了对模糊缺陷的稳定识别。针对以上瓶颈,研究人员以YOLOv8n为统一基线,提出OAD-YOLOv8n轻量化检测框架,通过引入方向感知表示、细节保持上采样、轻量化多尺度融合及难分样本重加权实现精度与效率的协同提升。论文发表于《Metals》期刊。
本研究主要关键技术方法如下:以NEU-DET(Northeastern University Defect Database for Steel Strip Surface,含1800幅200×200像素灰度图像,涵盖裂纹Crazing、夹杂物Inclusion、斑块Patches、麻点Pitted surface、压入氧化皮Rolled-in scale及划痕Scratches六类缺陷)为主要实验数据集,按7:1:2分层随机划分训练集、验证集与测试集;外部验证及跨域实验采用GC10-DET金属表面缺陷数据集(3570幅灰度图像,十类缺陷)。以YOLOv8n为基础架构,在SPPF层后嵌入提出的OA-EMA(Orthogonal Direction-Adaptive Efficient Multi-Scale Attention)方向自适应注意力模块;Neck中上采样节点以DySample(Dynamic Upsampling by learning to Sample)替代固定插值上采样;采用SlimNeck策略以GSConv与VoV-GSCSP重构多尺度融合路径;分类损失函数替换为自适应阈值焦点损失(Adaptive Threshold Focal Loss,ATFL)。训练环境为PyTorch 2.5.1 + CUDA 12.4,输入分辨率640×640,SGD优化器,300 epoch,batch size 16;主要评价指标为Precision、Recall、mAP50、mAP50:95、参数量(Parameters)及浮点运算量(FLOPs),推理速度测FPS(images/s)。
3. Methodology(方法论)
3.1. Overall Framework of OAD-YOLOv8n(OAD-YOLOv8n整体框架)
研究人员在YOLOv8n骨干网络SPPF层后插入OA-EMA以增强方向感知语义特征;Neck中DySample替换固定上采样以恢复微细纹理与弱边界;SlimNeck(GSConv+VoV-GSCSP)重构融合路径减少冗余计算;分类分支采用ATFL加强对低置信度及模糊缺陷样本的梯度分配。结论:四个模块分别针对方向感知表示、细节保持上采样、轻量化多尺度融合及难分样本优化,形成协同改进的轻量化检测框架。
3.2. Orthogonal Direction-Adaptive Efficient Multi-Scale Attention Module (OA-EMA)(正交方向自适应高效多尺度注意力模块)
3.2.1. Difference Between EMA and OA-EMA(EMA与OA-EMA的区别)
EMA仅做分组跨空间聚合而未显式建模条形缺陷主导方向或抑制方向描述子中的低频光照偏差。OA-EMA在此基础上增加去偏正交条形描述子(减去局部平均响应以抑制低频亮度波动与反光背景干扰)、自适应方向选择器(对各特征组估计水平与垂直响应相对重要性并通过softmax归一化赋予方向偏好)及局部方向卷积(各向异性核与条形描述子方向系数一致,耦合长程条纹上下文与局部裂纹/划痕状结构)。结论:OA-EMA在保留EMA轻量化分组聚合特性的同时,更适合具强方向性的钢带表面缺陷检测。
3.2.2. Description of Debiased Orthogonal Stripes and Direction Selection Mechanism(去偏正交条形描述与方向选择机制)
对输入特征沿通道维度分组,在描述子分支先做去偏处理(原始特征减局部平均池化结果),再沿宽、高维做均值压缩构造正交水平/垂直条形统计,经可学习位置偏置与方向选择器加权融合并拆分为水平与垂直空间调制项。结论:将固定轴向响应转化为方向可调的正交建模,可突出细长缺陷的主导方向信息。
3.2.3. Local Directional Convolution and Intra-Group Cross-Spatial Aggregation(局部方向卷积与组内跨空间聚合)
每组内并行各向同性深度卷积(3×3)与各向异性方向卷积(1×k及k×1),按方向权重融合得局部方向特征;条形注意力图对输入组特征做Sigmoid调制后与局部方向特征经EMA式互补跨空间算子交互生成组级空间重标定图,最终作用于原始组特征并沿通道拼接输出。结论:OA-EMA整合了去偏正交条形描述、自适应方向选择、局部方向卷积及组内跨空间聚合,使长程方向上下文与局部各向异性结构在方向偏置上保持一致并转化为空间重标定权重。
3.3. Neck Reconstruction Oriented to Detail Preservation and Lightweight Fusion(面向细节保持与轻量化融合的Neck重构)
3.3.1. Dynamic Upsampling Based on DySample(基于DySample的动态上采样)
DySample通过学习采样偏移场对低分辨率特征动态重采样而非固定规则插值,可根据局部内容自适应调整采样位置以保留缺陷边缘与细微纹理。结论:DySample比最近邻或双线性上采样更利于微小裂纹及低对比度边界的特征重建。
3.3.2. Lightweight Feature Fusion Based on SlimNeck(基于SlimNeck的轻量化特征融合)
GSConv兼顾标准卷积跨通道交互能力与深度可分离卷积低复杂度;VoV-GSCSP以紧凑跨阶段局部连接(Cross Stage Partial connection)替换原融合单元减少冗余计算。结论:SlimNeck在保持必要跨尺度信息交互的同时降低Neck理论复杂度,与OA-EMA及DySample协同实现细节保持与轻量化融合双重能力。
3.4. Loss Function Design for Hard Samples and Class Imbalance(面向难分样本与类别不平衡的损失函数设计)
以自适应阈值焦点损失(ATFL)替代原分类分支的重新加权交叉熵。ATFL引入阈值解耦机制,对高置信度易分样本快速衰减损失权重,对低置信度难分样本通过自适应增强维持甚至加强优化权重。回归与定位损失同YOLOv8n基线。结论:ATFL针对性解决钢带缺陷检测中大面积易分背景主导梯度及低对比度/相似纹理缺陷难分样本优化不足的问题。
4. Experimental Results and Discussion(实验结果及讨论)
4.1. Datasets(数据集)
NEU-DET六类缺陷分层7:1:2划分;GC10-DET保留十类标签空间同样比例划分用于全监督外部基准,零-shot跨数据集时将两数据集各类别合并为单类"defect",少样本自适应使用GC10-DET训练集10%或30%分层抽样微调。结论:数据集划分与跨域设定合理,可用于基准性能与泛化性评估。
4.3. Experimental Environment and Training Settings(实验环境与训练设置)
硬件为NVIDIA RTX 4090D GPU + AMD Ryzen 9 7950X CPU,软件为PyTorch 2.5.1 + CUDA 12.4 + Python 3.11.0;YOLOv8n及对比模型统一300 epoch、batch size 16、输入640、SGD优化器;NEU-DET主对比进行五次独立训练取均值与标准差;FPS测量batch size=1、FP32精度、含100次预热与1000次计时并CUDA同步。结论:实验配置统一严谨,结果具统计可靠性。
4.4. Performance Evaluation(性能评估)
五次独立运行结果显示OAD-YOLOv8n相较YOLOv8n Precision由66.3±0.8%升至71.3±0.8%,Recall由70.4±1.0%升至74.0±0.7%,mAP50由74.7±0.5%升至79.1±0.4%,mAP50:95由42.1±0.4%升至45.8±0.4%;FLOPs由6.8 G降至6.1 G,参数量由2.56 M降至2.38 M。定性对比显示对裂纹、斑块及压入氧化皮等困难类别OAD-YOLOv8n减少漏检与误检。结论:OAD-YOLOv8n在NEU-DET上取得一致的精度提升且模型更轻量。
4.5. Comparative Analysis of Attention Mechanisms(注意力机制对比分析)
将SE、CA、Non-local Block、CBAM、EMA、SCSA及OA-EMA分别嵌入YOLOv8n对比,OA-EMA取得最优Recall(72.5%)、mAP50(77.3%)及mAP50:95(44.6%)且不增FLOPs与参数量,虽Precision非最高但在Precision–Recall–mAP间综合平衡最佳。结论:OA-EMA较通用注意力模块更契合钢带表面方向敏感缺陷的检测需求。
4.6. Results of Ablation Experiments(消融实验)
OA-EMA组件级消融表明去偏条形描述子(D)、自适应方向选择器(S)、局部方向卷积(L)对EMA各有互补增益——S主要提升Recall,L有助于mAP50:95,D稳定方向表示,完整OA-EMA(D+S+L)取得最佳Recall、mAP50、mAP50:95且与EMA等量计算量。全模型消融显示:单独引入OA-EMA对单模块精度贡献最大且不增计算量;DySample主要改善上采样细节恢复使Precision与mAP上升;SlimNeck降低FLOPs至6.0 G、参数量至2.36 M且性能接近基线;ATFL提升Recall与mAP;三结构模块(OA-EMA+DySample+SlimNeck)组合已达79.0% mAP50与45.5% mAP50:95且FLOPs 6.1 G、参数2.38 M;完整OAD-YOLOv8n(加ATFL)达71.4% Precision、74.1% Recall、79.2% mAP50、45.9% mAP50:95,较YOLOv8n相应提升5.2、3.6、4.4、3.8个百分点,FLOPs降10.3%、参数降7.0%。结论:最终性能提升来源于方向感知表示、细节保持上采样、轻量化融合与难分样本重加权的协同作用。
4.7. Comparison with Different Detection Methods(与不同检测方法的比较)
对比YOLOv3-tiny、YOLOv5n、YOLOv8n、YOLOv9t、YOLOv10n、YOLO11n、YOLO12n、YOLO26n及较大模型YOLOv3/YOLOv5s/YOLOv8s/YOLOv9c/RT-DETR-ResNet50与改进模型SDD-YOLO/EcoDetect-YOLOv2/StripSurface-YOLO,OAD-YOLOv8n获最高mAP50(79.2%)及具竞争力mAP50:95,在轻量化模型中精度—复杂度权衡最优;类别AP分析中对裂纹(Cr)与夹杂物(In)取得最高AP,对斑块(Pa)、压入氧化皮(Rs)及划痕(Sc)具竞争力。结论:OAD-YOLOv8n尤其擅长检测细长及各向异性纹理敏感缺陷且保持轻量化。
4.8. External Benchmark and Cross-Domain Validation(外部基准与跨域验证)
GC10-DET全监督十类训练中OAD-YOLOv8n mAP5067.96%、mAP50:9533.59%,较YOLOv8n分别提升2.47与1.52个百分点。零 shot跨数据集(单类defect)NEU-DET→GC10-DET mAP50由38.50%升至44.80%,GC10-DET→NEU-DET由56.50%升至63.20%。少样本自适应(NEU-DET预训练初始化,GC10-DET检测头重初始化,10%/30% GC10-DET训练集微调)OAD-YOLOv8n mAP50分别为56.50%与64.30%,均优于YOLOv8n。结论:所提方向感知表示改善跨数据集迁移能力,但真实产线仍需目标域自适应训练。
4.9. Robustness Test Under Controlled and Practical Imaging Perturbations(抗成像扰动的鲁棒性测试)
对NEU-DET测试集施加亮度降低/增强、高斯模糊(核3×3/5×5)、5%高斯噪声及局部照度梯度、类镜面高亮条带、镜头雾/污、局部遮挡,OAD-YOLOv8n在所有扰动条件下mAP50与mAP50:95均高于YOLOv8n,九种扰动平均mAP5072.2±0.4%、mAP50:9540.0±0.4%(YOLOv8n为67.1±0.5%与35.7±0.5%),高斯模糊下优势最明显。结论:OAD-YOLOv8n对照明波动、模糊、噪声及模拟现场污染等更具稳定性。
4.10. Error Analysis and Failure Cases(误差分析与失败案例)
主要失败模式包括低对比度裂纹与压入氧化皮漏检或定位不准、背景纹理相似致假阳性、细长划痕碎裂/重复检测、不规则缺陷边界定位偏差。结论:剩余错误关联于低对比度、弱边界、细长几何及局部纹理歧义,未来可从失败导向数据增强、难负样本挖掘、边界感知定位及域校准着手改进。
5. Conclusions and Limitations(结论与局限)
研究人员得出结论:OAD-YOLOv8n通过在YOLOv8n中集成OA-EMA(去偏正交条形描述子+自适应方向选择+局部方向卷积)、DySample细节保持动态上采样、SlimNeck(GSConv+VoV-GSCSP)轻量化多尺度融合及ATFL难分样本优化,在NEU-DET五次独立实验中Precision、Recall、mAP50、mAP50:95较YOLOv8n分别提升5.0、3.6、4.4、3.7个百分点,FLOPs降约10.3%、参数量降约7.0%;GC10-DET外部基准、零 shot跨数据集及少样本自适应实验验证了方向感知表示的泛化与跨域益处;抗成像扰动测试中OAD-YOLOv8n较基线更稳定;失败案例分析指明低对比度裂纹与压入氧化皮、细长划痕及背景纹理混淆仍为待解难点。局限在于评估基于公开基准未覆盖全线产线多变条件;鲁棒性测试为图像级扰动未完全复现现场耦合变化;部署验证限于GPU推理,DySample与SlimNeck在PyTorch原生后端下FPS略低于YOLOv8n(理论复杂度降但算子开销存差异),需TensorRT/量化等进一步优化;部分视觉模糊情形未完全解决。总体而言,OAD-YOLOv8n为钢带表面缺陷检测提供了显式建模各向异性视觉结构的紧凑方向自适应框架,在基准级精度—效率权衡上具优势,为工业在线轻量化缺陷检测提供了可行方案。
相关新闻
生物通微信公众号
微信
新浪微博

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号