AEConvNeXt:一种融合注意力增强(attention-enhanced)ConvNeXt框架的类别不平衡光伏故障分类及可解释特征分析方法

《AI》:AEConvNeXt: An Attention-Enhanced ConvNeXt Framework for Imbalanced Photovoltaic Fault Classification with Explainable Feature Analysis

【字体: 时间:2026年06月10日 来源:AI 5

编辑推荐:

  背景(Background):太阳能是化石燃料可持续且环保的替代能源,光伏(photovoltaic, PV)系统全球部署日益广泛。但其运行可靠性常受各类故障工况影响,导致功率下降与寿命缩短。基于图像的自动化深度学习方法在PV故障分类中展现出潜力,却常受严重类

  
背景(Background):太阳能是化石燃料可持续且环保的替代能源,光伏(photovoltaic, PV)系统全球部署日益广泛。但其运行可靠性常受各类故障工况影响,导致功率下降与寿命缩短。基于图像的自动化深度学习方法在PV故障分类中展现出潜力,却常受严重类别不平衡(class imbalance)及细微低对比度缺陷模式的限制。本研究旨在提出一种改进深度学习框架以实现鲁棒PV故障分类。方法(Method):提出一种称为AEConvNeXt的注意力增强卷积神经网络框架用于PV故障分类。模型以ConvNeXt-Tiny为主干(backbone),融入经Dropout正则化的卷积块注意力模块(Convolutional Block Attention Module, CBAM)以增强局部特征细化。为进一步改善不平衡数据下的学习,采用交叉熵损失(Cross-Entropy Loss)与焦点损失(Focal Loss)相结合的混合损失函数。结果(Results):实验评估表明,AEConvNeXt总体准确率达94.37%,宏平均F1分数(macro F1-score)达94.43%,较最强基线模型ResNet-50提升超3%。梯度加权类激活映射(Gradient-weighted Class Activation Mapping, Grad-CAM)可视化进一步证实模型有效关注故障相关区域,提升了可解释性。所提框架在六类PV故障及不同条件下均表现出一致稳健的性能。结论(Conclusions):所提AEConvNeXt框架为实时PV故障检测提供了准确且可解释的解决方案,有效解决类别不平衡问题并提升少数类故障识别能力。
论文解读:AEConvNeXt——面向类别不平衡光伏故障分类的注意力增强ConvNeXt框架及可解释特征分析
研究背景与立题依据
全球能源转型背景下,太阳能光伏(photovoltaic, PV)系统大规模部署,但面板长期暴露于恶劣环境中易出现积尘(dust accumulation)、鸟粪(bird droppings)、积雪(snow coverage)、腐蚀、热循环、微裂纹及电气故障等问题,导致热异常、结构损伤及功率衰减。传统人工目视巡检劳动强度大且难以发现隐蔽缺陷。基于红外热成像与电致发光(electroluminescence, EL)成像的深度学习方法虽有一定进展,但仍面临三大瓶颈:一是PV故障数据集普遍存在严重类别不平衡,模型易偏向多数类而忽视少数但关键的故障类别;二是诸多PV缺陷表现为细微、局部化、低对比度的纹理变化,常规卷积神经网络(CNN)难以充分捕捉;三是现代架构如ConvNeXt虽在计算机视觉任务表现优异,但其与注意力机制及交叉熵-焦点损失(Cross-Entropy–Focal Loss)联合用于不平衡PV故障分类尚未被系统探索。为此,研究人员开展了此项基于注意力增强ConvNeXt的不平衡PV故障分类研究,相关成果发表于《AI》期刊。
主要关键技术方法
研究人员选用公开Solar Panel Surface Faults Dataset,含清洁(Clean)、积尘(Dusty)、鸟粪(Bird Drop)、电气损坏(Electrical Damage)、物理损坏(Physical Damage)、积雪覆盖(Snow Covered)共六类,按7:1.5:1.5划分为训练/验证/测试集。图像统一缩放至224×224像素并做最小-最大归一化及高斯平滑与中值滤波去噪。以ImageNet预训练ConvNeXt-Tiny为骨干网(feature extraction backbone),在其末级特征图后嵌入带Dropout正则化的卷积块注意力模块(Convolutional Block Attention Module, CBAM)实施通道与空间双重注意力精炼;分类头由全局平均池化(global average pooling, GAP)与全连接层构成。训练采用混合损失函数Lhybrid=α·LCE+(1-α)·LFL(α=0.5,Focal Loss聚焦参数γ=2),优化器为AdamW配合余弦退火预热重启(Cosine Annealing Warm Restarts)及Reduce-on-Plateau策略,批次大小32,早停依据验证集最高宏平均F1分数(macro F1-score)。训练集施加随机旋转(±15°)、水平垂直翻转、随机缩放裁剪(0.8–1.2)、光照调整(±20%)及高斯噪声(σ=0.01)以增强泛化,验证与测试集不做增广与重采样以保留原始不平衡分布。采用Grad-CAM进行可解释性分析,并通过消融实验逐一验证各模块贡献。
研究结果
4.1. Evaluation Metrics
研究人员选用精确率(precision)、召回率(recall)、F1分数(F1-score)、总体准确率(accuracy)及马修斯相关系数(Matthews Correlation Coefficient, MCC)进行评估,并以各类单独F1、宏平均F1(macro F1-score)与加权平均F1(weighted F1-score)综合衡量不平衡条件下的性能,确保对各少数类公平评价。
4.2. Training Analysis
训练与验证损失曲线平稳下降并于约30轮(epoch)收敛,训练与验证趋势吻合且波动小,表明引入带Dropout的CBAM与混合损失有效抑制过拟合。最终验证集准确率为94.37%,宏平均F1分数达94.43%,三次重复实验标准差低,证明训练过程稳定可靠。
4.3. Quantitative Analysis/Model Performance Analysis
AEConvNeXt在测试集总体准确率94.37%,宏平均精确率94.86%、宏平均召回率94.07%、宏平均F1分数94.43%,MCC为93.11%。六类中电气损坏(Electrical Damage)与积雪覆盖(Snow Covered)接近完美识别(F1≈0.99),鸟粪类召回达0.97;物理损坏(Physical Damage)因类内差异稍大(F1=0.89,召回=0.86),清洁与积尘间存少量混淆源于纹理及光照相似。混淆矩阵对角占优,多分类受试者工作特征曲线(receiver operating characteristic, ROC)各曲线靠近左上,曲线下面积(area under the curve, AUC)高;精确率–召回率(precision–recall, PR)曲线在少数类维持高精确率,证实混合损失缓解不平衡影响。与EfficientNet-B5、ResNeXt50-32×4d、ResNet-50、RegNetY-8GF及ViT-B/16对比,AEConvNeXt宏平均F1超出最强CNN基线ResNet-50(91.32%)逾3个百分点,参数量27.86 M、推理时间0.33 ms,精度–效率权衡优于参数量更大的Vision Transformer(ViT-B/16, 85.80 M, 0.94 ms)。
4.4. Model Performance Analysis
对比模型混淆矩阵显示ResNet-50与RegNetY-8GF对清洁与积尘区分略优,ViT-B/16在此二类中混淆偏多;PR曲线表明CNN架构整体比ViT更稳定应对低对比度类。柱状图比较宏平均F1分数,AEConvNeXt(94.43%)>RegNetY-8GF>ResNeXt50-32×4d>ResNet-50>ViT-B/16,验证了注意力增强与不平衡感知优化之优势。
4.5. Ablation Study Analysis
去除CBAM使宏平均F1降至88.81%(降幅最大),证实注意力引导特征精炼关键作用;去除CBAM内Dropout微降至93.52%,说明Dropout助益泛化;仅用Focal Loss(91.83%)或仅用Cross-Entropy(93.37%)均不及混合损失(94.43%);去除数据增广降至89.87%。完整AEConvNeXt组合取得最佳:准确率94.37%,宏平均F1 94.43%,MCC 93.11%,各模块具正向累积效应。
4.6. Explainable AI Feature Analysis
Grad-CAM热力图显示:鸟粪、积尘、物理损坏类高激活区对应异物、粉尘及裂纹处;电气损坏聚焦于烧灼变色区;积雪覆盖聚焦覆雪区;清洁面板呈均匀弱响应。预测置信度各列分别为BD 0.88、CL 0.90、DS 0.88、ED 0.96、PD 0.97、SC 0.93。注意力集中区域与可见缺陷重叠度高,局部化注意力越明确则该类F1越高,表明模型决策依循真实故障特征,具备可解释性。
讨论与结论总结
研究人员指出,AEConvNeXt通过注意力增强特征学习与不平衡感知损失协同优化,有效提升少数类PV故障识别及细微缺陷判别能力;局限含单数据集规模有限、未纳入时序信息、ConvNeXt-Tiny对极致边缘设备仍需轻量化。未来拟扩展多中心大数据集、探索自监督与半监督学习降低标注依赖、引入先进注意力或Transformer模块及模型压缩,并尝试融合红外热成像与电气监测等多模态数据。
结论(Conclusions):研究人员提出以ConvNeXt-Tiny为主干并嵌入带Dropout正则化CBAM、配用Cross-Entropy与Focal Loss混合损失的AEConvNeXt框架,用于类别不平衡下基于图像的PV故障分类。实验表明该框架宏平均F1分数94.43%、宏平均召回率94.07%、MCC 93.11%,注意力机制引导模型关注具判别性的空间与通道特征,Dropout提升有限不平衡数据下的泛化能力,验证了该框架在实际PV故障诊断中对细微及少数类故障类别的有效识别能力,具备可靠性与可解释性,适于实际部署。
相关新闻
生物通微信公众号
微信
新浪微博

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号