AEConvNeXt：一种融合注意力增强(attention-enhanced)ConvNeXt框架的类别不平衡光伏故障分类及可解释特征分析方法

《AI》：AEConvNeXt: An Attention-Enhanced ConvNeXt Framework for Imbalanced Photovoltaic Fault Classification with Explainable Feature Analysis

【字体：大中小】 时间：2026年06月10日 来源：AI 5

编辑推荐：

　　背景(Background)：太阳能是化石燃料可持续且环保的替代能源，光伏(photovoltaic, PV)系统全球部署日益广泛。但其运行可靠性常受各类故障工况影响，导致功率下降与寿命缩短。基于图像的自动化深度学习方法在PV故障分类中展现出潜力，却常受严重类

背景(Background)：太阳能是化石燃料可持续且环保的替代能源，光伏(photovoltaic, PV)系统全球部署日益广泛。但其运行可靠性常受各类故障工况影响，导致功率下降与寿命缩短。基于图像的自动化深度学习方法在PV故障分类中展现出潜力，却常受严重类别不平衡(class imbalance)及细微低对比度缺陷模式的限制。本研究旨在提出一种改进深度学习框架以实现鲁棒PV故障分类。方法(Method)：提出一种称为AEConvNeXt的注意力增强卷积神经网络框架用于PV故障分类。模型以ConvNeXt-Tiny为主干(backbone)，融入经Dropout正则化的卷积块注意力模块(Convolutional Block Attention Module, CBAM)以增强局部特征细化。为进一步改善不平衡数据下的学习，采用交叉熵损失(Cross-Entropy Loss)与焦点损失(Focal Loss)相结合的混合损失函数。结果(Results)：实验评估表明，AEConvNeXt总体准确率达94.37%，宏平均F1分数(macro F1-score)达94.43%，较最强基线模型ResNet-50提升超3%。梯度加权类激活映射(Gradient-weighted Class Activation Mapping, Grad-CAM)可视化进一步证实模型有效关注故障相关区域，提升了可解释性。所提框架在六类PV故障及不同条件下均表现出一致稳健的性能。结论(Conclusions)：所提AEConvNeXt框架为实时PV故障检测提供了准确且可解释的解决方案，有效解决类别不平衡问题并提升少数类故障识别能力。

论文解读：AEConvNeXt——面向类别不平衡光伏故障分类的注意力增强ConvNeXt框架及可解释特征分析

研究背景与立题依据

全球能源转型背景下，太阳能光伏(photovoltaic, PV)系统大规模部署，但面板长期暴露于恶劣环境中易出现积尘(dust accumulation)、鸟粪(bird droppings)、积雪(snow coverage)、腐蚀、热循环、微裂纹及电气故障等问题，导致热异常、结构损伤及功率衰减。传统人工目视巡检劳动强度大且难以发现隐蔽缺陷。基于红外热成像与电致发光(electroluminescence, EL)成像的深度学习方法虽有一定进展，但仍面临三大瓶颈：一是PV故障数据集普遍存在严重类别不平衡，模型易偏向多数类而忽视少数但关键的故障类别；二是诸多PV缺陷表现为细微、局部化、低对比度的纹理变化，常规卷积神经网络(CNN)难以充分捕捉；三是现代架构如ConvNeXt虽在计算机视觉任务表现优异，但其与注意力机制及交叉熵-焦点损失(Cross-Entropy–Focal Loss)联合用于不平衡PV故障分类尚未被系统探索。为此，研究人员开展了此项基于注意力增强ConvNeXt的不平衡PV故障分类研究，相关成果发表于《AI》期刊。

主要关键技术方法

研究人员选用公开Solar Panel Surface Faults Dataset，含清洁(Clean)、积尘(Dusty)、鸟粪(Bird Drop)、电气损坏(Electrical Damage)、物理损坏(Physical Damage)、积雪覆盖(Snow Covered)共六类，按7:1.5:1.5划分为训练/验证/测试集。图像统一缩放至224×224像素并做最小-最大归一化及高斯平滑与中值滤波去噪。以ImageNet预训练ConvNeXt-Tiny为骨干网(feature extraction backbone)，在其末级特征图后嵌入带Dropout正则化的卷积块注意力模块(Convolutional Block Attention Module, CBAM)实施通道与空间双重注意力精炼；分类头由全局平均池化(global average pooling, GAP)与全连接层构成。训练采用混合损失函数L_hybrid=α·L_CE+(1-α)·L_FL（α=0.5，Focal Loss聚焦参数γ=2），优化器为AdamW配合余弦退火预热重启(Cosine Annealing Warm Restarts)及Reduce-on-Plateau策略，批次大小32，早停依据验证集最高宏平均F1分数(macro F1-score)。训练集施加随机旋转(±15°)、水平垂直翻转、随机缩放裁剪(0.8–1.2)、光照调整(±20%)及高斯噪声(σ=0.01)以增强泛化，验证与测试集不做增广与重采样以保留原始不平衡分布。采用Grad-CAM进行可解释性分析，并通过消融实验逐一验证各模块贡献。

研究结果

4.1. Evaluation Metrics

研究人员选用精确率(precision)、召回率(recall)、F1分数(F1-score)、总体准确率(accuracy)及马修斯相关系数(Matthews Correlation Coefficient, MCC)进行评估，并以各类单独F1、宏平均F1(macro F1-score)与加权平均F1(weighted F1-score)综合衡量不平衡条件下的性能，确保对各少数类公平评价。

4.2. Training Analysis

训练与验证损失曲线平稳下降并于约30轮(epoch)收敛，训练与验证趋势吻合且波动小，表明引入带Dropout的CBAM与混合损失有效抑制过拟合。最终验证集准确率为94.37%，宏平均F1分数达94.43%，三次重复实验标准差低，证明训练过程稳定可靠。

4.3. Quantitative Analysis/Model Performance Analysis

AEConvNeXt在测试集总体准确率94.37%，宏平均精确率94.86%、宏平均召回率94.07%、宏平均F1分数94.43%，MCC为93.11%。六类中电气损坏(Electrical Damage)与积雪覆盖(Snow Covered)接近完美识别（F1≈0.99），鸟粪类召回达0.97；物理损坏(Physical Damage)因类内差异稍大（F1=0.89，召回=0.86），清洁与积尘间存少量混淆源于纹理及光照相似。混淆矩阵对角占优，多分类受试者工作特征曲线(receiver operating characteristic, ROC)各曲线靠近左上，曲线下面积(area under the curve, AUC)高；精确率–召回率(precision–recall, PR)曲线在少数类维持高精确率，证实混合损失缓解不平衡影响。与EfficientNet-B5、ResNeXt50-32×4d、ResNet-50、RegNetY-8GF及ViT-B/16对比，AEConvNeXt宏平均F1超出最强CNN基线ResNet-50（91.32%）逾3个百分点，参数量27.86 M、推理时间0.33 ms，精度–效率权衡优于参数量更大的Vision Transformer(ViT-B/16, 85.80 M, 0.94 ms)。

4.4. Model Performance Analysis

对比模型混淆矩阵显示ResNet-50与RegNetY-8GF对清洁与积尘区分略优，ViT-B/16在此二类中混淆偏多；PR曲线表明CNN架构整体比ViT更稳定应对低对比度类。柱状图比较宏平均F1分数，AEConvNeXt(94.43%)>RegNetY-8GF>ResNeXt50-32×4d>ResNet-50>ViT-B/16，验证了注意力增强与不平衡感知优化之优势。

4.5. Ablation Study Analysis

去除CBAM使宏平均F1降至88.81%（降幅最大），证实注意力引导特征精炼关键作用；去除CBAM内Dropout微降至93.52%，说明Dropout助益泛化；仅用Focal Loss(91.83%)或仅用Cross-Entropy(93.37%)均不及混合损失(94.43%)；去除数据增广降至89.87%。完整AEConvNeXt组合取得最佳：准确率94.37%，宏平均F1 94.43%，MCC 93.11%，各模块具正向累积效应。

4.6. Explainable AI Feature Analysis

Grad-CAM热力图显示：鸟粪、积尘、物理损坏类高激活区对应异物、粉尘及裂纹处；电气损坏聚焦于烧灼变色区；积雪覆盖聚焦覆雪区；清洁面板呈均匀弱响应。预测置信度各列分别为BD 0.88、CL 0.90、DS 0.88、ED 0.96、PD 0.97、SC 0.93。注意力集中区域与可见缺陷重叠度高，局部化注意力越明确则该类F1越高，表明模型决策依循真实故障特征，具备可解释性。

讨论与结论总结

研究人员指出，AEConvNeXt通过注意力增强特征学习与不平衡感知损失协同优化，有效提升少数类PV故障识别及细微缺陷判别能力；局限含单数据集规模有限、未纳入时序信息、ConvNeXt-Tiny对极致边缘设备仍需轻量化。未来拟扩展多中心大数据集、探索自监督与半监督学习降低标注依赖、引入先进注意力或Transformer模块及模型压缩，并尝试融合红外热成像与电气监测等多模态数据。

结论(Conclusions)：研究人员提出以ConvNeXt-Tiny为主干并嵌入带Dropout正则化CBAM、配用Cross-Entropy与Focal Loss混合损失的AEConvNeXt框架，用于类别不平衡下基于图像的PV故障分类。实验表明该框架宏平均F1分数94.43%、宏平均召回率94.07%、MCC 93.11%，注意力机制引导模型关注具判别性的空间与通道特征，Dropout提升有限不平衡数据下的泛化能力，验证了该框架在实际PV故障诊断中对细微及少数类故障类别的有效识别能力，具备可靠性与可解释性，适于实际部署。

热点排行