《Sensors》:A Component-Level Defect Detection and Real-Time Localisation Method for Photovoltaic Arrays Using UAV-Based Infrared Imagery
编辑推荐:
光伏(PV)组件中的缺陷,包括热点、遮挡和二极管失效,会显著降低发电效率并带来安全风险。该研究提出了一种基于无人机(UAV)获取的红外图像的光伏缺陷实时检测与定位框架。在标准化采集条件下,研究人员构建了一个包含5583幅红外/可见光图像的专用数据集。在YOLO
光伏(PV)组件中的缺陷,包括热点、遮挡和二极管失效,会显著降低发电效率并带来安全风险。该研究提出了一种基于无人机(UAV)获取的红外图像的光伏缺陷实时检测与定位框架。在标准化采集条件下,研究人员构建了一个包含5583幅红外/可见光图像的专用数据集。在YOLOv8-OBB基础上,研究人员通过引入轻量级C3m模块和共享卷积LSCD-OBB检测头,开发了改进的旋转边界框检测器YOLO-CLO。所提出的检测器在仅具有8.52 M参数量和23.6 GFLOPs的条件下,取得了99.1%的mAP@0.5、96.7%的mAP@0.5:0.95以及59.88 FPS,准确性与效率均优于基线模型。结合梯度、灰度、温度和形态学线索的多特征图像处理流程,可识别热点、二极管失效和遮挡,其检测准确率分别为96.97%、100%和88.89%。融合全球导航卫星系统(GNSS)元数据、霍夫变换(Hough transform)和改进K-means聚类算法的组件级定位策略,能够准确恢复阵列内每个缺陷组件的行列索引。与YOLOv5和Faster R-CNN的对比实验进一步证实了所提框架的优越性。该方法对硬件依赖较低,适用于大规模光伏电站的工程部署。
该论文发表于《Sensors》,聚焦于大规模光伏电站运维中的关键技术问题,即如何在复杂场景下实现光伏组件缺陷的高精度、低成本、可实时检测,并进一步给出可直接服务现场检修的组件级定位结果。随着全球能源结构向低碳化、清洁化加速转型,光伏(PV,photovoltaic,光伏发电)已成为能源系统中的重要组成部分。然而,光伏板长期暴露于户外环境,易受辐照变化、遮挡、热应力和器件老化等因素影响,产生热点、局部阴影、旁路二极管故障等典型缺陷。这些缺陷不仅会降低发电效率,还可能引发热失控甚至火灾风险,因此建立高效、可靠的缺陷巡检技术具有重要现实意义。
现有光伏缺陷检测方法主要包括基于电学特性的监测方法和基于红外图像分析的方法。前者通常依赖输出电压、电流、功率等参数,但在大规模电站场景下需要部署大量传感器,成本高且扩展性差。相比之下,基于图像的方法具有非接触、部署灵活、适合大范围巡检等优势,已成为主流研究方向。不过,传统计算机视觉方法在复杂背景下容易受边缘模糊、信息丢失及阈值不稳定影响,准确性有限;而深度学习方法虽然特征表达能力强,却往往参数量大、算力需求高,不利于无人机端或边缘侧部署。此外,已有研究多数只给出图像级或阵列级结果,缺乏现场维修真正需要的组件级行列定位信息。正是在这一背景下,研究人员提出了融合轻量化深度学习检测、传统多特征缺陷识别与空间定位策略的两阶段自动识别框架,以弥补准确率、效率与工程实用性之间的断层。
研究人员首先建立了基于无人机的红外巡检系统,采用DJI M300搭载Zenmuse H20T双光相机以及Autel EVO II Dual 640T两类平台,在晴朗、无雾、镜头垂直于组件平面的标准化条件下采集数据,构建了5583幅红外/可见光配对图像数据集,并以8:1:1划分训练、验证和测试集。随后,在检测阶段,研究人员以YOLOv8-OBB为基线,设计了轻量级旋转目标检测器YOLO-CLO,通过C3m模块替代原始C2f模块,并引入共享卷积LSCD-OBB检测头,以实现阵列旋转框的实时提取;在缺陷识别阶段,针对热点、二极管失效和遮挡三类热特征差异明显的故障,构建融合梯度、灰度、温度与形态学特征的多特征阈值处理流程;在定位阶段,研究人员结合无人机记录的GNSS元数据、霍夫直线检测以及带先验初始化的K-means聚类,实现故障阵列的绝对地理定位和阵列内部组件行列索引恢复。总体上,该研究通过“旋转阵列检测—缺陷识别—组件级定位”的串联框架,实现了从红外巡检图像到可执行检修信息的闭环输出。
该研究主要采用了三类关键技术方法。第一,基于YOLOv8-OBB构建轻量化旋转框检测模型YOLO-CLO,通过C3m与LSCD-OBB降低参数量和计算量,提升阵列检测的实时性。第二,利用多特征图像处理流程对裁剪后的阵列图像进行缺陷分析,包括CLAHE增强、Sobel梯度分割、Otsu阈值、自适应阴影去除、平均温度阈值和基于面积/温差/不规则度的分类判别。第三,基于无人机采集时同步记录的GNSS坐标,结合霍夫变换与先验K-means聚类,对故障位置进行阵列级地理匹配和组件级行列索引定位;样本来源为两类无人机平台在标准化飞行条件下采集的5583幅配对图像。
在研究结果方面,论文首先在“2.1. UAV Inspection System and Dataset Construction”中说明了数据基础与系统平台。研究人员构建了标准化的无人机红外巡检系统,并建立了具有较高一致性和代表性的光伏红外数据集。通过统一天气条件、飞行高度、成像视角和相机预热/非均匀性校正(NUC,non-uniformity correction),数据具备良好的几何与热辐射一致性,为后续算法训练和测试提供了可靠基础。该部分结论表明,规范化采集协议是保证模型泛化和物理量可比较性的前提。
在“2.2. Defect Categories and Thermal Signatures”中,研究人员明确了三类目标缺陷的热学表现。热点表现为局部高亮、边界清晰、梯度陡峭的规则圆形或椭圆形区域;二极管失效通常体现为焊点或汇流条附近狭长的高温区域,具有亮核和向外递减的热扩散;遮挡则表现为低灰度、大面积、轮廓与遮挡物形态一致的低温区域。该部分为后续多特征检测策略提供了热模式依据,说明缺陷分类可以建立在明确的物理先验之上,而不必完全依赖端到端学习模型。
在“3.1. Overall Framework”中,论文给出了整体算法流程。研究人员先利用改进后的YOLO旋转检测器从红外图像中提取所有光伏阵列,并以仿射变换裁剪各阵列区域,再将每个阵列独立送入多特征缺陷检测模块。若检测到缺陷,则记录缺陷像素坐标,并通过逆仿射变换映射回原图,实现全局可视化和后续定位。该结果说明,采用“阵列提取—缺陷分析”的分层策略,有助于降低背景噪声对缺陷识别的影响。
在“3.2.1. Rotating Detector Design”至“3.2.3. Lightweight Shared-Convolution Rotating Detection Head (LSCD-OBB)”中,研究人员围绕YOLO-CLO的结构设计展开分析。由于原始无人机红外图像中往往同时包含多个完整或不完整阵列以及大量背景,若直接采用水平边界框(HBB,horizontal bounding box)会引入相邻阵列背景,增加误检和漏检风险,因此论文采用更适合密集旋转目标的有向边界框(OBB,oriented bounding box)。在此基础上,研究人员提出C3m模块,将部分CBS结构替换为普通Conv2d,并在融合后引入Mish激活函数,以降低复杂度并平滑信息流;同时提出LSCD-OBB检测头,通过在回归与分类分支间共享两个3 × 3 Conv_GN模块,并保留独立角度分支与可学习尺度因子,减少冗余卷积计算。该部分结果表明,针对光伏阵列这一单类、方向敏感目标,参数共享不会显著损害表示能力,反而能够改善部署效率。
在“3.2.4. Experiments and Ablation Study”中,研究人员通过消融实验验证了各模块贡献。仅用C3m替换C2f后,mAP@0.5保持99.0%,mAP@0.5:0.95提高0.2个百分点,同时参数量与GFLOPs分别下降8.43%和8.16%,FPS提升11.37%。单独引入LSCD-OBB检测头时,mAP@0.5提升至99.1%,mAP@0.5:0.95提升至96.7%,参数量减少16.87%,速度提升9.51%。完整YOLO-CLO模型最终在8.52 M参数量、23.6 GFLOPs和59.88 FPS条件下,实现99.1%的mAP@0.5和96.7%的mAP@0.5:0.95。相较基线模型,参数量降低25.31%,GFLOPs降低19.73%,推理速度提升17.37%。这一结果说明,所提出模型在几乎不牺牲精度的前提下显著提升了轻量化程度和实时性能,适合边缘部署和机载应用。
在“3.3.1. Algorithm Design”中,论文设计了五阶段多特征缺陷检测流程,包括图像预处理、梯度阈值分割、背景阴影去除、平均温度阈值分割和缺陷分类。研究人员首先用CLAHE(Contrast-Limited Adaptive Histogram Equalization,限制对比度自适应直方图均衡化)增强高频与低频信息,再用Sobel算子提取梯度并结合Otsu法自动确定分割阈值;随后通过灰度直方图特征去除阴影干扰,再利用阵列平均温度将高温类缺陷与低温类遮挡区分开来;最终依据连通域面积、峰值与均值温差及不规则度指标判别具体类型。这一设计强调基于物理热成像规律的解析式判别思路,减少对缺陷像素级标注的依赖。
在“3.3.2. Detection Performance”中,研究人员报告了缺陷识别性能。热点检测准确率为96.97%,仅1例漏检且无误报;二极管失效检测准确率达到100%;遮挡检测准确率为88.89%,存在4例漏检和5例误检,反映出遮挡形状和热对比度变化更复杂。总体上,该流程实现了94.7%的检测准确率、5.1%的漏检率和5.15%的误检率。与YOLOv5及Faster R-CNN相比,所提方法在三项指标上均表现更优。该部分还指出遮挡类表现较低的主要原因,包括细长阴影面积不足阈值、邻近亮背景并入遮挡区域导致形态学指标偏移,以及局部行阴影边界平滑造成误分类。这说明多特征规则方法在强物理先验场景下对热点和二极管故障具有很高判别力,但对形态变化大的遮挡仍需更强的自适应机制。
在“4.1. Overall Localisation Framework”至“4.3. Module-Level Row–Column Localisation”中,研究人员提出了组件级定位方案。阵列级定位方面,先将故障阵列从裁剪图映射回原图,计算其质心相对图像中心的像素偏移,再调用无人机记录的图像中心GNSS坐标,并与电站台账中各阵列质心的地理距离和方位进行匹配,从而确定故障阵列的绝对位置。组件级定位方面,则使用增强预处理后的霍夫直线检测提取阵列内部连接线,并结合带先验初始化的K-means聚类形成横纵分割线,构建组件索引矩阵与顶点坐标矩阵,再通过缺陷像素坐标匹配得到具体行列号。该方法的关键意义在于将图像空间缺陷位置转换为现场检修可以直接使用的组件编号信息。
在“4.4. Localisation Results”中,论文给出了定位结果。研究人员通过诊断报告示例证明,系统输出的故障模块行列索引与人工真值一致,表明该方法能够准确实现图像缺陷坐标到物理组件索引的映射。进一步的测试集评估表明,阵列级GNSS匹配在大多数故障阵列上可返回正确阵列标识,失败主要集中于相邻阵列在匹配容差内距离过近的情形;组件级定位的主要误差模式是列方向“差一位”的错误,其原因在于阵列边缘模块间隙线缺失,影响了K-means聚类中心位置。该结果说明,所提定位框架在工程应用中具有较强可行性,但精细量化评估仍有拓展空间。
在“5. Discussion”中,研究人员综合讨论了方法优势与局限。该框架通过轻量化旋转检测器、多特征缺陷识别和GNSS–Hough–K-means混合定位策略,系统解决了水平框背景干扰、深度模型过重以及缺乏组件级定位三项长期瓶颈。YOLO-CLO在精度基本持平甚至略优的前提下,明显降低了参数量与计算量,提高了推理速度,证明其适合边缘部署。多特征缺陷检测阶段充分利用光伏热成像中的显式物理先验,使得在无需缺陷级标注数据的条件下,仍能对热点和二极管失效获得很高精度,并在遮挡检测方面取得较好效果。与YOLOv5和Faster R-CNN相比,该方法进一步降低了漏检与误报,并减轻了标注成本负担。
同时,论文明确指出若干限制。其一,缺陷检测阈值虽具有物理依据,但依赖于飞行高度、观察角度、天气和辐照等成像协议,迁移至其他场景可能需要重新校准。其二,K
x = 3与K
y = 14的聚类数取决于当前数据集中的阵列组件布局,对其他结构的阵列不具有直接可迁移性。其三,研究仅覆盖热点、二极管失效与遮挡三类缺陷,尚未涉及裂纹、蜗牛纹、PID(potential-induced degradation,电势诱导衰减)等其他重要故障。其四,方法尚未专门区分太阳反射或周围热源反射造成的伪热点,也未对跨飞行任务的红外传感器温漂进行主动校正。其五,阵列级定位依赖无人机GNSS精度以及相机光轴近垂直假设,姿态偏差可能引入像素到地面的投影误差。其六,文中报告的FPS主要针对检测器本身,而完整诊断流水线在嵌入式机载硬件上的端到端时延仍需进一步评估。总体而言,这些限制界定了该方法目前的适用边界,也为后续研究提供了明确改进方向。
研究结论部分可概括为:研究人员提出了一种面向无人机红外巡检的两阶段光伏缺陷检测与组件级定位框架。基于YOLOv8-OBB改进得到的YOLO-CLO,通过引入轻量级C3m模块和共享卷积LSCD-OBB检测头,在8.52 M参数量、23.6 GFLOPs和59.88 FPS条件下实现了99.1%的mAP@0.5与96.7%的mAP@0.5:0.95,在准确率与效率之间取得了良好平衡。多特征缺陷检测流程对热点、二极管失效和遮挡的检测准确率分别达到96.97%、100%和88.89%,整体表现优于YOLOv5和Faster R-CNN。GNSS–Hough–K-means定位策略能够准确恢复故障组件在阵列中的行列索引。总体上,该框架硬件依赖低、工程部署潜力强,对于大规模光伏电站的运维管理具有显著应用价值;未来工作将进一步聚焦于自适应阈值和具有域泛化能力的缺陷检测,以提升在多样化现场环境中的鲁棒性。