基于深度学习的堆叠板材视觉识别方法

首页今日动态人才市场新技术专栏中国科学人云展台
BioHot
云讲堂直播会展中心特价专栏技术快讯免费试用

生物通官微
陪你抓住生命科技
跳动的脉搏

生物通首页 > 今日动态 > 正文

基于深度学习的堆叠板材视觉识别方法

《Optics》：A Visual Recognition Method for Stacked Plates Based on Deep Learning

【字体：大中小】 时间：2026年06月10日 来源：Optics 1.6

编辑推荐：

　　本文针对工业场景中堆叠元件的计数问题，提出了一种将近距离扫描获取完整轮廓与深度学习进行数量识别相结合的方法：该轮廓采集系统由线阵相机（line array camera）和线激光（linear laser）组成，两者以一定角度水平布置，激光线垂直且与元件堆叠方

本文针对工业场景中堆叠元件的计数问题，提出了一种将近距离扫描获取完整轮廓与深度学习进行数量识别相结合的方法：该轮廓采集系统由线阵相机（line array camera）和线激光（linear laser）组成，两者以一定角度水平布置，激光线垂直且与元件堆叠方向一致，系统沿堆叠方向逐行扫描并连接单行像素以获取轮廓。该方法有效避免了因元件堆叠不均匀造成的遮挡问题。数量识别算法采用类似编码-解码（Encoding-Decoding）的网络结构，以元件间隙（cls: 0表示否，1表示是）和分隔线段端点坐标[cls, x1, y1, x2, y2]构成标签，引入多尺度锚点（multi-scale anchors）预测线段的平移距离（正负表示方向）。预测头（prediction head）为全卷积（fully convolutional），回归损失利用预测端点与真实线段端点计算。提出一种线段冗余去除方法（line segment redundancy removal method），输出每个元件间隙的预测置信度（conf）和坐标[conf, px1, py1, px2, py2]。使用自建数据集进行训练和验证。实验表明，每幅图像的识别准确率达到95.79%，间隙识别准确率达到99.62%，能够满足自动化要求。

**论文解读文章**

**研究背景与问题**
在机械、建材、有色金属等工业领域，存在大量以堆叠方式存放的板材元件。准确、高效地识别堆叠板材的数量，直接影响产品生产、包装和出货的自动化流程。当前国内该任务多采用人工方式，效率低且浪费人力资源，识别准确率和效率是核心难点。现有研究方法中，直接使用工业相机采集原始RGB图像存在因相机锥形视场导致的遮挡问题，致使轮廓不完整；基于峰谷数据重建、峰值特征结合投票、K近邻算法等方法虽有一定效果，但泛化能力不足或受限于分辨率、遮挡、模糊等因素；基于深度学习的单阶段（如YOLOv8）和两阶段（如Faster R-CNN）目标检测算法在矩形框回归中难以直接对应间隙的细微线状特征，容易出现重叠、误检或漏检。因此，开发一种高精度、高效率且能规避遮挡的堆叠板材数量识别方法具有重要实际意义。研究人员在《Optics》期刊上发表了该项研究成果。

**主要关键技术方法**
研究人员采用以下核心方法：（1）轮廓采集系统：将线阵相机（Hikvision Digital Technology Co., Ltd.，中国杭州）与线激光以一定角度水平固定于图像采集平台，激光线垂直照射并与元件堆叠方向一致，控制单元带动平台沿堆叠方向匀速运动，通过逐行扫描获取完整侧轮廓图，从根本上避免因堆叠不均匀导致的成像遮挡。（2）数量识别网络：采用类似编码-解码（Encoding-Decoding）的全卷积结构，引入多尺度锚点（锚点尺寸分为(17,20)、(34,40)、(68,80)），以元件间隙的分类（cls: 0或1）和分隔线段两端点坐标[x1,y1,x2,y2]为标签，通过全卷积回归预测每个锚点在不同尺度上的平移距离（dx,dy），输出置信度（conf）和坐标[conf,px1,py1,px2,py2]。（3）预测线段冗余去除：结合基于线段的非极大值抑制（line non-maximum suppression）和相邻线段中心坐标的欧氏距离阈值准则，剔除同一间隙的多余预测结果。数据集来源为企业（某铜板制造厂家）阴极铜板堆叠件的激光轮廓图像，共采集1592张，按1297张训练集（含18452个间隙）、200张验证集（2831个间隙）、95张测试集（1300个间隙）划分，并经过尺寸归一化（640×640）、仿射变换、翻转、裁剪等数据增强。

**研究结果**

**3.1 消融实验（Ablation Experiment）**
通过定性消融逐一验证预测线段冗余去除算法的效果。未使用去冗余算法时，预测结果中存在大量重叠冗余线段；仅添加x方向去冗余模块后，水平方向冗余被大量消除，但垂直方向仍有冗余；加入完整去冗余算法后，每个间隙仅保留一条预测线段。结果表明，所提算法能有效抑制线段重叠并消除细小无效线段。

**3.2 与先进算法的对比分析（Comparison and Analysis with Advanced Algorithms）**
以工程中常用的YOLOv8目标检测算法为基准进行定性和定量对比。定性上：（1）标签格式不同：YOLOv8矩形框无法直接对应间隙实际分隔线段，需要额外映射引入误差；本方法直接使用间隙分类与线段端点坐标，更贴合细线状目标。（2）损失函数设计不同：YOLOv8边界框在密集小间隙易产生重叠抑制；本方法直接回归点对点欧氏距离，实现亚像素定位，避免冗余框和邻近干扰。（3）冗余去除方式不同：YOLOv8的NMS适合稀疏目标；本方法基于线性特征并融入工业先验（板材垂直堆叠、间隙平行等距），可区分“不同间隙相邻”与“同一间隙重复预测”，不误删密集排列的真实间隙。定量上，在95张测试图像中，本方法仅有4张预测错误，图像识别准确率95.79%；1300个间隙中仅5个预测错误，间隙识别准确率99.62%，均高于YOLOv8算法。

**3.3 精度（Precision）**
定义了精确率（Precision, P）和召回率（Recall, R），计算公式为标准定义。在训练集上，P达到97.3%，R达到99.54%。测试集上，本方法的图像识别准确率为95.79%，间隙识别准确率为99.62%。针对可能的失败场景（如强环境光干扰、目标表面反射率异常、目标形状异常、轮廓边界模糊等），研究人员提出应对策略：添加自适应参数调整算法避免光强干扰；引入异常数据检测机制，进行多角度补充扫描，并将不同角度、尺寸、堆叠高度和光照条件下的轮廓图像纳入自建数据集以优化模型泛化能力。

**结论**
本文提出了一种用于堆叠元件数量统计的视觉识别方法：（1）该方法利用线阵相机和线激光扫描器对堆叠元件进行扫描，获取高质量侧轮廓图像，有效避免了元件堆叠不均匀造成的遮挡问题。（2）该方法采用类似编码-解码结构的网络，引入多尺度锚点获取线段平移距离，直接使用全卷积，并以预测结果与真实线段端点之间的欧氏距离作为回归损失，应用预测线段冗余去除方法实现了堆叠元件的精确分割和数量统计。（3）实验测试集包含95张图像和1300个间隙，图像识别准确率达到95.79%，间隙识别准确率达到99.62%，能够满足自动化要求。该方法标签标记简单、泛化能力强，可应用于多种堆叠元件的检测，显著提高识别准确率，具有广阔的应用前景。本文提出了一种用于堆叠元件数量识别的视觉方法，其贡献在于：（1）实现了从理论算法到工业级系统的闭环验证，在保证检测效率的同时显著降低硬件和部署成本，可在特定工业场景实现工程化应用，具有可移植性和可部署性的实用价值。（2）该方法将成熟的光学扫描硬件与现场近距采集、单行拼接技术以及自主研发的检测模型相结合，实现了端到端检测，解决了通用设备因元件间隙窄、不平整及连续边缘等问题导致检测准确率低和遮挡的难题。

联系信箱：

粤ICP备09063491号

热点排行