《Processes》:DIF-LSTM: A Dual Information Filtering LSTM Network for V/G Value Prediction in Czochralski Silicon Growth
编辑推荐:
为实现采煤机自动调高(Automatic Height Control of Coal Cutter),准确提取连续的煤–岩界面(Coal–Rock Interface)至关重要。针对现有基于深度学习(Deep Learning, DL)的检测方法输出离散边界
为实现采煤机自动调高(Automatic Height Control of Coal Cutter),准确提取连续的煤–岩界面(Coal–Rock Interface)至关重要。针对现有基于深度学习(Deep Learning, DL)的检测方法输出离散边界框(Bounding Box)、难以直接生成符合岩层形态的连续光滑煤岩界面曲线的问题,研究人员提出一种结合YOLOv8目标检测与三次样条插值(Cubic Spline Interpolation)的煤岩界面自动提取方法。首先利用YOLOv8高效感知煤岩图像并输出边界框中心点( Centre Point of Bounding Box)所组成的离散序列;随后通过置信度加权(Confidence Weighting, 权重直接采用YOLOv8输出的检测置信度Confidence Score)的改进三次样条拟合,将离散点拟合成符合岩层形态的光滑、连续煤岩界面曲线。实验表明该方法可实现端到端处理,在典型复杂井下场景中表现良好;相较于线性插值(Linear Interpolation),三次样条插值策略使边界线的垂直定位精度(Vertical Positioning Accuracy, 记为Py)提升14.9%,显著提高了输出曲线的工程可用性与采煤机调高控制精度,为煤矿智能化开采提供可靠技术方案。
论文解读:基于YOLOv8与置信度加权三次样条插值的煤岩界面自动检测与连续边界提取方法
一、研究背景与立题依据
在中国能源结构中煤炭仍占主导地位,建设"智能矿山(Smart Mine)"以实现安全高效开采是行业共识。作为综采工作面的核心装备,采煤机(Shearer / Coal Cutter)的自动化程度直接决定生产能力,但国内超90%矿井仍依赖人工操作采煤机调高,自动化渗透率极低,制约了高效开采。实现采煤机自动调高(Automatic Height Adjustment of Drum)的关键在于精确识别煤–岩界面(Coal–Rock Interface / Coal–Rock Boundary)。若截割滚筒遇到岩层会因岩石硬度高加速截齿磨损;为避岩而采取过于保守的截割边界则造成丢煤、降低回采率。传统煤岩边界检测依赖人工经验判断,效率低、主观性强、危险性高且在复杂地质条件下精度与一致性难保证。
已有煤岩边界检测研究分为传统图像处理(Canny边缘检测、Otsu阈值分割+数学形态学(Mathematical Morphology)、灰度共生矩阵(GLCM, Gray-Level Co-occurrence Matrix)纹理特征提取等——依赖手工设计特征,在井下光照不均、粉尘干扰及煤岩表面特征相似时光棒性与泛化能力有限)和深度学习方法(CNN分类、FCN/U-Net语义分割(Semantic Segmentation)、YOLO系列单阶段目标检测——速度快精度可接受但输出为离散边界框)。现有深度学习检测法直接输出一组离散边界框,无法生成采煤机调高系统可直接追踪的连续光滑边界线;若将离散中心点用线性插值或普通曲线拟合连接存在两点不足:(1)边界框几何中心(Geometric Centre of Bounding Box)在井下不规则截割面上常偏离真实物理煤岩分界面,引入系统性偏差;(2)标准三次样条插值为全局无偏方法,单个离群点(Outlier)或漏检(Missed Detection)会导致整条拟合曲线剧烈振荡(Oscillation),现有方法缺乏有效抑制手段。为此,研究人员开展本研究,提出基于YOLOv8检测与置信度加权改进三次样条插值相协同的煤岩界面自动检测方法,发表于MDPI期刊《Processes》。
二、主要关键技术方法概述
研究人员采集多个综采工作面实时监控系统的煤岩图像,经筛选与专业标注后获得4016幅有效样本,按约8∶2∶0.55划分为训练集(3216幅)、验证集(800幅)与测试集(220幅),涵盖正常光照、低照度(Low Light)、粉尘/雾(Dust/Fog)、局部过曝(Local Overexposure)等工况,部分图像含煤尘附着、设备反光等干扰;标注含用于YOLOv8训练的边界框及独立于训练用的像素级真值边界折线(Pixel-level Ground Truth Polyline)供评估垂直定位误差。训练中采用多级数据增强:随机水平翻转、±15°小角度旋转、0.8–1.2倍缩放等几何变换同步变换标注框;亮度/对比度±20%调整、色彩抖动(Color Jitter)、直方图均衡化(Histogram Equalization)、高斯噪声(σ=0.01)与椒盐噪声(密度0.005)不变换标注;额外模拟粉尘雾化(高斯模糊+白色半透明叠加不透明度0.2–0.4)及局部遮挡(随机置黑灰矩形块面积为图像5–15%)。检测后端选用YOLOv8s模型,输入统一缩放到640×640(保持长宽比填充),置信度阈值0.3、NMS(Non-Maximum Suppression, IoU阈值0.5),加载COCO预训练权重后微调;检测输出各边界框几何中心点(xi, yi)并按x坐标升序排列得有序插值点列,以YOLOv8直接输出的检测置信度confi∈[0,1]作为该点权重wi=confi;在标准自然边界条件(端点二阶导数为零)的三三次样条基础上构造带加权拟合残差项与二阶导正则化(Curvature Regularization, 正则系数λ=0.01)的优化目标函数,转化为三对角线性方程组用Thomas算法求解,得到全局C2连续煤岩界面轨迹函数S(x);对检测点数不足情形设退化策略(≥3点用加权三次样条、=2点线性插值、=1点输出有限长水平线段、=0点空曲线并报警)。性能评估除YOLO常用指标(mAP0.5、mAP0.5–0.95、Precision、Recall、推理速度FPS、参数量)外,定义水平投影精度Px(预测与真值边界框集在图像X轴投影区间交并比IoU)和垂直定位精度Py(Y轴投影区间IoU),并设计最大垂直偏移误差(Maximum Vertical Offset Error)与曲线曲率异常指数(Curvature Anomaly Index, 拟合曲线二阶导均方根)量化鲁棒性。
三、研究结果
3.1 实验环境与数据集(Experimental Environment and Dataset)
研究采用Intel Core i7-14700HX + NVIDIA RTX 4060 Laptop GPU平台,Python 3.12、PyTorch 2.0及Ultralytics YOLOv8实现。自建4016幅真实井下煤岩图像数据集经严格筛选与交叉多人校验标注,涵盖多种光照与干扰工况并按相同比例分配至训练/验证/测试集,同时独立标注像素级真值边界线供界面质量定量评估。
3.2 性能评估体系(Performance Evaluation System)
建立综合评估框架:YOLO侧采用mAP0.5、mAP0.5–0.95、Precision、Recall、FPS衡量检测性能;针对煤岩界面专门定义水平投影精度Px(反映界面对水平走向的覆盖完整性)与垂直定位精度Py(直接关联滚筒高度调节控制精度),并以最大垂直偏移误差和曲率异常指数评估抗离群与抗漏检鲁棒性。
3.3 实验结果与分析(Experimental Results and Analysis)
3.3.1 三次样条插值提升垂直定位精度的消融实验分析(Analysis of Ablation Experiments on the Improvement of Vertical Positioning Accuracy Using Cubic Spline Interpolation)
固定YOLOv8检测模块一致,对比不同后处理策略:仅输出YOLOv8离散点无连续轨迹;线性插值虽产生连续曲线但一阶导不连续呈锯齿状且Py与离散点相同(0.631);本文三次样条插值方法取得最优——Px=0.806(较线性插值提升5.1%),Py=0.725(较离散点/线性插值提升14.9%),证明三次样条可有效利用检测点上下文信息优化局部定位并将离散噪声点转为符合地质形态的光滑连续边界,实现从"可检测"到"可控制"的工程跨越。
3.3.2 典型场景可视化分析(Visual Analysis of Typical Scenarios)
在清晰煤岩界面、模糊边界、粉尘干扰及局部反光等多种典型井下场景中对比拟合边界线与像素级真值,所提系统均能生成稳定合理光滑边界线,验证了YOLOv8特征提取能力与置信度加权三次样条全局光滑约束的协同有效性及对复杂环境的适应性。
3.3.3 鲁棒性分析与离群影响测试(Robustness Analysis and Outlier Impact Testing)
人工向检测点引入20%随机垂直偏移(≈30 pixel)与15%随机漏检,分别用标准三次样条与本文置信度加权正则化三次样条拟合对比。结果显示:20%偏移干扰下本文方法最大垂直偏移误差112.53 pixel,标准样条增至123.45 pixel;15%漏检下本文方法误差较标准样条降低23.2%,曲率异常指数保持<0.014且平滑性满足工程要求。表明置信度加权与曲率正则化能有效抑制低置信离群点引起的非物理振荡,提升系统在复杂工况下的鲁棒性。
3.3.4 数据增强策略定量分析(Quantitative Analysis of Data Augmentation Strategies)
以仅含基本几何变换(随机翻转+缩放)的YOLOv8基线模型参照,逐一单独添加单种增强后评测mAP0.5:直方图均衡化提升最多(+7.2%),模拟粉尘/雾化次之(+6.5%),亮度/对比度调整+4.7%、色彩抖动+3.5%、随机水平翻转+2.8%、小角度旋转+1.9%、局部遮挡+1.6%、高斯与椒盐噪声各自<1.0%;全策略联合使用最终mAP0.5达0.806,说明直方图均衡化与粉尘雾化模拟直接针对井下不均光照与粉尘扩散两大核心挑战,多种增强具协同增益。
四、讨论与结论总结
研究人员指出当前方法局限在于:(1)仅依赖二维视觉信息,煤岩表面纹理色泽极相似或严重遮挡(大块煤尘黏附)时判别力下降,未来拟融合LiDAR点云等三维几何信息;(2)主要针对单一清晰煤岩分界面优化,多重平行/交叉界面或破碎顶板等复杂地质构造适应性未充分验证,后续将开发多边界推理专用模型;(3)深度学习模型泛化受训练数据分布制约,跨矿井地质条件差异大时性能可能衰减,需建立大规模跨区域开源煤岩图像数据集。此外未来可考虑用关键点检测或轻量分割模型直接获取更接近真实物理界面的标注以进一步提升垂直定位精度。
研究结论(翻译自Conclusion部分):
本文针对智能采煤中煤岩界面检测需求,提出融合YOLOv8目标检测与三次样条插值的创新方法,建立"精确检测—平滑拟合"协同框架,有效解决传统离散检测结果难以直接工程应用的问题。方法成功将YOLOv8应用于复杂井下环境煤岩边界检测,并利用三次样条插值将检测结果重建为光滑连续界线,显著提升输出结果的工程可用性;同时开发了完整的自动处理流程与质量评估模块以保障系统部署可靠性。生成的边界线可直接作为采煤机自动调高系统的控制指令,显著降低系统集成复杂度,为推动煤矿智能化开采提供实用技术途径。