基于深度学习的异形钢坯纵向裂纹缺陷预测——针对变长序列与缺陷稀疏场景

《Engineering Applications of Artificial Intelligence》:Deep learning-based longitudinal crack defect prediction for special-shaped billets under variable-length sequences and defect scarcity

【字体: 时间:2026年06月18日 来源:Engineering Applications of Artificial Intelligence 8

编辑推荐:

  张志岩|吕志民|何飞|周玉杰|孙熙北京科技大学钢铁技术协同创新中心,中国北京学院路30号,100083摘要H型钢制造中的中间产品——异形坯,需要准确预测其纵向裂纹缺陷,以防止缺陷蔓延到最终产品。然而,实际预测面临诸多挑战,包括不同阶段和坯材之间序列长度的不稳定性,以及裂纹缺陷的稀

  张志岩|吕志民|何飞|周玉杰|孙熙北京科技大学钢铁技术协同创新中心,中国北京学院路30号,100083摘要H型钢制造中的中间产品——异形坯,需要准确预测其纵向裂纹缺陷,以防止缺陷蔓延到最终产品。然而,实际预测面临诸多挑战,包括不同阶段和坯材之间序列长度的不稳定性,以及裂纹缺陷的稀缺性和不完整性。本研究首先设计了一种长度对齐策略,用于对坯材内的多阶段序列进行对齐,从而为后续分析构建信息完备的数据集。随后,提出了一种新的纵向缺陷预测方法,即基于掩码增强残差卷积的监督对比学习(MERC-SCL)。具体而言,该方法设计了掩码增强残差卷积(MERC)网络,以避免在处理不同长度序列时填充值干扰特征提取。同时,监督对比学习(SCL)通过构建具有良好紧凑性和缺陷可分离性的特征空间,提升在缺陷稀缺场景下的区分能力和泛化能力。此外,还采用了潜空间混合策略来合成缺陷特征,从而在避免序列插值带来的失真的同时缓解缺陷稀缺问题。实验结果表明,所提方法在各种缺陷稀缺程度下均优于传统基准方法,当仅有10、30和60个缺陷样本时,对应的加权F1分数分别为0.7627、0.8007和0.8276。进一步的增量比较和消融实验也验证了该方法各组件的有效性。最后,还引入了与模型无关的可解释性方法,以提高模型的可解释性,并为工艺优化提供指导。引言由于优异的机械性能,热轧H型钢已成为现代建筑和工程结构中最重要的承重材料之一(Chen等人,2023)。在其生产过程中,连续铸造技术起着至关重要的作用,它能够铸造出接近最终形状的坯料,大大简化了后续的轧制工序。然而,异形坯复杂的轮廓使其极易出现质量缺陷,尤其是纵向裂纹缺陷(Yang等人,2018)。这类裂纹缺陷不仅会在铸造过程中导致钢液泄漏,还会在热轧过程中传递给最终的H型钢,进而引发应力集中,对结构安全构成威胁。因此,及时识别裂纹缺陷并采取相应措施对于提升产品质量、减少经济损失至关重要。裂纹缺陷识别方法大致可分为基于图像的方法和基于工艺参数的方法。其中,基于图像的方法利用计算机视觉技术,通过分析表面缺陷的视觉形态和纹理信息来检测或分割裂纹。由于这些方法能提供直观的检测结果,并且具备较强的局部表面异常识别能力,因此已被广泛应用于各类表面检测场景,如钢材检测(Fu等人,2025;Tian等人,2022)以及服务过程检测(Di Mucci等人,2024;Laflamme等人,2026)。此外,为了降低背景干扰并提高缺陷细节的识别能力,还引入了注意力机制(Ruggieri等人,2025)和对抗学习(S. Tian等人,2024;Tian等人,2022)等增强策略。但在连续铸造生产环境中,由于存在高温和照明不稳定等恶劣复杂的现场条件,基于图像的方法容易受到影响。而且,此类检测通常在缺陷发生后才进行,不可避免地存在时间滞后,这限制了其在及时干预和优化工艺方面的作用。相比之下,基于工艺参数的方法则利用工艺参数来预测裂纹缺陷,使得实时监测和早期预警在工业应用中更为可行。此外,这些方法还有助于揭示工艺参数与裂纹缺陷之间的内在关系,从而为分析裂纹成因及优化连续铸造工艺提供支持。因此,本研究重点探讨基于工艺参数的异形坯裂纹缺陷预测方法。对于基于工艺参数的裂纹预测,传统的机理驱动方法(Li等人,2021;Zhang等人,2025)会将连续铸造过程中的关键工艺参数输入到热力学耦合模型中,判断局部应力是否超过材料的断裂阈值,进而推断裂纹可能出现的概率。然而,这类方法的预测精度仍然有限,主要是因为它们过度依赖许多理想化的物理假设,未能充分利用实际生产中丰富的工艺数据(Ning等人,2025)。为了解决这些问题,越来越多的研究开始采用数据驱动方法,利用历史生产数据来揭示工艺参数与裂纹缺陷之间的关系。在这些方法中,诸如支持向量机(SVM)和LightGBM(LGBM)(Duan等人,2021;Wang等人,2025)等各类机器学习算法被用来构建分类模型,通过从工艺参数中提取的统计特征来实现裂纹预测。需要指出的是,坯料的工艺参数本质上是随坯料长度不断变化的时间序列数据。随着深度学习在时间序列建模领域的快速发展,越来越多的研究开始深入挖掘坯料时间序列数据,以进一步提升裂纹预测的精度。例如,Sala等人(2023)采用了经过挤压激励(SE)机制改进的卷积神经网络,从工艺数据中提取多尺度时间特征,并整合组合信息,从而实现了有效的裂纹预测。此外,Geng等人(2025)则使用了MLSTM-FCN模型进行裂纹预测,该模型能够捕捉时间序列数据中的局部短期变化和全局长期依赖关系,因此在裂纹预测任务中表现出更优的性能。尽管基于工艺参数的缺陷预测方法已经取得了出色的预测效果,但在实际应用中仍面临一系列挑战。首先,如图1所示,不同阶段和坯材之间序列长度的不稳定性严重影响了异形坯连续铸造数据集的有效构建。由于坯料会依次经过连续铸造过程的多个阶段,如结晶器以及不同的二次冷却区,因此需要将不同阶段的工艺参数与相应的坯料精准匹配,才能构建出信息完备的多阶段数据集。为了解决这一难题,人们普遍采用连续铸造跟踪模型(CCTM)(Geng等人,2025;Kong等人,2019),通过逆向积分铸造速度来推断每个坯料经过各个阶段的时间间隔,从而获取相应的工艺数据。然而,由于铸造速度的波动,同一坯料在不同阶段的序列长度会存在不一致性。针对这一问题,现有研究(Geng等人,2025)试图通过零填充的方式对不同阶段的数据进行对齐,从而形成完整的多阶段坯料工艺序列数据集。但这种策略无法实现不同阶段之间的精确对应,因而难以有效挖掘跨阶段的变量关系。此外,由于实际生产的要求,不同坯料的切割长度往往也不一致,这就导致了坯材之间序列长度的差异。因此,构建多阶段对齐的序列数据集,并有效解决坯材之间序列长度不稳定的问题,是实现异形坯裂纹缺陷可靠预测的重要前提。其次,异形坯的纵向裂纹缺陷本身就具有稀缺性和不完整性特点,这使得构建稳健的预测模型变得十分复杂。在稳定生产条件下,虽然纵向裂纹缺陷属于常见缺陷类型,但其出现频率相比普通坯材仍然较低。因此,由此构建的缺陷预测模型往往存在严重的类别不平衡问题,容易偏向正常类别,进而削弱其识别裂纹缺陷的能力(Rezvani和Wang,2023)。此外,纵向裂纹的形成原因复杂多样,不同的成因可能会对应不同的特征表现。因此,即便有训练用的裂纹样本,也可能无法全面覆盖推理过程中可能出现的各种纵向裂纹成因,尤其是在缺陷稀缺的情况下。这就要求模型具备较强的泛化能力,以便应对那些可能从未出现过的纵向裂纹特征表现。为了解决裂纹缺陷稀缺的问题,常见的策略是使用数据增强技术生成合成样本。过采样技术及其变体(SMOTE)(Ning等人,2025;Wang等人,2025)已被用于生成缺陷样本,从而提升模型对裂纹缺陷的识别能力。但对于序列输入而言,基于插值的合成样本往往会破坏其固有的时间依赖关系,产生不真实的序列,进而误导模型。而输入数据的序列长度不稳定性进一步降低了这类增强策略的效果。尽管深度生成模型(Fan等人,2023;Ren等人,2025;J. Tian等人,2024)因其强大的数据拟合能力而被广泛用于时间序列数据生成,但在缺陷样本极为稀缺的情况下,其训练过程仍然难以稳定。因此,开发能够在保证时间一致性和训练稳定性的同时有效应对缺陷稀缺问题的方法,对于提升预测精度和泛化能力至关重要。本研究提出了一种基于深度学习的异形坯裂纹缺陷预测框架,旨在解决不同阶段和坯材之间序列长度不稳定的问题,以及纵向裂纹缺陷的稀缺性和成因相关的不完整性问题。主要贡献如下:(1)提出了一种长度对齐策略,用于处理从CCTM获得的数据中不同阶段的序列长度不稳定性问题。具体而言,通过时空变换将各阶段的序列投影到统一的坯料长度空间域中,然后再进行等间隔重采样,从而实现每块坯料的多阶段序列数据对齐。(2)针对坯材之间序列长度不稳定性以及成因相关的缺陷不完整性问题,提出了一种名为基于掩码增强残差卷积的监督对比学习(MERC-SCL)的裂纹缺陷预测模型。该MERC网络在批量归一化(BN)和全局平均池化(GAP)操作中加入了掩码机制,从而在采用填充策略处理序列长度不稳定性时,消除填充值对特征提取的干扰。随后,监督对比学习(SCL)会构建成对的判别目标,使正常样本相互靠近,而缺陷样本则相互远离,从而在潜在的成因相关裂纹表现形式覆盖不足的情况下,形成更加稳健且具有强判别能力的嵌入空间。(3)潜空间混合策略通过在潜空间内合成语义一致的缺陷表示,来缓解缺陷稀缺问题,从而避免原始序列空间中插值操作带来的失真。为了验证所提方法的有效性,研究人员利用真实的工业生产数据构建了多个具有不同缺陷规模的数据集。实验结果表明,所提方法在各种缺陷规模的数据集中均优于传统基准方法,而消融实验则证实了各核心模块的有效性。最后,还采用了与模型无关的可解释性方法——集成梯度法,用于分析多种案例中的裂纹形成机制,为工艺优化提供指导。本文的其余部分结构如下:第2节介绍了连续铸造工艺的背景,并详细阐述了多阶段铸造数据的预处理和对齐方法。第3节全面描述了所提出的方法及其各组成模块。第4节说明了实验设计,包括数据集构建、评估指标以及模型配置。第5节汇报了实验结果,并对各项关键组件进行了对比分析。最后,第6节对全文进行了总结,并探讨了未来研究的潜在方向。连续铸造工艺概述连续铸造是钢铁生产中最重要的工艺路线,其目的是将液态熔融钢连续凝固成特定形状的坯料,为后续的轧制工序提供原材料(Cemernek等人,2022;Han等人,2021)。连续铸造工艺的流程图如图2所示,包括浇包、中间包、结晶器以及二次冷却区。在连续铸造过程中,液态钢从浇包流入作为缓冲装置的中间包,然后再通过多个通道进入结晶器。问题定义在本研究中,纵向裂纹被视为目标缺陷类型,研究的目标是预测每块坯料是否存在纵向裂纹。通过上述连铸数据预处理,构建了一个针对异形坯的多阶段、长度对齐的裂纹缺陷数据集,表示为{(Xi,yi)}i=1N,其中Xi∈RSi×d代表多阶段序列数据,d为工艺变量数量,Si则表示第i个坯料的序列长度。本研究所使用的实验数据来源于中国某大型钢铁企业的H型钢连铸车间,工艺参数以5赫兹的频率采集并存储在时间序列数据库中。为构建坯料级数据集,还提供了连铸跟踪模型所需的位置信息,如表1所示,包括距结晶器以及SCZs中心线各段到切割点的距离。基于这些数据,本节首先重点优化和分析模型中的关键超参数,随后利用这些优化后的超参数对所提方法与现有方法进行系统比较,并对各个模块进行消融研究。最后,通过评估特征重要性,分析影响裂纹形成的关键因素,以揭示潜在的缺陷机制。

在本研究中,提出了一种基于深度学习的纵向裂纹缺陷预测框架,以应对异形连铸过程中的实际挑战,包括不同阶段和坯料之间的长度差异,以及裂纹缺陷的稀缺性和因果关系不完整性等问题。首先,引入了一种长度对齐策略,通过时空变换将多阶段序列数据映射到统一的坯料长度域中,从而解决这一问题。

**作者贡献声明**
张志岩:概念设计、数据整理、方法论、软件工具、初稿撰写。吕志敏:概念设计、监督指导、验证工作。何飞:概念设计、形式化分析、资金筹措、方法论、审稿与编辑。周宇杰:形式化分析、验证工作、审稿与编辑。孙希:概念设计、验证工作、审稿与编辑。

**利益冲突声明**
我们声明与任何可能不当影响我们工作的个人或组织不存在财务或个人关系,也不存在任何可能影响本文观点或评审结果的产品、服务及公司的专业或其他个人利益。

**致谢**
本研究得到了国家科技重大专项——智能制造系统与机器人(项目编号2025ZD1602500)以及中央高校基本科研业务费(项目编号FRF-BD-25-036)的支持。
相关新闻
生物通微信公众号
微信
新浪微博

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号