一种基于注意力-贯穿的潜在扩散模型用于机械故障诊断中的单源域泛化

《ADVANCED ENGINEERING INFORMATICS》:Attention-throughout: a latent diffusion approach for single domain generalization in machinery fault diagnosis

【字体: 时间:2026年04月24日 来源:ADVANCED ENGINEERING INFORMATICS 9.9

编辑推荐:

  在机械故障诊断领域,当仅有单一工况下的可用数据时,如何将学习到的诊断知识推广到未见过的工况是一个严峻挑战。研究人员开展了一项关于“单源域泛化”的研究,提出了一种称为“注意力-贯穿的潜在扩散”模型。该模型通过融合时、频、时频三视图振动信号,并利用潜在扩散过程结合注意力机制,实现了在仅有单源数据下对多种未见目标工况的鲁棒泛化,显著提升了诊断精度,为解决工业实践中数据受限下的智能诊断难题提供了新思路。

  
在工业4.0时代,保障旋转机械的可靠运行至关重要,任何故障都可能导致不可估量的经济损失和安全事故。得益于传感技术和深度学习的快速发展,数据驱动的智能故障诊断取得了长足进步。然而,现实工业环境中的故障数据通常只在单一工况下可获取,而在实际部署时,诊断模型却不可避免地会遇到各种未见过的工况。这种已知训练场景与未知测试场景之间的分布差异,会显著降低模型的诊断性能。为了应对这一挑战,领域适应和领域泛化技术应运而生。其中,领域泛化旨在不依赖任何目标域样本的情况下,学习一个具有普适性的诊断模型,这尤其符合工业实际,因为目标工况的数据通常事先无法获得。但现有的大多数领域泛化研究都假设能够获取多种工况下的数据进行训练,这在工业实践中很少成立。当只有一个工况的数据可用时,如何实现有效泛化,即“单源域泛化”问题,是当前面临的根本性和实践性难题。这项发表于《ADVANCED ENGINEERING INFORMATICS》的研究,正是为了解决这一核心痛点。
为了攻克单源域泛化在机械故障诊断中的难题,研究人员开发了一种名为“注意力-贯穿潜在扩散”的模型。该方法的核心技术路径包括:首先,对原始一维振动信号进行时域、频域和时频域的三视图表征,并通过一种协同注意力融合机制将其投影到一个共享的潜在子空间,以构建全面的故障特征表示。其次,专门设计了一个一维U-Net网络,用于在潜在空间中进行有条件的扩散过程,避免了将信号转换为时频图像可能造成的信息损失。在此过程中,研究者巧妙地利用健康状态信号(其富含工况信息且易于大量获取)作为条件,来引导扩散过程。最后,通过操作扩散模型中的自注意力和交叉注意力模块,发展了一种特征编辑策略,确保在生成特征时保留与故障状态相关的特征,同时用目标域的工况特征进行替换,从而实现可控的、面向目标域的伪特征生成,而非随机的特征泛化。
1. Latent representations encoding with multi-view fusion mechanism
为了构建全面的振动信号潜在表征,每个输入信号段被编码为时域、频域和时频域三种异构视图。其中,时频表征采用了连续小波变换,因其在分析非平稳信号和捕获局部瞬态特征方面的强大能力而被选用。随后,通过一个受注意力机制思想启发的动态组合系数,自适应地加权每个视图的贡献,这一过程被称为协同注意力融合。该机制将三种视图视为平等的上下文来源,克服了标准注意力只能计算两个向量间相似性的局限,实现了更全面的特征融合。融合后的特征再经过线性投影和Dropout处理,形成最终的潜在表示,为后续的域泛化任务奠定了基础。
2. One-dimensional U-net construction with conditional guidance
基于学习到的潜在表示,研究引入了一个扩散过程来实现潜在空间内的条件生成。与直接采用计算机视觉中的二维扩散架构不同,本文专门为振动信号构建了一个一维U-Net网络作为去噪网络,这有助于保留时域局部故障相关细节,防止因时频变换造成的信息丢失。为了将工况信息引入逆向去噪过程,模型使用源域健康样本融合特征的均值作为条件向量。在训练阶段,这个条件向量通过交叉注意力机制被注入U-Net,从而将去噪轨迹显式地约束在源工况的结构偏置上,同时逐步合成和细化与故障相关的成分。模型通过最小化噪声预测目标进行优化,从而学习到一个以工况信息为锚点的可控生成方向。
3. Target-domain pseudo-feature generation with feature manipulation strategy
在训练好条件潜在扩散模型后,固定的去噪网络被用作特征生成器来合成目标域的伪特征。生成过程由一种特征操纵策略指导。研究人员计算了目标域与源域健康信号条件向量之间的偏差,该偏差表征了由不同工况引起的健康信号特征的系统性变化。为了在伪特征生成过程中保留故障状态信息,去噪U-Net中的自注意力机制受到了约束:在训练阶段学到的查询-键交互模式被记录并存储为固定的注意力图,在生成阶段直接使用此固定图与动态计算的值表示进行聚合。这在一定程度上保留了内部注意力拓扑结构,约束了去噪动力学以维持故障判别性结构模式,防止分布漂移。最终,目标域伪特征通过从纯高斯噪声开始并利用目标域条件向量引导的逆向扩散过程生成。生成的伪特征与源域真实特征一起用于训练分类器,该分类器随后被应用于目标域的故障诊断。
本研究提出了一种新颖的“注意力-贯穿潜在扩散”框架,用于解决基于单源域泛化的机械故障诊断难题。该框架的创新性主要体现在三个方面:首先,通过协同注意力潜在编码器增强了判别性表征,同时利用扩散过程中的自注意力和交叉注意力来引导生成过程,在保留故障语义的同时抑制工况特异性因素,为单源域泛化建立了可控的扩散机制。其次,模型专为一维振动信号的域泛化任务设计,引入了三视图信号表征以提高生成质量和泛化能力,避免了现有方法依赖时频表征可能造成的信息损失。最后,提出了一种特征操纵策略来学习域间差异并引导特征生成,此策略无需额外监督、领域标签或训练/微调。
大量的实验验证了所提出方法的有效性和优越性。结果表明,该方法在仅使用单工况训练数据的情况下,能够实现向多个未见目标工况的鲁棒泛化,其诊断精度显著优于当前最先进的领域泛化方法。这些发现表明,当针对一维状态监测信号进行适当结构化设计时,潜在扩散模型为单源域泛化提供了一个有效的机制,有助于弥合预测性维护领域泛化研究中的一个重要空白。这项研究不仅为数据受限的工业环境下的智能故障诊断提供了切实可行的解决方案,也为扩散模型在更广泛的时序信号处理与域适应任务中的应用开辟了新的可能性。
相关新闻
生物通微信公众号
微信
新浪微博

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号