《Process Safety and Environmental Protection》:Class-weighted alignment and reliable self-training for cross-domain fault diagnosis under class-imbalanced conditions
编辑推荐:
领域自适应已广泛应用于跨域故障诊断。然而,实际的工业系统仍面临一个尚未解决的主要挑战:故障样本数量有限,且其特征微弱或不明显。正常状态与故障状态之间的这种类别不平衡通常会导致传统领域自适应方法出现错误对齐,并阻碍域不变表示的提取。为解决此问题,研究人员提出了一
领域自适应已广泛应用于跨域故障诊断。然而,实际的工业系统仍面临一个尚未解决的主要挑战:故障样本数量有限,且其特征微弱或不明显。正常状态与故障状态之间的这种类别不平衡通常会导致传统领域自适应方法出现错误对齐,并阻碍域不变表示的提取。为解决此问题,研究人员提出了一种名为类别加权对齐与可靠自训练(Class-Weighted Alignment and Reliable Self-Training, CWA-RST)的新型故障诊断方法。该方法的核心思想是引入自适应的类别相关权重,以减少同类别故障特征之间的跨域规模差异。特征提取器集成了卷积神经网络(Convolutional Neural Network, CNN)、双向门控循环单元(Bidirectional Gated Recurrent Unit, BiGRU)、注意力模块(Attention Module)和度量学习(Metric Learning),以增强特征表示能力。研究人员设计了一个类别加权对齐模块来放大少数类中的弱特征,从而实现更有效的跨域分布对齐。此外,构建了可靠自训练机制,自动从目标域中选择可信的伪标记样本,从而优化模型并增强其跨域适应能力。在两个公共数据集和一个真实工业系统上的大量实验表明,所提出的方法在类不平衡条件下实现了卓越的跨域诊断性能。
论文解读:类不平衡条件下的跨域故障诊断新方法
研究背景与意义
现代工业系统在能源、交通和制造等领域发挥着关键作用。然而,由于其规模庞大、结构复杂及运行环境恶劣,极易发生各类潜在故障。若未能及时检测与排除,将导致设备损坏、生产停工甚至重大安全事故。随着传感器和存储技术的发展,数据驱动方法已成为故障诊断的主流。深度学习凭借强大的表征学习能力显著提升了分类精度。然而,在实际工业场景中,动态运行环境和不同工况常导致显著的“分布偏移”(Distribution Shift),使得在单一工况下训练的模型在新工况下性能大幅下降。为解决此问题,领域自适应(Domain Adaptation, DA)方法被引入以迁移诊断知识。但目前多数方法假设各类别样本均衡,忽视了工业系统中普遍存在的“类别不平衡”(Class Imbalance)现象,即正常样本极多而故障样本极少。这种不平衡会导致特征提取偏向多数类,引发跨域特征“错配”(Misalignment),限制了模型的泛化能力。因此,开展在类别不平衡条件下的跨域故障诊断研究具有重要的工程应用价值。该论文拟发表于《Process Safety and Environmental Protection》。
关键技术方法
为实现上述目标,研究人员采用了以下关键技术方法:首先,构建了一个集成卷积神经网络(CNN)、双向门控循环单元(BiGRU)和时间注意力机制(Temporal Attention Mechanism, TAM)的特征提取器,以捕获深度时空特征;其次,引入度量学习(Metric Learning)以优化嵌入空间,增强类内紧凑性和类间可分性;随后,设计了类别加权对齐(Class-Weighted Alignment, CWA)模块,通过引入自适应类别权重缓解跨域规模差异;最后,提出了可靠自训练(Reliable Self-Training, RST)策略,自动筛选高置信度的目标域伪标签样本进行模型微调。实验验证部分采用了田纳西伊斯曼(Tennessee Eastman, TE)过程、连续搅拌釜式反应器(Continuous Stirred Tank Reactor, CSTR)以及一个真实的智能过程控制测试装置(Intelligent Process Control Test Facility, IPCTF)数据集。
研究结果
问题定义(Problem formulation)
在多模态过程中,研究人员定义了源域(Source Domain)包含 Ns个带标签样本 Ds={(xis,yis)}i=1Ns,其中 xis∈RV×T(V为监测变量数,T为滑动窗口大小),yis∈{1,2,...,C}(C为健康状态总数)。目标域(Target Domain)包含 Nt个无标签样本。研究指出,由于目标域样本匮乏且特征微弱,直接最小化源域与目标域之间的分布差异会导致位于决策边界附近的少数类样本发生错位,这是本研究致力于解决的根本问题。
总体结构(Overall structure)
研究人员提出的CWA-RST模型主要由三部分组成:特征提取器、分类器和可靠自训练模块。特征提取器通过CNN、BiGRU和TAM的协同作用提取判别性特征;分类器基于学习到的特征预测健康状态;可靠自训练模块则负责筛选并利用目标域中的可信样本。这一架构旨在联合利用特征优化、类别加权对齐和可靠自训练,以提升在不平衡条件下的跨域诊断性能。
评估指标(Evaluation metrics)
为了全面比较不同模型的诊断能力,研究采用了准确率(Accuracy)、精确率(Precision)、召回率(Recall)和假阳性率(False Positive Rate, FPR)作为评价指标。具体定义为:ACC=∑c=1CTPc+∑c=1CFNc∑c=1CTPc,Precic=TPc+FPcTPc,Recalc=TPc+FNcTPc,FPRc=FPc+TNcFPc。其中 TPc、FPc、TNc和 FNc分别代表正确预测为类别 c、错误预测为类别 c、正确预测为非 c和错误预测为非 c的样本计数。
结论(Conclusion)
本文提出了一种新颖的类别加权对齐与可靠自训练模型,以解决类别不平衡条件下的跨域故障诊断难题。该方法集成了CNN、BiGRU和TAM以获得更具判别性的表示。此外,研究采用度量学习优化嵌入空间,开发了类别加权对齐模块以减轻由类别不平衡引起的跨域错配,并引入了可靠自训练策略。
讨论
本研究针对工业故障诊断中因数据分布不一致和样本失衡导致的模型失效问题进行了深入探讨。传统的领域自适应方法往往忽略了故障样本(少数类)在特征空间中的弱势地位,导致对齐效果不佳。本研究通过引入自适应权重机制,巧妙地平衡了不同类别在跨域迁移中的贡献度,确保了少数类特征的有效对齐。同时,结合自训练策略,充分利用了目标域中的隐含信息,进一步提升了模型的鲁棒性。实验结果表明,该方法在多个基准和真实数据集上均优于现有先进方法,证明了其在复杂工业环境下的实用潜力。未来的研究可进一步探索更复杂的动态工况下的在线自适应机制。