基于SHAP可解释性混合CNN–BiLSTM–Attention深度学习框架的逆变器驱动PMSM系统行为故障诊断

首页今日动态人才市场新技术专栏中国科学人云展台
BioHot
云讲堂直播会展中心特价专栏技术快讯免费试用

生物通官微
陪你抓住生命科技
跳动的脉搏

生物通首页 > 今日动态 > 正文

《Machines》：Behavioral Fault Diagnosis in Inverter-Driven PMSM Systems Using a Hybrid CNN–BiLSTM–Attention Deep Learning Framework with SHAP-Based Interpretability

【字体：大中小】 时间：2026年06月10日 来源：Machines 2.5

编辑推荐：

　　可靠的故障检测与诊断（Fault Detection and Diagnosis, FDD）在逆变器驱动的永磁同步电机（Permanent Magnet Synchronous Motor, PMSM）系统中具有关键作用，尤其在运行连续性不可妥协的应用场景中。

可靠的故障检测与诊断（Fault Detection and Diagnosis, FDD）在逆变器驱动的永磁同步电机（Permanent Magnet Synchronous Motor, PMSM）系统中具有关键作用，尤其在运行连续性不可妥协的应用场景中。本研究构建了一种融合一维卷积神经网络（One-Dimensional Convolutional Neural Network, 1D-CNN）、双向长短期记忆网络（Bidirectional Long Short-Term Memory, BiLSTM）及多头自注意力机制（Multi-Head Self-Attention）的混合深度学习框架，面向三相PMSM逆变器系统的多类故障分类任务。该框架的有效性在一组公开实验数据集上进行了验证，该数据集包含10,892个多传感器样本，采集自九种运行工况，涵盖正常工况、开路故障、短路故障及半桥过热场景。为避免时序数据泄露，研究采用了块感知时序分割策略（Block-Aware Chronological Splitting）。模型超参数通过24种不同配置的验证过程确定。所提出的CNN–BiLSTM–Attention模型在五次独立运行中取得宏平均F1分数（Macro F1-Score）0.9681 ± 0.0195、准确率（Accuracy）0.9810 ± 0.0102、马修斯相关系数（Matthews Correlation Coefficient, MCC）0.9757 ± 0.0130及ROC曲线下面积（ROC-AUC）0.9996 ± 0.0003，在所有评估模型中达到最高准确率和MCC；尽管随机森林（Random Forest）基线模型基于时序聚合特征而非时序建模取得了略高的宏平均F1分数（0.9747），所提出模型仍在完整混淆矩阵结构上提供了更优的判别能力，并通过SHAP实现了端到端的时序可解释性。模型的可解释性通过基于SHAP（SHapley Additive exPlanations）的GradientExplainer分析实现，结果表明：温度相关特征主导故障判别，尤其对过热工况至关重要；而电流不平衡特征则对区分开路与短路故障起关键作用。

永磁同步电机（Permanent Magnet Synchronous Motor, PMSM）凭借其高功率密度、高能效及紧凑结构等优势，已广泛应用于电动汽车、风力发电转换及精密制造等工业与交通系统。在逆变器驱动系统中，PMSM与功率电子变换器协同工作，通过高频开关调节供电电压，实现灵活的转速控制并提升系统整体性能。然而，这种集成也加剧了系统复杂性，催生了更广泛的潜在故障类型，包括电机本体故障（如匝间短路、退磁）及逆变器相关故障（如开关管开路、短路及过热条件）。由于机电系统的紧密耦合特性，单一_component的故障可能在短时间内蔓延至整个系统，导致非计划停机、维护成本攀升及安全隐患，在关键应用中尤为突出。

可靠的故障检测与诊断（Fault Detection and Diagnosis, FDD）对现代电驱系统的状态维护具有重要意义。传统的信号处理方法（如电机电流特征分析、快速傅里叶变换、小波分解）虽能识别周期性故障模式，但在逆变器驱动PMSM场景中往往失效：电流信号非平稳、转速多变、开关谐波存在，这些因素共同掩盖了故障相关的频谱特征，使可靠检测更为困难。此外，实际退化过程并非孤立发生，不同故障类型以 varying severity 出现，削弱了简单二分类方法的有效性，亟需更高级的多类诊断框架。

深度学习已在电驱系统FDD中取得显著进展。卷积神经网络（Convolutional Neural Network, CNN）可直接从原始传感器数据中学习空间特征与短期时序模式，减少人工特征提取需求；长短期记忆网络（Long Short-Term Memory, LSTM）及其双向扩展（BiLSTM）适用于捕获时序依赖性；基于Transformer架构的注意力机制则使模型能够聚焦最富信息量的时间步与特征通道。单一架构存在局限，混合方法融合不同建模优势，通常在端到端框架内获得更鲁棒、更准确的结果。

尽管性能强劲，多数深度学习FDD模型存在可解释性不足的问题。在安全关键场景中，仅追求高准确率远远不够，还需清晰理解每次故障分类背后的推理逻辑。基于合作博弈论的SHAP（SHapley Additive exPlanations）提供了一种模型无关的框架，可量化各特征对个体预测的贡献。近年来SHAP已应用于基于振动的电机诊断机器学习模型及多模态预测维护系统，但其在PMSM逆变器故障诊断端到端深度学习架构中的应用仍较有限。

本研究旨在构建融合CNN、BiLSTM与多头自注意力机制的混合深度学习框架，用于逆变器驱动PMSM系统的多类故障诊断，并基于公开多传感器实验数据集进行验证。该数据集包含10,892个样本，涵盖九种运行工况。研究采用逐层递进的技术路线：CNN提取局部时序特征，BiLSTM建模双向长程依赖，多头自注意力子层通过残差连接实现自适应时间步加权；采用块感知时序数据分割防止时序数据泄露；通过24种配置的超参数验证确定最优架构；后 hoc 应用SHAP GradientExplainer分析，获得与已知故障机制相验证的物理可解释特征重要性排序。

研究所用关键技术方法包括以下方面。数据来源为Bacha公开发表的多传感器PMSM逆变器故障数据集，采样频率10 Hz，共10,892个样本。数据预处理阶段，从25个可用特征中剔除8个冗余或存在数据质量问题的特征，最终保留18个变量，包括8个原始传感器测量值（两相电流I_a、I_b，直流母线电压V_DC，直流母线电流I_DC，三个半桥温度T1、T2、T3，驱动电压V_D）及10个派生特征；对含无限值和NaN值的数据采用训练集中位数填充策略。数据划分采用块感知时序分割策略，按65%:20%:15%的比例在每个类别的连续录制块内顺序划分训练、验证和测试子块，确保滑动窗口不跨越训练-验证-测试边界，最终生成1393个训练窗口、413个验证窗口和306个测试窗口。模型架构为CNN–BiLSTM–Attention序列结构：CNN块含两层一维卷积（ReLU激活、批归一化、dropout，无最大池化以保持时序分辨率）；BiLSTM块为两层堆叠双向LSTM；多头自注意力子层含4个头、键维度16，配残差连接、层归一化及位置前馈网络；分类器头采用全局平均池化接两层全连接及softmax九单元输出。超参数通过网格搜索确定，覆盖滤波器数fc ∈ {64, 128}、LSTM单元数l_u ∈ {32, 64}、dropout率 ∈ {0.1, 0.2, 0.3}、学习率lr ∈ {10^?3, 5×10^?4}，共24种配置。训练采用Adam优化器、稀疏分类交叉熵损失、类别加权策略，最多100 epoch，早停耐心值12。五组独立随机种子运行量化训练随机性。可解释性分析采用SHAP GradientExplainer，以100个随机训练窗口为背景参考，计算200个测试窗口的归因，得到各样本各时间步各特征的SHAP值后按时间维度取平均。

研究结果部分，研究首先在"对比性能"中报告了各模型表现。经典机器学习基线中，随机森林取得最高宏观F1（0.9747），XGBoost（F1=0.9406）和MLP（F1=0.9092）次之。值得注意的是，所有表格基线均将滑动窗口聚合为单一时均值向量，丢弃了时序结构；随机森林的竞争性表现表明故障判别信息部分编码于跨传感器关系，而非完全依赖于时序动态。深度学习序列模型中，纯CNN取得宏观F1 0.9754±0.0127，与随机森林相当；纯BiLSTM（0.9423±0.0085）和纯LSTM（0.9404±0.0081）均低于CNN，表明缺失卷积特征层次时单纯时序建模不足。CNN+BiLSTM（0.9564±0.0112）优于各组件单独使用，验证了两者互补性。所提出的CNN–BiLSTM–Attention模型在所有深度学习模型中取得最高准确率（0.9810±0.0102）和MCC（0.9757±0.0130），宏观F1为0.9681±0.0195。尽管随机森林宏观F1略高，但所提出模型在完整混淆矩阵结构上表现更优，且通过SHAP归因提供了端到端的时序可解释性。CNN+Transformer竞争者（F1=0.9569±0.0191，准确率=0.9725±0.0127）均低于所提出模型，表明对于10 Hz采样率捕获的稳态及慢变故障动态，BiLSTM结合注意力的时序建模优于纯Transformer编码器。

"消融研究"进一步量化了各组件贡献。从纯LSTM基线（F1=0.9404）出发，替换为BiLSTM仅获边际提升（0.9423），与前人发现双向性收益任务依赖性一致。前置CNN特征提取（CNN+BiLSTM，F1=0.9564）带来明确改善，确认局部卷积特征学习与循环时序建模的互补性。增添多头自注意力子层后（所提出模型，F1=0.9681），宏观F1再提升0.012，同时取得最高准确率和MCC，共同验证了三阶段设计原理。

"窗口尺寸敏感性分析"评估了不同滑动窗口长度的影响。准确率在各窗口尺寸下保持稳定（>0.96），宏观F1在w_s=15（0.9579±0.0324）和w_s=30（0.9620±0.0155）时达峰，w_s=20略低（0.9469±0.0144）且标准差最大。w_s=30时所有指标标准差最低（F1 std=0.0155），训练更稳定。最终选择w_s=15以平衡诊断时序覆盖与最小类别（F4，341个样本）测试窗口数量约束。

"所提出模型的逐类评估"展示了最佳单次运行的混淆矩阵。九类中七类取得完美精确率（1.000），最具挑战性的类别为F2（低侧开路），精确率0.969、召回率1.000；F0（正常工况）精确率1.000、召回率0.992，一个正常样本误分为F2，物理上可解释为低侧开路故障产生的电流波形畸变在某些时间窗口可能 resembling 正常操作瞬态。

"可解释性分析"呈现了SHAP GradientExplainer的全局特征重要性与逐类热图。全局排名中，温度相关特征占主导：T1（半桥1温度）和Temp_Diff_Max（最大温差）分列第一、二位（平均|SHAP|分别为0.0083和0.0077），T2（0.0050）、T3（0.0027）紧随其后；电流相关特征居中：I_b、Power_AC分列第五、六位，Current_Imbalance、I_b__original、I_a__original紧随其后；电压及直流母线特征（V_DC、I_DC、V_D）始终处于较低层级。逐类热图显示：过热故障（F6、F7、F8）中T1、T2、Temp_Diff_Max SHAP值最大；开路故障（F1、F2）和短路故障（F3、F4、F5）中，电流相关特征（尤其I_b、I_a__original、Current_Imbalance）重要性升高；正常工况（F0）各特征重要性均低，表明模型依赖区分性模式的缺失。这些结果与系统预期物理行为一致。

讨论部分，研究人员指出实验结果凸显若干要点。CNN–BiLSTM–Attention架构在Bacha数据集上 delivering 最强性能，消融分析表明CNN提取局部模式、BiLSTM捕获时序关系、注意力机制调整时间步重要性，各组件均有贡献。块感知时序分割的选择对该数据集至关重要，因每类故障为单次连续录制，随机分割会导致时间相邻样本分布于训练集和测试集，造成性能估计虚高；保持时序结构可更真实地评估模型泛化能力。SHAP分析进一步阐明了模型对不同故障类型的响应机制：过热故障中温度传感器占重要性大份（33.2%），T1和Temp_Diff_Max在全球排名中突出，与其对半桥加热热效应的直接响应一致；开路和短路故障中，电流不平衡及相电流特征更为突出，与定子电流不对称性作为三相逆变器开关级故障诊断指标的已知角色相吻合。

研究人员也 acknowledge 了本研究的局限性。数据集在固定工况（恒定转子转速10 rad/s、直流母线电压15 V、环境温度25 °C）下采集，属于刻意的实验室简化。实际部署中，电机转速持续变化、负载转矩波动、环境温度范围宽广，这些因素调制基线电流、电压和热特征，可能偏移类别边界、降低模型性能。在变速、变负载及宽温度协议下验证所提出框架是未来优先方向，可能需要多工况实验数据集或物理信息域适应策略。10 Hz采样率足以捕获热动态和稳态电流特征，但无法解析高频开关瞬态，后者在更高采集率下可提供早期故障特征。GradientExplainer提供的是基于梯度的近似Shapley值而非精确解，对于含循环组件的模型，近似质量理论上受梯度 landscape 平滑度约束，重要性值应解释为方向性指示而非精确归因。此外，SHAP GradientExplainer识别的是特征层面最具判别性的传感器通道，未直接揭示注意力机制在1.5秒窗口内聚焦的具体时间步；时间步注意力权重可视化将补充现有特征层分析，留待未来工作。

结论部分，本研究提出了一种面向逆变器驱动PMSM系统多类故障诊断的混合CNN–BiLSTM–Attention深度学习框架，并在涵盖九种工况的公开多传感器实验数据集上进行了验证。与所有评估的替代方案（包括经典机器学习方法、序列模型及CNN–Transformer架构）相比，所提出模型在准确率（0.9810 ± 0.0102）和MCC（0.9757 ± 0.0130）方面表现最优。然而，随机森林基线取得了更高的宏观F1分数（0.9747 vs. 0.9681），反映出故障类别可通过聚合的跨传感器特征实现部分分离，而无需依赖时序建模；这一发现强调了在类别不平衡条件下评估诊断模型时报告互补指标的重要性。消融分析结果表明，每个架构组件均对整体性能有所贡献。此外，SHAP GradientExplainer分析提供了与已知故障机制一致的特征重要性排序，赋予了具有物理意义的可解释性。块感知时序数据分割策略、五次运行统计报告及基于验证集的超参数选择构成了方法学上严格的评估框架，避免了时序FDD基准中常见的性能估计膨胀问题。未来工作将探索：所提出架构向多速多载工况的泛化、将物理信息约束作为正则化项以强化热力学与电磁学一致性、以及适用于嵌入式边缘实时预测维护系统的轻量级模型变体部署。

联系信箱：

粤ICP备09063491号

热点排行