基于多尺度卷积神经网络与时空双重注意力的配电网两阶段故障诊断

首页今日动态人才市场新技术专栏中国科学人云展台
BioHot
云讲堂直播会展中心特价专栏技术快讯免费试用

生物通官微
陪你抓住生命科技
跳动的脉搏

生物通首页 > 今日动态 > 正文

《Electronics》：Two-Stage Fault Diagnosis of Distribution Network Based on MS-CNN and Spatio-Temporal Dual Attention

【字体：大中小】 时间：2026年06月10日 来源：Electronics 2.6

编辑推荐：

　　针对配电网中故障特征微弱以及相邻节点难以定位的问题，研究人员构建了一种两阶段级联架构，将诊断任务解耦为故障分类与区段定位。特征层融合多尺度卷积神经网络（MS-CNN）、SimAM（Simple Attention Module，简单注意力模块）与 Transf

针对配电网中故障特征微弱以及相邻节点难以定位的问题，研究人员构建了一种两阶段级联架构，将诊断任务解耦为故障分类与区段定位。特征层融合多尺度卷积神经网络（MS-CNN）、SimAM（Simple Attention Module，简单注意力模块）与 Transformer，形成时空双重注意力机制，同步捕获空间显著性与全局时间逻辑。在故障定位决策层引入原型网络（Prototype Network），并采用度量学习（Metric Learning）解决相邻节点特征混叠问题。实验结果表明，故障分类与定位准确率分别达到 98.61% 和 94.22%，且在极低信噪比（SNR）条件下表现出平滑退化特性，验证了所提策略在配电网精细化故障诊断中的有效性。

该文发表于《Electronics》，围绕配电网故障诊断中“弱故障特征难提取、相邻节点难区分、复杂噪声背景下定位精度不足”三类核心问题，提出了一种基于多尺度卷积神经网络（MS-CNN）与时空双重注意力的两阶段级联故障诊断框架。研究背景在于，配电网作为连接输电系统与终端用户的关键基础设施，其供电可靠性直接影响社会经济稳定运行。然而，受网络拓扑复杂、线路老化与环境干扰等因素影响，配电网容易发生单相接地、两相短路和单相断线等多种故障。尤其是单相接地故障常伴随微弱零序分量，相邻电气节点之间又具有高度相似的故障响应，使传统依赖人工巡检、阻抗计算或手工特征工程的方法难以满足智能电网对快速感知、快速隔离和快速恢复的需求。已有深度学习方法虽已在故障分类任务中取得较好效果，但在细粒度区段定位方面仍存在三项突出不足：单尺度卷积难以同时表征高频暂态冲击与稳态工频畸变，参数量较大的注意力机制不利于边缘部署，而基于 Softmax 的判别方式又难以有效分离相邻节点之间高度混叠的特征分布。因此，开展一种兼顾多尺度特征解耦、全时域依赖建模与精细定位判别能力的研究具有明确现实意义。

为解决上述问题，研究人员设计了“阶段 1：故障分类—阶段 2：故障区段定位”的两阶段级联架构，放弃传统端到端单任务诊断模式，将“是否故障、属于何类故障”与“故障具体位于哪个线路区段”分层处理。其核心思想是在特征提取层通过 MS-CNN、SimAM 与 Transformer 的融合构建时空双重注意力，在决策层通过原型网络（以可学习类别原型为中心的度量判别机制）替代单纯线性分类，从而同时改善弱特征提取能力与相邻节点可分性。最终实验表明，该框架在 IEEE 33 节点配电网数据上实现了 98.61% 的故障分类准确率和 94.22% 的故障定位准确率，级联后的最终有效定位率达到 93.62%；在 10 kV 配电网拓扑上仍保持较高精度，表明模型具有跨拓扑泛化能力；在多类噪声与极低信噪比条件下，模型性能虽下降但未发生灾难性失效，表现出较强稳健性。该研究的重要意义在于，提出了一条兼顾诊断精度、特征可分性与工程适用性的配电网精细化智能诊断路径，对提升配电网感知能力与自愈水平具有价值。

作者采用的主要关键技术方法可概括如下：研究基于 MATLAB/Simulink 构建 IEEE 33 节点配电网仿真数据集，并补充 10 kV 配电网用于跨场景验证；以三相电压、三相电流、零序电流、有功功率 P 与无功功率 Q 构建多维时间序列特征矩阵，经 Z-Score 标准化、层级标签编码与加权随机采样完成预处理；在模型结构上使用三分支不同卷积核尺寸的 MS-CNN 提取多尺度局部特征，以 SimAM 实现无参数空间注意力增强，以 Transformer 编码器建模全局时间依赖；在判别层构建共享 MLP 头，阶段 1 使用 Softmax 完成故障分类，阶段 2 使用原型网络与欧氏距离度量完成故障区段定位，并通过联合损失进行端到端训练。样本来源为仿真生成的 IEEE 33 节点与 10 kV 配电网故障事件数据。

在研究结果部分，论文首先在“整体框架概述”中说明，该方法通过两阶段级联诊断结构将故障分类与区段定位解耦，输入端接收三相电压电流、零序电流及瞬时有功/无功功率等多通道信号，经多尺度卷积、SimAM 和 Transformer 联合提取高维故障表征，再分别进入分类与定位决策分支。该部分明确了模型不是简单串联模块，而是通过“空间筛选 + 时间建模 + 几何度量判别”的协同方式重构故障诊断流程。

在“数据预处理与特征构建”部分，研究人员基于 IEEE 33 节点配电网仿真模型构建多维特征空间，指出仅依赖电压或电流难以刻画弱故障特征，因此进一步纳入零序分量以及有功/无功功率。论文特别强调 P 与 Q 能够编码电压和电流之间的相位关系（功率因数角），故障发生时系统阻抗突变引起的相位偏移无法仅由 U 或 I 幅值单独表达，因此功率特征对故障辨识具有补充作用。随后，研究采用训练集统计量进行 Z-Score 标准化以避免数据泄漏，并依据两阶段任务分别进行层级标签编码；针对实际样本类别不均衡问题，利用加权随机采样提高少数类在训练中的参与概率。这一部分的结论是，多物理量联合建模与规范化预处理为后续深层特征提取奠定了基础。

在“MS-CNN 模块”部分，研究针对配电网故障同时具有高频暂态与低频稳态畸变的跨尺度特性，设计了由 3、7、11 三种卷积核并联构成的多尺度卷积主干。小卷积核侧重捕获高频突变与瞬态冲击，大卷积核侧重提取全局波形轮廓与低频趋势。各分支引入残差块（Residual Block，残差结构）以改善深层训练中的梯度传播，分支输出再在通道维拼接并经 1 × 1 卷积融合。该部分通过结构设计说明，多尺度并行卷积能够较好地实现复杂故障信号频率成分的同步解耦，为弱故障识别提供更丰富的表征。

在“空间注意力：SimAM 注意力”部分，论文指出深层卷积网络在处理弱故障时容易平滑掉高频细节，且背景噪声可能被误放大。为避免 SE-Net 或 CBAM 等参数化注意力带来的额外复杂度与过拟合风险，研究引入 SimAM。该模块从神经科学中的空间抑制思想出发，根据特征图统计属性直接计算三维注意力权重，通过能量函数衡量每个采样点相对周围分布的“奇异性”，再经 Sigmoid 激活生成权重，对原始特征图进行逐元素增强或抑制。研究还将 SimAM 嵌入到每个多尺度残差块的核心路径中，位于第二个 Batch Normalization 层之后、残差相加之前，以确保只细调残差映射而不破坏恒等分支。该部分结论是，SimAM 在不增加额外参数负担的情况下增强了暂态奇异点检测与弱故障保真能力。

在“时间注意力：Transformer 编码器”部分，研究人员指出，即使引入 SimAM，卷积网络本质上仍局限于局部感受野，难以建立故障从起始突变到稳态演化全过程的远距离时间关联。为此，模型在 CNN 输出后引入 Transformer 编码器，以时间维作为序列长度、通道维作为嵌入特征，通过多头自注意力（Multi-Head Self-Attention，MSA）机制在全时间域内建模任意时刻之间的相关性。文中强调，这一机制能够赋予故障初始瞬间与后续若干周期稳态畸变之间的跨周期关系较高权重，从而重建故障演化的完整逻辑链。此外，研究采用前馈神经网络（FFN）与 GELU 激活函数，并通过全局平均池化与 MLP 头将序列压缩为高维语义向量。该部分表明，Transformer 有效弥补了 CNN 在长程时间依赖建模方面的不足。

在“任务解耦的决策机制”部分，论文介绍了共享 MLP 投影头及其后续两条决策路径。对于阶段 1 故障分类任务，模型使用 Softmax 在特征空间中快速建立各类故障的线性决策边界，以交叉熵损失学习宏观波形差异。对于阶段 2 故障定位任务，考虑相邻节点特征高度相似，研究以原型匹配（Prototype Matching）替代传统线性分类，将每个定位类别表示为可学习原型向量，利用样本嵌入与各原型之间的欧氏距离进行判别，并通过原型损失促使同类样本聚向各自中心、异类原型彼此分离。这一部分的核心结论是，定位任务本质上被重构为几何空间中的度量学习问题，从而有效缓解了相邻节点特征混叠造成的边界模糊。

在“数据集生成与实验环境”部分，研究人员基于 MATLAB R2024b/Simulink 的 SimPowerSystems 平台构建 IEEE 33 节点辐射型配电网，系统包含 33 个节点与 37 条支路，基准电压为 12.66 kV，基准频率为 50 Hz。故障场景覆盖 37 个线路区段、4 类运行工况、4 个故障电阻水平与 4 个故障初相角，故障施加于线路中点。每个事件持续 0.1 s，采样频率为 10 kHz，最终获得 240,111 个样本，并按故障事件级别以 6:2:2 划分训练、验证与测试集，以避免窗口级数据泄漏。阶段 2 的数据集直接来源于阶段 1 划分结果中的故障样本子集。模型在 PYTORCH 框架下训练，使用 AdamW 优化器、余弦退火学习率调度、标签平滑、梯度裁剪与早停策略。该部分为后续结果可信性提供了实验基础。

在“模型训练性能分析”中，“训练收敛与稳定性分析”表明，阶段 1 在训练初期损失函数快速下降，说明 MS-CNN 主干能迅速锁定故障电流中的暂态冲击与工频畸变成分，测试准确率在第 16 个 epoch 达到 98.61%，随后损失维持在较低区间且波动很小。阶段 2 作为更困难的定位任务，其损失曲线则持续、平滑、单调下降，在第 24 个 epoch 达到 94.22% 的最佳测试准确率。论文将这种稳定优化归因于原型损失对高维空间几何关系的持续约束。该部分结论是，两阶段模型不仅具有较高精度，还具有良好的训练稳定性。

在“诊断性能的定量评估”中，阶段 1 的准确率和召回率分别为 98.61% 和 98.64%，说明其具有可靠的故障检出能力；阶段 2 在 37 类细粒度定位任务上的准确率为 94.22%。进一步的端到端级联评估显示，漏检率仅为 0.83%，最终有效定位率达到 93.62%，相比阶段 2 单独定位准确率仅下降 0.60%。这说明阶段 1 具备很高召回能力，对级联误差传播影响极小。混淆矩阵分析进一步显示，阶段 1 在四种工况下均保持高识别率，尤其单相接地召回率达到 99.7%；阶段 2 的误差主要集中于电气距离极短的相邻线路之间，但未出现大范围跨区域误判。利用 t-SNE 对高维语义特征可视化后，阶段 1 不同故障类型形成清晰聚类，阶段 2 的 37 个线路区段亦表现出良好簇结构，原型向量充当了紧凑的类别中心。这一系列结果共同证明，该方法在特征空间组织与精细判别方面表现突出。

在“对比实验分析”中，研究选取 SVM、1D-CNN、LSTM、OS-CNN、LSTM-DenseNet、HHT-CNN 与 ResBlock-CBAM-CNN 等七种主流基准模型比较。结果表明，多数模型在阶段 1 分类任务上均可达到 96% 以上准确率，但在阶段 2 定位任务上普遍出现明显性能瓶颈。例如，1D-CNN 从 96.82% 的分类准确率降至 53.79% 的定位准确率，LSTM 也仅达到 65.68%。混合架构虽然有所改善，但所提方法仍在两阶段均取得最高精度，阶段 2 较 HHT-CNN 提高 1.52%，较 ResBlock-CBAM-CNN 提高 0.63%。论文据此认为，其优势来自 SimAM 在信号保真方面优于 CBAM、Transformer 在长序列建模方面优于循环结构、原型网络在特征空间几何优化方面优于传统 Softmax 决策。

在“跨场景泛化验证”中，研究进一步在结构不同的 10 kV 配电网上进行实验。该网络由 7 个节点、7 个线路区段和 4 条馈线构成，故障设置与 IEEE 33 节点系统保持可比。结果显示，模型在该网络上的阶段 1 与阶段 2 准确率分别为 96.23% 和 93.19%，最终有效定位率为 91.85%，误跳闸率为 3.82%，漏检率为 1.56%。尽管相较 IEEE 33 节点网络略有下降，但整体仍保持较高诊断性能，说明所提框架对不同拓扑具有较好的泛化能力。

在“消融实验”中，研究聚焦更具挑战性的阶段 2 故障定位任务，以单尺度 Backbone 作为基准，逐步叠加多尺度模块、SimAM、Transformer 和原型网络，构建五种变体。结果显示，各核心模块均对性能提升有正贡献：加入多尺度卷积后，准确率较基准模型提升 1.93%；加入 SimAM 后，精确率进一步提升至 92.05%；加入 Transformer 后，准确率再提高 3.43% 至 93.95%，显示全局时间建模带来最显著增益；最终引入原型网络后，F1-Score 达到 93.94%，实现总体最优定位性能。论文还对 P、Q 功率特征进行了特征消融，结果显示引入 P 和 Q 后，阶段 1 准确率从 94.57% 提升至 98.61%，阶段 2 从 92.15% 提升至 94.22%，最终有效定位率从 87.54% 增至 93.62%，漏检率由 4.62% 大幅降至 0.83%。这些结果证明了功率特征对于补充相位关系信息的重要作用。

在“噪声鲁棒性实验”中，论文向预处理阶段分别注入高斯白噪声、脉冲噪声、测量误差、传感器丢失与通信延迟五类干扰，并在 35 dB 至 5 dB 的七个 SNR 水平上测试性能。结果表明，在所有噪声类型下，即便 SNR 降至 5 dB，阶段 1 分类准确率仍保持在 82% 以上；阶段 2 定位则下降更明显，在 5 dB 时约为 60%—67%。论文认为，这是因为定位更依赖细粒度波形细节，而分类主要依赖整体形态。在低 SNR 下，传感器丢失场景表现出最高鲁棒性，说明多通道输入带来的冗余有助于缓解单通道信息缺失。尽管在极低信噪比下性能有所退化，但模型表现为平滑退化而非灾难性失效，并在 SNR ≥ 15 dB 时仍维持较高实际可用性。

讨论部分集中体现出该研究对配电网故障诊断任务结构的重新理解。论文通过实验表明，故障分类与故障定位虽然共享底层特征，但其判别难度与最优决策机制并不相同：前者更依赖宏观波形形态差异，后者则更依赖高维特征空间内相邻类别之间的几何可分性。因此，两阶段解耦策略比单一端到端分类更适合配电网细粒度诊断场景。另一方面，研究还说明，多尺度卷积、无参数空间注意力和全局时间建模并非相互替代，而是分别对应不同层面的信息提取需求：MS-CNN 负责跨尺度频率成分解耦，SimAM 负责弱故障显著性增强，Transformer 负责故障演化逻辑建模；原型网络则在此基础上完成几何结构优化。综合来看，论文的讨论并未脱离实验事实，而是围绕“弱特征—复杂背景—相邻混叠”这一主线论证各模块的必要性。

研究结论部分可译为：针对配电网中故障特征提取困难以及相邻节点定位精度低的问题，研究提出了一种基于多尺度卷积神经网络（MS-CNN）与时空双重注意力的两阶段故障诊断框架。该研究构建了融合 SimAM 空间筛选与 Transformer 时间序列建模的“时空”双重注意力协同增强机制，弥补了单一卷积网络在多维特征捕获方面的局限。在故障定位阶段的决策层，研究采用基于原型的度量学习策略替代传统 Softmax 分类，通过最小化到原型的欧氏距离优化特征空间几何结构，提高分类精度，并构建具有安全间隔的分类边界，从而有效突破故障定位瓶颈。实验结果表明，所提方法在故障分类和故障定位上的准确率分别达到 98.61% 和 94.22%，显著降低了相邻节点电气距离相近所导致的误判。基于 10 kV 配电网的跨场景验证进一步证实了该方法在不同拓扑下的泛化能力。此外，在 SNR ≥ 15 dB 条件下，模型仍保持可靠诊断性能，并在极低信噪比条件下表现出平滑退化特性。

联系信箱：

粤ICP备09063491号

热点排行