基于改进1DCNN-Transformer的滚动轴承故障诊断方法

首页今日动态人才市场新技术专栏中国科学人云展台
BioHot
云讲堂直播会展中心特价专栏技术快讯免费试用

生物通官微
陪你抓住生命科技
跳动的脉搏

生物通首页 > 今日动态 > 正文

《Machines》：Rolling Bearing Fault Diagnosis Method Based on an Improved 1DCNN-Transformer

【字体：大中小】 时间：2026年06月10日 来源：Machines 2.5

编辑推荐：

　　针对滚动轴承在复杂工况下故障类型多样、特征提取困难且易受噪声干扰的问题，研究人员提出一种基于改进的一维卷积神经网络（one-dimensional convolutional neural network, 1DCNN）与Transformer架构融合的故障诊

针对滚动轴承在复杂工况下故障类型多样、特征提取困难且易受噪声干扰的问题，研究人员提出一种基于改进的一维卷积神经网络（one-dimensional convolutional neural network, 1DCNN）与Transformer架构融合的故障诊断方法。该方法利用1DCNN高效提取振动信号中的局部冲击和能量特征，同时通过改进Transformer对长程时序依赖进行全局建模，从而显著提升多类故障信号的识别准确率和模型的泛化能力。实验数据来源于凯斯西储大学（Case Western Reserve University, CWRU）轴承故障数据集，将多通道振动信号进行预处理和均衡采样，并系统引入多种模拟噪声，以全面验证所提模型的噪声鲁棒性。在公开数据集上的实验结果表明，改进后的1DCNN-Transformer模型分类准确率达到99.43%，显著优于人工神经网络（Artificial Neural Network, ANN）、卷积神经网络（convolutional neural network, CNN）、LeNet和支持向量机（Support Vector Machine, SVM）等传统方法。进一步的t-分布随机邻域嵌入（t-distributed Stochastic Neighbor Embedding, t-SNE）可视化与混淆矩阵分析揭示了该方法在多种故障类别上的优异特征区分性和高精度性能。在强噪声条件下的测试也表明该模型具有高鲁棒性和良好的工程应用潜力。综上所述，所提方法为复杂环境下滚动轴承的智能故障诊断提供了高效可靠的解决方案，并为未来的模型开发和工业部署奠定了坚实基础。

滚动轴承作为旋转机械的关键部件，在支撑转动元件、传递系统载荷和保障设备平稳运行中发挥核心作用。然而，在复杂多变的实际工况下，轴承常承受非均匀载荷、变载工况和冲击振动，极易出现点蚀、磨损、裂纹等多种故障。一旦发生故障，不仅会扰乱机械系统正常运行、降低生产效率，还可能引发重大经济损失甚至安全事故。现有主流故障诊断方法可分为基于振动分析的传统方法和数据驱动方法两大类。传统振动信号分析（如时频分析、波形分析、包络谱分析等）严重依赖人工特征设计和专家经验，存在主观性强、泛化能力有限的问题。数据驱动的智能诊断方法（如支持向量机（SVM）、随机森林（RF）、人工神经网络（ANN）等）虽减少了人工干预，但特征提取仍依赖手工设计，难以充分捕捉故障间的细微差异。近年来，深度学习因其端到端自动特征提取和非线性映射能力而被广泛研究，但现有方法仍存在若干共性局限：多数模型对实际环境中的噪声干扰和工况变化适应性不足；许多方法侧重于局部网络优化，难以融合局部敏感特征与深层全局时序依赖；部分模型依赖预训练、后验特征选择或图像处理范式，导致关键时序信息丢失；此外，在极端小样本、类别不平衡或跨设备迁移场景下泛化能力有限。针对上述问题，研究人员提出一种融合改进一维卷积神经网络（1DCNN）与Transformer的混合模型，该模型充分利用卷积对振动信号中短时瞬态和包络调制模式的敏感性，以及Transformer对长时间跨步长依赖的全局建模能力。实验基于CWRU和西安交通大学-悉尼科技大学（XJTU-SY）轴承数据集开展，结果表明改进模型在分类精度、噪声鲁棒性和泛化能力上均显著优于传统方法，为复杂环境下滚动轴承智能故障诊断提供了高效可靠的解决方案。该论文发表在《Machines》。

研究人员为开展研究采用了以下几项关键技术与方法：首先，构建了改进1DCNN-Transformer混合架构，前端堆叠三层步长卷积（卷积核尺寸依次为32、16、8）实现局部特征提取和16倍下采样；后端采用单头预层归一化Transformer编码器（两层）进行全局依赖建模，通过正弦位置编码保留时序周期性信息。模型输出端使用时间维度全局平均池化（GAP）聚合特征，并采用加权交叉熵损失函数缓解类别不平衡。数据来源为凯斯西储大学（CWRU）轴承数据集（采样率12 kHz，含驱动端和风扇端信号，故障类型包括内圈、外圈和滚动体故障，每种故障三种损伤尺寸）以及XJTU-SY轴承数据集（三种工况：35Hz 12 kN、37.5Hz 11 kN、40Hz 10 kN）。预处理包括：六阶无限脉冲响应（IIR）带通滤波（500-6000 Hz）、滑窗分割（窗口长度1024，步长512）、均衡采样（对少数类进行上采样并添加标准差0.01倍的高斯噪声增强），以及训练过程中同时施加高斯白噪声（信噪比12 dB）、脉冲噪声（发生概率0.45，最大幅度1.5倍标准差）和调幅噪声（调制频率0.05，调制幅度0.25）以模拟复杂环境。

研究结果按照原文小标题组织如下：

3.1 数据集预处理：通过文件级划分后再进行独立滑窗分割，确保训练、验证和测试样本完全独立。采用均衡采样策略（min模式和target模式）解决类别不平衡，仅对训练集进行上采样和噪声增强，验证集和测试集不进行增强，从根本上避免信息泄露。

3.2 分析过程与结果：在CWRU数据集上，该模型经40个训练周期后，训练集和验证集准确率在第7周期基本收敛至0.98以上，最终测试集准确率为99.43%，损失函数稳定在较低水平。注意力图显示第一层Transformer编码器对特定特征区间高度关注（带状结构），第二层分布更均匀，表明模型实现了从局部到全局的层次化特征集成。混淆矩阵分析显示，除OR007和OR014各有1个样本误分类外，其余8个类别均实现100%正确分类，总正确样本358/360。t-SNE可视化表明，原始信号在高维空间严重重叠，而模型提取的特征显著增强了类间分离度和类内紧致性，有效提升了分类可分性。

3.3 比较与讨论：与ANN（91.14%）、LeNet（91.71%）、SVM（92.01%）、CNN（94.29%）相比，改进1DCNN-Transformer准确率最高（99.43%）。不同信噪比（SNR）测试表明：在SNR=12 dB时几乎无误分类，随着SNR降低至10 dB、8 dB、6 dB，模型仍保持高准确率，仅在B021和OR021等类别出现有限混淆；即使在4 dB强噪声下，混淆矩阵仍呈现清晰对角分布。讨论中指出，高斯白噪声、脉冲噪声和调幅噪声仍为理想化合成噪声，与实际工业环境中的非平稳噪声存在差距，未来需采用真实工业数据进一步验证。

3.4 泛化分析：在XJTU-SY数据集上，改进1DCNN-Transformer准确率达98.33%，显著高于ANN（87.57%）、LeNet（89.24%）、CNN（92.75%）、SVM（88.32%），验证了模型对不同工作条件的适应性和鲁棒性。

3.5 消融分析：卷积层数从1层增至3层时准确率从97.86%升至99.43%；卷积核宽度从[3,3,3]增至[32,16,8]时准确率从97.14%升至99.43%；输入窗口长度从256增至1024时准确率从68.86%升至99.43%（256和512时分别为68.86%和93.71%）；Transformer编码器层数从1层增至2层时准确率从97.58%升至99.43%，但增至3层时略降至99.17%。以上表明合理增加网络深度、扩大感受野和输入长度有利于提升性能，但存在饱和效应，两层Transformer为最优选择。

3.6 推理效率与整体性能对比：单样本推理时间：ANN为1.42 ms，CNN为1.12 ms，LeNet为1.36 ms，SVM为32.41 ms，改进模型为3.78 ms（每秒处理264.4个样本）。改进模型在满足实时性要求（远低于工业在线监测需求）的同时实现了最高分类精度，展现了良好的工业部署潜力。

在讨论部分，研究分析了主要发现：改进模型通过1DCNN提取局部瞬态特征，并通过Transformer自注意力机制捕获跨周期全局依赖，能够从物理上区分内圈和外圈故障引起的不同冲击周期，从而显著提升诊断精度。同时，消融实验揭示了关键超参数对性能的影响规律，为模型调优提供了理论指导。然而，当前噪声模拟为理想化合成噪声，与实际工业环境的非平稳复杂噪声存在差距；未来工作将考虑多源信息融合和自适应变工况操作，以促进该方法在真实工业环境中的应用。研究结论翻译如下：

4. 结论

为了解决滚动轴承故障诊断中多类识别、严重噪声干扰和特征提取能力不足的挑战，提出了一种基于改进1DCNN-Transformer架构的新型故障诊断方法。该方法有效集成了一维卷积的局部特征提取能力和Transformer的全局建模能力，显著提升了复杂工况下信号的区分能力。本研究的主要结论如下：（1）实验结果表明，改进1DCNN-Transformer模型在分类准确率和混淆矩阵分布上显著优于人工神经网络（ANN）、LeNet、卷积神经网络（CNN）和支持向量机（SVM）等主流方法，分类准确率达到99.43%。鲁棒性和泛化测试表明，该方法在不同信噪比（SNR）条件下均能保持高准确率。（2）与主流方法相比，改进1DCNN-Transformer模型具有更优的分类准确率和特征区分能力，并表现出优异的鲁棒性和泛化性能。即使在不同SNR的噪声环境下，该模型始终提供高识别准确率。模型能够准确区分多个故障类别和高相似度类别。凭借其轻量化架构和高效推理速度，该方法非常适合工业场景部署，为滚动轴承及其他复杂机械系统的智能故障诊断提供了有效可靠的解决方案，并展现出更广泛的应用潜力。未来工作将考虑模型框架的进一步扩展，以应对多源信息融合和变工况自适应操作，推动其在实际工业环境中的应用和推广。

联系信箱：

粤ICP备09063491号

热点排行