《Frontiers in Neuroscience》:Leveraging Synchrosqueezing Transform (SST)-based representations in a dual-stream attention framework to enhance sleep apnea detection and subtyping
编辑推荐:
睡眠呼吸暂停低通气综合征(SAHS)是一种普遍存在、对健康和生活质量具有深远不良影响的睡眠相关呼吸障碍,因此开发准确且易于使用的筛查工具至关重要。基于心电图(ECG)的分析因其无创性且易于部署在低成本硬件中,为SAHS筛查和初步诊断提供了一种特别便捷的方法。然
睡眠呼吸暂停低通气综合征(SAHS)是一种普遍存在、对健康和生活质量具有深远不良影响的睡眠相关呼吸障碍,因此开发准确且易于使用的筛查工具至关重要。基于心电图(ECG)的分析因其无创性且易于部署在低成本硬件中,为SAHS筛查和初步诊断提供了一种特别便捷的方法。然而,传统时频分析方法受限于海森堡不确定性原理,常无法捕捉ECG信号中细微但关键的模式,导致分辨率有限和信息损失。为克服这些限制,本研究提出了一种基于不确定性缓解时频表征的双流交叉注意力融合网络(DSCAFNet),该时频表征通过同步压缩变换(SST)生成。该框架独特地构建了两个互补的、高保真度的基于SST的表征,旨在从复杂、非平稳的SAHS动态中提供不同但协同的视角。一个专用的交叉注意力融合模块利用这些互补视图,使模型能够鉴别性地整合多分辨率特征,从而显著增强模式识别能力。在公共Apnea-ECG数据集上,DSCAFNet取得了0.9572的准确率、0.9575的灵敏度、0.9584的特异性和0.9557的F1分数,性能与现有先进方法相当。更重要的是,在私有华山-呼吸暂停(Huashan-apnea)数据集上的严格验证表明,其二分类准确率为0.9003,四分类分型准确率为0.7564,证明了其强大的有效性和泛化能力。在不同数据集上一致的结果凸显了DSCAFNet作为智能且可访问的SAHS筛查框架的前景,具有整合到便携式数据采集系统并结合云端分析的潜力。
本研究旨在从单导联心电图(ECG)信号中提取反映睡眠呼吸暂停事件的时间频率动态特征,并提出了一种基于同步压缩时频融合的双流交叉注意力融合网络(DSCAFNet)。睡眠呼吸暂停低通气综合征(SAHS)是一种常见的睡眠相关呼吸障碍,全球影响超过十亿人,其准确诊断和分类至关重要,因为该综合征主要分为阻塞性睡眠呼吸暂停(OSA)、中枢性睡眠呼吸暂停(CSA)、混合性睡眠呼吸暂停(MSA)和低通气(HYP)。不同亚型具有不同的病理生理机制和健康风险,准确的亚型分类是制定个性化诊断和治疗干预措施的前提。目前,多导联睡眠图(PSG)仍是诊断的金标准,但其过程复杂、成本高且依赖人工评分,限制了其在社区和家庭环境中的可及性。基于单导联ECG的自动检测方法因此具有重要的临床和社会价值。研究显示,呼吸暂停事件会引起自主神经系统波动和心脏电生理异常,这些变化反映在ECG信号中,如R-R间期(RRI)、心率变异性(HRV)和QRS波群形态的改变。早期研究主要从一维(1D)ECG信号中提取手工特征,如HRV或频域分析,并输入传统机器学习分类器。近年来,研究开始使用端到端深度学习网络从1D信号中直接学习判别特征。然而,1D信号固有地难以充分捕捉SA期间ECG复杂的非平稳和时变特征。为捕捉更全面的动态特征,一些研究利用时频分析(TFA)结合二维卷积神经网络(2D-CNNs)进行分类。为提高TFA的分辨率,引入了同步压缩变换(SST)这一高级后处理技术,它通过将时频谱中的模糊能量压缩到信号真实瞬时频率上,生成更尖锐和集中的时频图。尽管基于TFA的方法取得了显著进展,但仍存在两个主要局限:一是多数研究集中于二分类(呼吸暂停 vs. 正常),而对特定呼吸暂停亚型(如OSA、CSA、MSA)的多分类探索不足;二是大多数方法仅依赖单一类型的时频变换(如仅CWT或STFT),可能无法充分捕捉不同呼吸暂停事件的多样特征。如图1所示,原始ECG信号及其对应的同步压缩短时傅里叶变换(SST-STFT)和同步压缩连续小波变换(SST-CWT)频谱图显示,不同呼吸暂停类型具有独特的频谱和瞬态模式。单一表征可能无法提取深层判别特征。因此,有效融合多种高分辨率时频表征以最大化提取判别特征成为一个关键研究问题。为此,本文提出了DSCAFNet,其核心在于协同利用同步压缩时频表征(SST增强的CWT和STFT)与带有交叉注意力融合的双流架构,实现互补且语义层面的特征学习。主要贡献包括:1)验证了SST在锐化传统CWT和STFT时频表征方面的有效性,通过捕捉呼吸暂停事件固有的细粒度振荡动态,这些增强的表征提高了对阻塞性、中枢性和混合性睡眠呼吸暂停亚型的可区分性;2)提出了一种双流深度学习框架,并行处理时频表征以捕捉不同变换固有的互补时频特征,并引入交叉注意力融合模块在深层语义级别整合异构时频线索;3)在公共Apnea-ECG数据集和私有华山-呼吸暂停数据集上进行了全面评估,模型在二分类(SA/正常)和多分类(OSA/CSA/MSA/HYP)任务中均表现优异,证明了其有效性和泛化能力。
在模型构建上,DSCAFNet包含三个主要模块:双流特征提取模块(DSFEM)、交叉注意力融合模块(CAFM)和分类器。DSFEM使用基于残差卷积的独立骨干网络,并行处理SST-CWT和SST-STFT生成的时间频率图,提取空间特征图。CAFM将二维特征图转换为一维令牌序列,通过双向多头交叉注意力机制让两个特征流进行细粒度的信息交换和相互增强,克服简单拼接或相加融合的不足。最后,增强的特征序列通过全局平均池化和线性层进行分类。实验使用Apnea-ECG数据集(70例受试者,二分类标签)和私有华山-呼吸暂停数据集(133例受试者,包含OSA、CSA、MSA、HYP四类标签)。ECG信号经带通滤波、分段、重采样至100Hz,并采用SpecAugment进行数据增强。评估采用受试者独立的五折交叉验证,使用准确率、灵敏度、特异性和F1分数等指标。
研究结果显示,在Apnea-ECG数据集的二分类任务中,DSCAFNet取得0.9572的准确率、0.9575的灵敏度、0.9584的特异性和0.9557的F1分数,达到最先进水平。在华山-呼吸暂停数据集上,二分类准确率为0.9003,四分类分型准确率为0.7564,F1分数为0.7497。消融实验表明,SST处理能提升CWT和STFT的表征性能,而将两种SST增强表征融合能带来显著性能跃升。对比不同融合策略,提出的CAFM在分类性能上优于简单拼接和通道门控机制。与近期其他方法比较,DSCAFNet在公共数据集上整体性能更优,在私有数据集上也优于基线模型(如VGG16、ResNet18)。可视化分析显示,模型能关注与不同呼吸暂停亚型生理差异相符的有判别性的时频区域,支持其可解释性。计算复杂度分析表明模型约含2800万参数,单次推理时间约13.3毫秒。
讨论部分指出,DSCAFNet通过双流架构和交叉注意力机制,有效融合了SST增强的互补时频表征,显著提升了特征提取和分类能力,尤其在需要区分细微差别的多分类任务中优势明显。研究局限包括华山-呼吸暂停数据集存在显著的性别不平衡,可能引入偏差。结论部分总结,本研究引入的DSCAFNet利用同步压缩变换(SST)提高时频分辨率,并融合SST增强的连续小波变换(SST-CWT)和短时傅里叶变换(SST-STFT)表征的互补信息。在公共Apnea-ECG数据集上,DSCAFNet在二分类中达到0.957的准确率和0.956的F1分数;在私有华山-呼吸暂停数据集上,分别达到0.900的二分类准确率和0.756的四分类准确率。结果表明,SST增强与双流融合的结合能有效捕捉与睡眠呼吸暂停相关的非平稳动态特征,显著提高了检测和分类性能。这项工作为利用可穿戴ECG技术进行低成本睡眠呼吸暂停筛查提供了可行路径。