《Electronics》:Causal-Driven Severity Grading for Myocardial Ischemia Diagnosis Based on Magnetocardiography
编辑推荐:
心肌缺血不仅是全球主要的健康负担,也是全球心血管疾病发病率和死亡率的首要 contributor 之一。冠状动脉狭窄和心脑供血不足容易引发心肌缺血,并进一步导致心肌梗死、室性心律失常等严重心血管并发症。随着医疗技术和人工智能的持续进步,心肌缺血早期识别现已成为
心肌缺血不仅是全球主要的健康负担,也是全球心血管疾病发病率和死亡率的首要 contributor 之一。冠状动脉狭窄和心脑供血不足容易引发心肌缺血,并进一步导致心肌梗死、室性心律失常等严重心血管并发症。随着医疗技术和人工智能的持续进步,心肌缺血早期识别现已成为可能。例如,借助心脏计算机断层扫描(Computed Tomography, CT)或冠状动脉造影(Coronary Angiography, CAG)可检测该疾病,但前者存在辐射暴露风险,后者属于有创检查。心磁图(Magnetocardiography, MCG)作为一种无创、非接触、高灵敏度的心脏电生理学评估方法,已引起广泛关注。既往研究表明,MCG 能够识别心肌电活动产生的磁场细微变化。在临床实践中,经验丰富的心血管医师通过分析心脏磁场的时空模式来检测与心肌缺血相关的电生理异常。
近年来,由于 MCG 的诊断潜力,机器学习和深度学习技术在自动化心肌缺血诊断中的应用研究日益增多。然而,现有方法大多侧重于学习 MCG 衍生特征与诊断标签之间的统计关联,却忽视了电生理模式与缺血严重度之间的潜在因果联系。尽管多模态学习通过整合异构临床数据推动了医学人工智能的发展,但这些以图像为中心的模型存在固有的融合局限性,无法兼容 MCG 的单模态时序特征。同样,因果推断在降低医学影像中的伪相关方面已显示出巨大潜力,但针对心磁图等电生理信号的多模态因果框架在很大程度上仍未被探索。这些方法无法揭示心肌缺血与 MCG 电生理特征之间的因果关系,也无法缓解多模态融合中的混淆偏倚和伪相关,这严重限制了模型在真实临床环境中的鲁棒性和泛化能力。
本研究旨在利用这些关键特征(附录表 A1)引导模型从 MCG 图像中提取判别性表征。然而,由于两类特征均来源于同一数据源,当采用简单的拼接融合方法时,其特征表征在模型训练过程中可能导致两种截然不同的学习行为:一是特征间的互补特性,即"因果互补性";另一是可能引入冗余干扰特征,即"同质冗余性"。受此启发,研究人员提出了因果驱动的特征提取模块,使模型能够聚焦于与病理特征相关的核心特征。
本研究中,研究人员提出了一种因果驱动的多模态深度学习框架,以提升心肌缺血严重度分级辅助诊断算法的性能。通过因果图分析,识别并整合了两种混淆变量。利用反事实因果干预(counterfactual causal intervention)和前门干预(front-door intervention),该方法能够缓解冗余引起的干扰并强化因果互补性。本文的主要贡献包括:(1) 据研究人员所知,这是首次尝试利用深度学习基于 MCG 对健康个体、轻度缺血和重度缺血进行分级诊断;(2) 提出了一个因果驱动的多模态数据融合深度学习范式,包含两个因果模块:跨模态融合干预和潜在视觉干预。这些模块基于因果干预技术通过 do-操作构建,以实现去混淆推理。
本研究基于心磁图图像特征和关键特征工程特征,提出了一种因果驱动的多模态数据融合框架,旨在解决心肌缺血严重度分级中的关键挑战。研究背景源于心肌缺血作为全球重大健康问题的严峻形势,以及现有诊断方法在无创性和精准性方面的不足。心磁图技术虽具备无创、高灵敏度的优势,但其复杂的时空动态特性使得单一模式难以充分表征缺血严重度,而传统多模态融合方法又易陷入统计关联而非因果关系的局限,导致模型在临床实际应用中的鲁棒性和泛化能力受限。
研究人员开展了以下研究工作:首先,构建了一个包含 500 例标注样本和 1000 例未标注样本的私有数据集,样本来源于苏州心磁图有限公司,采用 9 通道超导心磁图仪采集,经冠状动脉造影确诊并由三位认证心血管医师共识分级为健康(<10% 管腔狭窄)、轻度缺血(10-50% 狭窄)和重度缺血(>50% 狭窄、左主干病变或三支病变)。其次,设计了包含特征归一化模块、因果驱动特征提取模块和分类器的完整框架;其中特征归一化模块采用 3D-CNN 编码 16×16×100 的时空 MCG 张量,并对 20 维关键工程特征进行特定预处理(Z-score 标准化、Min-Max 归一化、对数变换等);核心的因果驱动特征提取模块包含两个子模块,即视觉混淆变量前门干预(Visual Confounder Front-door Intervention, VCFI)和跨模态融合反事实干预(Cross-Modal Fusion Counterfactual Intervention, MFCI)。最终通过多层感知机(Multi-Layer Perceptron, MLP)分类器输出缺血严重度分级。
研究得出的主要结论包括:该因果驱动框架在三类分级任务中取得了超过 0.87 的平均准确率,敏感性、特异性和平均 F1-分数分别达到 0.87、0.87 和 0.92;消融实验表明,单独使用 VCFI 模块可将 3DCNN 的准确率从 0.75 提升至 0.83,完整框架(VCFI+MFCI)达到最优的 0.87;t-SNE 可视化显示因果干预后三类样本呈现紧致、良好分离的流形结构;Grad-CAM 注意力热图证实模型能集中关注与心肌缺血病理生理直接相关的关键磁极特征区域。该研究的重要意义在于首次将深度学习的多模态因果推断框架应用于 MCG 心肌缺血分级诊断,为开发更可靠、可解释且具临床价值的人工智能辅助心脏疾病诊断方法奠定了技术基础。该论文发表于《Electronics》。
主要关键技术方法包括:采用 3D-CNN 作为时空视觉编码器提取 MCG 时空动态特征;基于自监督深度聚类构建视觉语义原型空间,通过对比学习优化语义原型集合;运用前门调整(front-door adjustment)策略,以语义映射模块为中介变量阻断潜在视觉混淆变量;设计跨模态反事实干预,通过时间打乱和随机翻转生成反事实视觉样本,结合交叉注意力机制进行特征对齐,并以对比学习最大化真实样本与反事实样本的相似度差异;采用交叉熵损失与对比损失的加权和作为总体优化目标,权重系数 λ 经敏感性分析设为 0.5;实现两阶段训练策略,先单独训练特征提取模块 20 轮,再联合优化因果驱动特征提取模块 80 轮,使用 AdamW 优化器配合余弦退火学习率调度。
研究结果部分按照以下结构展开:
**与先进方法的比较**:研究人员将所提方法与现有基于 MCG 的心肌缺血辅助诊断最先进模型进行对比。实验结果显示,在私有数据集上,所提方法在主要分级诊断评估指标上均优于现有方法,平均准确率超过 0.87,敏感性、特异性和平均 F1-分数分别为 0.87、0.87 和 0.92。对五折患者级别交叉验证的每折准确率进行配对 t 检验,与最优基线 MCG-NET 相比具有统计学改善趋势(p 值分别为 0.0011 和 0.0030)。平均混淆矩阵显示重度缺血与健康类别之间极少误分类;在独立外部队列(中心 B)的零样本评估中,模型保持了与内部验证结果相似的判别模式。
**消融实验**:该部分系统评估了不同主干网络(U-net 和 3DCNN)、不同特征融合技术(Concat 和 所提方法)以及关键特征添加的影响。结果表明,简单拼接仅比单独主干网络带来轻微提升(U-Net 准确率从 0.71 至 0.72,3DCNN 从 0.71 至 0.75),表明朴素特征拼接引入了同质冗余;仅使用 VCFI 模块时准确率提升至 0.77(U-Net)和 0.83(3DCNN),证明前门调整有效抑制了潜在视觉混淆变量;完整设计(VCFI+MFCI)以 0.87 的准确率提供最佳性能,验证了各模块的增量贡献和有效性。
**可视化与定性分析**:通过 t-SNE 对高维 MCG 特征嵌入进行二维投影,发现自监督聚类初步实现了类别中心聚合,但橙色点与绿色点簇之间存在重叠,反映了缺血严重度的临床连续性;因果干预后三类呈现紧致、分离良好的流形结构,表明模型有效区分了干扰变化与病理生理显著特征。Grad-CAM 可视化显示,相较于基线模型的弥散激活模式,所提模型在心肌缺血相关区域表现出更集中的注意力,证明因果干预模块成功降低了混淆变量的影响,促进了更具临床意义和判别性的表征学习。
讨论部分,研究人员指出该框架整体准确率达 87%,为因果干预改善跨模态因果互补性提供了经验证据。但同时承认数据集规模限制了模型在更广泛真实临床人群中的应用,模型架构仍有改进空间,现有 3D-CNN 主干在捕获超长时序相关性方面存在局限。未来研究方向包括:(1) 整合先进的状态空间模型(如 Mamba)以增强长序列心磁图数据的表征和建模能力;(2) 将所提框架扩展至纵向心磁图监测任务,以实现心肌缺血进展和演变的连续跟踪。总体而言,该研究为开发更可靠、可解释且具临床价值的人工智能辅助心脏疾病诊断方法奠定了技术基础。
结论部分:本工作中,研究人员提出了一种新颖的基于心磁图辅助心肌缺血分级诊断的因果驱动多模态融合框架。该框架旨在利用特征工程提取的关键特征引导心磁图图像特征的深度学习。通过运用因果干预的相关理论和方法,缓解了多模态融合中产生的"同质冗余"问题,并 leveraging 因果互补性。未来工作中,研究人员计划将该框架扩展至更大规模的多中心临床数据集,并探索整合更先进的因果推断策略,以提升临床辅助诊断中的可解释性和泛化能力。