
-
生物通官微
陪你抓住生命科技
跳动的脉搏
可解释的机器学习驱动的心力衰竭生物标志物识别:一种结合SHAP解释性的多模型特征选择方法
《Scientific Reports》:Explainable machine learning-driven identification of heart failure biomarkers: a multi-model feature selection approach with SHAP-based interpretability
【字体: 大 中 小 】 时间:2026年05月27日 来源:Scientific Reports 3.9
编辑推荐:
摘要心力衰竭(HF)由于其复杂的病理生理学机制以及现有生物标志物的局限性,仍然是一个重大的临床挑战。在这项研究中,我们开发了一个强大的机器学习(ML)框架,用于识别心力衰竭的新转录组特征。我们整合并协调了三个GEO RNA-seq数据集(GSE141910、GSE198945、G
心力衰竭(HF)由于其复杂的病理生理学机制以及现有生物标志物的局限性,仍然是一个重大的临床挑战。在这项研究中,我们开发了一个强大的机器学习(ML)框架,用于识别心力衰竭的新转录组特征。我们整合并协调了三个GEO RNA-seq数据集(GSE141910、GSE198945、GSE263297),并采用“分割训练-测试”策略(70%用于训练,30%用于测试)。我们采用了三阶段特征选择方法——结合了LASSO、随机森林(RF)和SVM-RFE)来识别候选基因。通过留一法交叉验证(LOSO-CV)评估了10个模型的集成系统,并通过SHAP值进行解释。研究结果使用独立的外部队列(GSE135055)和本地临床队列中的实验RT-qPCR进行了验证。三个潜在的生物标志物——FNDC1、LPCAT3和TIMP2——被优先考虑。在心力衰竭组织中,FNDC1和TIMP2显著上调(p < 0.001),这一模式通过qPCR得到了一致验证。机器学习模型表现出高度的诊断稳定性,LOSO-CV AUC峰值达到0.973,并在外部验证中保持了稳健性(AUC高达0.876)。SHAP分析表明FNDC1是最有影响力的预测因子。功能富集将这些特征与细胞外基质重塑和脂质代谢联系起来。这些发现表明,FNDC1、LPCAT3和TIMP2可能作为与心力衰竭病理机制相关的潜在生物标志物。