今日动态 返回首页
会员注册 登录 生物通快讯免费订阅
  • 首页 今日动态 人才市场 新技术专栏 中国科学人 云展台
    BioHot
    • 定制我的BioHot
    • 进入我的BioHot
    • 进入我的集采
    • 肿瘤癌症研究
    • 免疫/基因/细胞疗法
    • 神经生物学
    • 健康与疾病
    • 衰老机制与长寿
    • 单细胞技术
    • 基因编辑-CRISPR
    • RNA研究
    • 肠道菌与人体微生态
    • 细胞代谢
    • AI生物信息学
    • COVID
    云讲堂直播 会展中心 特价专栏 技术快讯 免费试用

  • 生物通官微
    陪你抓住生命科技
    跳动的脉搏

生物通首页  >  今日动态  >  正文

考虑缺失数据的机器学习预测方法:针对ST段抬高型心肌梗死患者,在初次经皮冠状动脉介入治疗后院内发生重大不良心血管事件的情况

《Scientific Reports》:Missing-data–aware machine learning prediction of in-hospital major adverse cardiovascular events after primary percutaneous coronary intervention for ST-segment elevation myocardial infarction

【字体: 大 中 小 】 时间:2026年06月03日 来源:Scientific Reports 3.9

编辑推荐:

  摘要机器学习(ML)为改善ST段抬高型心肌梗死(STEMI)后的预后提供了机会,但现实世界中的登记数据往往存在不完整性,对缺失数据的处理不当可能会降低模型的性能。我们回顾性地评估了659名在住院期间接受经皮冠状动脉介入治疗(PCI)的STEMI患者。主要结局指标为院内重大不良心血

  

摘要

机器学习(ML)为改善ST段抬高型心肌梗死(STEMI)后的预后提供了机会,但现实世界中的登记数据往往存在不完整性,对缺失数据的处理不当可能会降低模型的性能。我们回顾性地评估了659名在住院期间接受经皮冠状动脉介入治疗(PCI)的STEMI患者。主要结局指标为院内重大不良心血管事件(MACE)。分析了80个临床、心电图、实验室、超声心动图和血管造影变量,其中某些预测因子的缺失率高达40%。我们采用了一种混合特征选择方法,结合了CatBoost特征重要性、SHAP值、方差过滤和相关性筛选来识别最具信息量的预测因子。模型通过分层5折交叉验证进行训练,比较了CatBoost中的原始缺失值处理方法与基于Transformer的插补方法(TabImpute)以及一个预训练的表格模型(TabPFN)的效果。共有282名患者(42.8%)发生了MACE。直接在数据不完整的情况下使用CatBoost训练的模型表现最佳,仅需约8-10个预测因子即可达到较好的预测效果(AUC为0.73),其平衡准确率为0.69,精确率为0.68,召回率为0.53)。基于Transformer的插补方法并未提升模型的区分能力。SHAP分析表明,PCI前的TIMI血流受阻、左心室射血分数(LVEF)降低、肌钙蛋白升高、ST段偏移度增加、炎症反应以及肾功能障碍是影响预后的主要因素。一个针对院内死亡率的加权CatBoost模型取得了极高的准确率(AUC=0.93)。这些发现支持在STEMI登记数据中使用能够处理缺失数据的ML方法进行预后预测,并强调了进行外部验证的必要性。

相关新闻
生物通微信公众号
生物通新浪微博
微信
新浪微博
我要投稿
  • 搜索
  • 国际
  • 国内
  • 人物
  • 产业
  • 热点
  • 科普

热搜:深度学习数据增强|模型校准不平衡诊断准确性|基于医疗领域对不稳定型心绞痛的研究|该方法结合了Transformer架构以平衡数据分布不均的问题。实验结果显示|在自身数据集中训练后直接推理良好的模型|但当输入数据并不完整时可能出现性能下降。引入外部数据增强技术可以缓解这一现象|但在临床应用中仍需验证有效性。该策略有助于提升医疗模型在真实场景下的泛化能力和鲁棒性。

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号