
-
生物通官微
陪你抓住生命科技
跳动的脉搏
利用机器学习和SHAP解释技术,通过膳食抗氧化剂来预测冠心病与糖尿病的共病风险
《Scientific Reports》:Machine learning and SHAP interpretation for predicting coronary heart disease-diabetes comorbidity with dietary antioxidants
【字体: 大 中 小 】 时间:2026年05月31日 来源:Scientific Reports 3.9
编辑推荐:
摘要冠心病(CHD)和糖尿病(DM)常常通过氧化应激和炎症等共同机制同时发生。特定的膳食抗氧化剂是否能够减轻这两种疾病的共病情况仍不清楚。利用2005–2018年全国健康与营养调查(NHANES)的数据(n = 9,279),我们开发了一种可解释的机器学习方法,该方法在十折交叉验
冠心病(CHD)和糖尿病(DM)常常通过氧化应激和炎症等共同机制同时发生。特定的膳食抗氧化剂是否能够减轻这两种疾病的共病情况仍不清楚。利用2005–2018年全国健康与营养调查(NHANES)的数据(n = 9,279),我们开发了一种可解释的机器学习方法,该方法在十折交叉验证的每个折叠中嵌入了标准化处理和合成少数样本过采样技术(SMOTE)以防止数据泄露。比较了六种算法(随机森林、Light Gradient Boosting Machine(LightGBM)、K最近邻算法、朴素贝叶斯、支持向量机以及Extreme Gradient Boosting(XGBoost)在区分能力、校准效果和决策曲线净收益方面的表现。XGBoost获得了最高的AUC-ROC值(0.774,95%置信区间0.759–0.788);随机森林的Brier分数最低(0.111),校准斜率最接近1(0.939),且净收益最高,因此被选为最终解释模型。加权分位数回归显示抗氧化剂组合与共病风险之间存在负相关关系(每个分位数的OR值为0.87,95%置信区间0.80–0.95;P = 0.001)。在经过相互调整的逻辑回归分析中,只有镁元素显示出独立的保护作用(每增加1个标准差,OR值为0.80,95%置信区间0.66–0.96;P = 0.016)。SHAP分析表明,可可碱(0.020)和番茄红素(0.016)是主要的保护性因素。这些发现支持将膳食抗氧化剂作为预防心血管代谢共病的潜在可调节因素。