基于机器学习的缺血性卒中（IS）老年患者认知衰弱（CF）预测模型：一项前瞻性队列研究

首页今日动态人才市场新技术专栏中国科学人云展台
BioHot
云讲堂直播会展中心特价专栏技术快讯免费试用

生物通官微
陪你抓住生命科技
跳动的脉搏

生物通首页 > 今日动态 > 正文

《Frontiers in Neurology》：Machine learning-based prediction model for cognitive frailty in elderly patients with ischaemic stroke: a prospective cohort study

【字体：大中小】 时间：2026年06月05日 来源：Frontiers in Neurology 2.8

编辑推荐：

　　认知衰弱（CF）以认知障碍与躯体衰弱并存为特征，在缺血性卒中（IS）后老年患者中较为常见，且与不良功能结局相关。本研究旨在开发并内部验证一种基于机器学习（ML）的预测模型，用于预测IS老年患者出院后3个月内的CF发生风险。研究方法：本项前瞻性队列研究共纳入40

认知衰弱（CF）以认知障碍与躯体衰弱并存为特征，在缺血性卒中（IS）后老年患者中较为常见，且与不良功能结局相关。本研究旨在开发并内部验证一种基于机器学习（ML）的预测模型，用于预测IS老年患者出院后3个月内的CF发生风险。研究方法：本项前瞻性队列研究共纳入402例IS老年患者。基线评估涵盖26个候选变量，包括人口学特征、卒中严重程度、营养状态、心理社会因素及血管标志物。特征筛选采用训练集内的最小绝对收缩和选择算子（LASSO）回归。研究评估了10种监督式机器学习算法，包括随机森林（RF）、CatBoost及XGBoost。模型可解释性采用SHAP（SHapley Additive exPlanations）进行评估。模型性能采用受试者工作特征曲线下面积（AUC）、准确率、灵敏度及决策曲线分析进行评价。研究结果：3个月随访时，149例（37.1%）患者发生CF。在评估的模型中，RF模型在独立保留的内部测试集上展现出最优综合性能，AUC为0.889，准确率为0.798，灵敏度为0.909。SHAP分析显示，出院时美国国立卫生研究院卒中量表（NIHSS）评分、年龄及白质高信号（WMH）负担为模型预测的主要贡献因素。抑郁与社会支持亦显示出显著的交互效应。RF模型在广泛的阈值概率范围内表现出良好的校准度与净临床获益。研究结论：本研究利用常规可获得的临床变量，开发了一种可解释的、基于机器学习的早期CF风险评估模型。研究结果表明，神经功能、营养及心理社会因素可能共同参与IS后CF风险的形成。尽管该模型在内部验证中表现良好，但在临床应用前仍需进行外部验证。}

认知衰弱（CF）是指认知障碍与躯体衰弱在尚未发展为痴呆的个体中同时存在的状态，在老年脑卒中幸存者中较为常见。国际队列研究报告指出，约30%至50%的老年幸存者在卒中发生后3至6个月内出现CF或相关状态。CF与生活质量下降、日常生活活动能力（ADL）受损、跌倒、住院时间延长、脑血管事件复发及全因死亡风险增加密切相关，凸显了在缺血性卒中（IS）后早期识别CF高危老年患者的重要临床意义。

IS后CF的形成可能源于多种因素的相互作用。先前研究表明，卒中严重程度、脑血管负担、营养状态、抑郁症状、睡眠障碍及社会支持等因素可能与卒中后认知障碍、躯体衰弱或两者兼而有之相关。然而，专门针对IS老年患者CF的研究证据有限，且现有研究多单独考察这些因素，而非评估其如何共同与CF相关联，导致临床医生缺乏实用证据来判定哪些患者更可能在IS后早期发生CF。因此，整合性评估这些因素有助于支持该人群更早、更具个体化的风险评价。传统基于回归的方法虽有用于考察候选因素与临床结局间的独立关联，但在捕捉预测因素间的非线性关系及交互作用方面存在局限。相反，机器学习（ML）提供了一种可行的补充方法，因其能够整合多维变量，且在预测卒中复发、卒中后认知障碍及功能恢复等多种卒中后结局方面已展现出良好前景。然而，现有机器学习研究主要分别针对认知或功能结局，鲜有将CF作为一种具有认知障碍与躯体衰弱并存特征的临床意义实体进行考察。因此，本前瞻性队列研究旨在开发并内部验证一种可解释的、基于机器学习的模型，用于预测IS老年患者出院后3个月内的CF发生风险，整合常规可获得的临床、神经影像、营养及心理社会变量，并通过比较多种监督式学习算法以确定最优预测方法。

本研究遵循流行病学观察性研究报告加强声明（STROBE）及个体预后或诊断多变量预测模型透明报告-人工智能扩展版（TRIPOD+AI）进行设计与报告。研究最终纳入402例完成3个月随访的老年IS患者，其中149例（37.1%）被诊断为CF。整个队列按7:3比例随机分为训练集（n=283）和独立测试集（n=119）。从26个候选变量中，通过单因素筛选及训练集内的LASSO回归进行特征选择，最终确定8个预测变量：年龄、既往卒中史、出院NIHSS评分、WMH分级、抑郁、社会支持、预后营养指数（PNI）及血管阻力指数（RI）。研究评估了10种监督式机器学习算法：Logistic回归、支持向量机（SVM）、梯度提升机（GBM）、神经网络、随机森林（RF）、XGBoost、K近邻（KNN）、AdaBoost、LightGBM及CatBoost。采用重复五折交叉验证进行超参数优化，以AUC、准确率、灵敏度、特异度、阳性预测值、阴性预测值及F1分数评价模型性能，并通过校准图、Brier分数、精确率-召回率曲线及决策曲线分析进行综合评估。模型可解释性采用SHAP值分析，包括全局解释（SHAP汇总图、条形图）、局部解释（瀑布图、力图）及特征交互作用分析。

基线特征分析显示，CF组患者年龄显著高于非CF组（75.39±10.98岁 vs. 68.21±6.24岁），饮酒史、糖尿病患病率更高，BMI分布存在显著差异，超重/肥胖比例更高。卒中相关特征方面，CF组既往卒中史更常见，出院NIHSS评分更高，改良Rankin量表（mRS）分布更差，WMH负担更重。心理社会及血清学评估显示，CF组抑郁评分更高，社会支持评分更低，营养状态更差（PNI更低），阻塞性睡眠呼吸障碍评分更高，RI更高。

特征选择结果表明，LASSO回归在最优惩罚参数（λ.1se=0.035）下从13个潜在显著变量中筛选出8个非零系数特征用于后续模型开发。

模型性能比较结果显示，所有模型在测试集上均达到可接受至良好的区分能力，AUC范围为0.755–0.889。RF模型获得最高AUC（0.889；95%CI：0.826–0.952），其次为SVM（0.869）、GBM（0.865）、神经网络（0.863）、AdaBoost（0.860）、XGBoost（0.855）、CatBoost（0.846）及Logistic回归（0.834），KNN（0.779）和LightGBM（0.755）区分能力相对较低。RF模型在灵敏度（0.909）与阴性预测值（0.932）方面表现最优，F1分数最高（0.769）。精确率-召回率曲线确认AUC表现较强的模型维持更优的精确率-召回率权衡。决策曲线分析显示RF模型在10%–60%的临床相关阈值概率范围内相对于"全部治疗"和"不予治疗"策略均提供持续正向净获益。为评估性能估计的稳定性，研究进行了100次重复五折交叉验证，RF模型保持一致的平均AUC为0.850（95%CI：0.841–0.859），与主要测试集结果高度一致。

模型可解释性分析方面，SHAP全局解释显示年龄对模型输出的整体贡献最强（平均|SHAP|≈0.039），其次为既往卒中史（≈0.032）、社会支持水平（≈0.030）、抑郁评分（≈0.026）、WMH（≈0.023）、出院NIHSS评分（≈0.022）、PNI（≈0.021）及RI（≈0.019）。SHAP汇总图进一步明确了效应方向：高龄、既往卒中史、较高出院NIHSS评分、更严重WMH、较高抑郁评分及较高RI通常与正向SHAP值相关，持续推动预测向更高CF风险偏移；而较高社会支持及较高PNI主要产生负向SHAP值，表明具有保护性关联。SHAP依赖图揭示了关键预测因素与CF风险间的非线性关系：年龄呈现明显阈值效应，SHAP值在年轻队列中相对稳定或为负，但在75–80岁后显著上升，最老年患者中急剧升高；既往卒中史显示离散性风险增加；抑郁呈单调趋势，评分超过10–12后风险更明显地增加。交互分析表明，某些特征的影响受协变量调节：较高基线NIHSS评分强化了高龄相关的风险，而较强的社会支持部分削弱了抑郁相关的风险。个体层面风险通过瀑布图进行可视化，展示了固定临床标志物与可改变的心理社会或营养因素在模型决策过程中的相互作用。

讨论部分，研究人员指出本研究利用常规可获得的出院数据开发了预测IS后3个月CF风险的机器学习模型，整合了8个反映人口学特征、脑血管负担、神经功能严重程度、营养状态及心理社会脆弱性的预测因素。在评估的算法中，RF模型在内部测试集中实现了最优异的综合性能，尤其在灵敏度和阴性预测值方面表现突出。这些发现提示IS后CF是一种多维度状态，可能源于急性神经损伤、既往脑血管脆弱性、营养状态及心理社会恢复力的共同影响。

SHAP分析揭示年龄是IS后CF最具影响力的预测因素，约75岁后风险更显著增加，这与既往研究一致，反映了生理储备、神经可塑性、血管完整性及多系统恢复力随年龄增长的进行性下降。既往卒中史排名亦较高，可能反映了反复脑血管损伤的累积效应，重复缺血性损伤可能加速神经退行性变、破坏代偿性神经网络并损害功能恢复。

值得注意的是，心理社会因素在模型预测中显示出实质性贡献，社会支持排名第三，抑郁症状亦具较强预测权重。传统IS后风险模型主要关注人口学、神经功能或影像标志物，而对心理社会脆弱性关注相对较少。社会支持可能改善治疗依从性、康复参与度、情绪调节及长期功能恢复，而IS后抑郁与体力活动减少、动机受损、慢性下丘脑-垂体-肾上腺轴激活、全身炎症及功能加速衰退相关。SHAP交互分析提示抑郁与社会支持之间存在潜在交互作用：较高抑郁评分与CF预测风险增加相关，而较强的社会支持在一定程度上削弱了这一关联，表明心理社会因素可能独立于神经功能损伤影响IS后恢复。

结构性及神经损伤标志物（包括WMH负担和出院NIHSS评分）也对模型预测有贡献。WMH负担较重可能反映慢性小血管疾病及额叶-皮层下环路破坏，较高出院NIHSS评分表明更严重的神经功能缺损，可能部分反映早期功能恢复和康复参与能力的降低。与年龄和心理社会因素相比，WMH和NIHSS评分的相对重要性较低，提示IS后CF的发生可能并非仅由急性神经损伤严重程度决定，慢性脆弱性和IS后恢复条件可能在长期认知和躯体衰退中发挥更广泛作用。

PNI和RI也对模型预测有贡献，尽管效应弱于年龄和心理社会因素。较低PNI可能反映较差的营养状态，与躯体功能降低及IS后恢复不佳相关；较高RI可能提示更大的脑血管阻力和慢性血管负担。这些发现共同表明营养和血管因素也可能与IS后CF风险相关。

本研究确定的四个预测因素（高龄、抑郁症状、有限社会支持和营养不良）与以往关于老年人CF的研究及专家共识声明 broadly一致。研究同时发现若干在现有CF框架中关注相对较少的IS相关变量（既往卒中史、出院NIHSS评分、WMH负担和RI），提示IS后CF的发生可能部分反映了传统CF框架未能完全捕捉的IS相关神经和脑血管损伤模式。该机器学习模型生成的相对重要性排序可为优化IS后管理策略提供定量证据：除常规神经功能评估外，还需加强对IS幸存者的社会心理筛查、营养评估、抑郁管理及长期功能支持。

从临床实用性角度，RF模型在独立测试集中达到相对较高的灵敏度和阴性预测值。在筛查背景下，最小化假阴性尤为重要，因为未能识别高危个体可能延误潜在有益的多领域干预。因此，该模型更适合作为筛查和风险分层工具而非诊断工具。此外，其性能也有助于识别不可能发生CF的患者，而被分类为高危的患者应进一步接受认知、衰弱、营养、心理及康复评估的确认性检查。

研究局限性包括：模型仅进行内部验证，CF事件数相对有限；单中心设计可能限制研究结果向其他人群、医疗环境及康复系统的可推广性；主要结局合并了衰弱前期和衰弱参数，虽提高了早期风险识别的灵敏度，但可能降低与采用更严格衰弱定义研究的可比性；若干潜在相关预测因素（包括炎症生物标志物、定量病灶特征、用药依从性、康复强度及认知、营养或心理社会状态的纵向变化）未能获取；随访期仅限于3个月，主要反映IS后早期CF风险而非长期认知和功能轨迹。

研究结论：在这项前瞻性队列研究中，研究人员开发并内部验证了一种用于估计IS老年患者3个月后CF风险的机器学习模型。研究结果表明，IS后CF是一种多维度状态，不仅受神经功能和脑血管因素影响，还受营养和心理社会脆弱性的影响。RF模型在内部验证中展现出良好的灵敏度和阴性预测价值，可能支持利用常规可获得的出院变量进行早期筛查和风险分层。然而，该模型应被视为初步风险评估工具而非独立的临床决策工具。需要进一步的外部验证和前瞻性实施研究，以确认其在不同卒中人群中的可推广性、校准度和临床实用性。本论文发表于《Frontiers in Neurology》。

联系信箱：

粤ICP备09063491号

热点排行