基于电子健康档案机器学习模型预测类风湿关节炎患者疾病活动度的研究

《Health Data Science》：Electronic Health Record-Based Machine Learning Model for Predicting Disease Activity in Patients with Rheumatoid Arthritis

【字体：大中小】 时间：2026年06月09日 来源：Health Data Science

编辑推荐：

　　背景：利用初始临床评估通过机器学习（Machine Learning, ML）预测治疗效果是精准医学中前景广阔的方向。本研究旨在构建ML模型以预测类风湿关节炎（Rheumatoid Arthritis, RA）患者的疾病活动度，从而优化临床决策与治疗选择。方法

背景：利用初始临床评估通过机器学习（Machine Learning, ML）预测治疗效果是精准医学中前景广阔的方向。本研究旨在构建ML模型以预测类风湿关节炎（Rheumatoid Arthritis, RA）患者的疾病活动度，从而优化临床决策与治疗选择。方法：本多中心回顾性研究分析2017–2022年中国5家三级医院1864例RA患者的电子健康档案（Electronic Health Records, EHRs）。北京大学人民医院（Peking University People's Hospital, PKUPH）数据作为训练及内部验证队列，其余4家中心数据用于外部验证。整合基线、3个月及6个月随访的纵向变量（人口学、实验室指标、用药方案）以捕捉动态疾病模式。训练四种ML模型预测治疗后6个月的疾病状态，主要终点定义为临床缓解［28个关节疾病活动度评分联合红细胞沉降率（Disease Activity Score in 28 joints with erythrocyte sedimentation rate, DAS28-ESR）≤2.6］。结果：最终分析纳入PKUPH的1629例患者及4家其他三级医院的235例患者。内部验证中最佳模型准确率达95.3%，受试者工作特征曲线下面积（Area Under the Receiver Operating Characteristic Curve, AUROC）为0.971，灵敏度、特异度、阳性预测值（Positive Predictive Value, PPV）及阴性预测值（Negative Predictive Value, NPV）分别为98.1%、84.2%、96.1%和91.8%。模型在外部验证中具良好泛化性，准确率87.3%，AUROC为0.922。此外，在多分类任务（将患者分层为缓解、低、中、高疾病活动度）中深度神经网络（Deep Neural Network, DNN）模型准确率为68.6%，AUROC为0.860。结论：从EHRs提取的纵向临床数据可有效用于预后模型开发。本研究证实基于大规模多中心队列训练的深度学习（Deep Learning, DL）方法能准确预测RA疾病轨迹，为个体化患者管理提供有价值工具。

本文解读对象为发表于《Health Data Science》的论文"Electronic Health Record-Based Machine Learning Model for Predicting Disease Activity in Patients with Rheumatoid Arthritis"。

一、研究背景与目的

类风湿关节炎（Rheumatoid Arthritis, RA）是一种常见系统性炎症性自身免疫病，可致关节畸形及功能丧失，严重影响生活质量。尽管改善病情抗风湿药（Disease-Modifying Antirheumatic Drugs, DMARDs）——包括常规合成csDMARDs、生物制剂bDMARDs及靶向合成tsDMARDs——广泛应用，临床仍缺乏可指导个体化用药的精准预测工具。既往基于多组学或单一标志物的模型成本高昂且依赖有创采样；基于登记库临床变量的模型又受限于单中心、小样本及缺乏外部验证，泛化能力不足。为此，研究人员开展此项多中心回顾性研究，利用结构化电子健康档案（Electronic Health Records, EHRs）中纵向临床数据，构建并验证多种机器学习（Machine Learning, ML）模型，以预测RA患者治疗6个月后的疾病活动状态（缓解 vs 非缓解及四级分层），为临床决策提供支持。

二、主要关键技术方法

研究人员收集中国5家三级医院（PKUPH为训练中心，另4家为外部验证中心）2017–2022年RA确诊患者EHRs，初筛686人后最终纳入1864例（训练集1629例，外部验证235例）。提取基线、3个月及6个月的人口学、实验室［C反应蛋白（C-Reactive Protein, CRP）、红细胞沉降率（Erythrocyte Sedimentation Rate, ESR）、类风湿因子（Rheumatoid Factor, RF）、抗环瓜氨酸肽抗体（anti-Cyclic Citrullinated Peptide Antibody, anti-CCP）］、临床体征（28处压痛关节计数Tender Joint Count of 28 joints, TJC28；28处肿胀关节计数Swollen Joint Count of 28 joints, SJC28；患者整体评估Patient Global Assessment, PtGA；医生整体评估Physician Global Assessment, PhGA）及DAS28-ESR、用药记录。缺失值采用均值填补并进行敏感性分析，类别型高缺失anti-CCP按阳性/阴性/缺失三分类处理；采用ALLKNN欠采样处理类别不平衡。以基线+3个月数据为输入特征，预测6个月二分类结局（缓解DAS28-ESR≤2.6 vs 非缓解＞2.6）及四分类（缓解≤2.6、低疾病活动度Low Disease Activity, LDA 2.6＜DAS28-ESR≤3.2、中疾病活动度Moderate Disease Activity, MDA 3.2＜DAS28-ESR≤5.1、高疾病活动度High Disease Activity, HDA＞5.1）。训练支持向量机（Support Vector Machine, SVM）、自适应提升（Adaptive Boosting, AdaBoost）、随机森林（Random Forest, RF）及深度神经网络（Deep Neural Network, DNN），10折交叉验证调参，SHAP（SHapley Additive exPlanations）分析解释特征重要性，外部多中心队列验证模型泛化能力。

三、研究结果

研究人群（Study population）

研究人员比较PKUPH训练队列（n=1629）与外部多中心验证队列（n=235）基线特征，发现外部队列基线DAS28-ESR更高［6.1(5.5,6.7) vs 5.4(4.8,6.2)，P＜0.001］，两组在病程、TJC28、SJC28、PtGA、ESR、CRP、RF、anti-CCP上均存在差异，证实多中心间具异质性。基线DAS28-ESR被Gini重要性及SHAP分析一致认定为核心预测因子。

模型在训练与验证队列中的表现（Model performance on training and validation cohorts）

内部验证中四种模型均具较高判别力，SVM表现最优：准确率95.3%，AUROC 0.971，灵敏度98.1%，特异度84.2%，PPV 96.1%，NPV 91.8%；DNN、RF相近（准确率94.6%、94.5%），AdaBoost较低（87.3%）。外部验证中SVM仍最优：准确率87.3%，AUROC 0.922，灵敏度94.2%，特异度80.6%，PPV 83.1%，NPV 93.5%；DNN为85.2%（AUROC未单独列但整体性能次优），RF 83.6%，AdaBoost 79.8%。研究表明SVM在该高低维特征混合EHR数据集中泛化性与稳定性最好。

疾病活动度分层中的表现（Performance in disease activity stratification）

在多分类任务（REM/LDA/MDA/HDA）中DNN表现最佳，准确率68.6%，AUROC 0.860，提示深度网络擅长捕捉纵向变量间复杂非线性交互以进行精细分层。

特征重要性可视化（Visualization of feature importance）

SHAP分析显示各模型最重要特征均为基线DAS28-ESR及用药持续时间，不同算法特征贡献方向一致。用药持续时间重要性反映RA慢性及潜在治疗抵抗亚群特征。Gini重要性与SHAP值排序差异源于前者衡量分裂贡献、后者衡量边际平均影响，二者互为补充。

四、讨论与结论翻译

讨论指出本研究模型仅依赖常规EHR数据，成本低且整合纵向随访信息，优于仅用基线的静态模型；SVM适合高维临床特征且抗过拟合，DNN在多层分类具优势；AdaBoost对EHR噪声敏感致性能偏低。高NPV支持模型用于排除缓解、筛查需密切监测患者，但模型应作辅助决策工具而非替代临床判断。局限性含anti-CCP高缺失率（经敏感性分析不影响结论）、DMARDs未细化至具体作用机制、多中心EHR系统差异致外部验证精度略降、人群限于中国及回顾性设计，需前瞻性大样本多族裔进一步验证并纳入CDAI/SDAI等标准。

结论：本研究凸显利用ML模型基于多样医疗机构EHR数据预测RA疗效及辅助治疗选择的有效性，所建预测模型可直接应用于日常临床场景并为精准医学提供支撑，建模方法亦有助于推动ML算法在EHR数据分析中的广泛应用。

（Ethical Approval：研究获北京大学人民医院伦理委员会批准(2020PHB300-01)，所有受试者签署知情同意书。）

热点排行