《International Journal of Chronic Obstructive Pulmonary Disease》:Construction and Validation of Active Case-Finding Tool in Community Participants with Chronic Obstructive Pulmonary Disease Using an Interpretable Machine Learning Approach
编辑推荐:
目的:早期诊断是慢性阻塞性肺疾病(COPD)预防的有效策略。主动病例查找是一种有效方法,但传统工具如COPD筛查问卷(COPD-SQ)受到数据陈旧、外推性差和单一二元预测的限制。本研究旨在为社区参与者开发一种更新、便捷且可解释的机器学习工具用于COPD筛查。
目的:早期诊断是慢性阻塞性肺疾病(COPD)预防的有效策略。主动病例查找是一种有效方法,但传统工具如COPD筛查问卷(COPD-SQ)受到数据陈旧、外推性差和单一二元预测的限制。本研究旨在为社区参与者开发一种更新、便捷且可解释的机器学习工具用于COPD筛查。
患者与方法:模型训练和外部验证的数据来自中国广东的两项基于社区的研究。研究人员使用PyCaret和R编程语言开发机器学习模型。最初使用了30个原始项目,包括人口统计学数据、临床特征和危险因素数据。比较了11种机器学习分类模型,并进一步使用最小绝对收缩和选择算子(LASSO)来收缩预测因子。使用受试者工作特征曲线(ROC)、曲线下面积(AUC)、准确度、灵敏度、特异度等指标评估模型性能。使用SHapley Additive exPlanations(SHAP)解释模型。
结果:训练队列和外部验证队列分别纳入5381名和2456名参与者。在预测COPD方面,AdaBoost模型表现最佳,准确度为0.846,AUC为0.848。对于GOLD分级预测,模型实现了0.822的总准确度和0.816的AUC,并识别了社区中83%的中重度COPD。在回归分析中,梯度提升回归模型预测的FEV1 %pred和FEV1/FVC值与实测值之间显示出良好的一致性。这些模型在外部验证队列中也表现出良好的性能,并已部署在线。
结论:研究人员利用有限的临床数据构建了一个集成机器学习模型的主动病例查找工具,用于预测COPD、COPD严重程度和肺功能参数。该工具可能有助于在社区环境中优先考虑高风险个体进行确诊性肺功能检查。未来的实施研究应评估其对转诊效率、诊断率、治疗接受度和长期结局的影响。
关键词:COPD|社区筛查|临床预测模型|机器学习
慢性阻塞性肺疾病(COPD)是全球第四大死因,预计2030年将成为第三大死因。早期诊断是预防COPD的有效策略,然而,初级保健和社区机构中肺功能检查(spirometry)的普及率与质量控制存在显著不足(分别为6.9%和7.2%),美国预防服务工作组也不推荐对无症状个体进行社区肺功能筛查,这限制了肺功能检查在中国社区COPD早期诊断中的应用。主动病例查找(active case-finding)作为一种筛查方法,对于未诊断或高风险的COPD个体价值日益凸显,常采用问卷等简易工具(有时结合呼气峰流速仪)进行大规模筛查,随后建议高风险个体接受肺功能检查以确诊,从而提高医疗成本效益并减轻疾病负担。研究人员此前开发了COPD筛查问卷(COPD-SQ)和贝叶斯模型等本土主动病例查找工具,但这些传统工具受到数据陈旧(收集于2002–2006年)、评分系统人为设定导致偏倚和外推性差(尤其在40–65岁年轻人群)的局限。最重要的是,传统工具仅能回答个体是否存在COPD风险,而在无法进行肺功能检查的偏远地区,直接预测COPD的概率、严重程度甚至肺功能参数将带来更大益处。因此,迫切需要更新、更便捷、更强大的COPD预测工具。人工智能(AI)技术在医学领域带来突破,机器学习(ML)在医学图像识别、肿瘤诊断与分类、COVID-19及哮喘急性加重风险预测中已取得超越人类专家和传统模型的准确性和泛化能力,但在AI应用于COPD高风险个体预测方面仍存在空白。已有研究报道了基于中国人群的机器学习COPD预测模型,但大多基于国际疾病分类(ICD)代码、计算机断层扫描(CT)图像、血液生物标志物或来自特定疾病背景的数据,不适用于社区个体且无法预测疾病严重程度。近期韩国学者发现机器学习可通过危险因素估算COPD患者的FEV
1/FVC值,但尚无基于真实世界社区调查来源临床数据、以肺功能为预测变量并更新预测特征的综合机器学习模型。为填补这一空白,本研究基于近期在广东开展的队列调查,利用机器学习方法开发和验证了用于预测COPD、GOLD分级、FEV
1 %pred及FEV
1/FVC值的多因素模型,这些模型仅依赖临床数据,对高风险或未诊断COPD个体的主动病例查找具有更高预测效果。
研究人员开展了以下研究:基于两个独立社区研究队列(发展队列来自2019–2023年广东韶关翁源县和河源连平县40–80岁居民的ECOPD研究,外部验证队列来自2015–2017年广州六个城市社区40–65岁居民的“十三五”科技支撑计划项目),共纳入训练队列5381人和外部验证队列2456人。利用流行病学问卷收集30余个原始项目(包括人口统计学、呼吸症状、疾病史、危险因素等),通过PyCaret和R语言开发和比较11种机器学习分类模型(包括随机森林[RF]、支持向量机[SVM]、逻辑回归[LR]、LightGBM、决策树[DT]、AdaBoost、梯度提升分类器[GBC]、XGBoost、K近邻[KNN]、高斯朴素贝叶斯[GNB]、线性判别分析[LDA]和二次判别分析[QDA])以及回归模型(梯度提升回归[GBR]、贝叶斯脊回归[BR]、脊回归[Ridge]和线性回归)。采用递归特征消除交叉验证(RFECV)和最小绝对收缩和选择算子(LASSO)进行特征筛选,最终将原始18个特征缩减为9个(年龄、性别、体重指数[BMI]、咳嗽咳痰、喘息、既往诊断肺气肿、改良英国医学研究委员会呼吸困难指数[mMRC]、吸烟指数和呼吸系统疾病用药史)。使用受试者工作特征曲线下面积(AUC)、准确度、灵敏度、特异度、阳性预测值(PPV)、阴性预测值(NPV)等评估模型性能,并利用SHapley Additive exPlanations(SHAP)解释模型。通过决策曲线分析(DCA)评估临床适用性,并在外部验证队列中验证模型泛化能力。
研究结果包括以下部分:
1. 机器学习算法模型比较:在COPD二分类预测中,AdaBoost模型表现最优,10折交叉验证平均准确度为0.846(95%置信区间[CI]: 0.834–0.858),AUC为0.848(95% CI: 0.827–0.854)。逻辑回归、梯度提升分类器、高斯朴素贝叶斯和LightGBM的AUC也超过0.8。
2. 特征选择:通过RFECV方法从18个初始特征中筛选出12个重要特征,进一步结合LASSO回归将变量缩减至9个(年龄、性别、BMI、咳嗽咳痰、喘息、既往诊断肺气肿、mMRC呼吸困难指数、吸烟指数、呼吸道疾病用药史),且与12变量模型比较后AUC无显著差异(P>0.05),最终采用9特征模型以避免过拟合。
3. 最优模型构建与评估:基于9个特征训练AdaBoost模型,经调参后验证集准确度为0.851,AUC为0.84(95% CI: 0.827–0.854),Youden指数确定最佳阈值为0.802。学习曲线表明样本量在1500–3000时模型性能稳定。吸烟指数对模型贡献最大(F-score=0.27)。决策曲线分析显示在0.2–0.8阈值概率范围内AdaBoost模型具有正向净收益。
4. SHAP方法解释COPD预测模型:全局特征重要性排序显示年龄、吸烟指数和mMRC≥2对预测正向推动作用最大(红色高值),而性别(女性)和BMI高值则向健康方向推动预测。个体力图中展示了每个特征的贡献方向和幅度。SHAP相似图直观展示了各特征对模型输出的整体分布影响。
5. 多分类与肺功能值预测:基于梯度提升分类器(GBC)的GOLD分级预测模型总体准确度为0.822,总体AUC为0.816;其中对非COPD(类0)AUC 0.832、GOLD 1(类1)AUC 0.710、GOLD 2(类2)AUC 0.825、GOLD 3及以上(类3)AUC 0.954,能识别社区中83%的中重度COPD。回归分析中,梯度提升回归(GBR)模型预测FEV
1 %pred和FEV
1/FVC的R
2分别为0.331和0.444,Bland-Altman一致性检验显示93.2%和96.1%的结果在均值±1.96标准差范围内,无显著差异。
6. 外部验证:外部验证队列(2456人)中上述模型表现良好,具体结果见表S8和S9。表明模型在不同区域(农村 vs 城市)和年龄范围(40–80岁 vs 40–65岁)具有良好适用性。
讨论部分总结:研究表明,基于临床数据的机器学习模型在COPD社区主动病例查找中表现出色,超越了传统COPD-SQ等工具。SHAP方法揭示了关键特征(吸烟指数、年龄、mMRC等)对预测的正负影响,增强了模型可解释性。多分类模型能直接区分COPD严重程度,尤其对中重度COPD(GOLD II–IV)的识别准确率高达83%,有助于降低中重度气流受限的漏诊率。回归模型预测的FEV
1 %pred和FEV
1/FVC值与实测值高度一致,可为无法完成肺功能检查的患者提供指导。部分变量(如生物燃料暴露)在特征筛选中权重较低,可能与近年农村厨房通风改造及清洁能源推广有关。模型已在在线平台部署,可用于社区或医疗机构的多场景便捷筛查,但未来实施研究需评估其对转诊效率、诊断率、治疗接受度和长期结局的影响。结论翻译:尽管COPD的危险因素随时间变化,但社区“主动病例查找”的预测模型数十年来未得到更新。在本研究中,研究人员利用标准化机器学习技术和大规模社区调查数据,构建了用于预测COPD、COPD严重程度以及FEV
1 %pred和FEV
1/FVC值的预测模型。机器学习是COPD早期识别中一项新颖且强大的技术。该工具可能有助于在社区环境中优先对高风险个体进行确诊性肺功能检查,但其对诊断率、治疗接受度和长期结局的影响仍需进一步前瞻性评估。