
-
生物通官微
陪你抓住生命科技
跳动的脉搏
基于呼吸音的哮喘和慢性阻塞性肺疾病(COPD)人工智能筛查方法:采用多特征融合与CatBoost分类算法
《Scientific Reports》:Respiratory sound-based AI screening of asthma and COPD via multi-feature fusion and CatBoost classification
【字体: 大 中 小 】 时间:2026年06月02日 来源:Scientific Reports 3.9
编辑推荐:
摘要哮喘和慢性阻塞性肺疾病(COPD)是全球主要的健康问题,其传统诊断方法依赖于资源密集型的肺功能检测(如肺活量测定)。本文提出了一种可复现的多模态呼吸声音筛查模型,该模型结合了声学特征和临床信息。该方法将手工制作的频谱-时间特征(如MFCCs、色彩信息、频谱对比度、Tonetz
哮喘和慢性阻塞性肺疾病(COPD)是全球主要的健康问题,其传统诊断方法依赖于资源密集型的肺功能检测(如肺活量测定)。本文提出了一种可复现的多模态呼吸声音筛查模型,该模型结合了声学特征和临床信息。该方法将手工制作的频谱-时间特征(如MFCCs、色彩信息、频谱对比度、Tonetz图、梅尔频谱图、Tempogram)与预先计算好的咳嗽和元音特征以及结构化的临床元数据相结合,并通过类加权CatBoost集成算法在标准化的AIRS Kaggle基准数据集上进行训练。该模型的整体准确率为90.3%,各类别的F1分数分别为:健康人群0.945、哮喘患者0.915、COPD患者0.842。系统性的实验表明,多模态特征融合(缺失全部特征时准确率下降7.8%)、注意力机制(下降4.9%)以及数据增强(下降6.7%)对模型性能有显著影响。此外,马修斯相关系数(MCC = 0.856)和Cohen’s Kappa系数(κ = 0.849)也证明了该模型在类别不平衡情况下仍具有较好的分类能力。通过梯度提升算法实现的结构化多模态特征融合,使得这种呼吸系统疾病筛查方法具备可扩展性和可复现性,适用于远程医疗应用。未来的研究应针对多样化的多机构临床队列进行前瞻性验证。