基于可解释性机器学习模型的良性阵发性位置性眩晕延迟诊断预测及时间验证:一项来自中国北京的回顾性研究

《Preventive Medicine Reports》:Development and temporal validation of an interpretable prediction model for delayed diagnosis of benign paroxysmal positional vertigo: a retrospective study from Beijing, China

【字体: 时间:2026年06月16日 来源:Preventive Medicine Reports 2.4

编辑推荐:

  **摘要** **目的**:开发和验证一种可解释性的良性阵发性位置性眩晕(Benign Paroxysmal Positional Vertigo, BPPV)延迟诊断预测模型。 **方法**:该回顾性研究纳入了2020年7月至2024年6月期间中国北京10,

  
**摘要**
**目的**:开发和验证一种可解释性的良性阵发性位置性眩晕(Benign Paroxysmal Positional Vertigo, BPPV)延迟诊断预测模型。
**方法**:该回顾性研究纳入了2020年7月至2024年6月期间中国北京10,422例BPPV患者,其中2949例(28.30%)存在延迟诊断(症状发作至诊断间隔>14天)。患者按时间划分为建立队列(n=7536;训练/测试分割为7:3)和时间验证队列(n=2886)。研究人员开发并比较了Logistic回归(Logistic Regression, LR)、随机森林(Random Forest, RF)、极端梯度提升(eXtreme Gradient Boosting, XGB)和轻量梯度提升机(Light Gradient Boosting Machine, LGBM)四种模型。
**结果**:在时间验证队列中,LR模型取得了最高的区分度(AUC 0.84, 95% CI 0.82, 0.86),并在各数据集中表现出稳定的性能。非典型前庭症状(Atypical Vestibular Symptoms)是延迟诊断最强的预测因子。非典型诱发因素、晕动病史、头痛病史、外伤病史以及年龄增长也与延迟诊断相关。Firth回归产生了相似的估计结果。在≥65岁参与者中的亚组验证也表现出稳定的性能(AUC 0.83, 95% CI 0.79, 0.86)。
**结论**:研究人员基于常规收集的临床数据开发了一种可解释性预测模型,用于评估BPPV延迟诊断的风险。最终的LR模型在各验证队列中表现出稳定的预测性能。
该研究旨在解决良性阵发性位置性眩晕(BPPV)延迟诊断这一临床重要问题,论文发表于《Preventive Medicine Reports》。BPPV是最常见的前庭疾病,典型临床特征为体位改变诱发的旋转性头晕(或"眩晕")和眼震。然而,老年患者的症状往往缺乏特异性,可表现为不稳感或跌倒而非典型眩晕。尽管BPPV终生患病率高达2.4%,且随年龄增长而升高,但该疾病常被漏诊,导致跌倒和骨折风险增加、心理健康受损及生活质量下降。既往研究报道BPPV患者存在显著诊断延迟,症状发作至诊断的平均延迟时间约为2周,可能造成不必要的检查和医疗负担增加。虽然已有大量研究开发了关于BPPV发病病因、治疗手法次数、复发及受累半规管等方面的预测模型,但针对BPPV延迟诊断的预测模型研究甚少,机器学习(Machine Learning, ML)方法在该领域的应用尚待探索。

为此,研究人员利用眩晕与平衡数据库(Vertigo and Balance Data System, VBDS)中2020年7月至2024年6月期间经SRM-IV BPPV诊疗系统确诊的BPPV患者临床资料,开展了一项大规模回顾性研究。该数据库收录了就诊于首都医科大学附属北京天坛医院头晕临床诊疗研究中心、主诉头晕或平衡障碍并接受前庭功能检查患者的结构化临床症状信息及前庭功能检查结果。研究纳入标准为:年龄≥18岁;依据2015年Bárány学会诊断标准明确诊断BPPV;完成结构化前庭症状病史问卷且临床数据完整。排除标准包括:急性脑血管事件;严重中枢神经系统疾病、精神状况或严重躯体疾病导致无法可靠采集病史、完成结构化问卷或进行体位试验;研究期间多次复发就诊;或其他前庭疾病急性期或症状期。

最终共纳入10,422例BPPV患者,其中2949例(28.3%)存在延迟诊断(定义为症状发作至BPPV诊断间隔>14天)。建立队列(2020年7月至2023年6月,n=7536)按7:3随机分为训练集(n=5276)和测试集(n=2260),时间验证队列(2023年7月至2024年6月,n=2886)用于独立验证。研究基于临床相关性和数据可用性选取了20个独立变量,包括年龄、性别、非典型前庭症状、非典型诱发因素、前庭症状持续时间>1分钟、伴随症状(自主神经症状、耳鸣、听力下降、耳闷胀感、睡眠障碍、颈痛、头痛)及既往病史(高血压、糖尿病、高脂血症、冠心病、BPPV病史、晕动病、头痛、头部外伤)等。

研究人员开发并比较了LR、RF、XGB和LGBM四种预测模型,采用受试者工作特征曲线(Receiver Operating Characteristic, ROC)下面积(Area Under the Curve, AUC)、灵敏度、特异度、阳性预测值、阴性预测值、准确率、F1评分和Brier评分等指标评估模型性能,并通过校准曲线评估校准度,采用DeLong检验比较模型区分度差异,运用决策曲线分析(Decision Curve Analysis, DCA)评估临床效用。同时,为评估非典型前庭症状关联的稳健性,额外进行了Firth惩罚Logistic回归和简化Logistic回归模型分析,并在≥65岁参与者中进行了亚组验证。

研究结果显示,在训练集中,所有模型均表现出较高的区分度,AUC值范围为0.86(95% CI 0.85, 0.87)至0.91(95% CI 0.90, 0.92),以RF模型最高。在测试集中,XGB模型AUC最高(0.86, 95% CI 0.84, 0.88),LR模型紧随其后(0.86, 95% CI 0.84, 0.88)。DeLong检验显示LR与XGB在测试集中的区分度无显著差异,而RF和LGBM的AUC显著较低。校准性能方面,RF在训练集中Brier评分最低,但该优势未能保持至测试集,提示可能存在过拟合;相比之下,LR和XGB在各数据集中均保持较低且稳定的Brier评分。在时间验证集中,LR模型取得了最高的AUC(0.84, 95% CI 0.82, 0.86),其次是XGB(0.84, 95% CI 0.82, 0.86)、LGBM(0.84, 95% CI 0.82, 0.85)和RF(0.83, 95% CI 0.81, 0.85),LR与RF之间存在统计学显著差异。决策曲线分析显示各模型在内部验证和时间验证集中曲线高度重叠,表明临床净获益相当。基于区分度、校准稳定性和模型可解释性,LR被选为最终模型。

多变量LR分析显示,非典型前庭症状(OR 25.7, 95% CI 21.77, 30.37)、非典型诱发因素(OR 1.26, 95% CI 1.07, 1.50)、头痛病史(OR 1.33, 95% CI 1.03, 1.71)、晕动病史(OR 1.59, 95% CI 1.31, 1.91)、外伤病史(OR 1.55, 95% CI 1.01, 2.38)和年龄(OR 1.01, 95% CI 1.01, 1.02)与延迟诊断显著相关。女性性别呈边缘性关联(OR 1.17, 95% CI 0.99, 1.38)。Firth回归对非典型前庭症状的估计结果相似(OR 25.20, 95% CI 21.39, 29.80)。简化模型分析显示纳入额外关键预测因子后区分度改善,但简约模型与完整模型性能相似。≥65岁亚组验证中模型性能稳定(AUC 0.83, 95% CI 0.79, 0.86)。

研究人员进一步基于多变量模型中P值<0.10的预测因子(年龄、女性性别、非典型前庭症状、非典型诱发因素、头痛病史、晕动病史、外伤病史)开发了列线图(Nomogram)以可视化最终LR模型。同时应用SHAP(SHapley Additive exPlanations)分析于XGB和LGBM模型以阐释特征对模型预测的贡献,结果显示非典型前庭症状的平均SHAP值远高于其他变量,为最重要的预测因子。

在讨论部分,研究人员指出这是首个在中国大规模开发的BPPV延迟诊断预测模型研究。所有模型均表现出良好的区分度和校准度,LR模型在时间验证队列中表现最为稳定,兼具良好的区分度、校准度、临床可解释性和净获益,而XGB和LGBM通过SHAP分析用于探索特征重要性和非线性效应。该研究的关键发现是非典型前庭症状作为延迟诊断预测因子的压倒性重要性:在LR模型中,非典型前庭症状与超过25倍的延迟诊断风险增加相关;XGB和LGBM的SHAP分析均显示该变量对模型输出的贡献远超其他变量。非典型诱发因素也始终位列最重要的预测因子之一。这些发现表明延迟诊断主要由经典症状模式的丧失所驱动,而非人口学特征或合并症负担。

研究人员进一步讨论了相关机制:既往研究指出患者对头晕的感知方式(眩晕、头重脚轻或不稳感)与BPPV诊断无独立相关性。部分BPPV患者尤其是老年人,不表现为典型眩晕而以头晕或不平衡为主诉,这种非典型症状表现可能与外周前庭刺激的年龄相关感知下降有关。研究队列中,非典型诱发因素在及时诊断患者中占36.7%,在延迟诊断患者中占46.0%。这些因素可能阻碍患者和临床医生识别症状的位置性特征并及时进行体位试验诱发眼震,从而增加BPPV漏诊或延迟诊断的风险。

晕动病史作为延迟诊断的关键预测因子也备受关注。晕动病是一种常见的前庭疾病,多用感觉冲突理论解释,被广泛视为前庭易感性增加和中枢感觉整合改变的标志物,尽管其精确机制尚不完全明了。与晕动病相关的头晕可模拟BPPV的表现,可能导致症状的错误归因和医疗评估延迟。在LR模型中,晕动病史与延迟诊断风险独立相关,在XGB和LGBM模型中重要性排名第二。

年龄增长与BPPV延迟诊断风险增加相关。既往研究已确定年龄是BPPV发生和复发的独立危险因素,老年患者同时面临更高的跌倒、骨折、认知下降和脑血管疾病风险。前庭功能和感觉整合的年龄相关衰退可能使BPPV典型位置特征不那么明显,从而导致识别和诊断延迟。头痛和外伤病史也与延迟诊断独立相关,但头痛性质未进一步细化分类。有报道偏头痛病史者BPPV发病风险增加,这些特征可能使临床关注点转向前庭性偏头痛或外伤后头晕等替代诊断。女性性别在LR模型中呈边缘性预测作用,鉴于女性性别已被一致报道为BPPV发生和复发的危险因素,该发现可能部分反映了BPPV患者中女性比例较高,而非性别对诊断延迟的强特异性效应。多种常见心血管代谢合并症(包括高血压、糖尿病、冠心病)未成为预测模型的主要贡献因素。

该研究的优势在于:基于10,422例BPPV患者的大规模队列,为模型开发和验证提供了充足数据;比较了多种机器学习模型,最终LR模型在时间验证和老年亚组分析中均表现一致;Firth回归等附加分析产生了相似结果,支持了结果的稳定性;非典型前庭症状作为最强预测因子在不同分析方法中均保持一致;所有预测因子均为常规收集的临床变量,便于日常临床应用。局限性包括:回顾性单中心设计,无法完全消除潜在偏倚;尽管模型在时间验证中表现良好,其在其他人群和医疗环境中的普适性尚不确定;仅纳入常规可用临床变量,部分历史变量未进一步分类,可能降低了预测精度。未来研究计划纳入更多时间验证队列并扩展数据集以涵盖更多样化人群,以提高模型的普适性。

**研究结论**:研究人员成功开发了一种基于常规收集临床数据的可解释性机器学习模型,用于预测BPPV患者延迟诊断的风险。最终的LR模型在内部验证和时间验证队列中均表现出强有力的预测性能。需要进一步的前瞻性和随机研究来确定由该预测模型指导的诊断筛查和管理策略能否有效改善BPPV患者的临床结局。
相关新闻
生物通微信公众号
微信
新浪微博

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号