《Scientific Reports》:An explainable machine learning approach to predict fragility fractures and the identification of important features
编辑推荐:
在本研究中,研究人员开发了机器学习(ML)算法来预测脆性骨折,考虑了不同骨骼部位骨折的发生情况,使用的是加拿大骨质疏松症多中心研究(CaMos)中年龄≥50岁参与者的数据。研究人员考虑了73个基线特征,结局指标是以下任何部位的首次骨折发生情况:髋部、脊柱、骨盆
在本研究中,研究人员开发了机器学习(ML)算法来预测脆性骨折,考虑了不同骨骼部位骨折的发生情况,使用的是加拿大骨质疏松症多中心研究(CaMos)中年龄≥50岁参与者的数据。研究人员考虑了73个基线特征,结局指标是以下任何部位的首次骨折发生情况:髋部、脊柱、骨盆、肋骨、肩部和前臂。根据受试者工作特征曲线下面积(ROC_AUC)对ML算法进行了评估。采用SHapley Additive exPlanations(SHAP)分析来识别重要特征,并研究这些特征之间的相互作用。共有7753名受试者被纳入本研究。约72%为女性,平均年龄为67岁。研究人员发现,XGBoost算法的ROC_AUC略优(0.70;95%置信区间[CI] 0.67, 0.73)。从SHAP分析中,研究人员发现骨密度(BMD)是最重要的特征,且全髋BMD与股骨颈BMD的交互作用最强。本研究表明,XGBoost是用于预测脆性骨折的略优ML算法。此外,研究人员还识别出了有助于预测脆性骨折的重要特征。针对这些特征的干预将有助于预防这些骨折的发生。
论文解读:可解释机器学习预测脆性骨折及关键特征识别研究
研究背景与意义
脆性骨折是全球重大公共卫生问题,给老年人群带来显著的健康负担,包括生活质量下降、活动受限及高昂的医疗成本。尽管现有的FRAX?等预测工具在临床中广泛应用,但其存在低估风险、假设风险因素间无交互作用、性能受地域限制且未充分考虑社会健康决定因素等局限性。随着人工智能技术的发展,机器学习(ML)在提升骨折预测精度方面展现出潜力,然而现有研究多聚焦于单一部位(如髋部骨折),缺乏对多部位脆性骨折的综合预测,且对于模型决策过程的可解释性(即识别关键特征及其交互作用)研究不足。因此,本研究旨在利用纵向队列数据,开发和比较多种ML算法以预测多部位脆性骨折的发生,并通过可解释性分析揭示关键风险因素及其复杂交互,为精准预防和干预提供科学依据。该研究成果发表于《Scientific Reports》。
关键技术与方法
本研究基于加拿大骨质疏松症多中心研究(CaMos)这一大型人群前瞻性队列。研究纳入了7753名基线年龄≥50岁的参与者,随访时间长达19年。研究人员定义了髋部、脊柱、骨盆、肋骨、肩部和前臂的首次低创伤脆性骨折为结局事件。初始纳入73个基线特征,涵盖人口学、生活方式、骨密度(BMD)及疾病史等。数据经预处理后,随机分为训练集(70%)和测试集(30%),并按骨折状态进行分层以确保分布均衡。研究人员采用十折嵌套交叉验证结合贝叶斯优化方法,对七种ML算法进行超参数调优和性能评估,包括:标准逻辑回归、惩罚回归(LASSO、弹性网络)、树基模型(随机森林、决策树)、集成学习(极端梯度提升,XGBoost)和深度学习(神经网络)。模型性能主要通过测试集上的ROC_AUC进行评价。最终,选择表现最优的模型进行全局可解释性分析,应用SHapley Additive exPlanations(SHAP)方法量化各特征的重要性,并进一步分析前五位重要特征与其他特征间的交互效应。
研究结果
研究人群
最终分析共纳入7753名参与者,其中女性占72%,平均年龄为67岁。
机器学习算法性能
经过数据预处理和特征工程,最终55个特征被用于模型训练。七种算法的测试集ROC_AUC均超过0.65,表现相近。其中,XGBoost算法取得了最高的ROC_AUC值,为0.700(95% CI: 0.669, 0.732),略优于其他算法。决策树算法的性能相对较低,为0.656(95% CI: 0.624, 0.689)。LASSO和弹性网络的ROC_AUC分别为0.696和0.694,神经网络和随机森林则分别为0.684和0.686。
SHAP特征重要性分析
通过SHAP分析识别出预测脆性骨折的15个最重要特征,按重要性排序依次为:全髋BMD(SHAP值=0.119)、腰椎BMD(0.107)、既往骨折史(0.102)、股骨颈BMD(0.090)、年龄(0.061)、绝经状态(0.058)、体重(0.043)、骨质疏松状态(0.042)、步行状况(过去6个月步行>5小时或≤5小时)(0.026)、青少年期维生素D摄入量(13-19岁)(0.024)、性别(0.024)、骨质疏松家族史(0.023)、每日维生素D摄入量(0.022)、每日钙摄入量(0.021)和久坐时长(每日极少或无活动的小时数,例如坐姿)(0.020)。分析显示,较低的BMD值、较高的年龄、较高的体重、既往骨折史、患有骨质疏松、有骨质疏松家族史、处于绝经状态以及女性性别均与较高的骨折风险(SHAP值增加)相关。
SHAP交互作用分析
对前五位重要特征的交互作用进行分析发现:全髋BMD与股骨颈BMD的交互作用最强(SHAP值=0.014),当两者均处于低值时,骨折风险显著增加。其次,全髋BMD还与体重、腰椎BMD、既往骨折史、钙摄入量、年龄和绝经状态存在交互。腰椎BMD则与体重的交互最为突出,其与低BMD值结合时,无论体重过低或过高均会提升风险。股骨颈BMD主要与全髋BMD、既往骨折史、每日钙摄入量、腰椎BMD和体重发生交互。既往骨折史与股骨颈BMD、腰椎BMD、每日维生素D摄入量、全髋BMD和身高存在交互,其中既往骨折合并低股骨颈BMD时风险最高。年龄主要与腰椎BMD交互,低BMD值结合较高或较低的年龄均会增加风险。
讨论与结论
本研究通过比较七种ML算法,证实了XGBoost在预测多部位脆性骨折方面具有边际优势,其性能与传统FRAX工具相当甚至更优,且能处理更复杂的风险因素关系。通过SHAP分析,不仅验证了BMD、年龄、既往骨折等传统风险因素的核心地位,还揭示了特征间复杂的交互模式,例如不同部位BMD之间的协同作用,以及BMD与体重、年龄等因素的非线性关联。这些发现强调了在临床风险评估中考虑多维度因素及其交互的重要性,有助于识别极高危亚群,指导个体化预防策略的制定。研究的优势在于使用了长期随访的纵向队列数据和广泛的特征集,并采用了先进的可解释性AI技术。局限性包括骨折事件可能存在自我报告偏倚,以及队列中女性参与者比例过高可能影响结果的普适性。未来需在更平衡的队列中验证,并探索整合生物标志物等新型数据以进一步提升预测效能。
结论
本研究利用纵向前瞻性队列研究数据,开发并比较了七种ML算法在预测脆性骨折发生率方面的性能。研究发现XGBoost算法的表现略优于其他被测算法。SHAP分析不仅识别了增加脆性骨折风险的关键风险因素,如BMD、维生素D摄入量和年龄,还阐明了这些重要特征如何与其他特征相互作用,这是一个此前鲜有探索的研究领域。