
-
生物通官微
陪你抓住生命科技
跳动的脉搏
预测中国中学生中的自杀倾向:一种结合XGBoost和SHAP解释的机器学习方法
《BMC Public Health》:Predicting adolescent suicidal tendency in Chinese secondary school students: a machine learning approach with XGBoost and SHAP interpretation
【字体: 大 中 小 】 时间:2026年06月02日 来源:BMC Public Health 3.6
编辑推荐:
摘要背景青少年自杀是全球范围内一个严重的公共卫生问题。由于其隐蔽性和多维性,早期发现自杀倾向仍然具有挑战性。本研究旨在开发并验证一个可解释的机器学习模型,以预测中国中学生的自杀倾向。方法对中国苏州的12,063名学生进行了横断面调查,收集了包括人口统计、心理和行为因素在内的23个
青少年自杀是全球范围内一个严重的公共卫生问题。由于其隐蔽性和多维性,早期发现自杀倾向仍然具有挑战性。本研究旨在开发并验证一个可解释的机器学习模型,以预测中国中学生的自杀倾向。
对中国苏州的12,063名学生进行了横断面调查,收集了包括人口统计、心理和行为因素在内的23个变量。开发了7种机器学习模型(LR + LASSO、LightGBM、SVM、KNN、DT、RF和XGBoost),并使用五折交叉验证进行了比较。模型性能通过AUC、敏感性、特异性、校准曲线和决策曲线分析进行评估。特征重要性通过SHAP值进行解释。
在参与者中,21.98%表现出自杀倾向。XGBoost在验证集上的表现优于其他模型,AUC为0.802(95%置信区间:0.785–0.818),敏感性为0.686,特异性为0.758,阴性预测值为0.892。前三大预测因子是抑郁情绪(PHQ2)、自我不满(PHQ6)和不愿寻求帮助。SHAP分析显示,情绪困扰严重且不愿寻求帮助的男性学生构成了高风险亚群。
基于XGBoost的模型在识别有自杀风险的青少年方面表现出强大的预测能力和临床可解释性。这突显了在学校筛查项目中整合心理和行为因素的重要性,特别是对于那些未被充分认识到的亚群,如避免寻求帮助的困扰男性。
青少年自杀是全球范围内一个严重的公共卫生问题。由于其隐蔽性和多维性,早期发现自杀倾向仍然具有挑战性。本研究旨在开发并验证一个可解释的机器学习模型,以预测中国中学生的自杀倾向。
对中国苏州的12,063名学生进行了横断面调查,收集了包括人口统计、心理和行为因素在内的23个变量。开发了7种机器学习模型(LR + LASSO、LightGBM、SVM、KNN、DT、RF和XGBoost),并使用五折交叉验证进行了比较。模型性能通过AUC、敏感性、特异性、校准曲线和决策曲线分析进行评估。特征重要性通过SHAP值进行解释。
在参与者中,21.98%表现出自杀倾向。XGBoost在验证集上的表现优于其他模型,AUC为0.802(95%置信区间:0.785–0.818),敏感性为0.686,特异性为0.758,阴性预测值为0.892。前三大预测因子是抑郁情绪(PHQ2)、自我不满(PHQ6)和不愿寻求帮助。SHAP分析显示,情绪困扰严重且不愿寻求帮助的男性学生构成了高风险亚群。
基于XGBoost的模型在识别有自杀风险的青少年方面表现出强大的预测能力和临床可解释性。这突显了在学校筛查项目中整合心理和行为因素的重要性,特别是对于那些未被充分认识到的亚群,如避免寻求帮助的困扰男性。
生物通微信公众号