《Applied Sciences》:Early Prediction of Well-Being Outcomes in Older Adults Using Explainable AI and Emotional Intelligence Measures
Evgenia Kouli,
Evangelos Bebetsos,
Maria Michalopoulou and
Filippos Filippou
编辑推荐:
背景:老年人幸福感(well-being)受复杂的情绪与社会因素共同塑造。及早识别幸福感下降风险较高的个体,可能有助于及时开展预防性或支持性干预。本研究检验了:在基线时收集的情绪智力指标,是否能够借助可解释机器学习模型预测5个月后的幸福感状态。方法:纳入年龄6
背景:老年人幸福感(well-being)受复杂的情绪与社会因素共同塑造。及早识别幸福感下降风险较高的个体,可能有助于及时开展预防性或支持性干预。本研究检验了:在基线时收集的情绪智力指标,是否能够借助可解释机器学习模型预测5个月后的幸福感状态。方法:纳入年龄60至89岁的老年参与者队列,于基线完成情绪智力量表测量,并于5个月后采用心境状态量表(POMS)评估幸福感。研究人员构建了4种机器学习算法,即逻辑回归(LR)、支持向量机(SVM)、随机森林(RF)和极端梯度提升(XGBoost),并采用5折分层交叉验证。模型性能通过准确率、精确率、召回率、F1值、ROC曲线下面积(ROC AUC)及标准化混淆矩阵进行评估。采用Shapley加性解释(SHAP)解析各预测变量的贡献及方向性。结果:XGBoost取得最高预测性能(accuracy = 0.789;F1 = 0.778),且在不同幸福感类别间表现出均衡分类能力。SVM同样表现稳健(accuracy = 0.760),而LR在识别幸福感较差者方面敏感性较低。SHAP分析表明,自我控制、情绪性、社交性、自我激励与幸福感成分是最具影响力的预测因子。较低的情绪性、较高的社交性以及较高的自我控制得分,与更有利的幸福感结局概率增大相关。结论:研究结果表明,在本老年样本中,利用可解释机器学习模型基于情绪智力指标预测5个月后的幸福感状态具有可行性。XGBoost表现出最强且最均衡的性能,而SHAP分析进一步阐明了特定情绪智力维度如何影响预测结果。这些发现提示,可解释机器学习方法有望支持未来对幸福感下降风险老年人的早期识别,并为个体化干预策略提供指导。
本文发表于《Applied Sciences》,研究聚焦于老年阶段幸福感(well-being)的前瞻性预测问题。现有研究普遍认为,幸福感并非单一心理状态,而是涵盖情绪、心理与主观体验的多维构念,并与健康老龄化、心理韧性、寿命延长及总体群体健康密切相关。然而,相关领域长期存在概念界定不统一的问题,心理幸福感、心理健康与主观幸福感等术语常被交替使用,导致测量工具选择、研究结果比较与干预目标设定均受到限制。与此同时,情绪智力(emotional intelligence)被视为老年期重要的心理资源,其在情绪识别、情绪理解、情绪调节、社会交往与生活满意度维持方面具有关键作用。既往研究虽然提示情绪智力与老年人幸福感存在显著关联,但多依赖传统回归模型或横断面设计,较难捕捉非线性关系、变量交互作用及个体间异质性,也缺乏足够透明的解释机制。因此,开展一项结合可解释人工智能(XAI)与机器学习(ML)的前瞻性研究,对于提高老年人幸福感风险识别的时效性、精确性与可解释性具有现实必要性。
研究人员围绕这一问题,构建并评估了多种可解释机器学习模型,以基线情绪智力指标预测5个月后的幸福感状态。研究对象为来自希腊Komotini地区老年人开放照护中心(KAPI)的67名老年人,年龄60—89岁,平均年龄为69.67 ± 5.47岁。研究人员在基线阶段采用特质情绪智力量表简式版(TEIQue-SF,Trait Emotional Intelligence Questionnaire–Short Form)收集情绪智力相关信息,5个月后采用心境状态量表(POMS,Profile of Mood States)评估幸福感。为构建二分类结局变量,研究人员以样本内POMS总分中位数为阈值,将得分低于或等于中位数者划为较好幸福感组,将高于中位数者划为较差幸福感组,从而形成近似平衡的两类样本。之所以采用中位数划分,是因为POMS在社区老年人群中缺乏公认的临床截断值,同时这一处理有助于减轻小样本机器学习分类中的类别失衡问题。研究结论显示,基于情绪智力基线指标对老年人中期幸福感状态进行预测具有可行性,其中XGBoost在整体准确性及类别均衡性方面表现最佳,SVM也显示出较强区分能力;模型解释结果进一步提示,自我控制、情绪性、社交性、自我激励与幸福感维度共同影响预测输出。该研究的重要意义在于,它不仅验证了可解释机器学习在老年心理健康风险筛查中的应用潜力,也为社区老年照护场景下开展个体化、前瞻性支持提供了方法学基础。
在方法上,研究人员采用前瞻性随访设计,样本来源为希腊Komotini市老年人开放照护中心(KAPI)。数据预处理包括对不超过5%的分类变量缺失值进行众数插补,并使用StandardScaler实施标准化。研究在5折分层交叉验证框架内进行顺序前向特征选择(SFFS),并分别针对逻辑回归(LR)、支持向量机(SVM)、随机森林(RF)与极端梯度提升(XGBoost)独立建模;模型调参在训练折内部通过嵌套5折分层交叉验证完成,以避免数据泄漏与乐观偏倚。性能评估指标包括accuracy、precision、recall、F1-score、ROC AUC及标准化混淆矩阵;模型解释采用Shapley加性解释(SHAP)分析特征重要性及作用方向。
在结果部分,论文首先总体说明,4种机器学习模型均用于预测基线后5个月的幸福感状态,并在5折分层交叉验证下比较其表现。结果显示,不同模型在处理两类结局时存在明显差异,这种差异不仅体现在整体评价指标上,也可从混淆矩阵所反映的分类偏倚模式中观察到。
在“LR produced moderate predictive performance”部分,研究人员指出,逻辑回归模型呈现中等水平预测效能。该模型准确率为73.19%,其总体表现主要受对Class 0的较强识别能力驱动。混淆矩阵显示,LR能够正确识别78.1%的Class 0个体,但对Class 1的识别率仅为68.1%。这一不平衡也体现在精确率0.781与召回率0.681的差异上,说明其对阳性预测相对可靠,但会遗漏接近三分之一的Class 1参与者。F1值为0.727,ROC AUC为0.6966,进一步表明LR虽具备基础预测能力,但在较差幸福感个体的识别上相对不足。该结果提示,预测变量与结局之间的关系可能并非严格线性。
在“The SVM classifier demonstrated a clear improvement over LR”部分,研究人员报告,支持向量机模型较LR有明确提升,并在两类之间实现更均衡的识别。SVM准确率为76.04%,对Class 0和Class 1的正确识别率分别为75.2%和76.7%,显示其对数据底层结构的把握更充分,较少偏向任一类别。其精确率为0.765、召回率为0.767,二者几乎相同,对应稳定的F1值0.760。尤其值得注意的是,SVM获得所有模型中最高的ROC AUC,为0.8279,提示其在不同判别阈值下具有最强区分能力。这表明采用RBF核的非线性决策边界较适合该预测空间的复杂性。
在“Random Forest demonstrated stable predictive performance”部分,研究人员发现,随机森林模型表现稳定,平均准确率为74.62%,与LR相近但略低于SVM。混淆矩阵显示,RF可正确分类82.9%的Class 0个体,但对Class 1的正确识别率仅为68.6%。这一模式说明,RF更擅长识别幸福感较好者,而在识别较差幸福感结局方面敏感性有所下降。该模型精确率最高,为0.838,召回率为0.686,F1值为0.710,ROC AUC为0.763,表明其具有令人满意但不够均衡的区分能力。
在“XGBoost achieved the highest overall accuracy and F1-score”部分,研究人员指出,XGBoost在所评估模型中取得最高总体准确率和F1值。其准确率为78.90%,优于LR和SVM,同时在两类结局之间保持高度平衡的分类表现。混淆矩阵显示,模型对Class 0和Class 1的正确识别率分别为78.1%和78.6%,几乎完全对称,体现出较强泛化能力以及对任一类别的最小偏倚。该模型精确率为0.790、召回率为0.786、F1值为0.778,均显示出稳健预测能力。尽管其ROC AUC为0.769,低于SVM,但从灵敏度与精确率的整体平衡来看,XGBoost表现最佳。研究人员据此认为,该模型可能更能捕捉传统线性模型难以识别的非线性模式及高阶交互作用。
在“FS identified 12 influential predictors”部分,论文说明,通过特征选择(FS)共识别出12个关键预测因子,这些变量主要来自情绪性、自我控制、社交性、自我激励和幸福感等情绪智力领域,表明老年幸福感的中期预测依赖于多维情绪智力构成,而非单一心理特质。
在“The SHAP bee swarm plot provides a global overview of feature importance”部分,研究人员进一步利用SHAP蜂群图解释最佳模型的内部决策逻辑。结果显示,TEIQue_SF_selfcontrol_22*、TEIQue_SF_emotionality_28*和TEIQue_SF_sociability_6是对5个月幸福感预测影响最大的特征。总体模式表明,较高特征取值通常对应正向SHAP值,即推动预测偏向较好幸福感类别;较低取值则更多与负向SHAP值相关,倾向于较差幸福感分类。中等重要度的预测因子包括TEIQue_SF_wellbeing_12*、TEIQue_SF_sociability_26*及TEIQue_SF_sociability_11,它们表现出方向类似但效应稍弱的影响。较低重要度特征则体现出更个体化的作用模式。综合而言,SHAP结果支持这样一种认识:情绪性、社交性、自我控制和自我激励等多个维度以非线性方式共同塑造模型对幸福感结局的分类。
在讨论部分,研究人员总结认为,本研究证明了使用机器学习模型根据基线情绪智力指标预测老年人5个月后幸福感状态的可行性。与其他模型相比,XGBoost在分类准确率和类别平衡性方面最优,提示非线性建模方法更适合处理情绪与行为预测因子背后的复杂关系;SVM在ROC AUC上同样表现突出,而LR在识别幸福感较差者时相对较弱。SHAP分析则揭示了若干特质情绪智力条目、社会功能相关条目与预测分类之间的统计关联,尤其是行为性自我调节、关系联结能力、人际效能以及乐观—阴郁相关条目具有较强贡献。论文同时强调,SHAP值表示的是模型内部的特征贡献,不能被解释为因果关系。研究还指出,特征在不同个体中的双向影响反映出老年阶段情绪、社会和动机过程与幸福感关系的异质性,这一现象也可能受到反向计分条目、老年群体应答模式以及情绪状态相关认知偏差等测量因素影响。
对于局限性,研究人员明确指出,样本量较小(N = 67),统计功效与推广性均受限制;样本以女性为主,性别分布失衡;模型虽采用嵌套交叉验证,但尚未在独立外部数据集上验证;研究对象仅来自希腊单一城市的两家KAPI中心,因此结果可能受到社会文化背景影响;情绪智力与幸福感测量均依赖自陈问卷;此外,以中位数划分幸福感虽有助于分类建模和类别平衡,但也会压缩连续信息、掩盖更细微的幸福感梯度。因此,本文结果应被视为探索性和概念验证性质的证据,而非可直接外推的定论。
结论部分可译为:研究结果表明,在当前样本中,利用可解释机器学习模型根据基线情绪智力指标预测5个月后的幸福感状态具有可行性。XGBoost表现出最强的总体性能,能够在两类幸福感类别之间实现准确且平衡的分类。SHAP可解释性分析进一步阐明了关键情绪智力成分的作用,显示与自我控制、情绪性、社交性、自我激励和幸福感相关的特征如何共同影响预测结果。这些发现强调,老年人幸福感受到多种相互作用的情绪与社会因素塑造,而机器学习方法,尤其是能够建模复杂交互作用的方法,可以有效捕捉这些关系。重要的是,本研究采用的可解释框架提升了模型的透明度与实际应用价值,使研究人员和实践者能够理解模型为何给出特定预测。总之,可解释机器学习代表了探索较差幸福感结局风险个体早期识别的一条有前景的研究方向。然而,在更大规模且独立样本中完成重复验证和外部验证之前,当前发现仍应被视为初步结果。未来研究应在更大样本中验证这些模型,探索更多行为学预测因子,并检验如何将预测输出整合至有针对性的个体化支持策略之中。