《Frontiers in Neurology》:Screening of biomarkers and machine learning prediction in traumatic brain injury
编辑推荐:
摘要
背景:创伤性脑损伤(traumatic brain injury,TBI)是全球范围内致残和死亡的重要原因。易于获取的血液及激素生物标志物,可能与接受神经康复治疗患者的损伤严重程度及认知状态相关。本研究采用可解释机器学习,探索常规血液参数和激素与TBI
摘要
背景:创伤性脑损伤(traumatic brain injury,TBI)是全球范围内致残和死亡的重要原因。易于获取的血液及激素生物标志物,可能与接受神经康复治疗患者的损伤严重程度及认知状态相关。本研究采用可解释机器学习,探索常规血液参数和激素与TBI中影像学损伤严重程度及认知状态之间的关联。
方法:在这项前瞻性横断面多中心研究中,共纳入154例TBI患者。于入院后1周内采集血样,以评估常规血液学指标、肝肾功能、血脂及激素水平。采用Helsinki CT评分评估损伤严重程度,采用简易精神状态检查量表(Mini-Mental State Examination,MMSE)评估认知状态。经预处理后,数据按7:3比例划分为训练集和验证集。采用最小绝对收缩与选择算子(least absolute shrinkage and selection operator,LASSO)回归进行特征选择,并建立6种机器学习模型。模型性能采用R2、均方误差(mean squared error,MSE)和平均绝对误差(mean absolute error,MAE)进行评估。采用SHapley Additive exPlanations(SHAP)进行解释。
结果:LASSO为Helsinki CT评分识别出8个特征,为MMSE识别出4个特征。随机森林(random forest,RF)在Helsinki CT评分预测中表现最佳(验证集R2 = 0.06),而CatBoost在MMSE预测中表现最佳(验证集R2 = 0.103)。SHAP分析提示,胰岛素样生长因子-1(insulin-like growth factor-1,IGF-1)在两个模型中均为重要特征。IGF-1与两项结局之间均表现出可能的非线性关联。
结论:常规血液及激素生物标志物,尤其是IGF-1,可能与TBI中的影像学损伤严重程度和认知状态相关。这些发现具有探索性,仍需在更大样本的纵向研究中进一步验证。
临床试验注册:中国临床试验注册中心(Chinese Clinical Trial Registry):ChiCTR2300072902。医学研究登记号:MR-11-23-023826。
《Frontiers in Neurology》发表的这项研究聚焦于创伤性脑损伤(traumatic brain injury,TBI)神经康复阶段可及性生物标志物的识别与预测建模问题。TBI是全球范围内导致死亡和长期残疾的重要病因之一,其病理生理过程复杂,涉及神经炎症、氧化应激、线粒体功能障碍以及神经内分泌失衡等多重机制。临床上,患者的影像学损伤严重程度和认知结局存在显著异质性,而现有评估主要依赖神经影像、量表和临床经验。相比之下,常规血液学指标、肝肾功能指标以及激素水平具有获取便捷、成本较低、重复检测可行等优势,因此寻找与TBI严重程度和认知状态相关的外周血生物标志物,具有重要的临床转化意义。已有研究提示,血红蛋白(hemoglobin,Hb)、天冬氨酸氨基转移酶(aspartate aminotransferase,AST)、总蛋白(total protein,TP)以及胰岛素样生长因子-1(insulin-like growth factor-1,IGF-1)等与TBI预后相关,但这些指标与结局之间可能并非简单线性关系,传统回归分析往往难以充分揭示其复杂交互和阈值特征,因此有必要引入可解释机器学习方法进行更深入分析。
研究人员开展了一项前瞻性横断面多中心研究,纳入14家医疗中心的TBI患者,尝试将常规血液与激素指标同影像学损伤严重程度及认知表现相联系。研究以Helsinki CT评分作为影像学损伤严重程度指标,以简易精神状态检查量表(Mini-Mental State Examination,MMSE)作为认知状态指标,通过特征筛选与多模型比较,评估不同生物标志物对上述两类结局的预测价值,并进一步借助可解释人工智能工具揭示变量重要性及潜在非线性模式。最终结果显示,IGF-1在影像学严重程度模型和认知状态模型中均表现为重要特征,提示其可能是连接TBI损伤程度、恢复过程及神经内分泌变化的关键变量。与此同时,Hb、AST、TP、红细胞压积(hematocrit,Hct)和肌酐(creatinine,Cr)等指标也在模型中具有一定贡献。虽然模型验证集R
2值整体较低,说明当前模型预测能力有限,但研究证明了常规血液和激素指标中可能蕴含与TBI临床状态相关的信息,为后续大样本、纵向随访研究提供了探索性证据。
本研究主要方法包括:自14家医疗中心纳入154例TBI患者,剔除数据不完整者后共144例进入统计分析;所有受试者于入院后1周内完成静脉血采集、影像学评估及MMSE测评。研究采用四分位距(interquartile range,IQR)法进行离群值检测,按7:3划分训练集与验证集,并在分组后分别采用LightGBM(LGBM)进行缺失值插补以降低信息泄漏风险。随后利用LASSO回归进行特征筛选,构建K近邻(KNN)、随机森林(RF)、XGBoost、CatBoost、LGBM和多层感知机(MLP)6种模型,使用5折交叉验证优化超参数,并以R
2、MSE和MAE评估性能;最后采用SHAP和偏依赖图(partial dependence plot,PDP)解释模型。
一、Prediction models based on the Helsinki CT score
研究人员以Helsinki CT评分为结局变量构建预测模型。经LASSO回归筛选,进入建模的最优8个特征包括Hb、AST、TP、IGF-1、甲状腺素(thyroxine,T4)、游离三碘甲状腺原氨酸(free triiodothyronine,fT3)、黄体生成素(luteinizing hormone,LH)和孕酮(progesterone,P)。基于这些特征建立6种机器学习模型后,验证集上随机森林模型表现最佳,R
2为0.06。该结果表明,常规血液和激素指标对影像学损伤严重程度具有一定解释能力,但总体预测效能较弱。
在模型解释层面,研究人员应用SHAP框架分析各变量对Helsinki CT评分的贡献。结果显示,IGF-1在6个模型中的5个模型里均为最重要预测因子,且在最优RF模型中亦占据核心地位。这说明IGF-1在反映TBI影像学损伤程度方面具有相对稳定的重要性。进一步结合散点图和PDP分析发现,随着IGF-1、TP和Hb水平升高,CT评分呈现先下降后上升的趋势;而AST升高时,CT评分先升高后下降;P升高则总体对应CT评分下降。这些结果提示,相关生物标志物与影像学严重程度之间可能存在显著非线性关系,而非单向度变化。
二、Prediction models based on the MMSE score
研究人员进一步以MMSE评分为结局变量构建认知状态预测模型。LASSO特征筛选后,共保留4个最优变量,即Hb、Hct、Cr和IGF-1。基于这4项指标建立6种机器学习模型,结果显示CatBoost模型在验证集中的表现最佳,R
2为0.103,优于其他模型,但整体拟合度依然较低。这提示仅凭有限的血液与激素指标,对TBI患者整体认知状态的解释能力仍然有限。
SHAP分析表明,IGF-1在6个模型中的3个模型里为最重要预测变量,但在最优CatBoost模型中,Hb是贡献最大的特征。这说明在认知状态预测中,血液携氧能力相关指标可能比单一激素指标更直接地反映患者认知表现。进一步的散点图及PDP分析显示,Hb、Hct和Cr升高均与更高的MMSE评分相关;IGF-1与MMSE之间则呈现“先升高、后下降、再升高”的非线性变化模式。这一结果提示,IGF-1与认知功能之间的关联可能并非简单的正向或负向关系,而可能反映不同损伤阶段、代偿状态或全身生理背景共同作用下的复杂模式。
三、Discussion
讨论部分指出,本研究的主要价值在于通过可解释机器学习识别TBI神经康复患者中与影像学损伤严重程度和认知状态相关的可及性血液及激素特征。研究结果显示,IGF-1在两个结局模型中均具有重要地位,提示创伤后神经内分泌状态可能对损伤严重程度和功能恢复同时产生影响。文中强调,这一发现具有生物学合理性,因为TBI后垂体功能障碍较常见,而生长激素轴异常可能影响康复轨迹和认知表现。但研究同时明确指出,血清IGF-1不能被简单视为创伤后生长激素缺乏的直接替代指标,也不应据此推定明确临床阈值。
对于Hb和Hct,作者认为其在MMSE模型中的重要性与既往关于贫血和不良TBI结局的研究相一致,提示血液携氧能力下降可能加重继发性脑缺氧,从而影响神经功能恢复。TP和AST进入Helsinki CT模型,则可能反映营养状态、炎症负荷、肝脏合成功能、系统性组织损伤或代谢应激等非脑特异性生理扰动,这些因素虽然不是脑损伤特异指标,但仍可能与脑恢复过程相关。此外,T4、fT3、LH和P在特征筛选中出现,也提示TBI后内分泌监测在部分康复患者中具有潜在意义。
从方法学角度看,研究认为可解释机器学习优于传统线性模型之处在于能够识别非单调关联和变量交互,并通过SHAP可视化各特征对模型输出的影响模式。不过,作者也明确指出,本研究验证集R
2较低,说明模型仅能解释患者间变异中的很小一部分,原因可能包括样本量有限、病程跨度较大、队列临床异质性显著,以及影响TBI结局的诸多重要因素未被纳入,如损伤生物力学特征、病灶分布、治疗强度、康复暴露程度和病前储备等。因此,本研究更适合作为假设生成和特征发现工作,而非直接用于临床高精度预测。
四、Limitations
研究存在若干局限。首先,样本量较小,且病程范围为1—24个月,可能导致不同阶段患者在生物标志物、内分泌状态、影像学表现和认知功能上的异质性增加。其次,尽管多中心均采用统一研究方案,但检测平台、执行细节和临床实践差异仍可能影响结果。再次,本研究重点关注常规血液与激素生物标志物,未构建包含更全面临床混杂因素的综合模型。另由于样本有限、使用多种机器学习模型且仅进行单次训练集-验证集划分,模型稳定性可能受限,较低的验证集R
2也提示预测性能有限。最后,横断面设计无法支持因果推断,因此所有观察到的关联,包括非线性模式,均应视为探索性发现。
五、研究结论翻译
本研究提示,常规血液及激素生物标志物,尤其是IGF-1,可能与接受神经康复治疗的TBI患者的影像学损伤严重程度和认知状态相关。可解释机器学习为识别潜在相关特征及呈现可能的关联模式提供了一种具有可解释性的研究路径。这些发现具有探索性和假设生成性质,仍需在更大样本并具有纵向随访设计的研究中进一步验证。