《Frontiers in Immunology》:A multicenter prospective cohort study developing and validating a SIRI-based machine learning model and simplified risk score for predicting postherpetic neuralgia
编辑推荐:
**背景**:带状疱疹后神经痛(postherpetic neuralgia,PHN)是带状疱疹(herpes zoster,HZ)最常见且最严重的并发症,早期识别高危患者仍是临床面临的主要挑战。系统炎症反应指数(systemic inflammatory r
**背景**:带状疱疹后神经痛(postherpetic neuralgia,PHN)是带状疱疹(herpes zoster,HZ)最常见且最严重的并发症,早期识别高危患者仍是临床面临的主要挑战。系统炎症反应指数(systemic inflammatory response index,SIRI)是一种新型炎症标志物,已在多种疾病中显示出预后价值,但迄今为止,其与PHN发生风险之间的关联尚未见报道。现有的PHN预测模型大多依赖传统回归方法,预测性能有限,且缺乏临床实用的风险分层工具。
**方法**:经筛选合格并完成随访后,最终纳入杭州市第三人民医院1135例患者和浙江中医药大学附属第二医院226例患者进行统计学分析。将1135例入组患者按3:1的比例分层随机分为模型开发训练集和内部验证集,226例患者数据作为独立的外部验证集。首先通过单因素Logistic回归(Logistic regression,LR)和共线性诊断筛选36个候选预测因子,随后采用最小绝对收缩和选择算子(Least Absolute Shrinkage and Selection Operator,LASSO)回归结合10折交叉验证识别核心预测因子。最终比较8种机器学习算法的预测性能,并基于SHapley Additive exPlanations(SHAP)分析构建简化风险评分表。
**结果**:最终共纳入1361例患者,随访期间511例(37.55%)发生PHN。多因素二元LR证实SIRI是PHN的独立预测因子(比值比[odds ratio,OR]=1.448,95%置信区间[confidence interval,CI] 1.119–1.874,P=0.005)。LASSO回归识别出6个核心预测变量:年龄、SIRI、数字评定量表(numerical rating scale,NRS)评分、就诊时间、皮疹部位和中性粒细胞-白蛋白比值(neutrophil-to-albumin ratio,NAR)。极端梯度提升(eXtreme Gradient Boosting,XGBoost)模型表现出最优的预测性能,受试者工作特征曲线下面积(area under the receiver operating characteristic curve,AUC)在训练集为0.889(95%CI 0.868–0.910),内部验证集为0.857(95%CI 0.813–0.901),外部验证集为0.900(95%CI 0.860–0.940)。SHAP分析显示SIRI在模型特征贡献中排名第二(20.1%),基于SHAP值构建的简化风险评分表在外部验证集中AUC达0.904(95%CI 0.867–0.941)。
**结论**:该研究首次证实SIRI是PHN发生的独立预测生物标志物。基于SIRI的XGBoost模型展现出优异的预测性能,所开发的简化风险评分表具有高度的临床实用性,其中建议对风险评分≥18分的患者进行早期积极干预以降低PHN发生率。
该研究发表于《Frontiers in Immunology》,旨在解决带状疱疹后神经痛(PHN)早期风险识别这一临床难题。PHN是带状疱疹(HZ)最常见且严重的并发症,中国年发病率约7.7%,约29.8%的HZ患者进展为PHN,导致长期剧烈疼痛,严重影响患者生活质量。然而,临床缺乏高效便捷的早期识别工具,现有预测模型多基于单中心回顾性队列,采用传统Logistic回归方法,受试者工作特征曲线下面积(AUC)多集中于0.70至0.80,预测性能有限且缺乏外部验证。系统炎症反应指数(SIRI)作为新型复合炎症指标,同时整合两种先天免疫细胞(中性粒细胞和单核细胞)及适应性免疫成分(淋巴细胞),能更全面评估机体炎症-免疫稳态,已在心血管疾病、卒中相关肺炎及恶性肿瘤预后预测中展现价值,但此前未有研究探讨其与PHN风险的关联。
研究人员基于多中心前瞻性队列设计,严格遵循《个体预后或诊断多变量预测模型透明报告》(Transparent Reporting of a multivariable prediction model for Individual Prognosis Or Diagnosis,TRIPOD)声明开展研究。从杭州市第三人民医院和浙江中医药大学附属第二医院共纳入1361例急性HZ患者,其中1135例来自第一中心,按3:1随机分为训练集(849例)和内部验证集(286例);另226例来自第二中心,作为独立外部验证集。主要结局为皮疹发作后90±7天内PHN的发生。所有基线数据于患者首诊24小时内、接受任何全身性治疗前完成采集,实验室参数均为空腹肘静脉血首次检测结果。
研究采用的主要技术方法包括:通过单因素Logistic回归筛选候选变量,方差膨胀因子(variance inflation factor,VIF)进行共线性诊断;采用最小绝对收缩和选择算子(Least Absolute Shrinkage and Selection Operator,LASSO)回归结合10折交叉验证及1-标准误(1-standard error,1-se)规则筛选核心变量;构建并比较8种机器学习算法(Logistic回归、决策树、随机森林、XGBoost、Light Gradient Boosting Machine梯度提升机、支持向量机、K近邻算法及单隐藏层神经网络),采用网格搜索结合10折交叉验证进行超参数优化;运用SHapley Additive exPlanations(SHAP)进行模型可解释性分析;基于SHAP值和变量最优截断值构建简化临床风险评分表,并通过内部验证集和独立外部验证集进行性能评估。
研究结果部分按以下结构展开:
**HZ患者基线特征分析**
最终纳入1361例患者,617例男性(45.33%),744例女性(54.67%),平均年龄(62.90±12.62)岁。随访结束时511例(37.55%)进展为PHN。组间比较显示PHN组与非PHN组在年龄、中性粒细胞-白蛋白比值(NAR)、球蛋白、白蛋白、就诊时间、SIRI、肌酐、水痘-带状疱疹病毒免疫球蛋白G(VZV-IgG)、单核细胞计数、中性粒细胞-淋巴细胞比值(neutrophil-to-lymphocyte ratio,NLR)、NRS评分、前驱痛、皮疹部位、高血压、糖尿病、抗抑郁或抗焦虑药物使用、睡眠障碍及免疫抑制状态方面存在显著差异(均P<0.05)。经Bonferroni校正后,年龄、白蛋白、就诊时间、SIRI、肌酐、单核细胞计数、NRS评分、皮疹部位、高血压、糖尿病、睡眠障碍的组间差异仍然显著(α=0.0014)。
**预测因子筛选及SIRI独立预测价值**
训练集与验证集基线特征无显著差异(均P>0.05)。单因素Logistic回归分析筛选出年龄、NRS评分、就诊时间、皮疹部位、高血压、糖尿病、睡眠障碍、超敏C反应蛋白(high-sensitivity C-reactive protein,hs-CRP)、中性粒细胞百分比、嗜酸性粒细胞百分比、淋巴细胞计数、单核细胞计数、中性粒细胞计数、NLR、C反应蛋白-淋巴细胞比值(C-reactive protein-to-lymphocyte ratio,CLR)、NAR、SIRI、白蛋白、肌酐、球蛋白、VZV-IgG及低密度脂蛋白(low-density lipoprotein,LDL)等潜在影响因素(P<0.05)。共线性诊断排除方差膨胀因子>5的变量后,多因素二元Logistic回归证实SIRI为PHN独立预测因子(OR=1.448,95%CI 1.119–1.874,P=0.005)。LASSO回归在惩罚因子λ=0.0278(1-se规则)时,筛选出6个非零系数核心预测变量:年龄、NRS评分、就诊时间、SIRI、胸背部皮疹(location_X2)和NAR。受试者工作特征曲线分析显示,纳入SIRI的6变量预测模型训练集AUC为0.890(95%CI 0.869–0.911),显著高于不含SIRI的5变量模型(AUC=0.838,95%CI 0.811–0.865)。
**机器学习模型的构建与内部验证**
为全面评估模型性能,研究报道了AUC、敏感度、特异度、准确率、精确率-召回率曲线下面积(Precision-Recall Area Under the Curve,PR-AUC)、Brier评分、F1分数、阴性预测值、阳性预测值、Youden指数和Kappa系数等11项指标。8种模型性能比较显示,XGBoost、Light Gradient Boosting Machine和随机森林在训练集中预测性能最佳。其中随机森林模型训练集与测试集AUC差值为0.112(>0.05),而XGBoost模型差值仅0.032(<0.05),无明显过拟合,泛化能力优异。在测试集中,XGBoost模型AUC(0.857)、准确率(0.758)、PR-AUC(0.776)和F1分数(0.693)均为最高,Brier评分最低(0.139),敏感度(0.812)与特异度(0.730)平衡良好。校准曲线显示XGBoost、Logistic回归和K近邻算法的拟合度最佳;决策曲线分析(Decision Curve Analysis,DCA)显示XGBoost曲线在整个阈值范围内始终位于"全部治疗"和"不治疗"两极端策略曲线之上,未见负净获益,临床适用性最广。综合评估后,XGBoost、随机森林和Light Gradient Boosting Machine入选前3名最优模型。
**最优模型的独立外部验证**
三种模型在外部验证集中的性能比较显示,XGBoost模型AUC最高(0.900),其次为Light Gradient Boosting Machine(0.879)和随机森林(0.877)。校准曲线显示XGBoost模型预测概率与实际观察发病率一致性最优;DCA进一步证实其在多数临床相关阈值概率范围内提供最高临床净获益。XGBoost模型在外部验证集中仍保持最优且稳健的预测性能,准确率、特异度、F1分数、Youden指数和Kappa系数均为三种模型中最高,Brier评分较低,进一步确认了良好的跨中心泛化能力,被确定为最终最优PHN风险预测模型。
**SIRI的增量预测价值**
为阐明SIRI的增量预测价值,研究构建并比较了四种模型:仅临床特征模型(年龄、NRS评分、就诊时间、皮疹部位)、仅实验室指标模型(SIRI、NAR)、临床+SIRI模型、以及最终XGBoost模型(6个核心变量)。结果显示,向仅临床特征模型中加入SIRI后,训练集AUC从0.850提升至0.881,内部验证集从0.814提升至0.856。尤为重要的是,临床+SIRI模型在三组队列中均展现出显著改善的稳健性:内部验证集与外部验证集AUC差值从仅临床特征模型的0.090降至0.045,提示SIRI有效缓解了过拟合并增强了模型泛化能力。在独立外部验证集中,临床+SIRI模型保持了0.901的优异判别能力,与最终XGBoost模型(0.900)近乎一致,仅增加一个常规实验室参数即可实现。
**最优模型的可解释性分析**
特征重要性条形图显示,年龄、SIRI、就诊时间、NRS评分、NAR和胸背部皮疹为对模型预测结果贡献最高的6个特征,其中SIRI贡献排名第二,约占20.1%。SHAP全局蜂群图直观展示了各特征高值对应正SHAP值,提示其与PHN发生风险增加相关。
**风险评分表的构建与验证**
最终建立的评分系统理论总分范围为5至24分,研究人群实际观察总分范围为6至24分。根据训练集ROC曲线最大Youden指数确定总风险评分最优截断值为18分,据此将研究人群分为低风险(6–12分)、中风险(13–17分)和高风险(18–24分)三层。该PHN临床风险评分表现出稳健且良好的预测性能:训练集AUC为0.803,内部验证集为0.813,外部验证集为0.904。校准曲线在三组队列中均显示预测PHN风险与实际观察发病率具有良好一致性;决策曲线分析显示,在0.05至0.9的阈值概率范围内,风险评分较"全部治疗"和"不治疗"默认策略均提供显著更高的临床净获益,且在独立外部验证集中保持优势净获益。
讨论部分,研究人员首先分析了本研究PHN发生率(37.55%)略高于国内流行病学数据(29.8%)的原因:两中心均为省级三甲综合医院,纳入患者急性期疼痛更严重、老年患者比例更高,属于PHN高危人群。研究纳入的6个指标充分覆盖PHN发生的病理环节:年龄是公认的核心危险因素,与T细胞功能减退、VZV清除效率降低及神经炎性损伤持续加重相关;急性期疼痛程度(NRS评分)直接反映病毒复制所致神经损伤;就诊时间是唯一可干预危险因素,延迟就诊将错过抗病毒和疼痛干预最佳窗口期;胸背部皮疹涉及更广泛皮节和神经损伤范围;SIRI和NAR作为新型复合炎症-营养标志物,分别从免疫炎症应答和营养储备角度互补评估神经损伤潜在风险。
研究的核心创新在于首次系统整合SIRI和NAR,弥补了既往PHN预测研究缺乏客观量化生物标志物的不足。SIRI作为同时整合先天免疫和适应性免疫成分的复合指标,可通过常规血检计算,便捷且成本低。多因素分析证实在调整急性期干预措施等混杂因素后,SIRI仍为PHN独立危险因素(OR=1.448),SHAP分析显示其贡献度排名第二。NAR整合炎症激活与营养抗氧化能力,反映机体营养状态和抗氧化损伤能力。两者虽均含中性粒细胞信息,但反映不同的病理生理维度,无生物学冗余。
与传统Logistic回归模型相比,XGBoost作为梯度提升集成算法,能够通过残差迭代拟合自动挖掘变量间复杂交互效应,克服传统模型仅能捕捉线性关系的局限。针对机器学习"黑箱效应"问题,研究通过SHAP值进行全面可解释性分析,帮助临床医师理解决策依据。基于SHAP值和最优截断值开发的简化风险评分表仅需6个指标,无需复杂计算工具,通过病史询问和入院常规检验即可完成快速床旁风险分层,解决了既往模型难以在基层推广的痛点。该评分表在训练集、内部验证集和外部验证集中保持稳定预测性能,阴性预测值高达94.4%,能有效排除低风险患者、减少不必要的过度治疗;以18分为最优截断值可有效识别高危患者。
研究还对误分类患者进行特征分析:210例假阳性患者多具高龄、长就诊时间等危险因素,但急性期疼痛较轻、SIRI水平较低,提示临床需结合整体情况审慎判断;75例假阴性患者多为老年人,提示即使模型评分处于低危范围,仍需密切随访和积极疼痛干预。
研究结论部分翻译如下:基于多中心前瞻性队列,该研究首次证实SIRI是PHN发生的独立预测生物标志物。由SIRI、年龄、NRS评分、就诊时间、皮疹部位和NAR等6个核心变量构建的XGBoost机器学习模型在训练集、内部验证集和独立外部验证集中均展现出卓越的判别能力、校准度和临床净获益,预测性能显著优于传统Logistic回归模型及其他机器学习模型。基于SHAP开发的简化风险评分表仅需常规临床和实验室指标即可完成快速风险分层,具有极强的临床实用性。该研究为PHN早期风险评估提供了循证工具,建议对评分≥18分的高危患者进行早期积极干预以降低PHN风险,实现了PHN的早期精准风险评估,为临床个体化治疗方案制定提供了重要依据。