《Journal of Hepatocellular Carcinoma》:A Machine Learning Guided System for Therapeutic Decision-Making in Intra-Arterial Therapy of Hepatocellular Carcinoma
编辑推荐:
目的 开发并验证一个机器学习引导系统(machine learning-guided system, MLGS),用于基于动脉内治疗(intra-arterial therapy, IAT)前后的临床数据对不可切除肝细胞癌(unresectable hepat
目的 开发并验证一个机器学习引导系统(machine learning-guided system, MLGS),用于基于动脉内治疗(intra-arterial therapy, IAT)前后的临床数据对不可切除肝细胞癌(unresectable hepatocellular carcinoma, uHCC)的预后风险进行分层。方法 2008年4月至2022年6月期间,在15家医院连续纳入5646例接受首次IAT的符合条件的uHCC患者。以5年死亡率作为主要预测结局。将35套临床数据(包括29项术前数据和6项术后数据)依次输入五种监督式机器学习(ML)模型。使用受试者工作特征曲线下面积(area under the receiver operating characteristic curve, AUC)并通过DeLong检验比较各ML模型的性能。采用Kaplan-Meier分析揭示MLGS的总生存期(overall survival, OS)风险分层。结果 这些患者分别被划分为训练数据集(training datasets, TD, n=3387)、内部测试数据集(internal testing datasets, ITD, n=1130)和外部测试数据集(external test datasets, ETD, n=1129)。在基于术前数据的ML模型中,使用23个变量的CatBoost模型取得了最佳区分能力,其在三个数据集中的AUC为0.777–0.735。同时,使用20个术后变量的XGBoost模型取得了最佳区分能力,其在三个数据集中的AUC为0.904–0.861,显著优于CatBoost模型的性能(DeLong检验, P < 0.001)。基于XGBoost模型的MLGS在三个数据集中的三个风险分层之间提供了显著差异的OS(均P < 0.001)。结论 MLGS可能指导放射科医生为uHCC制定IAT策略。需要前瞻性研究评估其临床效用。
**研究背景与问题**
肝细胞癌(hepatocellular carcinoma, HCC)约占原发性肝脏恶性肿瘤的90%,是全球第六大常见癌症和第三大癌症相关死亡原因。对于不可切除肝细胞癌(unresectable HCC, uHCC),动脉内治疗(intra-arterial therapy, IAT)包括肝动脉灌注化疗(hepatic arterial infusion chemotherapy, HAIC)和经动脉化疗栓塞术(transarterial chemoembolization, TACE),是临床标准治疗。国际指南推荐TACE作为中期HCC的一线治疗,而HAIC在亚洲人群中已成为中晚期HCC的重要治疗选择。近年证据表明,IAT联合分子靶向药物(molecular-targeted agents, MATs)和免疫检查点抑制剂(immune checkpoint inhibitors, ICIs)可产生深度而持久的疗效;基于IAT的转化治疗后序贯局部区域治疗(如手术切除、肝移植、热消融)可显著提高uHCC患者的长期生存。然而,现有预测模型受限于数据不足和计算能力有限,对IAT预后预测能力欠佳。HCC在组织学、基因组和分子水平上存在显著的肿瘤异质性,且治疗决策因肿瘤对IAT的反应和疾病进展而异,导致患者预后个体差异大。目前缺乏无创、便捷、准确的模型来指导临床医生进行IAT决策。研究人员假设结合术后变量的机器学习(machine learning, ML)模型在预测5年死亡率方面将优于仅术前模型和现有分期系统,因此开展本研究以开发和验证一个基于临床数据的ML模型,为IAT治疗决策和监测策略提供指导。该论文发表在《Journal of Hepatocellular Carcinoma》。
**关键技术与方法**
研究人员开展了一项回顾性多中心研究,从中国15家三级医院连续纳入5646例接受首次IAT的uHCC患者(2008年4月至2022年6月)。收集30项术前和6项术后临床变量,采用五种监督式ML算法(XGBoost、CatBoost、GBDT、LGBM、随机森林[Random Forest, RF])进行模型构建。使用5年死亡率作为主要预测结局,通过受试者工作特征曲线下面积(AUC)和DeLong检验比较模型性能,并利用Kaplan-Meier分析和Log rank检验评估MLGS的风险分层。采用SHAP(SHapley Additive exPlanations)方法解释模型预测结果。数据划分为训练数据集(TD,n=3387)、内部测试数据集(ITD,n=1130)和外部测试数据集(ETD,n=1129)。
**研究结果**
- **基线特征**:纳入的5646例患者中,男性4930例,女性716例,中位年龄57岁。三个数据集间的基线特征均衡(均P>0.05)。
- **ML模型预测性能比较**:基于术前数据,CatBoost模型使用23个变量获得最佳区分能力,AUC在TD、ITD、ETD中分别为0.777、0.743、0.735;基于术后数据,XGBoost模型使用20个变量取得最佳区分能力,AUC分别为0.904、0.886、0.862,显著优于CatBoost模型(DeLong检验,P<0.001)。
- **ML模型的解释方法**:通过SHAP分析发现,早期复发(early recurrence, ER)是预后不良的最强关联因素;首次IAT无客观反应(non-OR)是第二大风险因素;单纯IAT治疗较IAT联合序贯局部治疗或靶向免疫治疗有更高的不良结局风险;甲胎蛋白(AFP)>400 ng/mL、肿瘤直径>10 cm或多发肿瘤(>3个)与更差预后相关。
- **MLGS的预后风险分层**:基于术前和术后MLGS的截断值(22.34、76.25),患者被分为低、中、高风险组。在TD中,低风险组1、3、5年累积OS率分别为87.8%、62.1%、49.1%,中风险组为63.2%、33.4%、25.4%,高风险组为35.9%、13.0%、8.9%(MLGS-pre模型,P<0.001);MLGS-post模型中低风险组1、3、5年OS率分别为98.3%、81.7%、65.8%,中风险组为68.0%、22.1%、13.5%,高风险组为20.5%、1.7%、0%(P<0.001)。在ITD和ETD中结果一致。
- **MLGS与肿瘤分期及生物标志物的预测准确性比较**:时间依赖性AUC分析显示,MLGS在各时间点的OS预测性能显著优于白蛋白-胆红素(ALBI)分级、血小板-白蛋白-胆红素(PALBI)分级、血小板-淋巴细胞比值(PLR)、中性粒细胞-淋巴细胞比值(NLR)、终末期肝病模型(MELD)评分以及BCLC、JSH、AJCC TNM、EASL、CNLC等分期系统(Log rank检验,P<0.001)。MLGS-post的整合Brier评分(IBS)在TD、ITD、ETD中分别为0.17、0.14、0.22,校准曲线接近理想化45°线,决策曲线分析显示其临床净获益更大。
- **MLGS的临床价值**:MLGS通过术前模型提供个体化预后风险评分,并将患者分层;术后输入肿瘤复发、IAT反应、序贯治疗等变量后,风险评分动态变化,可指导临床医生在IAT过程中调整治疗方案和监测策略。
**总结与结论**
讨论部分指出,MLGS能有效将接受IAT的HCC患者分为三个具有显著不同长期OS的风险组,并可视化死亡率风险的动态变化,有助于个体化决策,减少未来死亡率、治疗相关副作用和经济负担。研究优势包括大样本多中心外部验证、变量范围广、采用五种ML算法比较、性能优于国际公认临床和生物标志物。SHAP分析揭示的风险因素与近期全球III期随机临床试验(EMERALD-1)结果一致,强调了联合治疗的价值。与其他仅关注单一治疗决策的模型不同,MLGS基于动态风险轨迹,可更精确地制定个体化IAT方案。研究局限性包括多中心方案差异可能引入异质性、药物多样性影响、中国人群特征限制其向西方推广等。结论:MLGS准确分层预后风险,有助于识别可能从更密集监测或辅助治疗中获益的高风险患者。需要前瞻性研究评估其临床效用。