机器学习引导系统用于肝细胞癌动脉内治疗的治疗决策

首页今日动态人才市场新技术专栏中国科学人云展台
BioHot
云讲堂直播会展中心特价专栏技术快讯免费试用

生物通官微
陪你抓住生命科技
跳动的脉搏

生物通首页 > 今日动态 > 正文

《Journal of Hepatocellular Carcinoma》：A Machine Learning Guided System for Therapeutic Decision-Making in Intra-Arterial Therapy of Hepatocellular Carcinoma

【字体：大中小】 时间：2026年06月19日 来源：Journal of Hepatocellular Carcinoma 3.4

编辑推荐：

　　目的开发并验证一个机器学习引导系统（machine learning-guided system， MLGS），用于基于动脉内治疗（intra-arterial therapy， IAT）前后的临床数据对不可切除肝细胞癌（unresectable hepat

目的开发并验证一个机器学习引导系统（machine learning-guided system， MLGS），用于基于动脉内治疗（intra-arterial therapy， IAT）前后的临床数据对不可切除肝细胞癌（unresectable hepatocellular carcinoma， uHCC）的预后风险进行分层。方法 2008年4月至2022年6月期间，在15家医院连续纳入5646例接受首次IAT的符合条件的uHCC患者。以5年死亡率作为主要预测结局。将35套临床数据（包括29项术前数据和6项术后数据）依次输入五种监督式机器学习（ML）模型。使用受试者工作特征曲线下面积（area under the receiver operating characteristic curve， AUC）并通过DeLong检验比较各ML模型的性能。采用Kaplan-Meier分析揭示MLGS的总生存期（overall survival， OS）风险分层。结果这些患者分别被划分为训练数据集（training datasets， TD， n=3387）、内部测试数据集（internal testing datasets， ITD， n=1130）和外部测试数据集（external test datasets， ETD， n=1129）。在基于术前数据的ML模型中，使用23个变量的CatBoost模型取得了最佳区分能力，其在三个数据集中的AUC为0.777–0.735。同时，使用20个术后变量的XGBoost模型取得了最佳区分能力，其在三个数据集中的AUC为0.904–0.861，显著优于CatBoost模型的性能（DeLong检验， P < 0.001）。基于XGBoost模型的MLGS在三个数据集中的三个风险分层之间提供了显著差异的OS（均P < 0.001）。结论 MLGS可能指导放射科医生为uHCC制定IAT策略。需要前瞻性研究评估其临床效用。

**研究背景与问题**
肝细胞癌（hepatocellular carcinoma, HCC）约占原发性肝脏恶性肿瘤的90%，是全球第六大常见癌症和第三大癌症相关死亡原因。对于不可切除肝细胞癌（unresectable HCC, uHCC），动脉内治疗（intra-arterial therapy, IAT）包括肝动脉灌注化疗（hepatic arterial infusion chemotherapy, HAIC）和经动脉化疗栓塞术（transarterial chemoembolization, TACE），是临床标准治疗。国际指南推荐TACE作为中期HCC的一线治疗，而HAIC在亚洲人群中已成为中晚期HCC的重要治疗选择。近年证据表明，IAT联合分子靶向药物（molecular-targeted agents, MATs）和免疫检查点抑制剂（immune checkpoint inhibitors, ICIs）可产生深度而持久的疗效；基于IAT的转化治疗后序贯局部区域治疗（如手术切除、肝移植、热消融）可显著提高uHCC患者的长期生存。然而，现有预测模型受限于数据不足和计算能力有限，对IAT预后预测能力欠佳。HCC在组织学、基因组和分子水平上存在显著的肿瘤异质性，且治疗决策因肿瘤对IAT的反应和疾病进展而异，导致患者预后个体差异大。目前缺乏无创、便捷、准确的模型来指导临床医生进行IAT决策。研究人员假设结合术后变量的机器学习（machine learning, ML）模型在预测5年死亡率方面将优于仅术前模型和现有分期系统，因此开展本研究以开发和验证一个基于临床数据的ML模型，为IAT治疗决策和监测策略提供指导。该论文发表在《Journal of Hepatocellular Carcinoma》。

**关键技术与方法**
研究人员开展了一项回顾性多中心研究，从中国15家三级医院连续纳入5646例接受首次IAT的uHCC患者（2008年4月至2022年6月）。收集30项术前和6项术后临床变量，采用五种监督式ML算法（XGBoost、CatBoost、GBDT、LGBM、随机森林[Random Forest, RF]）进行模型构建。使用5年死亡率作为主要预测结局，通过受试者工作特征曲线下面积（AUC）和DeLong检验比较模型性能，并利用Kaplan-Meier分析和Log rank检验评估MLGS的风险分层。采用SHAP（SHapley Additive exPlanations）方法解释模型预测结果。数据划分为训练数据集（TD，n=3387）、内部测试数据集（ITD，n=1130）和外部测试数据集（ETD，n=1129）。

**研究结果**
- **基线特征**：纳入的5646例患者中，男性4930例，女性716例，中位年龄57岁。三个数据集间的基线特征均衡（均P>0.05）。
- **ML模型预测性能比较**：基于术前数据，CatBoost模型使用23个变量获得最佳区分能力，AUC在TD、ITD、ETD中分别为0.777、0.743、0.735；基于术后数据，XGBoost模型使用20个变量取得最佳区分能力，AUC分别为0.904、0.886、0.862，显著优于CatBoost模型（DeLong检验，P<0.001）。
- **ML模型的解释方法**：通过SHAP分析发现，早期复发（early recurrence, ER）是预后不良的最强关联因素；首次IAT无客观反应（non-OR）是第二大风险因素；单纯IAT治疗较IAT联合序贯局部治疗或靶向免疫治疗有更高的不良结局风险；甲胎蛋白（AFP）>400 ng/mL、肿瘤直径>10 cm或多发肿瘤（>3个）与更差预后相关。
- **MLGS的预后风险分层**：基于术前和术后MLGS的截断值（22.34、76.25），患者被分为低、中、高风险组。在TD中，低风险组1、3、5年累积OS率分别为87.8%、62.1%、49.1%，中风险组为63.2%、33.4%、25.4%，高风险组为35.9%、13.0%、8.9%（MLGS-pre模型，P<0.001）；MLGS-post模型中低风险组1、3、5年OS率分别为98.3%、81.7%、65.8%，中风险组为68.0%、22.1%、13.5%，高风险组为20.5%、1.7%、0%（P<0.001）。在ITD和ETD中结果一致。
- **MLGS与肿瘤分期及生物标志物的预测准确性比较**：时间依赖性AUC分析显示，MLGS在各时间点的OS预测性能显著优于白蛋白-胆红素（ALBI）分级、血小板-白蛋白-胆红素（PALBI）分级、血小板-淋巴细胞比值（PLR）、中性粒细胞-淋巴细胞比值（NLR）、终末期肝病模型（MELD）评分以及BCLC、JSH、AJCC TNM、EASL、CNLC等分期系统（Log rank检验，P<0.001）。MLGS-post的整合Brier评分（IBS）在TD、ITD、ETD中分别为0.17、0.14、0.22，校准曲线接近理想化45°线，决策曲线分析显示其临床净获益更大。
- **MLGS的临床价值**：MLGS通过术前模型提供个体化预后风险评分，并将患者分层；术后输入肿瘤复发、IAT反应、序贯治疗等变量后，风险评分动态变化，可指导临床医生在IAT过程中调整治疗方案和监测策略。

**总结与结论**
讨论部分指出，MLGS能有效将接受IAT的HCC患者分为三个具有显著不同长期OS的风险组，并可视化死亡率风险的动态变化，有助于个体化决策，减少未来死亡率、治疗相关副作用和经济负担。研究优势包括大样本多中心外部验证、变量范围广、采用五种ML算法比较、性能优于国际公认临床和生物标志物。SHAP分析揭示的风险因素与近期全球III期随机临床试验（EMERALD-1）结果一致，强调了联合治疗的价值。与其他仅关注单一治疗决策的模型不同，MLGS基于动态风险轨迹，可更精确地制定个体化IAT方案。研究局限性包括多中心方案差异可能引入异质性、药物多样性影响、中国人群特征限制其向西方推广等。结论：MLGS准确分层预后风险，有助于识别可能从更密集监测或辅助治疗中获益的高风险患者。需要前瞻性研究评估其临床效用。

联系信箱：

粤ICP备09063491号

热点排行