《Clinical Imaging》:Identifying hepatocellular carcinoma patients at risk of early non-response after first-cycle transarterial chemoembolization: A reproducible machine learning study
编辑推荐:
吴科林|程佑佑|爱德华·佩蒂约翰|拉维·帕特尔|贾斯汀·库因|什雷亚斯·A·梅鲁加|康庄伟|莎拉·佩蒂约翰美国德克萨斯州圣安东尼奥市圣言大学骨科医学院研究与创新办公室摘要目的经动脉化疗栓塞术是中期肝细胞癌的标准治疗方法,但第一疗程后出现早期无反应的情况仍较为常见且难以预测。现有的
吴科林|程佑佑|爱德华·佩蒂约翰|拉维·帕特尔|贾斯汀·库因|什雷亚斯·A·梅鲁加|康庄伟|莎拉·佩蒂约翰
美国德克萨斯州圣安东尼奥市圣言大学骨科医学院研究与创新办公室
摘要
目的
经动脉化疗栓塞术是中期肝细胞癌的标准治疗方法,但第一疗程后出现早期无反应的情况仍较为常见且难以预测。现有的临床评分系统使用的变量有限,无法体现影响治疗反应的差异性。本研究利用公开数据集,构建了可重复的机器学习模型,用于预测第一疗程TACE后的早期无反应情况。
方法
我们分析了来自公开WAW-TACE数据集的233名患者的数据,该数据集包含TACE前的CT影像数据以及33个标准化的临床变量。根据mRECIST标准,将首次随访时的早期无反应定义为疾病稳定或进展,而非完全缓解或部分缓解。我们采用五折交叉验证法训练逻辑回归、随机森林、XGBoost和支持向量机模型,并通过准确率、F1值和AUC-ROC指标在独立测试集上评估这些模型的性能。
结果
交叉验证时的F1值在0.78到0.83之间。在独立测试集中,逻辑回归的表现最为均衡(准确率为0.73,AUC值为0.76),其次是随机森林(0.70,0.73)、支持向量机(0.66,0.75)和XGBoost(0.66,0.73)。支持向量机的敏感性最高(召回率为0.93),而XGBoost的召回率为1.00,但精确度较低,这可能是由于对阳性类别的过度分类所致。特征重要性分析确定了具有临床意义的预测因子,包括胆红素、六十二分值、肿瘤直径、疾病病因以及BCLC分期。
结论
基于公开TACE数据训练的可重复机器学习模型,在预测早期无反应方面的性能较为一般。这些研究结果为未来介入肿瘤学领域的模型开发与验证提供了透明的参考标准,同时也表明仅依靠基线临床变量可能难以实现有效的预测。提前预测无反应具有重要的临床意义,但本研究中观察到的有限性能也凸显出这一任务的难度。
引言
肝细胞癌是全球癌症相关死亡的主要原因之一。经动脉化疗栓塞术是中期、不可切除肝细胞癌的标准治疗方案,但患者的预后差异较大,且难以预测。现有的预后评估系统,如BCLC分期系统和ALBI评分系统,所依赖的临床变量有限,无法反映影响治疗反应的生物学和影像学差异。
人工智能,尤其是机器学习技术,已成为预测介入肿瘤学领域治疗结果的宝贵工具,多项系统评价表明其在TACE治疗中的应用效果虽有一定潜力,但存在差异。机器学习能够发现传统评分系统无法识别的临床变量之间的非线性及多维度关联。
公开可用的WAW-TACE数据集包含了标准化的临床变量和影像数据,便于对预测模型进行透明化的对比评估。本研究旨在利用公开数据集,对基线临床变量在预测TACE后早期无反应方面的能力进行透明且可重复的评估,为未来的模型开发提供参考标准。
章节节选
材料与方法
本研究共纳入了233名来自公开WAW-TACE数据集的患者。该数据集包含TACE前的动脉期CT扫描图像、肿瘤层面的分割信息以及33个标准化临床变量;不过在本研究中仅使用了临床变量来构建模型。
主要评估指标是根据改良的实体瘤反应评价标准,在首次随访影像检查时判断是否出现早期无反应。完全缓解或部分缓解被归类为有反应组,而
结果
表1总结了这些患者的基线人口统计学和临床特征。233名患者中有227名(97.4%)有相应的预后数据,另有6名患者因缺乏反应评估数据而被排除在外。这些患者的肿瘤负荷存在较大差异,肿瘤中位数为1个(四分位数范围为1–2个),最大肿瘤直径的平均值为50.0±28.4毫米。在可评估的患者中,有112名(49.3%)出现早期无反应,而115名(50.7%)被归类为有反应组。大多数患者被诊断为早期病变。
讨论
特征重要性分析显示,这些预测模型依赖于具有临床意义的因素。随机森林模型指出胆红素、六十二分值和肿瘤直径是最重要的预测因子,这些因素也与肝细胞癌治疗中的已知预后生物标志物一致。XGBoost模型则认为HAP评分、mHAP-II评分、六十二分值和肿瘤直径是影响预后的关键因素,这些因素与肿瘤负荷和肝功能密切相关。逻辑回归模型则识别出了六十二分值和疾病病因等重要因素。
结论
基于公开TACE数据训练的可重复机器学习模型,在预测第一疗程后早期无反应方面的性能较为一般,且各模型之间的预测效果存在一定重叠。这些研究结果为未来介入肿瘤学领域的模型验证和开发提供了透明的参考标准,同时也表明仅依靠基线临床变量可能难以实现有效的预测。虽然提前预测无反应具有重要的临床价值,但本研究中观察到的有限性能也反映了这一任务的复杂性。
CRediT作者贡献说明
吴科林: 文章撰写——审稿与编辑、文章撰写——初稿撰写、项目管理、方法设计、研究实施、正式分析、数据整理、概念构思。程佑佑: 文章撰写——初稿撰写、正式分析、数据整理、概念构思。爱德华·佩蒂约翰: 文章撰写——初稿撰写、项目管理、方法设计、研究实施、正式分析。拉维·帕特尔: 文章撰写——初稿撰写、研究实施、正式分析、数据整理。贾斯汀·库因: 文章撰写——审稿与编辑,
利益冲突声明
作者声明不存在任何可能影响本文研究结果的已知财务利益关系或个人关系。