《Journal of Imaging Informatics in Medicine》:Interpretable MRI Radiomics for Preoperative Meningioma Consistency Prediction
编辑推荐:
影像组学模型用于脑膜瘤一致性预测通常侧重于优化判别能力,却保持不透明:这些模型很少阐明哪些特征驱动预测、判别模式出现在何处,或它们在MRI上对应什么,这限制了临床可解释性并阻碍了临床应用。研究人员开发了一个基于术前T1加权钆增强MRI(T1-Gd MRI)的可
影像组学模型用于脑膜瘤一致性预测通常侧重于优化判别能力,却保持不透明:这些模型很少阐明哪些特征驱动预测、判别模式出现在何处,或它们在MRI上对应什么,这限制了临床可解释性并阻碍了临床应用。研究人员开发了一个基于术前T1加权钆增强MRI(T1-Gd MRI)的可解释影像组学框架,用于42例切除的脑膜瘤(软质n=16,中等n=13,硬质n=13)。采用半自动化工作流程对肿瘤进行分割,并在19例病例中与独立神经放射科医师的分割进行验证(Dice系数0.84±0.12)。从1409个影像组学特征中,保留了组内相关系数(ICC)稳定的特征(ICC≥0.75),并去除了冗余(|r|>0.95)。采用了基于患者层面的交叉验证,结合基于最小绝对收缩和选择算子(LASSO)的特征选择与CatBoost分类器。可解释性通过三个组成部分处理:稳定特征识别(WHICH)、SHAP归因(Shapley Additive Explanations),以及使用11×11×11滑动窗口的体素级局部影像组学映射(WHERE),并辅以影像组学到放射学特征词典(WHAT)。三个特征构成紧凑签名:纹理熵(wavelet-LLH_glrlm_RunEntropy)、钙化指数(exponential_gldm_LargeDependenceHighGrayLevelEmphasis)和局部同质性(wavelet-LHH_glcm_InverseVariance)。CatBoost实现了宏观平均一对多曲线下面积(AUC)0.87和准确率66.7%;错误主要发生在相邻类别之间(折叠平均偏离一级准确率90.3%;总计38/42,90.5%)。局部映射显示硬质肿瘤中存在空间异质性纹理和局灶性高灰度依赖热点,尽管组水平钙化指数差异未通过Bonferroni校正。研究人员提出了一个概念验证的可解释影像组学框架,该框架整合了既有的可解释性技术——基于LASSO的特征稳定性分析、SHAP归因、体素级空间映射以及影像组学到放射学词典——将稳定的影像组学签名与空间肿瘤模式和可识别的MRI特征联系起来,为其他组织成分影响临床决策的成像任务提供了一种潜在可扩展的方法。
**研究背景与问题**
脑膜瘤是常见的颅内肿瘤,其术中机械一致性是决定手术策略的关键因素:软质肿瘤可通过吸引和超声吸引处理,而硬质肿瘤需广泛机械减瘤,增加手术时间和神经血管损伤风险。然而,传统MRI难以可靠评估肿瘤一致性。尽管影像组学模型在术前预测中取得进展(AUC约0.70–0.85),但现有模型多为“黑箱”分类器,仅输出单一概率估计,未阐明哪些特征驱动预测、判别模式在肿瘤内何处出现、或这些模式对应何种MRI表现,这限制了临床信任、错误检测和监管审批。为解决这一问题,研究人员提出将既有的可解释性技术——基于LASSO的特征稳定性分析、SHAP归因、体素级局部影像组学映射及影像组学到放射学词典——整合至统一框架,用于脑膜瘤一致性预测,旨在同时回答WHICH(哪些特征稳定)、WHERE(空间上何处表现)和WHAT(对应何种MRI特征)三个问题。该研究作为概念验证,优先考虑方法透明性和解释而非预测性能,发表在《Journal of Imaging Informatics in Medicine》。
**研究方法简要概述**
本研究为回顾性模型开发与内部验证,纳入42例接受术前3T T1-Gd MRI扫描并手术切除的脑膜瘤患者(软质16例、中等13例、硬质13例),样本均来自欧登塞大学医院。肿瘤分割采用半自动化工作流程,并在19例病例中与独立神经放射科医师分割验证(Dice系数0.84±0.12)。提取1409个影像组学特征后,通过ICC筛选(≥0.75)保留638个可靠特征,再经皮尔逊相关去除冗余(|r|>0.95)得到189个非冗余特征。采用LASSO正则化进行特征选择,并在患者层面嵌套五折交叉验证中评估特征选择稳定性。最终选定三个稳定特征(纹理熵、钙化指数、局部同质性)作为输入,比较五个分类器(多项逻辑回归、有序逻辑回归、支持向量机、XGBoost、CatBoost),以CatBoost为最终模型。可解释性通过SHAP归因、体素级局部映射(11×11×11滑动窗口)和影像组学到放射学词典实现。
**研究结果**
*患者特征与一致性分布*:42例肿瘤中软质38.1%、中等31.0%、硬质31.0%。患者平均年龄65.0±11.8岁,女性57.1%。
*观察者间分割与一致性可靠性*:19例双评估者分割显示良好体积一致性,平均Dice系数0.84±0.12,Cohen's κ为0.82,支持特征可靠性。
*影像组学特征提取与冗余去除*:1409个特征中,638个(45.3%)达到ICC≥0.75;去除冗余后保留189个非冗余特征。
*LASSO特征选择与稳定性*:交叉验证中三个特征稳定入选:纹理熵(5/5折,ICC≈0.78)、钙化指数(4/5折,ICC≈0.81)、局部同质性(3/5折,ICC≈0.85)。其余8个特征出现频率≤40%被排除。
*多模型性能比较*:比较五类分类器,CatBoost数值表现最优:宏观平均一对多AUC 0.87,准确率66.7%,校准可接受;其他分类器AUC 0.77–0.82,准确率52–57%。Friedman检验未达统计显著性(p=0.21)。
*最终模型性能*:CatBoost达到折叠平均准确率66.7%(95%CI 47.3–86.1%),宏观平均AUC 0.87。偏离一级准确率90.3%(总计38/42,90.5%)。各类别敏感度:软质81.7%、中等50.0%、硬质60.0%。混淆矩阵显示错误主要发生在相邻类别。
*基于SHAP的全局特征重要性*:局部同质性平均绝对SHAP值最高(0.168),其次为纹理熵(0.126)和钙化指数(0.114)。类别特异性分析显示局部同质性在各类中贡献最大,纹理熵对中等肿瘤贡献接近。
*通过局部影像组学映射进行判别模式空间定位*:局部纹理熵映射显示肿瘤内空间异质性;局部同质性映射显示均匀性梯度;钙化指数映射在代表硬质肿瘤中显示局灶性热点,与钙化或致密结构推测一致。组水平比较:纹理熵在软质肿瘤中显著低于中等和硬质肿瘤(Bonferroni校正p<0.01);钙化指数和局部同质性未达显著性。
**讨论与结论**
该概念验证研究表明,通过整合既有可解释性方法至疾病特异性框架,可使基于影像组学的脑膜瘤一致性预测变得可解释。紧凑的三特征签名经嵌套交叉验证确认稳定。体素级映射揭示判别信息不仅存在于全局特征值,也反映在空间分布中。与既往研究相比,本文明确聚焦于可解释性,而非仅优化性能,将问题从“模型多准确”转向“模型如何做出预测”。临床意义包括:术前解释性预测可辅助手术规划和患者咨询;WHICH/WHAT成分使模型输出可作为MRI解读的延伸;WHERE成分可突出难点区域。但存在局限性:单中心小样本(n=42)、性能估计置信区间宽;术中一致性分级主观;可解释性方法仅关联而非因果;缺乏体素级组织学共配准;仅使用T1-Gd序列;未与临床参考标准对比。未来需前瞻性多中心验证,并探索混合模型。研究结论:研究人员证明,通过整合LASSO特征选择、SHAP分析和体素级局部影像组学映射于统一疾病特异性流程,可使脑膜瘤一致性预测的影像组学更具可解释性。三个关键纹理特征对应可识别的MRI模式,热图将抽象纹理指标转化为空间线索,对术前手术规划有潜在价值,需在大规模多中心队列中前瞻性验证。