《Tomography》:Image Quality Assessment of Diffusion-Weighted Imaging (DWI) and Its Impact on Apparent Diffusion Coefficient (ADC) as a Quantitative Imaging Biomarker for Predicting Response to Neoadjuvant Chemotherapy in High-Risk Early Breast Cancer
编辑推荐:
摘要:背景/目的——由扩散加权磁共振成像(DWI)计算得到的表观扩散系数(Apparent Diffusion Coefficient, ADC)可用于预测乳腺癌新辅助化疗(Neoadjuvant Chemotherapy, NAC)的治疗反应,但获取稳定合格
摘要:背景/目的——由扩散加权磁共振成像(DWI)计算得到的表观扩散系数(Apparent Diffusion Coefficient, ADC)可用于预测乳腺癌新辅助化疗(Neoadjuvant Chemotherapy, NAC)的治疗反应,但获取稳定合格的乳腺DWI图像存在挑战,且图像质量对ADC预测效能的影响尚不清楚。本研究旨在评估DWI图像质量评估的阅片者间变异,以及DWI图像质量对ADC预测效能的影响。方法——这项多中心研究纳入428例患者,两名阅片者评估三项DWI图像质量因素:脂肪抑制(fat suppression)、伪影(artifacts)及信噪比(Signal-to-Noise Ratio, SNR),采用Fleiss' Kappa评估阅片者间一致性。以治疗前(T0)至早期治疗(T1)肿瘤ADC百分变化率预测术后病理完全缓解(Pathologic Complete Response, pCR)。结果——428例患者中排除134例(缺失pCR结果[n=17]、缺失/错误DWI[n=23]、无法勾画感兴趣区[Region of Interest, ROI, n=94]),最终纳入294例进行分析。Kappa系数分别为:脂肪抑制0.47(95% CI: 0.42, 0.52)、伪影0.54(95% CI: 0.50, 0.59)、SNR 0.38(95% CI: 0.32, 0.44)。两个时间点图像质量均合格(adequate)组ADC预测pCR的AUC为0.61(95% CI: 0.52, 0.702),任一时间点图像质量不合格(inadequate)组AUC为0.68(95% CI: 0.53, 0.83),AUC差异p=0.45,无统计学意义。结论——三项质量分类的阅片者间一致性为中等至一般(fair to moderate)。当能够手动勾画肿瘤ROI时,图像质量合格组与不合格组的ADC预测效能无统计学显著差异,两组均可预测pCR。此外,1.5T与3.0T磁共振扫描仪间的阅片者间一致性及ADC预测效能亦无显著差异。这些发现对真实临床条件下将ADC用作影像生物标志物具有临床参考价值。
论文解读:乳腺扩散加权成像(DWI)图像质量评估及其对新辅助化疗反应预测中表观扩散系数(ADC)作为定量影像生物标志物影响的研究(《Tomography》发表)
研究背景与意义
表观扩散系数(Apparent Diffusion Coefficient, ADC)源自扩散加权成像(Diffusion-Weighted Imaging, DWI),可量化水分子微观运动并反映组织细胞密度与微结构,乳腺癌新辅助化疗(Neoadjuvant Chemotherapy, NAC)中ADC相对于基线的纵向变化已被证实与治疗反应相关。然而,乳腺DWI尚未像动态对比增强磁共振成像(Dynamic Contrast-Enhanced MRI, DCE-MRI)那样常规纳入NAC疗效评估,部分原因是技术难点及缺乏标准化ADC测量流程。乳腺DWI图像质量易受脂肪抑制不足、组织磁敏感差异致几何畸变(单次激发平面回波成像固有缺陷)、及低信噪比(Signal-to-Noise Ratio, SNR)影响,次优图像质量可能使ADC测量产生偏倚并干扰感兴趣区(Region of Interest, ROI)勾画,进而降低ADC预测病理完全缓解(Pathologic Complete Response, pCR)的效能。定量影像生物标志物联盟(Quantitative Imaging Biomarker Alliance, QIBA)强调需关注图像质量与方案依从性,但图像质量对ADC预测NAC反应的具体影响尚不明确。本研究基于多中心I-SPY 2 TRIAL数据,旨在明确DWI图像质量主观评估的阅片者间变异,以及DWI图像质量是否影响肿瘤ADC对新辅助化疗后pCR的预测性能。
主要关键技术方法
研究人员基于多中心I-SPY 2 TRIAL(ClinicalTrials.gov NCT01042379/NCT01042370)筛选初始428例高危早期乳腺癌患者队列,排除pCR缺失、DWI未执行或未同时采集b=0和b=800 s/mm2、肿瘤区无法勾画ROI者,最终分析队列294例。DWI于治疗前(T0)及早期治疗(T1,约治疗后3周)采集,使用1.5T或3.0T磁共振仪配专用乳腺线圈,单激发平面回波成像(EPI)并行采集b=0及b=800 s/mm2图像,基于S= S0·e?b·ADC计算ADC图。参照DCE-MRI减影图定位肿瘤,由经验丰富的乳腺影像专家在多层面手动勾画最具扩散受限区域(避开囊变坏死及脂肪成分)获得肿瘤ROI,计算平均肿瘤ADC值,ADC变化率ΔADC% = (Tumor_ADC_T1 ? Tumor_ADC_T0) / Tumor_ADC_T0 × 100%。两名具DWI分析经验的阅片者对每例T0/T1的DWI按脂肪抑制、伪影、SNR三项各打1(低/不合格)—3(高/合格)分,分歧经协商裁定;以任一类别为1定义单次检查图像质量不合格( inadequate),三项均≥2为合格(adequate);患者级分组:T0或T1任一时点被判不合格(两阅片者一致)归入Inadequate队列,余为Adequate队列。病理终点为手术标本确认乳腺及淋巴结无浸润癌残余定义为pCR。统计学采用Cohen's Kappa(加权Fleiss–Cohen权重)评估阅片者间一致性,Wilcoxon秩和检验比较pCR与非pCR组ΔADC%,ROC曲线下面积(Area Under the Curve, AUC)评价预测效能,多元logistic回归检验分子亚型与ADC变化交互作用,p<0.05为差异有统计学意义(R 4.5.1)。
研究结果
3.1. Patient Characteristics(患者特征)
初筛428例中134例被排除(缺失pCR n=17,缺DWI n=19,缺b=800 DWI n=4,无法勾画肿瘤ROI n=94),最终分析294例。分析组与排除组在年龄、HER2状态、绝经状态上无差异,但激素受体(Hormone Receptor, HR)状态、治疗臂及pCR率分布有显著差异,提示无法勾画ROI造成一定选择偏倚。
3.2. Inter-Reader Agreement(阅片者间一致性)
两名阅片者独立评估588次DWI检查(294例×T0+T1)。Cohen's Kappa值:脂肪抑制κ=0.47(95% CI: 0.42–0.52),伪影κ=0.54(95% CI: 0.50–0.59),SNR κ=0.38(95% CI: 0.32–0.44),对应三等级百分比一致率分别为50.5%、51.2%、50.9%。合并为二分类(合格/不合格)后检查级百分比一致率为79%;两位阅片者一致判定25%(147/588)的检查图像质量不合格。结论:三项图像质量主观评分的阅片者间一致性为中等(伪影、脂肪抑制)至一般(SNR),其中SNR主观目测评判可靠性最低;合并为"是否可纳入分析"的二分类判定时一致性提高。
3.3. Predictive Performance of ADC(ADC预测效能)
294例全队列中,92例(31%)归为Inadequate组(两位阅片者一致认为T0或T1 DWI不合格),202例(69%)为Adequate组。全队列pCR率29%(86/294),Adequate组31%(62/202),Inadequate组26%(24/92),组间无差异(p=0.49)。全队列、Adequate组、Inadequate组中pCR患者ΔADC%均显著高于非pCR患者(全队列7.4%, p<0.001;Adequate组6.04%, p=0.012;Inadequate组11.4%, p=0.0103)。预测pCR的AUC:全队列0.63(95% CI: 0.55–0.704),Adequate组0.61(95% CI: 0.52–0.702),Inadequate组0.68(95% CI: 0.53–0.83),Adequate与Inadequate组AUC差异p=0.45,无统计学意义。将Inadequate组细分:T0与T1均不合格(Inadequate sub1)时pCR与非pCR的ΔADC%差异无统计学意义(p=0.45),AUC=0.57;仅一时点不合格(Inadequate sub2)时ΔADC%差异显著(p=0.0055),AUC=0.78。共识双时点均合格(Consensus Adequate) AUC=0.60,双时点均不合格(Consensus Inadequate=Inadequate sub1) AUC=0.57,差异p=0.83。多元分析显示Inadequate队列中ADC变化与乳腺癌分子亚型存在显著交互作用(p=0.011),Adequate队列无此交互(p=0.95)。结论:只要能勾画肿瘤ROI,无论DWI图像质量是否达标,ADC变化均可预测pCR且预测效能无显著差异;仅在T0与T1 DWI均质量不合格时ADC预测信号减弱;1.5T与3.0T间阅片者一致性和ADC预测效能均无显著差异。
讨论与结论总结
本研究显示乳腺DWI图像质量三项主观评分(脂肪抑制、伪影、SNR)的阅片者间一致性为中等至一般,其中SNR主观评估一致性最低,提示需客观SNR量化指标;合并为二分类排除标准后一致性改善至79%。关键发现是:在可手动勾画肿瘤ROI的前提下,图像质量不合格(经两位阅片者确认任一时点不合格)与合格DWI得出的ADC早期变化预测NAC后pCR的效能无统计学显著差异,两组ADC变化均能显著区分pCR与非pCR——说明经专家仔细勾画ROI可部分补偿图像质量问题,ADC作为影像生物标志物对此类图像质量波动具一定稳健性。仅在T0和T1两时点DWI均质量不合格时预测能力下降。1.5T与3.0T扫描仪间无论阅片者一致性或ADC预测性能均无差别,支持ADC跨场强稳定性。本研究也指出22%数据因ROI无法勾画或质量过差丢失,凸显多中心试验中实时影像质控必要性。局限性包括I-SPY 2原无DWI实时质控、只分析T0/T1两时点、无法勾画ROI致部分病例排除可能产生偏倚等。
原文结论翻译:若能借助手动勾画肿瘤ROI对DWI检查进行分析,三项质量分类的阅片者间一致性为中等至一般(fair to moderate)。图像质量合格组与不合格组的ADC预测效能无统计学显著差异;两组均可预测pCR。此外,1.5T与3.0T磁共振扫描仪之间的阅片者间一致性及ADC预测效能亦未观察到统计学显著差异。这些发现对在真实世界条件下——可能使用不完美图像质量或较低场强扫描仪评估治疗反应——具有临床相关性。