《Journal of Neural Transmission》:Comparison of neuromelanin-sensitive magnetic resonance imaging using different magnetic resonance protocols on the same patients with Parkinson’s disease
编辑推荐:
在帕金森病(Parkinson’s disease,PD)中,黑质(substantia nigra,SN)与蓝斑(locus coeruleus,LC)会发生神经元丢失。既往采用3T磁共振成像(magnetic resonance imaging,MRI)进
在帕金森病(Parkinson’s disease,PD)中,黑质(substantia nigra,SN)与蓝斑(locus coeruleus,LC)会发生神经元丢失。既往采用3T磁共振成像(magnetic resonance imaging,MRI)进行神经黑色素敏感磁共振成像(neuromelanin-sensitive magnetic resonance imaging,NMI)的研究,已报道黑质对比比值(SN-CR)与面积(SN-A)的测量方法、诊断意义及其与临床症状的关联。然而,尚无研究在短时间内于同一患者中评估不同磁共振(MR)协议获取的NMI结果一致性。因此,本研究评估了在不同成像参数下同步获得的二维(2D)NMI之间的相似性。研究人员比较了55例PD患者中54例在3个月内于不同成像条件下接受2D-NMI检查所得的SN-CR、LC-CR和SN-A;其中1例因伪影被排除。随后进一步检验了这些变量与运动功能及认知功能之间的关系。该队列平均年龄为62.3?±?8.0岁,平均病程为11.4?±?5.2年,男女比例为25:29。结果显示,SN-CR(r?=?0.233,p?=?0.091)与LC-CR(ρ?=?0.180,p?=?0.192)均未见显著相关;然而,SN-A呈现显著但较弱的正相关(ρ?=?0.403,p?=?0.003)。为尽量减少技术变异,成像协议标准化至关重要。
本文发表于《Journal of Neural Transmission》,聚焦于帕金森病(Parkinson’s disease,PD)影像学评估中的一个关键方法学问题:在同一患者短期内采用不同磁共振(magnetic resonance,MR)扫描协议获得的二维神经黑色素敏感磁共振成像(neuromelanin-sensitive magnetic resonance imaging,2D-NMI)结果,是否具有足够一致性,从而能够支持跨平台、跨设备或多中心比较。研究背景在于,PD的核心病理改变之一是黑质(substantia nigra,SN)和蓝斑(locus coeruleus,LC)神经元丢失,而NMI能够可视化与神经黑色素相关的高信号区域,因此已被用于辅助诊断、病情评估及症状关联分析。既往研究已分别证明不同2D-NMI参数方案在PD中的诊断价值,并报道了黑质对比比值(SN-CR)、蓝斑对比比值(LC-CR)及黑质面积(SN-A)等指标与临床表现之间的关系。然而,此前缺乏在同一患者、短时间窗内直接比较不同成像协议所得结果一致性的研究。这一空白直接限制了NMI在多中心研究、不同厂商平台整合及纵向随访中的推广应用,因此开展本研究具有明确必要性。
研究人员纳入2017年8月至2022年11月在同一机构就诊、并于3个月内接受两种不同MR参数2D-NMI扫描的PD患者。55例病例中,1例因伪影排除,最终分析54例。患者依据MDS临床诊断标准确诊。研究比较两种协议下的SN-CR、LC-CR和SN-A,并进一步分析这些影像指标与运动、认知、睡眠、情感及步态等临床量表之间的关系。研究结果表明,两种方案之间SN-CR和LC-CR并无显著相关,SN-A虽有统计学显著相关,但仅为弱相关。同时,Bland-Altman分析提示所有指标均存在系统性偏倚,且95%一致性界限较宽;线性回归的决定系数R
2很低,显示无法通过简单数学换算实现跨协议校正。研究据此得出结论:不同成像条件下获得的2D-NMI指标存在明显技术性变异,临床上不具备可互换性,未来必须优先推进成像协议标准化。
主要技术方法方面:本研究为回顾性单中心研究,样本来源于同一机构3个月内完成两种2D-NMI扫描的PD患者队列。研究采用两种3T MRI协议,分别由Siemens Verio与Philips Ingenia平台完成T1加权涡轮自旋回波(T1-weighted turbo spin-echo,TSE)序列采集;在下丘下缘层面测量黑质致密部(SN pars compacta,SNc)的SN-A和SN-CR,在其尾侧7 mm层面测量LC-CR。面积测量采用ImageJ软件完成,全部影像由对临床资料设盲的经验评定者手工分析。统计学上使用Pearson相关、Spearman秩相关、Bland-Altman一致性分析、线性回归及事后敏感性分析,并进一步评估影像指标与多种临床量表的相关性。
结果
患者背景与总体研究设计结果
最终纳入54例PD患者,平均年龄62.3?±?8.0岁,平均病程11.4?±?5.2年,男性25例、女性29例。研究对象均在3个月内完成两种不同协议的2D-NMI扫描,从而使研究能够在较短时间尺度上评估不同协议之间的一致性,而尽量减少真实生物学变化对结果的干扰。
Inter-Protocol Correlation of MRI Measurements
在两种协议之间,SN-CR未见显著相关(r?=?0.233,p?=?0.091),LC-CR亦未见显著相关(ρ?=?0.180,p?=?0.192)。SN-A则表现为显著但较弱的正相关(ρ?=?0.403,p?=?0.003)。这一结果说明,在同一PD患者短期内重复成像时,基于信号强度的对比指标跨协议稳定性较差,而基于空间形态学的面积指标仅保留有限一致性。事后敏感性分析进一步指出,以当前样本量,SN-CR和LC-CR的观测相关系数均低于检测阈值,也提示阴性结果存在统计功效方面的限制,但即便如此,其相关强度本身仍不足以支持协议互换。
Agreement and Conversion Analyses
通过Bland-Altman分析,研究人员发现所有NMI指标均存在显著系统性偏倚。协议1测得的SN-A和SN-CR显著高于协议2,平均偏倚分别为26.81 mm
2与5.67;而LC-CR则由协议2测得更高,平均偏倚为?1.95。更重要的是,三项指标的95%一致性界限均较宽,提示两种平台间可交换性较差。对于SN-A,还观察到显著比例误差(r?=?0.56,p?0.001),说明随着黑质面积增大,两协议间差异也随之扩大。在线性回归中,SN-A、SN-CR和LC-CR的R
2分别仅为0.13、0.05和0.06,表明不同协议数据之间高度离散,简单建立转换公式并不可行。该结果直接支持“跨协议数学矫正不足以实现数据协调”的核心结论。
Correlations Between Neuromelanin-Sensitive MRI Measures and Clinical Assessments
在临床相关性分析中,两种协议所得结果缺乏一致重复性。协议1中,MDS-UPDRS Part IV与SN-CR呈显著负相关(ρ = ?0.306,p?=?0.024),ESS与LC-CR呈显著正相关(ρ?=?0.305,p?=?0.025);但这些关系未在协议2中得到重复。相反,在协议2中,仅观察到冷漠量表与SN-CR之间的显著负相关(ρ = ?0.301,p?=?0.027)。MMSE和MoCA-J在两种协议中均未与NMI指标呈显著相关。该部分结果说明,不同协议不仅影响影像定量值本身,也可能改变影像指标与临床表型之间的统计关联,从而削弱NMI在跨平台研究中的解释稳定性。
Discussion
讨论部分指出,两种协议均曾在既往研究中被证实对PD临床诊断和纵向评估具有价值,因此若在同一患者短期内重复扫描,理论上应当获得高度一致的结果。但本研究实际仅观察到SN-A的弱相关,而SN-CR与LC-CR无显著相关,这一反差凸显了2D-NMI对技术参数变化的敏感性。研究人员认为,SN-A之所以较对比比值指标表现出相对更高的一致性,是因为其本质上属于空间形态学测量;虽然绝对值会受层厚与层间隙影响,但患者间相对解剖大小差异仍可部分保留。相比之下,CR属于基于信号强度的指标,更容易受到重复时间、回波时间、厂商特异性背景信号抑制、射频线圈特性及图像重建算法等因素影响,因此跨协议相关性更易丧失。与此同时,SN解剖体积较LC更大,对部分容积效应(partial volume effect,体素内多组织混合导致信号失真)的耐受性更强,而LC结构细小,较容易在较差空间分辨率下丢失对比噪声比。
研究进一步指出,两种协议在层厚和层间隙上的差异可能是最主要原因。协议1采用2.5 mm无层间隙扫描,协议2采用3.0 mm层厚并设置0.3 mm层间隙。层厚变化会直接影响信噪比与空间分辨率,尤其会影响LC这类微小结构的显示。层间隙还可能引入采样偏倚,使目标结构位于未采集间隙中而被部分或完全遗漏。对于SN-A观察到的比例误差,研究人员认为这尤其提示协议2层间隙累积造成未测面积增加,且黑质越大,跨层累积遗漏越明显。此外,平台厂商差异、射频线圈特征及重建算法等因素亦可能共同导致偏差,因此该技术变异应理解为多因素共同作用的结果,而非单一参数所致。
研究还讨论了影像-临床关联结果的不稳定性。虽然既往已有LC复合体与睡眠障碍相关的研究基础,但本研究中该关联仅在一种协议中出现,另一种协议未能重复。冷漠量表与SN-CR关系也呈现类似不一致。这提示2D-NMI指标对技术条件高度敏感,若未严格统一协议,相关指标在多中心试验或纵向研究中的解释效度将受到限制。研究人员因此强调,未来除加强协议统一外,还应考虑引入标准化自动分析方法,以减少人工勾画感兴趣区带来的主观性与任意性。
Study limitations
研究局限包括样本量较小、缺乏健康对照、手工测量不可避免存在主观误差,以及未评估3D-NMI。由于为回顾性研究,无法在相同协议下对同一患者进行重复扫描,因此未能直接评估协议内测试-重测可靠性。此外,诊断依据临床标准而非神经病理学证实,不能完全排除多系统萎缩(multiple system atrophy)或进行性核上性麻痹(progressive supranuclear palsy)等其他帕金森综合征混入队列所带来的异质性影响。尽管如此,研究指出,即便未来扩大样本量使部分弱相关达到统计学显著,其低R
2仍不足以改变“协议间缺乏临床可互换性”的主要结论。
研究结论翻译:黑质(SN)和蓝斑(LC)的2D-NMI测量在不同成像条件下表现出明显变异。为提高可靠性,未来应优先推动成像协议标准化、采用3D-NMI体积分析,或引入自动分割方法,以尽量减少人为误差和技术变异。