《Psychiatry Research: Neuroimaging》:Towards a rational ECT treatment approach for severe and treatment resistant schizophrenia using neuroimaging biomarkers: A focused review
编辑推荐:
难治性精神分裂症(TRS)是精神病学领域的一项重大挑战,其治疗需求尚未得到满足。鉴于一线抗精神病药物(APMs)耐药发生率相对较高(35%),以及作为最后手段的氯氮平(clozapine)耐药率(55%),电休克治疗(ECT)成为TRS患者精神病性症状管理的重
难治性精神分裂症(TRS)是精神病学领域的一项重大挑战,其治疗需求尚未得到满足。鉴于一线抗精神病药物(APMs)耐药发生率相对较高(35%),以及作为最后手段的氯氮平(clozapine)耐药率(55%),电休克治疗(ECT)成为TRS患者精神病性症状管理的重要替代方案,通常在氯氮平治疗无效后才考虑使用,尽管有证据表明在TRS中更早介入ECT可能更有益。本综述讨论了近期利用机器学习模型和影像组学(radiomics)采用神经影像标志物预测TRS患者ECT治疗反应的研究进展。眶额回(orbitofrontal gyrus)、颞叶(temporal lobe)及边缘系统(limbic structures)是与精神分裂症神经病理学相关的脑区,也是这些机器学习模型中重叠的关注区域。这些实验模型的成功开发标志着向临床工具研发迈出了重要一步,未来有望指导TRS患者的治疗决策,为其匹配ECT等有效治疗方案。这些实验模型可能有助于制定更加个性化的治疗方案,从而缩短精神病未治疗持续时间(DUP),改善TRS患者的预后。
1. 引言
精神分裂症是一种异质性神经精神综合征,在美国影响高达1%的人口。由于症状严重,精神分裂症常伴有显著的功能损害和沉重的疾病负担。尽管存在多种药物治疗选择,但25%至30%的精神分裂症患者对一线抗精神病药物耐药,被认定为TRS,通常定义为两次充分疗程的第二代抗精神病药物治疗失败。然而,TRS的正式定义存在差异,影响了患病率报告。本文将TRS定义为:至少经过两种第二代抗精神病药物足剂量治疗至少6周仍缺乏症状改善。较新的定义还包括症状严重程度和功能损害等因素。在耐药患者中,40%至70%对氯氮平也耐药(氯氮平难治性TRS或CR-TRS),而氯氮平是FDA批准的TRS首选治疗。幸运的是,约50%的CR-TRS患者对ECT有反应,ECT常作为TRS患者抗精神病药物治疗的下一步增效手段。鉴于相当一部分TRS患者为氯氮平无反应者,临床医生需要指南来明确何时考虑更早将ECT作为辅助增效治疗,并筛选出不太可能从ECT获益的患者,以避免不必要的风险、费用和不便。
患者间神经生物学病理的差异,包括神经解剖学差异,可能构成了这些不同耐药模式的基础。鉴于已证实多种遗传和非遗传因素参与精神分裂症的发病机制,单一确定性神经解剖特征并非该病的特征性表现不足为奇。相反,存在大量与该精神病谱系相关的病理发现。这种异质性使疾病进程、严重程度、治疗反应和临床结局的预测变得复杂,目前尚无经验证的方法可预测TRS患者对ECT的治疗反应。
机器学习生成模型的发展为应对疾病预测中的异质性挑战提供了独特且有前景的途径。特别是将机器学习应用于定量神经影像数据(即"影像组学")具有特殊价值,因为脑成像研究如磁共振成像(MRI)收集的数据量巨大,其中大量数据无法用肉眼识别,正是应用机器学习的理想场景。目前有许多研究评估ECT诱导的脑结构改变,可能反映这种神经调控技术实现治疗效应的途径。既往研究使用临床和传记数据寻找预测ECT疗效的变量并建立预测模型,在精神分裂症和重性抑郁障碍(MDD)等多种精神障碍中取得了不同程度的成功。然而,结合临床数据和影像数据生成基线脑成像预测ECT治疗反应模型的研究较少。预测ECT治疗反应的能力将为患者(疗效预期设定、风险/效益讨论)和医疗系统(有限资源环境中的患者分诊)带来多重益处,有助于创建更加知情、合理和基于证据的临床决策,以指导符合患者目标和需求的治疗选择。
2. 方法
2.1 检索策略
鉴于该主题的新颖性、有限文献量和聚焦性,本综述采用选择性综述而非系统性综述方法。使用PUBMED数据库检索,检索式为:"(electroconvulsive therap* OR ECT) AND (schizophren* OR 'treatment-resistant schizophrenia' OR 'treatment resistant schizophrenia' OR TRS) AND (MRI OR 'magnetic resonance imaging' OR 'brain imaging' OR 'neuroimaging' OR 'structural MRI' OR 'functional MRI' OR fMRI OR radiomic*) AND (predict* OR prognos* OR 'treatment response' OR response)"。未限制日期范围,排除预印本。检索获得62篇文献。
2.2 纳入/排除标准
由单一审稿人手工筛选数据库检索到的标题和摘要,仅纳入使用神经影像预测TRS或严重病例(如自杀性)ECT反应的研究,因为这些是目前精神分裂症的ECT适应证。因此,纳入文章须包含ECT治疗前后的基线脑成像和症状负担测量,而非仅分析治疗后神经影像变化。仅纳入英文、同行评审的原创研究。排除标准:病例报告、病例系列、综述文章。经标题和摘要筛选后,确定3篇手稿纳入并进行全文综述。将数据整理至标准化表格,包括TRS定义、ECT/药物治疗细节(如可用)、影像学方法、模型特征工程、机器学习方法、验证策略、准确率、敏感性和特异性等。
3. 神经影像数据
3.1 灰质
灰质体积和形态学改变在精神分裂症中已被长期确立为与临床症状相关的潜在病理来源。特别是灰质体积减少和随后的脑室扩大是精神分裂症的经典神经影像学发现。有趣的是,据报道ECT可增加灰质体积。许多精神分裂症ECT研究显示岛叶、杏仁核和海马等区域的灰质体积增加。然而,鉴于精神分裂症的异质性,患者间的灰质改变可能存在很大差异。灰质异常差异是否能用于解释或预测ECT的治疗反应和耐药性尚待明确。
一项已发表研究使用结构脑MRI评估了灰质形态学对TRS患者ECT治疗反应的预测价值。利用精神分裂症已知结构异常区域,研究者采用机器学习生成ECT治疗反应的预测模型,进行基于体素的灰质容积分析。模型生成过程中,确定4个最强预测ECT反应的灰质感兴趣区(ROI):左侧 inferior orbitofrontal gyrus、右侧 superior temporal gyrus、左侧 temporal pole和右侧 insula。这些区域的组织同质性差异(通过峰度、偏度、标准差和平均绝对偏差等影像组学特征测量)与ECT反应水平相关,反映为治疗后阳性和阴性综合征量表(PANSS)评分的降低幅度,计算ECT前后百分比变化。当这些灰质发现与白质(WM)特征结合并应用于独立于训练队列的保留测试队列时,模型对ECT后PANSS改善(定义为PANSS评分百分比降低,作为连续变量测量)具有显著预测效能(r = 0.777, p < 0.001)。这确立了体素水平灰质分析可能允许预测TRS患者ECT治疗反应。
该研究团队在同一患者队列上的另一项研究评估了包括体积和影像组学数据(峰度、偏度、标准差、平均绝对偏差等)在内的灰质特征,以生成TRS患者ECT反应的预测模型,同样使用机器学习。在此模型中,他们利用从每位患者19个灰质ROI衍生的285个特征。与Gong等(2020)的报告类似,其最强ROI中包括颞叶多个区域和岛叶,同时扣带回也被纳入。当应用于独立保留测试队列时,其模型预测ECT治疗反应的准确率为87.12%(敏感性84.47%,特异性89.77%,阳性预测值90.42,阴性预测值86.61,AUC值0.903)。
3.2 白质
除灰质改变外,白质结构差异也存在于精神分裂症中。这不足为奇,因为脑区之间的异常连接可能代表精神分裂症及其他神经精神疾病的潜在特征。Gong等(2020)除结构MRI外还利用弥散加权成像收集分数各向异性数据(通过弥散张量成像或DTI),以绘制白质纤维束图谱。共分析37条白质纤维束,其中6条最终应用于预测模型,包括连接多个枕叶和颞叶区域的纤维束,以及连接右侧额下inferior orbital gyrus与岛叶的纤维束。使用保留测试队列测试时,白质特征单独表现优于灰质特征(r = 0.571, p = 0.007 vs. r = 0.477, p = 0.072)。然而,如前所述,灰质+白质联合模型对TRS患者ECT反应(以PANSS评分降低百分比判断)的预测能力显著提高(r = 0.777, p < 0.001)。
3.3 功能MRI
功能MRI(fMRI)是一种强大的模态,利用血氧水平依赖(BOLD)成像分析脑活动。通过测量脑血流相对变化,可推断任务期间或静息状态下特定区域的脑活动。静息态fMRI(rsfMRI)评估无特定任务时的基础(内在)脑活动。静息态功能连接(rsFC)测量静息时区域活动的同步性。rsFC改变与多种精神障碍相关,可能代表潜在生理/解剖病因的功能表现。因此,rsfMRI研究可用于精神分裂症综合征不同亚型的分类,包括治疗反应性或耐药性。
一项已发表研究应用rsfMRI数据生成TRS患者ECT反应的预测模型。研究者关注ECT期间高电场干扰的脑区(即额叶、颞叶和边缘区域),评估功能连接用于预测模型。对预测ECT反应性具有显著意义的功能连接区域再次包括orbitofrontal cortex至insula等连接——主要在边缘系统(hippocampus、amygdala、insula)和颞叶区域之间。使用交叉验证,其模型成功利用基线rsfMRI特征预测了ECT后PANSS症状改善程度(以百分比表示)(r = 0.7165, r
2 = 0.7005)。有趣的是,他们还发现ECT后R amygdala与L hippocampus之间的连接降低。这种功能连接降低程度与PANSS评分降低百分比相关(r = 0.3771, p = 0.0164)。这显示了精神分裂症背后功能改变的复杂性,但也证实了将其应用于ECT治疗结局预测的可行性。
3.4 数据有效性
此处主要讨论的三项研究(Gong等,2020、Xi等,2020、Yang等,2020)均在预测性应用中使用了机器学习模型。值得注意的是,三项研究均在同一医疗中心(西安市精神卫生中心)进行。在讨论纳入有限人群、使用的MRI扫描仪、共同研究人员、潜在偏倚等时,这显然与数据的普遍性和可靠性相关。这包括Gong等(2020)和Xi等(2020)的数据集来自同一组57例患者并应用于不同机器学习模型。从相同扫描仪获得的影像数据显著限制了普适性,因为硬件、采集方案、影像数据处理等可能影响影像组学特征及后续模型性能。因此,需要其他机构扫描仪的外部验证来正式评估这些数据及模型有效性/性能的严谨性。此外,三项研究中ECT参数的细节提供程度不一。所有研究均使用spECTrum 5000Q双电极放置,但仅有Gong等(2020)和Xi等(2020)提供了刺激电流和持续时间。各组治疗次数和频率相似。总体而言,三项研究的ECT方案相似,但ECT方案的变异性可能影响结果,应在结果解读中予以考虑。最后,这些模型训练的样本量较小(57例和44例),这当然可能影响将这些模型应用于外部人群。
就方法学严谨性而言,三项研究的报告详细程度不一,使评估具有挑战性。例如,Gong等(2020)和Xi等(2020)似乎在特征选择和模型优化期间分离了训练和测试队列(分别为15例和13例),但在两篇文章的方法学图示之外,均未明确说明是否使用了恰当的嵌套交叉验证(即用于测试的15/13例患者未用于模型训练)。因此,这些模型存在信息泄露的可能性及随后的乐观性能评估。如果使用了恰当的嵌套,这是比Yang等(2020)小型研究使用的留一交叉验证更强的验证形式,后者无保留验证队列,可能存在乐观性能。然而,三项研究均未使用外部数据不同患者人群、MRI扫描仪等测试这些模型的外部验证。
本综述中机器学习的运用包括线性支持向量回归(SVR)、支持向量机分类和基于线性回归的模型。鉴于数据匮乏,难以比较技术间优劣,但考虑到高维度下相对较小的数据集,这些模型类型的选择是合理的,因其较复杂模型具有更低的过度拟合风险。
就过度拟合风险而言,Gong等(2020)和Xi等(2020)的样本量与高维度影像组学特征之比相对较小,引入了模型过度拟合风险。因此,这些早期小型研究应谨慎解读。另一方面,Yang等(2020)的样本量与较低维度影像组学特征之比显著改善,更为平衡。此外,三项研究均未评估校准度,而是报告了AUC或相关性等区分度指标。校准度评估模型预测值与真实观察值之间的一致性,这是临床决策所必需的,也将是未来涉及临床开发模型研究的重要组成部分。过度拟合可能影响校准度,因此这些研究的结果可能过于乐观,应作相应解读。最后,三项研究均未提供代码,构成了可重复性的重大障碍。
4. 讨论
4.1 证据总结
精神分裂症背后的脑异常复杂、多方面,涉及多个脑区的弥散性改变。然而,某些区域似乎牵涉更深,这些改变的异质性可能构成了治疗反应差异的基础。本综述的研究显示了预测治疗结局最相关区域的重叠:orbitofrontal gyrus、temporal lobe和边缘结构。所有这些区域的病理改变先前已被证实与精神分裂症的发生发展相关,部分区域如颞叶在TRS中较治疗反应性精神分裂症表现出更低的灰质体积。这些区域也代表ECT期间高电场干扰区域。此外,边缘结构(如杏仁核和海马)及扣带回(亦见于Xi等,2020)的神经影像特征也已被证实可预测MDD的ECT反应。因此,这些区域的MRI特征(灰质、白质和功能连接改变)可用于预测TRS的ECT反应并不令人意外。
然而,综述研究也进一步证明需要机器学习来生成功能性模型,鉴于分析的复杂性及神经生物学数据的规模,人类自身难以解读或整合。包括精神分裂症在内的精神障碍背后的生物学和解剖学异常可能是分散的、弥散的改变,低于单纯视觉解读影像所能达到的可视化和检测水平。这包括区域连接改变、结构变异及其他较不离散的改变类型。因此,这些研究表明影像组学和机器学习总体上将在未来识别这些先前不可能可视化的疾病模式。
4.2 临床转化
寻找适当治疗方法的试错过程虽是目前传统选择,但在约30%患者中无效。尽早识别应接受氯氮平及ECT等替代或增效治疗的TRS患者可提高缓解几率、改善预后。尽管仍处于早期开发阶段,且尚未得到外部验证/可重复性或临床试验支持,但本综述的机器学习模型可能最终使临床医生识别出将从早期加入ECT治疗方案中获益的TRS患者,或避免在不太可能获益者中使用ECT。此外,通过机器学习基于个体因素匹配患者与治疗方案来扩大治疗成功机会,将大幅减少DUP的有害影响,从而减少认知损失、改善功能结局。
如果这些模型有朝一日通过严格临床试验得到验证,它们将使临床医生能够纳入先前不可用的患者层面关于预期治疗疗效的数据,实现更加合理和个体化的决策制定。氯氮平是FDA批准的TRS一线治疗,但并非对所有患者或医生都方便。尽管通常安全有效,但其作为治疗存在潜在缺点,包括完全起效可能较慢(某些情况下长达一年)、潜在风险副作用谱(如心脏性猝死、糖尿病酮症酸中毒、粒细胞缺乏症、肠梗阻等)、因必要监测导致的临床劳动量大和患者预约时间长等,这些都是潜在的用药障碍。由于氯氮平需要长期治疗,患者可能暴露于数年副作用中。因此,对某些患者而言它可能并非理想或安全的治疗选择。
另一方面,ECT也有其固有风险,主要包括手术期间短期内心血管和麻醉风险,以及长期的认知风险如记忆丧失和意识模糊。ECT的风险通常发生在治疗时点附近,部分研究表明认知效应可能随时间消退。然而,两种疗法在适当监测和正确患者人群中实施时均被证实安全有效。风险效益讨论应围绕共享决策制定,关注患者最 Comfortable 的治疗类型,同时考虑可能改变两种治疗方式风险分层的个案临床因素。
因此,纳入ECT预期疗效信息将使患者和医生能够进行更加知情的风险-效益讨论和决策制定。一种情形是:对于氯氮平治疗的不良候选人/禁忌证患者(如存在排除性医疗条件),但识别出具有ECT高反应概率者。这些患者可能选择ECT作为二线治疗而非氯氮平,因为对该个体而言风险-效益比更佳。反之,该技术也有助于识别对氯氮平治疗失败或非候选人的TRS患者亚群,且其从ECT获益的可能性低,从而避免不太可能导致症状改善的ECT治疗。这些患者可能受益于更早期的新兴替代药物/治疗,伴或不伴氯氮平,具体取决于个体临床情况。这包括心理治疗,已被证明作为多模式治疗方案的补充,对TRS的阳性症状治疗可能有所帮助。最后,从医疗系统角度,该技术将使有限资源环境中的患者分诊成为可能,使ECT反应可能性最高的患者在需要排程时获得优先。总之,如果该技术得到发展、临床试验验证,可能最终导致治疗决策支持工具的开发,使更加现代、个性化和多模式的治疗方案得以从个体预测疗效数据中衍生。
4.3 局限性
本研究局限性包括每项研究中研究数量和患者数量较少,因为这代表了一个新颖的研究领域。鉴于这是在单一数据库(即PUBMED)中进行聚焦性而非系统性综述,作者承认检索过程可能未识别该主题的全部已发表文献,因此本工作可能不代表该 with 该主题相关的全部研究。此外,如前所述,两项研究使用了相同患者集,三项研究均在同一医疗中心进行,意味着在通过不同患者、MRI扫描仪、研究人员等再现结果之前,应对这些结果保持健康怀疑态度。三项研究中关于APM方案的细节,包括氯氮平的使用和耐药性均不可用。应在与其他已确认氯氮平试验失败的患者人群比较时考虑这一点。另外,纳入患者未按病程标准化。终生病程和DUP可能对神经影像模型生成产生有意义影响,因为精神病发作期间存在灰白质体积丢失。然而,控制这些因素可能只会进一步增强未来模型的预测能力,因为这将在理论上创建数据异质性更可比的模型生成组。
4.4 未来方向
就未来方向而言,此处讨论的早期模型证明了尽管训练样本量相对较小,但生成稳健的TRS患者ECT反应预测模型是可行的。鉴于上述关于缺乏外部验证的局限性,未来研究应寻求再现和改进研究发现,希望最终构建经验证、可靠且临床适用的模型。将这些模型扩展至包含数百或数千例患者可能大幅增强预测潜力,也应成为验证后未来研究的重点。为个体患者亚群创建模型(如纳入DUP、终生病程、人口统计学信息等)也可能增强预测能力,应成为未来研究的另一个重点。这一点尤为重要,因为考虑到症状早期发作(增加终生病程)与TRS风险增加相关,早发TRS与更差的认知和社会心理结局相关,可能由DUP促成。其他研究正在调查脑MRI用于预测非难治性精神分裂症的抗精神病药物反应。将药物反应模型与ECT反应预测模型相结合将是该技术的终极演进和临床影响。这将允许指导首次发作精神病患者(甚至在证明为TRS之前)应接受何种药物与其他非药物治疗的组合,基于个体预测疗效。
5. 结论
在机器学习支持下,预测建模在精神分裂症治疗选择临床决策中的应用将成为当代精神科实践的有力补充,并可能在未来成为常态。影像组学代表了一个特别有前景的前沿领域,因其允许提取常规影像解读中未评估的不可见性定量数据。这些早期研究表明,机器学习可能允许利用影像组学神经影像特征来预测精神分裂症的ECT治疗反应。需要更多数据来比较该技术与传统临床评估和治疗选择的性能。总体而言,鉴于样本量小和缺乏外部验证/结果再现,目前综述数据的普遍性较低。然而,这些早期发现可能为这个日益增长的研究领域提供谨慎乐观的态度,该领域似乎值得继续追求。最终临床测试和验证预测模型的发展将允许使用预测疗效数据为TRS创建个体化治疗方案。这代表了向个性化医学迈进的道路——从群体层面、泛化性的治疗疗效研究转向利用个体因素预测治疗反应,可能显著推进精神分裂症的治疗。