《Diagnostics》:Needle Types and Diagnostic Accuracy in EUS-Guided Liver Biopsy: A Systematic Review and Network Meta-Analysis
编辑推荐:
背景:对于内镜超声(EUS)引导下肝活检(LB)的最佳针头尚不明确。方法:研究人员进行了一项网络荟萃分析,整合了不同针头之间的直接和间接比较。分析纳入了5项随机对照试验(RCTs),共251例患者,比较了19G细针穿刺(FNA)、19G Franseen细针活
背景:对于内镜超声(EUS)引导下肝活检(LB)的最佳针头尚不明确。方法:研究人员进行了一项网络荟萃分析,整合了不同针头之间的直接和间接比较。分析纳入了5项随机对照试验(RCTs),共251例患者,比较了19G细针穿刺(FNA)、19G Franseen细针活检(FNB)、19G Fork-tip FNB、22G Franseen FNB和22G Fork-tip FNB。主要结局指标为总标本长度和完整汇管区(CPTs)数量。结果以平均差(MD)或风险比(RR)及其95%置信区间(CIs)表示。结果:19G Fork-tip和19G Franseen针头在总标本长度和CPT数量上显著优于其他针头。19G FNA与22G Franseen或Fork-tip针头之间未观察到差异。SUCRA排序显示,19G Franseen和19G Fork-tip FNB为表现最佳针头,其标本长度的SUCRA得分分别为0.91和0.83,CPTs的SUCRA得分分别为0.85和0.82。未报告严重不良事件。由于偏倚风险和不精确性,证据质量总体被认为较低。结论:19G Franseen和Fork-tip FNB显示出有利结果,但需要进一步的RCTs来证实这些结果。
**1. 引言**
尽管非侵入性检测的广泛应用简化了多种肝脏疾病的诊断流程,但通过肝活检(LB)进行的组织学评估仍然经常需要。肝活检的主要目标是获取足够的标本用于诊断。美国肝病研究协会(AASLD)将最佳标本定义为福尔马林固定后至少长2-3厘米,且包含≥11个完整汇管区(CPTs)。另一方面,英国联合学会的最新指南推荐获取长度>20毫米的样本,而不考虑CPT数量。经皮肝活检(通常在超声引导下)数十年来一直是肝组织取样的金标准。经颈静脉肝活检在终末期肝病、凝血功能障碍或腹水患者中可作为有价值的替代选择,因其经静脉途径且无包膜穿刺可降低出血并发症风险。内镜超声引导(EUS)下通过细针穿刺(FNA)或细针活检(FNB)进行组织获取,已在胰腺和腹部实性病变的诊断流程中发挥关键作用,且EUS-LB显示出良好的诊断效能,报告的组织学充分率为93.9%,并发症发生率低至2.3%。这些有希望的结果随着新型端切式FNB针头(如Franseen针头(Acquire?,Boston Scientific,Marlborough,MA,USA)和Fork-tip针头(SharkCore?,Medtronic,Dublin,Ireland))的应用而进一步改善。EUS-LB近期被提出作为经皮或经颈静脉LB的替代方法,具有相似结果、更低术后疼痛评分以及能够到达深部或困难部位取样的优势。尽管EUS-LB目前已成为成熟且广泛使用的技术,但最佳针头的选择仍不明确。既往荟萃分析发现19G FNA针头的诊断效能高于核心针头(主要是反向斜面FNB)。另一项更近期的荟萃分析显示FNB针头的CPT数量高于FNA。此外,在端切式FNB针头中,另一项荟萃分析发现Franseen针头优于Fork-tip装置。鉴于文献中的不一致结果,研究人员决定进行一项系统回顾和网络荟萃分析,比较用于EUS-LB的不同针头的随机对照试验(RCTs)。与成对荟萃分析不同,网络荟萃分析还可提供多种干预措施比较效果的间接证据,并综合跨RCTs网络的可获得数据。研究人员还使用了推荐分级的评估、制定与评价(GRADE)标准对网络荟萃分析进行证据质量评估。
**2. 方法**
本系统回顾根据系统综述和荟萃分析优先报告条目(PRISMA)扩展声明中的网络荟萃分析报告要求进行报告。
**2.1 选择标准**
纳入本荟萃分析的为符合以下纳入标准的英文RCTs:(a)患者:接受EUS-LB的成人(年龄>18岁);(b)干预措施:19G FNA、19G Franseen FNB、19G Fork-tip FNB、22G Franseen FNB、22G Fork-tip FNB;(c)对照措施:上述另一种针头;(d)结局指标:总标本长度、CPT数量、诊断充分性、不良事件(AEs)。排除非比较性观察性和回顾性研究、比较相同针头内不同取样策略或穿刺次数的试验、或比较EUS-LB与经皮LB的RCTs。
**2.2 检索策略**
检索策略采用多种数据库,使用不同的受控词汇、扩展术语、可变算法和关键词功能,检索自建库至2025年5月发表的RCTs。补充手动检索在额外数据库进行,并通过检查该主题所有主要综述文章的参考文献以识别可能的额外研究。详细文献检索策略见补充材料(表S1)。本综述未在国际注册平台注册。数据由两位作者独立提取至标准化表格。使用Cochrane偏倚风险评估工具对纳入研究进行偏倚风险评价,由两位作者独立进行。如遇分歧,由第三位作者意见决定。
**2.3 结局指标**
主要结局指标为总标本长度(以毫米测量)和平均CPT数量。次要结局指标为样本的诊断充分性,主要定义为至少2厘米标本长度且≥11个CPTs。不良事件报告不一致,仅进行描述性分析。
**2.4 统计分析**
网络荟萃分析采用基于随机效应一致性模型的频率学方法,通过多变量随机效应meta回归进行,结果以平均差(MD)或风险比(RR)及其95%置信区间(CIs)表示。对直接和间接治疗估计进行比较(可行时),通过节点分割技术评估网络荟萃分析的一致性。使用I
2统计量评估统计学异质性,值超过50%表示显著异质性。因研究数量有限,未报告漏斗图。方法排序基于累积排序曲线下面积(SUCRA)得分分析,以0(最差)至1(最佳)尺度测量。网络荟萃分析使用R包netmeta 3.5(R Foundation for Statistical Computing,Vienna,Austria)进行。
**2.5 证据质量**
采用GRADE框架判断成对和网络荟萃分析的证据质量。在该方法中,RCTs的证据起始为高质量,可根据偏倚风险、间接性、不精确性、不一致性(或异质性)和/或发表偏倚降级至中等、低和极低质量(表1和表S2)。
**3. 结果**
从最初通过检索策略识别的87篇文章中,最终纳入5项RCTs进行网络荟萃分析,比较用于EUS-LB的五种不同针头:19G FNA、19G Franseen FNB、19G Fork-tip FNB、22G Franseen FNB、22G Fork-tip FNB。图1详述了研究选择流程图,图2显示了可用的直接比较和试验网络。所有比较均来自单组RCT,除19G Franseen与19G Fork-tip针头的比较基于两项RCTs。19G Franseen是间接比较中的主要共同对照。
**3.1 纳入研究特征**
表2总结了纳入网络荟萃分析的RCTs的基线特征。总体而言,纳入的5项试验共纳入251例患者。两项RCTs比较了19G Franseen与19G Fork-tip,一项RCT比较了19G FNA与19G Franseen,一项RCT比较了19G FNA与22G Fork-tip,一项RCT比较了19G Franseen与22G Franseen。
三项研究严格符合诊断充分性的标准定义(至少2厘米标本长度且≥11个CPTs),一项RCT将充分性定义为≥5个CPTs,另一项RCT未报告定义充分性的最小CPT数量。患者基线特征在主动和对照组之间以及不同试验间均匀分布(表2)。所有RCTs仅包括用于肝实质疾病的EUS-LB。招募期从2016年至2022年,所有研究均在美国进行。三项RCTs对所有肝叶进行取样,针头通过次数和刺入次数分别在1至4次和1至7次之间。所有纳入RCTs均使用湿抽吸(主要使用肝素)。如图S1A、B所示,所有研究均存在高绩效偏倚风险。此外,一项RCT因未隐藏的序列生成和患者分配被认为存在高选择偏倚风险。
**3.2 总标本长度**
如表1所示,19G Fork-tip和19G Franseen FNB的总标本长度显著优于其他针头(与22G Franseen FNB相比,MD分别为2.76,1.43-4.10和3.19,2.07-4.31;与22G Fork-tip相比,MD分别为4.78,0.95-8.62和5.21,1.45-8.97;与19G FNA相比,MD分别为3.92,0.51-7.33和3.49,0.01-6.98)。19G FNA与22G Franseen或Fork-tip针头之间未检测到差异(表1和图3A)。同样,22G Franseen与Fork-tip FNB之间无差异(MD ?2.02,?5.95至1.91)。I
2为0%,表明无异质性。
因此,如表3所示,SUCRA排序表明19G Franseen和19G Fork-tip FNB为表现最佳针头(SUCRA分别为0.91和0.83),而19G FNA和22G Fork-tip FNB显示出最低效能(SUCRA分别为0.24和0.09)。
**3.3 CPT数量**
在网络荟萃分析中,19G Franseen和19G Fork-tip FNB显著优于22G Fork-tip FNB(MD分别为23.62,5.25-41.98和22.80,5.92-39.68)和19G FNA(MD分别为21.50,7.98-35.02和22.32,6.98-37.65;表1和图3B)。值得注意的是,19G Franseen和19G Fork-tip FNB与22G Franseen FNB之间未观察到统计学差异(MD分别为9.92,?2.49-22.32和9.10,?0.98-19.18)。未检测到其他差异(表1)。I
2为0%,表明无异质性。
因此,19G Fork-tip和19G Franseen FNB在CPT数量方面再次为最佳针头(SUCRA分别为0.85和0.82),其次为22G Franseen(SUCRA 0.53)、19G FNA(SUCRA 0.17)和22G Fork-tip(SUCRA 0.10)(表3)。
**3.4 诊断充分性和不良事件**
如表S3和S4所示,19G Fork-tip和19G Franseen FNB在诊断充分性方面显著优于22G Franseen(RR分别为6.61,1.08-40.53和8.50,1.76-41.09)。I
2为0%,表明无异质性。未检测到其他差异。因此,19G Franseen和19G Fork-tip FNB为表现最佳针头(SUCRA分别为0.81和0.63),而22G Franseen FNB显示最低充分率(SUCRA 0.02)。
表2描述性报告了纳入研究中登记的AEs。仅在Aggarwal等人的研究中观察到一例胃血肿,而其他RCTs报告了不同程度轻度腹痛发作。
**3.5 网络一致性和证据质量**
在可评估网络一致性的闭合环中,直接和间接估计之间无显著差异(总标本长度的组间差异p值范围为0.21-0.45,CPT数量的p值范围为0.15-0.72)。
证据质量主要被判断为低,原因是文献中的偏倚风险和结果不精确性(宽95%CIs跨越无效线或事件数少未达到所需信息量)。在诊断充分性分析中,由于纳入RCTs中充分样本定义不同导致的额外间接性风险,证据质量进一步降级至极低。
**4. 讨论**
其他非侵入性模态尚未完全取代肝活检在肝脏疾病诊断流程中的地位,特别是在需要适当组织学和免疫组织化学的自身免疫性肝炎或某些局灶性病变中。为克服经皮LB的主要局限性(如潜在严重并发症风险、观察者间变异和取样误差),经颈静脉LB已在高风险患者(如凝血功能障碍、抗血栓治疗或大量腹水患者)中进行测试;然而,该操作的复杂性和潜在并发症风险限制了其适用性。EUS-LB方法能够从双侧肝叶获取样本,甚至可到达深部位置,EUS引导可提高操作的安全性,并减少腹水和体型对诊断效能的影响。
然而,EUS-LB的最佳针头仍不明确。既往成对荟萃分析的结果不一致,且近年来发表了几项RCTs,特别测试了新型端切式FNB针头。通过网络荟萃分析(据研究人员所知为领域内首次发表),并使用GRADE标准评估证据质量,研究人员做出几项关键观察。首先,与其他针头相比,19G端切式FNB(无论是Fork-tip还是Franseen)能够获取显著更长的样本和更多的CPT数量。另一方面,19G FNA与22G端切式FNB针头之间未观察到差异。如预期,22G FNB针头表现相当(MD ?2.02,?5.95至1.91)。
因此,19G端切式FNB似乎决定了更有利的结果,如SUCRA排序所示,而19G FNA和22G Fork-tip FNB显示最低效能。
研究人员的结果表明,需使用较大口径针头以获取更长的样本和更多CPTs,这对于多种肝脏疾病的正确诊断至关重要。然而,较大尺寸针头可能引发关于针头操控性的担忧,尤其应被经验较少的操作者考虑。尽管22G端切式FNB针头最初在部分回顾性研究中显示出有希望的结果,但本网络荟萃分析和两项RCTs明确建议使用较大尺寸FNB针头以获得高质量样本。遗憾的是,关于另一种大尺寸端切式FNB针头(即20G前向斜面FNB)的比较数据缺乏,需在初步研究的有希望结果后于未来RCTs中进行测试。
作为第二个值得注意的发现,19G FNB在诊断充分性方面显著优于22G Franseen,但未优于19G FNA,尽管这两种针头在该特定参数上仍排名为最佳设备。纳入RCTs中诊断充分性的定义不一致,尤其依赖于不同CPT数量阈值。因此,尽管19G FNA针头在充分样本率上与19G端切式FNB相似,但后者的样本质量显著更高,从而为其在临床实践中的更广泛应用铺平道路。此外,诊断充分性分析应谨慎解读,且因结果证据质量极低(主要与纳入RCTs中使用的不一致充分性定义有关),应将发现视为探索性。有趣的是,所有RCTs均使用湿抽吸技术,该技术已证明在其他腹部肿块中表现良好。测试其他取样技术会有意义,尽管初步结果支持用于EUS-LB的肝素化湿抽吸方法。
第三个显著发现是,所有测试针头均具有良好的安全性特征,仅在Aggarwal等人的研究中观察到一例胃血肿,其他RCTs报告了轻度腹痛发作。尽管使用较大尺寸针头可能引发对针头操控性和操作安全性的担忧,但未报告技术失败或严重AE事件。然而,需注意纳入RCTs样本量不足检测这些罕见事件,可靠的安全性比较评估需更大规模研究。因此,本研究中的AE报告为描述性且研究间不一致。
最后,由于文献中绩效偏倚风险和结果不精确性导致的低质量证据,需进一步RCTs来确认这些结果,并加强支持19G FNB针头的推荐以指导即将发布的临床指南。
本研究存在某些局限性,既涉及网络分析也涉及个别研究,值得进一步讨论。首先,某些比较缺乏直接头对头试验,导致不同针头比较效能证据等级低至极低。需注意,在缺乏足够头对头RCTs的情况下进行多项间接比较可能导致较弱的结论,有时可能产生错误,尤其在解释SUCRA排序时。特别是,因RCTs数量有限可能使结果偏向网络中代表性最强的干预措施,SUCRA排序应谨慎解读。其次,网络荟萃分析可能因概念异质性(涉及参与者、干预措施、共同干预措施/背景治疗和结局评估的显著差异)而受到误解,这可能限制试验的可比性。例如,纳入RCTs使用不同取样方法(双叶或仅右叶取样)。最佳方法尚不明确且超出本荟萃分析范围;此外,这些潜在效应修饰因子的影响不确定。然而,它们对结果间接性的潜在影响已在分析中考虑。此外,如前所述,不同RCTs中诊断充分性的定义异质,且研究数量有限阻止了基于此方面的充分敏感性分析;然而,主要结局指标专门聚焦于充分性的定义特征(即标本长度和CPT数量),因此研究人员认为这种异质性未影响结果。
关于个别研究的局限性,研究人员承认大多数研究样本量小,未探索所有潜在混杂因素(例如上述取样方法(单叶或双叶)),也未测试辅助技术(如快速现场评估(ROSE)或宏观现场评估(MOSE))对EUS-LB的影响。此外,所有RCTs均在美国进行,这可能影响结果的可重复性。
然而,尽管存在这些局限性,据研究人员所知,本手稿是首篇比较不同EUS-LB针头的网络荟萃分析。尽管稳健的GRADE方法学显示主要为低水平证据,但研究人员观察到,基于当前可获得的证据,19G端切式FNB针头似乎提供最高的组织学效能。需进一步RCTs来确认这些结果。
**5. 结论**
本网络荟萃分析表明,在EUS引导下肝活检中,19G端切式细针活检(FNB)针头(具体为Franseen和Fork-tip类型)在标本长度和完整汇管区获取方面似乎优于19G细针穿刺(FNA)和较小尺寸的22G FNB针头。然而,由于偏倚和不精确性所致的低质量证据,需进一步设计良好的随机对照试验来确认这些结果,并为EUS-LB中针头选择的临床指南提供信息。