计算机辅助方法在胰腺细针穿刺细胞学中的应用成效如何?一项系统评价与荟萃分析

《Cytopathology》:What Are Computer-Assisted Methods Achieving in Fine-Needle Aspiration Cytology of the Pancreas? A Systematic Review and Meta-Analysis

【字体: 时间:2026年05月28日 来源:Cytopathology 1.1

编辑推荐:

  胰腺恶性肿瘤是重大诊断挑战,当前诊断金标准为内镜超声引导细针穿刺(EUS-FNA)联合细胞病理学评估。由于劳动力短缺,计算机辅助诊断(CAD)因可提升效率受到关注,但其在胰腺细胞学中的整体诊断影响尚不明确。研究人员旨在评估CAD在此场景下的准确性。研究人员开展

  
胰腺恶性肿瘤是重大诊断挑战,当前诊断金标准为内镜超声引导细针穿刺(EUS-FNA)联合细胞病理学评估。由于劳动力短缺,计算机辅助诊断(CAD)因可提升效率受到关注,但其在胰腺细胞学中的整体诊断影响尚不明确。研究人员旨在评估CAD在此场景下的准确性。研究人员开展了一项系统评价与荟萃分析,检索5个数据库(2010年1月至2025年5月)中应用CAD于胰腺FNA细胞学的研究,由两名研究者独立筛选文献,采用诊断准确性研究质量评估工具-2(QUADAS-2)评估偏倚风险,通过随机效应双变量模型生成合并灵敏度、特异度及汇总受试者工作特征(SROC)曲线。研究按分析单元分层:图像水平研究基于单个细胞病理图像生成预测,患者/病例水平研究整合每例多个图像生成单一诊断结果。最终10项研究符合纳入标准并提供定量数据。图像水平的合并灵敏度为91%[95%置信区间(CI):86–94],特异度为92%[87–96],SROC曲线下面积(AUC)为0.962;患者/病例水平的合并灵敏度为85%[69–93],特异度为91%[73–97],SROC AUC为0.919。异质性较高(I2=65%–93%),由回顾性设计和参考标准差异导致。结果表明CAD工具在确定性诊断中可达到接近专家的准确度,可减少常规筛查负担并加速手术规划,但选择偏倚、单中心训练及阈值不一致限制了普适性。未来需采用全切片工作流程的前瞻性多中心验证,远程病理学整合或可扩大其在资源匮乏地区的可及性。
该研究发表于《Cytopathology》,聚焦胰腺细针穿刺细胞学中计算机辅助方法的诊断价值。胰腺恶性肿瘤是全球致死率最高的实体肿瘤之一,五年总体生存率仅1%–12%,且超50%患者确诊时已发生转移,早期诊断对改善预后至关重要。目前内镜超声引导细针穿刺(EUS-FNA)是胰腺病变病理诊断的核心手段,但其准确性受非典型细胞形态、肿瘤异质性及全球细胞病理医师短缺限制,数字病理与人工智能(AI)技术的整合成为提升诊断效率的重要方向,但现有CAD工具的准确性尚未得到系统性量化评估。
研究人员开展的系统评价与荟萃分析严格遵循PRISMA指南并在PROSPERO注册(ID:CRD420251014289)。检索覆盖MEDLINE、EMBASE、Web of Science、Scopus及IEEE Xplore共5个数据库,检索时限为2010年1月至2025年5月,纳入所有将计算机辅助技术(含AI、机器学习、数字图像分析、全切片成像等)应用于胰腺FNA细胞学的诊断性能研究,未限定细胞制备类型或技术模态,同时纳入会议摘要以保证证据完整性。两名研究者独立完成文献筛选与数据提取,提取内容包括研究设计、样本特征、AI模型细节、参考标准及诊断效能指标(灵敏度、特异度、准确率、ROC曲线下面积等),缺失的四格表数据通过已报告指标回算,零单元格采用+0.5连续性校正以满足logit转换需求。统计分析采用R语言完成,按分析单元分为图像水平(基于单个细胞图像预测)与患者/病例水平(整合单例多图像生成单一诊断结果)两个亚组,分别通过PLOGIT广义线性混合模型计算合并比例,采用Reitsma双变量随机效应模型生成SROC曲线,并通过χ2检验比较亚组差异,同时进行敏感性分析排除会议摘要与连续性校正的影响。
研究结果部分显示,初筛共获得3701条记录,去重后2395篇经标题摘要筛选,93篇进入全文评估,最终21项研究纳入系统评价,其中10项提供充足定量数据进入荟萃分析。QUADAS-2偏倚风险评估表明,多数研究存在患者选择偏倚(9项为高风险,源于回顾性非连续入组)、索引测试适用性不确定(3项因事后阈值优化致高风险)及参考标准局限(2项仅以细胞学为金标准),且常排除血液遮挡或诊断困难病例,存在谱偏倚风险。
3.1 灵敏度分析结果显示,患者/病例水平研究的合并灵敏度为0.85(95%CI 0.69–0.93),图像水平为0.91(95%CI 0.86–0.94),亚组差异无统计学意义(χ2=1.20,p=0.27),两组均存在显著异质性(I2分别为80.4%与77.6%)。
3.2 特异度分析结果显示,患者/病例水平合并特异度为0.91(95%CI 0.73–0.97),图像水平为0.92(95%CI 0.87–0.96),亚组差异无统计学意义(χ2=0.09,p=0.76),异质性在图像水平尤为突出(I2=90.0%)。
3.3 准确率分析显示,单项研究准确率范围为0.71–0.96,图像水平算法中位数准确率(≈0.90)略高于患者/病例水平(≈0.82),但因受数据集恶性占比影响未计算合并值,最终以不受患病率影响的灵敏度与特异度作为主要比较指标。
3.4 SROC曲线分析显示,患者/病例水平模型的AUC为0.919,图像水平为0.962,表明两类模型均具备较强的阈值无关判别能力,图像水平模型区分效能更优。
讨论部分指出,当前CAD工具在二元分类任务中已接近专家水平,最大多中心研究显示半监督卷积神经网络外部验证准确率达94%、AUC达0.99,可减少观察者间变异,适合作为高工作量场景下的“第二阅片者”。在特定细分任务中价值明确,如自动化Ki-67指数计算与人工计数一致性极高(r=0.968,κ=0.86),92%病例可复现病理医师分级结果。但研究存在明显局限性:多数模型基于回顾性精选数据集训练,排除了不典型、可疑等“灰区”病例,而这类病例正是临床决策的核心难点,当面对此类病例时模型性能显著下降;依赖病理医师预先选取的“热点区域”而非自主全切片分析,且多为单中心小样本,外部验证时性能常下滑;训练集病理谱系狭窄,集中于胰腺导管腺癌(PDAC),罕见肿瘤代表性不足。此外,CAD在快速现场评估(ROSE)中具备服务层面价值,可支持标本 adequacy 评估与术中快速分诊,但仍无法替代病理医师对形态学、临床影像信息的整合及最终诊断责任。
研究结论部分表明,胰腺FNA细胞学的计算机辅助方法展现出可观前景,在限定分类任务中可实现高诊断准确度,在提升速度、一致性与定量分析方面具备优势,可作为辅助技术支持ROSE、初步诊断及胰腺神经内分泌肿瘤增殖标志物分级,有望提升 workflow 效率与诊断信心。但多数模型开发于受控环境,将诊断简化为二元结果,未反映细胞病理学的完整复杂性。未来临床应用需关注偏倚控制、普适性与临床整合,算法应基于包含不典型、不确定及罕见病变的多样化数据集训练,并在多中心完成稳健外部验证。后续研究应优先开展前瞻性多中心试验,在实时诊断 workflow 中评估AI效能,直接对比AI辅助实践与标准诊疗的差异,同时遵循诊断准确性报告规范以提升研究可比性与可重复性。开发者、病理医师及国家病理影像合作项目等的紧密协作,对工具优化、落地实施与信任构建至关重要,经持续验证后,AI驱动的图像分析有望成为胰腺细胞学中可靠的辅助工具,在专家监督下提升效率并支持诊断决策。
相关新闻
生物通微信公众号
微信
新浪微博

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号