自适应四叉树分割在巴氏涂片图像核与胞质分割中的应用:一种用于自动化细胞学的轻量级可解释方法

《Frontiers in Artificial Intelligence》:Adaptive quadtree-based segmentation of nucleus and cytoplasm in pap-smear images: a lightweight and interpretable approach for automated cytology

【字体: 时间:2026年06月12日 来源:Frontiers in Artificial Intelligence 4.7

编辑推荐:

  自动化分析巴氏涂片(Pap-smear)图像在宫颈癌筛查中具有重要作用,尤其在低资源环境中,人工细胞学检查仍面临劳动密集、主观性强及观察者间变异大等挑战。精确的核(nucleus)与胞质(cytoplasm)分割是计算机辅助诊断(computer-aided

  
自动化分析巴氏涂片(Pap-smear)图像在宫颈癌筛查中具有重要作用,尤其在低资源环境中,人工细胞学检查仍面临劳动密集、主观性强及观察者间变异大等挑战。精确的核(nucleus)与胞质(cytoplasm)分割是计算机辅助诊断(computer-aided diagnosis, CAD)系统中的关键步骤,可为定量形态计量学分析(quantitative morphometric analysis)及临床重要生物标志物(如核质比,nucleus-to-cytoplasm ratio, N/C ratio)的计算提供基础。然而,由于染色变异(staining variability)、非均质性(inhomogeneity)、形态不规则、胞质边界微弱及细胞结构重叠等因素,稳健的宫颈细胞分割仍具挑战性。本研究提出了一种基于自适应四叉树(adaptive quadtree)的分割框架,用于自动化巴氏涂片图像中核与胞质的 delineation。研究人员采用层次化分裂-合并分解(hierarchical split–merge decomposition)策略,以动态自适应统计均质性分析为指导,融合均值强度(mean intensity)、方差(variance)及熵(entropy)等测度。预处理阶段采用大核中值滤波(large-kernel median filtering)进行背景归一化,随后依次进行局部Otsu阈值化(local Otsu thresholding)、自适应区域合并(adaptive region merging)、重叠精化(overlap refinement)及形态学后处理(morphological post-processing)。该框架在Herlev宫颈细胞学数据集及包含重叠和聚集宫颈细胞的ISBI 2015宫颈细胞学分割挑战数据集上进行评估,并与U-Net与Attention U-Net进行了对比基准测试。在Herlev数据集上,所提框架在所有诊断类别中核Dice系数超过0.94,Zijdenbos相似性指数(Zijdenbos Similarity Index, ZSI)值大于0.9034,胞质分割性能亦具竞争力。在ISBI 2015数据集上,框架在重叠细胞条件下保持了可接受的分割性能,核Dice和ZSI值分别为0.912 ± 0.048和0.918 ± 0.044。形态计量学特征比较显示与金标准标注具有强一致性,面积和直径测量的平均百分比误差较低。尽管深度学习模型在高度复杂重叠条件下表现更优,但所提框架在计算资源需求显著降低且无需迭代模型训练的情况下仍保持竞争力。所提自适应四叉树分割框架为自动化宫颈细胞学分割提供了一种轻量级、可解释且计算高效的方法。其无需训练的设计、透明的统计决策规则及降低的硬件需求使其特别适用于资源受限及嵌入式宫颈癌筛查系统的部署,为自动化细胞学分析及下游计算机辅助诊断应用提供了实用的分割骨干。
本研究发表于《Frontiers in Artificial Intelligence》,研究背景聚焦于宫颈癌作为全球女性主要癌症相关发病和死亡原因,其中约85%的疾病负担发生在低收入和中等收入国家(low- and middle-income countries, LMICs),这些地区筛查基础设施、病理服务及专家资源有限。虽然宫颈癌可通过常规巴氏涂片筛查预防,但人工显微镜检查费时费力、主观性强,且存在观察者可变性,限制了诊断一致性与人群筛查覆盖率。计算机辅助诊断系统应运而生,其中核与胞质的分割是分析流程中的关键阶段,核的大小、形状、染色质分布及核质比等形态学特征是最重要的诊断生物标志物。然而,巴氏涂片图像中染色不均、对比度差、碎片伪影及重叠细胞等挑战使准确分割成为难题;深度学习虽表现强劲,但需大量标注数据、计算资源及GPU加速,且黑箱特性限制了临床可解释性。现有分割方法包括阈值法、基于边缘/轮廓的方法、区域分裂/合并方法、分水岭法、聚类模糊方法及深度学习方法,各有优劣,而自适应四叉树分解(一种层次化图像分解技术,将图像递归划分为逐渐变小的空间区域)在视频压缩、计算病理学及视网膜血管检测等生物医学图像分析中展现出可解释性与计算效率优势,但在宫颈细胞学核与胞质同时分割中的应用尚不充分。

研究人员开展了以下工作:提出自适应四叉树分割框架,采用层次化分裂-合并分解,以均值强度、方差和熵作为动态自适应统计均质性测度,结合大核中值滤波背景归一化、局部Otsu阈值化、自适应区域合并、重叠精化及形态学后处理,无需训练即可实现核与胞质分割,并在Herlev数据集和ISBI 2015数据集上与U-Net及Attention U-Net进行对比。主要结论包括:框架在Herlev数据集上核Dice系数超过0.94、ZSI大于0.9034;ISBI 2015重叠细胞条件下核Dice和ZSI分别为0.912±0.048和0.918±0.044;形态计量学特征与金标准一致性好;虽未超越深度学习在复杂重叠场景下的性能,但计算资源需求显著降低且无需训练,具有临床部署价值。该研究意义在于为资源受限环境、便携式数字细胞学系统和嵌入式显微镜平台提供了轻量化、可解释的分割解决方案。

主要关键技术方法如下(样本队列来源:Herlev大学医院宫颈细胞学数据集,917张单细胞图像,7个诊断类别;ISBI 2015宫颈细胞学分割挑战数据集,含重叠和聚集细胞):256×256像素图像归一化后转换为灰度图;27×27大核中值滤波进行背景归一化;自适应四叉树分解以均值、方差和Shannon熵为统计描述符,基于图像特定统计分布计算自适应方差和熵阈值(Tvσ2+0.5σσ2,TeH+0.5σH),最小块大小4×4像素;区域分类阶段采用局部Otsu阈值结合高方差、高熵识别核,中间强度及空间连续性识别胞质,高强度低方差低熵识别背景;相邻均质区域合并(相似性阈值Tm=8);基于核种子标记的欧氏距离变换和标记控制分水岭法处理重叠;形态学闭运算(核半径2像素,胞质半径3像素)及小对象/孔洞填充;指针参数β实现层次区域追踪。

研究结果部分:

核与胞质分割性能:自适应四叉树分割框架在Herlev数据集上产生了准确且视觉连贯的核与胞质 delineation。层次化分裂-合并机制成功分离了高方差核区域,同时保持了低方差胞质区域的连续性。后续形态学精化改善了边界平滑度,填充了小内部孔洞,并去除了结构边缘附近的孤立误分类像素。视觉检查显示该算法在低级别和高级别异型增生类别中均保持结构保真度,包括核形态不规则和轻度胞质重叠的病例。

Herlev数据集定量评估:该数据集7个类别图像用于测试四叉树分解算法准确分割核区域的能力。采用Zijdenbos相似性指数(ZSI)进行详细比较,四叉树算法在所有7个类别中ZSI均值大于0.9034,标准差小于0.1735,与Kale and Aksoy(2010)及Li等人(2012)的方法相比具有可接受性能。胞质分割ZSI为0.9498±0.0921,与Yang-Mao等人(2008)及Li等人(2012)的方法相比表现良好。整体图像分割定量评估显示,核Dice系数0.947±0.031、ZSI 0.934±0.038、精确率0.952±0.026;胞质Dice系数0.928±0.046、ZSI 0.918±0.051、精确率0.934±0.043。

形态计量学特征验证:从核和胞质区域提取的形态计量学特征与Herlev数据集金标准测量值进行比较,包括核面积(NA)、核最短直径(NSD)、核最长直径(NLD)、核圆度(NR)、核周长(NP)、核位置(NL)、胞质面积(CA)、胞质最短直径(CSD)、胞质最长直径(CLD)、胞质圆度(CR)及胞质周长(CP)。各特征平均百分比误差分别为0.112、0.207、0.152、0.242、0.229、0.243、0.064、0.256、0.197、0.215和0.266。胞质面积误差(0.064)特别低,显示强的区域恢复能力。形状特征(圆度、周长)变异较高,因其对小边界偏差敏感。核直径误差在细胞学标注研究报道的观察者间变异范围内可接受。箱线图显示大多数特征的中位百分比误差低于0.20,极端离群值有限,每幅图像误差分布证实分割稳定性在不同形态类别中保持。

Herlev数据集按类别核分割性能:按类别评估显示所有七个诊断类别中核分割性能一致。表层鳞状细胞(0.962±0.018)和中层鳞状细胞(0.955±0.026)性能最高,柱状细胞(0.917±0.052)和原位癌(0.923±0.049)较低,原因在于不规则核形态、异质性染色质分布和微弱胞质边界。

ISBI 2015数据集定量评估:在含重叠和聚集宫颈细胞的ISBI 2015数据集上,核Dice系数0.912±0.048、ZSI 0.918±0.044、精确率0.926±0.039;胞质Dice系数0.881±0.067、ZSI 0.887±0.061、精确率0.894±0.058。与Herlev数据集相比观察到中度性能下降,胞质分割受严重重叠、聚集细胞结构和微弱胞质边界影响。

与深度学习模型对比基准:Herlev数据集上,自适应四叉树(Dice 0.947±0.031,ZSI 0.934±0.038)与U-Net(0.962±0.024,0.951±0.029)和Attention U-Net(0.971±0.019,0.963±0.021)相比略低;ISBI 2015数据集上,自适应四叉树(0.912±0.048,0.918±0.044)亦低于U-Net(0.941±0.036,0.936±0.039)和Attention U-Net(0.953±0.028,0.947±0.031)。深度学习架构在严重重叠条件下性能更高,但所提框架无需迭代训练且计算资源需求显著降低。

计算效率分析:自适应四叉树单图运行时间0.42±0.08秒,内存使用118±15 MB,无需GPU和训练;U-Net分别为1.83±0.26秒、1824±143 MB、需GPU和训练;Attention U-Net为2.41±0.31秒、2146±172 MB、需GPU和训练。框架运行时间变异低、内存占用少、无GPU依赖、无训练要求。

讨论部分总结:研究人员指出,大核中值滤波(27×27)的应用是性能关键因素,其估计并去除缓慢变化背景强度,同时保留细胞结构,提高了方差和熵测度的稳定性,减少了染色异质性和照明变化导致的错误细分。与传统四叉树方法不同,本框架同时在每个节点整合均值强度、方差和熵,结合自适应阈值和局部Otsu阈值,改善了核、胞质和背景区域的区分。框架在Herlev数据集上核分割性能强劲,新区域变异性低,证实自适应分解策略对紧凑高对比度核结构有效。特征级验证显示与金标准标注强一致,尤其是核和胞质面积测量。在ISBI 2015数据集上,重叠精化阶段改善了相邻细胞结构分离和胞质区域向对应核的分配,表明自适应四叉树分解可支持孤立单细胞以外的分割场景。基准比较显示深度学习模型性能更优,尤其在ISBI 2015数据集上,Attention U-Net因注意引导上下文特征精化能力实现最高整体精度;但所提框架在无需迭代训练、GPU加速或大型标注数据集的情况下仍具竞争力,对计算基础设施有限环境尤为重要。研究的主要贡献在于证明有效宫颈细胞学分割不一定需要深度卷积架构或大量训练数据;框架通过显式统计分解、自适应阈值计算和透明区域合并标准保持完全可解释性,与深度学习模型的隐式学习行为形成对比,其数学可追溯的分割决策直接与可测量图像特征(强度、方差、熵和空间连通性)相关联。计算效率分析进一步确认了轻量级特性,层次分解策略可快速消除均质背景区域,减少不必要计算,适用于便携式数字细胞学系统和资源受限筛查环境。局限性包括:框架未设计为在严重重叠条件下超越优化后的深度学习架构;密集聚集细胞区域胞质分割仍具挑战;当前评估限于图像级分割,未涵盖全玻片图像分析或大规模临床部署。未来工作将聚焦于混合可解释深度学习分割架构、多尺度自适应分解策略,以及嵌入式显微镜和边缘细胞学系统的部署优化。

研究结论部分翻译如下:

准确的核和胞质分割仍然是自动化巴氏涂片分析和宫颈癌筛查系统中的基本要求。这些细胞结构的可靠 delineation 使定量形态计量学分析成为可能,包括核大小、形状、纹理及临床重要的核质比(N/C ratio)评估。然而,由于染色变异、强度非均质性、形态不规则和细胞结构重叠,稳健分割仍具挑战性。本研究提出了一种用于自动化宫颈细胞分割的自适应四叉树分割框架,利用自适应统计均质性分析指导的层次化区域分解。该框架整合均值强度、方差、熵、局部Otsu阈值化、自适应区域合并、重叠精化和形态学后处理,以提高核、胞质和背景区域间的区分能力,同时保持计算效率和可解释性。在Herlev数据集和更具挑战性的ISBI 2015宫颈细胞学分割挑战数据集上的实验评估表明,所提框架能够在孤立和重叠宫颈细胞环境中产生具有竞争力和可重复性的分割结果。框架在Herlev数据集上表现强劲,核Dice系数超过0.94,所有诊断类别ZSI值大于0.9034。在更具挑战性的ISBI 2015重叠细胞数据集上也获得了可接受的性能,证实了自适应层次分解在受控单细胞场景以外的适用性。与U-Net和Attention U-Net的对比基准表明,尽管深度学习架构在高度复杂重叠条件下实现更优性能,但所提框架在显著降低计算资源需求且无需迭代模型训练的情况下仍保持竞争力。与深度学习方法不同,所提方法无需GPU基础设施、大型标注数据集或大量超参数优化,同时保持可解释和数学可追溯的分割行为。计算效率、透明度和降低的硬件需求使该框架特别适用于资源受限环境、便携式数字细胞学系统和用于分散式宫颈癌筛查的嵌入式显微镜平台的部署。总体而言,所提自适应四叉树分割框架为自动化宫颈细胞学分析和下游计算机辅助诊断系统提供了实用、轻量级和可解释的分割骨干。
相关新闻
生物通微信公众号
微信
新浪微博

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号