用于青光眼筛查的多尺度密集网络及金字塔池化算法

《Journal of Visual Communication and Image Representation》:Multi-scale dense network with pyramid pooling for glaucoma screening

【字体: 时间:2026年04月10日 来源:Journal of Visual Communication and Image Representation 3.1

编辑推荐:

  青光眼诊断需精准视盘和虹膜分割结合杯盘比计算,传统方法依赖人工特征且存在主观性强、鲁棒性差等问题。本文提出MD-PPNet,通过动态权重分配与通道注意力实现自适应多尺度特征融合,金字塔密集块增强局部特征重用和梯度流动,复合损失函数处理类别不平衡。实验证明其分割精度和鲁棒性显著优于现有方法。

  
金英秀|周坤|王静|徐世杰|徐黎明
中国西华师范大学,中国

摘要

青光眼是一种不可逆的致盲眼病,临床诊断需要精确分割视盘(OD)和视杯(OC),并结合计算杯盘比(CDR)。尽管深度OD/OC分割技术取得了显著进展,但眼部病变的形态变异和复杂的解剖结构仍然具有挑战性。本文提出了一种结合金字塔池化网络的多尺度密集网络(Multi-Scale Dense Network with Pyramid Pooling Network)来解决这些问题。首先,尺度选择模块通过集成动态权重分配和通道注意力机制,实现了自适应的多尺度特征融合,有效适应OD/OC结构的形态变化。其次,我们设计了金字塔密集连接结构以增强局部特征的重用,并在瓶颈层引入梯度流,从而捕捉多层次的上下文信息,这有助于精确定位OD/OC边界,同时减少对高级语义特征的过度依赖导致的定位偏差。此外,混合损失函数结合多任务优化,解决了不同疾病进展阶段之间的特征异质性问题。实验表明,该方法在分割精度和鲁棒性方面明显优于现有方法。

引言

青光眼是一种慢性眼病,如果不及时治疗,可能导致失明[1]。青光眼的发病率急剧上升,给全球人口带来了沉重负担[2]、[3]、[4]。临床上,医生通常通过检查视盘(OD)和视杯(OC)的形态以及测量杯盘比(CDR)[5]来筛查青光眼,如图1所示。一般来说,当CDR大于0.6时,可以确定患者患有青光眼。然而,这种方法耗时、成本高,并且眼科医生的主观诊断存在差异[6]。成像技术的发展推动了计算机辅助青光眼早期诊断技术的快速发展[7],因此迫切需要设计自动化的青光眼检测方法来辅助医生进行诊断。
在过去的诊断发展中,基于专家经验的传统手动特征提取方法被大量提出[8]、[9]并用于青光眼检测。然而,由于这些方法依赖于专业知识,不确定性高且鲁棒性差,在复杂的OD/OC精细分割任务中受到限制[10]。随着计算机视觉技术的发展,深度学习因其强大的特征提取和泛化能力而在医学图像分析中变得至关重要。与传统方法不同,深度学习可以自动学习和识别医学图像中的复杂模式。U-Net的出现极大地推动了这一领域的发展,其众多变体在OD和OC分割中表现出优异的性能,尤其是在准确描绘结构边界方面。
2020年后的最新进展进一步推动了OD/OC分割的技术边界。基于Transformer的架构,如Vision Transformer(ViT)[11]和Swin Transformer[12],被引入以捕捉CNN局部感受野之外的长距离依赖关系。混合模型如CC-TransXNet[13]结合了CNN和Transformer的优势,以改善特征表示。此外,通过对U-Net进行注意力机制[14]、概率建模[15]和嵌套跳跃连接(U-Net++ [16])的改进,更好地处理了多尺度特征和边界模糊问题。尽管有这些改进,但在自适应多尺度融合、精确边界定位以及处理不同青光眼阶段的类别不平衡方面仍存在挑战。
尽管多尺度方法取得了进展,但仍存在三个主要限制:(1)固定的融合策略难以应对动态病变大小;(2)有限的感受野无法捕捉低对比度边界;(3)类别不平衡降低了不同青光眼阶段的准确性。具体来说,像U-Net++这样的网络使用固定的特征融合方式,无法适应病变规模的变化。此外,由于CNN的感受野较小,经常无法准确捕捉OD/OC边界,导致边缘断裂和对齐不准确。最后,在不平衡数据上训练的模型在病变不明显的早期阶段表现较差。
受到上述问题的启发,我们提出了结合金字塔池化的多尺度密集网络(Multi-Scale Dense Network with Pyramid Pooling Network),该网络增强了特征融合,扩大了感受野,并提高了不同青光眼阶段的分割精度。本工作的主要贡献如下:
我们创新地将动态权重选择与通道注意力相结合,通过尺度选择模块实现自适应的多尺度特征融合,以适应变化的OD/OC形态。
我们设计了金字塔密集块,其中金字塔池化模块捕捉多层次的全局上下文,密集块增强局部特征的重用和梯度流,从而平衡细节保留和语义理解,提高了OD/OC边界的定位精度。
我们提出了改进的损失函数,该函数结合了Tversky指数和交叉熵,保留了Dice损失的优势,以解决类别不平衡和边界模糊的问题。
在三个公开数据集上的实验评估表明,我们提出的方法性能显著提升,明显优于现有的先进方法。
本文的其余部分安排如下:第2节回顾了OD和OC分割的相关文献。第3节描述了所提出的方法。第4节介绍了数据集和训练配置,并将MD-PPNet与现有的OD和OC分割模型进行了比较。最后,第5节进行了总结。

相关研究

相关工作

为了说明我们设计的合理性,本节回顾了最新的OD/OC分割研究,包括传统分割方法和深度学习方法,重点介绍了以U-Net及其各种改进版本为代表的主要架构。

方法

本节介绍了所提出的MD-PPNet,如图2所示。我们首先对模型进行了全面概述,然后详细介绍了其核心组成部分,并解释了专门开发的损失函数的设计。

实验

为了验证MD-PPNet模型的有效性,我们在三个基准数据集上进行了广泛的实验。为了保证可重复性和透明度,MD-PPNet的完整实现(包括Scale-Selector和Pyramid Dense模块)可在https://github.com/Zionii/MD-PPNet-code公开获取。我们介绍了数据集和算法的实现细节。然后,将我们的方法与代表性的分割方法进行了比较,并对其性能进行了全面评估。

结论

本文提出了MD-PPNet,用于从眼底图像中进行OD/OC分割和青光眼诊断。关键创新包括:集成动态权重选择机制和通道注意力以实现自适应的多尺度特征融合;引入金字塔密集块结构,结合增强的局部特征复用和全局上下文捕获;以及设计复合损失函数,结合了多种损失函数的优势。这些创新共同提高了...

CRediT作者贡献声明

金英秀:撰写——原始草案、可视化、软件、资源、方法论、调查、形式分析、数据管理。周坤:撰写——审稿与编辑、验证、项目管理、调查、形式分析。王静:可视化、验证、监督、资源管理、调查。徐世杰:可视化、验证、项目管理、资金筹集。徐黎明:撰写——审稿与编辑、验证、监督、项目管理、资金筹集

利益冲突声明

作者声明没有已知的财务利益冲突或个人关系可能影响本文报告的工作。

致谢

作者感谢匿名审稿人的帮助。本工作得到了四川省科技计划(编号:2025ZNSFSC0456)和博士研究创新计划(编号:21E025)的支持。
相关新闻
生物通微信公众号
微信
新浪微博
  • 搜索
  • 国际
  • 国内
  • 人物
  • 产业
  • 热点
  • 科普

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号