《IEEE Access》:HMA-GPNET: A Lightweight Direction-Aware Attention Network for Retinal OCT Disease Classification
编辑推荐:
为解决视网膜光学相干断层扫描(OCT)图像疾病自动分类中模型参数量大、计算复杂度高以及在多样异构数据上泛化能力有限的问题,研究人员开展了基于方向感知注意力网络的轻量化架构研究。他们提出的HMA-GPNET模型,在整合了六个公共OCT数据集(OCTDL, DUKE, OCT-C8, OCT2017, NEH, ARMD-Kaggle)的统一基准上进行了评估,结果表明该模型能以极少的参数(1.546百万)实现92.87%至100%的数据集特异性准确率,在NVIDIA RTX 3050笔记本电脑GPU上单次扫描延迟仅为8.18毫秒,模型大小仅5.91 MB,显示出在资源受限环境下部署的巨大潜力。
在人工智能辅助诊断领域,对眼底进行快速、准确的疾病筛查是守护视觉健康的关键一环。光学相干断层扫描(OCT)作为一种非侵入性的影像技术,已经成为眼科医生诊断视网膜疾病(如老年性黄斑变性、糖尿病性黄斑水肿等)的“黄金标准”。然而,人工阅片耗时耗力,且高度依赖专家的经验,在医疗资源不均衡的地区尤为受限。于是,基于深度学习的OCT图像自动分类研究应运而生,旨在为医生提供一个高效、可靠的辅助工具。但这条路并非坦途,现有的深度学习模型往往“体型庞大”、计算需求高,难以“奔跑”在笔记本电脑、便携设备等计算资源有限的现实场景中。此外,来自不同医院、不同型号OCT扫描仪获取的图像,在分辨率、对比度和噪声水平上存在差异,这种“领域偏移”让一个在特定数据集上表现优异的模型,在另一个数据集上可能“水土不服”,泛化能力面临严峻挑战。为了攻克这些难题,让AI诊断工具更“轻便”、更“健壮”,一项针对性的研究在《IEEE Access》期刊上发表。
为了开展研究,作者主要采用了以下关键技术方法:1)构建了统一的多数据集评估基准,整合了OCTDL、DUKE、OCT-C8、OCT2017、NEH和ARMD-Kaggle六个公开OCT数据集,以模拟异质性和类别不平衡条件。2)提出了名为HMA-GPNET的轻量化神经网络架构,其核心创新在于引入了采用分解非对称卷积的平行融合块(Parallel Fusion Blocks),以方向感知的方式高效捕获视网膜的层状结构特征。3)采用了双阶段注意力策略,即在特征提取层级中嵌入几乎不增加参数的微注意力(Micro-Attention)来细化局部特征,并在最终阶段应用计算开销极小的混合乘法注意力(Hybrid Multiplicative Attention)进行联合通道-空间重校准。4)进行了详尽的性能评估,包括在多数据集上的分类准确率测试,以及在NVIDIA RTX 3050笔记本电脑GPU上的推理延迟和模型大小测量。
网络架构与创新设计
通过引入分解非对称卷积和平行融合块,HMA-GPNET能够以较低的计算成本(2.056 GFLOPs)有效提取视网膜图像中具有方向性的结构特征,为后续分类奠定了轻量化且判别力强的基础。
双阶段注意力机制的作用
研究表明,嵌入的微注意力模块在几乎不增加参数的情况下增强了局部特征的表示能力,而最终阶段的混合乘法注意力则通过联合通道与空间维度的重校准,显著提升了模型对判别性特征的聚焦能力,从而共同提升了分类性能。
在统一多数据集基准上的性能表现
在整合了六个异构OCT数据集的基准上进行评估,HMA-GPNET展现出了有竞争力的性能,其数据集特异性准确率在92.87%到100%之间。这验证了模型在一定程度上处理领域差异和类别不平衡的能力,尽管在跨域条件下性能仍存在波动。
轻量化与效率评估
模型仅包含1.546百万可训练参数,占用5.91 MB存储空间。在NVIDIA RTX 3050笔记本电脑GPU上进行推理测试,单次扫描延迟仅为8.18毫秒。这些量化指标强有力地证明了该模型在计算资源受限的边缘或移动设备上具备实际部署的潜力。
研究结论与讨论
本研究表明,HMA-GPNET是一种参数高效、计算轻量的深度学习架构,能够有效地从视网膜OCT图像中进行疾病分类。模型的核心优势在于通过方向感知的卷积设计和高效的双阶段注意力机制,在保持高分类性能的同时,极大地压缩了模型的复杂度和计算需求。在包含多中心、多扫描仪数据的统一基准上取得的良好结果,表明该模型对数据异质性具有一定的鲁棒性。更重要的是,其实测的极低推理延迟和微小模型体积,为解决深度学习模型在临床实际部署中常遇到的资源瓶颈问题提供了一个有前景的技术方案。虽然研究也指出模型在极端领域偏移下性能仍会下降,这为未来研究指明了方向,但当前工作无疑为推动准确、快速且可负担的AI辅助眼科诊断工具迈向现实应用,迈出了坚实的一步。其轻量化的设计理念对于开发其他医学影像分析工具也具有重要的借鉴意义。