量化病灶的纹理和形状对乳腺超声深度学习分割的影响
《Biomedical Signal Processing and Control》:Quantifying how lesion texture and shape influence deep learning segmentation in breast ultrasound
【字体:
大
中
小
】
时间:2026年06月18日
来源:Biomedical Signal Processing and Control 4.9
编辑推荐:
穆罕默德·阿利扎·穆德里卡|西蒂·朱莉娅|扎赫拉·阿齐扎|沙希尔·西雷加尔
印度尼西亚西爪哇省德波克市,16424,印度尼西亚数学与自然科学学院物理系
**摘要**
深度学习模型,尤其是U-Net变体,在乳腺超声图像的病变分割任务中表现出优异性能。然而,大多数研究仅
穆罕默德·阿利扎·穆德里卡|西蒂·朱莉娅|扎赫拉·阿齐扎|沙希尔·西雷加尔
印度尼西亚西爪哇省德波克市,16424,印度尼西亚数学与自然科学学院物理系
**摘要**
深度学习模型,尤其是U-Net变体,在乳腺超声图像的病变分割任务中表现出优异性能。然而,大多数研究仅报告整体分割精度,未分析病变固有特征对模型性能的影响,这限制了人们对临床环境中分割结果可靠性的理解。本研究量化分析了三种架构——U-Net、U-Net++和UResNet-34——在BrEaST数据集上训练并在独立BLUI数据集上测试时,病变级别特征对分割性能的影响。在BLUI数据集上,杰卡德相似度指数范围为0.724至0.785,表明模型具有中等泛化能力。从每个真实病变掩模和乳腺超声图像中提取了15个定量特征,包括形状描述符、强度指标以及基于灰度共生矩阵并通过良性与恶性病变掩模公式得出的纹理参数。研究采用了皮尔逊相关分析及回归模型(随机森林、AdaBoost、支持向量回归)来探讨这些特征与分割质量之间的关联。与JSI相关性最稳定的特征是与强度相关的参数,尤其是病变与背景的对比度,其次是对比度与噪声比以及边缘清晰度,而形态学描述符的影响相对较弱。随机森林模型的预测性能最佳(R2=0.440),可解释约44%的方差变化。这些结果表明,病变强度对比度和信号质量是决定分割稳健性的关键因素,为此,需采用考虑对比度的建模策略及质量保障框架,以提升临床乳腺超声分析的可靠性。
**引言**
乳腺癌是全球最为常见且致命的恶性肿瘤之一,2022年全球新增病例超过230万例,死亡人数约为665,684例[1]。在许多国家,它是女性癌症相关死亡的首要原因,且由于人口结构、环境因素及生活方式的改变,其发病率正在全球范围内上升[2][3]。早期发现和及时干预能显著改善患者预后,这凸显了准确可靠的诊断成像技术的重要性[4][5]。
乳腺X线摄影仍是乳腺癌筛查的金标准。但对于乳腺组织致密的女性,其诊断效果会受到影响,因为重叠的纤维腺体结构可能掩盖病变[6]。此外,乳腺X线摄影涉及电离辐射,这对年轻女性或需要反复检查的患者而言并不理想[7]。乳腺超声则是一种互补的成像方式,能够实现实时、无辐射且成本较低的评估,尤其适用于乳腺组织致密的患者以及资源有限的地区[8]。此外,乳腺超声还能对可触及的异常进行针对性评估,并为影像引导下的介入治疗提供帮助。尽管如此,乳腺超声的结果高度依赖操作者,且易受斑点噪声、病变与背景对比度低以及患者解剖结构差异等因素的影响而下降[9][10]。这些因素导致了不同医疗机构之间诊断结果的差异性。
近十年来,深度学习技术,尤其是卷积神经网络,已成为自动化医学图像分割领域的强大工具。U-Net[11]及其衍生架构,如U-Net++[12],凭借其编码器-解码器结构及保留空间细节的跳跃连接,在乳腺超声病变分割任务中展现出领先性能。此外,还有基于注意力机制的U-Net[13]以及残差型U-Net混合架构[14][15],旨在进一步提升边界识别能力和模型泛化性。然而,当将这些模型应用于采用不同成像方案、探头设置或扫描设备获取的外部数据集时,其分割精度往往会下降。这种领域适应性问题是阻碍其临床应用的主要障碍[13][16]。
与上述发展同步,放射组学作为一种量化描述病变特征的方法也逐渐受到重视。从灰度共生矩阵中提取的形状描述符(如圆形度、实心度、偏心度)及二阶纹理特征,已被证明与乳腺超声中的肿瘤病理类型、预后及治疗反应存在密切关联[17][18][19]。尤其是纹理分析,能够捕捉那些肉眼难以察觉但可能影响诊断决策的超声纹理微观模式。尽管如此,目前大多数关于乳腺超声深度学习分割的研究仅报告 Dice系数或杰卡德相似度指数等总体性能指标,未能探讨病变特异性特征对分割质量的实际影响。病变形态、纹理与分割网络泛化能力之间的内在联系仍需进一步研究。
理解这一关系至关重要,原因至少有三:
• **临床可靠性**:某些特定类型的病变容易引发分割错误,进而影响诊断结果;
• **模型可解释性**:识别与分割性能相关的病变特征有助于构建可解释的人工智能系统;
• **质量保障**:量化这些影响因素可让自动系统识别出存在高分割错误风险的病例。
本研究旨在探讨病变级别的形状和纹理特征对三种基于CNN的架构——U-Net、U-Net++和UResNet-34——分割精度的影响。这些模型均在BrEaST数据集上训练,然后在独立的BLUI数据集上进行测试。据我们所知,此前仅有少数研究系统地量化并分析了乳腺超声分割中的这类关系。
本研究的主要贡献如下:
• 对病变级别的特征(形态学特征、基于强度的特征以及来自灰度共生矩阵的纹理特征)与分割质量之间的关系进行了定量分析;
• 验证了与强度相关的特征,尤其是病变与背景的对比度、对比度与噪声比以及边缘清晰度,是预测分割成功与否的关键因素,而形状描述符的影响相对较弱;
• 提出了基于特征的分割策略,并概述了基于特征的质量控制机制,旨在提升不同临床环境下自动乳腺超声分析的稳健性。
**章节节选**
**乳腺超声分割中的深度学习**
U-Net[11]的出现为医学图像分割带来了重大变革,尤其是在标注数据集较为有限的生物医学领域。U-Net的编码器-解码器结构结合跳跃连接,既能够保留精细的空间细节,又能整合上下文信息。U-Net++[12]通过重新设计跳跃路径,缩小编码器与解码器特征之间的语义差距,引入了更密集的跳跃连接以及更深层的结构。
**数据集**
本研究使用了两个公开可用的乳腺超声图像数据集:BrEaST数据集和BLUI数据集。BrEaST数据集由Paw?owska等人于2019年至2022年间在波兰多家医疗机构使用四种不同的扫描设备(Hitachi ARIETTA 70、Esaote 6150、Samsung RS85以及Philips Affiniti/EPIQ 5G)采集,共包含256幅图像[30]。该数据集包含154幅良性病变图像、98幅恶性病变图像以及4幅正常乳腺图像。
**分割性能**
这三种架构在BrEaST训练集上的表现均十分出色,其中U-Net++的训练集杰卡德相似度指数最高,为0.961±0.065,其次是U-Net,为0.953±0.073,UResNet-34为0.899±0.085(见表2)。在独立的BLUI测试集上,各模型的性能有所下降,杰卡德相似度指数范围在0.724至0.785之间。其中UResNet-34的测试集杰卡德相似度指数最高,为0.785±0.166,其次是U-Net++,为0.761±0.166,U-Net为0.724±0.171。这些结果证实了模型在不同数据集间的性能差异具有实际意义。
**结论**
本研究系统地定量分析了病变级别特征——包括形状、强度和纹理特征——对乳腺超声成像中深度学习模型分割性能的影响。通过在BrEaST数据集上训练三种架构,并在BLUI数据集上对其性能进行评估,我们研究了病变固有属性与模型跨数据集泛化能力之间的关系。
**皮尔逊相关分析**
**CRediT作者贡献说明**
穆罕默德·阿利扎·穆德里卡:撰写——初稿、可视化、方法论、研究实施、正式分析、概念设计、数据整理、软件开发。
西蒂·朱莉娅:撰写——审阅与编辑、验证、方法论。
扎赫拉·阿齐扎:撰写——审阅与编辑、验证。
沙希尔·西雷加尔:撰写——审阅与编辑、监督、资金申请、概念设计、项目管理。
**利益冲突声明**
作者声明不存在任何可能影响本研究结果的已知财务利益或个人关系。
**致谢**
本研究得到了印度尼西亚大学研究与开发处的支持,具体项目为FMIPA UI 2024研究生研究资助计划(项目编号PKS-048/UN2.F3.D/PPM.00.02/2024)。本研究中的计算工作还获得了印度尼西亚东丽科学基金会(ITSF)2024年度科学技术研究资助的支持。作者感谢印度尼西亚大学的Djarwani Soeharso Soejoko教授,他在讨论和见解方面为本研究提供了重要帮助。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号