一种结合卷积混合器（ConvMixer）和注意力机制的深度学习框架，用于乳腺密度评估

首页今日动态人才市场新技术专栏中国科学人云展台
BioHot
云讲堂直播会展中心特价专栏技术快讯免费试用

生物通官微
陪你抓住生命科技
跳动的脉搏

生物通首页 > 今日动态 > 正文

《Engineering Applications of Artificial Intelligence》：A ConvMixer-Enhanced deep learning framework with attention mechanism for mammographic breast density assessment

【字体：大中小】 时间：2026年04月28日 来源：Engineering Applications of Artificial Intelligence 8

编辑推荐：

浙江省 Taizhou 市浙江癌症医院（Taizhou Cancer Hospital）Taizhou 校区微创介入治疗与人工智能重点实验室，中国浙江省 Taizhou 市，317502

摘要

乳腺癌（BC）仍然是一个全球性的健康问题，早期诊断对于有效治疗至关重要。乳腺密度是一个重要的风险因素，可以通过乳腺X光片进行评估，但由于组织结构的复杂性，解读起来仍然具有挑战性。深度学习（DL）在自动化乳腺X光分析方面显示出巨大的潜力，可以更准确、更高效地进行诊断。在这项研究中，我们提出了一个基于DL的新框架，用于将乳腺X光片中的乳腺密度客观分类为四个类别。我们构建了一个包含17,644张乳腺X光片的大型基准数据集，这些数据来自2017年1月至2020年12月期间在Taizhou癌症医院收集的4,968名女性患者，并根据BI-RADS乳腺密度等级（A–D）进行了标注。所提出的方法包括四个关键阶段：（i）图像增强和裁剪，以提高视觉质量并关注相关区域；（ii）两阶段训练策略，涉及对MobileNetV2主干网络的部分微调——最初冻结所有层以训练自定义模块，然后解冻最后六个卷积层，以加速收敛并提高任务特定适应性；（iii）整合ConvMixer模块以丰富空间特征提取；（iv）结合卷积块注意力机制（CBAM）来引导模型关注最具信息量的区域。通过消融研究评估了每个组件对模型性能的贡献，帮助确定最有效的配置。此外，还使用了梯度加权类别激活映射（Grad-CAM）、Shapley Additive解释（SHAP）和显著性图来可视化和解释模型的决策过程，确保透明度并提供了关于影响预测的乳腺X光片区域的见解。该模型的曲线下面积（AUC）达到了95.32，表明其分类性能很强。在两个公共数据集上的额外实验也证实了模型的鲁棒性和泛化能力。最后，开发了一个基于网络的应用程序，以实现实时乳腺密度和癌症检测，并提供视觉解释，支持实际临床应用。

引言

乳腺癌（BC）继续是全球女性面临的主要健康问题之一，其发病率每年都在稳步上升，正如2020年全球癌症统计报告（Sung等人，2021年）所报道的那样。在早期阶段检测到乳腺癌对于减少其发病率和相关死亡率至关重要（Gastounioti等人，2022年）。在可用的筛查方法中，乳腺X光检查仍然是主要工具，因为它在识别乳腺组织中的癌变方面已被证明是有效的。然而，解读乳腺X光图像——尤其是在乳腺密度的背景下——仍然存在持续的挑战。乳腺密度指的是乳腺中纤维腺体组织的相对量，包括纤维组织和腺体结构（Jiang等人，2023年）。它被认为是发展乳腺癌的一个重要独立风险因素。年龄、体重指数（BMI）、激素状态和更年期变化等因素会影响乳腺密度，这些因素在个体之间差异显著（Tran等人，2021年）。高乳腺密度不仅增加了患乳腺癌的可能性，还降低了肿瘤在乳腺X光片上的可见性，使得诊断更加困难。美国放射学会的乳腺成像报告和数据系统（BI-RADS）将乳腺密度分为四个类别：（a）几乎完全由脂肪组成，（b）散在的纤维腺体组织，（c）异质性密集，以及（d）极度密集。属于较密集类别的女性面临更大的诊断挑战和更高的癌症风险（Vachon等人，2007年）。尽管BI-RADS系统在临床实践中被广泛采用，但其视觉上的主观性引入了相当大的变异性。放射科医生在区分相邻的密度类别时经常存在分歧——尤其是在“散在”和“异质性密集”组织之间——导致诊断和随访建议的不一致性（Huo等人，2014年）。此外，由于BI-RADS是一种定性方法，它缺乏定量方法所提供的精确度和重复性。为了缓解这些问题，利用DL的现代计算机辅助系统作为自动化和标准化乳腺密度评估的有希望的替代方案应运而生。这些方法提供了客观、可重复的评估，并有助于减少人为错误。商业工具如Quantra和Volpara使用基于面积或体积的技术来量化密度，但需要访问原始乳腺X光数据，而这在典型的临床工作流程中并不总是可行的。此外，许多自动化系统仍然难以处理边界案例和中等密度类别之间的细微差异。具有密集腺体乳腺组织的女性不仅面临更高的乳腺癌风险，而且肿瘤在乳腺X光片上也可能被掩盖，使得检测更加困难。

章节片段

材料与方法

如图1所示，所提出的框架由以下顺序步骤组成。

•
步骤1：数据收集

在这第一步中，收集数据集，确保它包含多样化的乳腺X光片图像，以便进行全面训练和评估。

•
步骤2：图像预处理

这一步进一步分为以下阶段：

阶段1：图像增强。

对乳腺X光片进行增强，以提高可见性并突出对分类相关的关键特征。

环境设置和评估指标

所有用于训练所提出的BDA-Net模型的实验都在配备了NVIDIA RTX 4060 GPU（16 GB VRAM）和1 TB存储空间的Windows 11系统上完成。实现使用了TensorFlow 2和Keras DL框架。

为了评估模型性能，采用了标准的评估指标。这些指标对于量化预测输出与真实标签的一致性至关重要。适当选择指标，如方程（3）、（4）中定义的那样

结论

在这项研究中，我们提出了一个新颖的DL模型BDA-Net，用于自动分类乳腺X光片中的乳腺密度，这是评估乳腺癌风险的关键因素。我们的方法整合了几项先进技术，包括对MobileNetV2主干网络的部分微调、使用ConvMixer模块进行增强的空间特征提取，以及应用CBAM来关注乳腺X光片的关键区域。通过利用这些技术，BDA-Net取得了令人印象深刻的

CRediT作者贡献声明

Sohaib Asif：撰写——原始草稿，验证，软件，方法论，数据管理，概念化。Lingying Zhu：验证，软件，概念化。Shang Hongchao：验证，软件，概念化。Dane Yan：验证，软件，概念化。Haimin Xu：可视化，验证，软件。Ruxuan Yan：可视化，验证，监督。Luman Xu：可视化，验证，监督。Hu Jinwen：撰写——审稿与编辑，验证，监督，资金支持

知情同意

无。

遵守伦理标准

无。

利益冲突声明

作者声明他们没有已知的竞争性财务利益或个人关系可能影响本文报告的工作。

联系信箱：

粤ICP备09063491号

摘要

引言