基于Transformer的多模态深度特征融合框架在脑肿瘤磁共振成像中的精准分类与分割研究

首页今日动态人才市场新技术专栏中国科学人云展台
BioHot
云讲堂直播会展中心特价专栏技术快讯免费试用

生物通官微
陪你抓住生命科技
跳动的脉搏

生物通首页 > 今日动态 > 正文

《Scientific Reports》：Multimodal deep feature fusion with transformer for brain tumor classification from magnetic resonance imaging

【字体：大中小】 时间：2026年04月12日 来源：Scientific Reports 3.9

编辑推荐：

　　本研究聚焦脑肿瘤（BT）早期诊断难题，提出多模态深度学习特征融合框架（MDFF-ABTDS）。团队整合CapsNet、ResNet-50与AlexNet提取多源特征，结合双向卷积长短期记忆网络与Transformer（TBConvL-Net）进行分类，并采用nnUNet实现病灶精准分割。经MRI数据集验证，模型准确率达98.91%，显著提升BT检测精度，为临床诊疗提供可靠AI辅助工具。

在全球范围内，脑肿瘤（Brain Tumor, BT）因其异常细胞增殖特性，始终是高死亡率疾病之一。每年，无数家庭因未能及时察觉颅内病变而陷入困境——毕竟，大脑作为人体最精密的“指挥中心”，其内部结构错综复杂，病灶往往隐匿难辨。传统的诊断依赖医生肉眼判读磁共振成像（Magnetic Resonance Imaging, MRI）切片，不仅耗时费力，更易受主观经验影响，微小病灶可能被遗漏，最终延误最佳治疗时机。如何让机器像人类专家一样“读懂”MRI影像，精准锁定病灶位置，成为医学影像分析领域的核心挑战。近年来，深度学习（Deep Learning, DL）技术在计算机视觉任务中大放异彩，但在脑肿瘤检测与分割中，单一模型的特征捕捉能力有限，多模态信息的协同利用仍有巨大潜力亟待挖掘。这便是本研究的出发点：构建一个能够融合多维度特征、模拟医生综合判断逻辑的智能系统，让每一次诊断都更加精准可靠。

针对这一需求，研究团队在《Scientific Reports》发表了题为“Multimodal deep feature fusion with transformer for brain tumor classification from magnetic resonance imaging”的论文，提出一种名为“多模态深度特征融合自动化脑肿瘤检测与分割框架”（Multimodal Deep Feature Fusion Framework for Automated Brain Tumor Detection and Segmentation, MDFF-ABTDS）。该系统巧妙串联了预处理、多模型特征提取、Transformer增强分类与nnUNet精细分割四大模块，最终在脑肿瘤MRI数据集上实现了98.91%的分类准确率，显著超越现有主流方法。这一成果不仅是算法设计的突破，更为临床辅助诊断提供了可落地的工具，有望将医生从繁重的影像筛查中解放出来，把更多精力投入治疗方案制定。

关键技术方面，研究首先对原始MRI图像进行对比度受限自适应直方图均衡化（Contrast Limited Adaptive Histogram Equalization, CLAHE）与标准化预处理以增强特征辨识度；随后并行使用CapsNet、ResNet-50和AlexNet三种架构提取互补的多模态深度特征；进而设计双向卷积长短期记忆网络与Transformer结合的TBConvL-Net模块进行肿瘤/非肿瘤分类；最终由nnUNet完成像素级病灶定位分割。所有实验均基于公开脑肿瘤MRI数据集开展。

图像预处理提升特征显著性

研究首先对比分析了原始MRI图像与经CLAHE处理后的效果。结果显示，预处理有效增强了肿瘤区域与正常组织的对比度，减少了噪声干扰，为后续深度特征提取奠定了清晰的数据基础。

多模态特征融合增强信息表征

团队分别采用CapsNet（擅长捕捉空间层次关系）、ResNet-50（深层残差结构提取抽象特征）与AlexNet（快速提取基础纹理）并行提取特征，并将三者输出融合。实验证明，融合后的特征向量兼具局部细节与全局语义信息，比单一模型更能全面描述肿瘤形态多样性。

TBConvL-Net分类性能优越

将融合特征输入TBConvL-Net后，模型通过双向卷积长短期记忆网络捕捉序列依赖，再经Transformer的自注意力机制聚焦关键区域。在肿瘤/非肿瘤二分类任务中，该方法准确率达到98.91%，精确率、召回率等指标均优于传统CNN及RNN模型，证实了时序建模与注意力机制的协同有效性。

nnUNet实现亚像素级分割

分类后的疑似肿瘤区域由nnUNet进一步处理。该模型通过自适应数据集的网络配置与高效的训练策略，成功实现了对肿瘤边界的亚像素级勾勒，分割结果与医生标注的金标准高度吻合，验证了其在复杂解剖结构中的鲁棒性。

端到端框架综合评估

最后，研究对整个MDFF-ABTDS流程进行了端到端测试。结果表明，从预处理到分割的全链路设计显著降低了假阳性率，在多中心、多扫描仪采集的异构数据上仍保持稳定性能，具备良好的临床泛化潜力。

综合来看，本研究提出的MDFF-ABTDS框架成功解决了脑肿瘤MRI影像中特征利用率低、小病灶漏检率高等痛点。通过多模态特征融合与Transformer的结合，系统不仅能高效区分肿瘤与非肿瘤组织，还能借助nnUNet实现精细化分割，为医生提供直观的病灶空间分布信息。这一成果不仅推动了医学影像分析技术的边界，更为未来构建实时术中导航、预后评估等智能诊疗场景奠定了基础，真正让AI成为医生的“第二双眼睛”。

联系信箱：

粤ICP备09063491号

图像预处理提升特征显著性

多模态特征融合增强信息表征

TBConvL-Net分类性能优越

nnUNet实现亚像素级分割

端到端框架综合评估

热点排行