基于产前超声深度学习分析的胎儿脑室扩张(Ventriculomegaly)自动识别研究

《Urology》：Deep Learning Analysis of Prenatal Ultrasound for Identification of Ventriculomegaly

【字体：大中小】 时间：2026年06月16日 来源：Urology 2

编辑推荐：

　　目的：开发并评估一种能够基于产前超声图像检测胎儿脑室扩张(Ventriculomegaly, VM)的深度学习(Deep Learning, DL)模型，该模型使用专门针对超声数据预训练的基础模型(Foundation Model)。方法：研究人员采用基于视觉

目的：开发并评估一种能够基于产前超声图像检测胎儿脑室扩张(Ventriculomegaly, VM)的深度学习(Deep Learning, DL)模型，该模型使用专门针对超声数据预训练的基础模型(Foundation Model)。方法：研究人员采用基于视觉Transformer(Vision Transformer, ViT)的超声自监督基础模型结合掩码自编码器(Ultrasound Self-supervised Foundation Model with Masked Autoencoding, USF-MAE)对胎儿颅脑超声图像进行正常与VM的二分类微调；其编码器曾在OpenUS-46语料库的逾370,000张超声图像上完成预训练，本研究在精选胎儿颅脑图像数据集上适配并微调；通过五折交叉验证(Fivefold Cross-validation)及独立测试集评估模型性能，报告准确率(Accuracy)、精确率(Precision)、召回率(Recall, 即灵敏度Sensitivity)、特异度(Specificity)、F1分数(F1-score)、受试者工作特征曲线下面积(Area Under the Receiver Operating Characteristic Curve, AUC-ROC)及精确率—召回率曲线下面积(Area Under the Precision-Recall Curve, AUC-PR)，并使用本征类激活映射(Eigen-CAM)与梯度加权类激活映射(Gradient-weighted Class Activation Mapping, Grad-CAM)可视化模型注意力区域。结果：USF-MAE在交叉验证集上F1-score达91.76%，测试集为91.78%；优于所有基线模型(VGG-19、ResNet-50、ViT-B/16及MoCo v3)；测试集平均精确率(Precision)为94.47%，准确率(Accuracy)为97.24%；激活图显示模型识别VM时持续聚焦于脑室区域。结论：在大规模超声特异性语料库上的预训练提升了VM检测的分类性能与泛化能力；USF-MAE框架具备较高准确性、可靠性及可解释性，有望成为产前超声评估胎儿脑结构的稳健工具。

论文解读：《Deep Learning Analysis of Prenatal Ultrasound for Identification of Ventriculomegaly》发表于《Urology》

一、研究背景与意义

胎儿脑室扩张(Ventriculomegaly, VM)定义为侧脑室后角(atrium)内径≥10 mm，是产前超声筛查中常见的中枢神经系统异常征象，且与多种畸形相关。目前产前超声诊断VM存在假阳性率高的问题，易造成孕妇不必要的焦虑及后续有创检查风险。深度学习(Deep Learning, DL)在医学影像分类、检测及分割中已有成功应用，但既往应用于VM检测的DL研究多基于CT或MRI、样本量小、仅做径线测量而非分类或未按VM专门建模。此外，超声图像具有操作者依赖性大、噪声高、斑点(Speckle)纹理独特等特点，在自然图像预训练的卷积神经网络(Convolutional Neural Network, CNN)或视觉Transformer(Vision Transformer, ViT)上直接微调效果受限。因此研究人员开展本研究，旨在利用大规模超声专属自监督预训练的基础模型(Foundation Model)——超声掩码自编码器(Ultrasound Self-supervised Foundation Model with Masked Autoencoding, USF-MAE)——对胎儿颅脑超声进行正常与VM二分类，验证域专属预训练对下游产前神经影像诊断任务的增益。

二、主要关键技术方法

研究人员回顾性收集加拿大某三级医院2014—2021年间孕18—24周标准横脑室(Transventricular/Axial)平面的胎儿颅脑灰度超声DICOM图像，经去标识、去除标注符号与伪影(基于HSV色彩空间检测高饱和度标记区并用Navier–Stokes方程修复)、归一化为224×224像素并采用ImageNet统计量标准化，训练时进行0°—90°随机旋转、水平/垂直翻转及随机缩放裁剪等合理增强。VM组为侧脑室房部直径≥10 mm，正常组<10 mm，排除合并其他脑畸形者，最终共823例(正常680例、VM 143例)，按分层随机抽样划分为训练集560例、验证集140例及独立测试集123例，训练+验证集再做五折交叉验证(Fivefold Cross-validation)。USF-MAE编码器(ViT-Backbone)此前在OpenUS-46(~370,000张多解剖区超声图)以掩码自编码器(Masked Autoencoder, MAE, 掩码率25%，Patch 16×16)自监督预训练，本研究移除解码器并接二分类头，采用加权交叉熵(Weighted Cross-entropy Loss)处理类别不平衡(约1:5)，AdamW优化器(学习率3×10^-4，权重衰减1×10^-4，批大小128)，余弦退火预热调度，五折微调；并与ImageNet预训练的VGG-19、ResNet-50、ViT-B/16及MoCo v3(ViT-B/16自监督)基线对比。性能以Accuracy、Precision、Recall(Sensitivity)、Specificity、F₁-score、AUC-ROC及AUC-PR衡量，并以Eigen-CAM和Grad-CAM做可解释性分析。

三、研究结果

Results——交叉验证与独立测试集性能

在验证集上USF-MAE取得Accuracy 97.29%、Precision 96.55%、Recall 87.67%、F₁-score 91.76%、Specificity 99.31%、AUC 96.00%，全面优于VGG-19(F₁72.39%)、ResNet-50(F₁89.45%)、ViT-B/16(F₁86.73%)及MoCo v3(F₁86.59%)。在独立测试集(123例)上USF-MAE达Accuracy 97.24%、Precision 94.47%、Recall 89.52%、F₁-score 91.78%、Specificity 98.82%、AUC 97.00%；虽ResNet-50的Recall略高(90.48%)，但其Precision与F₁均低于USF-MAE。表明超声域专属自监督预训练较通用自然图像预训练或通用自监督(MoCo v3)更能提升VM检测的精度与综合判别力。

Discussion——结果解读与模型可解释性(Interpretation of results and model performance)

五折ROC曲线均值AUC为0.97±0.005，精确率—召回率曲线下面积0.95±0.011，跨折变异小，说明模型泛化稳定。测试集混淆矩阵显示仅6例假阳性与11例假阴性，Specificity 98.8%(504/510正常正确)，Recall 89.5%(94/105 VM正确)，认为该权衡适合产前筛查场景。

Discussion——可解释人工智能(Explainable Artificial Intelligence, XAI)可视化

Eigen-CAM与Grad-CAM热图显示：正常胎儿颅脑图像模型关注侧脑室周围及脑室边界；VM图像则高亮扩张的侧脑室房部区域，注意力分布与真实临床感兴趣区一致，证实模型基于解剖形态学特征而非伪影判断，且Eigen-CAM在ViT架构上比Grad-CAM产生更连贯局部化图谱。

Discussion——模型失败案例分析(Analysis of model failure cases)

假阳性多因探头角度或声影致脑室房部视觉上偏宽，模型关注较弥散颅内区域；假阴性多见于轻度/临界VM、脑室不对称或图像对比低导致注意力分散未聚焦脑室。失败案例仍主要注视脑组织而非背景，提示可通过多平面输入或引入径线回归改进边际VM敏感度。

Discussion——模型复杂度与推理效率(Model complexity and inference efficiency)

USF-MAE参数量85.8 M(ViT-B/16骨架)，在NVIDIA RTX 4080 Super上对123张测试图总推理时间5.7 s(约46 ms/图)，慢于ViT-B/16(4.3 s)但快于MoCo v3(11.3 s)及CNN类，满足近实时临床部署潜力。

Discussion——跨厂商及床旁超声推广(Generalizability across ultrasound manufacturers and point-of-care devices)

本研究数据源于GE Voluson系统，未直接验证跨厂商或手持(point-of-care)设备，但USF-MAE的大规模多解剖区超声预训练使其学到模态共有特征(斑点纹理、组织界面、几何结构)，理论上较ImageNet预训练模型具更好域鲁棒性；后续拟做多中心多设备外部验证与轻量自适应微调。

四、讨论与结论翻译

研究人员结论如下：本研究提出并评估了基于USF-MAE基础模型的产前超声胎儿VM自动分类深度学习框架，该模型利用大规模超声自监督预训练学到的域专属表征并在胎儿颅脑数据集微调。五折交叉验证及独立测试集结果表明，所提方法在Accuracy、Precision、F₁-score及Specificity上均优于CNN及常规Transformer基线模型。在超声数据上的域专属预训练有益于提升下游诊断任务的特征泛化能力与标签效率(Label Efficiency)。Eigen-CAM热图证实模型决策依据为相关脑室解剖区域。结果表明USF-MAE类基础模型可支持产前超声对胎儿脑结构的一致客观评估，有助于提升VM及其他相关神经系统异常产前筛查的诊断可靠性，待多机构多系统数据进一步验证。

热点排行