DF-CANet：基于三维坐标注意力(3D Coordinate Attention)的密集特征堆叠(Dense Feature Stacking)方法用于CBCT图像中的牙齿分割

《Array》：DF-CANet: A dense feature stacking approach based on 3D coordination attention for tooth segmentation in CBCT images

【字体：大中小】 时间：2026年05月29日 来源：Array 4.5

编辑推荐：

　　在现代口腔医学领域，准确的牙齿分割是口腔影像智能分析的基础。三维锥形束CT（Cone Beam Computed Tomography, CBCT）成像可有效显示口腔的三维结构。然而，复杂的口腔环境给牙齿分割任务带来诸多挑战，包括牙齿结构多变、目标与背景对比度

在现代口腔医学领域，准确的牙齿分割是口腔影像智能分析的基础。三维锥形束CT（Cone Beam Computed Tomography, CBCT）成像可有效显示口腔的三维结构。然而，复杂的口腔环境给牙齿分割任务带来诸多挑战，包括牙齿结构多变、目标与背景对比度低及金属伪影影响，致使现有分割模型的准确性（Accuracy）与鲁棒性（Robustness）亟待提升。为此，研究人员提出了一种新颖的牙齿分割模型。首先，引入密集特征堆叠（Dense Feature Stacking）架构以有效提取多尺度特征并增强特征重用（Feature Reuse）。其次，设计了一种三维坐标注意力（3D Coordinate Attention）模块，使网络能同时捕获三维空间中深度、宽度和高度的体积特征（Volumetric Features），通过整合深度信息显著提升了模型对CBCT图像三维结构的学习能力。最后，研究人员采用Dice损失（Dice Loss）与焦点损失（Focal Loss）相结合的策略以有效缓解数据类别不平衡（Class Imbalance）的影响。在公开牙科CBCT数据集上的实验结果表明，该模型实现了96.19%的Dice相似系数（Dice Similarity Coefficient, DSC）。该模型在牙齿分割任务中展现出优异性能，为临床应用中及口腔医学研究提供了有力的技术支持。

《Array》期刊论文解读：DF-CANet——基于3D Coordinate Attention的CBCT牙齿分割密集特征堆叠网络

【研究背景】

口腔锥形束CT（Cone Beam Computed Tomography, CBCT）因能提供清晰的牙槽骨及牙齿三维解剖信息，被广泛应用于口腔诊疗。自动牙齿分割（Tooth Segmentation）是后续正畸方案设计、种植规划及病灶定量分析的关键前置步骤。然而现有基于卷积神经网络（Convolutional Neural Network, CNN）的三维分割方法面临三大瓶颈：一是在牙齿重度交错重叠（Inter-tooth Occlusion）区域因细微解剖结构建模不足导致边界模糊或断裂；二是牙齿与周围牙槽骨（Alveolar Bone）HU值相近造成前景-背景极度不平衡（Foreground-Background Imbalance），模型易偏向背景类；三是Transformer或复杂级联网络计算开销大，难以在临床资源受限环境下部署。针对以上问题，北京工业大学Yan Li、Suyu Wang等人提出DF-CANet（Dense Feature stacking network with 3D Coordinate Attention），旨在兼顾轻量化（Lightweight）、高精度与鲁棒性，解决CBCT全牙列（Collective Tooth Region）二值分割难题。

【关键技术方法】

研究人员选用公开3D CBCT牙科数据集（含129例扫描，103例训练、26例验证，体素间距0.25 mm，NIfTI格式，同Zhong等人设置），以DenseVNet为骨干网络搭建编码器-解码器（Encoder-Decoder）架构，编码器由三个密集特征堆叠（Dense Feature Stacking）模块构成并通过下采样卷积连接，各编码层输出经1×1×1卷积跳跃连接（Skip Connection）至解码器，解码器采用双线性插值（Bilinear Interpolation）逐级上采样并沿通道维度拼接多尺度特征，最终由1×1×1卷积映射至目标类别；在密集特征堆叠单元中嵌入自设计的3D坐标注意力（3D Coordinate Attention）模块，对输入特征图分别沿深度（Depth, D）、高度（Height, H）、宽度（Width, W）三轴做全局平均池化（Global Average Pooling），经3D卷积、批归一化（Batch Normalization, BN）及h_swish激活函数生成各轴注意力权重并与原特征图逐元素相乘；损失函数采用加权融合的Dice–Focal混合损失（Dice–Focal Hybrid Loss），其中Dice Loss权重ra=0.995、Focal Loss权重1-ra=0.005、Focal调制因子γ=1.0，以缓解前景像素稀疏导致的类别不平衡；评价指标采用Dice相似系数（Dice Similarity Coefficient, DSC）、交并比（Intersection over Union, IoU）、豪斯多夫距离（Hausdorff Distance, HD）、平均对称表面距离（Average Symmetric Surface Distance, ASSD）及表面重叠度（Surface Overlap, SO），并与UNet3D、AttentionUNet3D、DenseVoxelNet、MultiResUNet3D、UNETR、SwinUNETR、TransBTS、nnFormer、3D UX-Net及PMFSNet3D等十种主流三维分割方法进行定量与定性比较，并行进消融实验验证各模块有效性。

【研究结果】

4.1 Dataset（数据集）

研究人员使用公开3D CBCT牙科数据集子集（129例CBCT扫描，来自15个医疗中心的大样本库，103例训练/26例验证，原始格式NIfTI， voxel spacing 0.25 mm），验证集用于评估模型泛化能力。

4.2 Evaluation metrics（评价指标）

定义并采用DSC、IoU、HD（mm）、ASSD（mm）、SO（%）五项指标，HD与ASSD用于衡量分割边界与金标准（Ground Truth）的几何偏差，SO衡量表面重叠程度。

4.3 Quantitative evaluations（定量评估）

DF-CANet在测试集上取得DSC=96.19%、IoU=93.13%、HD=2.75 mm、ASSD=0.32 mm、SO=97.94%，参数量（Params）仅0.88 M、浮点运算量（FLOPs）23.22 G。相比次优轻量模型PMFSNet3D（DSC 91.30%，Params 0.63 M，FLOPs 15.14 G），DF-CANet在DSC上提升4.89%、IoU提升8.45%、HD降低2.82 mm、ASSD降低0.46 mm、SO提升2.84%，且仅增加适度计算成本；相比Transformer类模型（如nnFormer DSC 90.66%、SwinUNETR DSC 89.74%），DF-CANet在精度与效率间取得更优平衡。定性可视化显示DenseVNet在磨牙区易出现牙间粘连（Inter-tooth Adhesion）及将牙槽骨误判为牙齿，而DF-CANet借助3D坐标注意力明确区分齿-骨边界并保留邻接牙间隙（Interproximal Spaces）。

4.4 Ablation studies（消融实验）

以PMFSNet3D为基线（DSC 91.30%，IoU 84.68%）：仅换用DenseVNet骨干（无3D CA无混合损失）即提升至DSC 95.70%，IoU 92.44%；在此基础上加入3D坐标注意力（3D CA）模块后DSC升至96.06%，IoU 92.97%；仅加入Dice–Focal混合损失后DSC为95.79%，IoU 92.60%；三者联合（DF-CANet完整模型）达到最高DSC 96.19%，IoU 93.13%。证实密集特征堆叠骨干、3D坐标注意力及混合损失均对性能有正向贡献且具互补性。

【讨论与结论总结】

研究人员指出CBCT牙齿分割难点在于解剖重叠、金属伪影及三维数据量大导致的效率-精度权衡困难。DF-CANet通过DenseVNet增强多尺度特征复用，通过扩展至三维的空间坐标注意力编码牙齿相对稳定空间位姿关系以细化齿-骨边界，通过Dice–Focal损失抑制背景主导偏差，在保持轻量化前提下显著提升分割精度与边界敏感性。局限在于标注样本量少且缺乏复杂病理（如缺牙、种植体、病变）数据，未来可通过半监督（Semi-supervised）、弱监督（Weakly-supervised）学习范式及扩充多中心异常病例标注进一步提升泛化能力。

结论翻译：研究人员提出了一种新颖的轻量级语义分割网络DF-CANet，旨在高效准确地完成牙科CBCT图像的语义分割任务，兼顾算法效率与性能的平衡。该网络选取DenseVNet作为骨干网络，这一设计在保持低参数量的同时显著提高了牙齿分割准确率。此外，研究人员创新性地引入了三维坐标注意力（3D Coordinate Attention）模块，有效增强了模型捕获三维图像中体积关系与结构特征的能力，同时提升了对牙齿特征的关注。在三维CBCT牙科数据集上的实验结果表明，该方法在准确率与计算效率之间取得了优异平衡。通过与一系列先进分割技术的对比分析，DF-CANet在牙齿语义分割任务中展现出突出的性能优势。未来工作中，研究人员将致力于进一步提升模型性能与泛化能力，以增强模型在不同临床场景下的适应性与应用潜力。

热点排行