RT-BMTR：一种用于复杂农业场景中作物与杂草检测的双侧混合骨干网络

首页今日动态人才市场新技术专栏中国科学人云展台
BioHot
云讲堂直播会展中心特价专栏技术快讯免费试用

生物通官微
陪你抓住生命科技
跳动的脉搏

生物通首页 > 今日动态 > 正文

《Applied Sciences》：RT-BMTR: A Bilateral Hybrid Backbone Network for Crop and Weed Detection in Complex Agricultural Scenarios

【字体：大中小】 时间：2026年06月19日 来源：Applied Sciences 2.5

编辑推荐：

　　本研究评估了一种基于U2-Net的人工智能（AI）模型在牙科全景放射影像中识别翼上颌裂方面的诊断性能，并探讨其作为初步解剖标志识别与术前筛查辅助工具的潜在应用价值。研究回顾性纳入270张至少显示一侧完整可见翼上颌裂的全景X线片。在这些匿名化影像中，共识别出50

本研究评估了一种基于U2-Net的人工智能（AI）模型在牙科全景放射影像中识别翼上颌裂方面的诊断性能，并探讨其作为初步解剖标志识别与术前筛查辅助工具的潜在应用价值。研究回顾性纳入270张至少显示一侧完整可见翼上颌裂的全景X线片。在这些匿名化影像中，共识别出501处翼上颌裂，并由两名独立检查者采用CVAT v1.7.0标注软件进行人工标注。在测试数据集上，该分割模型获得0.904的Dice系数（95% 置信区间（CI）：0.876–0.930）和0.846的交并比（IoU）（95% CI：0.810–0.879）。精确率（precision）和召回率（recall）分别为0.921和0.902，对应F1评分为0.911。在训练过程中，最高验证Dice系数达到0.910，同时验证IoU为0.844，验证准确率为0.998。这些结果表明，所提出模型在全景放射影像上对翼上颌裂进行精确分割方面具有较强性能，并可在初始解剖评估过程中作为初步解剖标志识别的辅助工具。

该文发表于《Applied Sciences》，研究聚焦于牙科全景放射影像中翼上颌裂（PMF，位于上颌骨后壁与蝶骨翼突之间的解剖交通裂隙）的自动识别问题。研究背景在于，全景放射摄影因辐射剂量较低、可及性广且能一次性显示颌面部整体结构，长期作为牙颌面影像学的重要基础工具，也逐渐成为人工智能（AI）辅助诊断的关键数据来源。近年来，深度学习（DL，利用多层神经网络自动提取特征）已在牙齿检测、龋病识别和下颌管定位等任务中取得良好效果，但在中面部复杂解剖标志方面的应用仍较少。翼上颌裂在全景片上通常呈“倒置泪滴样”透亮影，但这一影像并非孤立、边界绝对清晰的真实解剖实体，而是由邻近骨性结构重叠、投照几何、患者体位、图像放大及周围结构叠加共同形成的复合投影表现，因此存在明显的形态变异性、投影依赖性和可视化不稳定性。这种复杂性使其自动检测较常见牙体牙槽结构更具挑战。同时，翼上颌裂及翼上颌连接区在口腔颌面外科、区域麻醉和邻近颅底操作的术前评估中具有重要解剖学意义，若皮质连续性中断或边界消失，还可能提示后上颌区域破坏性病变。因此，开展该研究的必要性在于：在不能常规对所有患者实施锥形束计算机断层扫描（CBCT）的现实条件下，若能在全景片上实现较稳定的翼上颌裂自动识别，将有助于初始解剖定位、提高解读一致性，并为术前筛查提供辅助信息。

研究人员围绕这一目标，构建并验证了一个基于U2-Net的语义分割模型，用于在牙科全景X线片上自动分割翼上颌裂。研究结论显示，该模型在独立测试集上达到较高的一致性指标，提示其在这一高复杂度、低对比度、投影依赖性强的解剖区域中仍具备较好的识别能力。论文的重要意义在于，其并未将AI定位为取代临床医师或CBCT的工具，而是将其界定为面向初步解剖评估与术前早期筛查的辅助性技术路径，从而为复杂颅颌面解剖标志的自动识别提供了前期技术与临床前依据。

作者开展研究所采用的主要技术方法可概括如下：研究样本来源于Cyprus International University牙学院临床档案，共纳入270例成年患者的匿名化全景放射影像，按70%、20%和10%随机划分为训练集、验证集和测试集。两名检查者使用CVAT v1.7.0独立标注翼上颌裂，并通过Cohen’s κ系数评价观察者间与观察者内一致性，再由第三名高级专家裁定最终真值。模型采用U2-Net语义分割框架，输入尺寸为512 × 1024 × 1，结合深监督（deep supervision）、AdamW优化器、加权Dice损失函数、固定窗min–max归一化及0.5概率的水平翻转增强，以提升对前景—背景类别不平衡及多尺度细微解剖特征的学习能力。

在研究结果部分，论文首先给出了数据集与评价体系。研究共使用270张二维全景片，其中189张用于训练、54张用于验证、27张用于测试。评价指标包括Dice系数、交并比（IoU）、精确率、召回率及F1评分，并为测试集主要指标计算了95% 置信区间，以反映统计可靠性。通过这一设计，研究人员建立了定量评价模型分割性能的统一框架。

在“Results”部分，研究显示该模型在测试集上获得Dice系数0.904（95% CI：0.876–0.930）和IoU 0.846（95% CI：0.810–0.879），精确率为0.921，召回率为0.902，F1评分为0.911。训练过程中最高验证Dice系数为0.910，验证IoU为0.844，验证准确率为0.998；训练集Dice系数、IoU和准确率分别为0.982、0.971和0.999，训练损失为0.031。依据这些结果，研究人员认为模型对全景片中翼上颌裂的分割具有较强能力。

在“Qualitative Evaluation of Segmentation Performance”部分，研究人员进一步采用定性分析评估模型在不同临床成像条件下的表现。对于解剖对比适中、体位标准的病例，U2-Net能够较好勾画翼上颌裂边界；对于边界性或困难病例，如金属修复体与种植体导致的局部硬化伪影、对比度下降，或明显的投影相关结构不对称与致密骨性重叠情形，模型则可能出现轻度过分割或欠分割。通过这些代表性案例，论文指出模型在理想成像条件下表现稳定，但在复杂投照和结构重叠环境中仍需要临床医师复核。

在“Discussion”部分，论文围绕结果的意义、优势与局限进行了归纳。研究人员指出，PMF并非边界清晰的独立骨性结构，而是受重叠、体位及邻近结构共同影响的复合性投影，因此即使性能未达到“完美”，Dice系数0.904与IoU 0.846仍显示出较有前景的结果。论文将本研究与既往牙科影像深度学习研究进行对比，指出牙齿、下颌管、上颌窦等结构往往具有更高影像对比度、更清晰边界和更低形态变异性，因此更易取得较高分割表现；相较之下，翼上颌裂分割难度显著更高。即便如此，该模型表现已接近某些解剖上更简单结构的既往报道水平，提示提出的标注与训练策略能够较好捕捉形态可变、易重叠且低对比的区域特征。

讨论还强调了该研究的临床定位：全景片中的翼上颌裂自动识别可为后上颌区域初始评估提供更标准化的解剖定向信息，尤其在CBCT并非即时可得或无常规适应证时，AI辅助系统可作为椅旁支持工具，帮助减少操作者依赖性、提升标志识别重复性，特别有利于经验较少的临床医师。然而，研究人员同样明确指出，全景放射摄影本质上是二维投影成像，无法替代CBCT对翼上颌区进行三维精细评估，也不能直接承担 definitive surgical planning（最终手术规划）或详细风险评估任务。论文还提到，训练集与测试集之间存在一定性能差距，提示模型有轻度过拟合倾向；同时，由于PMF缺乏绝对独立的三维骨性边界，所谓“真值”本质上是专家对复合投影的一致性判断，这也会影响模型在不同临床图像条件下的泛化能力。

在“Limitations”部分，研究人员总结了若干主要限制。首先，样本量相对较小，尤其测试集仅27张图像，限制了统计稳健性与广泛泛化能力，并可能导致模型真实性能被高估。其次，全部影像均来自单一机构、同一全景设备及统一采集参数，虽然有利于图像一致性，但削弱了模型对不同设备、不同采集协议及不同患者群体的适用性。此外，该研究仅验证了模型在全景片上的分割表现，未进一步评估其对临床决策、诊断效能、手术结局或并发症发生率的影响。因此，该系统目前只能被视为初步解剖标志识别的辅助工具，而非完整影像学与临床评估的替代方案。研究人员认为，在潜在临床应用前，仍需基于更大规模、多中心、异构设备来源数据开展外部验证，并在真实临床流程中评估AI辅助与非辅助条件下的实际增益。

研究结论部分可译为：本研究开发的基于U2-Net的深度学习模型，在牙科全景放射影像中识别翼上颌裂方面，于初步技术性和临床前研究背景下展现出具有前景的分割性能。尽管这种自动化方法可为初步解剖标志识别和术前筛查提供较可靠的支持，但其应用应严格限定为辅助性椅旁工具。未来仍需开展前瞻性研究，以评估其在临床实践中对诊断表现、解剖标志识别一致性及工作流程效率的实际影响。

联系信箱：

粤ICP备09063491号

热点排行