基于YOLO11的视讯荧光吞咽造影成像中测压传感器检测用于计算机辅助多模态吞咽评估

《Frontiers in Radiology》:YOLO11-based detection of manometry sensors in video-fluoroscopy imaging for computer-aided multimodal assessment of swallowing

【字体: 时间:2026年04月14日 来源:Frontiers in Radiology 2.3

编辑推荐:

  为解决头颈癌患者吞咽功能障碍精准评估难题,本研究提出一种基于YOLO11深度学习的检测方法,旨在从视频-荧光成像序列中自动定位高分辨率阻抗测压传感器,实现了平均F1分数达96.6%的准确、鲁棒检测,为计算机辅助HRIM-VFSS融合分析、实现客观的吞咽功能评估迈出了关键一步。

  
准确评估头颈癌患者治疗后的吞咽功能至关重要,因为高达50%的患者会遭受口咽性吞咽困难的困扰,这可能引发营养不良、吸入性肺炎等一系列严重并发症,并显著降低患者生活质量。临床上,评估吞咽困难主要依赖两种技术:一是视频荧光吞咽造影,它能像看“慢动作电影”一样,用造影剂勾勒出吞咽过程的解剖细节,但其解读高度依赖医生的主观经验,一致性欠佳;二是高分辨率阻抗测压,它像一根“智能导管”深入咽部,实时记录压力和阻抗变化,提供定量的生理数据,但它需要手动划定测压区域。这对于治疗后常出现解剖异常、咽部压力降低的头颈癌患者来说,既费时又难以保证准确。尽管将两者结合分析能优势互补,但临床实践中它们仍被分开解读,不仅增加了医生的工作负担,也未能解决在解剖异常情况下精确划定测压区域的根本挑战。
这篇发表在《Frontiers in Radiology》上的研究,正是为了破解这一难题。研究团队的核心思路是:利用深度学习这把“智能尺子”,在荧光造影视频中自动、精确地找到每一枚测压传感器的位置。一旦知道了所有传感器的“空间坐标”,就能将它们与咽部的解剖结构(如鼻咽、口咽、下咽)自动对齐,从而实现测压区域的自动划分,为最终构建一个全自动、计算机辅助的多模态吞咽评估框架奠定基础。
为开展此项研究,研究人员首先获取了8名头颈癌患者同时采集的VFSS和HRIM数据,并手动标注了268帧图像中所有可见的测压传感器作为“标准答案”。他们选择了最新的YOLO11-nano目标检测框架,因为它以高精度和快速处理见长,适合实时应用。模型在训练中采用了“留一患者交叉验证”策略,并使用了丰富的数据增强技术(如随机缩放、亮度/对比度调整、高斯模糊/噪声,以及模拟食团遮挡的“Dropout”技术)来提高模型的泛化能力和对图像质量变化的鲁棒性。研究还采用了改进的EigenCAM(带有动态符号校正的类激活映射)技术来可视化模型关注的区域,以解释其决策过程。
模型训练与性能评估结果
模型在训练过程中损失稳步下降,验证集平均精度(AP@50-95)稳步提升,并在平均86个周期后收敛,表明学习过程稳定。在未经处理的测试帧上,模型达到了95.8%的精确率、97.4%的召回率和96.6%的F1分数,平均精度(AP@50)高达99.1%。处理速度约为每帧43毫秒,支持潜在的实时应用。最重要的是,模型性能在不同患者间变异很小,显示出良好的泛化能力。
在不同噪声和遮挡条件下的鲁棒性结果
为模拟不同辐射剂量和食团遮挡的挑战,研究测试了模型在四种递增的噪声水平(“无”、“轻度”、“中度”、“重度”)和一种模拟遮挡条件(“Dropout”)下的表现。结果显示,即使在“重度”噪声和“精确”定位(5像素阈值)的严苛条件下,模型F1分数仍保持在87.2%。在“Dropout”条件下,模型同样表现出色,能够有效推断出被遮挡区域的传感器位置,证明了其对部分导管遮挡的稳健性。模型在所有条件下的表现均显著优于先前基于模板匹配的方法。
模型注意力可视化结果
通过改进的EigenCAM生成的热图显示,无论图像质量如何,模型的核心注意力始终集中在测压导管区域,并在各个传感器位置呈现明显的局部激活峰值。在“Dropout”条件下,尽管被遮挡区域的激活响应减弱,但沿导管轨迹的注意力连续性得以保持,这解释了模型为何能在遮挡情况下仍能较好地推断传感器序列。
研究结论与重要意义
本研究表明,基于YOLO11的检测器能够在VFSS序列中实现高精度、高鲁棒性的测压传感器定位。这不仅显著优于传统的模板匹配方法,还通过快速的推理速度(约23帧/秒)和强大的抗干扰能力,证明了其临床应用的可行性。这项研究的核心价值在于,它为HRIM和VFSS两种模态数据的自动空间配准提供了关键技术。通过精准定位传感器,未来可以自动化地勾画出与解剖结构对应的测压区域,从而克服头颈癌患者因咽部压力低、解剖异常导致的HRIM分析困难。这标志着向构建一个自动、定量、计算机辅助的多模态吞咽评估系统迈出了关键一步,有望为头颈癌吞咽困难患者提供更快速、客观、精准的诊断和监测工具,最终改善患者的康复和生活质量。
相关新闻
生物通微信公众号
微信
新浪微博

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号