面向全身CT下多发伤患者脊柱骨折自动检测

《Journal of Imaging》:Towards Automated Spine Fracture Detection on Whole-Body CT of Polytraumatized Patients

【字体: 时间:2026年06月19日 来源:Journal of Imaging 3.3

编辑推荐:

  严重创伤患者的治疗具有挑战性,因此及时阅读全身计算机断层扫描(whole-body computed tomography, WBCT)图像至关重要。在这一背景下,人工智能越来越多地被用于优先处理和检测急性损伤。针对颈椎和压缩性骨折的算法已成功部署。然而,缺乏

  
严重创伤患者的治疗具有挑战性,因此及时阅读全身计算机断层扫描(whole-body computed tomography, WBCT)图像至关重要。在这一背景下,人工智能越来越多地被用于优先处理和检测急性损伤。针对颈椎和压缩性骨折的算法已成功部署。然而,缺乏用于全脊柱评估和涵盖所有骨折形态的工具。研究人员旨在探究一种算法在WBCT上检测脊柱骨折的能力以及影响其开发难度的因素。算法1.0版(v1)先前使用454例颈椎骨折通过U-Net基于四折交叉验证训练,利用多任务损失(multi-task loss)进行脊柱骨折分割和脊柱分割。进一步训练扩展至全脊柱评估,增加了颈椎(n=50)、胸椎(n=30)和腰椎(n=20)的额外标注骨折(队列1),从而得到2.0版(v2)。基线设定为在每例最多5个假阳性(false positive, FP)的情况下达到最高灵敏度。1.0版在队列1上进行了测试,两个版本在前瞻性收集的真实世界数据(队列2,n=712例WBCT)上进行了比较。额外的系统综述用于将算法性能与当前技术水平进行比较。1.0版不仅对颈椎,而且对胸椎和腰椎也表现出具有前景的性能(灵敏度介于60%至87%之间),这归因于泛化能力。2.0版在队列2上也获得了可接受的灵敏度(灵敏度介于77%至85%之间),但产生了大量假阳性。多种原因导致了假阳性结果;对于2.0版,骨小梁结构本身引发了虚假警报。训练和测试数据的差异(图像质量、辐射剂量、重建方式)、骨折和解剖结构的异质性以及训练集的大小解释了算法开发过程中的一些困难。仅其他五个研究组描述了他们在全脊柱骨折检测方面的工作,遇到了类似的困难,并且也未能开发出可临床部署的工具。在WBCT上检测脊柱骨折是可行的,但多种因素阻碍了商业化人工智能工具的开发。需要扩大和改进训练队列的设计,以进一步开发并模拟真实场景。
**论文解读:基于全身CT的多发伤患者脊柱骨折自动检测研究**

**研究背景与问题**

严重创伤患者的急诊处理对全球医生构成挑战,全身计算机断层扫描(WBCT)已成为快速评估多发伤、辅助临床决策和手术规划的核心工具。然而,在时间压力下,放射学报告的及时完成至关重要,目前已有研究致力于WBCT的结构化报告及人工智能在急诊放射学中的整合。尽管针对颅内出血、肋骨骨折、气胸等急性损伤的AI辅助工具已投入使用,但脊柱骨折(尤其是颈椎和胸腰椎骨折)的延迟诊断仍导致患者发病率增加。现有算法多聚焦于颈椎或压缩性骨折,缺乏针对全脊柱所有骨折形态的综合检测工具。因此,研究人员旨在扩展先前针对颈椎的自动化骨折检测算法,覆盖整个脊柱,并分析影响算法开发的困难因素。该研究发表在《Journal of Imaging》。

**主要技术方法**

研究人员采用深度学习方法,基于U-Net架构通过四折交叉验证训练脊柱骨折分割模型。初始版本1.0(v1)使用454例颈椎骨折(来自195例CT)训练,实现逐椎体分类的脊柱骨折分割,并通过多任务损失(multi-task loss)同时分割脊柱。后续版本2.0(v2)添加了100例CT(队列1)的额外标注骨折(颈椎50例、胸椎30例、腰椎20例),来自德国某学术性大都市创伤中心的双源192排CT扫描仪(Somatom Force)。测试数据包括前瞻性收集的真实世界队列2(n=712例WBCT),来自单源128排扫描仪(Philips Ingenuity Core),使用迭代和滤波反投影重建。算法性能通过灵敏度(sensitivity)和每例假阳性数(false positives per case)评估,并与人类放射科医生(初级和高级各一名)及独立神经放射科医生的判读进行差异分析。此外,进行了系统文献检索,比较算法与现有技术的性能。

**研究结果**

**3.1 队列1——人口学特征**
队列1中96例患者的328处骨折(颈椎135处、胸椎125处、腰椎68处)被分析,平均年龄59.4±22.34岁,男性占75%。算法无法处理3例因重度骨质减少的CT,另有1例回顾确认无骨折。

**3.2 队列1——算法1.0版分析**
v1在96例CT中标记88例为可疑,每CT灵敏度0.92(95% CI 0.84–0.96),每骨折灵敏度0.56(95% CI 0.51–0.62)。假阳性结果占71.9%的病例,其中≥3个假阳性占39.6%。按脊柱节段分析,颈椎灵敏度最高(每CT 0.87,每骨折0.82),腰椎次之(每CT 0.84,每骨折0.49),胸椎最低(每CT 0.68,每骨折0.34)。腰椎假阳性最多,59.4%的病例有≥3个假阳性。无假阳性病例归因于明显骨小梁结构。

**3.3 队列2——人口学特征**
队列2中663例WBCT成功分割和分析,平均年龄51.2±18.69岁,男性占66.1%。骨折总患病率44.3%,腰椎骨折最常见(18.4%),其次为胸椎(14.0%)、颈椎(7.8%)和骶椎(4.1%)。椎体骨折占21.3%,横突骨折14.6%。

**3.4 队列2——算法1.0版与2.0版对比(病例1–100)**
v1每CT灵敏度0.87(CI 0.72–0.96),v2为0.97(CI 0.86–1.00),v2对胸椎和腰椎灵敏度更高,但骶椎检测灵敏度低。v1标记76例CT中有118处骨折,v2标记98例CT中有277处骨折。v2假阳性显著增加,96例病例有≥3个假阳性,而v1仅35例。v1假阳性多由椎间盘引起,v2假阳性多由骨性结构(骨小梁、骨赘、骨管)引起。

**3.5 队列2——算法2.0版分析(病例1–663)**
v2对颈椎、胸椎、腰椎的灵敏度相似(81%–88%),骶椎仍低。每CT检测数过高导致每CT灵敏度100%,但假阳性严重:97.1%的病例有≥3个假阳性,仅0.2%为真阴性。仅8.3%的WBCT无伪影,但伪影对假阳性/假阴性比例的影响不显著。队列2中假阳性的主要原因推测为明显骨小梁结构。

**3.6 系统文献检索**
检索到5篇相关文章(2016–2025),均描述卷积神经网络(CNN),但均未在独立外部数据集上测试。报道的灵敏度/召回率范围为59%–90%(Roth等,D.N.等),F1分数54%–94%,Intersection over Union(IoU)65%–93%。假阳性率仅一项提及(每例5–10个)。研究者指出骨折检测技术可行但困难。

**讨论与结论**

本研究证明,通过U-Net算法在WBCT上检测全脊柱各类骨折技术上可行。v1仅用颈椎训练即通过泛化对胸腰椎也有较好表现;v2增加训练后灵敏度提升,但假阳性率剧增,无法识别健康病例。主要困难因素包括:罕见骨折类型(尤其后部结构)、骨折多样性、解剖变异、退行性改变、伪影、训练数据与测试数据的域偏移(不同CT扫描仪、剂量、重建方式)。系统性综述显示其他研究组也面临类似挑战,均未开发出临床可用工具。

研究结论翻译:总而言之,使用上述算法在WBCT上检测所有类型的孤立性脊柱骨折在技术上是可行的。当前的高假阳性率及其无法识别健康病例阻碍了临床实用性。多种因素导致为严重创伤患者开发用于WBCT全脊柱骨折检测的商业化AI工具的困难:脊柱骨折的罕见性和多样性、解剖变异和退行性改变同样限制了训练过程中的泛化能力,而成像伪影和不同的CT扫描参数导致域偏移,也被认为是这一挑战的原因。当前AI研究的进展让人们有理由相信新技术将能比预期更快克服这些挑战。然而,必须集中精力扩展和设计代表真实场景的适当训练队列。多站点数据对于算法训练以覆盖多样性问题并收集足够的骨折形态和CT图像质量是理想的。数据增强方法已被研究团队和其他组成功使用,并且增加训练和测试队列也将进一步利用。迁移学习、半监督训练技术、高效标注策略的实施、联邦学习、少样本学习以及替代神经网络架构(如Transformer模型)是即将到来的算法开发的有前景的方法。最后,模拟脊柱骨折的合成数据也能解决高质量数据的短缺问题,并可能在不久的将来有效增强WBCT脊柱分析的发展。
相关新闻
生物通微信公众号
微信
新浪微博
  • 搜索
  • 国际
  • 国内
  • 人物
  • 产业
  • 热点
  • 科普

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号