AI辅助临床-定量影像列线图用于≤3cm实性及部分实性肺结节术前恶性风险预测:开发与内部验证

《Frontiers in Oncology》:AI-assisted clinico–quantitative imaging nomogram for preoperative malignancy risk in solid and part-solid pulmonary nodules ≤ 3 cm: development and internal validation

【字体: 时间:2026年04月13日 来源:Frontiers in Oncology 3.3

编辑推荐:

  目的:开发并内部验证一种人工智能(AI)辅助的临床-定量影像预测模型,该模型结合自动提取的定量计算机断层扫描(CT)影像特征与临床数据,用于术前评估≤3cm实性及部分实性肺结节(PNs)的个体化恶性风险。方法:这项回顾性研究分析了951例接受手术切除的≤3cm

  
目的:开发并内部验证一种人工智能(AI)辅助的临床-定量影像预测模型,该模型结合自动提取的定量计算机断层扫描(CT)影像特征与临床数据,用于术前评估≤3cm实性及部分实性肺结节(PNs)的个体化恶性风险。方法:这项回顾性研究分析了951例接受手术切除的≤3cm肺结节患者(210例良性,741例恶性)的数据。定量CT特征,包括结节大小、最小及最大CT衰减值(HU)、实性成分占比(CTR)及结节类型,均使用InferRead CT Lung AI软件(Infervision, Beijing, China; version 4.0)自动测量。这些AI辅助的定量测量指标与临床变量及炎症标志物共同作为候选预测因子进行评估。最终预测模型为多变量logistic回归模型,在全队列中进行预测因子选择后进行内部Bootstrap重抽样验证。模型性能通过1000次Bootstrap重抽样进行评估,采用受试者工作特征曲线下面积(AUC)量化区分度,通过校准曲线、斜率、截距和平均绝对误差评估校准度,并利用决策曲线分析(DCA)评估临床效用。结果:最终的AI辅助模型表现出较强的区分度,AUC为0.836(95%置信区间[CI],0.804–0.869),且具有优异的校准度,平均绝对误差为0.015。DCA表明在0.10–0.45的阈值概率范围内具有显著的净临床获益。基于预测概率四分位数的风险分层将患者分为低危、中危和高危层,在该手术管理队列中观察到的恶性率分别为43.3%、86.7%和95.0%。交互式计算器已公开访问。由于研究队列仅限于手术切除的结节,这些风险估计值应在恶性肿瘤富集的术前手术背景下进行解释。结论:成功开发并内部验证了AI辅助的临床-定量影像列线图,以支持≤3cm不确定肺结节的个体化术前恶性风险评估。由于该模型源于手术筛选的恶性肿瘤富集队列,应将其视为术前手术决策支持工具,而非筛查或偶发肺结节人群的应用工具。在更广泛实施前,需在独立的非选择性队列中进行外部验证及必要的重新校准。
论文解读:AI辅助临床-定量影像列线图在肺结节恶性风险评估中的应用
本研究由Jiande市第一人民医院的研究团队完成,旨在解决≤3cm肺结节术前良恶性鉴别的临床难题,相关成果发表于《Frontiers in Oncology》。随着低剂量计算机断层扫描(LDCT)在肺癌筛查中的普及及人工智能(AI)技术的发展,不确定肺结节(PNs)的检出率显著增加,如何在术前准确区分良恶性成为临床面临的巨大挑战。尽管Fleischner协会和Lung-RADS指南提供了基于结节大小和密度的管理框架,但在处理1-3cm的实性(SNs)和部分实性结节(PSNs)时,其判别能力有限,导致诊断不确定性和临床实践中的变异性。现有模型往往独立运作,缺乏将AI衍生的定量影像特征、全身炎症标志物和代谢参数整合到统一框架中。因此,研究人员开展了这项单中心回顾性队列研究,开发并内部验证了一种结合自动提取的定量CT影像特征与临床数据的AI辅助预测模型。
为实现研究目标,作者采用了几项关键技术方法。首先,研究纳入了2012年至2025年间经手术病理证实的951例患者(210例良性,741例恶性)。其次,利用InferRead CT Lung AI软件(版本4.0)自动提取结节大小、体积、轴位面积、最小/最大CT衰减值(HU)及实性成分占比(CTR)。此外,通过电子病历收集临床数据,并计算全身免疫炎症指数(SII)等炎症标志物。统计分析采用多变量logistic回归构建预测模型,并通过1000次Bootstrap重抽样进行内部验证,评估指标包括区分度(AUC)、校准度(校准曲线、平均绝对误差)及临床效用(DCA)。
研究结果显示,最终模型表现优异。研究人群与基线特征方面,恶性结节患者多为女性(60.9% vs. 47.1%)、无症状(77.1% vs. 66.2%),且从发现到手术的时间更短(<2年占87.2% vs. 74.8%),更多表现为混合型(59.9% vs. 27.1%)及具有可疑影像学特征(78.4% vs. 41.0%)。预测因子选择与最终模型通过多变量分析确定,女性性别(校正后比值比[aOR]=1.81)、可疑影像学特征(aOR=8.43)及结节大小>2-3cm(aOR=3.31)是恶性风险的正向预测因子;而检测时有症状(aOR=0.53)、手术时间≥2年(aOR=0.55)、实性结节表现(vs. 混合型,aOR=0.54)、CTR>0.5(aOR=0.33)及较高的最小/最大CT衰减值则是负向预测因子。模型性能与验证显示,该模型AUC达到0.836(95%CI: 0.804–0.869),校准曲线显示预测概率与实际观察结果高度一致(平均绝对误差=0.015),斜率接近1(0.98)。内部基准测试表明,全模型(临床+定量影像)的判别能力显著优于仅临床模型(AUC=0.666)和类似指南的影像模型(AUC=0.733)。临床效用与风险分层通过DCA证实,在0.10–0.45的阈值概率范围内,该模型比“全治疗”或“不治疗”策略具有更高的净获益。根据预测概率四分位数将患者分为低、中、高危三层,对应的实际恶性率呈单调上升趋势,分别为43.3%、86.7%和95.0%。亚组分析进一步证明,模型在不同结节大小、CTR、结节类型及性别等亚组中均保持了稳定且较高的AUC值(0.711–0.879)。临床实施方面,研究者构建了可视化的列线图(Nomogram)并开发了交互式网页计算器(https://ruanyingding.shinyapps.io/myshinyapp/),便于临床医生快速估算个体患者的恶性概率。
在讨论部分,作者指出该研究的主要优势在于结合了AI衍生的定量影像特征与关键临床变量,利用全自动平台提高了客观性,并提供了开源工具。然而,研究也存在局限性:单中心回顾性设计可能引入选择偏倚;模型是在恶性肿瘤富集的手术队列中开发的,若直接应用于非选择的筛查人群可能导致绝对风险校准不良(Spectrum effect);此外,预测因子选择未在Bootstrap过程中重复进行,可能轻微低估模型乐观度。
综上所述,研究人员得出结论:一种AI辅助的临床-定量影像列线图已被成功开发和内部验证,用于支持≤3cm不确定肺结节的个体化术前恶性风险评估。由于该模型源自手术筛选的恶性肿瘤富集队列,应主要将其解释为术前手术决策支持工具,而非筛查或偶发肺结节人群的通用工具。在更广泛实施之前,需要在独立的非选择性队列中进行外部验证及必要的重新校准。
相关新闻
生物通微信公众号
微信
新浪微博
  • 搜索
  • 国际
  • 国内
  • 人物
  • 产业
  • 热点
  • 科普

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号