《Frontiers in Cell and Developmental Biology》:Advancements in artificial intelligence for cancer diagnosis and prognosis prediction: current applications and emerging opportunities
编辑推荐:
这篇前沿综述系统阐述了人工智能(AI)在肿瘤学领域的变革性作用。文章重点剖析了机器学习(ML)、深度学习(DL)与大规模语言模型(LLMs)三大类AI算法,详述了其在癌症筛查、精准诊断、分子分型及预后预测等关键环节的广泛应用实例。综述强调了通过整合多模态数据(如影像、病理、基因组学和临床记录),AI正推动肿瘤诊疗模式从经验决策转向数据驱动的精准医学。文中也探讨了该领域面临的挑战与未来发展趋势,为临床实践与科研创新提供了深刻洞见。
人工智能(AI)技术正以前所未有的速度重塑肿瘤学的面貌,为癌症的筛查、诊断、预后预测乃至治疗决策带来革命性变革。随着计算能力的飞跃与海量数据的积累,AI已从实验室走向临床,展现出解决传统医学方法在精准性、效率和可及性方面固有挑战的巨大潜力。
AI算法在肿瘤学中的应用类型
现代AI的发展历经了从传统机器学习(ML)到深度学习(DL),再到大规模语言模型(LLMs)的关键演变阶段。这些技术正以前所未有的速度融入肿瘤学的各个领域,展现出从基础研究、临床诊断到治疗决策的变革潜力。
- •
机器学习(ML):作为一种数据驱动方法,ML能够从大规模临床数据集中识别复杂模式并生成预测性见解,为临床决策提供支持。其在肿瘤学中的应用广泛,涵盖医学影像、分子谱和电子健康记录的分析,用于癌症检测、诊断、预后预测和治疗反应评估。ML在药物发现与开发方面也展现出巨大前景,例如优化纳米颗粒设计以提升靶向药物递送效率。
- •
深度学习(DL):作为ML的高级子集,DL以其自动特征提取能力著称,特别擅长处理高维和非结构化数据,如医学图像和文本报告。在放射学领域,DL模型在乳腺X线摄影和乳腺超声检测肿瘤方面已达到或超越了人类专家的水平。在神经肿瘤学中,DL助力脑肿瘤分割、分类和预后预测。值得注意的是,DL模型可以直接从常规H&E染色的病理切片中推断关键的分子特征,如特定基因突变和肿瘤突变负荷,实现了“数字活检”的概念。近年来,像CHIEF这样的基础模型,以及UNI、Phikon、Virchow等模型,通过自监督学习从海量数据中学习通用表征,展现出强大的泛化能力和全癌种检测潜力。2025年,Deepath-MSI模型获得了中国国家药品监督管理局的批准,用于结直肠癌微卫星不稳定性检测,标志着AI算法向临床批准、监管认可应用的关键过渡。
- •
大规模语言模型(LLMs):LLMs的出现代表了AI在理解和生成人类语言能力上的范式转变,特别是在处理非结构化临床文本方面。LLMs能够解析电子健康记录,为预后评估、治疗推荐和临床试验匹配提供决策支持。它们还能高效地从病理报告等文本中提取结构化信息。通过利用海量生物医学文献和真实世界患者数据,LLMs可以开发出超越传统临床评分系统的风险分层工具。此外,LLMs与视觉网络结合形成的多模态基础模型,预示着未来AI系统能够同时解读文本和影像等异质数据流,实现更全面、个性化的临床决策支持。
AI在癌症筛查中的应用
近年来,AI技术,特别是ML和DL,在早期癌症筛查方面取得了实质性进展,展现出改变传统医学范式的潜力。目前,AI被广泛应用于包括乳腺癌、肺癌、食管癌、肝细胞癌、前列腺癌、结直肠癌、膀胱癌和宫颈癌在内的多种高发恶性肿瘤的早期识别,体现了其在全身系统性癌症筛查中的多功能性。
- •
结直肠癌筛查:在组织病理学评估中,结合DL和经典ML的分类器模型能够以极高的灵敏度检测活检全切片图像中的高级别病变。此外,结合血清N-聚糖谱的ML诊断模型,为无创人群水平筛查提供了新途径。
- •
食管癌筛查:AI研究主要集中在食管鳞状细胞癌。ML、DL和迁移学习在早期检测中的应用,优化了筛查方案,改善了病变识别,并通过整合基因组、影像和临床数据实现风险预测。针对癌前病变Barrett食管开发的弱监督DL模型,有望将病理医生工作量减少近50%,从而推动大规模人群筛查。
- •
肺癌筛查:AI的应用贯穿筛查全流程。卷积神经网络原型可自动检测肺部结节并量化冠状动脉钙化体积。多模态早期检测平台整合了蛋白质组数据、DL衍生的CT影像特征和临床变量,显著提升了早期肺癌的诊断性能。重要的是,DL模型可利用肺癌筛查的低剂量CT数据同时预测心血管疾病风险,实现“一次扫描,双重筛查”。
- •
乳腺癌筛查:AI已深度融入乳腺影像分析。应用于数字乳腺断层合成图像的DL算法,在曲线下面积、敏感性和特异性方面均优于传统的计算机辅助检测系统。增强的YOLACT架构提高了乳腺MRI中典型和挑战性病例的检测准确性。整合乳腺X线摄影和超声数据的多模态DL模型,其整体性能超越了单模态方法。
- •
宫颈癌筛查:AI驱动的自动化细胞学图像分析是筛查的关键焦点。渐进式病变细胞识别方法和基于循环神经网络的WSI分类模型,在大规模多中心验证研究中优于普通细胞病理学家。DL模型在区分宫颈液基细胞学WSI中的肿瘤性与非肿瘤性病变方面表现出高诊断准确性。结合阴道镜图像、细胞学和HPV检测结果的跨模态整合框架,在宫颈癌筛查中达到了先进水平。专为资源有限地区设计的便携式AI宫颈癌筛查设备CITOBOT也已开发出来。
- •
泌尿系统癌症筛查:AI为非侵入性或微创筛查提供了强大工具。对于尿路上皮癌,结合数字全息流式细胞术与ML/DL算法,可在尿液样本中高精度识别恶性细胞。DL模型能够准确分类尿液液基细胞学WSI。在膀胱癌筛查中,整合数字微流控、荧光寿命成像显微镜和DL的方法,提供了一种高精度、非侵入性的诊断途径。对于前列腺癌,结合多重尿液生物标志物传感与AI驱动分析的非侵入性方法,在患者分类中达到了超过99%的准确率。
- •
其他癌症筛查:AI在其他恶性肿瘤筛查中也展现出多样化用途。例如,通过大气压辉光放电质谱结合ML分析尿液样本实现肝细胞癌筛查。在血液肿瘤学中,应用ML筛选13条程序性细胞死亡通路的生物标志物,构建了可用于急性髓系白血病预后预测和治疗指导的基因特征。在药物发现中,通过基于ML的虚拟筛选识别靶向Bcl-2蛋白家族的新型小分子,并在临床前模型中验证了其抗肿瘤功效。
AI在癌症诊断中的应用
AI,特别是DL,其核心特征是构建多层神经网络,从原始数据中自主学习层次化的特征表示。AI在癌症诊断、分级分期和分子分型中的应用广泛。通过整合多源数据,如MRI、CT、PET、超声和组织病理学图像,AI不仅促进了肿瘤诊断,还实现了精确的病理分级和临床分期。此外,结合多组学数据,AI能够实现准确的分子分型,以支持个性化的治疗决策。
- •
诊断:AI技术,特别是ML、DL和LLMs,正在从根本上改变癌症诊断的格局。其应用主要围绕两个快速发展的领域:影像组学和病理组学。
- •
影像组学:涉及从CT、MRI和超声等医学图像中高通量提取和分析定量特征。在神经系统肿瘤中,基于多模态MRI和液体活检数据的多任务DL影像组学模型,旨在实现与WHO分类一致的术前非侵入性“整合诊断”。在肺部结节诊断中,结合DL架构和影像组学特征的计算机辅助诊断框架能有效区分良恶性磨玻璃结节。在乳腺癌中,结合DL和影像组学的诊断模型在乳腺超声图像上表现出高准确性和强泛化能力;基于多参数乳腺MRI的影像组学模型在区分良恶性病变方面表现优异;整合B超和Nakagami参数图像的多模态DL框架进一步提升了诊断效能。在腹部和盆腔恶性肿瘤中,基于超声的临床-影像组学-DL融合模型可准确诊断软组织肿瘤;影像组学与ML结合能有效区分子宫肉瘤和良性平滑肌瘤;基于双模态超声的分层DL诊断模型不仅能准确识别不明原因颈部淋巴结病的病因,还能缩小不同经验水平医生之间的诊断差距。
- •
病理组学:专注于数字化病理全切片图像的定量分析。在结直肠癌中,基于迁移学习深度卷积网络的大规模多中心研究开发的诊断模型,与经验丰富的病理医生高度一致,展现出减轻病理工作负荷的巨大潜力。对于肝细胞癌,DL框架可实现高效的亚型多分类;专门的DL模型有助于微血管侵犯的精确诊断和定量评估。在胃癌中,研究揭示肿瘤周围非癌组织具有诊断价值,据此构建的DL模型能有效识别胃癌。在肺癌中,DL与病理组学结合可评估肿瘤侵袭性;可解释的DL辅助诊断系统不仅能分类非小细胞肺癌亚型,还能生成决策逻辑的可视化解释。在血液系统恶性肿瘤中,整合DL与多ML分类器的框架实现了急性淋巴细胞白血病组织病理学图像的自动筛查和分类。在泌尿系统癌症中,基于H&E图像的ML病理组学模型对膀胱癌具有高诊断准确性,其生成的风险评分可作为独立的预后指标。在卵巢癌中,基于DL的组织学类型诊断模型显示出作为辅助工具提升病理评估可靠性和一致性的前景。
- •
分级与分期:医学成像的客观和非侵入性特性使其成为癌症诊断、分级和分期的基石。AI技术,特别是传统ML和DL,在从医学图像中提取定量特征和构建预测模型方面取得了实质性进展。
- •
CT图像:基于CT影像组学结合ML或DL的模型在多种癌症分级分期中显示出巨大潜力。例如,在膀胱癌中预测肌层浸润和区分T2与T3期;在上尿路尿路上皮癌中,结合肿瘤及肾周脂肪的影像组学特征提升了肿瘤分级和分期的预测性能;在神经系统肿瘤、食管癌、喉癌和胸腺上皮肿瘤中,融合CT影像组学特征与DL或临床语义数据的模型在分级分期任务上 consistently outperformed 单模态方法。
- •
MRI图像:MRI因其优越的软组织分辨率,是中枢神经系统、前列腺、盆腔和肝脏肿瘤分级的首选成像方式。在前列腺癌中,可解释的临床-影像组学-DL模型可预测术后格里森评分。在胶质瘤中,基于MRI影像组学或ADC和脑血流图特征可有效区分高低级别肿瘤。在脑膜瘤分级中,研究探索了瘤周水肿区域的诊断价值,并提出了整合Vision Transformer和CNN架构的混合DL模型。在肝肿瘤分级中,基于MRI的影像组学模型SVM的表现超过了DL模型DenseNet。对于肾透明细胞癌,利用多参数MRI数据构建的ML列线图可预测术前WHO/ISUP核分级。在分期应用中,基于T2WI MRI的影像组学模型成功预测了直肠癌的淋巴结负荷,而DL模型在子宫内膜癌和舌癌的自动T分期中表现出高准确性。
- •
PET图像:PET通常与CT结合用于癌症诊断和分期。基于11C-蛋氨酸PET/CT图像的影像组学ML模型,能够可靠地区分高低级别中枢神经系统肿瘤。
- •
组织病理学图像:组织病理学检查仍是癌症诊断和分级的金标准。AI驱动的病理组学通过分析数字化WSI,旨在实现定量、可重复和标准化的肿瘤分级和分期。在结直肠癌中,基于H&E和Ki67免疫组化切片的AI病理组学模型在区分I-II期和III期疾病方面表现出色。在肾细胞癌中,高效的DL框架RCCGNet可在新型五级分级数据集上实现自动准确的肿瘤分级。在乳腺癌中,基于WSI训练的DL模型在分级方面与病理学专家高度一致。
- •
分子分型:分子分型已成为现代肿瘤学的基石,为预后分层和个性化治疗策略选择提供了必要依据。AI技术,特别是DL和ML,在整合多模态数据以实现快速准确的分子亚型分型方面展现出巨大潜力。
- •
组织病理学全切片图像:AI能够从常规染色组织切片直接推断分子特征。例如,DeepGlioma系统可在90秒内分析 stimulated Raman 组织学图像,准确预测IDH突变、1p/19q共缺失等关键分子生物标志物。在乳腺癌、子宫内膜癌和脊髓室管膜瘤中,可解释的DL模型仅基于H&E染色切片就能高精度预测分子亚型。
- •
影像组学:AI实现了非侵入性的体内分子表征。针对脑胶质瘤的研究证实,基于MRI数据的DL模型能够可靠预测IDH突变、1p/19q共缺失和MGMT启动子甲基化状态等关键分子标志物。整合转录组数据与影像特征的“影像基因组学”模型,为阐释影像表型背后的分子机制提供了新视角。
- •
多组学数据:在系统层面,AI利用聚类和ML算法整合多组学数据,能够发现超越传统组织病理学分类的新分子亚型,并构建稳健的预后模型。在卵巢癌、肝细胞癌、胃癌、肺腺癌、软组织肉瘤等实体瘤中,整合分析框架系统地揭示了亚型间在基因组改变、通路激活、肿瘤微环境组成和治疗敏感性方面的异质性。
- •
流式细胞术数据:AI的应用也已扩展到流式细胞术数据分析。针对急性髓系白血病开发的基于注意力的DL流程,能够实现自动诊断并直接预测关键分子异常,实现了从细胞形态到分子分类的整合分析。
AI在癌症预后预测中的应用
癌症预后评估是临床决策的基石。近年来,AI,特别是ML和DL,通过其先进的数据整合和模式识别能力,在解读肿瘤异质性和实现精确预后预测方面开辟了新前沿。
- •
风险预测:基于DL的AI模型已广泛应用于利用医学图像和临床数据预测个体患癌风险。在乳腺癌风险预测中,基于筛查乳腺X线摄影图像训练的DL模型表现出强大的预测性能,能够仅根据当前阴性的乳腺X线照片预测未来风险。在肺癌中,应用数据增强技术缓解临床数据集类别不平衡并结合优化分类器构建的ML风险预测模型,达到了高精度。在肝细胞癌中,多组学数据与ML算法的整合能够识别具有不同预后的分子亚型,并构建AI衍生的风险评分,该评分可作为总体生存的独立预测因子,并有望指导个性化治疗策略。在胶质瘤中,基于免疫原性细胞死亡相关基因构建的风险评分能有效预测患者预后。
- •
淋巴结转移预测:AI在术前预测淋巴结转移方面显示出重要价值。对于口腔鳞状细胞癌,基于MRI的DL模型预测淋巴结转移的曲线下面积达到0.81,显著降低了隐匿性转移率,其性能与专科放射科医生相当。在口腔癌中,基于增强CT的DL模型在识别阳性淋巴结方面的准确性与放射科医生相当。在结直肠癌中,结合DL和临床特征的模型对术前淋巴结转移具有高预测准确性。在乳腺癌中,基于H&E染色切片的自动淋巴结转移筛查算法,对于微转移和孤立肿瘤细胞达到了100%的敏感性和阴性预测值。
- •
生存结局预测:AI通过从基因组、影像和病理数据中提取特征,构建有效的生存预测模型。在胶质瘤中,基于CD163+FPR3+巨噬细胞特征的风险评分在多个队列中一致预测总体生存。在小细胞肺癌中,基于H&E组织病理学图像开发的病理组学特征对总体生存和无病生存显示出显著的风险分层能力。在食管鳞状细胞癌中,基于临床特征的多重ML算法模型(如CoxPH)得出的风险评分,能将患者分为具有显著不同3年总体生存率的组别。
- •
治疗反应预测:AI在预测患者对特定治疗的反应方面至关重要,有助于实现治疗个性化。在结直肠癌中,基于多染色DL的AImmunoscore预测了直肠癌患者对新辅助治疗的反应;基于H&E图像的病理组学特征识别了更可能从辅助化疗中获益的II/III期患者。在肝细胞癌中,CLAM-C模型预测了BCLC C期患者对不同治疗的差异反应;基于CT的模型预测了中期肝细胞癌患者经动脉化疗栓塞术后的生存情况,评分较低者获益更多。在卵巢癌中,基于H&E图像的图深度学习模型OCDPI预测了对辅助治疗的反应,评分低的患者生存更好、复发率更低。
- •
预后生物标志物开发:AI能够从复杂的高维数据中识别新的预后生物标志物。在尿路上皮癌中,通过多组学数据识别出一个由12个基因组成的共识ML特征,能够稳健预测预后和免疫治疗反应。在肾细胞癌中,构建了预后和治疗脆弱性特征以指导个性化治疗策略。在肺腺癌中,DL定义的风险组是独立于TNM分期的无病生存预测因子。在肝细胞癌中,基于程序性细胞死亡模式构建的细胞死亡相关指数预测了预后和治疗反应。
总之,AI技术通过整合多模态数据,正在深刻改变癌症诊疗的全过程,从早期筛查、精准诊断、分子分型到预后预测与治疗指导,持续推动肿瘤学向更加数据驱动、个性化和精准化的未来迈进。尽管在临床转化、模型可解释性、数据标准化等方面仍面临挑战,但其展现出的巨大潜力和已取得的成果,无疑标志着肿瘤学领域一个新时代的开启。