《Journal of Evidence-Based Dental Practice》:Accuracy of Image-Based Deep Learning in Oral Squamous Cell Carcinoma Diagnosis: A Systematic Review and Meta-Analysis
编辑推荐:
Hai-Tao Zhu|Pei-Chi Chen|Rui-Min Wang|Yu-Yu Zeng|Chang-Yun Leng|Ze-Jian Li中国广东省广州市暨南大学口腔医学院,邮编510632摘要目的近期有研究探讨基于图像的深度学习在口腔鳞状细胞癌诊断中的应用潜力。本综述
Hai-Tao Zhu|Pei-Chi Chen|Rui-Min Wang|Yu-Yu Zeng|Chang-Yun Leng|Ze-Jian Li
中国广东省广州市暨南大学口腔医学院,邮编510632
摘要
目的
近期有研究探讨基于图像的深度学习在口腔鳞状细胞癌诊断中的应用潜力。本综述旨在评估其有效性,为未来发展提供证据支持。
方法
截至2025年6月3日,系统检索了Cochrane图书馆、Embase、PubMed和Web of Science中的相关文献。采用QUADAS-2工具进行偏倚风险评估,并按分类类型(二元分类与多类分类)和图像类型(组织病理学图像、口腔照片以及拉曼光谱图像)进行亚组分析。
结果
共纳入52项研究。在二元分类中,深度学习表现优异。其中4项研究基于拉曼光谱图像构建深度学习模型,其灵敏度综合值为0.99(95%置信区间为0.98-0.99),特异性为0.98(95%置信区间为0.96-0.99),总结接收者操作特征曲线下面积为0.99(95%置信区间为0.20-1.00)。8项研究基于口腔照片构建深度学习模型,灵敏度综合值为0.97(95%置信区间为0.91-0.99),特异性为0.93(95%置信区间为0.85-0.97),AUC值为0.99(95%置信区间为0.85-1.00)。另有31项研究基于组织病理学图像构建深度学习模型,其灵敏度综合值为0.98(95%置信区间为0.97-0.98),特异性为0.97(95%置信区间为0.96-0.98),AUC值为0.99(95%置信区间为0.50-1.00)。
结论
基于图像的深度学习在多种成像模式中均展现出良好的诊断性能与优势,包括组织病理学图像、口腔照片以及拉曼光谱图像,表明其为开发用于口腔鳞状细胞癌诊断的智能诊断工具提供了良好方向。该技术有望成为辅助诊断的有效手段。
引言
口腔癌属于头颈部恶性病变,也是人类第16大常见癌症1。作为头颈部最常见的恶性肿瘤,口腔鳞状细胞癌的发病率仅次于鼻咽癌,占所有头颈部癌症的28.1%2。近年来口腔鳞状细胞癌的发病率呈上升趋势,其五年生存率约为62%3。尽管诊断和治疗技术不断进步,但该疾病的死亡率并未显著下降,严重影响了患者的生存质量与寿命。因此,亟需有效的诊断与预后评估工具,以实现早期发现并改善预后4。
及时发现并诊断口腔癌有助于牙医尽早采取干预措施,从而改善临床治疗效果5。然而,在绝大多数患者中,口腔疾病往往在晚期才被发现,这严重影响了治疗效果与预后6。尽管医疗设备快速发展,诊断和治疗技术也取得了很大进步,但组织病理学检查仍是口腔鳞状细胞癌诊断的金标准6, 7, 8。需要注意的是,组织病理学检查属于侵入性操作,需要采集手术组织,且对于多灶性或可疑病变往往需要多次活检,这不仅会造成组织损伤,还会给患者带来疼痛与恐惧感;此外,从采集组织到完成活检也需要一定时间。传统诊断方法还需要病理学家投入大量时间和精力,他们必须仔细观察组织病理学切片的形态特征才能做出准确诊断。但对于经验不足的病理学家来说,很容易出现漏诊或误诊的情况,进而影响后续治疗9。因此,迫切需要非侵入性的医疗技术来帮助早期发现口腔鳞状细胞癌。近年来,拉曼光谱和光学相干断层扫描等光学成像技术10逐渐成为一种非侵入性检测方法,通过分析组织和细胞的光学特性变化,可判断其生物学结构与成分11。这些成像技术已在临床中得到广泛应用,有助于识别可疑病变、实现早期诊断,并为临床治疗提供支持12。
随着人工智能技术的不断发展,为人类疾病的诊断、治疗及预后预测带来了新的可能13。基于深度学习的人工智能算法在疾病诊断与分类领域展现出广阔的应用前景14。例如,Sakinat O. Folorunso等人15通过训练深度学习模型区分口腔鳞状细胞癌组织与正常组织的组织病理学图像,实现了高达99.2%的准确率。此外,深度学习模型在处理光学成像结果方面也取得了进展。Hao Yan等人16构建了深度学习模型,可区分正常组织与舌鳞状细胞癌的拉曼光谱图像,进一步体现了人工智能在口腔鳞状细胞癌诊断中的巨大潜力。更值得注意的是,人工智能训练还有助于实现非侵入性诊断。Ye等人17将人工智能模型与口腔颌面外科医生的诊断结果进行比较,发现该模型在灵敏度与特异性方面表现更优。更为有趣的是,Ye等人17通过多中心试验发现,包括口腔医院专家以及综合医院和社区医院的普通牙医在内的外部临床医生,在借助人工智能模型预测结果后,其诊断能力甚至优于资深牙医。他们还构建了能够检测并分类口腔照片的深度学习模型,可有效区分口腔扁平苔藓、口腔白斑病与口腔鳞状细胞癌,从而帮助更准确地诊断口腔疾病,提高临床诊断效率;同时,该深度学习模型作为一种更安全、非侵入性且成本较低的诊断方法,还能提升患者的配合度。
近年来有许多学者研究深度学习模型在口腔鳞状细胞癌辅助诊断中的应用,但他们使用的图像类型各不相同,包括口腔照片、组织病理学图像、拉曼光谱图像或放射学图像,且训练方法也有所差异。因此,目前关于深度学习模型诊断价值的系统性证据仍然不足,这给人工智能的发展与优化带来了挑战。为此,我们开展了这项研究,旨在系统评估基于图像的深度学习模型在口腔鳞状细胞癌诊断中的灵敏度与特异性。通过整合现有证据,我们的研究结果有望明确人工智能在口腔鳞状细胞癌诊断中的实际效果,为开发智能诊断技术提供科学依据。
章节节选
研究注册情况
本研究遵循PRISMA-DTA指南18,并在PROSPERO数据库中进行了注册,注册编号为CRD420251080579。
纳入标准
纳入标准如下:
(1)患有疑似口腔鳞状细胞癌的口腔病变患者或健康个体;(2)研究类型为病例对照研究、队列研究或横断面研究;(3)已构建用于口腔鳞状细胞癌诊断/分型的深度学习模型;(4)深度学习模型基于图像数据(组织病理学图像、口腔照片以及拉曼光谱图像)构建。
排除标准如下:
(1)仅发表会议摘要的研究;(2)仅包含图像资料的研究。
研究筛选过程
初步检索共获得1,399篇相关研究,其中731篇为重复文献,被剔除。经过标题与摘要筛选后又剔除了513篇研究,随后对剩余研究的全文进行了核查,又有24篇因以下原因被排除:(1)仅研究图像分割技术;(2)研究对象不符合纳入标准;(3)使用的并非深度学习模型或语言模型;(4)缺乏结局指标或提取的数据不足。最终共有52篇研究符合纳入标准。
主要研究结果总结
这项荟萃分析从灵敏度与特异性两个方面全面评估了基于图像的深度学习模型在口腔鳞状细胞癌诊断中的性能。基于组织病理学图像、口腔照片以及拉曼光谱图像的深度学习模型在口腔鳞状细胞癌诊断中均表现出优异性能。在拉曼光谱图像分析中,深度学习模型的整体灵敏度为0.99(95%置信区间为0.98-0.99),特异性为0.98(95%置信区间为0.96-0.99);在口腔照片分析中,灵敏度为0.97(95%置信区间为0.91-0.99),特异性为0.93(95%置信区间为0.85-0.97);基于组织病理学图像的深度学习模型灵敏度为0.98(95%置信区间为0.97-0.98)。
结论
基于图像的深度学习技术在口腔鳞状细胞癌的非侵入性诊断(如拉曼光谱图像或口腔照片分析)与侵入性诊断(组织病理学图像分析)中都具有较高的准确性与一定优势,为开发用于该疾病的智能诊断工具指明了方向。不过,其在临床应用前仍面临诸多挑战,尤其是在多类分类方面,因此还需要更多证据来验证深度学习技术的有效性。未来研究应重点致力于完善深度学习模型。
资金来源
本研究得到了暨南大学研究生优秀创新人才培养项目的资助[项目编号为2025CXY328]。
作者贡献:根据CRediT分类标准,所有作者均参与了研究的构思与设计。论文初稿撰写工作由Hai-Tao Zhu负责;论文修订工作同样由Hai-Tao Zhu承担;概念构思部分由Pei-Chi Chen负责;方法学研究由Hai-Tao Zhu、Pei-Chi Chen与Rui-Min Wang共同完成;正式分析与研究工作则由Rui-Min Wang、Yu-Yu Zeng负责。
数据可用性
本研究过程中生成或分析的所有数据均收录在本篇已发表的文章及其补充材料文件中。
CRediT作者贡献说明
Hai-Tao Zhu:负责论文修订与编辑工作、论文初稿撰写以及方法学研究。Pei-Chi Chen:参与方法学研究、资金申请工作以及概念构思。Rui-Min Wang:负责方法学研究、数据收集工作以及正式分析。Yu-Yu Zeng:参与数据收集工作以及正式分析。Chang-Yun Leng:负责数据收集工作以及正式分析。Ze-Jian Li:承担研究监督工作以及资源协调工作。