宫颈癌预测建模:现有人工智能方法与阴道微生物组的新兴作用

《Frontiers in Network Physiology》:Predictive modeling for cervical cancer: existing AI approaches and the emerging role of vaginal microbiome

【字体: 时间:2026年06月05日 来源:Frontiers in Network Physiology 3.0

编辑推荐:

  宫颈癌仍然是全球范围内的重要疾病负担,然而当前筛查工具在识别高危型人乳头瘤病毒(HPV)感染女性中哪些个体将进展为高级别病变或癌症方面,精确性不足。在网络生理学(network physiology)框架下,宫颈癌发生被视为并非源自孤立危险因素,而是由病毒动力

  
宫颈癌仍然是全球范围内的重要疾病负担,然而当前筛查工具在识别高危型人乳头瘤病毒(HPV)感染女性中哪些个体将进展为高级别病变或癌症方面,精确性不足。在网络生理学(network physiology)框架下,宫颈癌发生被视为并非源自孤立危险因素,而是由病毒动力学、宿主免疫、阴道生态、疫苗接种状态与行为因素之间的动态相互作用所涌现的结果。本文作为观点性综述,考察了用于宫颈癌预测的人工智能(AI)方法,并评估了阴道微生物组作为这些相互连接的生理网络中补充性生物标志物的新兴作用。

该综述综合了相关证据:非乳杆菌(Lactobacillus)优势型群落或富含惰性乳杆菌(Lactobacillus iners)的阴道群落与HPV持续感染及宫颈上皮内瘤变增加相关;与之相对,以卷曲乳杆菌(Lactobacillus crispatus)为优势的群落具有保护作用。文章进一步阐述了如何将这些生态学特征与HPV基因型及临床因素结合,构建多模态模型。通过对已发表AI工具进行结构化叙述性综合,研究显示当前预后、诊断与筛查算法主要依赖人口学、临床或影像变量,尚无经过验证的模型将阴道微生物组谱纳入宫颈癌风险计算器。

本文提出了一个微生物组赋能(microbiome-enabled)建模的技术框架,涵盖基于群落状态类型(community state types, CSTs)的特征工程、算法选择、高维组学(omics)数据处理,以及在与英国国家医疗服务体系(NHS)相关人群中的分阶段验证。最后,文章勾勒出一条转化路径,即通过自采式卫生棉条(tampon)采样、AI驱动分诊以及数字化决策支持,将基于微生物组信息的风险模型嵌入宫颈筛查流程,并指出若干关键未满足需求,包括纵向多组学队列、国际联盟以及稳健的偏倚审计。
本文发表于《Frontiers in Network Physiology》,是一篇围绕宫颈癌预测建模与阴道微生物组整合应用的结构化叙述性综述与观点文章。研究背景在于,宫颈癌至今仍是全球女性重要恶性肿瘤之一,持续高危型人乳头瘤病毒(HPV)感染被认为是其发生的核心病因,但临床实际困难并不在于识别HPV感染本身,而在于区分哪些感染会自然清除,哪些将持续存在并进一步发展为高级别宫颈上皮内瘤变(cervical intraepithelial neoplasia, CIN)甚至浸润癌。当前筛查体系虽然已因初筛HPV检测而提升敏感性,但对HPV阳性女性的进一步风险分层仍主要依赖细胞学、HPV基因型及有限临床信息,精细化程度不足,导致大量本可自行消退的感染进入随访或阴道镜流程,加重医疗资源压力。因此,开展这项研究的必要性在于:寻找能够更准确反映病程进展风险的整合性生物标志物,并以人工智能(artificial intelligence, AI)实现多源数据联合建模,从而改善筛查、分诊、诊断与预后预测。

研究人员基于网络生理学(network physiology)视角提出,宫颈癌发生发展并非单一危险因素线性累积的结果,而是病毒动力学、宿主免疫、阴道微生态、疫苗接种状态、生活方式和社会行为因素共同作用下形成的动态网络表型。文中重点讨论了阴道微生物组在这一网络中的潜在关键作用。既有研究反复提示,非乳杆菌优势型群落、富含惰性乳杆菌(L. iners)的群落,以及富集加德纳菌(Gardnerella)等厌氧条件致病菌(pathobionts)的生态状态,与HPV持续感染和CIN2/3风险升高相关;相反,以卷曲乳杆菌(L. crispatus)为优势的群落与较低阴道pH值、较稳定黏膜屏障和更有利的局部免疫环境相关,可能促进病毒清除并具有保护作用。基于此,文章的核心结论是:阴道微生物组可作为现有宫颈癌AI预测模型的重要补充信息层,但截至目前,已发表并经验证的宫颈癌AI工具尚未真正将微生物组信息整合进可临床应用的风险计算器。研究的重要意义在于,文章不仅梳理了现有AI方法的适用场景与局限,也为未来构建“微生物组赋能”的多模态风险模型提出了较明确的技术路径与临床转化框架,尤其对NHS宫颈筛查流程优化具有直接启发。

主要技术方法概括如下:本文采用结构化叙述性综述方法,而非系统综述或Meta分析。研究人员通过PubMed和Google Scholar开展定向检索,聚焦2015年以后及截至2026年1月的重要文献,主题涵盖AI宫颈癌预测、HPV自采样、阴道微生物组与HPV相互作用,并结合关键综述的参考文献补充纳入研究。方法学讨论主要包括:对现有AI模型按筛查/分诊、诊断分类、预后/生存预测进行归类;以群落状态类型(CST)、关键菌种相对丰度、pH值与多样性指数构建微生物组特征;比较逻辑回归、随机森林、支持向量机、梯度提升、卷积神经网络(CNN)及生存分析模型的适配场景;并提出在NHS相关人群中开展内部验证、外部验证、偏倚审计与流程嵌入式评估。

以下结合正文各部分小标题,对论文主体内容作系统解读。

1 Introduction
引言部分首先明确了当前宫颈癌风险预测的核心瓶颈:高危型HPV持续感染是必要病因,但不足以解释不同女性之间显著异质性的疾病结局。研究人员指出,越来越多证据显示,真正有效的风险识别不应局限于单一生物标志物,而应转向整合基因组学、转录组学、蛋白质组学、甲基化和微生物组学的多组学(multi-omics)网络标志物。引言还系统界定了现有宫颈癌AI模型的三大应用场景:筛查与分诊、诊断分类、预后与生存预测。研究人员指出,当前大多数模型仍主要处理表格型临床数据或影像数据,且现实中的“筛查”与“诊断”并非完全割裂,而是紧密衔接的连续过程。文章由此引出其目标:综合现有AI路径,并提出将阴道微生物组显式整合进宫颈癌筛查、诊断和预后模型的概念与技术要求。

2 Epidemiology and natural history of HPV
这一部分从流行病学和自然病程层面奠定研究基础。研究人员总结,宫颈癌在全球范围内仍有很高发病与死亡负担,且负担主要集中于低收入和中等收入国家。HPV 16与18型导致大多数浸润性宫颈癌,其他高危基因型在癌前病变和恶性病变中也逐渐受到重视。文中强调,多数HPV感染可在1–2年内清除,而同一高危型HPV持续至少12个月会显著提高CIN2/3及浸润癌风险。通过这一部分,研究人员得出的结论是:持续感染是风险上升的关键节点,但吸烟、免疫抑制、激素避孕使用等宿主和环境因素仍无法完全解释进展差异,提示遗传易感性与宫颈阴道微环境,特别是阴道微生物组,可能是决定病程走向的重要调节因素。文章还指出,疫苗接种正在重塑风险版图,因此未来模型应将HPV疫苗接种状态作为重要修饰变量纳入。

3 Vaginal microbiome and determinants
本节聚焦阴道微生物组的组成、分类及影响因素。研究人员说明,健康状态下阴道以乳杆菌属为主,其产生乳酸以维持≤4.5的酸性环境,支持黏膜完整性并抵御病原体入侵。相反,菌群失衡(dysbiosis)会形成高多样性、富厌氧菌群落,与生殖道感染、高危型HPV持续感染以及宫颈癌前病变和癌症风险增加持续相关。通过群落状态类型(CST)分类,文章总结:CST I、II、V分别以L. crispatus、Lactobacillus gasseri、Lactobacillus jensenii为优势,通常具有保护性;CST III以L. iners为优势,属于不稳定过渡状态;CST IV则为高多样性厌氧菌优势状态,与细菌性阴道病、HPV持续感染及宫颈肿瘤性病变风险升高密切相关。研究人员进一步梳理了吸烟、炎症、抗生素、性行为、外源性激素、年龄和绝经状态等决定因素,并指出这些变量大多可以在临床流程中获得,因此适合作为预测模型中的特征或交互项。该节的主要结论是:阴道微生物组不仅具有明确生物学相关性,而且具备转化为低维度、可计算特征的现实可行性。

4 Mechanistic interactions between HPV and the microbiota
这一部分从机制层面论证微生物组纳入预测模型的合理性。研究人员指出,以L. crispatus为代表的乳杆菌优势群落可通过维持低pH、保护上皮屏障及调节局部免疫促进病毒清除;而加德纳菌(Gardnerella)、Atopobium等厌氧条件致病菌富集则会升高阴道pH、增强黏膜炎症并破坏上皮结构,削弱免疫监视,形成有利于致癌型HPV持续存在的微环境。文中总结的关键机制包括促炎细胞因子增加、免疫逃逸标志上调,以及乳酸耗竭、蛋白水解与基因毒性活性升高等代谢紊乱。研究人员据此得出结论:从微生物生态失衡到HPV持续感染,再到CIN乃至浸润癌,存在一条具有生物学可解释性的连续链条。文章还提到若干初步干预研究显示,恢复L. crispatus优势状态的阴道益生菌策略可能提高HPV清除率并降低高级别病变复发,但相关研究样本量小、异质性强、随访较短,因此目前只能作为机制支持与转化线索。

5 Methodological advances and evidence gaps
本节总结了微生物组研究技术进展及证据缺口。研究人员指出,早期研究多依赖16 S rRNA基因测序,仅能描述大致菌群结构;近年来宏基因组测序(shotgun metagenomics)与宏转录组学(metatranscriptomics)使病毒、真菌、功能通路及宿主—微生物相互作用得以更精细刻画,但也引入采样、测序平台及生物信息学流程的技术变异。研究人员强调,目前多数研究为观察性、横断面设计,易受性行为、避孕、宿主遗传背景和种族等混杂因素影响,且英国及其他多民族筛查人群代表性不足。该节还特别指出,许多既往AI和风险评分研究在受试者选择、预测因子测量、结局定义和统计分析方面存在偏倚风险,与PROBAST评估框架高度相关。因此得出的结论是:未来微生物组赋能模型必须基于前瞻性、代表性筛查队列预先设计,采用透明的偏倚风险评估和更严格的报告规范。

6 Implications for predictive modelling and clinical translation
这一部分系统梳理现有宫颈癌AI模型并提出临床可落地的建模思路。研究人员指出,预后模型多基于人口学、肿瘤分期、组织学及治疗变量,常用Cox比例风险模型、Weibull模型及树模型;而诊断与筛查场景中的影像任务则主要依赖CNN等深度学习(deep learning)架构处理细胞学图像、宫颈镜图像或宫颈摄影图像。文章通过总结代表性研究说明:表格数据任务中传统统计模型往往具备不逊于深度神经网络(DNN)的表现,同时具有更强可解释性;影像任务则更适合CNN自动提取复杂空间特征。在此基础上,研究人员提出,真正具有临床意义的筛查风险计算器应在HPV阳性或细胞学可疑阶段,整合HPV基因型、年龄、吸烟、产次、避孕、既往筛查史、CST、L. crispatus及厌氧菌相对丰度、pH值、多样性指标,以及条件允许时的炎症/免疫标志物,将受检者分层为常规召回、缩短间隔复查或直接阴道镜转诊等可操作类别。其结论是:从计算架构看,将微生物组特征纳入现有表格模型或影像+临床混合模型并不需要根本性范式改变,关键在于标准化测量、解释性设计及外部验证。

7 Validation, harmonisation and explainability
该节强调模型验证、数据协调和可解释性的重要性。研究人员主张,微生物组赋能模型应采取分阶段验证路径:先进行严格的内部交叉验证,再在与NHS真实筛查人群相匹配的英国和欧洲队列中开展外部验证,最后嵌入实际筛查流程中进行前瞻性评估。由于不同实验室在测序流程、样本处理和信息基础设施上存在差异,文中建议采用ComBat等批次效应校正方法并针对微生物组与HPV测序数据进行适配。与此同时,可解释性应贯穿模型全生命周期,例如对表格和组学输入应用SHAP,对影像输入应用Grad-CAM等方法,并透明报告不同亚组表现。该节结论是:若无协调化、可解释性和偏倚审计,模型即使性能可观,也难以实现可信部署。

8 Integration into NHS screening pathways
这一部分聚焦NHS情境下的实施路径。研究人员提出,在可行流程中,无论是临床采样还是自采样的宫颈阴道标本,都可在同一份样本中同步获取HPV基因型与微生物组信息,并由实验室及全科医生系统自动接收。AI风险引擎据此计算复合风险评分,将持续高危型HPV且伴菌群失衡特征者优先转诊阴道镜,将低风险个体返回常规召回,从而减少不必要转诊、焦虑和过度治疗。文章还指出,在此路径中发现微生态失衡不仅可用于风险预测,还可能触发干预,例如L. crispatus益生菌、戒烟、避孕方式评估或抗生素—益生菌联合策略。研究人员同时明确提示,当前NHS并未将微生物组检测嵌入宫颈筛查协议,多数实验室亦缺乏验证流程,因此应先通过嵌入式试点研究评估互操作性、知情同意、数据安全、运行指标和卫生经济学效果。该节结论在于:微生物组整合并不要求新增采样,只需在现有样本基础上增加分析步骤,因此具备现实转化潜力。

9 Future directions and unmet needs
最后一节总结未来发展方向。研究人员提出,未来应优先建立大型、前瞻性、多组学、多种族纵向队列,结合自采样、行为数据、疫苗接种信息与多轮筛查结局,支持时间动态模型开发,例如贝叶斯变点方法、循环网络或Transformer架构。同时,还需开展算法引导路径的随机化或真实世界评估,衡量其对筛查参与度、依从性、公平性及过度/不足治疗的影响。治理层面则需与NHS、世界卫生组织(WHO)及新兴全球AI规范对接,形成标准化模型卡、训练与验证数据集透明文档,以及跨人群公平性与性能基准。研究人员最终强调,只有将病毒动力学、宿主免疫、阴道生态、疫苗接种、行为和社会决定因素置于同一网络生理学框架中,并在英国/NHS及国际环境中完成验证,才可能实现个体化、公平且符合监管要求的微生物组赋能宫颈筛查。

讨论部分总结
本文讨论部分的核心在于:阴道微生物组已经具备作为宫颈癌风险分层补充标志物的较强理论基础和初步证据基础,但当前证据链仍以相关性研究为主,尚缺乏足够规模和纵向深度的验证队列,也缺少将其真正纳入AI风险引擎并完成外部验证的成熟模型。研究人员认为,未来工作的关键不只是继续证明某些菌群与HPV持续感染或CIN相关,更在于建立标准化测量体系、形成具有临床可解释性的简化特征表示、开展严谨的偏倚审计,并通过NHS等真实筛查路径中的嵌入式研究证明其能切实减少不必要阴道镜转诊、提升高级别病变检出效率。文章整体论证了多模态整合是宫颈癌预测模型发展的必然方向,而微生物组是其中当前最具可开发性的新增层之一。

研究结论翻译
宫颈癌预测领域现有人工智能方法主要依赖人口学、临床和影像数据,尚未将阴道微生物组这一与高危型HPV持续感染及宫颈肿瘤进展密切相关的生物学层面有效整合。现有证据表明,非乳杆菌优势型或富含L. iners的阴道群落与较高风险相关,而L. crispatus优势型群落可能具有保护作用。将微生物组特征与HPV基因型、疫苗接种状态及临床变量联合纳入多模态AI模型,有望提升宫颈筛查、分诊与预后评估的精度。为实现临床转化,未来需要建设纵向多组学队列、推动国际合作、加强模型协调化与偏倚审计,并在NHS相关及国际人群中开展分阶段验证,以支持建立可解释、可推广且公平的微生物组赋能风险预测工具。
相关新闻
生物通微信公众号
微信
新浪微博

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号