辅助生殖技术中取卵后卵巢过度刺激综合征风险分层机器学习模型的开发与内部验证:一项探索性研究

《Frontiers in Endocrinology》:Development and internal validation of a post-retrieval machine learning models for OHSS risk stratification in assisted reproductive technology: an exploratory study

【字体: 时间:2026年05月25日 来源:Frontiers in Endocrinology 4.6

编辑推荐:

  目的:本研究旨在探索开发和内部验证用于接受辅助生殖技术(ART)患者取卵后卵巢过度刺激综合征(OHSS)风险分层的机器学习(ML)模型的可行性。方法:在这项单中心回顾性探索性研究中,研究人员利用2020年至2023年锦欣西囡妇女儿童医院接受控制性卵巢刺激(CO

  
目的:本研究旨在探索开发和内部验证用于接受辅助生殖技术(ART)患者取卵后卵巢过度刺激综合征(OHSS)风险分层的机器学习(ML)模型的可行性。方法:在这项单中心回顾性探索性研究中,研究人员利用2020年至2023年锦欣西囡妇女儿童医院接受控制性卵巢刺激(COH)的不孕症患者临床及实验室数据构建了三种ML模型。通过受试者工作特征曲线下面积(AUC)、准确率、灵敏度、特异度、F1值、校准曲线及决策曲线分析(DCA)对模型进行全面评估,并采用SHapley Additive exPlanations(SHAP)方法实现模型可解释性,识别关键预测因子并阐明模型决策依据。结果:共纳入500例不孕症患者,其中40例确诊为OHSS。参与者按7:3比例随机分为训练集(n=350)和测试集(n=150)。在开发的三种ML模型中,随机森林(RandomForest)模型在测试集中表现出最优的区分性能,准确率为0.79,灵敏度为0.75,特异度为0.80,F1值为0.37,AUC为0.81(95%置信区间:0.68-0.95)。最小绝对收缩与选择算子(LASSO)回归与SHAP分析确定取卵数、年龄、扳机日孕酮(P)水平及基础黄体生成素/卵泡刺激素比值(LH/FSH)为最具影响力的预测因子。结论:这项概念验证研究表明,基于ML的方法在ART治疗不孕患者的OHSS风险分层中展现出探索性潜力。通过整合人口统计学与临床变量,该模型——尤其是随机森林算法——可作为生成假设的基础框架,为取卵后风险分层提供依据,最终降低OHSS发生风险。结合ML与SHAP提供了明确、个体化的风险解读,有助于临床医师直观理解关键预测特征的影响,但这种可解释性并不意味着已验证的临床效用。这些发现属于探索性和假设生成性质,在临床应用前仍需通过更大规模、多中心的外部前瞻性研究进行严格验证。

论文解读:《辅助生殖技术中取卵后卵巢过度刺激综合征风险分层机器学习模型的开发与内部验证》

该研究发表于《Frontiers in Endocrinology》,针对辅助生殖技术(ART)中卵巢过度刺激综合征(OHSS)这一严重并发症的预测难题展开探索。OHSS总体轻度发病率为20%-30%,中重度达1%-6%,可导致腹水、血栓甚至死亡,同时增加医疗成本与患者心理负担。传统预测依赖临床经验及抗缪勒管激素(AMH)、窦卵泡计数(AFC)等单一指标,受限于线性统计假设,难以捕捉基因、血管生成因子(如血管内皮生长因子VEGF、白细胞介素-6 IL-6)与促性腺激素暴露间的非线性交互作用,预测精度不足。机器学习(ML)擅长解析高维数据中的复杂模式,但“黑箱”特性阻碍临床应用,而SHapley Additive exPlanations(SHAP)可通过博弈论量化特征贡献,为模型提供透明化解释。为此,研究人员开发了基于ML的OHSS风险分层工具,并整合SHAP实现临床可解释性。

关键技术方法

研究采用单中心回顾性队列设计,纳入2020-2023年锦欣西囡妇女儿童医院的500例ART患者(含40例OHSS病例),排除卵巢功能减退、子宫病变等干扰因素。数据集按7:3划分为训练集与测试集,通过单变量逻辑回归与最小绝对收缩与选择算子(LASSO)回归筛选特征,采用合成少数类过采样技术(SMOTE)平衡训练集类别分布。构建逻辑回归(Logistic)、随机森林(RandomForest)与极端梯度提升(Xgboost)三种ML模型,经1000次Bootstrap重采样优化超参数,以AUC、准确率、灵敏度、特异度、F1值、校准曲线及决策曲线分析(DCA)评估性能,并通过SHAP解析关键预测因子及其个体化贡献。

研究结果

研究参与者

训练集(n=350)与测试集(n=150)基线特征显示,OHSS组较非OHSS组年龄更低(中位数28岁 vs 33岁,P<0.001)、不孕年限更短(P=0.029)、基础促卵泡激素(FSH)更低(P=0.003)、基础LH/FSH比值更高(P=0.001)、AMH更高(P<0.001),且扳机日雌二醇(E2)、≥14mm卵泡数、取卵数及成熟卵数均显著升高(均P<0.001)。经LASSO回归筛选,最终确定年龄、扳机日P水平、取卵数及基础LH/FSH比值为核心预测变量。

模型性能比较

随机森林模型在测试集中表现最优,AUC为0.81(95%CI:0.68-0.95),准确率为0.79,灵敏度为0.75,特异度为0.80,F1值为0.37;逻辑回归与Xgboost的AUC分别为0.78与0.77。训练集因SMOTE过采样出现性能虚高(随机森林AUC=1.00),但Bootstrap校正C-index(0.81-0.90)与测试集结果一致,证实独立验证的必要性。校准曲线显示测试集所有模型校准度均下降,但随机森林在低预测概率区间(0-25%)表现相对稳健;DCA分析表明,在OHSS高发的1%-10%风险阈值范围内,随机森林具有最优净获益。

Bootstrap特征选择稳定性分析

1000次重采样显示,取卵数稳定性最高(选择频率0.914,等级“高”),其次为基础LH/FSH比值(选择频率0.819,等级“高”),年龄为中等稳定性(选择频率0.695),扳机日P水平稳定性低(选择频率0.572),表明预测信号集中于取卵数与基础LH/FSH比值。

可解释性分析

SHAP分析证实,取卵数对OHSS风险的正向贡献最强,高龄则降低风险;扳机日P水平呈非线性关联:低P(<1.0 ng/mL)为强风险预测因子,极高P(>2.0 ng/mL)反而负向贡献。个体化瀑布图进一步揭示,低风险患者主要由高龄驱动,高风险患者则由高取卵数主导,辅以年轻、扳机日P水平升高等因素,实现了从群体到个体的风险归因。

讨论与结论

讨论部分指出,随机森林模型0.75的灵敏度意味着绝大多数OHSS患者可被识别,假阴性风险极低——这对需紧急干预的OHSS至关重要;虽特异度有限可能导致过度预警,但其临床代价远低于漏诊。SHAP解析的关键因子与病理机制吻合:取卵数直接反映卵巢过度反应与VEGF释放,年龄关联卵巢储备敏感性,扳机日P水平提示卵泡黄素化状态。研究优势在于多算法对比、SHAP解决黑箱问题及变量易获取性;局限性包括单中心回顾性设计、OHSS样本量小(仅40例)导致的校准偏差、缺乏外部验证及未衔接临床干预路径。
结论重申,该随机森林模型可利用常规临床数据有效分层ART患者取卵后OHSS风险,SHAP提供个体化风险解读,有望成为风险分层支持系统的重要组成部分,辅助识别高危患者并指导预防措施(如取消新鲜胚胎移植、添加GnRH拮抗剂、白蛋白补充等)。但研究仅为探索性成果,需通过多中心前瞻性外部验证后方可考虑临床应用,未来还需开展随机对照试验验证模型指导下的干预策略能否真正降低OHSS发生率并改善妊娠结局。
相关新闻
生物通微信公众号
微信
新浪微博
  • 搜索
  • 国际
  • 国内
  • 人物
  • 产业
  • 热点
  • 科普

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号