《Biomedicines》:Machine Learning-Driven Prediction of Low BMD in Postmenopausal Women Using Cytokine, RANKL/OPG, and Oxidative Stress Biomarker Signatures: An Exploratory Study
编辑推荐:
目的:评估伴有不同骨密度(Bone Mineral Density, BMD)的绝经后妇女的细胞因子、核因子κB受体活化因子配体(Receptor Activator of Nuclear Factor kappa-B Ligand, RANKL)/骨保护素(
目的:评估伴有不同骨密度(Bone Mineral Density, BMD)的绝经后妇女的细胞因子、核因子κB受体活化因子配体(Receptor Activator of Nuclear Factor kappa-B Ligand, RANKL)/骨保护素(Osteoprotegerin, OPG)及氧化应激生物标志物谱,并应用机器学习(Machine Learning, ML)模型早期识别低BMD。材料与方法:根据ISCD/WHO标准将71名绝经后妇女分为正常BMD(N)、骨量减少(Osteopenia, OSN)或骨质疏松(Osteoporosis, OSR)组。定量检测10种细胞因子、RANKL、OPG及5种氧化应激标志物。采用非参数统计和秩双列相关(rank-biserial correlation)评估组间差异。在PyCaret自动化机器学习框架内开发ML分类器,采用重复分层交叉验证评估区分N vs. 低BMD(L = OSN + OSR)及OSN vs. OSR的能力(使用仅细胞因子、骨/氧化及整合生物标志物组合),并利用SHAP(SHapley Additive exPlanations)解释特征贡献。结果:低BMD与促骨吸收细胞因子(TNF-α, IL-6, IL-12)升高及抗骨吸收细胞因子(IL-4, IL-10, IL-23)降低相关。OPG及抗氧化酶(过氧化氢酶Catalase, 线粒体超氧化物歧化酶SOD2, 过氧化物还原酶2 PRX2)在L组中显著较低。效应量分析证实IL-4、IL-10、IL-23和OPG与正常BMD强相关,IL-6、IL-12p70和TNF-α与低BMD强相关。整合细胞因子与OPG及SOD2的逻辑回归模型取得最佳N vs. L性能(平均F1 ≈ 0.90, SD = 0.09)。生物标志物区分OSN与OSR的能力有限(最大F1 ≈ 0.70, SD = 0.18)。结论:整合细胞因子、骨调节及氧化应激标志物可增强基于ML的低BMD预测,支持改善早期骨质疏松风险分层。
论文解读:基于细胞因子、RANKL/OPG及氧化应激生物标志物特征应用机器学习预测绝经后妇女低骨密度
该研究发表于《Biomedicines》。骨质疏松是全球绝经后妇女面临的主要健康威胁,其特征为骨量减低及微结构退化导致骨折风险增加。目前诊断金标准为双能X线吸收测定法(Dual-energy X-ray Absorptiometry, DEXA),但其存在费用高、普及度有限且无法反映疾病生物学机制等局限。骨重塑受免疫(细胞因子)、骨代谢(RANKL/OPG轴)及氧化应激(Oxidative Stress, OS)多重通路交互调控,既往预测模型多依赖单一维度输入,缺乏对上述病理生理网络的多维整合。研究人员旨在探讨整合炎症、骨调节及氧化应激标志物的血清学特征,并利用机器学习(Machine Learning, ML)建立模型以区分正常与低骨密度(Bone Mineral Density, BMD)状态,弥补传统单域预测的不足。研究结果显示,低BMD伴随特征性的"促炎上调/抗炎及抗氧化下调"模式;整合多域生物标志物(细胞因子+OPG+SOD2)的逻辑回归模型对鉴别正常与低BMD表现出优异性能(平均F1 ≈ 0.90),但该组合无法有效区分骨量减少与骨质疏松。此研究为开发基于血液生化的早期骨质疏松风险分层工具提供了生物学依据与初步数据支持。
主要技术方法
研究人员纳入科威特Mubarak Al Kabeer医院物理医学科招募的71名绝经后妇女(自然停经≥12个月,排除激素、严重系统性疾病等),按腰椎/髋部DEXA测得的T值分为正常BMD(N, n=25)、骨量减少(OSN, n=31)及骨质疏松(OSR, n=15),并将后两者合并为低BMD组(L, n=46)。采集外周血分离有丝分裂原刺激的外周血单核细胞(Peripheral Blood Mononuclear Cell, PBMC)上清及血清,通过Luminex多重酶联免疫吸附测定(Enzyme-Linked Immunosorbent Assay, ELISA)定量10种细胞因子(促骨吸收:TNF-α, IL-6, IL-12, IL-17, IL-20;抗骨吸收:IFN-γ, IL-4, IL-10, IL-13, IL-23)、RANKL、OPG及5种氧化应激标志物(Catalase, PRX2, SOD1, SOD2, TRX1)。数据预处理包括 undetectable值以检测限替代、缺失值中位数填补、对数转换及Z-score标准化。采用Mann-Whitney U检验与秩双列相关(rank-biserial correlation, rrb)进行组间差异与效应量分析。在PyCaret框架内对比多种分类算法,通过重复分层5折交叉验证(30次重复,共150轮)评估仅细胞因子、仅骨/氧化指标及整合面板对N vs. L和OSN vs. OSR的分类性能,采用反向消除法筛选最优特征子集,并对最佳模型进行SHAP(SHapley Additive exPlanations)值解释分析。
研究结果
3.1. Participant Characteristics(受试者特征)
通过基线数据分析发现低BMD组年龄略高于正常BMD组(p = 0.03),N、OSN、OSR三组间髋部与脊柱BMD及T值呈阶梯递减;BMI及绝经年限无组间显著差异。年龄未纳入ML建模以单独评估生化标志物的判别力。
3.2. Comparative Analysis of Cytokines, Bone Remodeling, and Oxidative Stress Markers Across Study Groups(各组细胞因子、骨重塑及氧化应激标志物比较)
3.2.1 Cytokine Profiles(细胞因子谱):低BMD组促骨吸收细胞因子TNF-α(p < 0.021)、IL-6(p < 0.01)、IL-12(p < 0.013)显著升高;抗骨吸收细胞因子IL-4(p < 0.004)、IL-10(p < 0.027)、IL-23(p < 0.029)显著降低;OSN与OSR间无差异。
3.2.2 Bone Remodeling Markers(骨重塑标志物):RANKL组间无差异;OPG在正常BMD组显著高于低BMD组(p < 0.006);OSN与OSR间无差异。
3.2.3 Oxidative Stress Markers(氧化应激标志物):低BMD组抗氧化酶Catalase(p = 0.024)、SOD2(p = 0.009)、PRX2(p = 0.011)水平显著低于正常BMD组;SOD1与TRX1无组间差异;OSN与OSR间无差异。
3.3. Effect Size Analysis(效应量分析)
计算秩双列相关rrb显示IL-4(rrb= 0.42)、OPG(rrb= 0.40)、IL-10(rrb= 0.32)、IL-23(rrb= 0.32)与正常BMD呈最强正相关;IL-6(rrb= –0.37)、IL-12p70(rrb= –0.36)、TNF-α(rrb= –0.33)与低BMD呈最强负相关,验证了上述单变量统计结论。
3.4. Machine Learning Classification Performance(机器学习分类性能)
3.4.1 Prediction of Normal vs. Low BMD(正常 vs. 低BMD预测):仅用10种细胞因子时逻辑回归最优(F1 = 0.81);筛选至5种细胞因子(TNF-α, IL-10, IL-6, IL-4, IL-23)F1提升至0.83。仅用骨+氧化指标时梯度提升(Gradient Boosting Classifier)最优(F1 = 0.74),筛选至OPG、SOD1、SOD2、PRX2后逻辑回归F1 = 0.77。整合精简细胞因子亚组联合OPG与SOD2的逻辑回归模型取得最高性能——平均F1 = 0.90(SD = 0.09),AUC = 0.93(SD = 0.08)。SHAP分析表明IL-23、IL-6、IL-4为最重要预测特征;低IL-23/IL-4/OPG/IL-10/SOD2和高IL-6/TNF-α推动低BMD类别预测。
3.4.2 Prediction of Osteopenia vs. Osteoporosis(骨量减少 vs. 骨质疏松预测):所有特征集表现均有限,最优朴素贝叶斯模型(特征IL-4, IFN-γ, SOD2, TRX1)F1仅约0.70(SD = 0.18),且常将OSR误判为OSN,提示两阶段生物标志物重叠大、区分度低。
讨论与结论总结
讨论指出,本研究证实了绝经后低BMD者存在向慢性促骨吸收免疫环境偏移(促炎因子↑、抗炎因子↓)及抗氧化防御减弱,OPG降低反映RANKL/OPG轴失衡,氧化应激标志物耗竭支持活性氧(Reactive Oxygen Species, ROS)参与骨脆化。整合多域标志物较单域显著提升分类效能,印证了骨质疏松免疫-代谢-骨骼交互的多因素本质。骨量减少与骨质疏松间生物标志物谱相似且趋于平台期,故该面板更适用于筛查"是否存在低BMD"而非区分疾病严重程度。研究局限性包括样本量小、未进行嵌套交叉验证可能致性能乐观偏倚、横断面设计无法推断因果、细胞因子取自刺激后PBMC上清而其余为血清、缺乏外部独立队列验证,需在更大前瞻多中心人群中确认。
结论部分翻译:本研究表明,整合细胞因子、骨调节及氧化应激标志物可为绝经后妇女低骨密度提供稳健的生物标志物特征。利用该多域组合——特别是IL-10、IL-23、IL-4、TNF-α、IL-6、OPG及SOD2——训练的机器学习模型可高精度区分正常与低BMD,凸显了生物学知情的特征整合价值。相反,骨量减少与骨质疏松显示有限的生物标志物可分性,反映其生物学重叠及区分相邻阶段的挑战,提示该生物标志物组合更适合作为判定低BMD整体状态的工具而非评估疾病严重度的手段。该发现突显了ML驱动的生物标志物分析在支持骨质疏松早期检出与个体化风险分层中的潜力,尤适用于DEXA获取受限场景。需在更大独立纵向队列中验证以推进临床转化。