《BJPsych Open》:Feasibility of diagnosing major depressive disorder with a panel of serum and urine biomarkers
编辑推荐:
已有多项生物标志物被确认与抑郁症的病理生理学机制相关,其具备通过机器学习技术应用于抑郁症客观化实验室诊断的潜力。本研究旨在既往研究基础上,通过更大规模且更具异质性的队列,对在前期研究中显示出抑郁症预测价值的尿液和血清生物标志物的联合诊断效度进行建模。研究人员开
已有多项生物标志物被确认与抑郁症的病理生理学机制相关,其具备通过机器学习技术应用于抑郁症客观化实验室诊断的潜力。本研究旨在既往研究基础上,通过更大规模且更具异质性的队列,对在前期研究中显示出抑郁症预测价值的尿液和血清生物标志物的联合诊断效度进行建模。研究人员开发了一种新型多变量机器学习诊断工具,在160例重性抑郁障碍(MDD)患者和120例健康对照者中,对34种尿液和血清生物标志物组合进行检测,受试者被分为3个不同队列。研究应用分位数预测法构建生物标志物诊断模型(BDM),为每种生物标志物赋予评分。以每位受试者的总分计算受试者工作特征曲线下面积(AUC),作为判别能力的评估指标。研究结果表明,经内部验证后BDM具有良好的判别能力,AUC为0.81。进一步通过内部-外部验证,计算各独立队列的个体抑郁概率评分,所得AUC介于0.62至0.72之间。就临床应用而言,本研究表明生物标志物组合与机器学习模型相结合,能够以适度的诊断准确率区分MDD患者与健康对照。生物标志物检测未来有望为诊断工具箱增添价值,但尚需进一步研究。
重性抑郁障碍(MDD)是全球范围内导致残疾的最主要原因之一,估计终生患病率约为15%。目前,MDD的诊断属于综合征诊断,基于患者主观体验的症状组合及功能损害,通过(半)结构化临床访谈结合临床评估进行记录,并按照ICD或DSM标准进行分类。然而,MDD症状与其他精神及躯体疾病存在显著重叠,使得准确鉴别诊断面临挑战。及时诊断MDD至关重要,因为诊断延迟意味着患者更晚获得 adequate 治疗、预后更差、疾病负担加重以及医疗成本增高。在由全科医生(GP)及其心理健康护士充当"守门人"的医疗体系中,他们负责识别和诊断MDD并采取初步治疗措施,若治疗不成功则将患者转诊至专科医疗。尽管GP诊断的总体特异性尚可(Meta分析特异性为81.3%),但仅约半数抑郁症患者被GP识别(加权敏感性50.1%)。这意味着相当数量的MDD患者因在初级医疗中未被识别而未能获得早期治疗。虽然自我报告问卷的使用及增强GP识别抑郁症状的信心能够改善MDD识别率,但由于MDD的异质性特质,病例仍可能被遗漏。基于此,有研究者提出,在现有诊断手段中增加基于MDD相关生物通路生物标志物的客观化实验室检测,可能提升MDD的识别率。单一生物标志物因参与多种精神疾病而不适用于诊断,因此研究者致力于组合多种生物标志物以提高判别能力和诊断价值。然而,即便将生物标志物组合成 panel,健康与疾病状态下生物标志物的分布特征以及个体患者特征等因素仍可能影响基于生物标志物诊断检测的准确性。
在此背景下,研究人员在更大规模、更具异质性的队列中,对既往研究中显示抑郁症预测价值的尿液和血清生物标志物的联合诊断效度进行建模。具体而言,研究人员采用机器学习方法开发并进行了内部验证及内部-外部验证的多变量生物标志物诊断模型(BDM),可用于计算个体抑郁概率评分。
该研究共纳入来自MOTAR(抗抑郁药或运动情绪治疗)、tPEMF(靶向脉冲电磁场)以及PIDON/Vilnius三个队列的160例MDD患者和120例健康对照。研究人员依据TRIPOD+AI(预测模型个体预后或诊断透明报告+人工智能)指南开展数据分析,主要包含三个步骤:第一步为表征研究人群特征(包括按MDD状态划分的生物标志物水平)并评估检测性能(通过相对变异指数RVI);第二步为使用全部队列数据开发模型,采用分位数预测(QBP)这一机器学习方法进行二元疾病分类,该方法不使用预测变量的均值差异,而是依据生物标志物分布左右尾部中病例与对照出现偏移的特定百分位数赋予评分(-3至+3分),非相关生物标志物自动赋分为0,以BDM总分作为判别指标;第三步为通过内部-外部交叉验证(以队列作为分割单位)评估模型过拟合及性能变异,同时采用10×5折交叉验证进行内部验证,并通过逻辑回归模型评估性别交互作用。
研究结果显示,在第一步中,34种生物标志物中13种(7种血清、6种尿液)的均值在MDD与对照组间存在显著差异,11种生物标志物的方差存在显著差异。活性钙卫蛋白、乙酰-L-肉碱、髓过氧化物酶等在MDD患者中水平升高,而环磷酸腺苷(cAMP)、血栓烷、脑源性神经营养因子(BDNF)等水平降低。四种检测(血清zonulin、α1-抗胰蛋白酶、BDNF、乙酰-L-肉碱)未达到RVI可接受标准。在第二步模型开发中,经优化后24种生物标志物主动贡献于模型,AUC为0.82(P<0.001);进一步选择优势尾部后,生物标志物减至19种,AUC提升至0.85(95% CI:0.81-0.90,敏感性80.6%,特异性73.8%)。在第三步内部-外部验证中,各队列模型一致将贡献生物标志物减至13种,MOTAR队列AUC为0.623,tPEMF队列为0.670,PIDON/Vilnius队列为0.721。补充分析显示,10×5折交叉验证训练集AUC为0.85,测试集AUC为0.81,提示存在中度过拟合;BDM总分比值比为1.60(P<0.001),但未发现性别交互作用(比值比1.2,P=0.2)。
在讨论部分,研究人员指出,该研究建立的生物标志物组合具有区分MDD与健康对照的潜力,内部验证提示中度过拟合,而内部-外部交叉验证显示队列间性能异质性显著,泛化能力有限,AUC降至0.623-0.721,故当前模型性能最佳描述为"适度"。与van Buel等先前研究(AUC=0.96)相比,本研究AUC较低,可能原因在于后者未应用收缩或其他校正过拟合的方法,且本研究队列更为异质。值得注意的是,van Buel等研究中的11种生物标志物在本研究中仍显著贡献,提示这些生物标志物覆盖了MDD的异质性,是进一步开发的良好候选。性别未显示交互效应,但针对性别特异性开发模型可能提升性能。
研究亦存在若干局限:队列构成和代表性影响生物标志物 panel 的泛化能力;年龄、用药、种族等混杂因素未纳入模型;共用对照池降低了队列独立性;病例-对照设计可能导致选择偏倚;ELISA检测虽灵敏但易受生物学变异和检测变异影响。就临床应用而言,当前BDM诊断准确率已超过GP基于现有文献的诊断水平,但要实现临床价值,理想情况下还需证明其相比PHQ-9等量表筛查工具具有附加价值。未来研究应进行真实外部验证,"冻结"纳入标准后进一步开发抑郁症分型及治疗监测功能。
研究结论为:本研究表明,基于血清和尿液生物标志物 panel 联合机器学习模型诊断MDD具有可行性,能够以适度诊断准确率区分MDD患者与健康对照,为未来诊断工具箱增添了潜在价值,但距离临床应用仍需广泛的外部验证和精细调整。所呈现的模型应视为后续研究的初步基础,后续研究应包括外部验证以及在实际应用中的影响与可行性评估。