《Journal of Multidisciplinary Healthcare》:Predictive Value of Combined MEWS and NIPDS Scores for 24-Hour Clinical Deterioration in Emergency Observation Patients: A Prospective Cohort Study
编辑推荐:
目的:探讨改良早期预警评分(Modified Early Warning Score, MEWS)联合护士直觉患者恶化量表(Nurse Intuition Patient Deterioration Scale, NIPDS)对急诊观察(Emergency O
目的:探讨改良早期预警评分(Modified Early Warning Score, MEWS)联合护士直觉患者恶化量表(Nurse Intuition Patient Deterioration Scale, NIPDS)对急诊观察(Emergency Observation Unit, EOU)患者24小时内临床恶化的预测价值。患者与方法:这项单中心前瞻性队列研究于2025年5月至12月期间在南京一家三级医院纳入2,415例急诊观察患者。患者在入院后0、2、4、8、16和24小时接受MEWS和NIPDS序列评估。主要结局为24小时内非计划转入抢救室或重症监护病房(Intensive Care Unit, ICU)或死亡。采用受试者工作特征(Receiver Operating Characteristic, ROC)曲线分析评估MEWS单独及联合评分对24小时恶化的预测价值。结果:在2,415例患者中,287例(11.9%)在24小时内发生非计划转入抢救室或ICU或死亡。联合评分较MEWS单独显示出显著更优的预测性能(AUC=0.859 vs 0.688, P<0.001),并改善了总体风险再分类(净重新分类改善指数NRI=0.309, 95% CI: 0.245–0.373),尽管事件特异性再分类改善幅度有限且未达统计学显著性(NRI=0.056, 95% CI: ?0.011 to 0.123; P=0.103)。校准度良好(Hosmer–Lemeshow P = 0.287),决策曲线分析显示在5%–40%阈值范围内具有更高的净获益。Bootstrap验证确认了模型稳定性(乐观度=0.0008)。结论:MEWS与NIPDS联合评分较单独MEWS改善了总体风险分层; However,临床实施应考虑其增量再分类价值主要由对未恶化患者的正确降级所驱动,同时对实际恶化患者保持可比的灵敏度。
急诊观察单元(Emergency Observation Unit, EOU)作为急性快速评估与确定性住院治疗之间的关键桥梁,承担着识别潜在恶化风险患者的重要职能。该单元收治的患者常表现为诊断不明、临床表现隐匿的特点,其病情进展往往呈现为生理参数进行性异常、血流动力学不稳定以及主观症状与客观体征的渐进性改变。然而,由于EOU患者周转迅速、监护资源有限,医护人员及时识别这一动态过程面临重大挑战。现有研究报道,因未能识别病情恶化而导致的延迟治疗发生率高达59.4%。尽管改良早期预警评分(MEWS)通过量化生命体征降低了漏诊风险,但其固有的阈值依赖性局限可能在生理代偿期造成诊断盲区;大规模验证研究已量化了这一性能瓶颈——在超过360,000例患者中,MEWS的AUC仅为0.757。近期研究进一步证实,将护士直觉患者恶化量表(NIPDS)与国家早期预警评分(NEWS)整合可显著提升预测性能。在这一背景下,研究人员开展了一项单中心前瞻性队列研究,旨在评估MEWS联合NIPDS对EOU患者24小时临床恶化的动态预测价值,为早期识别与干预提供循证依据。该研究发表于《Journal of Multidisciplinary Healthcare》。
研究采用的技术方法主要包括:基于南京一家三级甲等医院EOU的2,415例观察患者的前瞻性队列设计;在入院后0、2、4、8、16和24小时六个预设时间点进行MEWS与NIPDS的同步序列评估;以非计划转入抢救室或ICU或死亡作为主要结局指标;运用ROC曲线分析评估判别效能,DeLong检验比较AUC差异;采用Hosmer-Lemeshow拟合优度检验评估校准度;通过净重新分类改善指数(NRI)和综合判别改善指数(IDI)量化增量预测价值;运用决策曲线分析(DCA)评价临床效用;并采用500次Bootstrap重抽样进行内部验证。
**基线特征与联合评分构建**
研究共纳入2,415例患者,平均年龄57.53岁(标准差18.47),女性占43.2%。287例(11.9%)发生主要结局,包括207例非计划转入抢救室、79例非计划转入ICU和1例死亡。事件组患者年龄显著更大(P = 0.029),初始MEWS、NIPDS及联合评分均显著更高(均P < 0.001)。在相互调整的二元logistic回归模型中,MEWS(OR = 1.384, 95% CI: 1.248–1.535)和NIPDS(OR = 1.884, 95% CI: 1.749–2.029)均为独立预测因子(均P < 0.001)。据此构建联合评分公式:联合评分 = 0.3249 × MEWS + 0.6333 × NIPDS。
**预测性能比较**
联合评分较MEWS单独显示出显著更优的预测性能(AUC: 0.859 vs. 0.688, P < 0.001),AUC改善幅度为0.171(95% CI: 0.137–0.205)。ROC曲线直观显示联合评分在整个阈值范围内均优于MEWS单独。
**评分校准度**
Hosmer-Lemeshow检验显示联合评分校准度良好(χ
2 = 8.55, P = 0.287),而MEWS单独校准度较差(χ
2 = 50.70, P < 0.001)。校准曲线表明联合评分的预测概率与实际观测概率一致性更佳。
**临床应用价值**
联合评分显著改善了风险再分类,NRI为0.309(95% CI: 0.245–0.373, P < 0.001),IDI为0.230(95% CI: 0.195–0.265, P < 0.001)。值得注意的是,NRI在未发生主要结局患者中显著更高(0.253),而在发生主要结局患者中仅为0.056。决策曲线分析显示联合评分在整个阈值概率范围(0%–100%)内均较MEWS单独提供更大净获益,尤其在临床关键区间5%–40%内优势最为明显,净获益差值为0.02至0.05。
**预测价值的时间动态变化**
联合评分在多数时间点均优于MEWS单独。具体而言,0小时联合评分AUC达0.859(95% CI: 0.840–0.877),而MEWS单独为0.688(95% CI: 0.660–0.716)。然而,8小时时两者性能趋于相当,MEWS单独数值上略高(0.900 vs. 0.895; ΔAUC = ?0.005),该微小差异可能反映置信区间重叠及动态病例构成的影响。24小时估计值(AUC = 0.988)基于1,046例患者中仅7例事件,估计高度不稳定,需谨慎解读。
**联合评分的内部验证**
Bootstrap验证(n = 500)显示乐观度极低(0.0008),乐观校正后AUC为0.858(95% CI: 0.833–0.884),表明模型具有优良的稳定性和内部可重复性。
讨论部分,研究人员首先将本研究结果与既往文献进行了对比分析。Edelson等在超过360,000例患者中报告MEWS的AUC仅为0.757,Golsheikhi等在COVID-19急诊患者中观察到灵敏度仅61.4%(AUC 0.729),提示MEWS在急性呼吸道疾病中灵敏度不足。Haegdorens等将NIPDS从普通病房扩展至EOU的研究背景与本研究呼应,但本研究中联合评分的灵敏度(0.791)和特异度(0.778)低于其在普通病房的研究结果,可能反映了EOU患者周转更快、病情进展更隐匿的特点。Ma等报道NIPDS单独在急诊环境中AUC仅0.753,显著低于本研究联合评分的0.859,提示在高周转急诊环境中单纯依赖护士直觉预测效能有限,需整合客观生理指标。
研究人员运用Endsley情境意识模型(层级1:感知)解释了这种动态互补性:NIPDS通过捕捉细微行为变化在早期预警中发挥作用,补偿MEWS在生理指标代偿期内的假阴性;而一旦明确出现生理失代偿,MEWS通过定量评估迅速恢复灵敏度。这种时间不对称的协同效应——NIPDS在代偿前期(0–4小时)贡献最大、MEWS在生理崩溃确立后重新凸显——应指导临床评估时机选择。8小时时MEWS单独数值略高的现象,鉴于置信区间重叠和动态病例构成,不能解释为真正的性能逆转。
NRI为0.309提示整体风险分类净改善30.9个百分点,但事件特异性NRI有限(0.056, 95% CI: ?0.011 to 0.123; P = 0.103)且未达统计学显著性,表明净改善主要由对未恶化患者的正确降级(NRI
非事件 = 0.253)所驱动。这一幅度与Haegdorens等在比利时的队列研究结果一致。Chen等在中国住院患者中验证NIPDS单独AUC达0.907(截断值4),显著高于本研究急诊人群,提示NIPDS预测效能可能具有场景依赖性——在相对稳定的住院病房中护士有更多时间观察患者行为模式,而在高周转EOU环境中量表灵敏度可能相对降低。
研究亦存在若干局限性:其一,机构MEWS方案规定仅MEWS ≥4或单项≥3的患者于2小时复评,导致该时间点评估率仅9.6%(n=232),这种选择机制可能引入偏倚并限制了对低危患者代偿期性能的泛化;其二,24小时AUC估计基于仅7例事件,样本量过小导致估计不稳定;其三,作为单中心观察性研究,所有患者接受双评分评估但无实际临床决策干预,统计学优效性是否转化为改善结局(如降低非计划ICU入院或死亡率)尚待多中心前瞻性干预性阶梯楔形群随机试验验证;其四,虽事件-变量比(143.5)远超推荐阈值10,提示模型稳定性及低过拟合风险,但未进行正式的先验样本量计算;其五,虽NIPDS评估者为具有5–10年急诊工作经验的床旁护士且评定者间信度良好(ICC = 0.854),但未按专业经验或临床工作年限进行分层分析,而直觉模式识别本身具有专家依赖性,这一未测量的变异来源可能影响NIPDS性能。
**研究结论**
该研究证实,将NIPDS与MEWS整合显著提升了急诊观察患者非计划转入抢救室/ICU或死亡的预测准确性。联合评分系统展现出稳健的判别能力、良好的校准度和潜在的临床应用价值,尽管性能随评估时间点变化且24小时估计仅基于7例事件。虽然总体风险再分类得到改善(NRI=0.309),但有限的事件特异性NRI(0.056, P=0.103)提示增量价值主要由对未恶化患者的正确降级所驱动;因此,临床实施应考虑这种不对称的再分类模式。然而,作为无干预验证的单中心观察性研究,这些发现应谨慎推广,且方案驱动的2小时90.4%患者未再评估及24小时极小事件数(n=7)代表额外的方法论局限。未来研究应优先在多中心多样本人群中进行外部验证,以阐明联合评分对不同严重程度结局的差异化预测价值。此外,开发整合电子健康记录的自动化计算工具对于减轻护理文书负担、促进该评分系统的无缝临床转化至关重要。