从开发到临床实践：部署一个可互操作且安全的基于ML的CDSS以辅助脓毒症早期检测

首页今日动态人才市场新技术专栏中国科学人云展台
BioHot
云讲堂直播会展中心特价专栏技术快讯免费试用

生物通官微
陪你抓住生命科技
跳动的脉搏

生物通首页 > 今日动态 > 正文

《International Journal of Medical Informatics》：From development to clinical practice: deployment of an interoperable and secure ML-based CDSS to aid in the early detection of sepsis

【字体：大中小】 时间：2026年06月18日 来源：International Journal of Medical Informatics 4.1

编辑推荐：

　　近期研究日益聚焦于用于早期疾病预测的机器学习（Machine Learning, ML）模型，但将这些模型整合入临床工作流的实用框架仍然有限。BIAlert是一个基于微服务的框架，设计为用于住院患者ML驱动疾病预测的实时预警系统。它可远程部署于物理或虚拟服务器

近期研究日益聚焦于用于早期疾病预测的机器学习（Machine Learning, ML）模型，但将这些模型整合入临床工作流的实用框架仍然有限。BIAlert是一个基于微服务的框架，设计为用于住院患者ML驱动疾病预测的实时预警系统。它可远程部署于物理或虚拟服务器，由通过Apache Kafka队列通信的耦合微服务组成，使用HL7 FHIR资源作为消息格式。该系统包含四个核心组件：（1）连接器（Connector），摄取原始医院数据并将其转换为标准化医疗格式；（2）写入器（Writer），将FHIR格式数据存储于内部数据库并触发预测管线；（3）预测器（Predictor），托管ML模型并生成患者特异性警报；以及（4）模型评估器（Model Evaluator），支持模型性能的前瞻性监测。警报通过BIAlert用户界面显示，也可直接整合至电子健康记录（Electronic Health Record, EHR）。BIAlert目前已在两家医院的实时临床环境中部署并运行，证明了其作为基于ML的临床决策支持（Clinical Decision Support, CDS）的可扩展且互操作解决方案的可行性。

**研究背景与问题**
脓毒症（sepsis）是一种由宿主对感染反应的失调导致的危险复杂疾病，早期干预能显著改善预后、减少并发症。然而，脓毒症临床表现异质性高，早期识别困难。尽管大量研究证明机器学习（Machine Learning, ML）模型在预测心脏骤停、呼吸窘迫及脓毒症方面具有高准确性，但仅有少数成功嵌入真实世界的临床决策支持系统（Clinical Decision Support System, CDSS）。现有系统在软件架构上面临患者隐私保护、数据标准化与互操作性（interoperability）、系统灵活性与可维护性等挑战。为此，研究人员提出了BIAlert（Big-data Intelligent Alerting）框架，旨在克服这些局限，实现ML模型在临床中的实际部署。

**研究内容与结论**
研究人员开发了基于微服务架构的BIAlert框架，作为住院患者ML驱动疾病预测的实时预警系统。该系统在西班牙两家医院（HSLL：Son Llàtzer医院，覆盖急诊科与病房；H12O：12 de Octubre医院，仅覆盖急诊科）成功部署并用于脓毒症预测，历时四个月（2025年1月1日至4月30日）。研究得出以下结论：BIAlert能够适应不同医院的电子健康记录（Electronic Health Record, EHR）系统、诊断标准（HSLL采用sepsis-2，H12O采用sepsis-3）和临床偏好（HSLL偏好高敏感性，H12O偏好高阳性预测值PPV），实现了可互操作、安全且可扩展的远程部署。前瞻性性能指标与训练结果一致，两院区均表现出良好的诊断效能（HSLL：AUC 93.65%，灵敏度84.65%，特异性90.30%，PPV 66.25%；H12O：AUC 95.51%，灵敏度70.08%，特异性96.26%，PPV 86.70%）。警报负担日均中位数分别为27次（HSLL）与31次（H12O），提示警报疲劳风险较低。从入院到首次警报的中位时间约为3小时，表明大多数脓毒症病例为社区获得性。这些发现表明BIAlert具备在异构临床环境中实现ML模型转化的潜力。

**重要意义**
该研究发表于《International Journal of Medical Informatics》。BIAlert不仅验证了微服务架构在CDSS中的可行性，还通过远程部署保护患者隐私、采用医疗标准（SNOMED CT、LOINC、ATC、HL7 FHIR）实现互操作性、高度参数化适应不同临床流程，为ML驱动的CDSS从理论走向临床实践提供了实用框架。

**主要关键技术方法**
BIAlert采用微服务架构，核心组件包括：连接器（Connector）读取原始医院数据并转换为标准化格式；写入器（Writer）存储FHIR格式数据至内部关系数据库并触发预测；预测器（Predictor）托管基于梯度提升集成（Gradient Boosting ensemble）的ML模型，预测24小时内脓毒症风险；模型评估器（Model Evaluator）利用事后诊断数据前瞻性监测模型性能。系统组件通过Apache Kafka消息队列通信，使用HL7 FHIR资源作为消息格式。远程部署通过虚拟专用网络（VPN）进行，利用ArgoCD实现自动更新，并通过Prometheus和Grafana持续监控运营与性能指标。ML模型特征来源于68个结构化EHR变量，动态生成72小时数据窗口。样本队列来源：HSLL（Son Llàtzer医院，参考人口约27万）与H12O（12 de Octubre医院，参考人口约45万）。训练数据分别为19,045个标记数据点（HSLL，10,928名患者）和20,459个标记数据点（H12O，7,159名患者）。

**研究结果**
**3.1 临床人群（Clinical population）**
研究期间，HSLL处理17,214名患者，其中约19%产生警报；H12O急诊科处理54,159名患者，约7%产生警报。警报患者中，男性比例更高（HSLL：49%，H12O：46%），且年龄大于平均住院患者（HSLL平均63岁，H12O平均68岁）。HSLL中约80%首次警报发生在急诊科。这些结果基于对工具处理患者的临床特征统计分析得出。

**3.2 运营性能（Operational performance）**
HSLL接收约174万条观察数据，生成343,293次预测；H12O接收约170万条观察数据，生成253,867次预测。观察定义为EHR中任何带时间戳的结构化临床条目（如生命体征、实验室结果、药物处方等）。该结果通过统计工具接收和处理的数据量得出，显示系统能高效处理大规模临床数据。

**3.3 警报动态（Alert dynamics）**
阳性预测（警报）占HSLL总预测的19.8%，H12O占11.8%。每日新警报中位数HSLL为27次，H12O为31次。从入院到首次警报的中位时间在两家医院急诊科均约为3小时；HSLL病房中位数延长至32小时。HSLL中，急诊科阳性预测中约11%是新警报，而病房仅3%为新警报。该结果通过对预测记录和警报时间戳分析得出，反映了不同院区和科室的警报产生模式。

**3.4 脓毒症模型性能（Sepsis model performance）**
模型评估器标记了HSLL的87,905次预测（约26%）和H12O的20,289次预测（约8%）。前瞻性性能指标：HSLL模型AUC为93.65%，灵敏度84.65%，特异性90.30%，PPV 66.25%；H12O模型AUC为95.51%，灵敏度70.08%，特异性96.26%，PPV 86.70%。HSLL中急诊科与病房的性能无显著差异（急诊科AUC 96.19%，病房AUC 92.50%）。该结果通过对比标记预测与实际诊断标签（基于sepsis-2或sepsis-3标准）计算得出，表明模型在真实环境中保持良好的预测能力。

**讨论与结论**
讨论部分指出，两家医院不同的偏好（HSLL高灵敏度、H12O高PPV）通过各自训练的本地模型得以实现，且两院区警报负担均较低，警报疲劳风险低。急诊科快速生成首次警报（约1小时）支持大多数脓毒症为社区获得性的观点。同时，研究承认局限性：并非所有预测均被标记（部分因脓毒症诊断主观性），可能导致指标偏高；且临床影响分析（HSLL单中心回顾性前后对比显示ICU入住率从34.4%降至30.4%，ICU住院天数减少0.35天，病房住院天数减少0.59天）仍需多中心验证。未来工作将实现在线模型训练以避免初始数据导出。

**研究结论部分翻译**：
结论，本文提出了一种用于疾病预测的架构，该架构超越了回顾性研究，能够在异构临床环境中实现真实世界部署。该系统已成功部署并前瞻性评估，证明了其对多样化EHR系统和操作协议的适应性，同时保护了敏感健康信息。通过强调灵活定制、互操作性和数据安全，机器学习可以被有效转化为辅助日常临床实践的临床决策支持系统。

联系信箱：

粤ICP备09063491号

热点排行