《International Journal of Medical Informatics》:From development to clinical practice: deployment of an interoperable and secure ML-based CDSS to aid in the early detection of sepsis
编辑推荐:
近期研究日益聚焦于用于早期疾病预测的机器学习(Machine Learning, ML)模型,但将这些模型整合入临床工作流的实用框架仍然有限。BIAlert是一个基于微服务的框架,设计为用于住院患者ML驱动疾病预测的实时预警系统。它可远程部署于物理或虚拟服务器
近期研究日益聚焦于用于早期疾病预测的机器学习(Machine Learning, ML)模型,但将这些模型整合入临床工作流的实用框架仍然有限。BIAlert是一个基于微服务的框架,设计为用于住院患者ML驱动疾病预测的实时预警系统。它可远程部署于物理或虚拟服务器,由通过Apache Kafka队列通信的耦合微服务组成,使用HL7 FHIR资源作为消息格式。该系统包含四个核心组件:(1)连接器(Connector),摄取原始医院数据并将其转换为标准化医疗格式;(2)写入器(Writer),将FHIR格式数据存储于内部数据库并触发预测管线;(3)预测器(Predictor),托管ML模型并生成患者特异性警报;以及(4)模型评估器(Model Evaluator),支持模型性能的前瞻性监测。警报通过BIAlert用户界面显示,也可直接整合至电子健康记录(Electronic Health Record, EHR)。BIAlert目前已在两家医院的实时临床环境中部署并运行,证明了其作为基于ML的临床决策支持(Clinical Decision Support, CDS)的可扩展且互操作解决方案的可行性。
**研究背景与问题**
脓毒症(sepsis)是一种由宿主对感染反应的失调导致的危险复杂疾病,早期干预能显著改善预后、减少并发症。然而,脓毒症临床表现异质性高,早期识别困难。尽管大量研究证明机器学习(Machine Learning, ML)模型在预测心脏骤停、呼吸窘迫及脓毒症方面具有高准确性,但仅有少数成功嵌入真实世界的临床决策支持系统(Clinical Decision Support System, CDSS)。现有系统在软件架构上面临患者隐私保护、数据标准化与互操作性(interoperability)、系统灵活性与可维护性等挑战。为此,研究人员提出了BIAlert(Big-data Intelligent Alerting)框架,旨在克服这些局限,实现ML模型在临床中的实际部署。
**研究内容与结论**
研究人员开发了基于微服务架构的BIAlert框架,作为住院患者ML驱动疾病预测的实时预警系统。该系统在西班牙两家医院(HSLL:Son Llàtzer医院,覆盖急诊科与病房;H12O:12 de Octubre医院,仅覆盖急诊科)成功部署并用于脓毒症预测,历时四个月(2025年1月1日至4月30日)。研究得出以下结论:BIAlert能够适应不同医院的电子健康记录(Electronic Health Record, EHR)系统、诊断标准(HSLL采用sepsis-2,H12O采用sepsis-3)和临床偏好(HSLL偏好高敏感性,H12O偏好高阳性预测值PPV),实现了可互操作、安全且可扩展的远程部署。前瞻性性能指标与训练结果一致,两院区均表现出良好的诊断效能(HSLL:AUC 93.65%,灵敏度84.65%,特异性90.30%,PPV 66.25%;H12O:AUC 95.51%,灵敏度70.08%,特异性96.26%,PPV 86.70%)。警报负担日均中位数分别为27次(HSLL)与31次(H12O),提示警报疲劳风险较低。从入院到首次警报的中位时间约为3小时,表明大多数脓毒症病例为社区获得性。这些发现表明BIAlert具备在异构临床环境中实现ML模型转化的潜力。
**重要意义**
该研究发表于《International Journal of Medical Informatics》。BIAlert不仅验证了微服务架构在CDSS中的可行性,还通过远程部署保护患者隐私、采用医疗标准(SNOMED CT、LOINC、ATC、HL7 FHIR)实现互操作性、高度参数化适应不同临床流程,为ML驱动的CDSS从理论走向临床实践提供了实用框架。
**主要关键技术方法**
BIAlert采用微服务架构,核心组件包括:连接器(Connector)读取原始医院数据并转换为标准化格式;写入器(Writer)存储FHIR格式数据至内部关系数据库并触发预测;预测器(Predictor)托管基于梯度提升集成(Gradient Boosting ensemble)的ML模型,预测24小时内脓毒症风险;模型评估器(Model Evaluator)利用事后诊断数据前瞻性监测模型性能。系统组件通过Apache Kafka消息队列通信,使用HL7 FHIR资源作为消息格式。远程部署通过虚拟专用网络(VPN)进行,利用ArgoCD实现自动更新,并通过Prometheus和Grafana持续监控运营与性能指标。ML模型特征来源于68个结构化EHR变量,动态生成72小时数据窗口。样本队列来源:HSLL(Son Llàtzer医院,参考人口约27万)与H12O(12 de Octubre医院,参考人口约45万)。训练数据分别为19,045个标记数据点(HSLL,10,928名患者)和20,459个标记数据点(H12O,7,159名患者)。
**研究结果**
**3.1 临床人群(Clinical population)**
研究期间,HSLL处理17,214名患者,其中约19%产生警报;H12O急诊科处理54,159名患者,约7%产生警报。警报患者中,男性比例更高(HSLL:49%,H12O:46%),且年龄大于平均住院患者(HSLL平均63岁,H12O平均68岁)。HSLL中约80%首次警报发生在急诊科。这些结果基于对工具处理患者的临床特征统计分析得出。
**3.2 运营性能(Operational performance)**
HSLL接收约174万条观察数据,生成343,293次预测;H12O接收约170万条观察数据,生成253,867次预测。观察定义为EHR中任何带时间戳的结构化临床条目(如生命体征、实验室结果、药物处方等)。该结果通过统计工具接收和处理的数据量得出,显示系统能高效处理大规模临床数据。
**3.3 警报动态(Alert dynamics)**
阳性预测(警报)占HSLL总预测的19.8%,H12O占11.8%。每日新警报中位数HSLL为27次,H12O为31次。从入院到首次警报的中位时间在两家医院急诊科均约为3小时;HSLL病房中位数延长至32小时。HSLL中,急诊科阳性预测中约11%是新警报,而病房仅3%为新警报。该结果通过对预测记录和警报时间戳分析得出,反映了不同院区和科室的警报产生模式。
**3.4 脓毒症模型性能(Sepsis model performance)**
模型评估器标记了HSLL的87,905次预测(约26%)和H12O的20,289次预测(约8%)。前瞻性性能指标:HSLL模型AUC为93.65%,灵敏度84.65%,特异性90.30%,PPV 66.25%;H12O模型AUC为95.51%,灵敏度70.08%,特异性96.26%,PPV 86.70%。HSLL中急诊科与病房的性能无显著差异(急诊科AUC 96.19%,病房AUC 92.50%)。该结果通过对比标记预测与实际诊断标签(基于sepsis-2或sepsis-3标准)计算得出,表明模型在真实环境中保持良好的预测能力。
**讨论与结论**
讨论部分指出,两家医院不同的偏好(HSLL高灵敏度、H12O高PPV)通过各自训练的本地模型得以实现,且两院区警报负担均较低,警报疲劳风险低。急诊科快速生成首次警报(约1小时)支持大多数脓毒症为社区获得性的观点。同时,研究承认局限性:并非所有预测均被标记(部分因脓毒症诊断主观性),可能导致指标偏高;且临床影响分析(HSLL单中心回顾性前后对比显示ICU入住率从34.4%降至30.4%,ICU住院天数减少0.35天,病房住院天数减少0.59天)仍需多中心验证。未来工作将实现在线模型训练以避免初始数据导出。
**研究结论部分翻译**:
结论,本文提出了一种用于疾病预测的架构,该架构超越了回顾性研究,能够在异构临床环境中实现真实世界部署。该系统已成功部署并前瞻性评估,证明了其对多样化EHR系统和操作协议的适应性,同时保护了敏感健康信息。通过强调灵活定制、互操作性和数据安全,机器学习可以被有效转化为辅助日常临床实践的临床决策支持系统。