《International Journal of Mental Health Nursing》:Active Ingredients Across the 10 Safewards Interventions: Expert Consensus Towards Fidelity Measurement
编辑推荐:
Safewards已在国际范围内用于预防精神科环境中的冲突与约束(containment)。尽管相关评估总体显示此类事件有所减少,但不同研究之间的效果存在差异。一个关键局限在于,当前缺乏一种有效且稳健的实施忠实度测量工具,用以指示Safewards的实施与其最
Safewards已在国际范围内用于预防精神科环境中的冲突与约束(containment)。尽管相关评估总体显示此类事件有所减少,但不同研究之间的效果存在差异。一个关键局限在于,当前缺乏一种有效且稳健的实施忠实度测量工具,用以指示Safewards的实施与其最初设计意图的接近程度。若缺乏这方面知识,复制、优化与有效实施将变得困难,从而危及临床质量保证与科学评价的严谨性。本研究报告了开发一种全新Safewards实施忠实度工具的初始步骤。研究目标是识别10项Safewards干预的重要活性成分及其相应测量层级。研究采用德尔菲(Delphi)调查设计,并组建国际专家小组,就活性成分与测量层级达成共识。初步调查条目来源于Safewards.net网站,并以实施忠实度理论为指导,同时纳入直接与间接测量层级。所得成分与测量集合随后在一家急性精神科诊所中,由潜在终端使用者进行可理解性预测试。研究通过小组访谈探讨其使用体验,采用主题内容分析(thematic content analysis)进行分析,并据此作出调整。最终产出包括覆盖10项干预的48项活性成分与122项测量指标,每项干预由3至7条陈述表示,并设有最多4个测量层级。研究结果为开发新的Safewards忠实度工具提供了概念上与内容效度上的基础。此外,这些活性成分本身亦具有内在价值,可为Safewards的临床实施提供指导。
该文发表于《International Journal of Mental Health Nursing》,聚焦于精神科护理干预Safewards在实施过程中的“忠实度(fidelity)”问题。研究背景在于,Safewards已广泛应用于多个国家和不同精神卫生服务场景,目标是减少病房中的冲突事件与约束性处置。然而,既往研究虽然总体提示该模式有助于减少冲突、约束及强制措施,但各项研究间效果并不一致。造成这种差异的一个核心原因,在于缺乏经过验证的忠实度测量工具,因而难以判断某一病房或机构究竟在多大程度上按Safewards原始设计完成实施。若无法明确实施是否到位,就难以区分“干预本身无效”与“干预未被正确实施”这两种情形,从而增加Ⅲ型错误(Type III errors)的风险,即对干预有效性得出错误结论。对于精神科护理而言,这不仅影响科研评价的可信度,也可能削弱临床质量改进、项目推广和循证护理方法的规范化发展。因此,建立一套具有概念基础和内容效度的Safewards忠实度工具,成为推动该模式进一步科学评估与临床优化的关键前提。
在此背景下,研究人员围绕Safewards的10项核心干预,系统识别其中真正影响干预发挥作用的“活性成分(active ingredients)”,并同步确定适宜的测量层级。论文的核心目标并非直接检验Safewards疗效,而是为后续开发新的Safewards实施忠实度工具奠定基础。研究最终形成了覆盖10项干预的48项活性成分和122项对应测量层级,且经急性精神科临床场景中的潜在使用者测试后完成修订。研究结论表明,这一结果为新型Safewards忠实度测量工具提供了坚实的概念框架与内容效度基础,同时这些活性成分本身亦可作为临床实施Safewards的操作导向。
研究人员采用的主要技术方法包括:第一,运用德尔菲法(Delphi method)组织来自7个国家的12名国际专家开展多轮共识调查,以识别10项Safewards干预的活性成分及相应测量层级;第二,以Carroll等提出的实施忠实度理论框架为基础,区分干预“为何发挥作用”与“如何实施”的成分结构,并设置病房走访观察、病房管理者/推广者访谈、工作人员访谈和患者访谈4类测量层级;第三,在瑞典3个成人急性精神科病房中,由潜在终端使用者使用正在开发的Safewards实施忠实度工具(SIFT)原型进行可理解性预测试,并通过小组访谈与主题内容分析完成修订。
研究结果部分首先显示,整个研究历时6个月,于2024年完成两轮针对活性成分的德尔菲调查,并增加一轮针对测量层级的小规模补充调查。全部12名专家均完成调查,无脱落。最终,所有10项Safewards干预均达到预设的≥75%共识标准。初始共识形成46项活性成分,随后在2025年4月完成临床可理解性测试并修订,最终确定48项活性成分与122项测量层级。
在“3.1 Active Ingredients”部分,研究人员分别报告了10项干预的共识形成过程及最终内容。
“3.1.1 Clear Mutual Expectations (CME)”显示,研究通过专家共识明确了共同明确期望的核心成分,即病房文化应建立在平等、清晰、积极态度、对所有人的安全感以及伦理性取向等共享原则之上,并要求医护人员与患者共同制定、评估和修订这些期望,同时借助醒目张贴物进行展示、向新入院患者解释,并在交接班中核查落实情况。该结果说明,CME不仅是病房规则的展示,更是以共享价值为基础的持续性互动实践。
“3.1.2 Soft Words (SW)”表明,该干预的关键在于工作人员以体贴、谨慎且合作性的方式与患者沟通,尤其在提出要求、限制行为或回应请求时,应尽可能减少对立感。除张贴相关提示信息外,病房还应通过某种持续强化机制,使这种沟通方式保持活跃。研究借此明确,SW的核心不在某种固定载体,而在于持续维持尊重性语言实践。
“3.1.3 Talk Down Tips (TDT)”指出,这一干预围绕去激化(de-escalation)技能展开,其核心成分包括工作人员基于情绪自我调节、尊重与共情开展沟通,并遵循“界定—澄清—解决”的过程;同时配置醒目的海报、指定擅长去激化的倡导者(champions),并通过简短培训和事件复盘不断强化团队应用。研究删除了若干未获共识的条目,说明该干预的关键并非附加材料的全面提供,而是围绕核心技能的组织性强化。
“3.1.4 Positive Words (PW)”显示,研究确认交接班中的语言框架是这一干预的关键,即工作人员在每次交接后以优势视角和希望感理解患者,对每位患者表达积极信息,并在涉及挑战性行为时给予可能的心理学理解,同时避免污名化或责备性语言。结果表明,PW强调的是团队叙事方式对病房氛围和患者理解框架的塑造。
“3.1.5 Bad News Mitigation (BNM)”表明,当患者接收到坏消息后,无论信息来源于病房内外,均应获得表达情绪、接受共情支持及补充解释的机会;病房工作人员与多学科团队需共同参与坏消息的传达或后续支持,并在交接班中主动讨论哪些患者已收到或可能收到坏消息以及如何支持。该结果强调,BNM是一种前瞻性和团队化的情绪冲击缓冲机制。
“3.1.6 Know Each Other (KEO)”表明,此干预的活性成分在于工作人员与患者彼此分享非争议性的个人信息,以促进日常交流、平等感和相互尊重,并通过统一展示材料供病房患者查阅。研究还明确患者在出院时可决定带走或销毁个人信息页,体现了该干预对自主性和边界感的重视。
“3.1.7 Mutual Help Meeting (MHM)”显示,共识确认的关键成分包括:病房应鼓励患者彼此帮助与理解;每周至少举行一次自愿性的互助会议;会议围绕感谢、消息、建议、请求与提供帮助等议程展开;工作人员知晓并可作为病房共同体成员参与。该结果表明,MHM旨在通过结构化集体互动建立患者间支持网络与积极病房文化。
“3.1.8 Calm Down Methods (CDM)”指出,该干预强调在适当情况下优先提供平静/自我安抚工具,以缓解痛苦、焦虑或激越,尤其是在可能考虑或请求按需给药PRN(pro re nata,必要时用药)时。病房需设置集中存放的安抚物品,明确患者可借用或保留的物品,并在需要时提供支持。交接班中也应在相关情况下关注此类方法是否已使用。研究结果表明,CDM的关键在于支持患者调动自身应对资源,而非单纯依赖药物或约束。
“3.1.9 Reassurance (Re)”表明,在病房发生可能引发焦虑的事件后,应与患者讨论其对事件的理解及受到的影响,并向其提供解释和答疑;同时工作人员应更明显地出现在病房公共空间,以温暖、关切的方式提升患者安全感。研究确认,这一干预的本质是事件后对患者安全感和意义理解的及时修复。
“3.1.10 Discharge Messages (DM)”显示,出院患者留下的积极信息应为在院患者提供希望、鼓励、实用建议及积极住院体验,这些信息通过公开展示板等形式呈现;患者在出院前后被邀请撰写留言,新入院患者也会被介绍该展示内容。结果说明,DM并非简单的展示装饰,而是利用过来者经验进行同伴希望传递。
在“3.2 Levels of Measurement”部分,研究人员依据实施忠实度理论建立了4个测量层级:病房走访观察这一直接测量层级,以及针对病房管理者/倡导者、工作人员和患者的3个间接访谈层级。结果显示,测量层级总体共识度较高。研究最终为7项干预确定了18个直接测量指标,而全部10项干预均至少配置了2至3类间接测量层级,其中患者访谈覆盖9项干预。该结果说明,新工具强调多源信息三角互证(triangulation),既关注现场可见证据,也重视实施者与接受者的经验反馈。
在“3.3 Comprehensibility”部分,预测试结果表明,终端使用者总体认为活性成分陈述及测量层级较易理解,但也指出部分表述过长、将两个要点合并为一句,或存在“if appropriate”“a majority of staff”“easily accessible”等语义含糊词,影响访谈判断与回答一致性。另有一项涉及TDT倡导者技能的测量被认为不适于由患者回答。研究团队据此对工具条目进行了最终修订,提升了可理解性和可操作性。
讨论部分指出,本研究的首要贡献是为Safewards忠实度工具构建了坚实的概念和内容效度基础。作者强调,活性成分不仅是测量工具开发的前置成果,本身也可作为临床实践中的“指南针”,帮助护士和其他精神卫生从业者更准确地把握Safewards每项干预的目的与实施方式。研究同时指出,随着Safewards在国际上的广泛传播,其具体实施内容可能出现漂移,因此明确定义活性成分有助于避免对干预原意的缩减或偏移。研究还认为,在专家组仅用3轮即达成共识这一事实,提示Safewards.net上的内容在不同国家具有较好的可理解性和文化稳健性。另一方面,作者也坦陈局限,包括专家遴选可能存在选择偏倚、研究团队成员兼任专家可能带来潜在偏倚,以及德尔菲调查任务繁重可能引发应答疲劳。
研究结论部分可译为:国际专家小组识别出了10项Safewards干预对应的48项活性成分及122项测量层级。该结果经急性精神科临床环境中的终端使用者测试并修订其可理解性后,构成了开发一种新型忠实度测量工具的概念性与内容效度基础,可用于支持更稳健的临床实践与研究。
总体而言,该研究并未直接评估Safewards是否有效,而是聚焦于“如何准确测量Safewards是否被按原意实施”这一更基础但又关键的问题。其学术意义在于,将复杂精神科护理干预拆解为可识别、可讨论、可测量的活性成分及多层级测量指标,为后续心理测量学验证和国际比较研究提供了基础。其临床意义则在于,为精神卫生住院护理团队提供了更为清晰的实施框架,有望提升Safewards实施质量,并促进病房冲突预防与非强制性护理实践的规范发展。