面向创伤知情的精神健康对话智能体:理解用户视角与体验

《Frontiers in Digital Health》:Trauma-informed conversational agents for mental health: understanding user perspectives and experiences

【字体: 时间:2026年06月10日 来源:Frontiers in Digital Health 3.8

编辑推荐:

  精神健康对话智能体(MHCAs)可提供规模化、可及性的心理支持,但其在创伤暴露用户中的安全性与适宜性引发关注。创伤知情护理(TIC)强调安全、信任、赋权、协作、同伴支持与文化敏感性等核心原则,虽在临床实践中已确立,但其在聊天机器人情境中的应用及用户解读尚属空白

  
精神健康对话智能体(MHCAs)可提供规模化、可及性的心理支持,但其在创伤暴露用户中的安全性与适宜性引发关注。创伤知情护理(TIC)强调安全、信任、赋权、协作、同伴支持与文化敏感性等核心原则,虽在临床实践中已确立,但其在聊天机器人情境中的应用及用户解读尚属空白。本研究旨在探究:(1)用户如何在精神健康聊天机器人情境中概念化创伤知情护理;(2)哪些因素可预测用户是否将其聊天机器人互动感知为创伤知情。研究方法采用59项网络调查(REDCap),评估606名受试者的人口学特征、技术熟练度、不良生活经历、聊天机器人使用情况及TIC感知,受试者通过ClickWorker、社交媒体及MyChart招募。探索性与验证性因子分析识别TIC潜在维度,多变量逻辑回归确定创伤知情感知的预测因素。结果显示高满意度(84.5%)与高创伤知情感知比例(92.9%);因子分析验证五维结构:信任与透明度、数据安全、赋权、同伴支持及文化敏感性(CFI = 0.978;RMSEA = 0.045);信任(OR = 3.89, p = .001)、赋权(OR = 1.97, p = .025)及同伴支持(OR = 1.73, p = .021)显著预测创伤知情感知;便利性驱动使用与智能手机熟练度呈负相关。本研究为MHCAs中创伤知情设计的测量提供了经验基础,信任构建、情感验证与同伴联结显著塑造用户感知,强调需将基于人工智能的精神健康工具与创伤知情原则对齐,以增强治疗安全性、可信度与包容性。
对话智能体(Conversational Agents, CAs),或称聊天机器人,是旨在通过文本或语音界面模拟自然人类对话的人工智能驱动系统。在精神健康领域,这些技术日益被用于提供心理健康教育、自助治疗模块以及模拟传统心理治疗要素的支持性对话。多项研究表明,精神健康对话智能体(MHCAs)能够改善情绪健康、减轻抑郁与焦虑症状,并提升用户的自我效能感及求助动机。这些工具通常借鉴认知行为疗法(Cognitive Behavioral Therapy, CBT)、正念及积极心理学等成熟治疗模式,提供持续可及的服务、匿名性与便利性,这对精神健康需求未获满足的人群尤为吸引。因此,商业化及研究型MHCAs如Woebot、Wysa和Youper已在数字市场及医疗系统中广泛传播。

尽管MHCAs日益普及,其安全性、伦理设计及治疗有效性问题仍存在争议,尤其对脆弱用户群体而言。文献回顾指出,证据基础仍然混杂,存在异质性结果及较高的偏倚风险。精神健康聊天机器人涵盖从早期基于规则与脚本的对话智能体到当代基于大型语言模型(Large Language Model, LLM)的生成式人工智能系统的异质性谱系。早期系统依赖预定义脚本和有限的自然语言理解能力,而生成式人工智能系统则引入独特挑战,包括可能产生看似合理但临床不适切的回应、情绪调谐不一致及问责机制缺失等问题。经验性比较研究发现,聊天机器人倾向于指令性、建议式的沟通,而非有效心理治疗所特征的反诘、探索式对话,目前尚不适合作为独立治疗手段。一项涵盖101项研究的范围综述进一步确认,隐私与保密性(61%的文章)及安全与伤害(52%)是对话式人工智能精神健康研究中最常讨论的伦理关切。备受瞩目的事件,包括对自杀意念的不当回应或鼓励有害行为的报告,加剧了公众担忧,暴露了基于规则与人工智能生成对话系统在设计与监管方面的关键局限。

创伤知情护理(TIC)已成为应对临床与数字精神健康情境中安全与伦理考量问题的基础性框架。TIC最初由药物滥用与心理健康服务管理局(Substance Abuse and Mental Health Services Administration, SAMHSA)提出,是一种强调理解并回应创伤广泛性、去权化影响的优势取向服务提供方法。TIC并非作为独立的治疗方式运作,而是涉及承认创伤的影响并有意识地以支持安全、避免再创伤的方式作出回应。该框架围绕六项核心原则构建:(1)安全;(2)可信度与透明度;(3)同伴支持;(4)协作与互惠;(5)赋权、表达与选择;(6)关注文化、历史及性别议题。鉴于许多人在一生中都会经历创伤性事件,无论其诊断或就诊状况如何,TIC已成为精神卫生保健的基础性方法,并已扩展至创伤知情远程医疗及创伤知情计算等领域。尤为重要的是,近期学术研究担忧生成式人工智能系统可能主动增加脆弱人群技术介导创伤的风险,凸显了将创伤知情原则应用于人工智能健康工具的紧迫性。一项涵盖118项研究的范围综述系统梳理数字技术设计中的TIC原则,发现尽管安全、可信度和透明度是最常被引用的原则,但多数研究虽使用创伤知情语言却未遵循标准化框架,揭示了数字情境中TIC理想与实施之间的持续差距。

近期,人机交互与数字健康领域的学者倡导将TIC整合到数字平台及人工智能驱动技术的设计中,催生了创伤知情计算(trauma-informed computing)的概念。伴随而来的是陪伴型机器人设计的平行发展,其同样展示了将安全、信任、自我关怀及自我效能在内的TIC原则嵌入创伤影响人群人工智能系统设计中的可行性,为更广泛的创伤知情人工智能开发提供了重要概念验证。创伤知情聊天机器人不仅保护用户隐私与情绪安全,还需清晰传达自身能力与局限性、支持用户对参与方式与时机的自主权,并避免可能被体验为强迫性、轻视性或触发性的语言或互动模式。尽管创伤知情设计的倡导日益增加,关键差距依然存在:现有研究主要从设计者或开发者视角探讨TIC,对终端用户经验的实证关注有限。特别是,尚缺乏以用户为中心、系统考察个体如何感知和回应MHCAs互动中TIC原则的循证基础,亦不清楚哪些设计要素最强烈地影响自动化情境中心理安全、信任和赋权的感知。本研究直接填补这一空白,通过实证调查终端用户对MHCAs互动中创伤知情护理的感知。具体而言,研究探讨:研究问题一(RQ1):用户如何在精神健康聊天机器人情境中概念化TIC原则?研究问题二(RQ2):哪些因素预测参与者是否将其聊天机器人体验感知为创伤知情?通过以用户经验和期望为中心,本研究旨在厘清创伤知情护理在MHCA互动中的具体表现,并识别支持感知情绪安全、信任和自主权的可操作特征。研究发现为希望将TIC融入数字精神健康工具、确保MHCAs以伦理、支持性和创伤敏感方式服务用户的开发者、临床工作者及研究人员提供洞见。

本研究作为更大规模联邦资助研究项目的组成部分,经Parkview Health机构审查委员会(Institutional Review Board, IRB)批准。研究人员开发了结构化、自填式在线问卷,通过REDCap系统实施,以评估用户对MHCAs的使用经验、对创伤知情聊天机器人特征的感知,以及对互动总体满意度。鉴于目前缺乏将TIC原则通过终端用户视角在人工智能聊天互动情境中进行操作性测量的成熟工具,研究人员通过将SAMHSA的TIC框架映射至可测量构想来开发研究工具。题项基于既往TIC及相关人机交互/卫生保健文献进行概念奠基,随后经专家反馈迭代优化以提升清晰度及与聊天机器人经验的相关性。问卷经临床心理学TIC专家,以及具有精神健康情境和人工智能伦理经验的人本设计专家反馈完善。问卷包含四个主要内容部分:人口学特征、技术经验、创伤知情聊天bot特征与经验、满意度水平。调查共计59个题项,包括多选、李克特量表(1 = 不佳/不熟练/从不至5 = 非常好/熟练/总是)、二分类及开放式问题。为确保数据质量,问卷包含一个注意力检查题项和两个隐藏机器人检测问题。

受试者于2024年12月至2025年4月期间通过三个主要渠道招募:众包平台ClickWorker(n=488)、在线社交媒体平台(n=113)及MyChart患者沟通门户(n=5),最终合格样本为606人。ClickWorker作为可及大规模、多样化且经核实劳动力的主要招募渠道,社交媒体招募通过Twitter和LinkedIn进行。MyChart招募针对印地安纳州18岁及以上、在过去12个月内至少有一次行为健康或精神科临床就诊且记录中有活动性行为或精神科病案的基于患者。尽管MyChart招募历时约八周,但由此产生的子样本量较小(n=5),不作临床人群代表性解读,可能反映了创伤相关研究主题的敏感性及临床人群参与此类研究的已知迟疑性。本研究并非专门招募受创伤影响或寻求帮助临床人群,而是有意采用广泛招募以反映真实世界中与数字精神健康工具互动的多样化个体,包括有和没有创伤暴露者。

数据分析方面,开放式问题的定性数据采用归纳式反思性主题分析,以识别与创伤知情聊天机器人经验相关的反复出现模式和用户定义概念。反思性由第一和末位作者全程保持以确保解释决策的透明度。定量调查数据采用描述性和推断性统计方法组合分析。首先计算描述性统计以概括参与者特征、技术使用模式及TIC总体感知;继而进行探索性因子分析(EFA)以识别参与者创伤知情聊天bot特征概念化背后的潜在维度;随后进行验证性因子分析(CFA)以验证因子结构并评估模型拟合;最后拟合多变量逻辑回归模型以识别与参与者将聊天机器人互动感知为创伤知情相关的因素。所有统计分析使用R(版本4.4.3)及相关统计包完成。

探索性因子分析支持五因子解,最终EFA模型保留18个题项,解释总方差的66%,五因子分别命名为同伴支持、信任和透明度、数据安全、赋权及文化敏感性。SAMHSA原则中的"协作"未作为独立因子出现,协作相关题项负荷于邻近维度,特别是赋权和信任与透明度。验证性因子分析显示五因子18题项模型具有优秀拟合度(CFI = 0.978;TLI = 0.973;RMSEA = 0.045, 90% CI: 0.037–0.052;SRMR = 0.033)。所有标准化因子负荷均统计显著(p < .001),范围为0.70至0.88。

在多变量逻辑回归分析中,感知信任 emerged as the strongest and most stable correlate of trauma-informed perception. Higher trust scores were associated with substantially increased odds of perceiving the chatbot as trauma-informed (OR = 3.89, 95% CI: 1.73–8.77, p = .001)。同伴支持(OR = 1.73, 95% CI: 1.09–2.74, p = .021)和赋权(OR = 1.97, 95% CI: 1.09–3.57, p = .025)亦与创伤知情感知呈正相关。用户层面特征中,报告曾涉及儿童服务部者表现出明显更高的创伤知情感知几率(OR = 9.71, 95% CI: 1.66–56.79, p = .012)。相反,以便利性为主要使用动机者(OR = 0.33, 95% CI: 0.11–0.96, p = .041)及智能手机熟练度较高者(OR = 0.38, 95% CI: 0.16–0.93, p = .033)与创伤知情感知呈负相关。

本研究具有几项重要研究意义。研究为理解用户如何解读、体验和评估精神健康聊天机器人互动中的TIC特征提供了严谨的经验基础。通过整合描述性模式分析、验证性因子分析和预测建模,研究人员阐明了TIC的概念结构以及驱动创伤知情评估的关键要素。用户绝大多数认可聊天机器人体现TIC特征,超90%认可其体验为创伤知情,同时满意度和推荐率亦高。重要的是,参与者并未将TIC理解为单一构念,而是展现出涵盖情绪安全、隐私、身份验证、自主权和同伴联结的 nuanced understanding。

因子分析结果产生的五维结构具有重要理论和实践意义。数据安全作为独立潜在因子的出现表明,对于研究人群而言,安全主要通过数据保护和隐私的视角来理解和评估,而非泛化的情绪或人际安全感。在精神健康聊天机器人情境中,这一区分表明关于用户数据如何存储、保护和使用的保证对于具有脆弱性或创伤经历经验的个体可能尤为显著,并可能有意义地塑造其对互动是否安全的感知。"协作"因子的缺失,尽管其具有理论显著性,表明协作要素可能隐含嵌入其他维度。定性资料强化了这一解释:几位参与者强调重视"持续反馈"和回应"为我量身定制"的感觉,突显协作作为整合性而非独立维度。

信任与透明度作为创伤知情感知最稳健的驱动因素出现,尤其在保密性和期望管理方面。情绪验证在培养信任中发挥核心作用,这一发现与既往研究一致,即关系真实性和透明沟通是数字精神健康工具中建立信任的关键。赋权和同伴支持亦被证明是塑造创伤知情感知的关键维度。感到在决策中获得支持或可获得社区资源者显著更可能将聊天机器人视为创伤知情,这与Potts等人关于多语言聊天bot提供用户驱动对话改善幸福感和参与度的发现相共鸣。个体间差异进一步塑造TIC感知:曾有儿童保护或社会服务参与史者显著更可能感知聊天机器人为创伤知情,这可能通过系统影响群体与制度支持和技术互动的独特关系来理解;而以便利性为主要使用动机或自评智能手机熟练度较高者则显著更不可能感知聊天机器人为创伤知情,这种模式与既往关于技术熟练或效率导向用户倾向于以功利主义视角评估对话系统的研究一致。

本研究发表于《Frontiers in Digital Health》。研究所用关键技术方法包括:基于SAMHSA创伤知情护理框架开发自编问卷工具,经临床心理学TIC专家和人本设计专家迭代完善;通过REDCap平台实施网络调查,采用众包平台ClickWorker(主要渠道,n=488)、社交媒体(Twitter和LinkedIn,n=113)及MyChart患者门户(n=5)招募606名有精神健康疑虑且使用过精神健康聊天机器人的18岁以上英语使用者;运用探索性因子分析(最大似然估计、oblimin旋转、平行分析确定因子数)和验证性因子分析(评估CFI、TLI、RMSEA、SRMR等拟合指标)识别和验证创伤知情感知的潜在结构维度;采用多变量逻辑回归(前向逐步选择法)分析创伤知情感知的预测因素。

研究结果部分围绕两个研究问题展开,下设多个小标题。在"总体描述性统计"中,通过使用频率、动机和满意度表明大多数参与者对聊天机器人持积极态度。92.9%受访者感知聊天机器人为创伤知情,84.5%选择满意度最高的两个等级,最高使用频率为每月1-3次或每周2-5次,最常用平台为Serenity(23.1%)、Woebot(21.5%)和Stresscoach(19.8%),主要使用动机包括压力或焦虑(68.8%)和抑郁(59.4%)相关的情绪困扰。

在"RQ1:TIC原则的概念化"部分,研究人员通过多选复选框题项分析用户对六个核心TIC维度的感知。安全主要被定义为无惧或无评判互动的能力,情绪安全为该领域最常选择特征(86.7%);信任与透明度围绕确保用户通过开放清晰沟通感到尊重,信息保密性为最高优先级特征(82.3%);赋权强调用户自主性与支持,"引导对话"最常获认可(73.1%);协作反映伙伴关系和共同决策,"尊重选择"最常被选择(72.6%);同伴支持聚焦与有相似经历他人的联结,"寻求支持"最常被选择(73.1%);文化敏感性强调包容性与对多元身份的尊重,"非评判性"最常被认可(79.4%)。通过探索性因子分析揭示潜在结构,五因子解最终保留18个题项,解释总方差的66%,个体因子解释方差在7%至20%之间。验证性因子分析确认五因子18题项模型具有优秀拟合度。

在"RQ2:确定聊天bot为创伤知情的预测因素"部分,多变量逻辑回归分析显示设计特征预测因素中信任为最强和最稳定的相关因素;用户特征预测因素中,曾有儿童服务部参与史者创伤知情感知几率显著更高,而以便利性为主要动机和更高智能手机熟练度与创伤知情感知负相关。

讨论部分系统整合研究发现,强调TIC在数字精神健康情境中的可测量性和影响力。研究人员指出,信任、赋权和同伴支持作为用户感知的核心驱动因素,与技术熟练度等用户特征共同作用,提示创伤知情设计不应作为可选增强功能而是核心架构特征。研究局限性包括横断面自我报告设计可能受回忆偏倚或社会期望效应影响;样本以白人为主且限于有可靠网络访问的英语使用者;MyChart临床人群招募不足;高阳性结果率引入天花板效应;以及定量数据在深度方面的固有限制。

研究结论部分翻译如下:本研究建立了理解创伤知情护理原则如何在精神健康聊天机器人互动中呈现的严谨经验基础。通过整合描述性分析、因子建模、预测回归和定性洞见,研究人员证明TIC既是可测量的亦是具有影响力的,信任、赋权和同伴支持作为用户感知的核心驱动因素涌现而出,同时关键个体特征亦发挥作用。为推进创伤知情数字精神健康,开发者应优先考虑整合同伴网络和人际-智能体协作的混合模式,针对多样化用户画像定制功能,并系统评估新兴TIC维度。未来纵向和多平台研究对于验证和扩展这些发现至关重要,最终将指导设计更具包容性、有效性和心理安全性的聊天bot干预。随着人工智能日益嵌入精神健康服务提供,以创伤幸存者声音为中心、保护其安全并尊重其自主权的伦理紧迫性从未如此迫切。本研究代表朝向实现这一愿景的重要一步。
相关新闻
生物通微信公众号
微信
新浪微博

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号