《Journal of Affective Disorders Reports》:Constructing Trust and Distrust in AI Therapists: A Grounded Theory Study of Public Online Narratives
编辑推荐:
全球心理健康服务需求正在增长,但获取专业治疗师的途径仍然有限。在此背景下,基于人工智能(AI)的解决方案,尤其是治疗性聊天机器人,正作为辅助工具受到关注。然而,用户采用受到信任问题的阻碍。本研究旨在开发一个扎根理论(Grounded Theory, GT)模型
全球心理健康服务需求正在增长,但获取专业治疗师的途径仍然有限。在此背景下,基于人工智能(AI)的解决方案,尤其是治疗性聊天机器人,正作为辅助工具受到关注。然而,用户采用受到信任问题的阻碍。本研究旨在开发一个扎根理论(Grounded Theory, GT)模型,以探索对AI驱动治疗系统的信任如何建立、维护和可能丧失。信任被概念化为一个多维度构念,整合了系统可靠性(来自人机交互)、医疗保健可信度(包括安全性和伦理)以及反映治疗联盟要素(如同理心)的关系信任。研究人员采用定性扎根理论方法,分析了来自社交媒体、心理健康论坛和相关在线平台的557个公共文本单元。通过开放性编码(Open Coding)、轴心编码(Axial Coding)和选择性编码(Selective Coding),开发了一个中层概念框架,即“凭证重新评估(Credential Reappraisal)”模型。该模型概述了三个阶段:初始证据评估、基于同理心和准确性的互动测试,以及信任稳定或崩溃。社会反馈和系统的错误管理被发现是加强或削弱信任的核心。研究揭示,对基于AI的治疗师的信任并非静态,而是动态的,通过系统互动和他人的反馈持续重新协商。透明度、准确性和错误管理是影响信任的关键因素。研究强调了在开发AI驱动治疗系统时需要信任设计(Trust-by-Design),确保透明度、可解释性回应以及持续改进的积极用户反馈机制。
**论文解读:AI治疗师信任的动态构建——基于扎根理论的公共叙事分析**
**研究背景与问题**
全球心理健康服务需求激增,经济压力、疫情和社会压力导致抑郁、焦虑患病率上升,但专业治疗师短缺、费用高昂和地理障碍限制了服务的可及性。基于人工智能(AI)的治疗聊天机器人因其可扩展性、低成本和全天候可用性成为潜在解决方案。然而,用户对AI治疗师的信任缺失严重阻碍了其采用。现有研究多将信任视为静态属性,或仅关注单一维度(如系统可靠性或治疗联盟),缺乏整合社会反馈和错误管理的动态过程模型。为填补这一空白,研究人员开展本研究,旨在通过扎根理论探索用户如何在互动中构建、维持或丧失对AI治疗系统的信任,并开发一个过程导向的理论框架。该研究发表在《Journal of Affective Disorders Reports》。
**研究内容与核心结论**
研究人员采用建构主义扎根理论(Constructivist Grounded Theory)方法,分析557个来自Reddit、Twitter/X和心理健康论坛的公开文本单元(231篇长帖和326条短评论/推文),涵盖2022年1月至2025年6月的数据。通过开放性编码、轴心编码和选择性编码,最终归纳出“凭证重新评估(Credential Reappraisal)”模型作为核心类别。该模型揭示了信任演变的三个递进阶段:初始证据评估、互动测试(同理心与准确性)、信任巩固或瓦解。研究发现,社会反馈和系统错误管理在信任强化或削弱中起核心作用。信任并非一成不变,而是在与系统的持续互动及他人反馈中动态重新协商。透明度、同理心、准确性和错误管理是影响信任的关键因素。研究强调,AI治疗系统的开发需遵循“信任设计(Trust-by-Design)”原则,嵌入透明机制、可解释回应和用户反馈闭环。
**主要关键技术方法**
本研究采用定性扎根理论设计。数据来源为公开平台:Reddit(心理健康与技术相关子论坛)、Twitter/X(公开推文)和开放心理健康论坛,使用PRAW API(Reddit)、官方API(Twitter/X)和手动收集(论坛)获取数据。样本经目的性抽样和理论抽样确定,最终纳入557个独立文本单元。分析流程包括:开放性编码(逐行生成初始概念)、轴心编码(组织类别并识别条件、行动与后果关系)、选择性编码(整合为核心理论)。NVivo 14支持数据管理,研究者通过持续比较法、分析备忘录确保理论饱和。信任度策略包括审计追踪、研究者三角验证、同行汇报、成员检查(8位数据提供者反馈)及跨平台三角验证(Reddit, Twitter/X, 论坛)。
**研究结果**
**核心发现**
通过开放性编码→轴心编码→选择性编码,研究人员构建了一个中层过程理论——“凭证重新评估”。该核心类别捕捉了用户在整个使用过程中对可信度信号的持续评估。模型包含三个主要类别:(1)初始证据评估,(2)互动测试:同理心与准确性,(3)信任的巩固或瓦解。这些类别条件性且过程性地相互连接,揭示了信任的动态本质:用户在不同阶段不断重新评估可信度。
**类别一:初始证据评估**
此类别描述用户在与AI治疗师互动前对初步信息的评价,包括隐私声明、临床宣称、研究引用和同伴反馈。共有477个单元编码至此类别(占比最高)。缺乏透明度或无支持的宣称常导致用户犹豫或延迟使用。例如,用户反映“隐私政策太模糊,我不确定数据是否安全”(Reddit用户,2023),以及“他们声称有临床验证但不引用任何研究,这让我怀疑”(论坛用户,2024)。同伴评价(如负面评论占半数)会促使用户谨慎尝试,而积极体验则推动用户给予机会。
**类别二:互动测试:同理心与准确性**
此类别指用户在与系统互动过程中对同理心、情境适配性和内容准确性的实时评价。共424个单元编码至此类别。具有同理心和情境适配的回应增强信任,而通用回复或幻觉(Hallucination)迅速削弱信任。例如,用户表示“系统的第一次回应感觉真心同理,这鼓励我继续”(Reddit用户,2023);但“当它给出与我的情况无关的建议时,我立刻怀疑其可靠性”(论坛用户,2022);“它有时产生幻觉性回应,不安全,毁掉我的信任”(Reddit用户,2025)。系统能承认错误反而使用户更愿意继续使用。
**类别三:信任巩固或瓦解**
此类别捕捉累积结果:持续使用和推荐(巩固)或停止使用、卸载和公开警告(瓦解)。共343个单元编码至此类别。用户根据系统能否随时间保持一致、准确和同理的回应来决定去留。例如,“几周有用会话后,我推荐给了朋友”(论坛用户,2023);“因重复错误我删除了应用并警告他人”(Twitter用户,2024);“虽然开头不错,但长期缺乏情境适配导致我停止使用”(论坛用户,2025)。
**讨论与结论**
讨论部分强调,本研究提出的“凭证重新评估”模型将信任视为动态、递归过程,而非静态属性。与以往仅关注透明度、同理心等孤立因素的研究不同,该模型展示了这些因素仅在用户持续再评估的框架内才有效。社会反馈和系统错误管理被确认为信任轨迹的关键调节变量。研究指出,缺乏情境准确性的同理心,或不对应用户需求的透明度,会迅速导致不信任。实践意义方面,开发者需设计包含明确错误处理协议、实时解释和自适应回应的系统,使用户能在出错后重新评估并恢复信任。政策制定者应制定监管框架,涵盖临床宣称、错误报告和数据透明度。临床实践中,引入AI工具前需认识到信任的周期性,避免过早放弃或怀疑。研究局限性包括仅基于英语文本、社交媒体用户可能不代表性临床人群、匿名化限制了深度情境分析。未来研究应跨语言、跨文化验证模型,并采用混合方法量化信任组件。
**研究结论**
本研究结果表明,对基于AI的治疗师的信任是一个动态、反思性和多层次的构念,通过用户、系统和社会反馈的持续互动而产生。将“凭证重新评估”作为核心机制的引入,为解释信任如何随时间形成、巩固或瓦解提供了新颖框架。该框架强调,信任并非一次性评估,而是一个由互动经验和反馈积极塑造的持续过程。模型指出,持续信任不仅依赖于初始的透明度和可信临床证据,还依赖于同理心和准确的互动,以及有效的错误管理和反馈响应机制。在理论层面,本研究超越了静态、线性的信任模型,突出了用户与AI系统关系的复杂、非线性路径。在应用层面,研究结果为以人为本的设计、循证政策制定和临床实践提供了可操作的建议,强调了创建对反馈敏感并能根据用户需求演变的系统的重要性。该框架可作为制定监管标准和开发增强公众信心的AI治疗工具的基础,同时提高其在数字心理健康护理中的有效性。