综述：数字镜像：生成式人工智能在心理健康干预中的临床潜力与关系性风险

首页今日动态人才市场新技术专栏中国科学人云展台
BioHot
云讲堂直播会展中心特价专栏技术快讯免费试用

生物通官微
陪你抓住生命科技
跳动的脉搏

生物通首页 > 今日动态 > 正文

《Current Psychiatry Reports》：The Digital Mirror: Clinical Potentials and Relational Risks of Generative AI in Mental Health Interventions

【字体：大中小】 时间：2026年06月19日 来源：Current Psychiatry Reports 6.7

编辑推荐：

　　本综述探讨生成式人工智能（Generative Artificial Intelligence, GenAI）在心理健康领域中快速演变的整合应用，旨在评估其在临床评估、治疗计划制定及心理干预中的当前应用，同时批判性审视GenAI作为辅助性工具而非替代人类提供的

本综述探讨生成式人工智能（Generative Artificial Intelligence, GenAI）在心理健康领域中快速演变的整合应用，旨在评估其在临床评估、治疗计划制定及心理干预中的当前应用，同时批判性审视GenAI作为辅助性工具而非替代人类提供的治疗之临床风险、伦理困境与未来潜力。近期研究表明，人工智能模型能够有效辅助诊断推理、通过脑电图（Electroencephalography, EEG）识别生物标志物，以及基于会谈记录预测症状轨迹。随机对照试验（Randomized Controlled Trials, RCTs）显示，GenAI聊天机器人能在短期内显著减轻焦虑和抑郁症状，尤其在临床医师资源有限的场景中作用明显；然而，人类主导的治疗在促进深层情感投入和临床疗效方面仍具优越性。已识别的重大风险包括：GenAI可能助长依赖、通过"谄媚式"镜像反射强化不良图式或妄想观念，以及在犯罪信息披露报告方面引发复杂的伦理-法律挑战。总结而言，人工智能代表着心理健康领域中具有变革性的辅助性层次，可为评估、培训及会谈间监测提供可扩展的支持。尽管个性化、多模态及沉浸式虚拟现实吹虚拟现实（Virtual Reality, VR）等技术进步提升了其临床效用，GenAI仍缺乏真实的关系深度及对"校准错配"（calibrated mismatches）的把握，而这两者对自主性及转化性改变至关重要。未来的整合必须优先采用以人为本的混合模式，GenAI应在严格的伦理与监管框架内由临床医师严格督导，以维护治疗性联结的核心本质。研究优先级、临时性临床防护措施，以及弥合当前证据与现实世界应用差距的建议均需明确制定并付诸实施。

**引言**

当前心理治疗需求与现有服务之间的差距凸显了扩大心理干预规模同时保障可及性、质量与个性化的必要性。在此背景下，生成式人工智能（GenAI）融入临床实践正开始重塑心理健康护理的路径。GenAI指一类能够创造新内容的人工智能系统，可通过学习大型数据集生成文本、对话、图像、音频或个性化反馈。在心理健康领域，GenAI可用于驱动对话代理、起草心理教育材料、总结临床记录、模拟治疗性对话或提供定制化自助回应。心理健康领域中的其他人工智能形式通常侧重于分析、预测、分类或决策支持而非内容生成。例如，机器学习（Machine Learning, ML）模型可预测复发风险、基于语音或问卷数据分类抑郁严重程度、检测电子健康记录（Electronic Health Records, EHRs）中的模式，或支持诊断和治疗计划制定。关键区别主要在于功能层面：GenAI产生新的类人类内容，而传统或非生成式AI主要识别模式、基于现有数据进行预测或支持决策。近期ML与自然语言处理（Natural Language Processing, NLP）的进展使得多模态数据源的分析成为可能，包括自我报告量表、数字表型分析、EHRs、语音特征、智能手机使用及其他被动数据流。早期证据表明AI可支持诊断过程、治疗计划制定和症状聚焦干预。大规模知识库与检索增强生成（Retrieval Augmented Generation, RAG）的结合使虚拟治疗师能够高效传递结构化心理教育内容。结合相对较低的获取成本，这些特性促进了虚拟治疗师的广泛扩散，拓展了护理可及性的前景。同时，多项研究强调了重要局限性，尤其在复杂临床呈现中，沟通困难和共情深度不足仍然明显。云基医疗系统中的数据存储、隐私及网络安全风险也持续存在关切。

**方法与结果概述**

本综述采用叙述性综述方法，涵盖过去十五年心理健康领域的关键AI应用，强调具有明确临床相关性的研究，并优先纳入在临床环境中直接考察GenAI应用的研究。

**评估与治疗计划**

AI在临床心理学和精神病学中的初步应用证据表明，其可有效用于诊断和治疗计划制定。AI整合EEG数据与基于人工神经网络的深度学习技术，能够区分抑郁症状个体与健康个体。在临床推理方面，探索性研究发现GenAI能够基于临床情景产生与病例材料总体一致的阐释。然而证据有时相互矛盾：ChatGPT-4在结构化病例、鉴别诊断和治疗建议方面表现有效，但在深入访谈、风险评估和副作用监测方面表现欠佳。

**心理治疗性干预**

近期证据探索了通过对话代理或聊天机器人提供心理治疗的可能性，在可及性和成本方面具有优势。GenAI治疗师可长期保留用户信息，模拟一致、非评判性的倾听，增强用户参与度。首批GenAI治疗系统（如Woebot、Replika、Tess、Sara和Wysa）在短期减轻焦虑和抑郁症状方面显示出一定效果。一项涉及210例抑郁、焦虑或进食障碍患者的RCT表明，一个月GenAI聊天机器人治疗较等待对照组显著减轻症状，且效果维持两个月。然而，当直接比较时，人类提供的治疗仍更有效：在涉及冲突地区104例焦虑障碍女性的RCT中，传统心理治疗组的改善幅度更大，聊天bot虽然提供有意义的助益，但情感投入和临床影响低于人类治疗。另一项比较iCBT聊天机器人Tinnibot与混合干预（结合Tinnibot和远程心理学）的试验显示，两组均显著降低耳鸣功能指数评分，但远程心理学联合人类心理学家的组别有更优趋势。

**临床风险**

GenAI介导治疗相对于人类交付心理治疗的关键局限性和风险主要包括以下方面：

自主性促进问题：人类心理治疗在安全基地中通过协调的治疗反馈，使来访者逐渐学会识别思维、情绪和身体感受，促进意义建构和情绪觉察，最终促进自主性、情绪耐受力以及对先前否认或压抑自我部分的同情。人类治疗鼓励来访者逐步减少对治疗师的依赖，而GenAI互动可能激活中脑皮质边缘奖赏回路，其多巴胺能奖赏通路的激活方式与问题性社交媒体和游戏使用类似，增加渴求和强迫性使用风险。持续24/7的可得性可能鼓励一种"快餐式心理治疗"，以即时性和诱惑性取代反思深度。

校准错配的缺失：治疗需要超越简单镜像反射的校准错配——策略性分歧提供替代性阐释，使来访者将其世界观视为多种观点之一。心理治疗师持续决定何时镜像、重构或引入不和谐替代和扰动，而GenAI聊天机器人倾向于通过顺从和诱惑逻辑运作， collusively镜像用户，剥夺促进洞察和自我意识所必需的人类错配。GenAI治疗应用常强调自我安抚技术，但可能未能以深层转化方式鼓励积极行为改变。

用户 profile 与GenAI的适配性：GenAI引导治疗的成功取决于技术、社会文化和个体因素的协同。通常男性及早采用者显示出更高信任度；年轻用户和较低教育水平者接受度更高，可能源于日常技术熟悉性。然而，对GenAI不加批判的乐观可能营造关怀幻觉，其功能由市场驱动而非临床逻辑塑造。研究显示，当用户认为信息来源是人类时，信息被认为更可靠，凸显明确框架的必要性：用户必须理解其正在与生成合理输出的虚拟系统而非有意图的主体互动。

伦理-法律挑战与安全风险：类人的感知常导致准关系，用户感到舒适而进行意外的个人披露，进而引发关键伦理和法律问题。具体而言，向聊天机器人披露犯罪行为挑战了技术提供方是否与医疗专业人员承担相同报告义务的问题，这在保护潜在受害者的义务与避免误报损害用户信任之间造成冲突。另一安全顾虑是过度GenAI互动可能加剧精神病性症状，GenAI的谄媚倾向可能强化妄想信念而非挑战之，或触发躁狂症状。尽管安全调优有所进展，不断增加的拟人化加大了这些风险。脆弱人群如未成年人或现实检验受损者可能将算法强化误认为真正关怀。

**未来整合**

强化资源与会话间监测：对某些由治疗师仔细筛选的来访者，AI工具可追踪会谈结束后的印象或提供反思空间供与治疗师共享。治疗师可在此空间中记录希望与来访者分享的考量、练习或情绪识别工具。这种始终由人类治疗师督导的AI支持在需要监测来访者防止自伤的高危情境中具有价值。

GenAI在临床培训与督导中的应用：基于GenAI的临床培训可在经验丰富的临床医师督导下实施，通过与呈现多样化精神病理学特征的虚拟患者互动，学生可在受保护的学习环境中练习评估和干预技能。基于大语言模型（Large Language Models, LLMs）的虚拟患者模拟为受训者提供安全空间，在接触真实来访者前练习访谈技能并获得结构化反馈。然而，持续督导仍然必要，以帮助受训者识别错误、反思其干预措施，并意识到模拟临床遭遇的局限性。在真实患者的督导中，GenAI可通过纵向分析会谈提供过程指标，反馈症状趋势、联盟关系和识别停滞的模式。LLMs还可辅助生成阐释或组织临床数据，但因缺乏对移情动态的理解，GenAI输出必须仅作为激发反思的假设，确保临床医师的自主性和伦理。

减少社会回避的潜力与风险：严重孤独个体通常比孤独感较轻者更愿意与GenAI分享亲密关切，社会孤独与更高GenAI接受度相关。对于经历 pervasive 羞耻或创伤性否定者，GenAI可被视为比感知为危险的人类关系更安全的替代。然而，GenAI的非评判性质可能虽提供从评价性目光中解脱的缓解，但其使用应保持受监管和时间限制，将GenAI能力与人类联结的转化潜力相整合。

通过沉浸式AI探索来访者的可能自我版本：虚拟现实临床应用研究显示，沉浸式环境可通过视角转换经验和不同自我版本的具身化促进自我同情、减少自我批评并增强自我保护。基于此，未来AI与治疗师的整合可特别关注"部分工作"。例如，"Introspecta VR"项目结合VR和AI，帮助用户通过可见、可叙述的身份配置探索其当下和未来自我。患者选择代表特定自我面向的场景，随后AI通过提示修改以增强唤起力，促进部分间工作，使内部冲突和阻塞更加显化。

**讨论与总结**

评估和治疗计划是AI尤其有前景的领域。初步证据表明基于AI的工具可通过整合异质性信息辅助诊断推理，潜在节省时间和提高评估可靠性。生成式模型可通过组织复杂病例材料、产生结构化病例阐释和提出治疗计划供临床医师完善来促进治疗计划制定。然而，AI应用应被框定为决策支持而非自主决策。未来实施将取决于跨环境和人群的外部验证、模型局限性的透明度，以及防止隐私泄露的防护措施。

GenAI支持的RCTs中观察到的症状减轻可能反映了GenAI生成情感支持性、个性化交流互动的能力。通过伪共情回应和部分镜像，用户可体验促进自我表达和初步情绪识别的联结感。尽管GenAI投入大量开发且情绪检测能力日益精细化，技术复杂性不应与真正治疗性同步混淆。这类系统能否真正模拟关系遭遇的深度或复制人类联结的真诚关系氛围仍存疑问。虚拟互动虽技术先进，但可能缺乏深刻的主体间基础和完整具身存在之重，而这些通常被认为是使人类治疗可信、有影响力且具转化性的根本要素。即使未来GenAI系统生成某种形式的"共振"，这些也将与人类存在质性不同。因此，GenAI最好被概念化为支持性或整合性工具，而非人类心理治疗的替代。

未受监测的GenAI使用可能损害来访者自主性，确认关于自我、他人和世界的僵化图式，存在与来访者 collude 而不促进觉察、自主性或不同关系技能的风险。值得注意的是，GenAI可能成为信念确认者，强化妄想信念、躁狂状态或攻击性态度。这些风险因现实世界采用速度正超越控制性证据而被放大，使临时防护措施的定义成为临床优先事项。另一关键要素在于训练通用LLMs和许多当前GenAI系统所使用的数据集性质：大多数模型基于大规模互联网语料库而非临床策划的心理治疗数据集训练，引发代表性、文化偏见、诊断效度和情境可靠性方面的关切。输出可能反映难以实时检测的隐藏偏见、不准确、刻板假设或临床不当关联。许多GenAI系统目前缺乏跨多样临床人群、语言和治疗情境的外部验证，增加了已知和不可预期错误的风险，尤其当应用于脆弱人群或高风险临床决策时。因此，GenAI输出应被审慎解读，始终服从临床医师督导和情境性临床判断。

未来整合应旨在支持治疗师并保护心理治疗的人性本质，发挥GenAI优势。在实践层面，AI可帮助监测会谈间变量、支持共享反思日记或提示巩固会谈工作的练习，并准备讨论材料。在培训和督导中，AI生成的结构化反馈可改善临床医师的访谈、病例阐释和技术技能。在此视角下，AI整合需要关于目标和边界的明确规则，并应嵌入活跃的人类治疗联盟中。

**研究、临床实践及弥合证据-应用差距的建议**

研究优先级：当前GenAI在心理健康领域的证据基础仍属初步。未来研究应优先采用：（i）以积极人类交付治疗而非等待列表或纯信息对照为比较对象的RCTs，并在可行时采用评估者盲法；（ii）超过8-12周的长期随访以评估症状持久性、依赖性和医源性效应；（iii）以伤害为重点的终点，包括妄想或躁狂观念强化、强迫性使用助长、自杀披露处理不当、以及寻求人类专业人员帮助行为的侵蚀；（iv）治疗效应异质性分析，识别获益者PROJECTOR（如轻中度症状、动机支持需求者）和可能受害PROJECTOR（如精神病谱系、严重孤独、未成年人）；（v）测量治疗联盟、自主性和校准错配的过程水平研究；（vi）跨文化、语言和临床情境的诊断和预测模型的独立外部验证；以及（vii）捕获现实世界使用而非理想条件试验的实施和上市后监测研究。

临床与组织实施：在更强证据出现前，建议临床医师和护理组织采取保守方法，GenAI工具应支持而非替代人类交付的护理。具体指南包括：（a）明确的知情同意和披露，说明用户正在与非感知系统互动；（b） intake 时的风险分层，排除或仔细监测高风险用户（如精神病谱系状况、活跃自杀意念或严重解离者）；（c）有时间限制和目标界定的使用（如会谈间心理教育、情绪追踪、行为演练）；（d）紧急情况下涉及人类临床医师的明确程序；（e）临床医师对GenAI输出的批判性评价培训，以 counter 自动化偏见和认知卸载；（f）符合医疗隐私框架的数据治理标准；以及（g）组织问责制，指定临床督导人员对GenAI辅助护理路径负责。

navigating 证据与采用之间的张力：患者和提供者已采用通用聊天机器人进行心理健康支持的速度明显超越现有控制性证据。因此建议：（1）专业学会发布临时实践指南，随新证据出现迭代修订；（2）监管机构（如WHO、EU AI Act、FDA）要求针对心理健康用途营销的工具进行透明度和不良事件报告；（3）临床医师主动询问患者的AI使用情况并将其整合入病例阐释；（4）心理教育澄清GenAI能做什么不能做什么，尤其关于共情、保密性和危机回应。

最终，AI是能照亮整个治疗旅程中模式并开启新可能性的强大工具，但将另一心灵置于心中的 delicate 工作必须保持其根本上的人类任务。

联系信箱：

粤ICP备09063491号

热点排行