综述：艺术欣赏与创作在抑郁症、焦虑症治疗中的应用及其对生活质量的影响：一项系统评价与荟萃分析

《The Arts in Psychotherapy》：Differences between the therapeutic use of art appreciation and production in depression, anxiety, and quality of life: a systematic review and meta-analysis

【字体：大中小】 时间：2026年04月30日 来源：The Arts in Psychotherapy 1.5

编辑推荐：

　　汉娜·莱德 | 阿尔贝托·菲尔盖拉斯中央昆士兰大学健康、医学与应用科学学院心理学系，凯恩斯，昆士兰州，澳大利亚 **摘要** 富有成效的视觉艺术疗法是一种有效的辅助疗法，能够减轻负面心理症状并提升幸福感。艺术欣赏的治疗应用显示出同样有效的干预效果，且没有潜在的负面

　　汉娜·莱德 | 阿尔贝托·菲尔盖拉斯
中央昆士兰大学健康、医学与应用科学学院心理学系，凯恩斯，昆士兰州，澳大利亚

**摘要**
富有成效的视觉艺术疗法是一种有效的辅助疗法，能够减轻负面心理症状并提升幸福感。艺术欣赏的治疗应用显示出同样有效的干预效果，且没有潜在的负面副作用。这项比较性系统评价研究了视觉艺术创作与欣赏对抑郁、焦虑和生活质量的影响。根据PRISMA指南（PROSPERO注册号CRD42024579204），系统地检索了四个数据库（PubMed、Web of Science、SCOPUS和Cochrane）中的相关文献。两名研究人员独立筛选了符合纳入标准的文献：成人参与者、采用创造性或接受性视觉艺术疗法的干预措施、对照组以及相关的结果测量指标。元分析采用了Hedges’ g值来衡量平均变化分数、敏感性分析、亚组分析、PET-PEESE分析以及独立样本t检验。最终共纳入14项研究，涉及23个相关结果指标，总样本量为1,208名参与者。叙事综合分析初步支持创造性艺术疗法在缓解抑郁和提升生活质量方面的优势。仅对焦虑进行了随机效应元分析，结果显示创造性艺术疗法的效果更显著（g=-1.062 [95% CI, -1.937 to -0.186]），而艺术欣赏的效果较差（g=-0.434 [95% CI, -6.59 to 5.72]）。敏感性分析验证了结果的稳健性，但较高的出版偏倚限制了这些发现的可靠性。风险偏倚评估显示，部分研究的质量较低。总体而言，创造性艺术疗法在减轻焦虑症状方面比艺术欣赏更有效。本文还定性地比较和讨论了艺术欣赏与创作对生活质量及抑郁的影响。

**引言**
全球范围内，心理健康问题日益严重（Wu等人，2023年）。尽管这些疾病给经济和医疗系统带来了压力，但报告和治疗的程度仍然不足（Cuijpers等人，2023年）。世界卫生组织（WHO，2022a, 2022b）建议采取具有成本效益的、跨学科的、基于社区的干预措施来减轻这一负担。艺术疗法作为一种非药物手段，在改善心理健康方面越来越受到重视。艺术疗法被定义为在治疗师引导下的创造性过程，旨在促进情感和认知健康（澳大利亚、新西兰和亚洲创意艺术疗法协会[ANZACATA]，2024年），包括视觉艺术、音乐、戏剧、舞蹈等多种形式。本综述特别关注创造性及接受性视觉艺术疗法，涵盖心理动力学、格式塔和正念等理论取向。研究表明，艺术疗法能够缓解抑郁和焦虑症状，减轻疼痛和疲劳，提升生活质量和情绪状态，但最佳干预类型尚不明确。其效果机制可能与适应性情绪调节途径的神经激活（Barnett & Vasiu，2024年）、促进意义构建的内省对话（Holt，2018年）以及引发流畅状态的持续当下意识（Csikszentmihalyi，1990年；Holt，2018年；Tang等人，2015年）有关。艺术疗法不同于一般的艺术活动，后者通常是自我导向的，侧重个人满足感，尽管也可能带来益处（Beard，2012年）。

视觉艺术疗法（VAT）是艺术疗法的一个分支，涉及绘画、雕塑、拼贴、绘画、陶艺或剪纸等视觉媒介的创作与探索（Avrahami，2006年）。多项系统评价总结了视觉艺术创作对心理健康的益处。一项元分析显示，总体健康状况有所改善（Joschko等人，2024年），主要体现在心理健康指标上。虽然大多数系统评价针对癌症患者，但证据表明视觉艺术创作能减轻焦虑和抑郁，同时提升生活质量（Han等人，2024年；Jiang等人，2020年；Zhou等人，2023年）。其效果可能归因于将抽象概念转化为具体形式、通过意象进行心理探索以及通过创作实现身体感知（de Witte等人，2021年）。这些非语言过程可能促进更深层次的情感处理。然而，视觉艺术创作也可能引发负面情绪，如挫败感、自我评判和焦虑，尤其是在参与者感到创作压力的情况下（Rankanen等人，2014年；Titus和Sinacore，2013年；Tomlinson等人，2018年）。有些人认为视觉艺术疗法过于幼稚或自我放纵，在极端情况下甚至可能加剧疼痛或焦虑（Scope等人，2017年）。虽然视觉艺术疗法具有心理益处，但在需要缓解疼痛、提升生活质量或时间有限的情境下，可能不适合使用；其他更合适的疗法可能更为合适。

艺术欣赏（AA）可能是一种更易接受的选择，且没有潜在的不良反应。虽然大多数研究关注艺术欣赏的心理影响，但新兴证据表明它也能改善心理健康。文化环境中的审美体验与整体心理健康改善有关（Wang等人，2024年）。欣赏著名画作可减轻癌症患者的焦虑和抑郁（Lee等人，2017年），并维持其生活质量（Koom等人，2016年）。患有严重精神疾病的退伍军人在接受艺术欣赏干预后情绪和自尊心有所提升（Ketch等人，2015年）。这些益处可能与激活与奖励、愉悦、共情和超越性审美体验相关的神经区域有关（Chatterjee和Vartanian，2014年；Freedberg和Gallese，2007年；Kühn和Gallinat，2012年；Markovi?，2012年；Wang等人，2024年）。长期研究表明，频繁参与艺术和文化活动可降低抑郁风险（Santini等人，2023年；Fancourt和Steptoe，2019年），且参与度越高，抑郁风险越低（Cuypers等人，2021年）。定性研究进一步强调了艺术欣赏在心理健康恢复中的作用，表明参与式艺术项目能促进联系、希望和意义感（Goodman-Casanova等人，2023年）。鉴于现有研究的局限性，有必要更细致地了解创作与欣赏对心理健康结果的差异。尽管许多研究探讨了视觉艺术疗法的心理学效应，但并未始终区分其中的主动与被动成分；专注于艺术欣赏的系统评价也未与创造性艺术疗法进行比较（Han等人，2024年；Jiang等人，2020年；Joschko等人，2024年；Zhou等人，2023年）。据我们所知，直接比较这两种方法的研究很少，结果也不一致。一项随机对照试验发现，创作艺术比单纯欣赏艺术能显著减轻负面情绪和焦虑（Bell & Robbins，2007年），但后续研究将组间差异归因于时间因素而非干预本身（Laurer & van der Vennet，2015年）。其他研究未能明确区分主动与被动参与，限制了比较的深度（Mahendran等人，2018年）。然而，一项fMRI研究发现，艺术欣赏与心理韧性相关，而被动干预由历史学家而非专业艺术治疗师进行（Bolwerk等人，2014年）。虽然有研究认为艺术欣赏具有更大的心理健康益处（Gillam，2018年），但尚未有系统评价直接比较接受性与创造性艺术疗法的心理健康效果，这表明需要进一步研究。

**方法**
本系统评价遵循了《系统评价和元分析优先报告项目》（PRISMA）指南（Moher等人，2015年）。研究方案于2024年9月20日在PROSPERO平台上预注册，并随后进行了修订（CRD42024579204）。研究问题和方法采用PICO框架（Population, Intervention, Comparators, Outcomes）来确保研究的针对性和系统性（Richardson等人，1995年）。

**纳入标准**
由于关于艺术欣赏的高质量已发表研究数量有限，本综述的纳入标准较为宽泛，涵盖结果、干预措施和人群。包括对照组可提高文献的严谨性，减少第一类错误，并获得更具普遍性的发现（Regev & Cohen-Yatzic，2018年）。

**研究要求**
研究需满足以下PICO框架要求：
1. 受试者：18岁以上的成人。
2. 干预措施：艺术疗法（创作）或艺术疗法（欣赏）。本综述仅包括视觉艺术疗法（绘画、绘画、陶艺、拼贴）。
3. 对照组：如等候名单对照组或常规护理。随机或准随机对照试验可减少观察性研究的偏倚。
4. 结果指标：主要指标包括抑郁、焦虑或生活质量的测量。

**排除标准**
患有性格障碍、创伤、物质滥用障碍或严重精神疾病（如精神分裂症、精神病性症状）的成人被排除，因为他们的临床特征和症状需求与普通人群不同，可能影响对艺术疗法的反应。认知障碍者或难以准确有效使用评估工具的参与者也被排除。住院患者（如养老院、监狱等）也被排除，因为他们的环境与日常环境不同，可能影响结果的普遍性。未在同行评审期刊上发表的文章、论文、定性研究、观察性研究、研究方案和灰色文献也被排除。

**搜索策略**
2024年9月26日，通过PubMed、Web of Science、SCOPUS和Cochrane四个电子数据库进行了系统检索，不限制发表日期。搜索策略基于纳入标准制定，包括以下关键词组合：
Population: (“成人” OR “老年人” OR “高龄者”)
Intervention: (“艺术疗法” OR “艺术欣赏” OR “艺术创作” OR “艺术干预”)
Comparator: (“相关性” OR “对照试验” OR “对照研究”)
Outcome: (“心理健康” OR “心理健康” OR “抑郁” OR “焦虑” OR “生活质量”)

**数据整理**
系统检索得到的文章标题和摘要被导入Covidence软件（Babineau，2014年）进行进一步处理。重复的文章被自动识别并进行了手动验证。两名研究人员独立且盲法地审查了所有检索到的文章的标题和摘要，以确定其相关性以及是否满足纳入标准。随后审查了剩余文章的全文。在出现分歧时，通过进一步讨论来决定文章是否被纳入研究。符合纳入标准的文章被纳入分析，同时记录了排除的原因。研究信息使用Covidence的数据提取工具进行记录（Babineau, 2014）。提取的信息包括第一作者的姓名、发表年份、国家、研究设计、样本量、研究对象、结果测量指标、艺术治疗方式以及干预组和对照组的基线值、干预后平均值和标准差（包括变化分数，如有的话）。

提取的结果数据包括每项研究中评估的抑郁、焦虑和生活质量（QoL）的测量结果。对于抑郁和焦虑，比较结果是症状的严重程度；对于生活质量，结果是测量得出的分数。如果研究包含多个随访期，则提取干预后立即的随访数据。记录了相关结果的评估工具，如果存在子量表，则提取总分。数据根据干预类型进行分组：创作或欣赏。采用了基于协议的方法，重点关注研究中定义的具有高干预依从性的参与者，这有助于在本综述中隔离出干预的效果进行比较。

研究偏倚风险评估
使用Cochrane的随机对照试验偏倚风险评估工具（RoB2）（Sterne等人，2019）来检查纳入的RCTs的内部偏倚。该评估评估了由随机化过程、偏离预定干预、结果数据缺失、结果测量以及报告结果的选择所引起的偏倚风险。使用类似的工具ROBINS-I来评估纳入的非RCTs的潜在偏倚（Sterne等人，2016）。评估结果影响了所得出结论的有效性。

效应测量
在适当的情况下，计算了连续结果（抑郁、焦虑和生活质量）的标准化平均差异（Hedges’ g的变化分数），以便比较来自不同测量工具的心理构念。选择Hedges’ g作为报告的效应大小，而不是Cohen’s d，因为它提供了更保守的估计，并且具有小样本偏倚校正，使其更加可靠且偏差较小（Hedges, 1981）。可以将其解释为效应较小（g=.20）、中等（g=.50）、较大（g=.80）或非常大（g>1）（Hedges, 1981）。尽管如此，仍进行了敏感性分析，将Hedges’ g与Cohen’s d进行了比较。

为了计算Hedges’ g的变化分数平均值，需要计算基线变化的平均值和标准差。平均变化的标准差是常见的缺失结果数据（Higgins等人，2024），因此如果没有报告，则使用以下公式进行估算（假设r=.50；Borenstein等人，2009）：
SDchange = SDbaseline^2 + SDfinal^2 - (2 × r × SDbaseline × SDfinal)

根据Cochrane手册，假设r是一个保守的估计在心理学研究中是合理的（Wampold等人，1997；Wilson, 2023，https://www.training.cochrane.org/handbook）。Hedges’ g的计算使用了在线元分析计算器（Wilson, 2023）的帮助。

综合方法
使用JASP软件进行统计分析，并辅以计算工具来帮助估算标准差。基于平均变化分数进行了元分析，以消除那些未考虑基线差异且干预后比较无意义的研究中的偏倚。当研究报告了两个结果测量指标时，为了使用元分析技术更全面地计算合并效应，实际违反了元分析中非独立效应大小的假设。研究人员承认这种选择可能会增加偏倚并影响结果的有效性（López-López等人，2017）。采用Q统计量检验来检测异质性。异质性的程度通过I2来确定，使用经验法则：低I2=25%，中等I2=50%，高I2=75%，并考虑到此类小型元分析中的偏倚风险（von Hippel, 2015）。在预期存在异质性的情况下，使用最大似然随机效应模型进行元分析；当异质性不显著时，则使用固定效应模型。逆方差加权为方差较小的研究分配更大的权重，以确保最终效应大小的计算更加精确和比例恰当。

汇总的效应大小和个体效应大小通过森林图进行可视化展示。视觉检查有助于评估异质性并指示效应的方向。在可能的情况下，进行了亚组分析，以识别异质性的来源，重点关注之前被确定为显著的亚组（例如，干预持续时间少于12周；Han等人，2024）。进行了调整系数的敏感性分析（r=.70，r=.30），以测试r=.50假设的稳健性。进一步分析了不同的效应模型和大小（表3）。通过视觉检查漏斗图并使用等级相关检验来识别出版偏倚，其中p<.05表示存在偏倚（Begg & Mazumdar, 1994；图8）。PET-PEESE分析也用于评估出版偏倚。当元分析不可行时，在结果亚组内进行了比较性叙述综合，按照Cochrane手册汇总了主要发现和统计数据（Mackenzie & Brennan, 2023）。

结果
初步搜索共找到682项研究（图1）。Covidence中的自动工具去除了183篇重复文章。两名独立研究人员（HR和AG）进行了以下选择过程：最初筛选了499个标题和摘要，排除了382篇文章。然后筛选了117篇全文，又排除了103篇文章，原因包括：干预方式错误（n=35）、研究对象错误（n=20）、研究设计错误（n=15）、无法获取全文（n=14）、通讯篇幅过短（n=6）、比较对象错误（n=5）、方法学描述不足（n=3）、结果指标错误（n=4）或文章非英文（n=2）。包含混杂因素（如正念元素）的研究被视为干预方式错误。整个过程中的分歧通过讨论解决。最终，有13项研究符合纳入标准，被纳入最终分析；其中9项是RCTs，4项是非RCTs。

下载：下载高分辨率图片（337KB）
下载：下载全尺寸图片
图1. 系统评价和元分析的优先报告项目（PRISMA）流程图

纳入研究的特征
AA和AP研究的基本特征和主要发现见表1和表2，共计1,208名参与者。这些研究发表于2009年至2024年之间，来自不同的地理区域，包括香港（n=1）、瑞典（n=1）、荷兰（n=1）、韩国（n=4）、意大利（n=1）、德国（n=1）、伊朗（n=1）、法国（n=1）、美国（n=1）和西班牙（n=1）。样本量从16人到127人不等。有4项研究（27%）专门纳入了女性参与者，4项研究纳入了60岁及以上的老年人。研究对象包括癌症患者（n=5）、抑郁症患者（n=4）、焦虑症患者（n=1）、老年人（n=2）以及脑损伤住院患者的家庭照护者（n=1）。研究场所包括艺术治疗实践场所（n=2）、精神病日间诊所（n=4）、肿瘤科病房（n=5）、日间护理中心（n=2）、康复医院（n=1）和博物馆（n=1），需要注意的是，有些研究在多个场所进行。

表1. 纳入研究的基本特征和主要发现
参与者 | 干预方式 | 结果指标 | 作者（年份） | 国家 | 研究设计 | 场所 | 对象群体 | 实验组（ATG） | 描述 | 频率（持续时间） | 对照组（CG） | 描述 | 测量时间 | 主要发现 |
| ---- | ---- | ---- | ---- | ---- | ---- | ---- | ---- | ---- | ---- | ---- | ---- | ---- |
| Abbing等人（2019b） | 荷兰 | RCT | 25个私人艺术治疗机构 | 18-65岁的成年女性，中度至重度焦虑 | n = 24 | 人智学艺术治疗 - 由合格的艺术治疗师指导 | 绘画、陶艺、绘画 | 10-12次课程，共3个月（每次60分钟） | n = 23 | 待定名单 | 焦虑（LWASQ） | 干预前后 | ATG组的焦虑显著降低，而CG组没有（p =.001） | 生活质量（MANSA） | 干预前后 | ATG组的生活质量显著提高，而CG组没有（p <.0001） |
| Choi等人（2020） | 韩国 | RCT | 精神病诊所 | 被诊断为MDD的成年人 | n = 19 | 艺术治疗 - 由艺术心理治疗师指导的结构化活动 | 每周一次，共6周（每次60分钟） | n = 16 | 按常规治疗 | 抑郁症（BDI-II） | 干预前后 | ATG组的分数显著下降（p <.001）；CG组没有显著变化。组间效应量很大（d = 1.09）；治疗与时间之间存在显著交互作用（p <.01） | |
| Choi等人（2020） | 韩国 | RCT | 精神病诊所 | 被诊断为MDD的成年人 | n = 19 | 艺术治疗 - 由艺术心理治疗师指导的结构化活动 | 每周一次，共6周（每次60分钟） | n = 16 | 按常规治疗 | 抑郁症（BDI-II） | 干预前后 | ATG组的分数显著下降（p <.001）；CG组没有显著变化。组间效应量很大（d =.86）；治疗与时间之间存在显著交互作用（p <.01） | |
| De Feudis等人（2021） | 意大利 | 非RCT（前后研究） | 医疗肿瘤科门诊 | 被收治到肿瘤科的癌症门诊患者 | n = 59 | 小组艺术治疗 - 由心理治疗师指导 | 绘画、绘画，播放“柔和背景音乐” | 1次课程（90分钟） | n = 56 | 标准护理 | 焦虑（STAI-Y状态） | 干预前后 | AT组的状态焦虑显著降低，而CG组没有（p =.002）；组与时间之间存在显著交互作用（p =.021） | |
| Geue等人（2013） | 德国 | 非RCT（前后研究） | 门诊项目 | 门诊癌症患者 | n = 54 | 艺术治疗 - 由具有心理肿瘤学培训的艺术家指导 | 绘画、绘画、书籍创作 | 每周一次，共22周（90分钟） | n = 126 | 无干预 | 焦虑（HADS） | 干预前后及6个月后 | AT组随时间没有显著变化，与CG组也没有显著差异 | |
| Ilali等人（2018） | 伊朗 | RCT | 日间护理中心 | 60岁及以上的抑郁症患者 | n = 27 | 基于生活回顾的绘画 | 每周一次，共6周（每次60分钟） | n = 27 | 无干预 | 抑郁症（GDS） | 干预前、干预后及6个月后 | AT组随时间没有显著变化，与CG组也没有显著差异 | |
| Joly等人（2022） | 法国 | RCT | 肿瘤科诊所 | 局部乳腺癌患者 | n = 125 | 创意小组艺术治疗 | 由认证的艺术治疗师指导 | 绘画、雕塑 | 8次课程，共10周（每次60分钟） | n = 127 | 标准护理 | 抑郁症（HADS） | 干预前、5个月后及11个月后 | 更多的患者报告干预后抑郁症状有所改善 | |
| Kim等人（2021） | 韩国 | 非RCT（前后研究） | 康复医院 | 住院脑损伤患者的家庭照护者 | n = 20 | 小组艺术治疗 | 由持证艺术治疗师指导 | 绘画、陶艺、盐制曼陀罗 | 每周三次，共4周（每次60分钟） | n = 21 | 无干预 | 抑郁症（CES-D Korean） | 干预前及干预后2周 | AT组报告抑郁症状显著降低（p =.004），但与CG组没有显著差异 | |
| Kim（2013） | 韩国 | RCT | 日间护理项目 | 韩裔美国老年人 | n = 25 | 小组艺术治疗 | 绘画、陶艺 | 每周三次，共4周（每次60-75分钟） | n = 25 | 标准护理 | 焦虑（STAI-1状态） | 干预前及干预后 | AT组的状态焦虑显著改变，与CG组相比（p =.001）。计算出的效应量很大（r =.84） | |
| Lee等人（2023） | 韩国 | RCT | 精神病门诊 | 被诊断为MDD且症状中度的成年人 | n = 20 | 艺术心理治疗 | 结构化课程 | 每周一次，共6周（每次50分钟） | n = 19 | 标准护理 | 抑郁症（HADS） | 干预前及干预后，5个月和11个月后 | AT组抑郁症状显著降低；CG组没有显著变化 | |
| Nan & Ho（2017） | 香港 | RCT | 精神病社区诊所 | 18-60岁的成年人，患有MDD | n = 52 | 陶艺艺术治疗 | 由合格的艺术治疗师指导 | 每周一次，共6周（2.5小时） | n = 48 | 标准护理（由社会工作者领导的娱乐课程） | 抑郁症（BDI-II-C） | 干预前、干预后及干预后3周 | AT组症状显著降低（p <.001，d = -1.1）；干预后3周AT组症状进一步显著降低（p <.001，d = -1.2）；CG组在时间上没有显著变化 |组与时间之间存在显著的交互作用效应（p <.01，ηp2 =.051）。Svensk等人（2009年）瑞典RCT：肿瘤科单元。非转移性乳腺癌女性患者=20人。艺术疗法-个体课程-绘画、素描-由受过培训的艺术治疗师指导，每周一次，持续5周（每次60分钟）。n=21；n=20。b无干预措施。生活质量（WHOQOL-BREF）：干预前、2个月后、6个月后。从干预前到2个月后，艺术疗法组（ATG）和对照组（CG）的整体生活质量没有显著差异。从干预前到6个月后，艺术疗法组的生活质量有显著改善（p =.003）。对照组没有显著变化。注：ATG艺术疗法组。

**表2. 艺术欣赏：纳入研究的基本特征和主要发现**

| 参与者 | 干预措施 | 结果 | 作者（年份） | 国家 | 研究设计 | 环境 | 人群 | 实验组（ATG） | n | 描述 | 频率（持续时间） | 对照组（CG） | n | 描述 | 结果（工具） | 测量时间 | 主要发现 |
| --- | --- | --- | --- | --- | --- | --- | --- | --- | --- | --- | --- | --- | --- | --- | --- |
| Lone等人（2021年） | 美国 | 肿瘤科单位的艺术画廊 | 接受肿瘤外科手术的患者 | n=40 | 在院内艺术画廊进行专门的艺术体验 | 1天（15分钟） | n=40 | 无干预 | 焦虑（STAI） | 干预前和干预后 | ATG组的焦虑显著降低（p <.0001）。多变量分析显示，每年至少参观艺术画廊两次与较低的焦虑水平相关（p <.01）。更频繁的艺术参与加剧了AT组焦虑的降低（p <.01）。换句话说，之前的艺术参与增强了干预的效果。 |
| Mourino-Ruiz等人（2024年） | 西班牙 | 巴塞罗那社区的博物馆 | 报告感到孤独的老年人（70岁以上） | n=63 | n=48 | 在博物馆中由引导员带领进行艺术观察 | 每周一次，持续10周（2小时） | n=75 | 无干预 | 抑郁（EVEA – Depression） | 干预前和干预后 | ATG组和CG组的悲伤/抑郁得分没有显著差异。 | 在ATG组中，出席次数较多的参与者在干预前后的“幸福感”得分显著增加（p =.005）。这与CG组和总出席次数较多的参与者有显著差异（p =.043；p =.045）。 |

**表3. 按调节因素划分的效应量边际均值估计（全模型）**

| 调节因素 | 效应量估计 | 下限 | 上限 | p值 |
| --- | --- | --- | --- | --- |
| 整体模型 | 7-1.08 | -2.24 | 0.06 |
| 持续时间 < 12周 | 4-0.82 | -2.47 | 5.08 |
| 持续时间 ≥ 12周 | 2-1.20 | -2.47 | 1.34 |
| 干预类型 | 个体 | 3-0.59 | -2.36 | 6.17 |
| 组别 | 4-1.43 | -3.23 | 3.06 |
| 地理区域 | 亚洲 | 4-1.66 | -4.09 | 3.07 |
| 欧洲 | 3-0.36 | -2.14 | 1.41 |

**注：** STAI是状态-特质焦虑量表；WEMBS是华威-爱丁堡心理健康量表。

**摘要：**
共有11项研究包含了艺术疗法（AP）干预，其中两项包含了艺术欣赏（AA）干预。艺术疗法干预高度多样化，包括绘画（n=11）、陶艺（n=6）或素描（n=8）等形式。这些干预在私人艺术治疗机构（n=2）或日间中心/诊所（n=9）中进行。艺术欣赏干预在私人艺术治疗实践中进行，而艺术欣赏干预则在肿瘤科单位的院内艺术画廊或各种社区博物馆中进行。干预频率从一次性到22周不等，持续时间从15分钟到2.5小时不等。几乎所有干预都由合格的艺术治疗师指导或由引导员协助进行，其中一项研究是患者在艺术画廊中的自我导向艺术体验（Lone等人，2021年）。表1和表2提供了关于干预的更多细节。

**风险偏倚评估：**
对纳入的随机对照试验（RCTs）的风险偏倚评估显示质量较低至中等（图2a）。只有三项研究在随机化过程中报告了分配隐藏措施。除了一项研究外，所有研究都因依赖自我报告评估而存在检测偏倚。研究人员实施干预并评估结果的研究进一步加剧了偏倚（例如Kim，2013年）。值得注意的是，Abbing等人（2019b）通过使用盲法评估者减少了这种偏倚。缺乏研究预先注册或透明的数据计划进一步影响了报告结果的选择。两项研究在特定领域显示出高偏倚。Choi等人（2013年）由于对照组退出导致结果数据缺失而产生偏倚（有利于比较组），Nan & Ho（2017年）承认对照组的结果测量偏倚较高，因为对照组参与度较低。所有研究在偏离预定干预方面偏倚较低。偏倚评估的总结见图3a。

**叙事综合：**
**焦虑：** 从五项研究中提取了七项艺术疗法相关的焦虑测量数据。六项测量数据显示，与基线相比，焦虑症状有所减少，并且实验组与对照组之间存在显著差异（Abbing等人，2019b；Choi等人，2020；De Feudis等人，2021；Kim，2013）。在艺术疗法干预3个月后，身体、行为和认知领域的焦虑显著下降（Abbing等人，2019b）。只有Geue等人（2013）发现，在22周的艺术干预后，肿瘤患者的焦虑症状没有显著减少。
**抑郁：** 九项艺术疗法研究考察了抑郁情况，其中两项使用了多种测量方法。七项研究在干预前后测量了抑郁症状，发现实验组的抑郁症状显著减少，尽管Kim等人（2021）发现与对照组没有差异。除Kim等人（2021）外，大多数报告显著性的研究涉及的参与者被诊断为重度抑郁症（MDD）。Geue等人（2013）对肿瘤患者的研究未发现显著差异。同样，Joly等人（2022）发现，虽然78%的癌症患者报告症状有所改善，但与对照组相比没有显著差异（p=.097）。只有一项艺术欣赏研究测量了报告感到孤独的参与者的抑郁情况（Mourino-Ruiz等人，2024），其中悲伤/抑郁得分没有显著差异。有趣的是，干预后实验组的幸福感得分高于对照组。
**生活质量：** 三项艺术疗法研究测量了生活质量。所有测量都使用了不同的工具，这突显了评估和有效比较这一概念的难度。两项研究涉及一对一的生产性艺术治疗课程（Abbing等人，2019b；Svensk等人，2009）。Abbing等人（2019b）发现，与对照组相比，焦虑成人女性的生活质量显著提高（p<.0001）。然而，Svensk等人（2009）发现5周干预后生活质量没有显著提高，但6个月后与对照组相比有显著改善（p=.003）。Joly等人（2022）发现，除了FACT-G工具中的社会/家庭福祉领域外，生活质量没有差异。效应大小和模型的敏感性分析。
空单元格
空单元格
空单元格
95%置信区间
空单元格
空单元格
空单元格
分析
Na
SMD
下限
上限
异质性
效应模型（Hedges’ g）
随机效应模型
7 -1.06
9 -1.9
-0.19
0.03
Q(6)=33.02，p<.001；I2=86.67%
固定效应模型
7 -0.67
7 -1.27
-0.09
0.03
Q(6)=33.02，p<.001；I2=86.67%
效应大小（随机效应模型）
Hedges’ g
7 -1.06
9 -1.9
-0.19
0.03
Q(6)=33.02，p<.001；I2=86.67%
Cohen’s d
7 -1.07
-1.95
-0.19
0.03
Q(6)=33.2，p<.001；I2=86.74%

为了确定是否存在发表偏倚，进行了漏斗图分析和等级相关性测试。通过视觉检查发现存在不对称性（图8）。等级测试的结果也表明存在显著的发表偏倚（p=.01）。PET-PEESE测试进一步证实了其存在（PET：p=.018），这表明样本量较小且标准误差较大的研究可能影响了观察到的效应。PEESE用于调整发表偏倚，得出的效应大小显著减小（g=-0.125 [95% CI，-.465至.214]）。这表明，尽管敏感性分析显示结果稳健，但由于发表偏倚以及文献中包含的具有显著结果的小规模研究的过度代表，合并效应大小可能被夸大了。

独立样本t检验
进行了独立样本t检验，直接比较了AA和AP干预措施在减轻焦虑方面的效果。使用Hedges’ g变化分数，结果显示两组之间没有统计学上的显著差异，t(7)=.902，p=.397。Shapiro-Wilk检验表明正态性假设得到合理满足（W=.837，p=.054）。由于AA研究样本量较小，无法进行Levene方差齐性检验。这提供了证据，表明AA和AP在减轻焦虑症状方面没有显著差异。

抑郁
虽然无法在AA和AP研究之间进行比较，但仍然对六项研究（8次测量）进行了元分析，以汇总AP对抑郁的影响。分析显示异质性处于中等水平（Q(7)=15.71，p<.05；I2 = 46.79%）。使用最大似然随机效应模型显示，AP在干预后对减轻抑郁症状有中等程度的显著效果（g=-.572 [95% CI，-.898至-.247]）。由于无法与AA研究进行比较，因此没有进一步分析。

生活质量
由于AA研究数量较少，也无法对生活质量（QoL）研究进行比较，但使用三项研究生成了AP对QoL影响的合并效应大小，显示异质性处于中等水平（Q(2)=7.99，p<.05；I2 = 60.57%）。最大似然随机效应模型显示AP对提高QoL有非显著的中等效果（g=.53 [95% CI，-.795至1.86]）。

讨论
本系统评价和元分析综合了比较视觉艺术创作（AP）和艺术欣赏（AA）干预措施对心理健康结果（特别是焦虑、抑郁和生活质量（QoL）影响的对照研究。共有13项研究符合纳入标准，涉及来自不同文化和临床背景的1,208名参与者。与世界卫生组织（WHO）（2022年）关于成本效益高和基于社区的干预措施的呼吁一致，研究结果支持AP是一种可行且有效的改善心理健康的策略。然而，由于AA研究数量有限且研究质量存在差异，AP和AA之间的差异需要细致解读。

来自本元分析的定量证据表明，AP在减轻焦虑症状方面显示出显著的大效应，而AA虽然在个别研究中有益，但合并效应并不显著。这与先前的研究结果一致，即创作艺术可以激活适应性情绪调节网络（Barnett & Vasiu, 2024）并通过具象化和象征主义鼓励自我表达（de Witte et al., 2021）。虽然这些机制可能是AP减轻焦虑的原因，但也不能忽视情境因素（如持续时间、引导方式和参与者特征）的潜在影响。观察到的异质性（I2 = 86.67%）表明方法上的多样性，而非效应方向的不一致性。尽管如此，独立样本t检验显示AA和AP在减轻焦虑方面没有显著差异，表明即使通过不同的机制，当适当结合情境时，接受性和创造性艺术疗法可能提供相同水平的心理益处。

尽管在焦虑症状方面发现了一致的改善，但存在发表偏倚，通过PET-PEESE调整后，合并效应减小到了一个微小且不显著的水平。这意味着具有显著发现的小规模研究可能对整体结果产生了不成比例的影响，这与之前的艺术疗法综合研究中的观察结果一致（Joschko et al., 2024）。尽管敏感性分析在不同统计假设下确认了合并估计的稳健性，但效应大小的膨胀表明需要谨慎解读这些结果。这些发现强调了需要进行更大规模、预先注册的随机对照试验（RCT）并采用透明报告，以加强AP和AA在减轻焦虑方面的证据基础。

关于抑郁，AP在减轻抑郁症状方面表现出有效性，这与之前关于视觉艺术疗法在心理健康方面的研究结果一致（Han et al., 2024, Jiang et al., 2020, Zhou et al., 2023）。这与理论观点一致，即无论采用何种形式，创作艺术都有助于促进内省对话和生活意义（Holt, 2018），有助于情感和认知过程的重新整合。然而，由于缺乏AA研究的比较，无法对AP和AA在抑郁方面的效果进行对比。

尽管无法对QoL研究进行比较，但使用三项研究生成了AP对QoL影响的合并效应大小，显示异质性处于中等水平（Q(2)=7.99，p<.05；I2 = 60.57%）。最大似然随机效应模型显示AP对提高QoL有非显著的中等效果（g=.53 [95% CI，-.795至1.86]）。

讨论
本系统评价和元分析综合了比较视觉艺术创作（AP）和艺术欣赏（AA）干预措施对心理健康结果（特别是焦虑、抑郁和生活质量（QoL）影响的对照研究。共有13项研究符合纳入标准，涉及来自不同文化和临床背景的1,208名参与者。与WHO（2022年）关于成本效益高和基于社区的干预措施的呼吁一致，研究结果支持AP是一种可行且有效的改善心理健康的策略。然而，由于AA研究数量有限且研究质量存在差异，AP和AA之间的差异需要细致解读。

定量证据表明，AP在减轻焦虑症状方面显示出显著的效果，而AA虽然在个别研究中有益，但合并效应并不显著。这与先前的研究结果一致，即创作艺术可以激活适应性情绪调节网络（Barnett & Vasiu, 2024），并通过具象化和象征主义鼓励自我表达（de Witte et al., 2021）。虽然这些机制可能是AP减轻焦虑的原因，但也不能忽视情境因素（如持续时间、引导方式和参与者特征）的潜在影响。观察到的异质性（I2 = 86.67%）表明方法上的多样性，而非效应方向的不一致性。尽管如此，独立样本t检验显示AA和AP在减轻焦虑方面没有显著差异，表明即使通过不同的机制，当适当结合情境时，接受性和创造性艺术疗法可能提供相同水平的心理益处。

尽管在焦虑症状方面发现了一致的改善，但存在发表偏倚，通过PET-PEESE调整后，合并效应减小到了一个微小且不显著的水平。这意味着具有显著发现的小规模研究可能对整体结果产生了不成比例的影响，这与之前的艺术疗法综合研究中的观察结果一致（Joschko et al., 2024）。尽管敏感性分析在不同统计假设下确认了合并估计的稳健性，但效应大小的膨胀表明需要谨慎解读这些结果。这些发现强调了需要进行更大规模、预先注册的RCT，并采用透明报告，以加强AP和AA在减轻焦虑方面的证据基础。

关于抑郁，AP在减轻抑郁症状方面表现出有效性，这与之前关于视觉艺术疗法在心理健康方面的研究结果一致（Han et al., 2024, Jiang et al., 2020, Zhou et al., 2023）。这与理论观点一致，即无论采用何种形式，创作艺术都有助于促进内省对话和生活意义（Holt, 2018），有助于情感和认知过程的重新整合。然而，由于缺乏AA与抑郁效果的比较，这反映了文献中的一个持续空白，因为很少有AA研究评估这一结果。唯一一项研究抑郁的AA研究（Mourino-Ruiz et al., 2024）未发现显著变化，尽管幸福感得分有所提高，这表明可能存在与情绪相关的效果。因此，尽管AP在抑郁方面似乎更有效，但AA的潜力仍有待进一步研究。

关于QoL，总体结果混合且不显著，尽管个别AP研究报告了后期改善，这表明可能存在持续或累积效应。由于QoL是一个包括身体、情感和社会福祉的多维构念，可能需要更长的随访时间来检测变化。Svensk et al.（2009）在干预后六个月观察到此类改善，支持通过艺术进行治疗可能产生持久而非即时效果的观点。尽管唯一一项评估QoL的AA研究未发现显著改善，但那些依从性较高的参与者报告了更大的QoL改善可能性（Mourino-Ruiz et al., 2024）。鉴于使用的工具数量有限且存在异质性，未来的研究应标准化QoL测量方法，以便进行更准确的跨研究比较。

方法学变异性和偏倚风险在纳入的研究中显示出显著限制。大多数研究缺乏分配隐藏措施，且未实施盲法评估程序，增加了偏倚风险。非RCT研究由于未控制的人口统计差异和心理社会支持的不一致性而显示出更多偏倚（例如，Geue et al., 2013）。这些方法学问题与之前对艺术疗法研究的评论中的担忧相似（Jenabi et al., 2023, Joschko et al., 2024），强调了在创造性和心理社会干预中保持方法学严谨性的挑战。未来的研究应通过改进随机化、盲法程序、预先注册和监测来解决这些限制。

干预持续时间、形式和引导方式的观察到的异质性与先前的研究结果一致，即艺术疗法的好处是情境依赖的（Abbing et al., 2018）。团体干预比个体形式显示出更低的焦虑水平，这可能是由于增强了社会联系和相互验证。这些机制与定性证据一致，强调了参与式艺术如何创造意义、希望和归属感（Goodman-Casanova et al., 2023）。然而，由于研究数量较少，目前无法进行统计确认。未来需要进一步研究AA和AP的关系和社会维度。

从实际角度来看，本研究的结果支持将基于视觉艺术的干预措施整合到社区和临床心理健康项目中（Jenabi et al., 2023, Joschko et al., 2024）。在可以进行积极自我表达且提供治疗引导的情境中，AP可能特别适用，而在资源有限或存在物理或心理障碍阻止积极参与的情境中，AA可以作为一个可行的选择。这些发现与WHO（2022年）关于跨学科、基于社区的心理健康策略的建议一致，并强调了艺术参与作为补充性、非药物方法的心理健康和情感福祉的作用。

局限性
在解释本研究结果时必须承认几个局限性。符合条件的AA研究数量较少，限制了比较分析，无法得出关于AP和AA干预效果差异的明确结论。尽管AP在减轻焦虑和抑郁症状方面表现出显著效果，但证据在方法学上存在异质性，包括干预持续时间、频率、交付形式和引导者专业水平的差异。许多研究缺乏严格的方法学控制，包括分配隐藏、盲法程序和预先注册，引入了潜在的检测和报告偏倚。自我报告措施占主导地位，缺乏外部有效性验证的工具或策略，进一步增加了主观反应效应和社会期望的影响。此外，排除了非英文出版物和包含混杂因素（如正念）的研究，可能降低了评估的准确性。存在发表偏倚，较小规模的研究产生了较大的效应，表明合并估计被夸大，文献中积极结果的过度代表。另一个局限性是研究结果测量的不一致性，特别是对于QoL，不同的工具限制了可比性和综合。尽管敏感性分析支持统计结果的稳健性，但高异质性表明未考虑的情境或方法学因素可能影响了统计效果。由于纵向随访数量有限，限制了对观察结果的持久性的理解，例如Svensk et al.（2009）报告的后期效果可能被忽视。因此，虽然本综述提供了当前证据的重要综合，但在解释结论时应谨慎考虑这些方法学和情境限制。

未来建议
未来的研究应通过实施更大规模、多中心的随机对照试验来解决本研究中指出的局限性，这些试验应采用严格的方法学设计，包括预先注册、盲法程序、超越自我报告的多样化工具测量以及标准化的干预方案。应更多地纳入不同人群和情境，以提高普遍性，并明确AP和AA之间的差异是人群依赖的还是形式特定的。应采用标准化和验证的结果测量方法，特别是对于QoL，以促进未来的元分析。方法学上，应优先考虑至少6个月的纵向随访设计（Svensk et al., 2009），以评估效果的可持续性。未来的研究还应结合定性方法，以阐明潜在机制，探索具象化、象征主义和审美体验如何促进心理变化。

在科学写作中声明生成式AI的使用
在准备本工作时，Alberto Filgueiras使用了Grammarly和Microsoft Co-Pilot来提高可读性和文本清晰度。使用这些工具/服务后，作者根据需要审查和编辑了内容，并对出版物的内容负全责。

PROSPERO注册声明
本系统评价已前瞻性注册到国际系统评价注册库（PROSPERO）。
注册编号：CRD42024579204
链接：https://www.crd.york.ac.uk/prospero/display_record.php?ID=CRD42024579204
所有协议修订均按照PROSPERO指南记录和更新。

未引用的参考文献
（澳大利亚，2024；Cuypers et al., 2012；López-López et al., 2017；McGuinness and Higgins, 2020；Mouri?o-Ruiz et al., 2024；Regev and Cohen-Yatziv, 2018；世界卫生组织（WHO），2022a；世界卫生组织（WHO），2022b）

CRedI作者贡献声明
Alberto Filgueiras：撰写——审阅与编辑、监督、软件使用、项目管理、数据管理、概念化。
Hannah Ryder：撰写——初稿、验证、方法学、正式分析、数据管理、概念化。

关于写作过程中生成式AI和AI辅助技术的声明
本手稿的部分内容使用了生成式人工智能（ChatGPT、Grammarly）进行语言优化、文本组织和非分析性任务的辅助（例如，格式化摘要、提高清晰度和校对）。所有数据提取、解释、统计分析、方法学决策和最终智力内容均由作者完成。作者仔细审查并验证了所有AI辅助的文本，以确保准确性、适当性和符合学术和伦理标准。

利益冲突
作者没有需要披露的利益冲突。

热点排行