《The Lancet Psychiatry》:Randomised controlled trials of psychological interventions treating common mental disorders in adults of Chinese descent: a systematic review of trial quality and credibility
编辑推荐:
自2000年以来,针对华裔人群常见精神障碍的心理干预随机对照试验数量有所增加,这可能为心理干预的跨文化有效性提供重要证据。主要基于北美和欧洲的心理干预随机对照试验系统综述一致发现了方法学缺陷;但华裔人群证据的质量尚未得到全面评估。本系统综述旨在描述华裔(即汉族
自2000年以来,针对华裔人群常见精神障碍的心理干预随机对照试验数量有所增加,这可能为心理干预的跨文化有效性提供重要证据。主要基于北美和欧洲的心理干预随机对照试验系统综述一致发现了方法学缺陷;但华裔人群证据的质量尚未得到全面评估。本系统综述旨在描述华裔(即汉族人群)常见精神障碍心理干预随机对照试验的方法学与可信度特征。
在本系统综述中,研究人员检索了MEDLINE、Embase、PsycINFO、CNKI和WANFANG,以识别从建库至2025年9月1日以英文或中文发表的符合条件的随机对照试验。研究人员纳入了针对18岁及以上、诊断为常见精神障碍的华裔成年人(至少80%为汉族)的心理干预试验。12名评审人员独立且重复地进行纳入标准筛选并提取研究特征、汇总结局数据及期刊特征的数据。使用结构化质量框架评估纳入试验的设计、实施、报告及结局。研究人员计算各组干预后标准化均值差,以描述报告效应的分布。研究人员让具有相关生活经历的人员参与研究及撰写过程。本研究已在PROSPERO注册,CRD42023394956。
通过数据库检索,研究人员识别出37?787项研究,其中857项随机对照试验(涵盖75?143名受试者)被纳入本综述。研究人员发现,34项(4%)研究报告了已注册的试验方案,398项(46%)采用了充分的随机化方法,21项(2%)使用了有效的分配隐藏,78项(9%)进行了结局评估者盲法,32项(4%)进行了意向性治疗分析,78项(9%)引用了所实施干预的治疗手册。417项(49%)研究引发了对数据真实性的担忧,其中位数效应量(g=2·06)是未发现担忧的440项(51%)研究效应量(g=0·96)的两倍以上。充分随机化方法的报告从2006年前18项研究中无一项报告,提升至检索范围最后5年内257项研究中179项(70%)。纳入研究发表于278种期刊,其中188种(68%)期刊未提供可获取的试验报告指南,仅41种(15%)引用了既定的报告指南。
本系统综述发现,大量随机对照试验在试验报告、方法学严谨性及数据真实性方面存在局限,这引发了对证据质量的担忧。需通过方法学培训、监管基础设施和期刊监督等系统性努力,以改善这一不断增长的证据体的可信度及其贡献。
无资助来源。
**论文解读:华裔成年人常见精神障碍心理干预随机对照试验的质量与可信度系统综述**
**研究背景与问题**
心理干预已成为全球多数医疗体系中精神障碍治疗的核心方法,且较药物干预更受患者偏好。然而,心理干预证据的质量一直是国际公认的挑战,《柳叶刀-精神病学》委员会(Lancet Psychiatry Commission)曾强调此问题。随机对照试验(RCT)被视为评估干预效果的可靠实验设计,但以北美和欧洲为主的RCT系统综述一致发现方法学缺陷,包括报告不充分(如治疗方案的细节)、透明度不足(如前瞻性试验注册)及方法学严谨性欠缺(如结局评估者盲法)。
针对华裔人群(即汉族人群)的精神健康研究近年来快速增长,大量RCT报告了心理干预对常见精神障碍(包括抑郁症、焦虑障碍、创伤后应激障碍)的有效性。然而,该人群心理干预试验质量的系统评价尚属空白。研究人员此前关于文化适应干预的系统综述已发现报告不足问题,但缺乏对整体试验质量、数据真实性及期刊监督的全面评估。因此,本系统综述旨在:①识别并描述华裔人群常见精神障碍心理干预RCT的特征;②评估试验质量(可靠性、有效性、可信度);③分析发表这些试验的期刊的编辑流程与要求。
**研究方法**
研究人员系统检索MEDLINE、Embase、PsycINFO、CNKI和WANFANG(从建库至2025年9月1日),纳入以中文或英文发表的、针对18岁以上华裔成年人(至少80%汉族)常见精神障碍的心理干预RCT。研究团队包括4名华裔作者和2名有相关生活经历的人员,全程参与研究设计、筛选、质量评估及撰写。
关键技术方法包括:①多维证据评估框架:基于CONSORT声明、TIDieR清单、Cochrane偏倚风险工具(RoB 2)及INSPECT-SR工具(Investigating Problematic Clinical Trials in Systematic Reviews),评估试验注册、随机化、分配隐藏、盲法、脱落处理、数据真实性(如重复数据、统计不可能值、临床不合理效果)等;②效应量计算:使用metafor包(R 4.5.3)计算Hedges' g,因异质性高未进行荟萃合并,仅描述性报告;③期刊评估:检索SCI-E及中国核心期刊目录,分析网站上的编辑政策与报告要求。数据由12名评审人员独立双盲提取,争议通过共识解决。
**研究结果**
1. **研究特征**:共纳入857项RCT(75?143名受试者),发表于1996年至2025年,92%发表于2010年后,93%为中文发表,98%由中国大陆机构完成。主要针对抑郁症(66%)、焦虑障碍(31%)。最常测试的干预为认知行为治疗(CBT,29%)、心理护理干预(22%)、正念干预(9%)及森田疗法等文化特异性治疗(4%)。对照组主要为常规治疗(90%)。
2. **方法学质量**:仅4%报告了注册试验方案(其中14项为回顾性注册),46%描述了充分随机化方法,2%采用有效分配隐藏,9%报告结局评估者盲法,4%进行意向性治疗分析,9%引用治疗手册。报告充分随机化方法的研究从2006年前的0%提升至近5年的70%,但试验注册、意向性治疗分析等指标仍极低。效应量中位数(Hedges' g)为1.35,但方法学充分的研究效应量显著较小(注册试验g=0.63 vs 未注册g=1.39;意向性治疗分析g=0.58 vs 未报告g=1.38)。
3. **数据真实性**:49%的研究至少未能通过一项数据合理性检查(如标准差小于量表范围5%、治疗后均值聚集在量表最低十分位、两组变化幅度异常),这些研究的效应量中位数(g=2.06)是未通过检查研究(g=0.96)的两倍以上。2%的研究存在与其他研究重复的数据,45%的研究报告了不合理的压缩方差。
4. **期刊特征**:857项研究发表于278种期刊,其中68%的期刊网站未提供任何试验报告指南,仅15%引用CONSORT等指南,17%要求试验注册,37%要求伦理批准。即使期刊有明确要求,仍存在63%的研究未注册试验方案等不遵守情况。
**讨论与结论**
本系统综述发现,华裔人群心理干预RCT数量快速增长,但试验报告、方法学严谨性和数据真实性问题突出,与北美和欧洲的研究一致但更为严重。效应量异常偏大(中位数g=1.35,国际文献中CBT与常规治疗比较的g范围多为0.03~1.69),且方法学充分的研究效应量更接近国际水平,提示质量缺陷可能夸大疗效估计。
研究的局限包括:仅检索了两个中文数据库(CNKI和WANFANG),可能遗漏部分试验;因报告不完整无法评估方法学;缺乏中国本地作者背景限制了解释深度。
研究结论:华裔人群心理干预RCT的证据基础正在快速积累,但需在临床试验方法学方面进行实质改进。对试验设计、实施和报告的严格审查至关重要,以确保该研究能可靠指导临床实践并为全球精神健康证据库做出贡献。系统性努力包括方法学培训、监管基础设施完善及期刊监督加强,从而提升证据的可信度。论文发表于《The Lancet Psychiatry》。