《Child's Nervous System》:Systematic review of the quality, readability, and reliability of web-based pediatric neurosurgical patient education information
编辑推荐:
背景:家长、照护者及儿科患者日益依赖互联网了解复杂的诊断与治疗方案。然而,此类内容大多缺乏监管,其质量、准确性与可读性标准界定不清。本研究旨在总结现有评估在线小儿神经外科信息质量的文献,明确优化数字内容的路径。
方法:采用系统评价方法,检索PubMed、MED
背景:家长、照护者及儿科患者日益依赖互联网了解复杂的诊断与治疗方案。然而,此类内容大多缺乏监管,其质量、准确性与可读性标准界定不清。本研究旨在总结现有评估在线小儿神经外科信息质量的文献,明确优化数字内容的路径。
方法:采用系统评价方法,检索PubMed、MEDLINE及Web of Science数据库,纳入评估神经外科疾病与操作相关在线内容质量与可读性的研究。排除无原始数据、未使用验证后质量评估工具或非神经外科主题的研究。
结果:共纳入42项研究,覆盖1456个网站与1960个视频,累计浏览量超2.51亿次。其中仅6项研究聚焦儿科人群。儿科专项研究中,DISCERN平均得分36.6±13.2(16–80分制),JAMA基准平均得分2.68±0.83(0–4分制),全球质量评分(GQS)为3.05±0.67(1–5分制),总体处于低至中等质量水平。与仅针对成人的研究相比,儿科导向内容质量得分略高,但两组均未达公认标准。可读性分析显示,多数资源阅读难度超出面向患者与照护者的推荐水平。
结论:本综述表明,在线小儿神经外科相关内容质量差异显著,总体处于中至差水平。针对儿科资源的专项研究仍十分有限,现有内容常无法满足照护者与家庭所需的可读性与质量标准。
方法
本研究为系统评价,遵循国际前瞻性系统评价注册库(PROSPERO)预注册方案,并依据系统评价与荟萃分析优先报告条目(PRISMA)规范开展,以保障方法学严谨性与透明度。检索覆盖PubMed、MEDLINE及Web of Science数据库,时限为2015年至2025年,旨在捕捉各平台的最新相关数据。纳入标准为:评估面向公众的神经外科疾病、操作或诊断相关的公开在线内容,包括网站、搜索引擎结果及数字媒体平台,且至少采用一种验证后质量评估工具。排除标准包括:非神经外科主题(如疾病预防、非手术治疗或普通外科、骨科、神经内科学等邻近专科内容);面向医学生或医疗专业人员而非患者或公众的内容;仅分析参与度趋势或患者体验而未评估信息质量的研究;仅评估可读性指标的研究;无原始数据的二次文献(如系统评价、观点述评、社论等);未采用验证后质量评估工具的研究;非神经外科医师或神经外科科室主导完成的研究。研究筛选由两名研究者独立按预设标准完成,标题摘要初筛与全文复筛均实施双人背靠背评审,分歧通过讨论解决,全程采用Rayyan软件管理以减少偏倚。
结果
初筛共识别3740条记录,去重后剩余1659篇进行标题摘要筛查,排除1548篇后111篇进入全文评审,最终纳入42项研究。其中仅6项聚焦儿科人群,29项评估视频资源,11项评估网站资源,2项评估人工智能生成内容。纳入研究共覆盖1456个网站与1960个视频,累计浏览量超2.51亿次,凸显在线神经外科信息的广泛传播度与质量管控的重要性。
整体而言,经验证工具评估,多数网站与视频质量未达标。常用质量指标总体处于低至中等水平:27项研究的DISCERN平均得分36.1±9.5(16–80分制);14项研究的JAMA基准平均得分1.94±0.63(0–4分制);12项研究的改良DISCERN平均得分2.58±0.91(0–5分制);10项研究的全球质量评分(GQS)平均2.45±0.63(1–5分制)。其余少见指标中,2项研究的美国疾病控制与预防中心(CDC)清晰沟通指数平均为53.1±19.0(0–100分制);2项研究的HONcode评分平均为5.31±2.30(0–16分制);1项研究的患者教育材料评估工具(PEMAT)可理解性得分86.6%±6.3%,可操作性得分54.6%±34.4%。上述结果一致表明,当前在线神经外科信息质量总体偏低,在可靠性、清晰度与实践指导层面存在显著不一致。
儿科神经外科内容在研究体系中代表性严重不足,尽管其在临床实践中对应高需求人群。即便在有限的儿科研究中,质量表现仍优于成人研究但未达标准:儿科专属研究的DISCERN平均得分36.6±13.2(4项研究),高于成人专属研究的34.6±12.8(25项研究);JAMA基准平均得分2.68±0.83(1项研究)高于成人组的1.89±0.62(13项研究);GQS平均3.05±0.67(2项研究)高于成人组的2.30±0.49(7项研究);CRAAP评分在儿科与成人各1项研究中分别为24.9±5.7与23.9±6.4,组间差异微小。这提示,尽管面向儿科受众的神经外科内容质量略优于成人内容,但整体仍远低于优质患者教育材料的阈值。
可读性分析显示,绝大多数材料阅读难度处于高中或大学水平,远超推荐的6–8年级标准。多项研究指出,无论来源为学术机构还是私人诊所,材料常达到或超过10年级阅读水平。这种可读性差距显著限制了可及性,尤其对低健康素养或英语非母语人群而言。即便内容准确,过高复杂度也会削弱其实用性,干扰知情决策。值得注意的是,尚无纳入研究专门评估儿科神经外科在线信息的可读性,但现有广义神经外科证据表明,儿科资源可读性略优于整体神经外科教育资源,前者Flesch阅读易读度(FRE)约41.1、Flesch-Kincaid年级水平(FKGL)约12.8,后者FRE约38.9、FKGL约12.9,二者均显著高于推荐阈值。跨外科亚专科比较亦显示,儿科外科资源可读性普遍略高于神经外科、胸外科、血管外科及整形外科,但所有专科均远超推荐水平。新兴研究提示,人工智能与大语言模型(LLM)有望通过简化文本提升儿科神经外科材料可读性,或为弥合健康素养差距提供可行路径。
不同神经外科疾病的在线信息质量存在显著差异。脑肿瘤、脊柱手术相关内容数量较多,但准确性与完整性异质性极强。动脉瘤、创伤性脑损伤、清醒开颅术及前路腰椎椎间融合术(ALIF)、经椎间孔腰椎椎间融合术(TLIF)相关内容在质量与教育价值上普遍评级偏低。与之相对,髓母细胞瘤相关视频是少数整体质量达良好水平的儿科主题;颈椎骨折、深部脑刺激相关视频质量处于中等水平;胶质母细胞瘤、动静脉畸形、慢性疼痛与脊髓刺激相关网站质量中等;脑膜瘤相关网络资源质量从中等到良好不等,学术健康平台内容尤佳。而脑肿瘤相关短视频、脊柱手术相关社交媒体帖子等则属于极低质量范畴,几乎无可靠教育价值。
讨论
儿科神经外科内容与整体神经外科内容的质量对比
成人与儿科神经外科文献的总体质量指标均处于差至中等水平,远低于优质患者教育材料阈值。常见缺陷包括内容过时、无参考文献标注、未说明治疗风险与替代方案。短视频平台因强调时长限制与流量属性,难以承载准确、完整的神经外科信息,脑肿瘤相关内容质量尤低,普遍存在信源缺失与过度简化问题。儿科内容虽总体略优于成人内容,但仍存在可靠性不足、完整性欠缺、信源透明度低、循证指导匮乏等问题。现有儿科资源常无法匹配照护者需求,多侧重流量吸引而非全面循证教育,网站内容普遍存在作者信息不透明、参考文献缺失、并发症与替代方案讨论不足等问题。考虑到儿科神经外科决策的复杂性与照护者在共同决策中的核心作用,这种内容缺口可能导致焦虑加剧、误解增多及对低质量信源的依赖。
儿科神经外科内容与整体神经外科内容的可读性对比
绝大多数在线神经外科内容阅读难度超出推荐水平,6–8年级标准常被突破,大量材料达到10年级以上水平,严重限制低健康素养人群的可及性。儿科神经外科资源虽可读性略优于成人神经外科内容,但二者均远高于推荐阈值。这种可读性壁垒会削弱信息的实际效用,即便内容准确也难以支撑有效知情决策。值得注意的是,人工智能工具虽存在自身局限,但已有研究显示其在优化儿科神经外科材料可读性方面具有潜力,可通过文本简化帮助缩小健康素养差距。
儿科神经外科内容的代表性不足
儿科神经外科在在线健康信息研究中占比极低,针对儿童、青少年及其照护者的专项评估十分有限。现有儿科资源常覆盖范围狭窄,对诊断、治疗方案、预期结局与长期术后管理的核心信息多有遗漏,且极少考虑年龄适配解释、心理社会因素与患儿发育背景。这种缺口在高压决策场景下尤为突出,易导致家庭焦虑升高、误解加深及对非循证信源的依赖。因此,亟需扩充高质量、高可及性、以照护者为中心的儿科神经外科数字资源,以支撑全周期诊疗中的知情决策与共同决策。
高质量内容的相关影响因素
研究一致表明,学术机构、医院及专业学会发布的在线神经外科内容质量显著高于私人诊所或个人创作者内容。机构背书资源更易满足验证后质量标准,倾向于平衡呈现信息、标注科学证据、披露作者信息、全面覆盖治疗风险与替代方案。标注发布日期、更新记录或获得HONcode认证的资源,质量得分普遍更高;而侧重营销、透明度低的私人诊所网站,可靠性与客观性得分更低。内容时效性亦影响质量,较新的视频在各评分体系中表现更好。信息深度同样是质量预测因子,较长时长视频通常得分更高。包含动画、风险因素讨论、清晰治疗方案解释、专业配音或字幕的内容,质量更优。新兴证据还提示,基于人工智能的患者教育工具可能提供更高信息质量,其表现优于传统在线资源,但需警惕其潜在偏差。
流行度不等于质量
高浏览量、点赞量与分享量并不等同于高质量。大量高传播度视频与网站在DISCERN、GQS、JAMA基准等工具中得分极低。非专业人士制作的娱乐化、推广类内容,往往比机构背书的教育内容获得更多关注,例如清醒开颅术中演奏音乐的片段极易引发传播,但教育价值有限。本综述记录的2.51亿次累计浏览主要集中在YouTube,TikTok等短平快平台的真实触达量可能因未公开数据而被低估。部分增强传播度的元素(如图表、解剖讲解、动画)虽与质量得分小幅正相关,但绝非可靠教育的保障。这种参与度与教育价值的脱节,提示算法更倾向于推送娱乐化或简化内容,而非准确、深度的信息,患者极易被表面高流量的资源误导。因此,临床医师需警示患者勿仅依赖高热度信源,应引导其选择循证、可靠的平台。
治疗风险与替代方案信息缺失
大量在线神经外科资源未充分提供手术相关风险、并发症及替代治疗方案信息。多数内容仅介绍适应证与总体结局,极少平衡讨论潜在危害或非手术选项,这种缺失会损害知情同意有效性,导致患者对疗效产生不切实际的期待。高质量资源虽更可能填补此类缺口,但整体而言,覆盖完整信息光谱的内容仍十分有限。确保在线材料呈现诊疗全貌,对保障患者自主权、支撑神经外科领域的真正知情决策至关重要。
内容质量随疾病类型存在差异
在线神经外科信息质量存在显著的疾病异质性。视频资源中仅髓母细胞瘤相关内容整体质量达良好水平,颈椎骨折与深部脑刺激相关内容质量中等。网站资源中,胶质母细胞瘤、动静脉畸形、慢性疼痛与脊髓刺激相关内容质量中等,脑膜瘤相关内容从中等到良好不等。而脑肿瘤相关短视频、脊柱手术相关社交媒体帖子则属于极低质量范畴,几乎无可靠教育价值。这表明高质量神经外科在线信息仍是例外而非常态,且高度集中于少数具有较强机构或学术代表性的疾病领域。
需强化提供者引导与数字素养
鉴于在线神经外科信息质量差异巨大且虚假信息泛滥,患者难以自行甄别可信信源,若无临床医师指导,极易依赖流行但不准确的内容,进而加重焦虑、干扰决策。有限的健康素养会进一步放大这一问题,尤其对儿科患者或教育背景薄弱人群而言。鼓励临床医师向患者推荐经过审核的资源、教导其评估在线内容的方法,可显著提升患者理解度,支撑知情、协作的共同决策。医学机构与学术团体应扩大在线影响力,发布同行评议、循证、以患者为中心的内容以对抗虚假信息,具体策略包括增加学术讲座类视频、融入动画与专业字幕、申请HONcode认证、定期核查内容准确性与完整性。人工智能生成内容虽存在虚假信息风险,但日益成熟的人工智能工具有望提升患者教育效能,不过其心理社会支持能力与可读性局限仍需临床医师监督。未来工作不仅要聚焦内容生产,还需教导患者识别可信信源、正确解读数字健康信息。
偏倚风险与方法学质量
本综述纳入研究的整体偏倚风险为中等。部分研究因算法驱动检索、语言限制、仅纳入搜索结果前几页,可能遗漏高质量但曝光度低的内容;部分研究评估者间一致性仅为一般到中等,存在评分一致性隐患;少数样本量极小的研宄偏倚风险较高,结果可能无法代表整体信息生态。其余多数研究(尤其是采用多种验证后工具、报告高评估者间一致性的研究)偏倚风险较低,研究目的清晰、方法可重复、结果报告规范。本综述虽全面刻画神经外科数字媒体现状,仍存在局限性:研究间方法学、评估工具与平台异质性高,难以直接比较;多数研究仅纳入英文内容,结果外推至非英语人群受限;部分评估工具最初为书面材料设计,用于数字媒体的适配性不足;数字平台迭代迅速,部分结果可能已过时。
结论
本综述表明,在线儿科与成人神经外科信息质量异质性极高且普遍不足,儿科内容仅总体质量略优。由医师、学术机构与专业学会生产的内容质量普遍更高,而非专业人士制作的高热度内容常缺乏参考文献、风险讨论与替代方案说明,凸显传播广度与教育质量的脱节。上述发现强调了提升神经外科在线信息质量、准确性、可及性与可靠性的迫切性,需临床医师、教育者、医疗机构共同强化质量监管、推进包容性内容建设、主动引导患者获取可信资源。