《JCO Oncology Practice》:Artificial Intelligence Among US Hematology Oncology Fellows: A Multicenter Survey of Education, Attitudes, and Clinical Use
编辑推荐:
研究人员开展了一项多中心调查,以评估美国血液学/肿瘤学(hematology/oncology, H/O)专科培训医师中人工智能(artificial intelligence, AI)工具的使用情况。背景方面,此前一项全国性调查显示美国H/O专科培训课程存在
研究人员开展了一项多中心调查,以评估美国血液学/肿瘤学(hematology/oncology, H/O)专科培训医师中人工智能(artificial intelligence, AI)工具的使用情况。背景方面,此前一项全国性调查显示美国H/O专科培训课程存在显著异质性,且受保护的教学时间有限。此后,人工智能(包括大语言模型(large language model, LLM)及环境式工具)已日益融入培训生教育与临床实践。研究方法上,研究人员通过项目负责人招募H/O专科培训医师完成一项匿名调查,该调查改编自前期研究,并增设了关于AI教育、态度及临床使用的问题。通过REDCap收集回复,采用描述性统计进行汇总。结果显示,共有118名H/O专科培训医师回应了来自30个受邀项目中18个项目(60%)的调查,主要来自学术中心(94%),且在各培训年份间分布均匀。大多数受访者(74%)报告使用AI工具。其他常用资源包括美国国家综合癌症网络(National Comprehensive Cancer Network, NCCN)指南(92%)和UpToDate(86%)。仅8%的受访者报告接受过正式的AI培训。大多数受访者认为AI对教育有用(93%),并对将其用于学习有信心(74%);92%预期未来使用会增加,82%希望接受正式培训。LLM最常见的用途是澄清概念(86%)、总结文献(83%)和探索前沿研究(75%)。AI辅助文档记录是最频繁的临床应用(51%)。报告的障碍按关注程度依次为:准确性、缺乏正式培训、数据隐私,以及不明确的伦理或机构指南。结论认为,在受访者中,AI工具被广泛使用且评价积极,但专科培训期间正式培训仍然有限。这些发现强调了开展有关有效、安全及伦理使用AI的结构化教育的必要性,以支持AI的临床整合。
研究背景与问题
近年来,临床环境已从对人工智能(artificial intelligence, AI)的认知阶段迅速演进至实践就绪工具的部署阶段,包括大语言模型(large language model, LLM)、影像分析学、可穿戴设备及环境式监听应用等。血液学与肿瘤学(hematology and oncology, H/O)作为数据密集型学科,以先进影像、病理学及多组学(multiomic)数据为驱动,特别易于受到AI技术的影响。然而,H/O领域深植于人文主义精神,医患关系是医疗服务的核心。因此,培训医师必须在数据驱动的洞察与富有同情心的以患者为中心的实践之间寻求平衡。尽管AIpresence日益增长,但培训医师如何在教育和临床实践中使用这些工具、是否获得充分的正式培训等问题仍知之甚少。此前的全国性调查已揭示H/O专科培训课程存在显著异质性,且除传统讲授式教育外,受保护的结构化教学时间有限。国家组织已开始为医学生及住院医师开发AI教育资源,但将AI整合入专科培训的确立框架仍然缺乏。有限的高校教师对新兴AI工具的熟悉度可能造成"培训培训师"的瓶颈,加剧了结构化课程与师资发展的需求。AI在H/O培训生中的使用既带来机遇也蕴含风险:一方面可提升管理效率、支持复杂临床技能发展、增强培训生学习与诊断推理能力;另一方面也存在输出准确性、可靠性、伦理考量及过度依赖导致临床推理技能退化等问题。因此,了解专科培训医师当前如何使用及认知AI,对于将AI负责任地纳入培训项目至关重要。
研究开展与关键结论
研究人员开展了一项多中心横断面调查,旨在刻画一组H/O专科培训医师中AI的使用情况、态度、教育暴露及临床整合状况,为开发结构化教育框架以支持AI安全、有效、伦理地整合入H/O专科培训奠定基础。该论文发表于《JCO Oncology Practice》。
关键技术方法
研究采用多中心横断面调查设计,样本来源于美国毕业后医学教育认证委员会(Accreditation Council for Graduate Medical Education, ACGME)认证的H/O专科培训项目,这些项目曾参与PODCAST-HOF试验。通过电子邮件联系项目主任或副主任邀请参与,选择项目时确保地理分布与项目规模多样性。参与项目通过标准化电子邮件模板邀请所有H/O专科培训医师自愿参加REDCap在线匿名调查。调查改编自前期全国专科培训课程评估,扩展纳入AI使用与教育相关领域,包括AI态度、教育中使用AI、LLM特定使用场景、临床接触AI工具情况及感知到的使用障碍。调查领域由三位独立的H/O教育专家审核确保内容效度,并在部分培训生中进行预测试。
研究结果
**项目与受访者特征**:30个H/O专科培训项目受邀,18个项目(60%)的专科培训医师作出回应。124名发起调查的专科培训医师中,6份不完整回应被排除,最终分析纳入118名专科培训医师。在受邀项目约539名潜在合格专科培训医师中,总回应率为22%。队列在各培训年份间均匀分布,92%来自大学附属项目,56%计划从事学术工作,47%来自南部地区。
**当前医学教育资源与AI培训**:教育用途方面,受访者仍依赖传统学习资源,最常用NCCN指南(92%)和参考网站(86%),以及教师授课材料(70%)和原始文献(65%)。同时,74%的专科培训医师报告将AI工具用于学习,但仅8%报告在专科培训期间接受过任何形式的AI正式教育或培训。
**对AI的态度**:参与者普遍对AI在医学教育中的作用持非常积极的态度,93%同意这些工具具有实用性。尽管对当前H/O授课满意度很高(91%),但大多数受访者(82%)表达了针对AI更多培训的愿望。总体而言,86%报告对AI持积极态度。虽对自己使用AI工具学习有信心者占74%,但仅53%认为自己具备批判性评估AI相关文献的能力。值得注意的是,92%的受访者预期未来5年将增加AI工具的使用,55%表示机构AI整合将成为其未来工作选择的考量因素。
**AI使用的障碍**:调查识别了AI工具在医学教育中应用的若干障碍。最普遍的担忧是对AI输出准确性或可靠性的不确定性(73%),其他障碍包括缺乏正式培训(52%)、数据隐私或保密性担忧(51%)、不明确的适当或伦理使用指南(51%)、机构或医院限制(36%),以及环境影响担忧(30%)。
**AI使用与临床暴露**:教育用途与临床环境暴露之间存在明显区别。专科培训医师最常报告将基于LLM的工具用于澄清疑难概念(86%)、总结期刊文章(83%)和学习前沿研究(75%)。用于识别个人知识差距(59%)、制定学习计划(54%)、生成考试式问题(31%)和患者模拟(29%)的比例较低。
在临床环境中,AI暴露最常见于AI辅助文档记录(51%),其次是临床决策支持工具(42%)。其他应用暴露较少,包括影像和病理工具(12%)、患者沟通工具(9%)和远程监测或可穿戴技术(9%)。近三分之一(31%)的专科培训医师报告在临床实践或培训环境中无AI暴露。探索性分析显示,虽在临床AI暴露或感知障碍方面无显著差异,但计划从事社区实践的专科培训医师更可能报告机构AI整合将影响其工作选择(96% 对 60%,P < .001)。
讨论与结论
该多中心调查提供了关于H/O专科培训医师中AI使用与教育暴露的当代评估。鉴于AI向医学教育和临床实践的快速整合,这些数据为多个美国机构中百余名为H/O专科培训医师的经验和认知提供了及时洞察。但鉴于总体回应率较低,这些发现不应被解释为全美H/O专科培训医师的患病率估计,也可能无法代表未回应者的观点或经验。
在此语境下,受访者报告持续依赖传统资源(如NCCN指南、题库和参考网站),与前期工作一致。尽管报告将AI用于教育用途,但负责任使用AI的正式教学仍然有限,仅8%的受访者报告专科培训期间接受过正式指导。这种AI使用与结构化培训之间的不匹配,与医学教育中AI工具快速采用的更广泛担忧一致。
研究识别的关键关切是AI使用与批判性评估技能之间的差距。受访者普遍使用LLM进行概念澄清和文献综合,但近半数报告对批判性评估AI生成输出的能力缺乏信心。这引发了对自动化偏见(automation bias)和过度依赖的担忧,特别是在缺乏正式指导的情况下。这些发现对教育可能具有重要影响,对患者护理也可能具有重要意义,因为AI使用培训不足可能增加不适当依赖AI生成建议的风险。新兴教育框架强调培训临床医师作为"环路中的人类(human-in-the-loop)"评估者,能够评估准确性、可靠性和临床适用性。
此外,受访者报告临床AI暴露似乎集中于行政应用和常规决策支持,而非诊断或面向患者的工具。虽超过半数报告接触AI辅助文档记录,但近三分之一报告无临床暴露,且鲜有人报告在影像或病理方面有AI经验。这些发现可能既反映培训生认知,也反映机构技术实施的变异性,以及部分项目可能优先考虑独立临床推理发展的刻意努力。鉴于H/O的数据密集型特性,面向临床意义的AI应用的结构化暴露可能对培训医师为未来实践做好准备具有重要意义。
从教育和劳动力角度,这些发现对专注于职业规划的专科培训项目可能具有潜在重要意义。超过半数受访者表示机构AI整合将影响未来工作选择,表明AI工具的获取可能正成为部分培训生招聘和职业规划中日益相关的因素。同时,标准化培训的低报告频率引发了对碎片化教育格局的担忧,其中AI能力可能由机构资源而非一致的课程设计所塑造。解决这一差距将需要协调努力,以开发跨多样化培训环境可扩展的、基于证据的教育框架。
研究局限性包括:参与项目基于前期兴趣选择及专科培训医师自愿参与,可能引入选择和回应偏倚;专科培训医师层面回应率低限制了确定全国性AI使用、临床暴露或培训需求患病率的能力;横断面设计可能无法完全反映纵向使用模式或能力un人认知队列主要来自学术中心,限制了向社区项目推广的普遍性。
研究结论指出,受访H/O专科培训医师普遍报告将AI工具用于教育和临床实践,但大多数仍为自学成才。这种AI使用报告与有限正式培训之间的不匹配,代表了专科教育中潜在的重要差距,可能导致各培训项目间AI能力的变异性。解决这一差距将需要开发标准化的、基于证据的课程,强调批判性评估、伦理整合入临床工作流程,以及保留核心诊断推理技能。随着AI日益嵌入肿瘤学实践,确保培训医师具备安全有效使用这些工具的能力,对教育和患者护理都将至关重要。