异步生成式AI学习模块对学生知识、技能与自我效能感的提升：一项大规模随机对照试验

首页今日动态人才市场新技术专栏中国科学人云展台
BioHot
云讲堂直播会展中心特价专栏技术快讯免费试用

生物通官微
陪你抓住生命科技
跳动的脉搏

生物通首页 > 今日动态 > 正文

《COMPUTERS and EDUCATION》：Can asynchronous learning modules about generative AI increase students’ knowledge, skills, and self-efficacy for genAI?

【字体：大中小】 时间：2026年04月15日 来源：COMPUTERS and EDUCATION 10.5

编辑推荐：

　　为应对高等教育中生成式人工智能（genAI）技能培训的普遍缺失，本研究通过一项大规模随机对照试验，评估了一套90分钟、开放在线的异步学习模块对大学生genAI能力发展的影响。结果表明，该模块能有效、公平地提升学生关于大语言模型的知识、提示工程技能、事实与来源核查技能以及genAI自我效能感，为规模化开展genAI通识教育提供了有力证据。

研究背景：AI浪潮下的教育新挑战与能力鸿沟

自OpenAI的ChatGPT横空出世以来，生成式人工智能（Generative AI, genAI）以其强大的内容生成能力，为高等教育领域带来了前所未有的机遇与挑战。教育工作者们既看到其辅助教学、个性化学习的巨大潜力，也对其可能引发的学术诚信危机和学生关键思维能力（如写作与批判性思维）的退化感到深切忧虑。然而，在早期的应对中，高等教育机构的焦点多集中于为教师提供整合指南或为学生制定反作弊政策，而系统性地培养学生有效、批判性且合乎伦理地使用genAI的能力培训却普遍缺位。

这种“重监管、轻赋能”的现状带来了一个严峻问题：学生们即将步入一个日益依赖AI的职场，超过60%的雇主已期望员工具备一定的genAI素养，但超过半数的毕业生却认为自己的学位课程并未提供相关训练，使其在就业市场上处于劣势。更令人担忧的是，学生接触和学习genAI的机会并非均等。尽管“数字原住民”一代看似与技术天然亲近，但研究表明，他们对genAI的准备程度同样参差不齐，其先前的技术接触往往受到家庭收入、社会经济地位乃至性别规范的影响，这可能导致新的“数字鸿沟”在AI时代被进一步拉大。因此，开发一种能够规模化、公平地提升所有学生genAI核心能力（包括知识、技能和态度）的培训方案，已成为高等教育机构一项紧迫而关键的任务。

研究方法：一项严谨的大规模随机对照试验

为科学评估培训效果，研究团队设计了一项大规模随机对照试验。核心干预材料是一套包含四个模块、约90分钟可完成的异步在线学习课程，内容涵盖大语言模型（LLM）工作原理、伦理关切、学生使用的机会与风险以及负责任使用。课程设计遵循了多媒体学习、认知负荷管理等原则，并嵌入了大量“边学边做”的练习与即时反馈。

研究在美国东北部一所中型私立大学进行，招募了46名教师及其所授的65个课程班（共涉及1368名本科生和研究生）。这些班级被随机分配至实验组（在前后测之间完成学习模块）或对照组（前后测之间不接触模块）。评估工具包括：1）知识测试：选择题和情境匹配题，考察对LLM工作原理（学习目标1，LO1）和负责任使用（学习目标3，LO3）的理解；2）技能评估：通过两个真实性任务，分别评估学生的“提示工程”技能和“输出内容批判性评估”技能，并使用标准化量规进行评分；3）自我效能感（Self-Efficacy, SE）评估：通过11个条目测量学生对完成各项genAI相关任务的信心水平。所有测量均在课程开始的第一周内，以严格的盲法和时间控制完成。

研究结果

1. 对genAI知识与自我效能感的影响

学习模块显著提升了实验组学生关于“大语言模型如何工作”（LO1）的知识水平，其增益显著大于对照组。在“负责任使用”（LO3）的知识上，两组学生在后测时水平相当，但对照组从更低的起点追赶上来，表明模块在此特定知识上的增值效应不显著，可能与其他课程内容的覆盖有关。更重要的是，模块极大地增强了学生的genAI自我效能感。实验组学生的信心水平提升幅度远超对照组，表明培训不仅教会了他们知识，更让他们相信自己能运用这些知识。

2. 对genAI技能的影响

•
提示工程技能：模块对提升学生的提示撰写技能效果显著。实验组在后测中的整体表现显著优于对照组，而对照组则无明显进步。深入分析显示，学生在培训后，在“为AI分配角色”、“明确受众”和“施加约束条件”这些超越传统搜索引擎使用习惯的关键子技能上进步最大。
•
输出内容评估技能：在整体评估技能上，模块未显示出显著的干预效果。然而，细化分析发现，实验组学生在后测中更频繁地提及需要对genAI输出进行“事实核查”和“来源核查”，这直接对应了培训中关于“横向阅读”策略的教学内容。但模块未能有效提升学生识别输出中“潜在偏见”的能力。

3. 培训效果的公平性检验

研究发现，不同学生群体在genAI知识的起点上存在差异，例如一年级本科生的知识水平低于研究生。然而，至关重要的是，在那些模块产生积极效果的领域（如LO1知识、自我效能感和提示工程技能），其带来的提升在所有被考察的人口统计学群体（包括出生性别、种族/民族、学生层级、第一代大学生身份和学科背景）中均是公平的，没有出现“马太效应”。一个突出的积极发现是，实验组中女性学生在培训后，其自我效能感追平了男性同伴，有效纠正了基线时存在的性别差距。

结论与意义

本研究通过严谨的实验设计证明，一个时长约90分钟、可异步完成的在线学习模块，能够作为一种高效、可扩展的干预措施，在大学阶段规模化地培养学生关于生成式AI的基础能力。它成功提升了学生对于大语言模型如何工作的理解、关键的提示工程技能、对AI输出进行事实与来源核查的意识，以及运用genAI的自我信心。尤为重要的是，这种培训带来的益处是普惠的，有助于弥合不同背景学生之间的初始能力差距，促进教育公平。

这项发表于《COMPUTERS and EDUCATION》的研究具有重要的实践意义。它为解决高校普遍面临的“如何规模化开展genAI通识教育”的难题提供了一个经实证检验的解决方案。这类模块可以被方便地嵌入新生导入课程、一年级研讨课或任何专业课程中，无需依赖授课教师独自开发内容或占用大量课堂时间。这为高等教育机构履行其社会责任——即确保所有学生，无论其先前的技术接触如何，都能为AI时代的学业和职业生涯做好基本准备——提供了可行的路径。当然，研究也指出，在培养“识别AI偏见”和深化“负责任使用”的伦理认知等更具挑战性的目标上，未来的培训内容仍需加强。随着AI技术的快速演进，对学生AI能力的培养及其评估，也必将成为一个需要持续迭代和深化的动态过程。

联系信箱：

粤ICP备09063491号

热点排行