编程教育中整合游戏化学习(Game-Based Learning)与生成式人工智能(Generative AI)：自动化出题与学习成效提升的研究

《Applied Sciences》：Integrating Game-Based Learning and Generative AI in Programming Education: A Study on Automated Question Generation and Learning Outcomes Enhancement

【字体：大中小】 时间：2026年06月19日 来源：Applied Sciences 2.5

编辑推荐：

　　摘要：本研究探讨了在编程课程中整合游戏化学习系统（Game-Based Programming Learning System, GBPLS）的教学效果，重点关注工具辅助练习对学生学习成效与学习体验的影响。研究人员采用准实验设计，实验组使用整合生成式人工智能(

摘要：本研究探讨了在编程课程中整合游戏化学习系统（Game-Based Programming Learning System, GBPLS）的教学效果，重点关注工具辅助练习对学生学习成效与学习体验的影响。研究人员采用准实验设计，实验组使用整合生成式人工智能(Generative AI)自动出题功能的GBPLS进行编程练习，对照组完成传统编程作业，两组由同一教师授课并使用相同教学内容，为期八周。通过前测与后测评估学习表现，并进行基线调整及条件效应分析以检验教学效果是否因学生先前编程知识水平而异。结果显示，实验组后测成绩高于对照组，且组别×前测的交互作用表明学习效应受基线编程能力调节。此外，实验组填写了系统使用感知与心流体验(Flow Experience)问卷，结果显示学生对GBPLS持总体积极态度，且在编程练习中体验到显著正向的心流水平。研究表明，当GBPLS嵌入连贯的教学设计中时可支持编程练习，但其益处应理解为有条件的而非普适的；系统的教育价值取决于编程任务、反馈、游戏化参与度、Gen-AI支持的出题及教师引导之间的协调统一。

论文解读：编程教育中整合游戏化学习与生成式AI的自动化出题及学习成效研究

该论文发表于《Applied Sciences》。研究背景指出，传统编程教学面临学生难以理解语法与程序执行逻辑、需大量分层练习题但教师命题与批改负担过重的问题；单纯增加练习量易导致学习倦怠，尤其是初学者面对重复枯燥的题目与延迟反馈会削弱动机。游戏化学习(Game-Based Learning, GBL)可提升参与度和持续练习意愿，而生成式人工智能(Generative Artificial Intelligence, Gen-AI / Generative AI)可依据预设规则或知识库自动生成适配学生水平的编程题目并提供即时反馈，减轻教师负担。然而现有研究多仅比较技术辅助组与传统对照组，缺乏对Gen-AI出题+游戏机制+即时反馈+教师引导四者整合重构编程练习流程的探讨。因此研究人员开展此项准实验研究，检验整合Gen-AI出题的游戏化编程学习系统(Game-Based Programming Learning System, GBPLS)对学习效果、系统感知及心流体验的影响，并分析效果是否受先验编程知识调节。结论表明GBPLS作为结构化练习环境能提升编程学习成效，但效益具条件性（随基线能力变化），学生对系统感知积极且报告显著心流体验；其教育价值依赖于任务—反馈—游戏机制—Gen-AI出题—教师引导的对齐。

研究人员以台湾某私立大学"计算机概论"课程68名学生（实验组n=33，对照组n=35）为样本，两组接受相同教师与教材，唯一区别为练习方式：实验组使用GBPLS（GPT-4o驱动、教师监督提示词生成与课程对齐的编程选择题，含"躲避炸弹"游戏机制、遇星答题、即时正确/错误反馈与解析、积分排行榜及学习历史记录）；对照组做等难度传统编程作业（无游戏元素与即时反馈）。实验周期八周——第1周前测，第2–7周干预，第8周后测并让实验组填系统使用感知问卷（11题五点李克特，含反向计分题，Cronbach's α=0.78）与心流量表（Flow State Scale改编，35题五点李克特，Cronbach's α=0.97）。统计方法包括独立样本t检验基线等效性、增益分数(Gain Score)比较、协方差分析(ANCOVA)及回归斜率齐性检验，因组别×前测交互显著故采用条件效应框架与Johnson–Neyman技术分析不同先验水平下实验组与对照组的后测差异。

4.1. Comparison of Learning Outcomes Between Experimental and Control Groups（实验组与对照组学习成效比较）

前测无显著差异（p=0.356）。增益分数显示实验组下降幅度（M=-0.48）远小于对照组（M=-33.31），差异显著（p<0.001, d=1.82）。ANCOVA中组别×前测交互显著（F(1,64)=14.24, p<0.001, η_p²=0.182），不满足回归斜率齐性假设，故按条件效应解读。低（M-1SD）、中（均值）、高（M+1SD）先验水平下实验组调整后后测均高于对照组（分别Diff=14.71, p=0.013；Diff=30.49, p<0.001；Diff=46.28, p<0.001）。Johnson–Neyman分析表明当前测≥20.65分时两组差异显著，即先验编程能力超此阈值者GBPLS优于传统练习；低先验知识亚组虽未达全样本显著J-N显著区但增益仍优于对照组（各先验亚组增益均显著优于对照组，p≤0.028）。结论：GBPLS产生条件性学习效益，先验知识越高优势越大，属能力—处理交互(Aptitude-Treatment Interaction)。

4.2. Learners' Perceptions of System Use and Learning Experience（学习者系统使用与学习体验感知）

系统使用感知问卷总分M=3.48（SD=0.47），显著高于中立值3（p<0.001, d=1.01），表明学生对GBPLS持总体正面看法。Cronbach's α=0.78，具可接受内部一致性。

4.3. Learners' Flow Experience During Game-Based Programming Learning（游戏化编程学习中的心流体验）

心流量表总分M=3.45（SD=0.61），Cronbach's α=0.97，显著高于中立值3（p<0.001, d=0.75），说明学生在GBPLS中体验到显著正向心流。

4.4. Supplementary Analysis of GBPLS Use Behaviors（GBPLS使用行为补充分析）

实验组平均登录20.61次、完成155.94道题、正确率0.73。完成题数、正确率、游戏得分与后测成绩相关及偏相关均不显著，说明单纯使用量不线性预测成绩，学习效应源于整合教学环境（先验知识+课程对齐任务+反馈+游戏化参与+教师引导）而非单纯练习量或游戏化装饰。

讨论与结论翻译总结：

讨论指出GBPLS的教育价值在于将编程练习重构为"挑战—应答—反馈—反思—再参与"的持续循环，而非仅添加游戏元素；学习效应有条件性，低先验学生可能因游戏时间压力与双重认知负荷需额外支架（如慢节奏初始关、提示功能、自适应难度）。任务设计应由易到难序列编排以匹配概念复杂度递进。教师仍为核心角色——负责定义教学目标、审核与优化提示词(Prompt)、把关AI生成题目的概念准确性与课程对齐、依据系统记录进行课堂讲解，即人在回路(Human-in-the-Loop)监督确保Gen-AI产出具教学适宜性。心流与积极感知是维持重复练习的支持条件而非学习成效直接证据。GBPLS适用于约30–40人班级，更小班级竞争激励减弱但个别化练习仍有效，更大班级可减教师工作量但需进度看板等管理策略。

结论：整合Gen-AI自动出题与游戏化机制的GBPLS可作为编程课有效结构化练习环境，能提升学习成效与心流体验，但其效益受学生先验编程知识调节，须与课程目标、任务设计及教师引导紧密对齐方能发挥最大价值。本研究为整合Gen-AI与GBL重构编程实践教学提供了实证支持与设计框架。

热点排行