**采用、驯化与疏离:K-12教室中教师人工智能整合实践及其驱动因素的案例研究**
王世晓、
李文业、
沈书生、
王维豪、
肖健、
唐爱彬
《Behavioral Sciences》:Adoption, Domestication, and Alienation: A Case Study of Teacher AI Integration Practices and Their Driving Factors in K-12 Classrooms
Shixiao Wang,
Wenye Li,
Shusheng Shen,
Weihao Wang,
Jian Xiao and
Aibin Tang
【字体:
大
中
小
】
时间:2026年04月28日
来源:Behavioral Sciences 2.5
编辑推荐:
摘要:随着生成式人工智能(GenAI)工具的快速迭代,教师在真实教学环境中使用技术的复杂性和多样性需要更深入的实证研究。本研究以中国东部一所被指定为AI示范学校的公立中学为研究对象,通过17个月的田野调查(包括关键事件访谈、参与观察和实物收集)得出了四种不同的技术实践类型:隐性赋
摘要:随着生成式人工智能(GenAI)工具的快速迭代,教师在真实教学环境中使用技术的复杂性和多样性需要更深入的实证研究。本研究以中国东部一所被指定为AI示范学校的公立中学为研究对象,通过17个月的田野调查(包括关键事件访谈、参与观察和实物收集)得出了四种不同的技术实践类型:隐性赋能、仪式化增强、变革性探索和谨慎距离。这些类型的差异可以归因于四个维度的相互作用:专业能动性、技术认知、组织治理和领域文化。具体来说,专业能动性涉及劳动强度的权衡、专业权威的保持以及教学习惯的连续性;技术认知表现为技术赋能的错位、对结果失真的担忧以及对话价值的减弱;组织治理包括评估系统的导向、资源过度集中以及对创新失败的容忍度缺乏;领域文化涉及同行实践的示范、团队文化氛围以及利益相关者的要求。这些因素共同解释了教师技术采用行为的多样性,并提供了一个基于实证的框架,用于理解AI融入课堂教学的微观过程。
1. 引言
在全球教育系统中,教师接触和使用基于GenAI的工具(以下简称“AI工具”)的速度惊人。然而,最新的TALIS(教学与学习国际调查)数据显示,在绝大多数参与国家和地区,AI工具的使用仍然集中在低阶认知任务上——如生成练习、组织材料或支持课程准备——几乎没有证据表明它能够培养高阶思维或重构课堂教学互动(OECD,2025)。即使在资源充足且培训计划健全的学校中,这种模式依然存在。以往的研究大多将教师技术实践的差异归因于个人能力或整合阶段,假设对有用性的积极认知、易用性或整合深度会自然引导教师采用更高级的应用(X. Chen等人,2024)。这种观点预设了一个从“采用意图”到“应用行为”的线性路径,将复杂的课堂教学实践视为意图的直接外在化。实际上,从意图到行为的路径远非直线;在教师想要做什么和他们实际做什么之间存在着“黑箱”(Shi等人,2024)。仅靠线性模型无法解释为什么具有相似能力和同等资源的教师会采取不同的实践路径。此外,该领域依赖于横断面调查和以变量为中心的模型,虽然有助于隔离决定因素,但未能揭示教师从“想要使用”到“如何使用”或“为什么不使用”在日常课堂中的动态决策过程。因此,理解教师AI实践的多样性需要打开这个“黑箱”,追踪特定制度环境中意图是如何重构、抑制或重新定向的。要把握这些机制,需要采取一种接近实践的研究立场(Brown,2017),即在教学日常节奏、制度压力和同事互动中观察教师如何协商AI使用的意义和限制。只有这样的方法才能揭示标准化工具往往忽略的情境推理,并阐明为什么同一技术在不同教师手中会呈现出截然不同的形式。
为此,本研究采用了双层分析方法。第一层使用PICRAT模型(Kimmons等人,2020)作为描述性坐标系,绘制教师AI实践的空间分布图,而不施加层级排名。第二层通过系统主题分析长期田野调查数据,追踪观察到的分布背后的情境因素。这种映射-追踪设计旨在捕捉实践多样性,同时揭示塑造它的情境机制。在此背景下,本研究提出了两个研究问题:
RQ1:一线教师在教学中表现出哪些典型的AI整合实践类型?
RQ2:哪些因素导致了教师AI整合实践类型的差异或其整合行为的表面化?
2. 文献综述
2.1. 教师技术实践的潜在多样性
当教师遇到大数据分析和AI工具等新兴技术时,他们的教学实践在形式和深度上往往会存在差异。学术界通过三种广泛的理论视角来探讨这种差异:阶段理论、层级理论和知识结构理论。每种理论强调了不同的分析切入点——采用时间线、整合深度和知识能力——共同为当前的综述提供了概念框架。
阶段理论以创新扩散理论(DOI)为代表,将技术采用视为一个包含知识、说服、决策、实施和确认的动态过程,并据此将采用者分为五个类别,从“创新者”到“落后者”(Rogers等人,2014)。DOI所强调的属性(相对优势、复杂性等)对解释采用意图具有很强的解释力,并且仍然是早期采用者行为解释的核心(Abdalla等人,2024;Singh & Strzelecki,2026)。层级理论侧重于评估技术整合的深度,SAMR模型和ICAP框架是两个主流理论。SAMR模型将教师的技术实践分为四个层级:替代、增强、修改和重新定义(Puentedura,2015)。最新证据表明,尽管教师普遍持积极态度,但实际上他们的实践大多集中在替代和增强层面,且自我评估经常高估了整合深度(W. Luo等人,2025)。作为补充,ICAP框架从认知参与的角度将技术使用分为四种模式——被动、主动、建构性和互动性——进一步评估了技术整合水平的差异(Chi & Wylie,2014;Antonietti等人,2023)。跨国调查数据证实,不同认知层面上的技术整合频率和质量存在差异,不同数字工具支持每种ICAP模式的能力也不均衡(Mari?i?等人,2025),反映了技术使用的潜在多样性。知识结构理论以TPACK框架为中心,将教师技术实践的多样性归因于技术知识(TK)、教学知识(PK)和内容知识(CK)在特定教学环境中的整合程度(Mishra & Koehler,2006),从而从知识结构角度解释了这种差异(Zou等人,2022)。实证工作证实,教师在这些知识维度上的成长受到个体和学科特征的强烈影响,复合知识的深度是高阶教学实践的可靠预测因子(Baran等人,2019)。
总体而言,阶段理论、层级理论和知识结构理论为绘制教师技术使用的差异奠定了重要基础。然而,它们的共同局限性在于依赖于线性尺度——“能与否”、“高或低”、“快或慢”——这种做法有可能将实践差异简化为能力梯子上的等级(Hamilton等人,2016)。然而,GenAI在学校中的快速传播打破了早期技术周期的模式。其生成性、交互性和应用边界的模糊性对教师的专业自我认知、他们的情境学科文化以及组织的制度规范提出了新的要求。由于GenAI在短短两年内就迅速普及,且技术持续快速迭代,将其视为能力框架中的另一个变量可能会低估其高度的情境依赖性。因此,迫切需要研究真实的课堂环境,以识别能够捕捉当前AI工具使用情境复杂性的实践类型。
2.2. 教师技术实践的驱动因素
技术接受模型(TAM)及其衍生模型(如UTAUT)大多数解释教师技术实践的尝试都依赖于这些模型。TAM最初关注两个变量——感知有用性(PU)和感知易用性(PEOU),主要集中在个人对技术工具工具属性的评估上。TAM2和TAM3通过纳入社会影响和主观规范扩展了该模型,从而承认了外部期望和同伴评价的作用(Al-Qaysi等人,2020)。Venkatesh等人(2003)将这些扩展整合为统一的技术接受和使用理论(UTAUT),该理论将绩效期望、努力期望、社会影响和促进条件纳入一个框架,涵盖个体认知、社会压力和组织支持。应用于教师AI工具使用的实证工作基本证实了基于接受的模型的解释相关性。Boughanzai等人(2026)通过扩展的TAM框架确认,感知易用性和有用性仍然是预测教师采用AI工具的核心路径,并发现信任和社会影响等变量在形成采用意图中起着关键的调节作用。内在动机(如感知乐趣)被认为是采用行为的最强预测因子,不同类型学校的教师在社会规范和绩效期望方面表现出显著差异(Y. Luo等人,2026)。此外,J. Chen等人(2025)通过将任务-技术匹配(TTF)与TAM相结合,发现AI工具与教学任务之间的匹配以及教师的创新态度是其实践意图的关键决定因素,而感知易用性是整个决策过程的必要前提。这些研究表明,一旦加入情感、任务特征和组织背景等变量,经典模型仍然能够识别教师AI采用的主要驱动因素。尽管这些模型识别了一系列重要的预测因子,从而扩展了解释采用动机的变量空间,但它们基于“理性行为者”的假设——即使用意图会顺畅地转化为实际行为——并隐含地将教师视为在社交真空中的决策者。一些研究确实承认技术决策嵌入在学校组织结构中,受绩效问责、组织文化和学科传统的塑造(Song等人,2025),但将这些情境力量简化为结构模型中的单一变量可能会弱化它们在教师情境决策中的复杂作用。教育领域之外的最新实证工作进一步强化了这一担忧。关于人与AI在组织环境中协作的研究表明,AI的采用通过身份形成(Xu等人,2025)和序列资源消耗(Jung & Kim,2026)等中介心理机制影响员工行为,表明AI情境中的意图-行为关系比经典接受模型假设的更为复杂。这些限制促使本研究转向个案研究,通过长期田野观察和迭代探究,将教师的微观决策置于数字转型的更广泛动态中。
2.3. 综合分析立场:从描述性映射到情境追踪
上述文献的两个方面都存在一个共同的结构缺口。在实践分类方面,SAMR和ICAP等框架提供了从“低”到“高”层级的技术使用等级划分。虽然这些尺度有助于基准测试,但它们嵌入了线性评估假设:实践差异最终可以归结为能力、认知或采用阶段的差异。Hamilton等人(2016)指出了SAMR模型的三个具体弱点:忽视教学情境、将技术视为产品而非过程,以及依赖将高级整合等同于更好教学的固定层级。Blundell等人(2022)在对230项基于SAMR的研究的综述中,通过一个显著的实证发现加强了这一批评:看似相似的教学行为被不同研究分配到了不同的SAMR层级,表明脱离教学情境后,层级分类变得不稳定。在采用驱动因素方面,TAM和UTAUT在识别预测使用意图的变量方面有效,但它们基于一个平滑传递的假设——即积极意图必然导致实际实践。在这些模型中,教师显得像是在社交真空中的理性决策者。
这两个限制共同指向了一个现有理论难以解决的核心问题:为什么具有相似能力和同等技术资源的教师会采取不同的实践路径?Beland(2009)通过借鉴Bourdieu的习惯概念提供了一个富有成效的重新框架。他认为,技术整合不是信念的直接外在化,而是嵌入在教师积累的专业经验中形成的持久倾向中。换句话说,对技术的积极信念并不会自动转化为深度整合——后续实证工作证实了这一点(Ertmer等人,2012)。Bicalho等人(2023年)在研究疫情期间教师使用信息通信技术(ICT)的情况时得出了一个补充性结论:教师们并非按照从替代到重新定义的线性路径进行发展,而是根据不断变化的情境需求,在SAMR(替代、增强、转变、重新定义)的不同阶段之间灵活转换。这些研究结果共同表明,要理解教师在人工智能(AI)实践中的多样性,需要超越传统的能力阶梯和意图-行为框架,采取一种更接近实际教学实践的视角——即关注教师如何在特定的机构环境中协商、适应,有时甚至抵抗技术的应用。基于这种实践导向的视角,本研究采用了一种双层分析方法,将描述性映射与情境追溯相结合。
第一层——描述性映射——将教师的实践置于一个非层级的坐标空间中。这种方法不是对教师进行能力排名,而是旨在绘制他们AI实践的空间分布图。为此,我们采用了Kimmons等人(2020年)提出的PICRAT模型。PICRAT包含两个相互交叉的维度:PIC轴反映了学生与技术的关系(被动、互动或创造性),而RAT轴则反映了技术对教师现有实践的影响(替代、增强或转变)。由此产生的3×3矩阵提供了一个开放的描述空间,而非预设的发展路径。这一点对于本研究至关重要。根据SAMR模型的设计,从替代到重新定义的过程代表了进步(Hamilton等人,2016年)。相比之下,PICRAT被设计为“一种反思工具,而非指导方案”(Kimmons等人,2020年),它允许研究人员记录实践的具体情况,而不给任何特定单元预先赋予价值。这种描述上的开放性使得能够发现线性层级结构可能掩盖的模式——例如,经验丰富的教师聚集在低级别的单元中,并非因为技能不足,而是一种明确的战略选择。此外,PICRAT还解决了ICAP框架(Chi & Wylie,2014年)的一个局限性,该框架主要关注学生方面的认知参与,但没有系统地考虑教师的教学决策。通过在一个矩阵中同时纳入学生经验轴和教师实践轴,PICRAT使分析师能够观察到两者之间的相互作用。
第二层——情境追溯——解释了这些实践为何会分布在不同的位置。PICRAT矩阵可以显示教师的实践在坐标空间中的不均匀分布,但它无法解释这种分布背后的原因。为什么一位教师停留在被动-替代的阶段,而一位具备相似资格的同事则进入了创造性-转变的阶段?回答这个问题需要超越单一的整合模型,深入探讨日常教学的机构生态——包括专业身份的协商、技术意义的构建过程、组织治理压力以及同事间的互动动态,这些因素共同影响了教师的实践选择。这一分析层次不依赖于预先指定的理论框架进行演绎性编码,而是遵循系统主题分析的原则(Braun & Clarke,2006年),通过访谈、观察和长期实地工作中收集的实物数据,归纳出导致实践差异的因素。
这两层构成了研究的分析架构。第一层利用PICRAT矩阵对观察到的教学片段进行编码,生成实践类型的空间地图,从而回答了研究问题1(前线教师典型的AI整合实践类型有哪些?);第二层则追溯了观察到的实践分布背后的逻辑,回答了研究问题2(哪些因素驱动了教师AI整合实践类型的差异?)这种映射-追溯的设计使研究能够描述实践的多样性,而不将其简化为能力排名,同时也揭示了层级模型往往会忽略的情境机制。
3. 方法论
教师与AI相关的实践既不是固定能力集的机械输出,也不是某种既定意图的直接转化;它们是在日常教学常规、机构要求以及同事关系的持续调整中形成的。案例研究方法致力于深入描述,非常适合展现单一调查数据难以捕捉到的组织生态(Creswell & Creswell,2017年)。它能够重建教师在其特定组织环境中如何赋予技术意义,并记录通过与环境的持续互动中产生的战略选择。
3.1. 研究背景
本研究在中国东部的一所公立初中(H校)进行。作为省级AI教育示范学校,H校配备了先进的数字化基础设施:所有普通教室都配备了智能终端,并设有专门的AI实验室。学校管理层通过行政措施和项目化管理提供稳定的支持。在师资能力方面,学校鼓励教师参与相关研究项目和专业培训计划,大多数教师通过这些项目积累了使用AI工具的实际经验。这样的环境为观察教师在技术丰富的环境中的多样化实践提供了基础。此外,研究者和研究团队深度参与了学校的日常教学管理工作,并与相关管理人员建立了良好的合作关系,从而获得了来自不同利益相关者的多角度理解,促进了数据的三角验证。
3.2. 参与者
为了确保选定的案例能够准确回应上述研究问题,并找到能够提供深入回答的参与者,本研究首先基于在案例学校进行的六个月实地观察进行了第一阶段抽样。在此期间,通过累计观察五十多节课、参加教学会议以及日常互动,初步了解了教师使用AI工具的基本模式。随后采用目的性抽样方法招募潜在受访者,包括那些在示范课中积极使用AI工具的教师、那些在非正式交流中主动分享使用经验的教师,以及那些明确反对使用AI工具的教师,以确保样本的多样性。为了进一步识别具有独特经验的教师,第二阶段采用了滚雪球抽样方法:最初选定的教师被邀请推荐其他同事,从而发现了那些在公开场合不活跃但在实际教学中具有特定使用经验的潜在参与者,从而增加了样本的异质性。在第三阶段(正式招募阶段),研究者利用课后研讨会向所有潜在参与者解释了研究目的、程序和匿名保护措施,并遵循知情同意和自愿参与的原则完成了最终确认。最终确认了13名正式参与者,他们来自不同的学科、具有不同的教学年限和技术熟练程度。其中3名是负责教学管理和信息化的行政人员,他们的观点提供了关于技术应用的机构和管理视角。在分析中,仅使用这三名参与者的数据作为理解组织治理和现场文化动态的背景证据(见第4.2.3节和第4.2.4节);第4.1节中报告的四种实践类型完全来自十名前线教师提供的课堂级数据。参与者的详细人口统计特征和背景信息记录在表1中。
3.3. 数据收集
对现有非干预性教学数据和匿名信息的初步分析始于2024年3月,根据中国国家法规(《涉及人类的生命科学和医学研究伦理审查措施》第32条),这些数据在伦理审查方面无需遵循特定程序。随后,在2024年12月获得机构审查委员会的批准后,开始了涉及直接人类受试者的正式定性数据收集,主要采用以下三种方法:
- 半结构化访谈:使用关键事件技术,对每位参与者进行了60至90分钟的面对面访谈,要求他们详细描述具体的教学片段,以获取其AI实践的全面叙述和具体例子(访谈协议见表2)。
- 参与者观察:观察涵盖了16次正式课堂会议以及非正式场合,包括教学和研究会议、办公室讨论以及社交媒体群聊。重点记录了教师和学生如何使用技术功能、具体使用目的,以及教师、学生和技术实体之间的互动过程,特别关注教师与同事之间的互动动态。
- 实物资料收集:系统收集的文件包括学校的AI实施计划、教师在使用AI工具前后的教案、社交媒体聊天记录以及学生作业。
3.4. 编码框架和编码过程
数据分析遵循Braun和Clarke(2006年)提出的系统主题分析程序,并借助NVivo 12软件进行编码。如第2.3节所述,PICRAT模型(Kimmons等人,2020年)作为描述性映射层的编码框架,定义了一个由学生参与模式(P–I–C:被动、互动、创造性)和技术对教师实践的影响(R–A–T:替代、增强、转变)构成的非层级坐标空间(见图1)。情境追溯层则通过归纳主题编码方法,对访谈、观察和实物资料中的数据进行分析,以识别导致实践差异的因素。
4. 研究结果
数据分析显示,教师在使用AI工具的方式上存在明显的差异。表层上看,差异体现在使用频率和深度上;更深层次上,则反映了教师如何平衡专业常规与组织期望之间的冲突。研究发现四种典型的实践类型及其差异原因。
4.1. 实践类型:四种不同的教师AI应用方式
通过对13名参与者报告的26个完整教学片段的深入分析,发现了实践的明显空间分布。图2展示了这些案例在PICRAT坐标系统中的分布情况,其中红色标记代表教师认为成功的应用案例,绿色标记代表遇到挫折或放弃的经历。通过将访谈数据与案例分布进行三角验证,我们将观察到的实践提炼为四种代表性类型。每种类型都体现了在日常教学限制下使用AI工具的独特方式及相应的战略取向。
4.1.1. 隐性赋能
第一种类型是隐性赋能,代表教师T1、T3和T12。这群教师大多具有丰富的教学经验和良好的专业认可度。他们在使用AI工具时采取了一种独特的策略,将AI工具局限于支持性角色——例如,利用AI生成初步的教学材料,然后由教师审核、修改并整合,最终以教师主导的方式呈现给学生。在课堂上,他们始终牢牢掌控教学逻辑的主线、知识解释的权威以及教学节奏,拒绝让技术干预其教学设计的重构。访谈表明,这种模式并非对AI的抵制,而是对自己教学方法的信心。这些教师将AI视为提升已有教学效率的“数字辅助工具”——只是众多辅助手段中的一种。
4.1.2. 仪式化增强
第二种类型是仪式化增强,代表教师T7、T8、T9和T10,他们的实践表现出明显的情境化和表演性特征。在日常教学中,这些教师倾向于限制技术使用,更多关注低层次的支持任务,如知识问答。然而,在具有制度激励的情境中——例如教学研究演示或公开评估会议——他们的技术使用方式转变为积极主动的展示模式,融入了数字化身介绍、实时课堂词云生成以及人机协作任务完成等元素,展现了明显的“智能化”特征。例如,在一次区级公开课上,T8设计了一个由AI驱动的词云活动作为课程的开场:学生们在共享平台上输入关键词,AI会实时将回应汇总到投影屏幕上。这一活动引发了观众的积极参与,并得到了评估人员的赞扬。然而,在后续访谈中,T8承认这个词云主要起到“热身”的作用,目的是营造活跃的课堂氛围,而不是为了支持任何特定的学习目标。这些教师的技术实践逻辑代表了一种高度情境化的战略性选择:在常规教学中,他们优先考虑效率和可控性,侧重于以讲授为中心的教学方式;在公开场合中,他们则主动响应组织对“技术演示”的期望。这里值得注意的是,这种行为逻辑实际上是一种情境性的表演策略:“创新”体现在教学的数字化包装上,而不是学生在认知参与度或处理深度上的实质性变化。
4.1.3 转型探索
第三种类型是转型探索,以教师T2、T4、T11和T13为代表,他们表现出强烈的内在驱动力。这些教师使用AI工具是基于他们对“什么是好教学”的理解,主动探索利用AI工具引导学生思考的可能性。例如,教师T11将AI配置成一个持有特定立场的辩论者;学生们需要实时识别AI论点中的逻辑谬误、证据缺口或价值预设,并当场生成反驳论点和补充证据,从而通过与AI的深入对话促进学生的实时知识生成和持续深入的思考。以传统的TPACK框架为例,这些教师在知识生成方面展现了三个领域的明显重叠,并愿意在教学环境中进行“试错”和“探究”,将技术应用视为能动性的积极表达和教学哲学的创造性转变。
4.1.4 谨慎距离
第四种类型是谨慎距离,以教师T5和T6为代表,他们的技术使用表现出明显的防御性逻辑。一方面,在外部环境的要求下,他们采取了最小的采用策略,与隐性赋能类型有表面上的相似之处;另一方面,他们也尝试了更高层次的应用,但与转型探索类型不同的是,这些教师通常对这些尝试的结果评价较低。访谈表明,这些教师对AI的有效性抱有高度理想化的期望,认为一个“真正有用的”工具应该能够在不需要额外学习和努力的情况下提供高质量的教学成果。当实际结果未达到这些期望时,教师的因果归因往往指向技术的局限性和不成熟性。T5的经历就说明了这一点。参加了一个培训工作坊后,T5尝试使用AI工具为不同水平的学生生成差异化的阅读理解问题。当生成的问题包含事实错误且与课程顺序不符时,T5得出结论:“这项技术还不足以用于实际课堂”,于是恢复了手动准备的材料,之后没有再进行任何调整。在这种认知结构的影响下,教师们在低层次的应用(被动-替代)中感到安全,但在高层次的尝试中很快受到挫折,从而强化了“技术更多是形式的而非实质”的印象。通过保持与技术的距离来确保专业安全,他们形成了封闭的技术价值认知循环。
4.2 形塑逻辑:教师AI实践差异化的多维力量
在4.1节提出的类型学基础上,进一步分析了影响教师差异化实践选择的因素。数据表明,差异化并非由单一原因造成,而是四个维度相互作用的结果:专业能动性、技术认知、组织治理和领域文化。图3将这些维度映射到四种实践类型上,颜色强度表示相对重要性。表3进一步详细说明了每个维度的子类别和操作定义。图3和表3共同构建了实践位置的描述性映射(RQ1)和实践差异化的背景追踪(RQ2)。
几个模式值得强调。对于隐性赋能类型,专业能动性是最决定性的力量:强烈的习惯连续性和教学自信使AI处于幕后角色,而组织和文化压力则具有相对中等的影响。仪式化增强类型呈现出相反的配置,组织治理——特别是将技术展示与专业发展激励相结合——成为主要的塑造力量,这一点通过同行对“成功模板”的模仿得到了强化。对于转型探索类型,专业能动性和技术认知共同显著:这些教师愿意承担试错的成本,并认识到AI作为对话伙伴的潜力,使他们能够进行更高层次的实践,尽管有限的制度失败容忍度限制了其范围。谨慎距离类型在三个维度上同时表现出高显著性,表明了一个复杂的强化因素网络,其中高教学理想、感知到的技术不成熟性和利益相关者期望的不一致共同导致了防御性的退缩。在所有四种类型中,没有单一维度足以解释任何实践模式。以下部分将详细探讨每个维度。
4.2.1 专业能动性维度:未形成的合作身份
教师的技术实践选择明显受到其专业能动性内在逻辑的限制,主要体现在三个层面——劳动力成本、专业角色和教学经验——这些因素共同驱动教师在AI应用上采取谨慎和保守的策略。首先,劳动力强度的权衡构成了技术采用的实践边界。面对沉重的教学和管理压力,教师在选择AI工具时最关心的是时间和努力的投入产出比。访谈显示,在做决策时,教师倾向于优先考虑AI工具校准的复杂性,而非其潜在的教学创新潜力。高认知投入和潜在的试错风险使教师避免使用需要深度校准的AI工具。在案例学校中,教师通常更喜欢采用来自社交媒体的已经相对成熟的AI应用模型,这些模型不需要他们进行“试错”,能够“快速产生结果”,从而最大化他们的工作量稳定性。其次,维护专业权威是限制技术干预深度的关键因素。大多数被采访的教师仍然认为自己是课堂上知识解释的唯一来源,AI工具的介入很容易被视为对其专业话语权威的削弱。尽管有些观点认为AI工具不能替代教师在价值引导方面的独特地位,但本研究观察到,教师对于知识解释层面的权威削弱表现出明显的防御心理。因此,教师倾向于将AI工具限制在辅助角色上,如朗读和问题生成,从而加强而非取代自己的权威。这种策略在常规教学中尤为明显。由于常规课程强调以讲授为基础的教学和进度控制,教师常常担心技术的介入会扰乱已建立的教学节奏,甚至认为技术在这样的情境中没有位置。与在公开课上使用技术营造氛围相比,在常规课程中维护专业权威使得AI工具的角色仅限于辅助工具。
最后,教学习惯的连续性巩固了教师在实践中的路径依赖性。具有稳定教学效能的教师,尤其是经验丰富的教师,经常面临已建立的知识系统与新工具之间的不匹配困境。访谈数据显示,成熟的教学系统难以在短期内进行重构以适应AI工具。例如,教师T12习惯于通过频繁的移动和在物理教室内的互动来建立课堂控制感;这种参与式行为高度依赖于教师对教学节奏的引导。然而,AI工具倾向于支持学生之间的个别互动,当学生的注意力从教师引导转移到屏幕互动上时,原本通过物理空间移动建立的教学联系就被改变了。这种转变实际上压缩了教师的身体表达空间。
4.2.2 技术认知维度:未形成的人机信任
在人机协作过程中,由于教师的技术理解仍处于动态调整阶段,人机信任关系表现出显著的脆弱性,直接影响了应用的广度和教学领域的互动逻辑。这在三个方面表现出来:对技术赋能的理解、对输出内容的担忧以及对话价值的缩小。首先,对技术赋能的理解仅限于基于结果的工具定位。访谈显示,大多数教师通常对技术持有“开箱即用”的期望;AI工具的赋能往往等同于其功能输出的即时可用性,而不是它们在教学过程中的中介引导作用。例如,在备课过程中,教师主要使用AI工具快速生成结构化的教学计划,很少用于模拟或特定教学过程的演练。这种结果导向的工具视角将AI限制为辅助劳动的自动化,简化为替代教师重复性任务的资源提供者。其次,对输出幻觉的担忧增加了额外的应用负担。在涉及公开教学或评估情境的情况下,教师倾向于表现出明显的风险规避倾向。一位教师坦率地表示:“我宁愿花额外的时间验证,也不愿在课堂上承担不确定性”(T7)。观察还显示,一些教师使用传统搜索工具对AI生成的内容进行二次验证,或者使用预设的固定响应路径和压缩智能代理设计中的对话轮次来减轻潜在风险。这真实反映了教师对技术可控性的核心关注,同时也无形中增加了他们的认知负担。最后,简化的AI互动逻辑缩小了对话的教育潜力。尽管政策鼓励深入的人机协作,但在课堂教学实践中,这种对话往往被简化为结构化的“精确问答”。在案例学校的实践中,AI工具主要用于回答具体、明确的知识性问题,表现出“回答等于对话”的特征。虽然这种应用突出了反馈的即时性,但它忽略了对话本身应该具备的多样性和创造性。进一步思考表明,这样的应用可能会削弱课堂沉默和停顿所蕴含的教学价值。
4.2.3 组织治理维度:未形成的赋能责任分享机制
在推进AI赋能的过程中,尚未建立有效的组织管理和教师实践之间的风险分担和责任分配机制。三个领域尤为突出:评估指标指导、资源整合思维和缺乏创新容忍度。首先,评估标准将AI赋能的努力引导向可见的表现形式。当前案例学校的激励机制高度关注高可见性的技术行为;例如,在公开课、示范课和教学研究活动中,AI工具的使用经常被视为教学创新的核心指标。然而,对于常规课堂中低可见性、高适应性的应用缺乏关注。教学创新和AI实践通常被制度性地捆绑在一起,将与技术实践联系起来,与职业发展机会(如职称晋升和奖励)联系起来。即使那些尚未对技术价值有内在理解的教师,在制度压力下也会选择采用特定的技术标签以满足合规要求。观察表明,这种导向使教师的技术实践行为趋向于短视和表演性,从而在评估系统中获得利益。其次,资源整合增加了技术适应的认知成本。案例学校在数字基础设施上进行了持续投资,整合了多个教学支持系统,并为教师提供了基本培训和技术咨询。由于人工智能技术发展迅速,在技术架构和教学逻辑上都与现有系统存在差异,教师仍需要根据学科特点和课堂需求进行个性化调整。观察表明,这一适应过程要求教师在内容筛选和工作流程优化上投入更多时间,客观上增加了课程准备的认知负担。因此,大多数教师选择在可控性强、互动性低的教学环节中使用人工智能技术,以避免系统复杂性带来的风险和成本。结果是,尽管学校层面资源丰富,但缺乏与人工智能工具特性相匹配的统一支持系统,实际上阻碍了教师探索更高层次应用(如创造性转化)的积极性。此外,对失败的容忍度不足也抑制了教师共同承担技术变革责任的意愿。案例学校积极营造了鼓励探索的制度环境,通过指定的研究项目、资源支持和成果展示平台为教师的人工智能教学创新提供政策空间和正面激励。虽然当前的支持系统在总结和传播成功经验方面相对系统化,但尚未建立针对“失败”及其他预期外结果的标准化经验反思和过程导向的支持机制。在这种背景下,面临高风险教学场景的教师倾向于模仿已经验证过的“成功模板”,避免在核心教学环节使用人工智能技术。因此,人工智能的应用主要不是基于个人教学逻辑的深度变革,而是被策略性地限制在非关键、低风险的活动中,以确保既定的教学目标不受威胁。
4.2.4. 田野文化维度:缺乏统一的创新愿景
教师的技术实践行为并非孤立个体的行为;然而,多个利益相关者之间尚未形成以教学转型为导向的共同愿景。这主要体现在三个方面:同行实践示范、团队文化氛围和利益相关者的需求。首先,在教师的日常互动中,对人工智能教学的理解常常被简化为与现有教学模式的负面对比。当一位教师提出新的技术应用想法时,该提议很容易被解读为对传统教学实践的隐性批评,迅速将技术讨论转变为价值立场之争。由于接受新方法被视为否定以往的实践,团队成员在感到自己的职业身份和工作习惯受到挑战时可能会采取防御态度。访谈显示,目前教师的人工智能实践主要依赖于个人经验,创新尝试往往具有碎片化特征,甚至隐含形成了相互孤立的“创新孤岛”。
其次,团队尚未建立规范的共创机制。有效的教学创新通常始于不成熟的概念胚胎,需要团队合作、迭代改进和集体智慧的注入才能转化为可稳定实施的计划。然而,当前的教学和研究合作模式在支持这些“初创想法”的成长方面仍有优化空间。一些受访教师表示,当他们提出初步的人工智能应用概念时,缺乏规范的协作研究流程意味着创新者往往需要独自承担从计划设计到技术实施的全周期责任。在这种高成本压力下,教师更倾向于提出低风险、易于实施的渐进式改进,以确保在教学和研究活动中满足“人工智能元素”的形式要求,而无需承担与概念创新相关的不确定性和责任负担。
最后,在区域层面,多个利益相关者之间尚未形成共同愿景。在围绕人工智能教学实践的情况下,家长、学生、教师和外部学术话语之间存在多种并不完全对称的利益需求。家长看重学术成绩的稳定性;学生关注互动过程的主观体验;而外部话语强调技术的“颠覆性”作用。面对这些不同的期望,教师在应用人工智能工具时需要在多元需求之间寻求平衡。特别是当某一节课未能产生所谓的“颠覆性效果”时,为了避免被批评“形式主义”或“不了解人工智能”,教师倾向于将技术限制在被动、可控的非核心教学环节,从而在各种利益诉求中找到最大公约数。这种策略虽然牺牲了人工智能工具的深层潜力,但也是出于在多重需求压力下维持职业安全的理性选择。
5. 讨论与结论
通过对一所人工智能示范学校的纵向案例研究,本研究确定了四种典型的教师人工智能应用实践类型:隐性赋能、仪式化增强、转化探索和谨慎疏离。进一步分析表明,这四种实践类型的形成受到四个相互作用维度的影响:专业能动性、技术认知、组织治理和田野文化。在专业能动性维度上,教师通常优先考虑劳动力强度的权衡、维护专业权威以及现有教学习惯的连续性,这使得技术应用倾向于低风险、高可控性的路径。在技术认知维度上,大多数教师将人工智能的赋能价值局限于总结性成果,同时对算法误用的警惕加剧了应用空间的压缩。在组织治理维度上,学校的评估系统将技术使用与专业发展机会捆绑在一起,但缺乏对失败的容忍机制。在田野文化维度上,同行之间的观念冲突导致了“创新孤岛”的出现,家长、学生和政策话语之间的竞争性期望使教师在更高层次的技术应用上陷入困境。
在详细讨论这些发现之前,有必要明确说明本研究的核心贡献。如第2.3节所述,采用的双层分析方法——描述性映射 followed by contextual tracing——旨在避免线性整合模型中嵌入的评价假设。这项分析得出了三个挑战主流理论假设的结论:首先,相似的可观察人工智能实践可能反映根本不同的潜在动机;其次,表面上的“高级”技术应用可能是表演性的而非真正具有变革性的;第三,看似“低级”的应用可能只是对制度约束的理性回应而非能力不足。总的来说,本研究的主要理论贡献不是一种新的整合模型,而是一种解释为什么具有相似能力和资源的教师会走上不同实践路径的情景机制。这四种实践类型和四个解释维度构成了一个基于实证的分析框架,强调能动性、认知、治理和文化的相互作用,而不是将教师简单地按线性采纳程度排序。
5.1. 讨论教师的不同技术实践类型
一个核心发现是,教师使用人工智能工具的行为并非一刀切,而是存在不可还原的多样性。这一观察对主流理论如何框架技术采纳具有启示意义。它质疑了线性层次结构的假设:现有理论认为实践差异源于个体在能力、意愿或认知结构上的差异,将“高级”应用视为本质上更优的。Hamilton等人(2016)在SAMR模型中批判了这一假设,Blundell等人(2022)也证明了其经验上的不稳定性。我们的数据支持这一观点,并进一步指出,在人工智能工具已广泛普及的背景下,实践差异可能更多地是对制度约束的响应,而非个体能力水平的反映。本研究中的教师很少超越其制度环境,达到规范模型所设想的理想化转化应用。实证研究表明,无论是本研究还是Song等人(2025)都发现了一种倾向于教学重建的“理想”实践类型,两组样本之间存在相当大的行为重叠。然而,整合深度与动机之间并未形成清晰对应关系。例如,仪式化增强的教师(如T7、T8、T9、T10)也参与了更高层次的技术实践(如结合实时词云和人机协作任务),但他们的根本动机是为了展示而非教学变革(见第4.1.2节)。如果仅根据整合深度对教师进行分类(如SAMR方法通常所做的那样),可能会导致将策略性行为误标记为发展滞后。
5.2. 讨论教师不同技术实践类型的影响因素
第二个总体发现是,教师的人工智能相关实践选择并非由单一因素决定,而是由专业能动性、技术认知、组织治理和田野文化的互动动态共同塑造的。结构上,这与文献中常见的“内部信念-外部环境”框架相一致,但本分析在几个方面对其进行了补充。专业能动性方面,教师通常倾向于低风险、高可控性的技术应用路径,同时强调对算法误用的警惕。在组织治理方面,学校的评估系统将技术使用与专业发展机会绑定在一起,但缺乏对失败的容忍机制。在田野文化方面,同行之间的观念冲突形成了“创新孤岛”,家长、学生和政策话语之间的竞争性期望使教师在更高层次的技术应用上处于两难境地。
在详细讨论这些发现之前,明确说明本研究的核心贡献是有必要的。正如第2.3节所述的,双层分析方法——先进行描述性映射,再深入情境追踪——旨在避免线性整合模型中隐含的评价假设。分析得出了三个挑战现有理论的结论:首先,相似的可观察人工智能实践可能对应于根本不同的潜在动机;其次,表面上的“高级”技术应用可能是表演性的而非真正具有变革性的;第三,看似“低级”的应用可能是对制度约束的理性回应而非能力不足。综上所述,本研究的主要理论贡献不是一种新的整合模型,而是一种解释为什么具有相似能力和资源的教师会走向不同实践路径的情境机制。这四种实践类型和四个解释维度构成了一个基于实证的分析框架,突出了能动性、认知、治理和文化的相互作用,而不是简单地对教师进行线性排序。
5.1. 讨论教师的不同技术实践类型
一个核心发现是,教师使用人工智能工具的技术实践并非统一一致,而是存在不可还原的多样性。这一观察对主流理论框架技术采纳的方式具有启示意义。它质疑了线性层次结构的假设。正如文献综述所论证的,现有理论隐含的前提是:实践差异源于个体在能力、意愿或认知结构上的差异,将“高级”应用视为本质上更优的。Hamilton等人(2016)在SAMR模型中对此前提提出了批评,Blundell等人(2022)也证明了其经验上的不稳定性。我们的数据支持这一观点,并进一步指出,在人工智能工具已经广泛普及的背景下,实践差异可能更好地理解为对制度约束的响应,而非个体能力水平的反映。本研究中的教师很少超越其制度环境,实现规范模型所设想的理想化转化应用。实证表明,当前研究和Song等人(2025)都发现了一种倾向于教学重建的“理想”实践者类型,两组样本之间存在相当大的行为重叠。然而,整合深度与动机之间并未形成明确对应关系。仪式化增强的教师(如T7、T8、T9、T10)也参与了更高层次的技术实践(如结合实时词云和人机协作任务),但他们的根本动机是为了展示而非教学变革(见第4.1.2节)。如果仅根据整合深度对教师进行分类(如SAMR方法通常所做的那样),可能会将策略性行为误标记为发展滞后。
5.2. 讨论教师技术实践的影响因素
第二个总体发现是,教师的人工智能相关实践选择并非由单一因素决定,而是由专业能动性、技术认知、组织治理和田野文化的互动动态共同塑造的。结构上,这与文献中常见的“内部信念-外部环境”框架一致,但本分析在几个方面对其进行了补充。专业能动性方面,教师通常优先考虑劳动力强度的权衡、维护专业权威以及现有教学习惯的连续性,这导致了技术应用倾向于低风险、高可控性的路径。在技术认知方面,大多数教师将人工智能的赋能价值限制在总结性成果上,同时对算法误用的高度警惕进一步压缩了应用空间。在组织治理方面,学校的评估系统将技术使用与专业发展机会捆绑在一起,但缺乏对失败的容忍机制。在田野文化方面,同行之间的观念冲突导致了“创新孤岛”的出现,家长、学生和政策话语之间的竞争性期望使教师在更高层次的技术应用上处于困境。
在详细讨论这些发现之前,有必要明确说明本研究的核心贡献。如第2.3节所述,采用双层分析方法——先进行描述性映射,再深入情境追踪——旨在避免线性整合模型中隐含的评价假设。这项分析得出了三个挑战现有理论的结论:首先,相似的可观察人工智能实践可能反映根本不同的潜在动机;其次,表面上的“高级”技术应用可能是表演性的而非真正具有变革性的;第三,看似“低级”的应用可能只是对制度约束的理性回应而非能力不足。总体而言,本研究的主要理论贡献不是一种新的整合模型,而是一种解释为什么具有相似能力和资源的教师会走向不同实践路径的情境机制。这四种实践类型和四个解释维度构成了一个基于实证的分析框架,强调了能动性、认知、治理和文化的相互作用,而不是简单地对教师进行线性排序。接下来的讨论将探讨这些发现与先前研究的关系。在行政和教学要求的双重压力下,教师对技术投资的主要考虑因素是成本而非技术理念——这一模式与布尔迪厄(Bourdieu)关于“惯习”(habitus)概念所预测的实际理性是一致的(Belland, 2009),但在人工智能(AI)整合的具体背景下却鲜有文献记载。技术认知:超越感知的有用性。目前主流的解释框架——感知的有用性和易用性——主要集中在对工具效力的评估上。孙等人(Sun et al., 2024)证实,教师采用AI的意愿在很大程度上取决于这两个变量。我们的研究结果确实表明感知的有用性很重要,但进一步揭示了一个更深层次的方面:教师对AI的理解取决于他们如何定位自己与技术之间的关系,而不仅仅是因为他们认为AI高效。在当前AI的普及阶段,这种定位仍然不稳定且相当脆弱。这种人机关系的脆弱性与组织行为研究的发现相呼应。徐等人(Xu et al., 2025)研究工作场所中的员工AI合作时,指出AI身份(包括依赖性、情感投入和关联性)是行为结果的关键中介因素。然而,本研究的教师尚未形成这种稳定的AI身份;他们对AI的定位仍然处于试探性阶段,主要是一种工具性的使用方式,这解释了为什么课堂应用被简化为低层次的互动形式。由于教师往往忽视了AI的对话性和创造性功能——将其视为提供现成答案的工具而非开放式探究的合作伙伴——课堂应用就被限制在单向问答或资源生成的任务上。这一模式与Blundell等人(Blundell et al., 2022)的发现一致,即如果不考虑教师原有的实践背景,基于SAMR的分类体系会变得不稳定:“放大”与“替代”之间的界限取决于教师是将AI视为对话伙伴还是答案机器。
组织治理:支持条件下的悖论。学校层面因素对技术采纳的重要性已被广泛认可。朱(Zhu, 2013)认为开放的学校文化是创新技术应用的基础;Vanderlinde等人(Vanderlinde et al., 2015)强调了明确的ICT政策在促进技术采纳中的作用;H?kansson Lindqvist(H?kansson Lindqvist, 2019)发现营造“安全试错”环境能激发教师的探索意愿。本研究确认了这些支持条件的重要性。然而,它还揭示了一个结构性悖论:仅仅强调提供支持往往会被忽略。AI工具仍处于快速迭代和功能不成熟的阶段,其输出具有高度不确定性。在本研究中,教师不可避免地经历了多次校准失败和教学中断。这样的探索过程在认知上要求很高且本质上具有风险,需要制度的支持来分担风险。然而,学校的治理重点在于短期内可见的结果,对于探索过程中不可避免的失败尝试几乎没有给予认可(见第4.2.3节)。这一发现进一步扩展了Hamilton等人(Hamilton et al., 2016)对脱离具体情境的整合模型的批评:仅仅提供资源和鼓励是不够的;如果希望教师超越被动-替代的现状,机构可能还需要承担失败的成本。
学校文化:同伴既是推动者也是限制因素。先前的研究指出,同事在技术实践中既是推动者也是限制因素,知识流动主要通过少数关键个体进行传递,而大多数教师则处于被动接受者的角色。本研究通过记录AI采纳过程中的同伴互动如何充满隐性的价值立场冲突,进一步强调了这一点。新AI应用的提议很容易被解读为对现有教学方法的批判,从而导致技术讨论演变为身份纠纷(见第4.2.4节)。虽然早期研究将团队文化描绘为通过共享规范、示范和集体意义构建来促进变革的积极力量,但本研究发现,团队文化实际上更像是一个阻碍技术变革的因素。关于利益相关者的需求,研究结果与Lewin和Luckin(Lewin & Luckin, 2010)以及Li等人(Li et al., 2025)的研究结果一致:AI支持的教学带来的好处在各种利益相关者群体之间存在分配不均,而不同期望之间的矛盾给教师的实践选择带来了额外的限制。
**5.3 限制因素**
需要承认几个限制。首先,这项研究是在中国东部一所被指定为省级AI示范学校的公立中学进行的。该校拥有高于平均水平的数字化基础设施、持续的支持性行政管理和定期的教师培训。本研究发现的实践类型和影响因素是在这种相对有利的环境背景下形成的,在资源较少或政策支持较弱的其他学校中可能表现不同。因此,这些发现应被视为基于实证的提议,而非普遍适用的结论。其次,尽管13名参与者的样本数量适合进行深入的定性案例研究以实现分析上的普遍性(Creswell & Creswell, 2017),但无法将其结果推广到更广泛的教师群体。未来的研究可以测试所提出的分类及其相关解释维度是否适用于更大的样本、不同类型的学校和不同的文化背景。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号