课堂层面逆境量表的项目反应理论分析

《Psychology in the Schools》:Item Response Theory Analysis of the Classroom Level Adversity Scale

【字体: 时间:2026年03月13日 来源:Psychology in the Schools 1.7

编辑推荐:

  课堂层面逆境量表(Classroom Level Adversity Scale, CLA)用于捕捉教师对其课堂中整体需求与挑战的知觉。该量表反映了一种基于教师报告的课堂集体特征,可为理解教师在与学生工作时所感知到的生态风险程度提供信息。CLA 的开发旨在推进

  
课堂层面逆境量表(Classroom Level Adversity Scale, CLA)用于捕捉教师对其课堂中整体需求与挑战的知觉。该量表反映了一种基于教师报告的课堂集体特征,可为理解教师在与学生工作时所感知到的生态风险程度提供信息。CLA 的开发旨在推进对教师课堂压力源知觉的测量,并已被用于考察其与教师或儿童层面结局以及其他课堂相关过程之间的关联。迄今尚未对 CLA 的心理测量学特性进行检验。本研究在项目反应理论(Item Response Theory, IRT)框架下对 CLA 进行评估。采用分级反应模型(graded response model, GRM)(AIC = 7749.786;BIC = 7015.628)后发现,测验信息曲线与目标信息曲线并不一致,这表明该量表当前最精确地捕捉的是中等逆境课堂的信息,而其理想目标应是最严重逆境课堂的信息。研究识别出若干导致这种不匹配的条目,并提出了修订建议。研究结论认为,提高该量表的测量精度,将有助于提供一种更具实用价值的工具,以捕捉教师对课堂压力源的观点。
该文发表于《Psychology in the Schools》,聚焦课堂层面逆境(Classroom-Level Adversity, CLA)这一学校心理学与教育评估交叉领域的重要概念。研究背景在于,累积风险理论长期主要用于解释个体学生暴露于多重压力源后在学业、行为与社会情绪发展上的差异,但真实教育情境中的风险并非仅作用于单个学生,而是常以课堂为单位聚集并共同塑造教学环境。研究者据此将风险情境从个体层面拓展到课堂层面,强调当同一课堂内大量学生同时面临贫困、家庭压力、健康问题、行为困难、出勤不稳定等生态性压力时,这种累积的课堂生态负荷会改变教学组织、增加教师管理与支持负担,并进一步影响全体学生的学习机会与发展结果。既有研究已显示,较高 CLA 与更高的行为管理需求、更少的有效教学时间、较低质量的师生互动、较弱的学业表现和执行功能,以及教师抑郁症状和教学压力增加相关,因此准确测量 CLA 对研究、筛查、干预与资源配置都具有现实价值。

然而,尽管课堂层面逆境量表(CLA)已在多项研究中使用,其心理测量学属性始终未在现代测量理论框架下得到系统验证,这构成当前领域的关键缺口。尤其对于一个旨在识别高逆境课堂的工具而言,研究者不仅需要知道量表是否具有内部一致性,还需要明确各条目在不同逆境严重度水平上的区分能力、阈值分布和整体测量精度是否与量表目标相匹配。若量表只能较好地区分中等逆境课堂,而不能准确识别最严重逆境课堂,则其在高风险课堂筛查、定向支持和干预设计中的应用价值将明显受限。基于这一问题意识,研究人员开展了本研究,尝试在项目反应理论(IRT)框架下对 CLA 进行首次系统检验,以判断其是否能可靠、有效地测量课堂层面逆境,并据此提出条目修订方向。

研究人员首先从理论层面为 CLA 提供了多重支撑,包括生物生态模型(Bioecological model,强调个体、同伴与课堂环境交互塑造发展)、课堂承载能力框架(Classroom Carrying Capacity framework,强调课堂资源有限且会被累积风险持续挤压)以及同伴效应与课堂构成模型(peer effects and classroom composition models,强调学生集体特征对个体与整体学习过程的影响)。在这些理论视角下,CLA 不仅是学生困难的简单汇总,更是共享教学环境中生态风险密度的课堂层面表征。与课堂资源与要求评估(Classroom Appraisal of Resources and Demands, CARD)不同,CLA 并不主要测量教师对工作条件的总体主观负担感,而是更具体地指向课堂内学生相关需求、困难与压力的聚集程度。

方法上,研究所用样本来自作者团队主持的三个项目,共纳入 175 名幼儿园至三年级教师,均来自美国中大西洋及东南部地区的城市、郊区及部分乡村小学。量表包含 17 个条目,围绕“这些因素在使你课堂中的所有儿童取得学业成功方面构成多大问题”这一提示,由教师按五点量表作答。条目内容涵盖家庭生活、家校合作、儿童健康、营养不足、低智力、文化差异、英语能力、非标准英语、特殊学习问题、破坏性行为、物资不足、师生比、学生流动性、社会准备不足、学业准备不足、注意问题以及迟到/缺勤等。研究者先检验单维性假设,随后比较部分计分模型(partial credit model, PCM)与分级反应模型(GRM)的拟合,并进一步分析个体拟合、条目拟合、阈值参数、区分度参数、信息曲线、标准误及量表层面的信度与内容效度。

主要关键技术方法可概括如下:其一,基于三个教师样本合并形成的 175 人数据集进行心理测量分析,样本来源涵盖城市、郊区、乡村及高经济弱势学校情境;其二,先以经典测验理论(CTT)作初步条目难度与区分度筛查,再在 IRT 框架下检验单维性;其三,比较 PCM 与 GRM 两种多分级反应模型,并以 AIC、BIC 选择更优模型;其四,在选定 GRM 后,对条目阈值、条目区分度、个体拟合(Zh)与条目拟合(χ2)进行校准;其五,通过测验信息曲线与目标信息曲线比较量表在不同逆境水平上的测量精度,并结合 Cronbach's α 与分离信度评估整体信度。

以下依据正文结果部分的小标题进行总结。

3.1 IRT Model, Person, and Item Fit
研究者比较 PCM 与 GRM 后发现,两种模型均成功收敛,但 GRM 的拟合指标更优(AIC = 7749.786;BIC = 7015.628),因此被选为最终模型。这一结果说明,允许条目区分度自由变化比假定所有条目区分力相同,更适合描述教师对课堂逆境条目的判断过程。条目拟合分析显示,没有任何条目出现显著 χ2 失拟,表明所有条目在模型假设下都能基本良好地解释观察数据。个体拟合方面,15 个个案(8.57%)的 Zh 值超过 |1.96|,提示少量教师的实际反应模式与模型预测不一致,但研究者在样本量有限的前提下保留这些个案继续分析。该结果支持量表总体结构稳定,同时也提示教师知觉受课堂规范、条目解释方式等因素影响,可能存在异质性。

3.2 IRT Calibration
校准结果显示,目标信息曲线希望量表在高逆境端达到最高精度,即优先识别最严重逆境课堂;但实际测验信息曲线的峰值却落在中等逆境区域。这种不一致是全文最核心的发现,意味着该量表虽然能够测量课堂逆境,却并未有效对准其最重要的应用目标。换言之,CLA 当前更擅长区分中等逆境课堂,而在最严重逆境课堂上的测量精度不足,因此对于需要优先筛出高生态风险课堂的研究与实践场景,其功能尚未充分实现。

3.3 Difficulty
条目阈值分析表明,所有条目的阈值排序均合乎逻辑,即随着作答从“不是问题”向“严重问题”递进,所需潜在逆境水平同步上升,说明反应类别结构合理。从覆盖范围看,阈值总体跨度较大,范围为 0.4468 至 5.5877,但分布呈正偏态,许多条目即便在最高认同水平上,其阈值仍然偏低。这表明不少条目过于“容易”被教师高强度认同,因此即便在逆境较低或较轻的课堂中也可能得到较高评分。尤其是“破坏性行为问题”“学生注意问题”“师生比”等条目的最高阈值较低,提示这些问题在课堂中较为常见,不足以有效标识最严重逆境情境。相对而言,“文化差异”“英语能力”“非标准英语”“学生流动性”等条目更难被认同,因而处于较高难度端。标准误分析进一步显示,量表在高阈值处误差普遍增大,第一阈值平均标准误为 0.30,第四阈值平均标准误为 0.46,说明越到严重逆境端,测量越不精确。其中“文化差异”与“学生流动性”在第四阈值上的标准误均达 1.02,提示这些条目对强烈认同的捕捉稳定性较差。

3.4 Discrimination
所有条目区分度参数均为正值,且多数较高,说明该量表总体具备区分低逆境与高逆境课堂的能力。区分度最低的条目为“师生比”“英语能力”“非标准英语”,显示这些条目在不同逆境水平教师之间的鉴别能力相对较弱。结合难度结果可以看出,量表并非完全缺乏辨别力,而是部分条目要么过于常见、导致高逆境识别不足,要么鉴别效能不足,从而共同导致总体信息峰值偏向中等逆境区间。

3.5 Test-Level Reliability and Validity
在量表层面,Cronbach's α 为 0.85,内部一致性较高;逐项删除条目后的 α 值仍保持稳定,表明各条目均对整体量表的稳定测量有所贡献。基于 GRM 结果计算的分离信度为 r = 0.8790,意味着近 88% 的观察方差可以由模型解释。研究者据此认为 CLA 在信度方面表现良好。不过,在效度尤其是内容效度层面,研究者持较谨慎态度。一方面,大多数条目确实与“妨碍儿童学业成功的课堂风险因素”这一构念相关;另一方面,部分原始条目已经显得过时,且某些条目带有潜在价值判断色彩,例如将“非标准英语”视作课堂逆境指标,可能隐含对语言与文化差异的负面预设。此外,CLA 目前完全依赖教师主观报告,研究者尚不清楚其与课堂客观逆境程度之间的对应程度,也无法确认教师是否对某些信息,如家庭生活,拥有充分而准确的判断依据。

在讨论部分,研究者明确指出,本研究是 CLA 首次在 IRT 框架下的系统评估。总体结论是:该量表具有较强信度、良好条目拟合和可接受的单维结构,因此作为教师课堂逆境知觉的测量工具具有一定基础;但其测量精度主要集中于中等逆境,而非目标所要求的严重逆境,这一偏离限制了其在高风险课堂识别中的实用性。研究者据此建议,不应简单删除问题条目,而应优先修订“过易”条目,使其更具体、更严重、更能代表高生态压力情境,例如将“家庭生活问题”细化为“住房不稳定”,将“破坏性行为”改写为“持续且极端的挑战性行为”。至于难度较高的条目,如文化与语言相关项目,研究者建议暂不轻易变动,而应结合更广泛样本进一步判断其高难度究竟源于样本构成还是条目本身属性。

研究者同时强调,CLA 与其说是学生客观困境的直接指数,不如说是教师如何体验课堂情境压力的工具。因此,该量表未来若要进一步提升效度,宜引入多信息源设计,包括学校行政记录、学生出勤与流动性资料、特殊教育记录、家长报告和直接课堂观察等,以降低单一教师报告可能带来的压力偏差、效能偏差或隐性偏见。作者也提出,未来的课堂层面评估不应仅围绕学生缺陷性特征构建,还应更多纳入可改变的环境与资源因素,如课堂资源、成人—儿童比例、教师经验与自我效能等,以形成更具资产导向(asset-based)的测量框架。

研究结论部分可译为:本研究在项目反应理论(IRT)框架下,对课堂层面逆境量表(CLA)进行了基础性评估。研究发现,尽管该量表能够捕捉课堂逆境的重要方面,但其对中等逆境水平的测量最为精确,而对最严重逆境水平的测量精度不足,这限制了其在最高风险课堂中的有效性。研究识别出若干导致这种不匹配的条目,表明有必要进行针对性修订,以使量表与其预期用途更好地一致。对于研究者而言,这些结果为未来修订与验证 CLA 提供了经验基础,从而支持对课堂层面风险及其与教学、学习过程关系作出更有力的推断。对于实践工作者和学校管理者而言,更精确的课堂逆境测量有助于在高情境风险环境中开展资源配置、干预规划和教师支持。上述意义共同表明,持续推进 CLA 的心理测量学发展,对于支撑研究与实践中的循证决策具有重要价值。
相关新闻
生物通微信公众号
微信
新浪微博

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号