了解高成就的东亚学生中的数学焦虑问题:基于2022年PISA数据的机器学习分析

《Personality and Individual Differences》:Understanding mathematics anxiety among high-achieving East Asian students: A machine learning analysis of PISA 2022 data

【字体: 时间:2026年06月23日 来源:Personality and Individual Differences 2.8

编辑推荐:

  Xu Wei|Kan Guo北京师范大学数学科学学院,中国北京市海淀区新街口外大街19号,邮编100875摘要尽管东亚地区的学生在国际评估中表现优异,但在2022年PISA测试中他们表现出较高的数学焦虑水平。本研究采用机器学习算法XGBoost,分析2022年PISA数据中来自六

  
Xu Wei|Kan Guo
北京师范大学数学科学学院,中国北京市海淀区新街口外大街19号,邮编100875

摘要

尽管东亚地区的学生在国际评估中表现优异,但在2022年PISA测试中他们表现出较高的数学焦虑水平。本研究采用机器学习算法XGBoost,分析2022年PISA数据中来自六个东亚地区(新加坡、澳门、中国台北、香港、日本和韩国)的34,968名学生的数学焦虑预测因素。通过递归特征消除法确定了26个关键预测因子,运用Shapley加性解释法来评估这些预测因子的作用重要性,同时用偏依赖图来呈现非线性效应。数学推理自我效能感和21世纪数学能力是最强的负向预测因子,其次是总体压力应对能力。数学成绩与焦虑之间的关联较弱,只有在分数非常高时焦虑程度才会下降。在学校层面,数学教师的总数是最重要的因素,且呈现出非线性但总体为正的关联关系。这些研究结果为理解高成就教育环境中焦虑的复杂成因提供了新的视角。

引言

数学焦虑指的是由数学引发的担忧、压力或无助感(OECD,2015)。具有较高数学焦虑水平的学生往往在数学学习上表现不佳,还会回避STEM等与数学相关的领域,从而限制了他们的职业选择(Megreya等人,2025;OECD,2013)。
与数学成绩与焦虑之间通常存在的负相关关系不同(OECD,2023b),以优异学术表现为特色的东亚国家却出现了较高的数学焦虑水平(Dowker等人,2016)。具体而言,在2022年国际学生评估项目中,澳门、中国台北、香港和日本的焦虑水平均高于OECD的平均水平。即便新加坡和韩国的数学焦虑水平略低于OECD平均水平,但也高于许多成绩较差的国家(OECD,2023b)。造成这一矛盾的原因尚不清楚,不过自我效能感、教师支持以及文化影响等因素可能与之有关(Ahmmed等人,2024;Gallagher,2012;Leung等人,2010)。以往的许多研究要么单独探讨数学焦虑的预测因素,要么使用传统的统计方法(如线性模型),而这些方法存在严格的参数假设限制,往往无法捕捉复杂的非线性关系(Wooldridge,2010)。我们需要指出的是,当前的统计建模方法提供了超越简单线性模型的灵活扩展方式,比如广义线性混合效应模型和广义加性模型,它们能够处理层次结构和非线性关系。然而,当主要目标是进行样本外预测,且存在众多候选预测因子以及复杂的依赖关系时,这些模型往往需要事先对函数形式和交互结构进行大量规定(Hastie & Tibshirani,1986)。因此,在一些高维场景下,这类方法可能与以预测为核心的目标不太契合(Duarte等人,2019)。
像XGBoost这样的机器学习方法采用以预测为导向的方式,能够处理众多相互关联的预测因子,还能自动识别非线性关系和交互效应,无需事先对函数形式或交互结构进行复杂规定,通常能提升样本外预测性能(Chen & Guestrin,2016;Friedman,2001)。但目前很少有研究运用机器学习方法来探究东亚学生的数学焦虑问题。这项以预测为重点的研究利用XGBoost分析六个东亚地区的2022年PISA数据,旨在找出数学焦虑的关键预测因子,并阐明这些预测因子与学生预期数学焦虑水平之间的关系,以便为相关决策提供依据。本研究围绕两个研究问题展开:

研究问题1

东亚学生中,哪些因素是导致数学焦虑的最重要预测因子?

研究问题2

这些预测因子与学生的数学焦虑之间存在怎样的关联?

章节节选

数学焦虑

数学焦虑被定义为一种特定的心理状态:“在各种日常生活和学术情境中,因处理数字和解决数学问题而产生的紧张与焦虑情绪”(Richardson & Suinn,1972,第551页)。后续研究则认识到其具有多维度特征,既包括认知层面的担忧,也包括情感层面的困扰(Wigfield & Meece,1988)。还有学者进一步区分了学习焦虑和评价焦虑(

数据

本研究使用了2022年PISA的数据,研究对象为六个东亚地区:新加坡、澳门、中国台北、香港、日本和韩国。该数据集包含了34,968名15岁学生的回答信息(新加坡为6606人,澳门为4384人,中国台北为5857人,香港为5907人,日本为5760人,韩国为6454人),同时还附有对应的学校校长和家长问卷调查数据。

因变量

数学焦虑是通过六个问题来测量的,这些问题反映了学生在与数学相关的情境中所感受到的焦虑程度。

数学焦虑的关键预测因子

如图1所示,当纳入26个特征后,模型的学习曲线开始趋于平稳。此时模型的R2值为26.35%,而如果将全部117个特征都纳入模型,R2值仅上升至28.48%,增幅仅为2.13%。为了提高效率并便于解读结果,我们选择了最具预测意义的26个特征用于模型构建。更详细的学习曲线图(图2)进一步证实了这一选择的合理性,数据显示当特征数量在26个左右时,R2值的波动幅度仅为0.64%

数学成绩的作用有限

虽然数学成绩通常被视为影响焦虑程度的关键因素(Ramirez等人,2018),但我们的研究结果表明其预测能力相对较弱。在学生层面的预测因子中,PV1MATH的排名较低,而且偏依赖分析显示,无论分数在400到550之间还是更高,学生的焦虑水平都保持较高,只有分数再高时焦虑程度才会下降。这种现象可能反映了社会文化方面的压力。所研究的六个东亚经济体都深受儒家文化的影响(Leung,2001),在这种文化背景下,学业

CRediT作者贡献说明

Xu Wei:负责撰写——初稿、方法论、正式分析。Kan Guo:负责撰写——审阅与编辑、验证、监督。

利益冲突声明

作者声明不存在任何可能影响本文研究结果的已知财务利益冲突或个人关系。

致谢

无。
相关新闻
生物通微信公众号
微信
新浪微博

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号