《Children》:Visual System Alterations for Identifying Teacher-Reported Academic Difficulties in Schoolchildren: A Machine Learning Analysis
编辑推荐:
背景/目的:高效的视觉信息加工与学龄儿童的阅读、书写及持续注意密切相关。然而,不同视觉功能领域在识别教师报告学业困难方面的相对判别价值仍不明确。本研究采用机器学习模型,评估5类视觉系统改变在识别教师报告学业困难中的作用。方法:研究人员开展了一项观察性分析研究,
背景/目的:高效的视觉信息加工与学龄儿童的阅读、书写及持续注意密切相关。然而,不同视觉功能领域在识别教师报告学业困难方面的相对判别价值仍不明确。本研究采用机器学习模型,评估5类视觉系统改变在识别教师报告学业困难中的作用。方法:研究人员开展了一项观察性分析研究,纳入581名小学儿童。经完整病例分析后,最终506名受试者被纳入机器学习分析。教师采用1–5级有序量表对学业功能进行评分,并将其二分化,作为教师报告学业困难的务实性校园指标。研究分析了5组预测变量:基于DIVE的眼动功能、临床眼动评估、调节系统、集合系统以及眼轴长度。研究评估了5种分类器,并采用分层5折交叉验证(cross-validation)结合经由超参数优化实现的模型复杂度惩罚。结果:调节系统显示出最高的交叉验证性能(XGBoost:准确率0.952 ± 0.021;宏平均F1值0.919 ± 0.028),其后依次为临床评估和仪器评估的眼动预测因子。眼动异常同样表现出较强性能;相比之下,集合异常具有较高特异度,但敏感度极低,而异常眼轴长度的判别性能有限。结论:功能性视觉领域,尤其是调节与眼动控制,相较于集合或眼轴长度变量表现出更强的交叉验证分类性能。这些发现具有探索性,仍需外部验证队列、标准化学业结局及未来的多领域联合建模,方可用于临床或教育实践。
该文发表于《Children》,聚焦校园情境下视觉功能异常与学业困难识别之间的关系。研究背景在于,儿童期学业表现不良可能由多种因素共同导致,学习困难具有多因素特征,且可见于智力正常甚至较高的儿童。学校学习高度依赖视觉通道,阅读、抄写、看黑板、使用数字屏幕等任务均要求视觉信息被稳定获取、选择和保持,因此视觉功能受损可能干扰阅读、书写和持续注意。既往研究提示眼动、调节、双眼视等视觉子系统与阅读表现有关,但不同视觉领域与学习结果之间的关联并不一致,且过往文献往往聚焦单一视觉维度或单一结局指标,难以在同一分析框架下比较多个视觉系统的相对贡献。同时,眼轴长度与近视发生及教育暴露相关,但其对学习困难的作用更可能是间接的生物测量学关联,而非直接功能指标。基于此,研究人员提出有必要采用能够处理非线性关系和变量交互的机器学习方法,对眼动、调节、集合和眼轴长度等不同视觉领域进行整合比较,以探索哪些视觉系统更能识别教师报告的学业困难。
研究人员因此开展了一项观察性分析研究,旨在评估5类视觉问题领域——DIVE客观评估的眼动异常、临床眼动异常、调节功能障碍、集合功能障碍以及异常眼轴长度——在小学儿童中识别教师报告学业困难的内部判别能力。研究结果表明,不同视觉领域的分类表现存在明显差异,其中直接参与近距离视觉任务的功能性视觉系统,尤其是调节和眼动控制,其交叉验证分类性能明显优于集合功能和眼轴长度。该研究的重要意义在于提示:在学校视觉筛查或转诊优先级评估中,除标准视力检测外,功能性视觉评估可能提供补充信息;同时,机器学习模型可用于探索与教师报告学业困难相关的多维视觉表型,但现阶段尚不能作为独立诊断或转诊工具。
在方法学上,研究样本来自西班牙马德里Educare Valdefuentes School,共招募581名小学儿童,剔除数据不完整者后纳入506例完整病例。教师依据单项5级Likert量表评定学业表现,并将评分<3界定为存在教师报告学业困难。视觉预测变量分为5组:DIVE眼动追踪系统评估的眼动功能、临床“双H”眼动检查、调节系统异常、集合系统异常及光学生物测量仪测得的异常眼轴长度。研究分别构建支持向量机(SVM)、K近邻(KNN)、决策树、随机森林(Random Forest)和极端梯度提升(XGBoost)模型,采用分层5折交叉验证与超参数优化控制模型复杂度,并以准确率、宏平均F1值、敏感度和特异度评价分类性能。
在研究结果部分,论文首先报告了受试者特征。
3.1 Participant Characteristics:研究最初纳入581名儿童,排除75名资料不完整者后,最终分析样本为506名。平均年龄为8.47 ± 1.74岁,年龄范围5–12岁,女孩占53.4%。这一部分说明了机器学习分析所依据的是完整病例样本,而非最初招募的全部队列。
3.2 Comparative Classification Performance Across Visual Domains:研究人员在5个视觉领域分别建立监督式分类模型,并通过分层5折交叉验证及模型复杂度惩罚比较其表现。结果显示,调节系统具有最高的交叉验证分类性能,其次是临床评估的眼动预测因子和DIVE评估的眼动预测因子;相反,集合异常和异常眼轴长度的判别能力较弱,尤其在识别存在教师报告学业困难的儿童方面表现有限。研究同时指出,调节组先前观察到的“完美分类”在更严格的交叉验证及惩罚后不再存在,说明修正后的模型估计更现实、更稳定。该部分的核心结论是:与近距离任务直接相关的功能性视觉领域,比集合或生物测量学变量更能提供有效分类信号。
3.3 Functional Domains with Highest Predictive Performance:本节进一步展示表现最佳的功能性视觉领域。
3.3.1 Oculomotor Alterations Assessed with DIVE:对于DIVE评估的眼动异常,最优模型为XGBoost。其准确率为0.895 ± 0.018,宏平均F1值为0.831 ± 0.024,敏感度为0.639 ± 0.038,特异度为0.975 ± 0.010。研究据此认为,基于DIVE的眼动评估可捕捉与教师报告学业困难相关的重要分类信号,但其对无学业困难儿童的识别优于对阳性个体的检出。
3.3.2 Clinically Assessed Oculomotor Alterations:对于临床“双H”检查评估的眼动异常,最优模型同样为XGBoost。准确率为0.904 ± 0.015,宏平均F1值为0.868 ± 0.020,敏感度为0.742 ± 0.031,特异度为0.978 ± 0.009。与DIVE模型相比,临床眼动评估的敏感度更高,提示临床动眼检查能够提供与教师报告学业困难相关的补充性判别信息。
3.3.3 Accommodative System Alterations:在所有预测组中,调节变量的分类性能最高。最优模型为XGBoost,准确率达0.952 ± 0.021,宏平均F1值为0.919 ± 0.028,敏感度为0.885 ± 0.035,特异度为0.966 ± 0.016。结果说明调节异常在识别有无教师报告学业困难儿童方面具有较平衡且较强的能力。尽管如此,作者明确强调,该高性能结果仍属于探索性发现,必须在独立外部队列中进一步确认。
3.4 Domains with Lower Discriminative Utility:本节说明分类能力较弱的视觉领域。
3.4.1 Vergence System Alterations:集合系统的最优模型为随机森林。其准确率为0.941 ± 0.008,但宏平均F1值仅为0.518 ± 0.041,特异度高达0.989 ± 0.007,而敏感度仅为0.056 ± 0.048。这意味着集合异常作为单独预测集时,虽然很擅长识别无学业困难者,却几乎不能有效检出存在教师报告学业困难的儿童。因此,单看准确率会高估该领域的实用性,必须联合宏平均F1值和敏感度进行判断。
3.4.2 Abnormal Axial Length:异常眼轴长度的最优模型同样为随机森林。其总体预测性能有限,准确率为0.638 ± 0.035,宏平均F1值为0.509 ± 0.040,敏感度为0.151 ± 0.046,特异度为0.932 ± 0.022。该结果表明,单独使用眼轴长度时,对教师报告学业困难的识别能力较差,支持眼轴长度更适合作为屈光发育或近视风险的指标,而非学业困难的直接功能性标志。
在讨论部分,作者将结果置于既有文献与应用场景中加以解释。研究认为,调节和眼动系统之所以表现更强,可能与其直接参与阅读中的凝视稳定、扫视(saccadic eye movements)、视觉顺序加工和近距离清晰聚焦有关,这与既往关于阅读获得和阅读速度的研究方向一致。相较之下,集合功能虽与症状改善及近距离任务表现有关,但其改善并不必然立即转化为标准化阅读成绩的提升,因此在本研究中表现出高特异度而低敏感度的模式。眼轴长度则更多反映屈光生物学基础,与教育暴露和近视风险相关,但不能直接捕捉阅读书写中即时表达的视知觉—认知过程。作者进一步指出,这些结果从应用层面提示学校视觉评估可考虑加入功能性视觉测试,尤其是眼动和调节检查,但模型目前仅完成内部验证,缺乏外部验证、独立验证队列及多中心样本支持,不能直接用于临床筛查或教育决策。论文还强调了若干局限性,包括:学业困难由教师单项评分代理且经二分化处理,存在主观判断、教师间差异及天花板效应;横断面设计无法进行因果推断;样本仅来自单一学校,可能限制推广性;未系统纳入阅读障碍、注意缺陷多动障碍(ADHD)、社会经济背景、语言能力、既往学业支持及屈光矫正等混杂因素;部分预测变量被二元化,损失连续临床信息;且尚未建立多视觉领域联合模型,难以分离各视觉系统的独立贡献。
研究结论部分可译为:本研究提示,在本样本中,用于识别学龄儿童教师报告学业困难的视觉异常,其内部判别性能在不同视觉领域之间存在差异。直接参与近距离视觉任务的功能系统,尤其是眼动控制和调节,相较于集合测量或眼轴长度表现出更强的交叉验证分类性能。这些发现提示,在学校视觉评估中,功能性视觉评估可为标准视力检测提供补充信息。然而,当前模型仅具有探索性并仅完成内部验证,不应被解释为独立的诊断工具或转诊工具。鉴于本研究采用教师评分代理指标、变量二分化、横断面设计、单校招募、缺乏外部验证及未纳入重要混杂因素,结果需谨慎解读。未来研究应纳入标准化学业和神经心理结局、多中心样本、纵向设计、连续变量建模、多领域联合预测模型以及外部验证队列,以确认这些发现的稳健性及临床适用性。