元学习与迁移学习在小规模数据集中预测超临界翼型的对比研究

《Aerospace》:Comparative Study of Meta-Learning and Transfer Learning for the Prediction of Supercritical Airfoils Under Small-Scale Dataset Yining Lian, Runze Li, Lifang Zeng and Xueming Shao

【字体: 时间:2026年04月08日 来源:Aerospace 2.2

编辑推荐:

  本研究旨在揭示复杂飞行任务中飞行员意图(Pilot Intention)的生成模式并识别飞行员意图状态,从而使机载预警系统能够理解与预测飞行员意图以制定早期预警策略。为实现该目标,研究人员设计了包含多种风险场景的模拟飞行实验以诱导飞行员意图,采集了反映飞行员意

  
本研究旨在揭示复杂飞行任务中飞行员意图(Pilot Intention)的生成模式并识别飞行员意图状态,从而使机载预警系统能够理解与预测飞行员意图以制定早期预警策略。为实现该目标,研究人员设计了包含多种风险场景的模拟飞行实验以诱导飞行员意图,采集了反映飞行员意图状态的眼动追踪(Eye-Tracking)数据,并提出了一种基于眼动追踪数据的飞行员意图持续性识别方法。随后,研究人员构建了飞行员意图数据集,分析了意图持续状态下眼动追踪数据的时频特性,揭示了飞行员意图产生后的关键行为特征。此外,研究人员还考察了能够提升飞行员意图识别模型性能的眼动追踪特征。最后,研究人员开发了融合循环神经网络(Recurrent Neural Network, RNN)与双向长短期记忆网络(Bidirectional Long Short-Term Memory, BiLSTM)的深度学习模型用于飞行员意图识别。结果表明,该模型在测试集上达到了97.8%的识别准确率,且通过与基线模型的对比验证了其识别飞行员意图状态的性能。该研究证实眼动追踪数据可有效识别飞行员意图状态,并为飞机安全预警与智能控制系统提供了新的洞见。
本研究聚焦飞行安全领域中飞行员意图识别这一关键科学问题,旨在通过眼动追踪技术揭示飞行员意图形成过程中的认知行为模式,并构建高精度的意图识别模型以服务于机载预警系统。

从研究背景来看,尽管航空运输业快速发展使航空事故率稳步下降,但民航安全仍是首要 priority。国际航空运输协会(International Air Transport Association, IATA)2017至2022年统计数据显示,超过50%的飞行事故归因于飞行员操控失误,其中飞行员决策问题占11%。当前广泛应用的自动飞行控制系统(Automatic Flight Control System, AFCS)主要通过飞行管理计算机(Flight Management Computer, FMC)调整操纵面来控制飞机运动,虽能维持稳定飞行,却未能考虑飞行员的认知过程如决策制定。尤其波音737 MAX 8事故后,机动改出系统(Maneuvering Characteristics Augmentation System, MCAS)覆盖飞行员操纵意图导致坠机的事件,使得飞行员操纵意图识别受到日益关注。

现有研究在数据 source 方面存在明显局限。飞行数据存在固有滞后性,需在飞行员与操纵装置交互后才能记录;生理数据虽能反映实时心理生理状态,但复杂座舱环境引入大量噪声,对数据完整性及清洗过滤要求极高。相比之下,眼动追踪数据能揭示意图形成早期的信息搜索模式与注意分配策略,对意图萌发的早期认知状态尤为敏感,但相关研究仍较匮乏。基于此,本研究提出基于眼动追踪数据的飞行员意图持续性识别方法,分析意图状态下眼动追踪的时频特性以识别有效提升模型性能的特征,并建立融合RNN与BiLSTM的深度学习模型识别飞行员意图持续性状态,仅聚焦飞行员为达成特定飞行目标而采取行动的状态,不涉及具体意图类型。

研究样本来源于11个机组(22名飞行员,含机长与副驾驶)在D级波音B787全动飞行模拟机中的实验数据。受试者年龄28至45岁,均持有B787航线运行资质。实验航线设定为福州长乐国际机场(ZSFZ)至东京成田国际机场(RJAA),在起飞滑跑、进近等阶段引入风切变、雷暴、单发失效三种风险场景以诱导飞行员意图。眼动数据通过Tobii Pro Glasses 3可穿戴眼动仪以50 Hz采样频率采集,主要分析操控飞行员(左座)的数据。

研究所用关键技术方法包括以下方面:在数据预处理层面,采用滑动中值滤波降噪,以75 ms最大间隙长度进行插值,运用I-VT(Identification by Velocity Threshold)算法以30°/s角速度阈值进行注视分类,瞳孔数据采用线性插值处理小于2 mm的瞳孔直径,眨眼识别基于350 ms和75 ms时域阈值判断;在数据集构建层面,以注视点首次进入导航显示器(Navigation Display, ND)、主飞行显示器(Primary Flight Display, PFD)或控制显示组件(Control Display Unit, CDU)区域为意图起始时刻,以操控开始为结束时刻,标记"Intention=1"或"Non-Intention=0";在特征提取层面,从时域提取均值、标准差、均方根(Root Mean Square, RMS),从频域采用Welch方法估计功率谱密度(Power Spectral Density, PSD),将0.05–6.00 Hz划分为超低频(ULF, 0.05–0.20 Hz)、低频(LF, 0.20–0.60 Hz)、中频(MF, 0.60–1.60 Hz)和高频(HF, 1.60–6.00 Hz)四个频段;在模型构建层面,采用RNN-BiLSTM混合神经网络,先以RNN层动态编码多变量眼动时间序列,再堆叠两层双向LSTM建模更长时程的注视-扫视转换及瞳孔动态特征,应用Dropout与循环Dropout防止过拟合,以Softmax层输出意图类别后验概率,采用中位数中心化和绝对中位差(Median Absolute Deviation, MAD)缩放进行稳健标准化,使用Adam优化器配合交叉熵损失、早停及自适应学习率衰减策略。

研究结果部分包含以下核心内容:

意图样本获取方面,从实验视频中检测到650个意图事件,包括114次爬升、362次下降、108次左转和66次右转,大多数意图事件时段持续时间在4 s以内,同时提取600个持续4 s的非意图事件。所有意图事件样本统一重采样为机动开始前4 s的时间段,按最终机动动作标注序列数据,随机选取80%训练、20%测试,确保四类机动在训练集与测试集中比例一致。

时域特征分析结果方面,研究通过统计检验发现:注视点位置的X方向均值、方差和RMS在两组间无显著差异(p > 0.05),而Y方向方差达显著水平(p < 0.05),意图样本呈现更集中稳定的分布模式,非意图样本空间分布更分散且波动更大,表明意图形成前飞行员已将视线逐渐聚焦于任务关键区域;眼动角速度的均值中位数和四分位距高度重叠,方差和RMS揭示更显著差异,意图类别呈现明显的上尾增厚和多峰结构,表明意图驱动的注视和扫视行为更易出现阶段性"爆发";瞳孔直径的均值和RMS无显著差异,但非意图状态的方差显著大于意图状态(p < 0.05),表明意图阶段瞳孔变化更稳定。

频域特征分析结果方面,Welch's t检验结合Benjamini-Hochberg校正显示:瞳孔直径在意图状态下的功率谱在所有四个频段均显著高于非意图状态,尤其在LF和MF频段增幅最为明显,表明意图形成时自主神经与认知负荷相关的瞳孔振荡呈现广谱增强;注视位置的X和Y方向MF频段功率在意图状态下显著增加,Y方向LF频段呈现边缘波动,表明意图注视时0.6–1.60 Hz节律的注视位置波动更强;角速度功率在各频段均无显著性。总体而言,瞳孔直径的低中频功率与注视点的中频功率为最具区分性的变量组合。

模型训练与性能方面,RNN-BiLSTM模型训练集准确率98.0%、测试集准确率97.8%,少数迭代后即超95%,测试集准确率逐渐稳定且振荡控制在3%以内,损失值未出现上升趋势。与基线模型对比,Logistic回归准确率0.497、F1分数0.493,支持向量机(Support Vector Machine, SVM)准确率0.672、F1分数0.511,随机森林准确率0.712、F1分数0.686,XGBoost准确率0.839、F1分数0.832,单向LSTM准确率0.913、F1分数0.862,而RNN-BiLSTM准确率达0.978、F1分数0.948、召回率0.965,在"Intention"类别的F1分数和召回率上均表现最优。

讨论部分,研究人员首先分析了飞行员意图形成过程中的眼动模式变化:进入意图状态后,注视分布更集中于任务关键区域,注视点Y方向波动显著降低,平均瞳孔直径在多个频段的相对功率显著增加,表明操控飞行员在执行机动前将视觉资源重新分配至与当前任务高度相关的显示区域,伴随唤醒水平和认知负荷的一定提升。PFD、ND和CDU仪器的注视比例在意图状态下显著增加,尤其ND仪器注视比例显著提升,可能表明飞行员在意图形成过程中更关注导航与周边环境信息。从频域指标看,意图状态下瞳孔直径的低频和中频成分能量比例增加,而高频噪声成分未显著增加,表明机动意图形成时飞行员未出现杂乱无章的快速波动,而是呈现幅度较大且相对稳定的瞳孔调节,这与"感知—判断—执行"的多阶段决策过程一致。

关于眼动数据在飞行员意图识别任务中的适用建模范式,研究表明:传统机器学习模型将时间序列展平为固定长度向量进行静态模式学习,仅能捕捉有限的线性或可分离性,难以表征意图形成中更复杂的非线性和时间依赖性;树型集成模型有所缓解但仍在"无序特征"空间操作,无法显式表示注视序列和节律等时间结构;序列模型则显著增强预测能力,LSTM较最优树型模型F1提升约0.03、召回率从0.850提升至0.905;RNN-BiLSTM引入双向结构,使模型能同时利用局部时间窗口内的短期"过去"和"未来"上下文,准确率和F1分数达0.978和0.948。这说明眼动序列的预测优势不仅源于空间分布差异,还源于任务关键区域间注视的转换序列及其时序演化模式,唯有具备记忆机制的时间模型才能充分利用。

从飞行安全视角看,基于眼动数据的飞行员意图识别可为机载预警系统提供关于即将发生机动的提前信息。现有预警多基于飞机状态和环境测量,未考虑飞行员操纵意图,只能在偏差明显后触发。眼动意图识别可在控制动作开始前预测意图:一方面,飞行员有意改变高度或航向时可自适应抑制或延迟某些警告,减少预期机动期间的频繁告警;另一方面,当系统预测的意图与当前飞行程序、自动驾驶模式或标准操作程序(Standard Operating Procedures, SOP)明显不一致时,预警系统可更早发出意图-飞行状态不匹配提示,为机组评估意图合理性争取额外时间。该概念也可应用于飞行训练评估系统,实时监控学员意图并分析错误意图形成的时机和原因。但意图识别不应孤立存在,需与其他飞行安全预警系统协调配合以实现综合预测。

研究亦承认若干局限:首先,基于控制的模拟飞行实验,飞行场景、风险事件和任务节奏由实验设计预设,飞行员人数和机型有限,结果主要反映特定模拟环境和参与者群体下基于眼动数据的意图可预测性,尚不足以直接推广至多机型、多机组和复杂运行环境;其次,输入特征仅限制为眼动相关变量,未纳入飞行参数、操纵输入或生理信号等其他模态信息,也未进行爬升、下降、左转、右转等更细粒度的多类预测;最后,RNN-BiLSTM内部状态表示和决策过程对飞行员而言仍为黑箱,关键时间段和特征维度尚未与飞行员认知阶段系统关联。

结论部分,本研究得出以下主要结论:(1)时域分析表明,意图形成期间飞行员倾向于提前将视觉资源聚焦于任务关键仪表区域,并以更稳定的瞳孔响应支持信息获取;(2)频域分析表明,意图形成期间更具区分性的指标为瞳孔直径低中频范围的节律性振荡及注视点位置中频段的增强波动,提示建模中应优先关注瞳孔直径低中频功率和注视点位置中频功率;(3)基于眼动数据的意图状态识别结果表明,眼动行为本身包含可利用的意图预测信息,且唯有具备记忆机制的时间模型才能充分利用;(4)研究仍受样本量、单一眼动模态及事件级别交叉验证框架下所获性能的限制,未来需在多模态融合和更大规模验证基础上进一步评估该方法在机载预警系统中的工程应用边界。与现有方法相比,本研究在数据层面分析了意图存在时眼动数据的时频特性,揭示了有效提升模型性能的眼动特征并讨论了适用建模范式,为提升飞行员意图识别准确率提供了新视角。
相关新闻
生物通微信公众号
微信
新浪微博
  • 搜索
  • 国际
  • 国内
  • 人物
  • 产业
  • 热点
  • 科普

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号