《Neurocomputing》:Manifold-SimCLR: Self-supervised contrastive representation learning on riemannian EEG covariance manifolds
编辑推荐:
伊马德·埃丁·蒂贝尔马辛(Imad Eddine Tibermacine)|萨穆埃莱·鲁索(Samuele Russo)|雅科波·塔马里(Jacopo Tamarri)|艾哈迈德·蒂贝尔马辛(Ahmed Tibermacine)|克里斯蒂安·纳波利(Christian Napol
伊马德·埃丁·蒂贝尔马辛(Imad Eddine Tibermacine)|萨穆埃莱·鲁索(Samuele Russo)|雅科波·塔马里(Jacopo Tamarri)|艾哈迈德·蒂贝尔马辛(Ahmed Tibermacine)|克里斯蒂安·纳波利(Christian Napoli)
意大利罗马萨皮恩扎大学(Sapienza University of Rome)计算机、自动化与管理工程系
摘要
准确解码运动想象脑电图(EEG)对于非侵入式脑机接口至关重要,但由于EEG的信噪比低、个体间差异大以及标记样本有限,这一任务仍然具有挑战性。我们提出了Manifold-SimCLR,这是一种基于几何结构的自监督框架,能够在不依赖大规模标记数据集的情况下学习具有区分能力的EEG表示。原始EEG数据首先被转换为对称正定(SPD)协方差矩阵,并通过対数欧几里得变换映射到黎曼流形的切空间,从而在保持内在几何结构的同时进行标准欧几里得优化。一系列新颖的SPD保持增强技术——包括缩放、正交重合和对数域抖动——为温度缩放的NT-Xent目标生成正样本对。主干编码器结合了深度空间滤波、残差时间卷积和超球面投影,生成适合对比学习的单位范数嵌入。训练过程由MXOptimizer驱动,该优化器采用Adam风格更新算法,在切空间中进行自适应步骤,并将参数重新投影到流形上。自监督训练后,使用一小部分标记数据对轻量级分类器进行微调,同时选择性地激活监督交叉熵损失。整个流程具有端到端可微性、参数效率高,并且兼容异构的公共运动想象数据集,为鲁棒且高效的EEG解码提供了理论基础。
引言
基于EEG的运动想象(MI)分类是脑机接口(BCI)系统中的一个基本问题,为有严重运动障碍的人提供了辅助技术的途径。通过解码与想象中的肢体运动相关的神经活动,基于MI的BCI实现了非肌肉通信和控制。然而,尽管经过数十年的研究,由于EEG信号的内在复杂性,可靠地分类MI EEG仍然是一项具有挑战性的任务。这些信号的特点是时间分辨率高、个体间和个体内差异大、信噪比低以及复杂的时空依赖性。此外,EEG数据采集既费时又昂贵,而专家标记的数据集往往稀缺,这限制了传统监督学习方法的有效性,因为这些方法需要大量标记数据才能良好泛化[1]、[2]。
深度学习的最新进展在EEG信号分类方面取得了有希望的结果;然而,这些模型通常依赖于大量的标记数据,而在临床或实验环境中获取这些数据往往很困难。为了克服这一限制,自监督学习(SSL)作为一种有吸引力的替代方案应运而生。SSL利用大量未标记数据,通过设计 pretext任务使模型能够在无需显式标签的情况下学习有信息量的表示。在各种SSL范式中,对比学习因其能够通过鼓励相似输入在表示空间中更接近、不同输入更分散来生成具有区分能力和泛化能力的表示而受到广泛关注[3]、[4]、[5]。尽管对比学习在计算机视觉和自然语言处理领域取得了显著成功,但将其应用于EEG,特别是MI EEG时,面临独特的挑战。EEG信号通常在非线性流形上表示得更好,而不是在欧几里得空间中。一个显著的例子是从EEG数据计算出的空间协方差矩阵,它们是对称正定的(SPD),自然存在于黎曼流形上。这种几何结构使得标准欧几里得运算不再适用[6]。
在这项工作中,我们提出了一种新的自监督对比学习框架,该框架利用流形嵌入技术来解决现有MI EEG分类方法的局限性。我们的方法通过使用対数欧几里得度量将EEG协方差矩阵投影到黎曼流形的切空间上,从而利用了数据的内在几何结构[7]、[8]。这使我们能够以尊重数据结构的方式应用对比学习,从而提高学习表示的质量和鲁棒性。具体来说,我们的方法扩展了SimCLR框架[3],使其能够在流形值数据上运行。我们引入了一组考虑流形特性的数据增强技术,这些技术保留了SPD结构,并针对EEG信号的空间时间特性进行了优化。这些增强包括时间和空间域中的SPD保持变换,旨在模拟EEG中的真实变化,而不会引入几何不一致性。
此外,我们提出了一种新的优化策略,称为MXOptimizer,它根据切空间的几何结构调整梯度更新。这种策略稳定了训练过程并加速了收敛速度。自监督预训练后,使用一小部分标记数据对主干网络进行微调,以完成下游的MI分类任务。这种方法不仅缓解了标签稀缺的挑战,还在标准MI数据集上提高了分类性能,这些数据集在之前的运动想象分类研究中被广泛用作基准[1]、[2]。
本文的贡献如下:首先,我们提出了一个将黎曼几何与深度表示学习相结合的自监督对比学习框架,用于MI EEG分类。其次,我们提出了新的SPD保持数据增强和对数欧几里得嵌入技术,以实现几何感知学习。第三,我们引入了MXOptimizer,这是一种适应流形结构的优化方案,用于增强非欧几里得空间中的学习。实验结果表明,与现有的监督和自监督基线方法相比,我们的方法在标签稀缺和信号噪声条件下取得了具有竞争力或更优的性能。这项研究为基于几何结构的脑信号处理文献做出了贡献,并为更可扩展和更鲁棒的基于EEG的BCI铺平了道路,同时减少了对外部标记数据的依赖,同时利用了神经生理信号中固有的丰富结构。
章节片段
使用EEG信号进行运动想象分类已成为脑机接口研究的核心主题,这得益于其在神经康复[9]、辅助技术[10]和人机交互[11]、[12]中的广泛应用。传统方法主要依赖于监督学习技术,通常使用手工制作的特征(如Common Spatial Patterns (CSP) [13]来区分MI类别。最近,深度学习方法逐渐成为
我们首先回顾表1中的符号。所有流形都赋予了对数欧几里得黎曼度量。
本节详细介绍了所提出的Manifold-SimCLR流程的每个组成部分,最终形成了算法1,可以逐字复制。在整个过程中使用了表1中的符号。
OpenBMI数据集包含了54名健康志愿者执行两类MI任务(左手抓取与右手抓取)时的EEG数据。信号使用BioSemi ActiveTwo以1 kHz的频率记录,电极按照10–20系统排列。每位受试者完成了4个会话,每个会话100次试验,共计400次试验(每类200次)。在' role="presentation">?s时,受试者保持想象状态4秒。我们保留了所有62个通道,下采样到250 Hz,带通滤波器8–30 Hz,并裁剪了三个
表4和表5中的实验证据支持四个相互关联的结论,这些结论涉及所提出流程的泛化能力、数据效率和计算可行性。
本研究提出了Manifold-SimCLR,这是一个结合黎曼几何与自监督对比学习的框架,用于高效标签的EEG运动想象分类。通过将EEG协方差视为SPD流形上的点,利用SPD保持增强技术,并引入MXOptimizer进行流形适应性更新,我们的方法在OpenBMI和SMR-BCI数据集上实现了最先进的准确率,且所需的监督最少。该框架减少了校准
伊马德·埃丁·蒂贝尔马辛(Imad Eddine):撰写——原始草稿、可视化、软件、方法论、调查、概念化。萨穆埃莱·鲁索(Samuele Russo):撰写——原始草稿、可视化、软件、方法论、调查、概念化。雅科波·塔马里(Jacopo Tamarri):撰写——审阅与编辑、验证、资源管理、形式分析、数据整理。艾哈迈德·蒂贝尔马辛(Ahmed Tibermacine):撰写——审阅与编辑、验证、监督、形式分析、数据整理。克里斯蒂安·纳波利(Christian Napoli):撰写——审阅与编辑、监督,
作者声明以下可能被视为潜在利益冲突的财务利益/个人关系:
伊马德·埃丁·蒂贝尔马辛报告称,他的工作得到了罗马萨皮恩扎大学(University of Rome La Sapienza)的财务支持和文章发表费用。如果还有其他作者,他们声明没有已知的可能会影响本文工作的财务利益或个人关系。
伊马德·埃丁·蒂贝尔马辛(Imad Eddine)1998年出生于阿尔及利亚的比斯克拉(Biskra)。2022年,他在比斯克拉大学(Biskra Algeria)获得了人工智能硕士学位。目前,他是罗马萨皮恩扎大学计算机、控制与管理工程系的计算机科学工程专业的博士生,同时也是机械与航空航天工程系的研究助理。他的研究兴趣包括深度学习、脑机接口和信号处理