自整流整合-发放神经元与协同修剪训练框架用于基于SNN的EEG运动想象分类

《Brain Sciences》:Self-Rectifying Integrate-and-Fire Neuron and Collaborative Trim Training Framework for SNN-Based EEG Motor Imagery Classification

【字体: 时间:2026年06月10日 来源:Brain Sciences 2.8

编辑推荐:

  背景:脉冲神经网络(spiking neural networks,SNNs)因其独特的生物合理性和能效优势在脑-机接口领域引起了显著关注。然而,脉冲的离散性质使得基于梯度的微分不可行,导致难以直接获得训练良好的SNNs。一种常见的方法是将人工神经网络(art

  
背景:脉冲神经网络(spiking neural networks,SNNs)因其独特的生物合理性和能效优势在脑-机接口领域引起了显著关注。然而,脉冲的离散性质使得基于梯度的微分不可行,导致难以直接获得训练良好的SNNs。一种常见的方法是将人工神经网络(artificial neural networks,ANNs)的权重迁移到SNNs中。然而,这一过程引入了转换误差,带来了重大挑战。方法:为应对这些挑战,研究人员提出了自整流整合-发放(self-rectifying integrate-and-fire,SRIF)神经元,该神经元利用负脉冲减少异步误差,并利用整流脉冲减少裁剪误差。同时,研究人员提出了协同修剪(collaborative trim,CT)训练框架,该框架引入量化网络来感知SNNs的权重和结果,从而可以进一步提高性能。结果:所提出的训练方法使SNNs在基于EEG的运动想象(motor imagery,MI)分类中达到与ANNs相当的性能指标。结论:实验结果表明,研究人员的方法不仅保留了ANNs的优异分类性能,还利用了SNNs优越的能效和较低的计算复杂度。
以下是根据论文内容的解读文章:

### 研究背景与问题

在脑-机接口(brain–computer interface,BCI)领域,人工神经网络(artificial neural networks,ANNs)在EEG信号解码中表现出优越性能。随着深度学习的发展,模型性能提升但复杂度增加,对内存和计算的需求增大。相比之下,人脑以约20瓦的功率执行复杂的感知和识别任务,具有惊人的能效。受生物神经元启发,脉冲神经网络(spiking neural networks,SNNs)被提出,它使用离散脉冲表示信息,能够在特定神经形态平台(如Intel Loihi、Truenorth、Spinnaker等)上实现低功耗高性能推理。然而,由于脉冲的不可微性,标准的反向传播无法直接应用于SNNs训练,因此训练高效的SNNs仍具挑战。

目前主要的SNN训练方法包括直接训练(使用替代梯度)和从ANNs转换。直接训练方法存在梯度近似不准确、梯度消失或爆炸以及高计算成本等问题。而基于平均脉冲发放率的ANN-to-SNN转换方法虽然可以充分利用ANNs的优异性能,但引入了量化误差、裁剪误差和异步误差,尤其在深层网络中误差逐层累积,导致SNN性能下降。此外,转换后的SNNs往往只是模仿ANNs,未能发挥SNNs自身的特征提取优势。在EEG信号解码应用中,现有研究多采用特征工程或部分使用SNNs,模型复杂度与性能提升之间存在矛盾。

因此,研究人员旨在开发一种通用方法,将BCI领域训练良好的ANNs转换为轻量、高能效的SNNs,同时降低转换误差并利用SNNs的内在优势。该研究发表在《Brain Sciences》。

### 主要关键技术方法

1. **SRIF神经元**:在经典整合-发放(integrate-and-fire,IF)模型基础上,引入二次脉冲发放阶段。第一阶段计算初始膜电位和脉冲,初始膜电位设为阈值的一半;第二阶段(整流阶段)利用残差膜电位和历史膜电位(hist)进行校正,产生负脉冲(减少异步误差)和整流脉冲(减少裁剪误差)。
2. **量化网络与协同修剪(CT)训练框架**:采用均匀裁剪对激活值进行量化,使用加法2的幂次(additive power-of-two,APoT)方法对权重进行量化,得到量化网络(quantized network)。该量化网络与SNN共享权重,并在CT训练中通过实时感知SNN的前向传播结果来调整共享权重,实现协同微调。
3. **数据集与预处理**:使用BCI竞赛IV-2a(4类运动想象,9名受试者)和IV-2b(2类运动想象,9名受试者)数据集。EEG信号经4–40 Hz带通滤波,取特定时间窗口(2a:1.5–6 s;2b:2.5–7 s),每名受试者80% trials用于训练,20%用于测试。验证网络为EEGNet和ShallowConvNet(使用ReLU激活函数版本以兼容转换)。

### 研究结果

#### 4.2. ANNs to SNNs分析
通过将EEGNet和ShallowConvNet转换为SNN形式,在BCI IV-2a和IV-2b数据集上比较性能。结果显示,转换后的SNN与原始CNN的准确率高度一致:EEGNet下SNN平均落后CNN最多0.91%,ShallowConvNet下SNN平均领先CNN 0.69%。配对t检验在EEGNet(2b)设置下显示显著差异(p=0.0468),但绝对差距很小;双单侧检验(TOST,等价界2%)在所有设置下p<0.05,证明SNN与CNN分类性能在指定界内等价。此外,SNN在某些受试者上(如ShallowConvNet在IV-2a受试者6)性能超越CNN(57.76% vs 62.93%),归因于协同微调过程。

#### 4.3. 消融实验
比较完整框架(Q_CT_SRIF)与三个变体(仅IF的Q_IF、仅SRIF的Q_SRIF、IF加CT的Q_CT_IF)以及不引入量化网络的C_IF。完整框架在所有设置下均获得最高平均准确率,且大多变体与完整框架存在统计显著差异。SRIF神经元和CT策略均贡献性能提升,其中SRIF带来的平均提升略高于CT。不引入量化网络的转换方法性能较差,尤其在IV-2a数据集上。

#### 4.4. 时间步长T的灵敏度分析
随着时间步长T增加,IF和SRIF方法的准确率均呈上升趋势,但T>8时增益放缓,而计算延迟线性增加。为平衡精度、延迟和计算成本,选择T=8。

#### 4.5. 计算效率
SNN使用累加(accumulate,AC)操作,CNN使用乘累加(multiply–accumulate,MAC)操作。SRIF神经元相比IF神经元略有操作数增加,但即使如此,SNN的总操作数远低于对应CNN,验证了SNN的固有计算效率优势。

#### 4.6. 与其他方法比较
与直接训练方法(如LENet)及ANN-to-SNN转换方法(如SCNet、HR-SNN)比较。所提方法在较低的T和参数量下,实现了相当或更优的分类性能(如在BCI IV-2b上优于LENet)。方法可快速应用于多种ANN,具有通用性。

### 讨论与结论

讨论部分指出,在浅层网络中,准确表示ANN激活值比异步误差累积更关键,SRIF通过两阶段脉冲机制扩展了激活值的表示范围。阈值设置对表示精度也很重要,SRIF能适应简单阈值设置并通过整流阶段进一步改进。与IF神经元相比,SRIF的激活值分布更接近ANN,且具有更精细的表示能力(如阈值减半时可表示两个激活值)。但当前方法缺乏宏观视角,仅关注局部层;CT训练虽部分弥补,但更复杂的感知机制(如层间相似性分析)可进一步对齐ANN与SNN表示。此外,脉冲编码误差(首层卷积)会传播并影响性能,将来需在损失函数中显式惩罚编码层不匹配。

研究结论:研究人员提出了自整流整合-发放(SRIF)神经元和协同修剪(CT)训练方法,成功构建了具有更高精度、更低量化误差和异步误差的SNN,并实现了有效的MI分类任务。SRIF通过整流脉冲平衡因过度发放导致的裁剪误差和异步误差;量化网络联合离散化激活值和权重,显著减少SNN以平均发放率编码ANN激活时的裁剪误差;该裁剪方案嵌入CT框架,通过权重共享实现量化网络与SNN的协同优化。最终将常用EEG信号解码网络EEGNet和ShallowConvNet转换为SNN,实现了有效的EEG解码。未来工作将改进SRIF的脉冲发放机制建模以减少转换误差,并探索有效的领域自适应训练框架以提高SNN的跨受试者/跨数据集泛化性能,推动SNN在BCI领域的发展。
相关新闻
生物通微信公众号
微信
新浪微博

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号