自整流整合-发放神经元与协同修剪训练框架用于基于SNN的EEG运动想象分类

首页今日动态人才市场新技术专栏中国科学人云展台
BioHot
云讲堂直播会展中心特价专栏技术快讯免费试用

生物通官微
陪你抓住生命科技
跳动的脉搏

生物通首页 > 今日动态 > 正文

《Brain Sciences》：Self-Rectifying Integrate-and-Fire Neuron and Collaborative Trim Training Framework for SNN-Based EEG Motor Imagery Classification

【字体：大中小】 时间：2026年06月10日 来源：Brain Sciences 2.8

编辑推荐：

　　背景：脉冲神经网络（spiking neural networks，SNNs）因其独特的生物合理性和能效优势在脑-机接口领域引起了显著关注。然而，脉冲的离散性质使得基于梯度的微分不可行，导致难以直接获得训练良好的SNNs。一种常见的方法是将人工神经网络（art

背景：脉冲神经网络（spiking neural networks，SNNs）因其独特的生物合理性和能效优势在脑-机接口领域引起了显著关注。然而，脉冲的离散性质使得基于梯度的微分不可行，导致难以直接获得训练良好的SNNs。一种常见的方法是将人工神经网络（artificial neural networks，ANNs）的权重迁移到SNNs中。然而，这一过程引入了转换误差，带来了重大挑战。方法：为应对这些挑战，研究人员提出了自整流整合-发放（self-rectifying integrate-and-fire，SRIF）神经元，该神经元利用负脉冲减少异步误差，并利用整流脉冲减少裁剪误差。同时，研究人员提出了协同修剪（collaborative trim，CT）训练框架，该框架引入量化网络来感知SNNs的权重和结果，从而可以进一步提高性能。结果：所提出的训练方法使SNNs在基于EEG的运动想象（motor imagery，MI）分类中达到与ANNs相当的性能指标。结论：实验结果表明，研究人员的方法不仅保留了ANNs的优异分类性能，还利用了SNNs优越的能效和较低的计算复杂度。

以下是根据论文内容的解读文章：

### 研究背景与问题

在脑-机接口（brain–computer interface，BCI）领域，人工神经网络（artificial neural networks，ANNs）在EEG信号解码中表现出优越性能。随着深度学习的发展，模型性能提升但复杂度增加，对内存和计算的需求增大。相比之下，人脑以约20瓦的功率执行复杂的感知和识别任务，具有惊人的能效。受生物神经元启发，脉冲神经网络（spiking neural networks，SNNs）被提出，它使用离散脉冲表示信息，能够在特定神经形态平台（如Intel Loihi、Truenorth、Spinnaker等）上实现低功耗高性能推理。然而，由于脉冲的不可微性，标准的反向传播无法直接应用于SNNs训练，因此训练高效的SNNs仍具挑战。

目前主要的SNN训练方法包括直接训练（使用替代梯度）和从ANNs转换。直接训练方法存在梯度近似不准确、梯度消失或爆炸以及高计算成本等问题。而基于平均脉冲发放率的ANN-to-SNN转换方法虽然可以充分利用ANNs的优异性能，但引入了量化误差、裁剪误差和异步误差，尤其在深层网络中误差逐层累积，导致SNN性能下降。此外，转换后的SNNs往往只是模仿ANNs，未能发挥SNNs自身的特征提取优势。在EEG信号解码应用中，现有研究多采用特征工程或部分使用SNNs，模型复杂度与性能提升之间存在矛盾。

因此，研究人员旨在开发一种通用方法，将BCI领域训练良好的ANNs转换为轻量、高能效的SNNs，同时降低转换误差并利用SNNs的内在优势。该研究发表在《Brain Sciences》。

### 主要关键技术方法

1. **SRIF神经元**：在经典整合-发放（integrate-and-fire，IF）模型基础上，引入二次脉冲发放阶段。第一阶段计算初始膜电位和脉冲，初始膜电位设为阈值的一半；第二阶段（整流阶段）利用残差膜电位和历史膜电位（^hist）进行校正，产生负脉冲（减少异步误差）和整流脉冲（减少裁剪误差）。
2. **量化网络与协同修剪（CT）训练框架**：采用均匀裁剪对激活值进行量化，使用加法2的幂次（additive power-of-two，APoT）方法对权重进行量化，得到量化网络（quantized network）。该量化网络与SNN共享权重，并在CT训练中通过实时感知SNN的前向传播结果来调整共享权重，实现协同微调。
3. **数据集与预处理**：使用BCI竞赛IV-2a（4类运动想象，9名受试者）和IV-2b（2类运动想象，9名受试者）数据集。EEG信号经4–40 Hz带通滤波，取特定时间窗口（2a：1.5–6 s；2b：2.5–7 s），每名受试者80% trials用于训练，20%用于测试。验证网络为EEGNet和ShallowConvNet（使用ReLU激活函数版本以兼容转换）。

### 研究结果

#### 4.2. ANNs to SNNs分析
通过将EEGNet和ShallowConvNet转换为SNN形式，在BCI IV-2a和IV-2b数据集上比较性能。结果显示，转换后的SNN与原始CNN的准确率高度一致：EEGNet下SNN平均落后CNN最多0.91%，ShallowConvNet下SNN平均领先CNN 0.69%。配对t检验在EEGNet（2b）设置下显示显著差异（p=0.0468），但绝对差距很小；双单侧检验（TOST，等价界2%）在所有设置下p<0.05，证明SNN与CNN分类性能在指定界内等价。此外，SNN在某些受试者上（如ShallowConvNet在IV-2a受试者6）性能超越CNN（57.76% vs 62.93%），归因于协同微调过程。

#### 4.3. 消融实验
比较完整框架（Q_CT_SRIF）与三个变体（仅IF的Q_IF、仅SRIF的Q_SRIF、IF加CT的Q_CT_IF）以及不引入量化网络的C_IF。完整框架在所有设置下均获得最高平均准确率，且大多变体与完整框架存在统计显著差异。SRIF神经元和CT策略均贡献性能提升，其中SRIF带来的平均提升略高于CT。不引入量化网络的转换方法性能较差，尤其在IV-2a数据集上。

#### 4.4. 时间步长T的灵敏度分析
随着时间步长T增加，IF和SRIF方法的准确率均呈上升趋势，但T>8时增益放缓，而计算延迟线性增加。为平衡精度、延迟和计算成本，选择T=8。

#### 4.5. 计算效率
SNN使用累加（accumulate，AC）操作，CNN使用乘累加（multiply–accumulate，MAC）操作。SRIF神经元相比IF神经元略有操作数增加，但即使如此，SNN的总操作数远低于对应CNN，验证了SNN的固有计算效率优势。

#### 4.6. 与其他方法比较
与直接训练方法（如LENet）及ANN-to-SNN转换方法（如SCNet、HR-SNN）比较。所提方法在较低的T和参数量下，实现了相当或更优的分类性能（如在BCI IV-2b上优于LENet）。方法可快速应用于多种ANN，具有通用性。

### 讨论与结论

讨论部分指出，在浅层网络中，准确表示ANN激活值比异步误差累积更关键，SRIF通过两阶段脉冲机制扩展了激活值的表示范围。阈值设置对表示精度也很重要，SRIF能适应简单阈值设置并通过整流阶段进一步改进。与IF神经元相比，SRIF的激活值分布更接近ANN，且具有更精细的表示能力（如阈值减半时可表示两个激活值）。但当前方法缺乏宏观视角，仅关注局部层；CT训练虽部分弥补，但更复杂的感知机制（如层间相似性分析）可进一步对齐ANN与SNN表示。此外，脉冲编码误差（首层卷积）会传播并影响性能，将来需在损失函数中显式惩罚编码层不匹配。

研究结论：研究人员提出了自整流整合-发放（SRIF）神经元和协同修剪（CT）训练方法，成功构建了具有更高精度、更低量化误差和异步误差的SNN，并实现了有效的MI分类任务。SRIF通过整流脉冲平衡因过度发放导致的裁剪误差和异步误差；量化网络联合离散化激活值和权重，显著减少SNN以平均发放率编码ANN激活时的裁剪误差；该裁剪方案嵌入CT框架，通过权重共享实现量化网络与SNN的协同优化。最终将常用EEG信号解码网络EEGNet和ShallowConvNet转换为SNN，实现了有效的EEG解码。未来工作将改进SRIF的脉冲发放机制建模以减少转换误差，并探索有效的领域自适应训练框架以提高SNN的跨受试者/跨数据集泛化性能，推动SNN在BCI领域的发展。

联系信箱：

粤ICP备09063491号

热点排行