基于注意力卷积网络与局部特征表示的步态识别研究

首页今日动态人才市场新技术专栏中国科学人云展台
BioHot
云讲堂直播会展中心特价专栏技术快讯免费试用

生物通官微
陪你抓住生命科技
跳动的脉搏

生物通首页 > 今日动态 > 正文

《Franklin Open》：Gait Recognition Based on Attention Convolutional Networks and Part-based Feature Representation

【字体：大中小】 时间：2026年05月30日 来源：Franklin Open CS1.4

编辑推荐：

　　步态识别系统常受视角变化、衣着、携带物品及复杂背景等因素影响，导致步态特征类内差异显著，进而降低识别性能。因此，如何构建兼具强判别力与良好鲁棒性的步态特征表示，成为当前步态识别研究的关键问题。针对上述问题，本文提出一种结合基于注意力的卷积网络与分块特征建模的步

步态识别系统常受视角变化、衣着、携带物品及复杂背景等因素影响，导致步态特征类内差异显著，进而降低识别性能。因此，如何构建兼具强判别力与良好鲁棒性的步态特征表示，成为当前步态识别研究的关键问题。针对上述问题，本文提出一种结合基于注意力的卷积网络与分块特征建模的步态识别方法。首先，利用步态轮廓序列构建步态表示，并通过卷积神经网络提取全局空间特征。同时引入卷积块注意力模块（CBAM）以增强模型对关键人体运动区域（如腿部与关节）的关注能力，从而提升特征表达能力。随后，采用基于区域的切分策略对步态特征图进行结构化分区，以提取更细粒度的局部特征。进而，采用多通道特征融合策略整合全局与局部信息，构建更具鲁棒性的步态特征表示。最终，利用分类网络对融合特征进行身份识别，实现高精度步态识别。研究人员在CASIA-B步态数据集上进行了广泛实验，系统评估了模型在不同视角及多种行走条件（正常行走、携带物品、穿着外套）下的性能。实验结果表明，所提方法在Rank-1准确率与平均精度均值（mAP）等指标上均优于多个基线模型，并在不同视角下展现出更优的稳定性与泛化能力。

步态识别作为一种非接触、远距离的生物特征识别技术，在公共安全与智能监控等领域具有重要应用价值。然而，在实际应用场景中，摄像头视角的改变、行人衣着的变化、携带物品的遮挡以及复杂背景的干扰，都会导致同一人的步态特征发生剧烈变化，而不同人在相同条件下的特征差异却可能缩小。这种显著的类内差异严重制约了传统步态识别系统的准确性与鲁棒性。现有的深度学习方法虽然在一定程度上缓解了这一问题，但大多依赖单一的特征表示，难以充分挖掘人体外观信息与运动信息之间的互补关系。此外，在特征融合过程中，如何有效剔除冗余特征以降低模型复杂度并提高识别效率，仍是当前研究面临的主要挑战。为解决这些问题，研究人员提出了一种集成了注意力机制与分块特征建模的深度学习框架，旨在通过多维度特征提取与优化融合，提升模型在复杂环境下的身份鉴别能力。

为实现上述目标，研究人员采用了几项关键技术方法。在特征提取方面，构建了双分支迁移学习网络，分别处理由步态能量图（GEI）表征的外观信息和基于光流法提取的运动信息，并利用预训练的MobileNetV2模型进行微调。在特征增强方面，引入了卷积块注意力模块（CBAM），从通道和空间两个维度自适应地强化关键运动区域的特征响应。在特征优化方面，设计了基于区域的切分策略以获取局部特征，并采用改进的单蝶优化（MBO）算法对高维融合特征进行子集选择，以剔除冗余维度。实验验证则在公开的CASIA-B标准数据集上进行，该数据集包含了124名受试者在11个不同视角下的正常行走、携带包裹和穿着外套等多种复杂场景数据。

模型比较实验结果

在单视角条件下，该方法的平均Rank-1准确率达到了94.06%，参数量仅为7.12M，显著优于VGG-16、ResNet-50及单分支MobileNetV2等基准模型。特别是在穿外套（CL）这一极具挑战性的条件下，准确率达到了90.73%，证明了双分支特征融合机制在处理外观遮挡时的有效性。在跨视角实验中，该方法同样表现出色，在正常行走（NM）、携带物品（BG）和穿外套（CL）条件下的平均Rank-1准确率分别达到96.41%、89.50%和86.50%，平均精度均值（mAP）也有显著提升。这表明模型不仅在前端匹配中表现优异，整体的特征检索质量也得到了优化。尽管在正前方和正后方等极端视角下所有模型的识别率均有所下降，但本方法依然保持了最高的性能，显示出强大的跨视角泛化能力。

消融实验结果

为了验证各核心模块的贡献度，研究人员设计了详尽的消融实验。在双分支架构的有效性验证中，单独使用外观分支和运动分支的平均准确率分别为90.78%和88.48%，而两者融合后提升至94.06%，证实了外观轮廓与动态运动信息的强互补性。在迁移学习与特征选择机制的验证中，从零开始训练的双分支模型准确率为89.26%，加入ImageNet预训练权重的迁移学习后提升至92.06%，再结合改进的MBO特征选择后最终达到94.06%。进一步的定量分析显示，引入MBO模块后，类内平均距离从1.84降至1.37，类间平均距离从4.92升至6.18，表明该优化算法有效去除了噪声维度，使特征分布更加紧凑且可分。此外，模块化的消融测试也证实，光流裁剪、双分支结构与MBO特征选择是逐步提升系统性能的关键环节。

讨论与结论

综合实验结果，研究人员得出结论：将人体外观信息与运动信息进行联合建模，能够显著提升步态特征的判别力。基于注意力的卷积网络有效抑制了背景噪声并聚焦于四肢等关键部位，而基于区域的切分策略则捕捉到了更精细的局部动态模式。虽然多模型融合与复杂的优化算法增加了一定的计算开销，但通过引入轻量级的MobileNetV2作为骨干网络，整体计算成本仍控制在合理范围内，具备在资源受限环境下部署的潜力。

步态识别系统常受视角变化、衣着、携带物品及复杂背景等因素影响，导致步态特征类内差异显著，进而降低识别性能。因此，如何构建兼具强判别力与良好鲁棒性的步态特征表示，成为当前步态识别研究的关键问题。针对上述问题，本文提出一种结合基于注意力的卷积网络与分块特征建模的步态识别方法。首先，利用步态轮廓序列构建步态表示，并通过卷积神经网络提取全局空间特征。同时引入卷积块注意力模块（CBAM）以增强模型对关键人体运动区域（如腿部与关节）的关注能力，从而提升特征表达能力。随后，采用基于区域的切分策略对步态特征图进行结构化分区，以提取更细粒度的局部特征。进而，采用多通道特征融合策略整合全局与局部信息，构建更具鲁棒性的步态特征表示。最终，利用分类网络对融合特征进行身份识别，实现高精度步态识别。研究人员在CASIA-B步态数据集上进行了广泛实验，系统评估了模型在不同视角及多种行走条件（正常行走、携带物品、穿着外套）下的性能。实验结果表明，所提方法在Rank-1准确率与平均精度均值（mAP）等指标上均优于多个基线模型，并在不同视角下展现出更优的稳定性与泛化能力。

联系信箱：

粤ICP备09063491号

热点排行