DeM-FCN：一种用于可穿戴健身追踪中边缘原生人类活动识别的超轻量纯卷积框架

首页今日动态人才市场新技术专栏中国科学人云展台
BioHot
云讲堂直播会展中心特价专栏技术快讯免费试用

生物通官微
陪你抓住生命科技
跳动的脉搏

生物通首页 > 今日动态 > 正文

《Frontiers in Sports and Active Living》：DeM-FCN: an ultra-lightweight and purely convolutional framework for edge-native human activity recognition in wearable fitness tracking

【字体：大中小】 时间：2026年06月10日 来源：Frontiers in Sports and Active Living 2.6

编辑推荐：

　　引言：可穿戴人类活动识别（Human Activity Recognition, HAR）已成为智能健身追踪的重要组成部分，但在资源受限的边缘设备上部署准确识别模型仍具挑战。现有深度学习方法通常依赖循环结构、注意力机制或复杂混合架构，这增加了计算成本并限制了实

引言：可穿戴人类活动识别（Human Activity Recognition, HAR）已成为智能健身追踪的重要组成部分，但在资源受限的边缘设备上部署准确识别模型仍具挑战。现有深度学习方法通常依赖循环结构、注意力机制或复杂混合架构，这增加了计算成本并限制了实时部署。方法：本研究提出了DeM-FCN，一种用于基于智能哑铃的抗阻训练活动识别的轻量级纯卷积框架。该模型集成了物理感知输入表示、高斯噪声正则化、堆叠一维卷积块、全局最大池化（Global Max Pooling, GMP）和代价敏感焦点损失（cost-sensitive focal loss），以提高与受试者无关（subject-independent）的识别性能。输入表示通过引入欧拉角的三角编码以及加速度和陀螺仪幅度特征，扩展了原始惯性测量，使模型能够捕捉与方向相关的运动模式和对方向不敏感的运动强度。该模型在包含来自15名受试者的四种抗阻训练动作的自定义智能哑铃数据集上，使用留一法交叉验证（Leave-One-Subject-Out cross-validation, LOSO）进行了评估。结果：DeM-FCN达到了0.966的准确率、0.916的宏观F1分数和0.982的宏观AUC，同时仅保持73.7?K参数、14.84 M FLOPs和0.29 MB的模型大小。在PAMAP2和MHEALTH上的额外评估表明，卷积骨干在基于惯性测量单元（Inertial Measurement Unit, IMU）的公共HAR数据集上保留了有用的类别排序能力，而较低的宏观F1分数表明，由于更广的活动多样性、传感器域差异和缺失模态信息，硬标签日常活动识别仍比受约束的抗阻训练识别更具挑战性。一项精细的消融研究证实，三角编码和幅度特征提供了互补优势，其中幅度特征对跨受试者鲁棒性的贡献更大。讨论：结果表明，DeM-FCN在可穿戴抗阻训练识别中提供了良好的准确率-效率权衡，并为面向边缘的健身监测提供了实用基础。

**论文解读：DeM-FCN在可穿戴抗阻训练活动识别中的超轻量纯卷积框架**

**研究背景与问题**
可穿戴人类活动识别（HAR）已成为智能健身追踪的核心组成部分，但将高精度模型部署到资源受限的边缘设备（如智能手表或嵌入式传感器节点）仍面临严峻挑战。现有深度学习方法，如基于循环神经网络（RNN/LSTM）、注意力机制或复杂混合架构的模型，虽能取得高分类准确率，但计算复杂度高、实时性差，难以满足边缘设备的能耗和内存约束。此外，传统启发式动作周期分割方法极易受基线漂移和传感器噪声影响，导致鲁棒性不足。因此，开发一种超轻量、高准确率、不依赖循环结构且能有效处理复杂运动动力学的纯卷积框架，对于实现边缘端可穿戴抗阻训练识别具有重要研究意义。

**研究内容与结论**
研究人员提出DeM-FCN——一种超轻量纯卷积神经网络（Fully Convolutional Network, FCN）框架，专门用于基于智能哑铃惯性信号的上肢抗阻训练活动识别（包括二头弯举、侧平举、肩推和三头伸展）。该模型在自定义数据集（15名受试者，4种动作）上通过留一法交叉验证（LOSO）评估，取得了0.966的整体准确率、0.916的宏观F1分数和0.982的宏观AUC，同时模型参数仅73.7?K、FLOPs约14.84 M、模型大小0.29 MB。在PAMAP2和MHEALTH两个公共数据集上的额外评估显示，DeM-FCN在更广泛的日常活动识别任务中保留了良好的类别排序能力（宏观AUC分别为0.972和0.981），但硬标签分类宏F1分数有所下降（分别为0.787和0.741），说明日常活动多样性、传感器域差异和缺失模态信息仍带来挑战。该研究为边缘端可穿戴健身监测提供了实用的准确率-效率权衡方案，相关成果发表在《Frontiers in Sports and Active Living》。

**主要关键技术方法**（不超过250字）
研究人员采用以下关键技术方法：1）物理感知特征工程：将原始9轴IMU数据（三轴加速度、角速度、欧拉角）通过三角编码（正弦/余弦）将不连续的欧拉角映射到连续二维圆空间，并提取加速度和角速度的欧拉范数（L2范数）作为与方向无关的运动强度特征，最终构建14维特征张量。2）数据分割：采用50%重叠的滑动窗口（窗口长度100帧，步长50帧）连续分割数据流，并进行全局标准化（StandardScaler）。3）模型架构：堆叠三个一维卷积块（内核尺寸8、5、3），依次包含Batch Normalization和ReLU激活；在输入层引入高斯噪声正则化（标准差σ=0.08）以增强跨受试者鲁棒性；采用全局最大池化（GMP）替代全局平均池化以捕捉瞬态判别峰。4）损失函数：使用代价敏感焦点损失（cost-sensitive focal loss，γ=2.0），并基于运动生物力学复杂度为四类动作设定经验权重[0.8,1.0,4.0,1.2]（分别对应二头弯举、侧平举、肩推、三头伸展），以强调判别困难类。5）实验协议：严格采用LOSO交叉验证，每折将一位受试者全部数据作为测试集，训练集仅适配标准化参数。优化采用AdamW优化器（学习率0.002，权重衰减0.01）和余弦退火学习率调度（最低学习率10??），训练80轮/折。样本数据来源为自定义智能哑铃数据集，含15名受试者的4种抗阻训练动作。

**研究结果**（保留每个小标题）

***3.1 实验与结果分析：受试者无关泛化与运动学评估***
3.1.1 总体泛化性能：在LOSO交叉验证下，DeM-FCN对8名受试者实现了完美预测（准确率1.0，宏F1 1.0），总体平均准确率0.966±0.076，宏F1 0.916±0.186，宏AUC 0.982±0.050。个别受试者（如YWH、ZH）性能下降（F1约0.66），表明跨个体变异性仍具挑战，但AUC仍保持较高值。
3.1.2 动作特异性运动学复杂度分析：三头伸展（TE）表现最佳（召回率1.000±0.000，AUC 1.000±0.000），因其为单一肘关节运动；二头弯举（BC）召回率0.990±0.037；侧平举（LR）平均召回率最低（0.803±0.337），归因于肩关节自由度大及代偿机制；肩推（SP）精度较低（0.870±0.278），源于肩肱节律个体差异。
3.1.3 混淆模式与跨受试者变异性分析：聚合混淆矩阵显示，BC正确预测率0.98，仅2%错分为LR；SP与TE分离性高；LR正确率0.81，主要错分为TE（12%）、BC（5%）和SP（2%），表明肩部相关及过渡敏感运动模式是主要困难。
3.1.4 AUC-F1差异的谨慎解读：部分受试者（如YWH）SP类F1为0但AUC为1.0，说明模型保留了排序能力但硬标签决策受阈值影响。研究人员指出差异源于排名指标与硬标签指标的不同性质，并建议未来通过轻量个性化校准（如Platt缩放）缩小差距。

***3.2 消融研究***
3.2.1 物理感知特征工程的解耦验证：从原始9轴输入（准确率0.894）到完整DeM-FCN（0.966）显著提升。移除三角编码后准确率略降至0.955；移除幅度特征后降幅更大至0.915，表明幅度特征对跨受试者鲁棒性贡献更强。两者互补，共同提升性能。
3.2.2 模型组件与损失函数消融：用全局平均池化（GAP）替换GMP致宏F1从0.916降至0.868，证实GMP能捕获瞬态判别峰；用标准交叉熵替换代价敏感焦点损失致准确率从0.966降至0.935，说明困难感知优化改善困难类识别；移除高斯噪声导致宏F1从0.916降至0.905，显示轻度正则化效果。

***3.3 模型可解释性分析***
通过一维类激活映射（1D-CAM）可视化：DeM-FCN的注意力（深红色区域）高度集中于加速度和角速度幅度的局部极值或转折点（如LR和BC的向心收缩峰值点，TE和SP的爆发性高幅波动段），证明模型学习到物理上有意义的运动学模式而非背景噪声。GMP层确保了时间平移不变性，使模型无论判别峰出现在窗口何处都能锁定。

***3.4 计算成本与边缘部署效率分析***
DeM-FCN参数73,732个，每100帧窗口FLOPs约14.84 M，模型权重（FP32）0.29 MB，单次推理峰值RAM<2 MB。在测试的通用CPU平台上推理延迟<2.5 ms，吞吐量>400窗口/秒。研究人员指出这是指示性计算分析，实际嵌入式硬件性能需后续验证。

***3.5 模型对比分析***
与五种近期先进边缘HAR模型对比：DeM-FCN在宏F1（0.916）和AUC（0.982）上排名前三，而模型大小（0.29 MB）和CPU延迟（2.5 ms）远优于依赖CNN+LSTM的模型（AlMuhaideb等：2.10 MB, 45.0 ms）。与极轻量TinyML方法（如Liu等，0.18 MB）相比，DeM-FCN在保持更高准确率的同时推理延迟更低。此外，与PWMF-ResMiniNet对比，DeM-FCN专为单传感器抗阻训练设计，无需多传感器同步或GAF预处理，端到端延迟更低。

***3.6 公共数据集性能评估***
在PAMAP2（12类活动）和MHEALTH（12类活动）上，DeM-FCN分别取得宏AUC 0.972和0.981，但宏F1仅为0.787和0.741。动态活动（如步行、自行车）表现稳定，静态或冲击性活动（如躺、跳绳）F1较低。缺失欧拉角信息（需零填充）是主要限制，但模型保留了良好排序能力。

**讨论与结论**
讨论部分总结：DeM-FCN在自定义数据集上实现了高受试者无关识别性能，消融研究证实三角编码与幅度特征互补、GMP优于GAP、焦点损失优于交叉熵。公共数据集实验显示卷积骨干保有排序能力，但硬标签分类因活动多样性、传感器差异和缺失模态而更具挑战。局限性包括：数据集仅15名受试者4种动作、计算评估未在真实嵌入式硬件进行、窗口参数未做敏感性分析、类别权重经验设定且未做概率校准。未来方向包括更大规模数据收集、真实设备部署、窗口参数分析、自适应损失加权、校准评估和传感器放置鲁棒性提升。

结论翻译：本研究提出了DeM-FCN，一种用于基于智能哑铃惯性信号的可穿戴抗阻训练活动识别的轻量级纯卷积框架。通过集成物理感知特征工程、全局最大池化、高斯噪声正则化和代价敏感焦点损失，该模型在LOSO交叉验证下实现了强大的受试者无关性能，准确率0.966，宏F1分数0.916，宏AUC 0.982，同时仅需73.7?K参数、14.84 M FLOPs和0.29 MB存储。精细的消融研究证实三角编码和幅度特征提供互补优势，幅度特征对于捕捉方向不敏感的运动强度尤其重要，而GMP和焦点损失进一步改善了瞬态特征提取和困难类识别。在PAMAP2和MHEALTH上的公开评估表明，DeM-FCN在更广泛的基于IMU的HAR任务中保留了有用的类别排序能力，尽管较低的宏F1分数表明，由于活动多样性、传感器差异和缺失模态信息，硬标签日常活动识别仍具挑战。总体而言，在当前实验设置下，DeM-FCN为面向边缘的可穿戴抗阻训练识别提供了良好的准确率-效率权衡。然而，结论仍受限于数据集大小、活动范围、固定窗口参数以及缺乏真实嵌入式设备验证。未来工作将集中于更大规模数据集、真实设备部署、窗口参数敏感性分析、自适应损失加权、校准感知评估以及对传感器放置变异性的鲁棒性改进。

联系信箱：

粤ICP备09063491号

热点排行