基于Hilbert空间填充曲线的辅助情绪识别：面向唐氏综合征儿童的空间局部性方法

首页今日动态人才市场新技术专栏中国科学人云展台
BioHot
云讲堂直播会展中心特价专栏技术快讯免费试用

生物通官微
陪你抓住生命科技
跳动的脉搏

生物通首页 > 今日动态 > 正文

《Technologies》：Hilbert Space-Filling Curves for Assistive Emotion Recognition: A Spatial Locality Approach for Children with Down Syndrome

【字体：大中小】 时间：2026年06月09日 来源：Technologies 3.6

编辑推荐：

　　许多唐氏综合征（Down syndrome, DS）儿童存在情绪识别困难，辅助技术与情感计算（affective computing）领域存在显著的应用空白。传统的深度学习方法依赖标准光栅扫描展平操作（raster-scan flattening），由于未能保

许多唐氏综合征（Down syndrome, DS）儿童存在情绪识别困难，辅助技术与情感计算（affective computing）领域存在显著的应用空白。传统的深度学习方法依赖标准光栅扫描展平操作（raster-scan flattening），由于未能保持空间局部性（spatial locality），在该群体中的识别精度有限。本文提出了一种基于Hilbert空间填充曲线（Hilbert space-filling curve）的神经网络展平层优化方法，专门设计用于解决辅助技术中的上述空白，为这一 currently underserved by affective computing 的脆弱群体提供支持，同时也为寻求微调人工神经网络架构的研究人员提供框架。研究人员的方法利用Hilbert索引保持空间连贯性，以灵活的Keras层实现，与VGG16和ResNet50等标准架构兼容。在多个数据集上的全面分析表明，与光栅方法相比，情绪识别准确率提高了4%。Hilbert优化在唐氏综合征情绪分类中达到71%的精确率，同时处理开销降低约5%。通过基于空间感知深度学习缩小情绪识别差距，该研究为更公平的医疗人工智能做出贡献，推动了面向神经多样性群体的辅助技术发展，在近期具有儿科临床应用价值，并在情感计算领域具有更广泛的应用前景。

该研究聚焦于唐氏综合征儿童情绪识别这一被长期忽视的领域，旨在解决现有辅助技术与情感计算应用中的重大公平性缺口。唐氏综合征是由21号染色体额外完整或部分拷贝引起的遗传性疾病，导致典型面部特征及中度智力发展迟缓，这类儿童难以准确识别基础情绪。当前面部情绪分类技术虽成熟，却几乎完全忽略了该群体的特殊需求。研究指出，传统卷积神经网络（convolutional neural network, CNN）中光栅扫描展平操作会破坏特征图间的空间连贯性，而唐氏综合征儿童的面部形态与表情模式具有局限性和特异性，空间局部性缺失对其影响尤为严重。为此，研究人员提出以Hilbert空间填充曲线替代传统展平方法，利用其分形几何特性在降维过程中保持像素间的邻近关系。

研究人员采用的关键技术方法包括：基于递归算法生成Hilbert空间填充曲线映射矩阵的自定义展平层（FlattenHilbert），以Keras兼容层形式实现；在标准CNN架构（VGG16、ResNet50）及自定义CNN中替换传统展平层进行对比实验；应用迁移学习（transfer learning）策略，使用ImageNet预训练权重；构建并公开EmoKidsData数据集（含唐氏综合征儿童四分类情绪图像，933张训练图像、384张验证图像、128张测试图像，由认证儿童心理学家标注）；采用McNemar检验与Bootstrap方法进行统计显著性检验；以及实现小波池化（wavelet pooling）与数据增强（data augmentation）等辅助技术。

研究设计与结果方面，在食品图像分类验证中（FoodDatabase），VGG16配合Hilbert展平达到与光栅展平同等的F1分数（0.95）和AUC（0.993），但单幅图像处理时间从39.035 ms降至10.869 ms；ResNet50虽F1分数略降（0.66 vs 0.68），处理时间大幅缩短（20.365 ms vs 84.615 ms）。在CIFAR-10数据集上，Hilbert方法F1分数（0.71）与AUC（0.9637）均优于光栅方法（F1=0.70，AUC=0.9530），且处理时间与内存使用更具优势。经McNemar检验统计验证，Hilbert模型准确率的提升具有高度显著性（检验统计量208.044，p值=3.67×10^?47；Bootstrap估计的95%置信区间为[?0.0542, ?0.0448]，不包含0）。

在情感计算专门化分析中，针对典型发育人群EmotionDatabase的实验显示，Hilbert展平在VGG16上将F1分数从0.88提升至0.92，AUC从0.9530提升至0.9653；研究人员自定义的CNN架构配合Hilbert展平达到最优性能（F1=0.94，AUC=0.9907，256×256像素输入，单幅处理时间0.186 ms，内存占用4.5 GB RAM）。该架构采用三级卷积块（滤波器数64→128→256），使用指数线性单元（exponential linear unit, ELU）激活函数、批归一化（batch normalization）与Dropout正则化，核心创新在于以Hilbert展平层替代标准光栅扫描。

针对唐氏综合征儿童的核心临床应用（EmoKidsData），研究人员比较了四种配置：基础架构（BASE）、数据增强（Data）、迁移学习最优模型（TR Best）、以及二者结合（TR Best + Data）。结果表明，VGG16-ImageNet的F1分数仅为0.50，AUC为0.60–0.68；而自定义架构配合数据增强达到最优性能（F1=0.71，AUC=0.8208），处理时间低于7 ms/图像。TR系列配置F1分数介于0.57–0.59，显示渐进式迁移与数据增强可提升稳定性与泛化能力。

讨论部分系统总结了Hilbert编码相较于光栅展平的跨领域优势。其核心机理在于：Hilbert曲线通过保持特征图转换为1维向量时的空间连贯性，使全连接层获得更具结构一致性的视觉信息表征。这种优势在低维度数据集（CIFAR-10）中依然显著，而在情感识别等高敏感任务中表现尤为突出。针对唐氏综合征儿童的临床实验具有重要价值，表明Hilbert增强的空间表征结合精心设计的架构，能够适应神经多样性群体的特殊面部特征与表情模式，为实时处理、低计算资源环境提供了精度与效率的优化平衡。该架构可作为治疗师、教育者和临床医生的辅助工具，实时识别情绪反应，支持社会情感发展评估与个性化干预。

研究结论指出：所提出的Hilbert索引架构在精度和计算成本方面均优于传统光栅方法，保持空间连贯性的特征向量生成能力使F1分数和AUC获得近乎一致的提升，处理速度提升近4倍（最高达5倍）。在唐氏综合征儿童情绪识别这一重点用例中，该架构达到F1=0.71、AUC=0.8208的临床可用水平，从基线F1=0.50显著提升至0.71，展现了应对重要医疗不平等问题的潜力。因此，通过对普遍使用的展平操作进行根本性改进，该研究不仅提供了替代性实现方法，更为唐氏综合征儿童的识别与情绪辅助提供了实用工具。未来工作将纳入ViT-ResNet、MobileNetV2-BiLSTM等前沿模型进行更广泛对比验证。

联系信箱：

粤ICP备09063491号

热点排行