今日动态 返回首页
会员注册 登录 生物通快讯免费订阅
  • 首页 今日动态 人才市场 新技术专栏 中国科学人 云展台
    BioHot
    • 定制我的BioHot
    • 进入我的BioHot
    • 进入我的集采
    • 肿瘤癌症研究
    • 免疫/基因/细胞疗法
    • 神经生物学
    • 健康与疾病
    • 衰老机制与长寿
    • 单细胞技术
    • 基因编辑-CRISPR
    • RNA研究
    • 肠道菌与人体微生态
    • 细胞代谢
    • AI生物信息学
    • COVID
    云讲堂直播 会展中心 特价专栏 技术快讯 免费试用

  • 生物通官微
    陪你抓住生命科技
    跳动的脉搏

生物通首页  >  今日动态  >  正文

基于Transformer的孟加拉语手语单词级识别技术,采用相对量化编码方法

《Scientific Reports》:Transformer-based word level Bangla sign language recognition using relative quantization encoding

【字体: 大 中 小 】 时间:2026年06月04日 来源:Scientific Reports 3.9

编辑推荐:

   摘要 对于像孟加拉语这样的低资源语言,手语识别(SLR)面临手势表达的多样性、视角差异以及标注数据集有限的问题。在本文中,我们提出了BdSLW401,这是一个大规模、多视角的孟加拉手语(BdSL)数据集,包含401个手势和102,176个视频样本,这些样本来自

  

摘要

对于像孟加拉语这样的低资源语言,手语识别(SLR)面临手势表达的多样性、视角差异以及标注数据集有限的问题。在本文中,我们提出了BdSLW401,这是一个大规模、多视角的孟加拉手语(BdSL)数据集,包含401个手势和102,176个视频样本,这些样本来自18位手语者的正面和侧面视角。为了改进基于Transformer的手语识别技术,我们引入了相对量化编码(RQE)方法。该方法通过将关键特征点与生理参考点关联起来并对运动轨迹进行量化,从而优化了模型的注意力分配。实验结果显示,在WLASL100数据集上,RQE使错误率降低了44.3%;在SignBD-200数据集上降低了21.0%;同时在BdSLW60和SignBD-90数据集上也取得了显著提升。然而,在大规模数据集(如WLASL2000)中,固定量化方法的效果不再明显,这表明需要采用自适应编码策略。进一步开发的RQE-SF变体通过稳定肩部关键特征点的位置,虽然在一定程度上牺牲了侧面视角识别的准确性,但提升了手势的一致性。注意力图谱分析表明,RQE通过关注主要的手势生成部位(如手指、手腕)以及更具辨识度的帧内容,提高了模型的可解释性。通过引入BdSLW401数据集并验证RQE增强型结构化嵌入方法的有效性,本研究为低资源语言的手语识别技术带来了进展,并为未来的相关研究奠定了基础。

相关新闻
生物通微信公众号
生物通新浪微博
微信
新浪微博
我要投稿
  • 搜索
  • 国际
  • 国内
  • 人物
  • 产业
  • 热点
  • 科普

热搜:孟加拉手语|多视角检索|量子编码|注意力机制|WD401|肩点定位|结构化嵌入

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号