今日动态 返回首页
会员注册 登录 生物通快讯免费订阅
  • 首页 今日动态 人才市场 新技术专栏 中国科学人 云展台
    BioHot
    • 定制我的BioHot
    • 进入我的BioHot
    • 进入我的集采
    • 肿瘤癌症研究
    • 免疫/基因/细胞疗法
    • 神经生物学
    • 健康与疾病
    • 衰老机制与长寿
    • 单细胞技术
    • 基因编辑-CRISPR
    • RNA研究
    • 肠道菌与人体微生态
    • 细胞代谢
    • AI生物信息学
    • COVID
    云讲堂直播 会展中心 特价专栏 技术快讯 免费试用

  • 生物通官微
    陪你抓住生命科技
    跳动的脉搏

生物通首页  >  今日动态  >  正文

用于阿姆哈拉语语音情感识别的频谱图和局部特征辅助卷积神经网络

《Scientific Reports》:A spectrogram and local feature-assisted convolutional neural network for Amharic speech emotion identification

【字体: 大 中 小 】 时间:2026年05月28日 来源:Scientific Reports 3.9

编辑推荐:

  摘要语音情感识别(Speech Emotion Recognition, SER)在改善人机交互和人际交流方面发挥着重要作用。然而,在像阿姆哈拉语这样的资源匮乏的语言中,由于数据集的缺乏和语言多样性问题,语音情感识别仍然是一项具有挑战性的任务。本文提出了一种基于卷积神经网络(Co

  

摘要

语音情感识别(Speech Emotion Recognition, SER)在改善人机交互和人际交流方面发挥着重要作用。然而,在像阿姆哈拉语这样的资源匮乏的语言中,由于数据集的缺乏和语言多样性问题,语音情感识别仍然是一项具有挑战性的任务。本文提出了一种基于卷积神经网络(Convolutional Neural Network, CNN)的方法,该方法结合了频谱图特征和局部声学特征(如梅尔频率倒谱系数、色度、零交叉率、能量和音高),以实现高效的阿姆哈拉语语音情感识别。研究人员构建了一个包含1650个三秒长阿姆哈拉语语音样本的数据集,并将这些样本标注为五种情感类别:愤怒、恐惧、快乐、中性和悲伤。为了提高信号质量并加快训练速度,采用了频谱减法和小波去噪等高级预处理技术。实验结果表明,所提出的基于CNN的方法分类准确率为90%,优于其他基于循环神经网络的方法(长短期记忆网络Long Short-Term Memory的准确率为58.48%、双向长短期记忆网络Bidirectional Long Short-Term Memory的准确率为63.33%、门控循环单元Gated Recurrent Unit的准确率为40%),以及单一特征模型(局部声学特征的准确率为73%、频谱图特征的准确率为79%)。这些结果证实,在CNN架构中整合频谱图和局部声学特征可以提高资源匮乏语言中语音情感识别的准确性和效率,为未来的阿姆哈拉语语音情感识别研究树立了新的标准。

相关新闻
生物通微信公众号
生物通新浪微博
微信
新浪微博
我要投稿
  • 搜索
  • 国际
  • 国内
  • 人物
  • 产业
  • 热点
  • 科普

热搜:资源匮乏、卷积神经网络、阿姆哈拉语、频谱图特征、梅尔频率倒谱系数、情感识别任务

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号