MSP-Podcast语料库

《IEEE Transactions on Affective Computing》:The MSP-Podcast Corpus

【字体: 时间:2026年04月07日 来源:IEEE Transactions on Affective Computing 9.8

编辑推荐:

   摘要: 大规模、高质量的情感语音数据库的可用性对于推进现实世界场景中的语音情感识别(SER)至关重要。然而,许多现有数据库在规模、情感平衡和说话者多样性方面存在局限性。本研究介绍了MSP-Podcast语料库,总结了我们十年的研究成果。该语料库包含来自各种音频分享网站的400多

  

摘要:

大规模、高质量的情感语音数据库的可用性对于推进现实世界场景中的语音情感识别(SER)至关重要。然而,许多现有数据库在规模、情感平衡和说话者多样性方面存在局限性。本研究介绍了MSP-Podcast语料库,总结了我们十年的研究成果。该语料库包含来自各种音频分享网站的400多个小时的多样化音频样本,所有样本都遵循允许其分发的通用许可协议。我们对这些样本进行了详细的情感标注,包括主要情感(单一主导情感)和次要情感(音频中感知到的多种情感),以及情感属性(如价值、唤醒度和主导性)。至少有五名评估者对这些情感标签进行了标注。此外,大多数样本还附有说话者身份信息,并为整个语料库中的句子内容提供了人工转录。数据收集流程采用了机器学习驱动的方法来选择情感多样化的录音,确保了不同说话者和环境下的情感表现具有平衡性和多样性。由此产生的数据库提供了一个全面、高质量的资源,更有利于在实际应用中提升语音情感识别系统的性能。
相关新闻
生物通微信公众号
微信
新浪微博

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号