
-
生物通官微
陪你抓住生命科技
跳动的脉搏
HeyJay!一个用于口语理解和自动语音识别的非典型语音语料库
《Scientific Data》:HeyJay! A corpus of atypical speech for spoken language understanding and automatic speech recognition
【字体: 大 中 小 】 时间:2026年06月04日 来源:Scientific Data 6.9
编辑推荐:
摘要语音技术,如自动语音识别或口语理解,通常不适用于非典型语音,即那些患有构音障碍、声音障碍或其他类型语音问题的人的语音。这阻碍了这些非典型说话者使用语音助手或其他人机交互平台,而这些平台本可以让他们的生活更加便利或提高他们的独立性。在本文中,我们介绍了HeyJay!,这是一个新
语音技术,如自动语音识别或口语理解,通常不适用于非典型语音,即那些患有构音障碍、声音障碍或其他类型语音问题的人的语音。这阻碍了这些非典型说话者使用语音助手或其他人机交互平台,而这些平台本可以让他们的生活更加便利或提高他们的独立性。在本文中,我们介绍了HeyJay!,这是一个新的英语非典型语音语料库,其中包含来自患有神经退行性疾病(包括帕金森病和肌萎缩侧索硬化症)的参与者的语音记录。当前版本的语料库包含8,669条语音记录,附带监督转录和意图注释。通过将这个语料库应用于自动语音识别、口语理解以及数据增强任务,我们证明了其有效性。此外,该数据集还包含了由专业语音和语言病理学家对每位参与者的语音质量进行的评分。作为首个公开发布的带有非典型语音意图注释的语料库,它的目标是通过对现有技术的改进来开发更加公平的语音技术,并促进该领域的进一步研究。
生物通微信公众号
热搜:非典型语音或语音障碍|HeyJay!|语料库|神经退行性疾病|语音辅助|数据增强 注意:根据内容本身长度精炼提炼。 摘要介绍了一个针对神经退行性疾病患者的非典型语音语料库HeyJay!|包含8669条记录及专业病理学家评分|旨在测试并改进语音识别与口语理解技术在无障碍交互领域的应用。 关键词提炼内容核心|按长度动态生成6个关键词|间用竖线分隔|无额外提示。 非典型语音|语音障碍|HeyJay!|神经退行性疾病|语音辅助|数据增强 精简版(4 个):非典型语音|HeyJay!|语音障碍|神经退行性疾病 标准版(6 个):非典型语音|语音障碍|HeyJay!|神经退行性疾病|语音辅助|数据增强 非典型语音或语音障碍|HeyJay!|语料库|神经退行性疾病|语音辅助|数据增强