佩戴双侧人工耳蜗或助听器的儿童在安静环境、嘈杂环境及混响环境中的音素感知能力

《Ear and Hearing》：Phoneme Perception in Children With Bilateral Cochlear Implants or Hearing Aids in Quiet, Noise, and Reverberation

【字体：大中小】 时间：2026年04月02日 来源：Ear and Hearing 2.8

编辑推荐：

　　摘要目标：评估辅助音素感知能力对于验证助听器和人工耳蜗是否充分满足儿童的放大和康复需求至关重要。在这些评估中通常使用音素，以尽量减少语义背景和词汇知识的影响。传统上，临床医生使用自己的声音来呈现音素。本研究直接比较了听力正常的儿童、使用助听器的儿童、使用人工耳蜗的儿童以及听

　　摘要
目标：评估辅助音素感知能力对于验证助听器和人工耳蜗是否充分满足儿童的放大和康复需求至关重要。在这些评估中通常使用音素，以尽量减少语义背景和词汇知识的影响。传统上，临床医生使用自己的声音来呈现音素。本研究直接比较了听力正常的儿童、使用助听器的儿童、使用人工耳蜗的儿童以及听力正常的成人之间的音素检测、区分和识别能力。整个研究过程中使用了实验室程序和录制的音频文件。此外，还在具有挑战性的声学环境中（特别是有噪音和/或混响的环境中）评估了音素区分能力，这些环境反映了儿童经常遇到的情况。

设计：
共有60名儿童和42名成人参与了这项研究。儿童的平均年龄为10±2岁，成人的平均年龄为27±5岁。儿童被分为三组，每组20人：听力正常的儿童、使用双耳助听器的儿童以及使用双耳人工耳蜗的儿童。使用助听器的儿童是通过哥本哈根听力与平衡中心（丹麦Rigshospitalet）招募的，并且所有设备都按照当前的最佳实践进行了适配。辅助音素检测和识别能力是通过Ling 6(HL) CD音频文件来评估的，而音素区分能力则是使用DANOK语音语料库的一个子集来评估的。测试在空间听力实验室中进行，以考察噪音和混响对表现的影响。

结果：
研究结果表明，除了在低频语音音素上存在轻微差异外，在各种声学条件下，使用助听器的儿童和使用人工耳蜗的儿童在音素检测、识别或区分方面没有显著差异。所有儿童在安静环境中的Ling音素检测阈值都在正常范围内，所有组的平均阈值均低于20 dB HL（当按每个Ling音素和参与者组分析时，最高平均值为22 dB HL）。在所有儿童中，音素区分能力受到混响和噪音的显著影响——尤其是对于使用助听器或人工耳蜗的儿童来说这种影响更为明显。

结论：
本研究提出的辅助音素检测、区分和识别方法是有价值的工具，可用于客观评估使用助听器和人工耳蜗的儿童的效果并验证其益处。这对于使用人工耳蜗的儿童尤为重要，因为这些设备无法通过实耳测量进行电声验证。结果表明，尽管助听器和人工耳蜗的技术本质不同（声学刺激与电刺激），但儿童的音素感知能力没有显著差异。在嘈杂和混响条件下，尤其是使用听力辅助设备的儿童表现较差，这强调了优化信噪比和儿童日常环境中的声学环境对于支持语音感知、听觉发展和整体福祉的重要性。

引言
结果评估是验证儿童助听器和人工耳蜗最佳实践临床指南的基本组成部分。这些评估有助于确定放大效果并支持微调，确保每个儿童的放大需求得到有效满足（美国听力学学会2013；Messersmith等人2019；英国听力学学会2022）。重要的是，结果评估是在初始设备适配和验证阶段之后进行的，在此阶段会客观确认放大效果是否达到预定的目标范围。结果评估工具包括客观测量方法（如辅助听力图和辅助语音感知测试）和主观测量方法（通常以家长问卷的形式）。本研究侧重于客观结果评估。传统上，临床医生仍然常用自己的声音来评估不同层次的设备功能和语音感知（Smiley 2004；Erber 2011）。相比之下，本研究采用了使用录制和校准的刺激物的结果评估方法。过去，辅助检测阈值听力图通常使用颤音或窄带噪音来测量。然而，由于潜在的误差来源（如刺激物与听力设备中的信号处理算法之间的相互作用），这些测量方法经常被排除在临床协议之外（Hawkins等人1987；Kuk & Ludvigsen 2003）。实耳测量（REM）作为一种可靠且高效的方法被引入，用于评估助听器的辅助可听度（Hawkins等人1987；Kuk & Ludvigsen 2003），并且是当前儿科放大临床实践指南的一部分（美国听力学学会2013）。虽然REM有助于验证助听器是否正确提供了规定的放大效果，但它不能评估用户是否能够感知特定频率的低强度语法标记，或者他们是否从启用了所有高级功能的助听器中受益。因此，REM属于临床协议的验证阶段而非确认阶段。此外，尽管儿童耳道声学特性存在很大差异，但REM并未在所有临床环境中得到一致实施。在北美的一项调查中，大约50%的听力学家报告称在超过一半的情况下进行了耳戴式验证测量（Moodie等人2016）。重要的是，由于无法对使用人工耳蜗的儿童进行REM测量，因此对他们来说，测量辅助听力图尤为重要。全球的临床医生使用各种辅助语音感知测试来评估音素、单词或句子层面的感知（美国听力学学会2013）。其中，Ling音素因其简单性和临床实践中的高效性而被广泛使用（Agung等人2005）。这六个音素——/m/、/u/、/a/、/i/、/?/ 和 /s/——代表了从低频到高频的广泛频率范围，涵盖了连续语音中常见的声音。这些音素共同覆盖了大约250到8000 Hz的语音频率谱（Ling 1988；Scollie等人2012；Glista等人2014）。Ling音素的录音版本可以在CD上获得，从而实现标准化的音素检测评估（Scollie等人2012；Glista等人2014）。听力和语言的发展依赖于一系列语音感知和听觉技能。这些技能——检测、区分、识别和理解——通常由言语-语言病理学家和听觉-语言治疗师进行评估（Smiley 2004；Erber 2011）。检测是最基本的听觉技能，指的是识别声音存在的能力，通常在柔和到中等响度水平或检测阈值下进行测试（Uhler等人2017）。区分涉及区分语音声音并识别它们之间的最小差异，比检测更高级。识别是在听到声音后对其进行标记、命名或再现的能力，需要先前的检测和区分。理解是最复杂的听觉技能，涉及理解声音的意义，将听觉感知与认知和语言能力联系起来（Smiley 2004；Erber 2011）。在这项研究中，我们专注于音素的检测、区分和识别，有意排除了更高层次的认知和语言能力。这一选择是基于证据，即老年人比年轻人更能从支持性的语义背景中受益（例如，句子的可预测性）（Pichora-Fuller等人1995），并且年龄和语义背景对语音感知的影响也在儿童中观察到（Fallon等人2002；Pittman & Schuett 2013；Walker等人2019）。此外，使用听力辅助设备的儿童在处理低可预测性句子时需要更多的声学信息（Lewis等人2017），而使用人工耳蜗的儿童则更依赖周围的语义线索（Simeon & Grieco-Calub 2021）。有研究表明，听力损失儿童在语音感知过程中会发展出强大的修复策略。因此，加强他们的听觉技能可能为词汇习得提供更多机会（Pittman & Schuett 2013）。此外，与成人相比，具有挑战性的声学环境对儿童的语音感知能力影响更大（Neuman & Hochberg 1983；Yang & Bradley 2009；Klatte等人2010b；Neuman等人2010），对于听力损失儿童来说这种影响更为明显（Ching等人2014；Iglehart 2016,2019；McCreery等人2019）。尽管听力损失儿童在安静条件下可以在语音感知测试中取得高分，但在嘈杂和混响环境中他们的表现无法达到听力正常儿童的水平（Neuman等人2012；McCreery等人2015；Goldsworthy & Markle 2019）。尽管存在这些挑战，儿童在嘈杂和混响环境中度过大量时间（Knecht等人2002；Crukley等人2011；Easwar等人2016），其中噪音和混响经常同时存在（Klatte等人2010a）。以往关于听力损失儿童音素感知的研究通常集中在特定亚群体上，例如那些使用助听器或人工耳蜗的儿童（Baudhuin等人2012；Glista等人2014；Van Eeckhoutte等人2020b），或者使用现场声音呈现的Ling音素（Yucel等人2009）。据报道，使用助听器的儿童在佩戴自己的助听器时，Ling音素的辅助检测阈值范围为0到35 dB HL（Glista等人2014），而使用人工耳蜗的儿童则在14到26 dB HL之间，具体值取决于T级编程设置（Baudhuin等人2012）。Van Eeckhoutte等人（2020b）发现，使用助听器的儿童在噪音中的辅音区分平均得分在76.5%到81.9%之间，这取决于助听器的带宽。较差的辅助音素感知与更严重的听力损失相关（Glista等人2014；Van Eeckhoutte等人2020b）。在Easwar等人（2024）的研究中，使用助听器的儿童在噪音和混响环境中的辅音区分能力低于听力正常的儿童，组间中位数差异至少为16.2 RAU。对于使用人工耳蜗的儿童，语音感知结果各不相同（Wolfe 2020）。然而，有一项研究报告称，在2.5岁之前接受首次植入的人工耳蜗儿童中，安静环境下的平均音素区分得分为95%（Uzun等人2022）。与早期研究不同，我们的目标是直接比较听力正常儿童、使用助听器的儿童和使用人工耳蜗的儿童在安静、嘈杂和混响听力条件下的辅助音素感知能力。虽然两组使用听力辅助设备的儿童都有听力损失，但他们的听力历史和听觉信号传输方式存在显著差异。助听器放大声学信号，保留了大部分频谱细节和一些时间细节。相比之下，人工耳蜗将声音分成频带，并通过电脉冲编码时间包络，这些电脉冲按照与耳蜗区域对应的音调分布传递给电极。这种对听觉神经的直接电刺激从根本上改变了频谱和时间线索的表示方式——特别是对于不同音素类别相关的线索。此外，语音感知测试的变异性以及不同研究中噪音和混响实施的差异使得直接数据比较变得复杂（Porto等人2023）。例如，有一项研究报告称，使用助听器的儿童和使用人工耳蜗的儿童在音素感知方面没有显著差异，但个体得分的变异性很大，范围从12%到100%（Fitzpatrick等人2012）。值得注意的是，该研究的儿童是在普遍新生儿听力筛查实施之前的诊断结果，这一因素可能影响了结果，并且与当前的临床实践不同。本研究的目的是直接比较三组儿童的语音感知表现：听力正常的儿童、使用双耳助听器的儿童以及使用双耳人工耳蜗的儿童。我们关注音素的检测、区分和识别能力，从而消除了语义背景或词汇的影响。在安静和不良声学环境中（包括噪音、混响以及两者的组合）评估了表现，使用了当前的临床助听器和人工耳蜗声音处理设置。

材料与方法
共有60名儿童参与了这项研究，分为三组，每组20人：一组听力正常，一组使用双耳助听器，一组使用双耳人工耳蜗。听力正常组包括11名男孩和9名女孩，平均年龄为9±3岁；助听器组包括8名男孩和12名女孩，平均年龄为10±2岁；人工耳蜗组包括10名男孩和10名女孩，平均年龄为11±2岁。使用Wilcoxon秩和检验（带连续性校正）对三组之间的年龄进行成对比较，结果没有显著差异（所有比较的p > 0.05）。所有儿童都能流利使用丹麦语，无论是作为母语者还是双语者（n = 15）。值得注意的是，NH组中的20名儿童中有9名也能流利使用普通话。NH组的儿童是通过同事和个人网络招募的，而CI（人工耳蜗）和HA（助听器）组的儿童则来自丹麦Rigshospitalet的哥本哈根听力与平衡中心。该项目的启动得到了丹麦首都地区健康研究伦理委员会（VEK，项目编号F-23005145）的批准。每位参与者的主要照顾者都签署了同意书，儿童们也签署了同意书。每个儿童都收到了一张礼品卡作为对他们时间的补偿。所有使用HA或CI的儿童在测试过程中都使用了他们的设备，并报告称经常使用这些设备。根据数据记录，使用HA的儿童平均每天佩戴设备12±3小时（四舍五入到最接近的小时数），而使用CI的儿童平均每天佩戴设备14±2小时。HA组的儿童佩戴的是双耳后置式（BTE）助听器，包括Oticon Opn Play 1 BTE PP（n = 13）、Oticon Opn 1 S BTE PP（n = 1）、Oticon PX Play 1 miniBTE T（n = 1）、Oticon REAL 1 miniBTE T（n = 2）、Phonak Sky M 90 PR（n = 1）和Phonak Sky M 90 SP（n = 2）。所有助听器的配置都符合DSL v5.0儿科规范（Scollie等人，2005年），并且运行在自动通用程序中。有1名使用左耳助听器的儿童和1名使用双耳助听器的儿童使用了降频技术。在测试前，使用儿童的个性化耳模通过真实耳与耦合器差异测量进行了助听器验证，并使用Interacoustics Affinity系统完成了验证。如果需要对设置进行任何调整以满足规定目标，这些调整仅是对参与者之前增益设置的微调。高级设置（如降噪功能）没有修改。使用国际语音测试信号（Holube等人，2010年）在输入水平50、65和80 dB SPL以及纯音90 dB SPL下进行了微调，以评估最大功率输出目标，遵循英国听力学协会（2022年）设定的质量标准。根据照顾者的问卷调查，HA组的儿童首次被诊断出的平均年龄为2个月（平均5±9个月），并且平均使用助听器的时间为9年（最短为6年）。听力损失的病因并不总是已知，但照顾者报告了遗传因素、巨细胞病毒、高胆红素血症和早产等原因。NH组和HA组都进行了耳镜检查、鼓室导抗测量和纯音听力测试。耳镜检查确认耳道无阻塞。除NH组中的9名儿童外，所有儿童都进行了鼓室导抗测量。大多数儿童的鼓室图类型为A（41例）、Ad（14例）或As（4例）。只有3只耳朵（共62只）显示类型C的鼓室图，但这些儿童的听力图要么正常，要么是感音神经性的。所有NH组和HA组的儿童的纯音听力阈值都是通过Interacoustics Affinity Compact设备测试或从患者记录中检索临床测量值获得的，前提是这些值在测试日期前6个月内进行过评估。至少记录了所有儿童在0.125至8 kHz范围内所有八度频率的空气传导阈值，如图1所示。HA组的儿童均为感音神经性或混合性听力损失。未佩戴助听器的较好耳的平均纯音阈值（PTA），即在0.5、1、2和4 kHz处的平均未助听听力阈值，平均为52 dB HL（标准差11 dB HL；范围34至71 dB HL）。未佩戴助听器的较差耳的PTA平均为57 dB HL（标准差11 dB HL；范围39至79 dB HL）。图1：参与本研究的佩戴助听器（左）和正常听力（右）儿童的听力图。CI组的儿童使用了双耳设备，这些设备分别是Cochlear Nucleus 7（n = 7）、Cochlear Nucleus 8（n = 5）或Advanced Bionics Naida M（n = 8）。听力损失的病因并不总是已知，但照顾者报告了遗传因素、巨细胞病毒、化疗、出生时缺氧和早产等原因。根据照顾者的问卷调查，CI组的儿童首次被诊断出听力损失的平均年龄为3个月（平均11±19个月），平均使用CI的时间为9年（最短4年）。此外，还有42名成人（24名男性，17名女性，1名非二元性别）参与了研究（平均年龄27±5岁），他们的空气传导阈值在0.125至8 kHz范围内的所有八度频率上都处于正常范围内（≤20 dB HL），除了2名在8 kHz处阈值为25 dB HL的参与者和1名在8 kHz处阈值为60 dB HL的参与者）。

**辅助语音检测与识别**
为了评估语音检测阈值，使用了Ling 6(HL) CD声音文件（Scollie等人，2012年；Glista等人，2014年）。这些文件被上传到Interacoustics Affinity听力计软件中，并通过安装在哥本哈根听力与平衡中心隔音室内的定制Sonible外壳中的KEF Ci160RR-THX扬声器播放。由于我们的诊所没有CD播放器，因此使用了一组21名正常听力成年人的平均阈值来确定参考等效阈值声压水平。每个Ling声音的相应刻度值都被记录下来。声音以随机顺序播放，使用Hughson-Westlake程序来确定检测阈值。在完成检测任务后，参与者被要求在50 dB SPL的音量下识别（即模仿或重复）Ling声音，同样以随机顺序。Ling 6(HL) CD录音是由一位加拿大-英语发音者制作的。然而，先前的研究表明，丹麦发音者发出的Ling声音与英语发音者的声音在频率上只有微小差异。丹麦Ling声音的频谱特征与英语Ling声音的频谱特征一致（Fruerlund Nielsen，参考注释162）。因此，使用Ling 6(HL)声音文件被认为是合适的。

**辅助音素区分**
为了评估辅音区分能力，在哥本哈根听力与平衡中心的空间听力实验室使用了Dansk Nonsense Ord Korpus（DANOK）（Nielsen & Dau，2019年）。这个经过声学处理的实验室配备了扬声器，Fernandez等人（2024年）对此有描述。DANOK语音语料库包含1150个由2名男性和2名女性丹麦发音者发出的无意义单词，用于评估音素区分能力。为了便于对儿童进行测试，选择了DANOK语料库的一个子集。本研究中使用的无意义单词遵循以下结构：/l//a/ C/i/，其中C代表12个常用的丹麦辅音之一（/p/、/t/、/k/、/b/、/d/、/g/、/m/、/n/、/l/、/f/、/v/和/s/）。这种结构生成了如“LABI”、“LAKI”、“LASI”等单词。这种方法类似于西安大略大学开发的UWO DFD测试，用于评估加拿大-英语发音者的音素区分能力，并已用于成人和儿童（Cheesman & Jamieson，1996年；Van Eeckhoutte等人，2020a,b）。DANOK测试包含的辅音数量少于UWO DFD测试，因为一些辅音（如/w/、/z/、/θ/）在丹麦语中不存在，而/y/在丹麦语中被归类为元音。为了减少测试时间，只选择了1名男性和1名女性发音者，每个DANOK条件进行了24次试验。所有儿童在完成四个DANOK测试条件之前都进行了训练条件，这些条件以随机顺序呈现。在所有条件下，语音都以55 dB（A）的音量呈现，因为关注的是在柔和到中等音量水平下的辅音区分能力，以便与Ling声音检测阈值进行比较。训练阶段包括12次无背景噪声或混响的试验，始终从辅音/m/开始（例如：“MABI”、“MAKI”、“MASI”）。训练阶段的结果未用于分析。噪声是稳定的、语音形状的，并且在频谱上与个别发音者匹配，噪声水平在0 dB（静音条件）到50 dB(A)（5 dB SNR条件）之间变化。此外，还有一组21名成人在更困难（0 dB SNR）和更容易（15 dB SNR）的噪声条件下进行了测试，这是根据初步测试建议的。语音在“正常”或“混响”条件下呈现，后者指的是是否存在混响。因此，所有儿童都参与了以下四个DANOK测试条件：无噪声的正常语音、有噪声的正常语音、无噪声的混响语音和有噪声的混响语音。语音通过位于0°的前置扬声器播放，而噪声则通过位于45°、135°、225°和315°的扬声器播放。混响条件是通过放置在30°、90°、150°、210°和330°的额外扬声器创建的。混响效果使用ODEON软件（ODEON A/S，Lyngby，丹麦）模拟，并通过卷积脉冲响应方法实现，假设单词尾部在混响环境中会自然延伸。估计的混响时间（T60）在0.125至4 kHz的八度频率范围内为1.77至1.71秒，在8 kHz时为1.38秒。这种设置被称为1.7秒混响条件，代表了极端的混响水平（Bradley，2002年；Reinhart等人，2016年）。选择这种设置是为了最大化混响和非混响语音条件之间的可测量差异，并反映了儿童常用的体育馆和其他体育场所的声学特性（美国声学学会，2019年）。类似的混响时间也用于之前的儿童研究（Valente等人，2012年）。此外，还有21名正常听力的成年人在0.6秒混响条件下进行了测试，这更接近典型的教室声学环境（Bradley，2002年；丹麦建筑法规：Bygningsreglementet，2025年）。

**统计分析**
数据使用R（R Core Team，2024年）进行分析。数据经过正态性检查，并根据Field等人（2012年）的方法构建和报告了线性混合效应模型。使用方差分析进行了顺序模型比较，以评估每个预测变量和交互项对模型拟合的贡献。当正态性假设不成立时，进行了成对Wilcoxon符号秩检验，并对p值应用了Bonferroni校正。

**结果**
**辅助语音检测**
由于我们的设置中没有可用的参考等效阈值声压水平，因此从正常听力成人组测得的平均刻度阈值被从儿童的Ling阈值中减去。这些平均值的95%置信区间范围为1.65 dB HL（对于/a/）到2.29 dB HL（对于/s/）。成人的平均阈值在图2中以水平虚线显示。图2：按听力组分类的所有儿童的Ling声音阈值。误差条代表95%置信区间。0 dB HL的虚线表示正常听力成人组的参考阈值。y轴值被反转以便更好地可视化阈值，遵循标准听力图的惯例。CI表示人工耳蜗；HA表示助听器；NH表示正常听力。

平均而言，NH组儿童的Ling检测阈值在所有Ling声音上为1.7±4.7 dB HL，HA组儿童为17.0±5.8 dB HL，CI组儿童为19.1±5.1 dB HL。CI组中Ling声音/u/的检测阈值最高（平均为22.1±4.6 dB HL）。使用线性混合效应模型分析了Ling阈值，以参与者作为随机因素，听力类别（NH、HA或CI）作为固定因素。设置了两个对比：一个是比较NH组和HA组，另一个是比较CI组和HA组。第一个对比（NH与HA + CI）显著（β = 5.47，t(57) = 15.77，p < 0.001），证实听力损失儿童的阈值显著高于正常听力的同龄人。第二个对比（HA与CI）不显著（β = 1.02，t(57) = 1.70，p = 0.095），表明HA组和CI组之间的Ling阈值没有明显差异。听力设备的品牌对Ling音素的阈值没有显著影响（χ2(3) = 4.80, p = 0.187）。在模型构建过程中，当将Ling音素作为额外的固定因素加入时，出现了残差正态性问题。因此，对每个Ling音素和听力类别进行了成对的Wilcoxon符号秩检验，并对p值应用了Bonferroni校正。所有成对比较都显著，除了CI组和HA组之间的/m/、/u/、/?/和/s/音素的阈值（表1）。CI组的/m/、/u/和/i/的检测阈值通常高于HA组，CI组的这些阈值平均分别高5.8 dB HL、6.0 dB HL和4.0 dB HL。总之，仅在低频谱能量的音素上观察到CI组和HA组之间的显著差异。此外，两组听力损失（HA和CI）的Ling阈值都显著高于正常听力（NH）组，尽管所有组的平均值都在20 dB HL以内。表1：不同Ling音素和听力类别的成对Wilcoxon符号秩检验结果

研究还调查了听力损失程度与Ling音素阈值之间的关系。图3将未辅助的较好耳听力阈值（PTA）与Ling音素阈值（以dB HL为单位）进行了绘制。该分析仅适用于NH组和HA组。未辅助的较好耳PTA与Ling阈值之间的皮尔逊积矩相关性显示出了强烈的正相关（r = 0.85, p < 0.001），即使仅分析HA组时，这种相关性仍然显著（r = 0.46, p < 0.001），尽管强度较低。这表明听力损失较大的儿童在使用助听器时表现出相应的较高Ling阈值。此外，在50 dB SPL的语音输入水平下，助听言语可懂度指数（SII）得分与助听Ling音素检测阈值之间存在弱但显著的相关性（r = ?0.31, p < 0.001），表明较高的SII得分与较低的Ling音素检测得分相关。图3显示，听力损失程度较高的儿童表现出较高的助听Ling阈值。该图表包括了NH组和HA组的数据。Ling阈值是在助听条件下（使用他们的助听器）和未辅助条件下（对于NH组）测量的。

助听音素识别：NH组的所有儿童都能正确模仿Ling音素。在使用助听器的儿童中，大多数模仿也是正确的；然而，也观察到一些错误，20名参与者中有4名将/u/替换为/m/，1名将/u/替换为/m/，1名将/f/替换为/s/。同样，对于使用人工耳蜗（CI）的儿童，大多数模仿也是正确的，但20名参与者中有7名将/m/替换为/u/，1名将/u/替换为/m/，1名将/n/同时替换为/m/和/u/。这些结果表明，虽然所有组的音素识别总体上是准确的，但在CI儿童中，特别是/m/和/u/等低频声音之间的混淆更为普遍。

助听音素区分：图4的左侧显示了参与研究的所有正常听力（NH）成年人的音素区分任务结果。正确反应被转换为RAU分数（Studebaker 1985）。出于实际原因，成年参与者被分为两组：一组21名成年人在0、15分贝信噪比（SNR）和静音条件下进行测试，混响时间为0、0.6和1.7秒，语音水平为65 dB(A)；另一组21名成年人在5分贝信噪比和静音条件下进行测试，语音水平为55 dB(A)，混响时间为0和1.7秒。两组的结果在图4中合并以便于解释。图4显示了参与研究的成年人（左侧）和儿童（右侧）的音素区分结果，转换为RAU分数。不同的噪声条件以信噪比（0、5或15 dB SNR）或静音表示在x轴上，RAU分数在y轴上显示。听力类别NH、HA和CI（分别代表正常听力、助听器和人工耳蜗）用不同颜色表示，不同的混响时间（0、0.6或1.7秒）用不同符号表示。显示了平均值和95%置信区间。CI表示人工耳蜗；HA表示助听器；NH表示正常听力。

成年人在噪声比语音低15分贝（SNR 15 dB）或语音在静音中呈现时表现出较高的区分分数（平均RAU分数为94.0或更高），无论混响时间如何。然而，随着噪声的增加，表现下降。在无混响的SNR 0 dB条件下，RAU分数降至87.7 ± 9.3。当加入极端混响（1.7秒）时，RAU分数在5 dB SNR时降至77.2 ± 8.6，在0 dB SNR时降至60.8 ± 9.7。为了统计评估噪声和混响条件对RAU分数的交互作用，应用了线性混合效应模型。模型显示SNR条件（χ2(3) = 184.35, p < 0.001）、混响（χ2(2) = 96.88, p < 0.001）及其交互作用（χ2(5) = 47.54, p < 0.001）具有显著的主效应。基于这些结果，选择SNR 5 dB条件作为测试NH成年人的具有挑战性的但仍然可管理的条件。因此，选择了这一条件来测试本研究中的儿童。儿童的声音素区分结果显示在图4的右侧。在NH组中，RAU分数在静音和无混响条件下非常高，平均为107.3 ± 8.5。当引入噪声（SNR 5 dB）时，分数降至87.8 ± 13.2，而在静音中加入混响后进一步降至75.7 ± 13.5。当同时存在混响和噪声时，NH儿童的RAU分数显著降至61.2 ± 11.0。对于使用助听器的儿童，平均RAU分数在静音中为83.4 ± 14.9，在无噪声中为66.4 ± 15.0。在混响条件下，分数进一步降至39.8 ± 16.0（在静音中）和37.6 ± 14.0（在噪声中）。对于使用人工耳蜗的儿童，平均RAU分数在静音中为85.7 ± 9.6，在噪声中为69.4 ± 11.9，在无噪声的混响条件下为40.3 ± 13.3，在有噪声的混响条件下为32.6 ± 9.6。应用了线性混合效应模型来分析RAU分数，以参与者作为随机因素，听力类别（HA、CI或NH）、SNR条件、混响及其交互作用作为固定因素。模型还包括将NH组与听力损失组（HA和CI）进行比较的对比，以及HA组和CI组之间的直接比较。包括SNR条件（χ2(1) = 18.64, p < 0.001）、混响（χ2(1) = 288.29, p < 0.001）、听力类别（χ2(1) = 13.42, p < 0.001）及其交互作用（χ2(7) = 38.82, p < 0.001）后，模型显著改善。分析显示SNR条件（β = 17.62, t(178.96) = 10.53, p < 0.001）具有主效应，表明更好的SNR（和静音）提高了音素区分分数。混响（β = ?30.76, t(178.96) = ?18.39, p < 0.001）也具有主效应，表明混响显著降低了区分性能。NH组与听力损失组（HA和CI）之间的显著对比（β = ?6.65, t(147.40) = ?5.87, p < 0.001）证实了听力损失儿童的表现在NH儿童中明显较差。然而，HA组和CI组之间的对比不显著（β = 1.50, t(147.40) = 0.76, p = 0.448），表明两组在音素区分方面面临类似的困难。所有其他交互作用都不显著，除了SNR × 混响交互作用（β = ?9.57, t(179.09) = ?4.04, p < 0.001）。这一显著的交互作用表明，混响对音素区分的影响取决于SNR水平。具体来说，在比较有和没有背景噪声的混响条件下的RAU分数时，分数主要受混响的影响。相比之下，在无混响条件下比较有和没有噪声的分数时，噪声的影响明显可见。这种模式表明混响是影响性能的主要因素。因此，极端混响限制了性能，以至于噪声的额外影响减弱了。图5展示了每个参与者组和条件的混淆矩阵。对这些矩阵的视觉检查表明，HA组和CI组在所有测试条件下表现出相似的混淆模式。由于参与者需要从屏幕上显示的12个辅音选项中选择一个，并且没有选项表明他们无法区分辅音才能进行下一次试验，实验者在参与者无法做出决定时手动选择了/v/作为默认选项。这导致/v/的响应在混淆矩阵中过度代表，因此从图5中移除。图5中看到的相似模式表明，无论是否存在噪声或混响，两组使用听力设备的儿童在音素区分方面面临类似的挑战。

讨论：本研究考察了NH、HA和CI儿童在各种声学条件下的音素感知能力。所有使用听力设备的儿童都使用了具有个性化临床设置的双侧助听器或人工耳蜗。总体而言，使用听力设备的儿童（HA和CI）的表现不如NH组的儿童，检测阈值大约高15到17 dB，区分RAU分数低约21到36分。然而，所有三组的平均Ling音素检测阈值都在听力图上通常被认为是正常的范围内（即，在20 dB HL以内），适用于所有Ling音素。有趣的是，在所有测试中，HA组和CI组之间没有发现显著差异，除了/m/、/u/和/i/音素的检测阈值有轻微差异（约5 dB），这些音素在低频区域有主导的频谱峰值（Scollie等人，2012年）。对于/m/和/u/也观察到一些识别错误，CI组的儿童中发生的频率略高（20人中有7人），而HA组的儿童中较少（20人中有4人），而所有NH儿童正确识别了每个Ling音素。低频音素观察到的小差异可能与人工耳蜗电极阵列的插入深度有关，该阵列必须到达耳蜗的顶端才能充分刺激低频区域（Wolfe 2020年）。考虑到人工耳蜗系统的已知限制，这些结果相当令人鼓舞。与NH儿童不同，他们可以在广泛的声学动态范围内感知声音，而CI儿童必须依赖更窄的电气动态范围——通常只有10到25 dB。因此，可以预期CI儿童的助听检测阈值不会低于20到30 dB HL。这与人工耳蜗性能的既定临床预期和指南一致（Wolfe 2020年）。本研究观察到的Ling音检测阈值与Glista等人（2014年）和Scollie等人（2012年）的先前研究结果一致，这些研究涵盖了患有听力损失（NH）的成人和儿童以及使用助听器（HA）的群体。本研究中测量的患有NH和HA的儿童的平均检测阈值与早期研究报告中提到的数值非常接近。我们的结果还表明，当前的临床助听器设置——通常包括具有自动降噪和混响处理功能的通用程序——似乎不会干扰Ling音的检测。与Glista等人的研究结果一致，我们观察到未经辅助的听力损失程度与辅助后的Ling音检测阈值之间存在正相关（r = 0.46，p < 0.001，仅在HA组内），这可能反映了DSL v5.0适配公式（Scollie等人，2005年）的增益配置特性。进一步分析发现，Ling音检测阈值与辅助言语可懂度指数得分之间存在负相关（r = ?0.31，p < 0.001），这表明Ling音覆盖了言语理解所需的重要频率范围，而这些声音的更好辅助可听度有助于在较低输入水平下提高言语可懂度。本研究与Glista等人的一个显著区别在于，本研究中未经辅助的最佳耳侧听力阈值（PTA）为71分贝（HL），而Glista等人的研究为85分贝（HL）。这种差异可能反映了植入标准随时间的变化，因为本研究中没有排除任何儿童参与。与儿童相比，使用HA的成人在摩擦音Ling音/s/和/?/的测试中表现明显较差（Scollie等人，2012年；Glista等人，2014年）。此前有研究表明，这种差异可能是由于许多儿童使用了降频助听器（29例中有22例）。有趣的是，在本研究中，只有2名儿童使用了降频助听器（其中1例仅单侧使用），但结果仍然具有高度可比性。据我们所知，这是首次证明使用人工耳蜗（CI）的儿童在Ling音检测阈值测量方面的表现与使用HA的儿童相当的研究。在音素辨别方面，使用HA和CI的儿童在以下条件下的得分分别比听力正常的同龄人低23.9、21.4、35.9和23.6 RAU分：安静环境中的正常言语、嘈杂环境中的正常言语、安静环境中的混响言语以及嘈杂环境中的混响言语。这些结果表明，即使在没有额外噪声的情况下，混响也会显著影响两组使用听力辅助设备的儿童的表现。混淆矩阵也显示，使用HA和CI的儿童在所有测试条件下的混淆模式相似。尽管在某些条件下得分较低，并且需要实验者对任务进行解释，但实验者报告称儿童们觉得这项任务很有趣，并且乐于参与实验。Easwar等人（2024年）最近的一项研究调查了听力损失儿童的神经包络处理，其中也包括了在噪声和混响环境中的音素辨别任务。该研究涉及以英语为母语的儿童，他们要么患有听力损失，要么使用助听器，年龄略大于本研究的参与者（平均11岁和13岁）。与我们的发现一致，Easwar等人报告称，尽管有适当的放大效果，使用HA的儿童在辅音辨别准确性方面仍低于听力正常的同龄人。具体来说，使用HA的儿童与听力正常的儿童在安静环境中的RAU差异为16.2分，在噪声和/或混响条件下的差异超过20.5分。我们研究中观察到的更明显的混响效应可能归因于使用了更极端的混响时间（1.7秒），而Easwar等人的研究使用的是较为温和的教室环境混响时间（0.6秒）。另一种可能性是，我们的参与者在自由场环境中使用了自己的助听器，而不是直接音频输入，这使得当前的结果更能代表实际设备性能。本研究的优势在于它系统地检查了所有三组儿童（听力正常、使用HA和使用CI的儿童），并在受控的声学条件下（安静、噪声和混响）使用相同的刺激和任务。本研究的一个局限性是，尽管我们的目标是通过允许参与者使用自己的听力辅助设备来评估其在生态学上有效的条件下的表现，但任务本身是在受控的实验室环境中进行的。这可能会限制研究结果在现实世界听力环境中的普遍性。此外，我们在评估混响效应时没有使用载体句子。虽然载体句子可能更接近日常听力情境，但在混响条件下使用无意义词汇仍然是合理的，因为它可以隔离混响对音素级处理的特定影响。最后，尽管某些条件下的得分较低，并且需要实验者对任务进行解释，但实验者报告称儿童们觉得这项任务很有趣，并且乐于参与实验。Easwar等人（2024年）的研究还涉及了在噪声和混响环境中进行音素辨别任务。

热点排行