《Frontiers in Aging Neuroscience》:Neural frequency-tagging of syllables in naturalistic speech is sensitive to background noise and age-related hearing loss
编辑推荐:
摘要:
引言:健康老龄化通常伴随听觉敏感性下降,以及在安静和噪声环境中言语理解能力的减弱。从生理学角度看,神经振荡被认为在将语音信号解析为有意义单元,并在多个层级提取语言学相关信息方面具有基础性作用。鉴于音节是语音信号的重要结构单元,以准节律性周期反复出现
摘要:
引言:健康老龄化通常伴随听觉敏感性下降,以及在安静和噪声环境中言语理解能力的减弱。从生理学角度看,神经振荡被认为在将语音信号解析为有意义单元,并在多个层级提取语言学相关信息方面具有基础性作用。鉴于音节是语音信号的重要结构单元,以准节律性周期反复出现,并牢固锚定于声学包络(acoustic envelope)的慢速振幅调制之中,研究人员利用频率标记(frequency-tagging)方法考察纯音听力损失和背景噪声对神经层面音节表征的影响。
方法:研究人员采用脑电图(electroencephalography, EEG),比较两组老年受试者在与音节语速相对应的窄频带范围内的峰值振幅:听力正常组(N=44)与轻至中度年龄相关性听力损失组(N=38)。实验中,参与者聆听自然句子,句子在安静条件下呈现,或嵌入多人说话者嘈杂噪声(multi-talker babble noise)中呈现。
结果:行为学指标证实,多人说话者嘈杂噪声条件的任务要求更高;听力损失总体上与言语可辨识度降低相关,但并未导致理解能力下降。值得注意的是,背景噪声和听力损失的影响在皮层水平上也得到了清晰表征,且二者呈现相似的神经反应特性。事实上,无论是声学上受损还是生理上受损的语音信号,均表现为更弱的音节神经表征。
讨论:上述结果为不利聆听条件下以及纯音听力损失个体中音节表征减弱提供了神经生理学证据,表明二者存在相似但性质不同的神经衰减模式。
本文发表于《Frontiers in Aging Neuroscience》,聚焦老龄化背景下语音加工的一个关键问题:年龄相关性听力损失如何影响大脑对自然语音中音节信息的编码。研究背景在于,健康老龄化常伴随纯音听阈升高,并进一步损害安静及噪声环境中的言语感知。既有研究表明,音节在语音中以约4–8 Hz的准节律形式重复出现,其节律特征与语音包络中的慢速振幅起伏紧密对应,因此音节解析被认为是连接低级声学处理与高级语言理解的核心环节。另一方面,以往关于听力损失与语音神经追踪(neural speech tracking)的研究,多基于脑电信号与语音包络之间的时间序列相关性,虽然提示听力损失个体可能表现出增强的包络追踪,但这类指标更接近句子整体层面的时间锁定,尚不足以直接刻画音节层级的神经表征强度。与此同时,背景噪声会通过声学掩蔽、信息干扰以及注意资源占用等机制削弱语音加工,因此有必要采用更聚焦于音节节律的神经指标,分别检验听力损失与噪声对音节表征的影响。
基于此,研究人员采用频率标记(frequency-tagging)范式,考察在自然句子聆听过程中,与音节速率相对应的窄频带脑电反应是否会受到背景噪声和纯音听力损失影响。研究对象为82名老年人,分为听力在正常范围组与轻至中度听力损失组,两组在年龄、流体智力、晶体智力、加工速度和工作记忆方面无显著差异。研究结果显示,多人说话者嘈杂噪声降低了言语可辨识度与言语理解表现;听力损失则总体降低了言语可辨识度,但未显著影响句子理解。更重要的是,在神经层面,背景噪声与听力损失均与更弱的音节表征相关,表现为与音节频率范围对应的脑电谱峰振幅减小。研究据此提出,声学退化与生理性听觉退化都会削弱皮层对音节节律的编码,提示两类不利听觉条件在神经层面具有共同的衰减效应。该研究的重要意义在于,它以更直接的频域指标补充了听力损失研究领域关于语音加工的证据链,推进了对老年听力受损个体自然语音编码机制的理解。
方法概括:研究样本来自研究团队先前建立的老年受试者队列,最终纳入听力正常组44人和无耳鸣但有听力损失组38人。研究人员实施纯音测听(PTA)、认知测评、行为学可辨识度与理解任务,并在安静与多人说话者嘈杂噪声两种条件下记录128导脑电图(EEG)。将句子音节速率估计为4–5.6 Hz后,对脑电信号进行相应窄频带滤波、快速傅里叶变换(FFT),提取前部、中央、后部及左右/中线电极簇在音节频率范围内的峰值功率,并通过重复测量方差分析和相关分析评估组别与条件效应。
以下为论文主体结果与解读。
3.1 年龄、听力测量与认知能力
研究首先验证了分组的有效性。纯音平均听阈(pure-tone average, PTA)显示,听力正常组的听力显著优于听力损失组,而两组在年龄及KAI、MWT-B、ZST和工作记忆测验上均无显著差异。这一结果说明,后续脑电与行为差异不太可能由一般认知能力或年龄差异所驱动,从而增强了对听力状态本身效应的解释力度。
3.2 行为学数据
研究人员分别评估了言语可辨识度与言语理解。结果显示,所有行为指标均显著高于机会水平,说明两组受试者均能够完成任务。可辨识度任务中,条件主效应和组别主效应均显著:安静条件优于多人说话者嘈杂噪声条件,且听力正常组整体优于听力损失组,但二者不存在显著交互作用。这表明噪声普遍降低了可辨识度,而轻至中度听力损失也独立带来总体性不利影响。理解任务中,仅条件主效应显著,即安静条件下的理解成绩高于噪声条件,而组别效应和交互作用均不显著。由此可见,听力损失对较低层级的言语辨识影响更直接,而对较高层级的句子理解未必产生同步损害。
3.3 电生理数据
在与音节速率相对应的4–5.6 Hz范围内,窄频带峰值振幅分析显示显著的前后分布主效应、左右侧化主效应,以及多个与条件和组别相关的拓扑交互效应。总体而言,中央区域较前部和后部显示更强功率,中线电极较左右侧电极显示更大振幅,这与音节表征在中央、中线区域较为突出的既往研究相一致。
就条件效应而言,条件×前后分布交互表明,安静条件在中央电极处的功率高于多人说话者嘈杂噪声条件;进一步分析显示,这种差异在Cz电极最为显著。该结果说明,背景噪声会削弱与音节节律同步的神经反应,提示噪声环境下皮层对音节信息的编码效率下降。
就组别效应而言,组别×前后分布和组别×侧化交互显示,听力正常组在前部及右侧电极上的功率高于听力损失组,而中央与后部区域的组间差异不明显。研究据此认为,听力损失与较弱的音节神经表征相关,但这种差异并非全头皮均匀出现,而具有特定拓扑分布。也就是说,听力损失不仅影响语音输入的外周质量,还会在皮层层面体现为音节节律编码强度减弱。
3.4 相关分析
相关分析显示,在全样本中,PTA与安静条件下的可辨识度呈显著负相关,即听阈越差,可辨识度越低。但PTA与噪声条件下的可辨识度、与两种条件下的理解成绩之间均无显著相关。进一步地,中央、中线及Cz处的脑电指标与行为学表现之间未发现显著相关;分组后在前部和右侧电极进行的组内相关分析也均未显著。这提示本研究提取的频率标记脑电反应,可能更多反映较早期、较自动化的听觉编码过程,而行为任务还涉及词汇提取、决策、工作记忆与反应选择等更高层过程,因此二者不一定呈简单线性对应。
讨论部分指出,本研究最核心的发现是:背景噪声与年龄相关性听力损失均会削弱自然语音中音节的神经表征,且这种削弱在行为与神经两个层面具有一定一致性,但在头皮分布上又呈现差异。对背景噪声而言,其负面影响可能来自声学掩蔽、神经同步受扰、注意分配受限以及语言竞争等多种机制;在本研究中,由于观察到的是脑电振幅下降,因此研究人员认为干扰效应和声学因素更可能是主要来源。对听力损失而言,频率标记结果与部分既往神经语音追踪研究中“听力损失者包络追踪增强”的现象并不矛盾,因为二者反映的是不同层级的神经过程:前者更聚焦于音节层面的表征强度,后者更强调整句层面的时间锁定关系。研究据此提出,听力损失个体可能在感觉层面表现出较弱的音节编码,但可在更高层句子加工中借助认知补偿维持理解表现,这也与本研究中“可辨识度下降而理解未受损”的行为模式相呼应。
论文也明确讨论了研究局限。其一,背景噪声由同一说话者的多句语音叠加而成,有助于控制声学和说话者特征,但与现实中多说话者竞争场景仍有差距。其二,4–5.6 Hz频段的神经反应虽与音节速率相对应,但不能完全排除其部分来源于较低层级的包络调制响应,因此更稳妥的解释是,这一频段活动反映了声学与语言学过程的相互作用。其三,研究仅纳入老年样本,无法进一步分离老龄化本身与听力损失对拓扑分布差异的相对贡献。
研究结论部分可译为:
研究人员采用频率标记(frequency-tagging)方法,利用安静条件或嵌入多人说话者背景噪声中的句子所具有的准周期性音节节律,从两组有无纯音听力损失的老年个体中提取了音节表征特异性的神经活动。可辨识度和理解指标共同证实,在噪声中感知语音比在无干扰信号时加工语音要求更高。此外,NTHL组在安静与背景噪声条件下聆听语音时总体表现出较低的可辨识度。重要的是,脑电图(EEG)数据也清楚表明,多人说话者嘈杂噪声和听力损失均与较弱的神经音节表征相关,这提示声学退化和生理性退化的语音信号可能具有共同的神经机制。另一方面,神经频率标记指标与行为表现之间缺乏显著相关,说明本研究观察到的神经效应未必能够直接映射到所采用的行为指标之上。一种可能解释是,这里所测得的神经反应更可能反映听觉编码中相对早期且自动化的阶段,而言语可辨识度与理解行为还依赖词汇提取、决策、工作记忆和反应选择等更高层级过程。这些后期过程可能引入额外变异,从而削弱直接的脑—行为关系。并且,在较有利聆听条件下行为表现的个体差异有限,也可能进一步降低相关分析的敏感性。因此,尽管本研究神经结果在群体水平上显示出对聆听条件和听力状态的调节作用,但其与外显行为之间的功能联系仍需谨慎解释。总体而言,这些结果有助于更好理解听力损失如何影响自然语音中音节信息的编码,并为今后探讨听力损失、言语可辨识度与言语理解之间的相互关系奠定了基础。