言语噪声环境中听觉反馈前预期性慢电位呈后部优势,但条件效应有限

《IBRO Neuroscience Reports》:Anticipatory slow potentials before auditory feedback show posterior predominance but limited condition effects in speech-in-noise

【字体: 时间:2026年06月03日 来源:IBRO Neuroscience Reports 2.9

编辑推荐:

  在嘈杂听觉条件下,反馈出现之前的预期性脑电图(electroencephalography, EEG)活动是否会被稳定调制,以及此类活动是否能够解释言语噪声识别(speech-in-noise)表现的个体间差异,仍不清楚。研究人员在一组独立的正常听力青年成人队

  
在嘈杂听觉条件下,反馈出现之前的预期性脑电图(electroencephalography, EEG)活动是否会被稳定调制,以及此类活动是否能够解释言语噪声识别(speech-in-noise)表现的个体间差异,仍不清楚。研究人员在一组独立的正常听力青年成人队列中检验了这些问题,采用时间估计任务,并在安静条件与连续多人谈话噪声(multi-talker noise)条件下呈现听觉反馈。刺激前负波(stimulus-preceding negativity, SPN)被量化为反馈起始前 ?200–0 ms 时间窗内的平均 EEG 波幅。主要分析采用感兴趣区(region of interest, ROI)× 半球线性混合效应模型(linear mixed-effects models, LMMs)。作为控制分析,还纳入了反应锁定的条件性负变异(contingent negative variation, CNV)分析。言语噪声表现以描述性方式汇总于 0、?5、?10 和 ?15 dB 信噪比(signal-to-noise ratio, SNR)下,脑-行为关联被视为探索性分析。主要 SPN 分析显示出明确的后部优势,即顶叶和枕叶区域的波幅较中央和额叶区域更为负向。然而,听觉条件主效应无统计学显著性,半球主效应及条件 × 半球交互作用亦均未达到显著。CNV 控制分析同样未显示可靠的条件效应。言语噪声表现随着 SNR 降低而单调下降,表明独立的行为学测试捕捉到了随声学难度增加而产生的预期效应。探索性分析未发现言语噪声表现与 SPN 或 CNV 指标之间存在稳健关联。这些发现表明,在当前任务参数和样本特征下,该任务能够诱发具有后部优势的预期性慢电位,但对于背景噪声可稳定调制此类电位的证据有限。
该文发表于《IBRO Neuroscience Reports》,围绕噪声环境下言语加工中的预期性神经活动展开,重点检验听觉反馈出现前的慢电位是否会因背景噪声而增强,以及这种神经指标能否解释个体在言语噪声识别能力上的差异。现实交流常发生于多人同时讲话的复杂环境中,听者不仅需要依赖自下而上的声学线索分离目标语流,还必须借助自上而下的信息整合语音、句法和语义线索,以克服噪声造成的频谱-时间信息重叠。预测编码(predictive coding)理论认为,大脑会基于内部模型对即将到来的感觉输入进行贝叶斯式推断,当外部输入偏离预期时,预测误差信号会在皮层层级中传播并更新内部模型。因此,在噪声中进行言语识别时,预期、注意分配、任务投入和聆听努力等过程都可能被加强。然而,噪声是否一定会增强反馈前的预期性脑电活动,以及这种活动是否与言语噪声能力直接相关,先前证据尚不稳定。研究人员此前曾报告背景噪声下刺激前负波增强,但该现象是否具有可重复性、是否足以解释行为差异,仍需在独立样本中以更保守的分析框架重新验证。

为解决上述问题,研究人员在一组与既往研究完全独立的青年正常听力样本中开展实验。研究限定受试者年龄为 18–23 岁,以减少年龄相关听觉差异的混杂影响。实验核心为时间估计范式:受试者在看到提示后主观估计 4 s,并按键作答;按键 2 s 后,系统通过正前方扬声器给出日语语音反馈,告知估计正确(“atari”)或错误(“hazure”)。研究设置安静与噪声两种听觉条件,其中噪声条件使用连续多人谈话噪声,由侧方扬声器持续播放,总体与目标反馈词构成 0 dB SNR。由于按键与反馈之间的时间间隔固定,该任务天然包含对反馈时序的预期;同时,受试者还会基于自己的反应表现对反馈内容形成预期。因此,本文将 SPN 视为一种预期性神经活动指标,而非纯粹的预测指标。

研究所用主要方法包括:招募独立青年正常听力样本并完成纯音听阈、听觉持续注意(auditory Continuous Performance Test, a-CPT)及利手评估;采用时间估计-听觉反馈任务,在安静和 0 dB SNR 连续多人谈话噪声条件下记录脑电图(EEG);以反馈前 ?200–0 ms 定义 SPN,并以反应前 ?0.5 至 ?0.1 s 定义反应锁定 CNV 作为控制指标;使用 EEGLAB、独立成分分析(independent component analysis, ICA)和 PREP 流程进行预处理;以非插值数据为主,采用 ROI × 半球线性混合效应模型(LMMs)进行推断;另使用独立的日语双音节词言语噪声测试,在 0、?5、?10、?15 dB SNR 下描述行为表现,并开展探索性脑-行为关联分析。最终主要 EEG 分析纳入 20 名受试者。

在结果部分,首先是“3.1. Sample retention and EEG quality control”。研究最初纳入 26 人,但有 6 人因有效试次数不足、导联放置程序偏差或坏导联过多而被排除,最终保留 20 人、74 个运行区块进入主要 EEG 分析。保留运行中平均坏导联数为 4.10 ± 1.89,占 19 导联系统的 21.6% ± 9.9%。这一部分说明研究人员对 EEG 数据质量采取了预设且较严格的控制标准,也解释了后续主要推断建立在非插值数据之上的原因。

“3.2. Primary SPN ROI × hemisphere analysis”是全文最关键的结果部分。线性混合效应模型显示,SPN 具有清晰的后部优势分布。相对于中央 ROI,额叶 ROI 的 SPN 更不负向,而顶叶和枕叶 ROI 的 SPN 则更负向,提示该预期性负波主要分布于后部头皮区域。然而,听觉条件主效应并不显著,即噪声与安静条件之间并未出现可靠的 SPN 振幅差异;半球主效应及条件 × 半球交互作用也均不显著。进一步纳入 Condition × ROI 的补充模型后,中央区条件效应仍不显著,额叶、枕叶和顶叶的交互项也均未达到显著。基于贝叶斯信息准则(Bayesian information criterion, BIC)的 Bayes 因子分析同样支持不包含条件相关项的简约模型。这些结果共同表明,该任务可靠诱发了 SPN,但背景噪声并未在群体水平上稳定增强该成分。

“3.3. Descriptive sensor-space localization of the SPN condition effect”进一步从传感器空间描述 SPN 的拓扑分布。无论在安静还是噪声条件下,SPN 头皮地形图均呈现广泛的后部负向分布,两种条件的空间形态总体相似。噪声减安静的差异图仅显示轻度中央趋势,但基于聚类置换(cluster-based permutation)的探索性分析未发现任何超阈值空间簇。ROI 波形图也显示,反馈前负向偏移在顶叶和枕叶更明显,而安静与噪声条件之间差异较小。此外,波形形态并未表现出非常典型、单调增强式的反馈前爬升趋势。由此可见,研究观察到的是一种可识别的预期性慢电位,而不是被噪声强烈放大的特异性效应。

“3.4. Response-locked CNV control analysis”用于检验任何潜在噪声效应是否只是更广义的准备状态改变。若噪声同时增强 SPN 和 CNV,则更可能反映普遍性的预备或注意状态上升。然而,CNV 分析结果与 SPN 一致:条件主效应不显著,半球主效应和交互作用同样不显著;仅额叶振幅较中央区更不负向。补充的 ROI 交互模型和 Bayes 因子分析也均未支持条件相关效应。该控制分析增强了全文结论的稳健性,即当前数据并不支持噪声会系统性增强反馈锁定或反应锁定的预期性负波。

“3.5. Speech-in-noise performance and exploratory brain–behavior analyses”则聚焦行为结果及其与 EEG 指标的关系。独立言语噪声测试显示,随着 SNR 从 0 dB 下降至 ?15 dB,识别正确率持续降低,说明该行为学任务成功操纵了声学难度。但需注意,EEG 实验中的噪声条件仅为 0 dB SNR,而在这一水平上,青年正常听力样本的识别表现接近天花板,个体间变异有限。在这一前提下,研究人员将脑-行为关联仅视为探索性。结果未发现言语噪声正确率与 SPN 或 CNV 存在稳健关联,因此不能据此支持“更大的预期性慢电位意味着更好的噪声中言语识别”这一推论。

讨论部分的核心在于:本研究以更独立、更保守的方法框架,重新评估了噪声环境中反馈前预期性慢电位的可重复性。与先前研究相比,本研究未再现明确的噪声增强效应,却稳定观察到后部优势分布。研究人员据此认为,应谨慎将该类慢电位直接解释为噪声驱动的预测加工增强信号。因为在当前范式下,SPN 可能同时受到时间预期、反馈内容预期、注意分配、聆听努力和任务准备等多种因素影响,难以从中分离出纯粹的预测成分。CNV 未见条件效应,也支持“当前任务中的预期性慢电位虽存在,但其受听觉情境调制并不稳健”的解释。文章还指出,0.5 Hz 高通滤波可能削弱慢电位振幅并改变其形态;最终样本量为 20 人,可能不足以检测较小效应;样本仅限青年正常听力者,也限制了对老年人或听力受损群体的外推;19 导低密度 EEG 蒙太奇限制了空间分辨率;此外,时间估计范式同时混合了时间预测与内容预测,不利于区分不同预测机制。

研究结论部分可译为:本研究表明,时间估计任务能够在听觉反馈出现之前诱发清晰的、以后部头皮分布为特征的预期性慢电位。然而,在这一独立样本以及保守的非插值分析框架下,无论是刺激前负波(SPN)还是反应锁定的条件性负变异(CNV),均未显示出由听觉条件引起的可靠调制。言语噪声表现虽然如预期般依赖于信噪比(SNR),但并未与这些预期性 EEG 指标呈现稳健关联。这些结果提示,在解释噪声听觉条件下的预期性慢电位时需要保持谨慎。更具体地说,这些慢电位似乎反映了由任务诱发的预期性神经活动,但其受背景噪声调制的程度及其与行为表现的关系,均应谨慎解读。上述结果并不意味着背景噪声不能调制预期性慢电位,而是说明在本研究条件下——包括较小的最终样本量、青年正常听力受试者以及 0 dB SNR 下接近天花板的识别表现——此类调制未被稳健检出。
相关新闻
生物通微信公众号
微信
新浪微博
  • 搜索
  • 国际
  • 国内
  • 人物
  • 产业
  • 热点
  • 科普

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号