说英语的美国儿童和成人表现出一种“喜怒交织”的声音象征效应，这种效应将元音发音与情感价值联系在一起

《Cognitive Science》：U.S. English-Speaking Children and Adults Exhibit a “Gleam-Glum” Sound Symbolic Effect Linking Phonemic Vowel Sounds With Emotional Valence

【字体：大中小】 时间：2026年05月01日 来源：Cognitive Science 2.4

编辑推荐：

　　摘要我们测试了一种最近发现的声音象征效应——即“gleam-glum效应”，这种效应表明含有[i]音素的单词（如“gleam”）在情感上被认为比含有[?]音素的匹配单词（如“glum”）更为积极。我们扩展了先前的研究，并通过一种新颖的在线伪词与场景匹配任务验证了这一效应，测试

　　摘要

我们测试了一种最近发现的声音象征效应——即“gleam-glum效应”，这种效应表明含有[i]音素的单词（如“gleam”）在情感上被认为比含有[?]音素的匹配单词（如“glum”）更为积极。我们扩展了先前的研究，并通过一种新颖的在线伪词与场景匹配任务验证了这一效应，测试了说英语的成年人（n = 105）和5至7岁的儿童（n = 52）。参与者听到了成对的[i]音素与[?]音素的单音节伪词（例如，“zeem”与“zum”），并将它们与表现出不同情感价值的卡通场景相匹配。这些结果提供了首个实证证据，证明“gleam-glum效应”在儿童和成人中都普遍存在，不过在儿童中的效应强度略低于成人。我们的发现证实，“gleam-glum效应”在很小的年龄阶段就已经很强，并且有望成为语言理解、语言使用和语言学习的重要机制。

1 引言

有效使用和学习口语需要解码单词的含义。多种因素可以帮助听者识别正确的单词与世界的映射关系，包括联想性（Benitez & Saffran, 2018; Suanda, Mugwanya, & Namy, 2014; Yu & Smith, 2007）、社会性（Baldwin, 1993; Bloom, 2000; Tomasello, 1992）和句法性（Fisher, Gertner, Scott, & Yuan, 2010; Gleitman, 1990）线索。在这里，我们研究了一种可能帮助成人和儿童听者识别单词与含义映射关系的线索——即音素能够传达情感价值。

1.1 声音象征

与传统观点认为单词与含义的映射是任意的观点相反（de Saussure, 1916），实际上音素与其含义之间存在一些非任意的关联，这种现象被称为声音象征（例如，Blasi, Wichmann, Hammarstr?m, Stadler, & Christiansen, 2016; Lockwood & Dingemanse, 2015; Sidhu & Pexman, 2018）。例如，在许多自然口语中，特定的音素与形状（Blasi et al., 2016）、大小（Blasi et al., 2016; Winter & Perlman, 2021）、接近性（Johansson & Zlatev, 2013; Rabaglia, Maglio, Krehm, Seok, & Trope, 2016）和质地（Winter, Sóskuthy, Perlman, & Dingemanse, 2022）有关联。此外，具象词（即那些在某种程度上与其含义相似的词）在针对婴儿的语言中更早被习得，并且出现得更频繁（例如，Asano et al., 2015; Jo & Ko, 2018; Sidhu, Williamson, Slavova, & Pexman, 2022），这支持了具象性可能有助于早期词汇学习（例如，Imai & Kita, 2014; Laing, 2019; Monaghan, Shillcock, Christiansen, & Kirby, 2014; Nielsen & Dingemanse, 2021; Perry, Custode, Fasano, Gonzalez, & Savy, 2021; Perry, Perlman, & Lupyan, 2015; Thompson, Vinson, Woll, & Vigliocco, 2012）。此外，新词中的音素可能会影响学习者对所指对象的选择（Imai et al., 2015; Kantartzis, Imai, & Kita, 2011; Lupyan & Casasanto, 2015; Monaghan, Christiansen, & Fitneva, 2011; Yoshida, 2012）。例如，成人、儿童和婴儿通常会将新词“bouba”与圆形物体联系起来，将“kiki”与尖锐物体联系起来，这种现象被称为“bouba-kiki效应”（例如，Fort et al., 2018; Maurer, Pathman, & Mondloch, 2006）。研究表明，这种效应在3至7岁的儿童中随着年龄的增长而增强（Tzeng, Nygaard, & Namy, 2017）。这些经典的声音象征类型挑战了单词与含义之间任意联系的传统观点。至关重要的是，有效使用口语和习得口语都可能受益于声音象征的存在（Lockwood & Dingemase, 2015）。到目前为止，关于声音象征的研究主要集中在识别单词声音与其含义的感知属性（如形状、大小和质地）之间的联系上。然而，有证据表明声音象征效应可能扩展到超出所指对象物理特征的更多含义。在当前的研究中，我们通过使用一种新颖的方法论，对说英语的成年人和5至7岁的儿童进行了测试，提供了新的证据，支持情感也可以作为一种广泛的声音象征形式。

1.2 情感声音象征

情感被认为是组织世界意义及其相关词汇的关键维度（Vigliocco, Meteyard, Andrews, & Kousta, 2009）。语言与情感紧密相连，语言的许多方面被认为能够传达情感特征（Majid, 2012）。例如，Warriner, Kuperman, 和 Brysbaert (2013) 发现人们可以对大量单词进行价值、唤醒度和支配性的评分，其中前两个特征是情感的主要类别。这些情感的关键特征可能是人类和非人类物种共同经历的一部分（Darwin, 1872; Paul, Sher, Tamietto, Winkielman, & Mendl, 2020），并且根据某些观点，人类情感与语言共同进化，使得情感表达能够促进更复杂的交流形式，为语言的起源和进化铺平了道路（例如，Filippi, 2020; Jablonka, Ginsburg, & Dor, 2012）。鉴于语言与情感之间的联系，理解单词是否以及如何传达情感信息对于理解声音象征如何成为语言理解、语言使用和语言学习的基础至关重要，甚至可能对人类交流的进化也有影响。越来越多的研究开始提供情感声音象征的证据，特别是关注单个音素本身如何系统地传达价值信息，如积极或消极的情感（例如，Adelman, Estes, & Cossu, 2018; Aryani, Conrad, Schmidtke, & Jacobs, 2018; Conrad, Ullrich, Schmidtke, & Kotz, 2022; Garrido & Godinho, 2021; Kambara & Umemura, 2021; Rummer & Schweppe, 2019; Rummer, Schweppe, Schlegelmilch, & Grice, 2014; Yu, McBeath, & Glenberg, 2021a, 2021b）。研究发现，许多语言中的单词音素都携带了价值信息（Adelman et al., 2018）。此外，伪词中的特定音素似乎会促使成年人将单词评为具有积极或消极的价值（例如，K?rner & Rummer, 2022; Rummer & Schweppe, 2019; Rummer et al., 2014; Schmidtke, K?rner, Glim, & Rummer, 2025; Yu et al., 2021a）。

1.3 “gleam-glum效应”

一个显著的情感声音象征例子是“gleam-glum效应”，该效应认为含有[i]音素的单词在情感上更为积极，而含有[?]音素的单词在情感上更为消极（参见Yu et al., 2021a, 2021b）。最初，“gleam-glum”区分是基于对不同音素感知相似性的多维尺度分析得出的。研究发现[i]和[?]是英语中最不相似的元音音素之一，在音色亮度和频谱中心点上处于两个极端（Patten, McBeath, & Baxter, 2019; Patten & McBeath, 2020, 2025）。这两个音素在感知相似性映射中的距离也与[i]和[?]在声音产生的前两个共振峰和口面部肌肉模型中的对立配置相匹配（Yu et al., 2021b）。此外，说英语的参与者认为[i]音素的音高最高，[?]音素的音高最低，无论是在感知上还是在说话和唱歌时（Patten & McBeath, 2020, 2025）。进一步的研究发现，较高的音高与积极的价值相关，而较低的音高与消极的价值相关（例如，Barber & Reimer, 2021; Kamilo?lu, Fischer, & Sauter, 2020）。最后，[i]音素是用微笑时的口面部肌肉产生的，而[?]音素是用类似皱眉或苦脸的肌肉产生的。这些研究表明，从3岁到7岁的儿童，这种效应会随着年龄的增长而增强（Tzeng, Nygaard, & Namy, 2017）。这些经典的声音象征类型挑战了单词与含义之间任意联系的传统观点。至关重要的是，有效使用口语和习得口语都可能受益于声音象征的存在（Lockwood & Dingemase, 2015）。迄今为止，评估声音象征的研究主要集中在识别单词声音与其含义的感知属性（如形状、大小和质地）之间的联系上。然而，有证据表明声音象征效应可能扩展到超出所指对象物理特征的更多含义。在当前的研究中，我们提供了新的证据，支持情感也可以作为一种广泛的声音象征形式，通过测试“gleam-glum效应”来验证这一点，使用了针对说英语的成年人和5至7岁儿童的新方法论。

1.4 情感声音象征

情感被认为是组织世界意义及其相关词汇的关键维度（Vigliocco, Meteyard, Andrews, & Kousta, 2009）。语言与情感紧密相连，语言的许多方面被认为能够传达情感特征（Majid, 2012）。例如，Warriner, Kuperman, 和 Brysbaert (2013) 发现人们可以对大量单词进行价值、唤醒度和支配性的评分，其中前两个特征是情感的主要类别。这些情感的关键特征可能是人类和非人类物种共同经历的一部分（Darwin, 1872; Paul, Sher, Tamietto, Winkielman, & Mendl, 2020），并且根据某些观点，人类情感与语言共同进化，使得情感表达能够促进更复杂的交流形式，为语言的起源和进化铺平了道路（例如，Filippi, 2020; Jablonka, Ginsburg, & Dor, 2012）。鉴于语言与情感之间的联系，理解单词是否以及如何传达情感信息可能对于理解声音象征如何成为语言理解、语言使用和语言学习的基础至关重要，甚至可能对人类交流的进化也有影响。越来越多的研究开始提供情感声音象征的证据，特别是关注单个音素本身如何系统地传达价值信息，如积极或消极的情感（例如，Adelman, Estes, & Cossu, 2018; Aryani, Conrad, Schmidtke, & Jacobs, 2018; Conrad, Ullrich, Schmidtke, & Kotz, 2022; Garrido & Godinho, 2021; Kambara & Umemura, 2021; Rummer & Schweppe, 2019; Rummer, Schweppe, Schlegelmilch, & Grice, 2014; Yu, McBeath, & Glenberg, 2021a, 2021b）。研究发现，许多语言中的单词音素都携带了价值信息（Adelman et al., 2018）。此外，伪词中的特定音素似乎会促使成年人将单词评为具有积极或消极的价值（例如，K?rner & Rummer, 2022; Rummer & Schweppe, 2019; Rummer et al., 2014; Schmidtke, K?rner, Glim, & Rummer, 2025; Yu et al., 2021a）。

1.3 “gleam-glum效应”

一个显著的情感声音象征例子是“gleam-glum效应”，该效应认为含有[i]音素的单词在情感上更为积极，而含有[?]音素的单词在情感上更为消极（参见Yu et al., 2021a, 2021b）。最初，“gleam-glum”区分是基于对不同音素的感知相似性判断的多维尺度分析得出的。研究发现[i]和[?]是英语中最不相似的元音音素之一，在音色亮度和频谱中心点上处于两个极端（Patten, McBeath, & Baxter, 2019; Patten & McBeath, 2020, 2025）。这两个音素在感知相似性映射中的距离也与[i]和[?]在声音产生的前两个共振峰和口面部肌肉模型中的对立配置相匹配（Yu et al., 2021b）。此外，说英语的参与者认为[i]音素的音高最高，[?]音素的音高最低，无论是在感知上还是在说话和唱歌时（Patten & McBeath, 2020, 2025）。进一步的研究发现，较高的音高与积极的价值相关，而较低的音高与消极的价值相关（例如，Barber & Reimer, 2021; Kamilo?lu, Fischer, & Sauter, 2020）。最后，[i]音素是用微笑时的口面部肌肉产生的，而[?]音素是用类似皱眉或苦脸的肌肉产生的。这些研究表明[i]和[?]在生产和感知上处于多个相互关联的维度上的对立极端。重要的是，这些区别可能与情感表达有关，使得英语中的“gleam-glum”二分法成为一种有希望的情感声音象征效应的候选者，其中[i]音素表示更积极的价值，[?]音素表示更消极的价值（Yu et al., 2021b）。首次对成人进行的“gleam-glum效应”实证测试提供了支持该效应的证据。结果证实，成年人认为含有[i]音素的真实英语单词（如“peace”）在情感上更为积极，而含有[?]音素的匹配单词（如“pus”）在情感上更为消极（Yu et al., 2021a）。在所有包含[i]和[?]的英语单音节单词对中，有63%表现出这种效应，效应大小显著（Cohen's d > 1）。此外，说普通话的成年人也对普通话单词对进行了类似的测试，结果同样显示了“gleam-glum效应”的稳健性（Yu et al., 2021a）。进一步的研究通过添加中性控制词对“gleam-glum效应”的稳健性进行了验证。Yu et al. (2021b) 让成年人对包含相同起始和结束辅音音素但每个单词包含从[i]到[?]的感知相似性元音连续体中的中间元音音素的匹配单音节单词对进行情感价值评分。这些单词包括[i]（如“deal”）、[I]（如“dill”）、[?]（如“doll”）和[?]（如“dull”）。研究发现，含有[i]音素的单词被评为最积极的，[?]音素的单词被评为最消极的，[I]和[?]介于两者之间，且在统计上没有显著差异。这些发现证实[i]和[?]音素分别被解释为比其他更中性的英语对照音素更具积极性和消极性。

1.4 本研究

综上所述，“gleam-glum效应”支持声音象征可以超越所指对象的物理属性，延伸到单词的情感成分，从而提示听者理解单词的价值。然而，音素与情感价值之间的联系在儿童中尚未被测试。这在文献中是一个关键空白，原因有几个。首先，了解情感声音象征在发展过程中的模式可以提供关于驱动声音象征效应的机制的见解（例如，Imai & Kita, 2014; Sidhu & Pexman, 2018; Tzeng, Nygaard, & Namy, 2017）。此外，这种理解有助于澄清情感声音象征在语言学习、语言发展和语言使用中的影响（例如，K?rner & Rummer, 2022; Nielsen & Dingemanse, 2021）。此外，尽管语言与情感之间有很强的联系，但在早期发展中这两个领域大多被分开研究，只有少数例外（例如，Bloom & Beckwith, 1989; Nencheva, Tamir, & Lew-Williams, 2023）。确定儿童是否表现出将语言和情感信息联系起来的偏见有助于更全面地理解早期儿童时期情感与语言之间的相互作用。最后，声音象征被认为是早期语言学习的关键（参见Nielsen & Dingemanse, 2021的综述）。声音象征的自我强化假设（Imai & Kita, 2014）认为，多感官整合（例如，将单词的声音与其含义的感官运动特征映射）在听到新单词时缩小了场景中候选对象的范围，从而在模糊的学习环境中支持词汇学习，尽管这种自我强化效应的范围仍在评估中（即Nielsen & Dingemanse, 2021）。如果儿童中也存在“gleam-glum效应”，那么这将为进一步测试这种对声音-情感关联的敏感性是否以及如何在早期语言学习中起作用提供一个重要的初步步骤。相反，如果儿童中的“gleam-glum效应”较弱或不存在，这将表明这种效应可能需要长期的语言经验，并可能在早期语言学习中起次要作用。本研究的首要目标是开发一种新颖且适合儿童的方法论，以便我们能够在成人和儿童中测试“gleam-glum效应”。这也将是首次在儿童中测试“gleam-glum效应”。第二个目标是比较儿童和成人之间的“gleam-glum效应”，因为这可以进一步了解该效应背后的机制如何随发展而变化。一种可能性是，这种声音象征效应在成人中更为稳健，而在儿童中则不然：例如，现有的英语词汇主要遵循“gleam-glum效应”的规则（Yu et al., 2021a），并且长期的语言经验在这项研究中，我们首次测试了5至7岁英语儿童的“gleam-glum效应”（即对明亮和阴郁情绪的感知差异），并使用一种新颖的在线伪词-场景匹配任务将这一效应与英语大学生进行了比较。我们选择5至7岁的儿童作为首次测试对象，原因有几点：首先，这个年龄段的儿童能够处理复杂场景的情绪价值（Theurel等人，2016年），这是完成我们的伪词-场景匹配任务所必需的；其次，尽管这个年龄段的儿童在语言和情绪理解及表达能力上已经发展得相当成熟，但他们仍在词汇学习（Bloom，2000年）和情绪处理能力（Declercq、Marlé和Pochon，2019年；Pons、Harris和De Rosnay，2004年）方面持续进步。在这一年龄段发现这种效应，是确定幼儿是否通过声音符号来理解、使用和学习语言的重要第一步，也为在更小的年龄阶段测试这一效应提供了依据。

**2 方法**

该研究已在Open Science Framework（OSF）上预先注册（儿童组：https://doi.org/10.17605/OSF.IO/TU7J3；成人组：https://doi.org/10.17605/OSF.IO/AZQXU）。儿童和成人都完成了一个伪词-场景匹配任务，在每次试验中，会并排展示两个卡通场景。这两个场景展示的是同一个卡通角色，但在情绪价值上有所不同（一个积极，另一个消极）。随后，参与者会听到两个新奇的伪词，这两个伪词仅在不同元音音素上有所区别，一个包含[i]音素，另一个包含[?]音素。参与者需要将其中一个伪词所指的对象与他们选择的场景对应起来。

**2.1 参与者**

**2.1.1 儿童**

参与研究的儿童年龄在5至7岁之间（n = 52，平均年龄=6.45岁，年龄范围：5.08–7.75岁，其中27名为女性，25名为男性），他们来自菲尼克斯大都会地区以及通过网络招募。本地招募通过在幼儿园和菲尼克斯儿童博物馆分发传单来实现；在线招募则通过各种社交媒体的帖子进行。儿童参与者主要来自菲尼克斯大都会地区（n = 29人），也有来自亚利桑那州其他地区（n = 3人）和美国其他州（n = 17人）的参与者，其中3人的地理位置信息缺失。父母和他们的孩子通过预定的Zoom会议在线参与研究。研究结束后，父母为孩子填写了人口统计和语言问卷（见表1）。

| 儿童 | 成人 |
|------|------|
| 年龄 | |
| 平均值（标准差）| 19.18（1.41） |
| 年龄范围 | 5–7.75 | 18–25 |
| 性别（%） | 女性 | 27（51.9%） |
| | 男性 | 39（37.1%） |
| 语言（%） | 仅说英语 | 40（76.9%） |
| | 说英语和其他语言 | 10（19.2%） |
| | | 40（38.1%） |
| 种族/民族（%） | 白人 | 26（50.0%） |
| | 美洲原住民或阿拉斯加原住民 | 0（0.0%） |
| | 黑人或非裔美国人 | 0（0.0%） |
| | 亚裔 | 8（7.6%） |
| | 西班牙裔或拉丁裔 | 5（4.8%） |
| | 多重种族 | 12（11.4%） |
| | 其他 | 1（1.9%） |
| | 3（2.9%） |
| 父母教育水平（%） | 高中毕业 | 0（0.0%） |
| | 高中/同等教育水平 | 0（0.0%） |
| | 大专或同等学历 | 6（11.5%） |
| | 本科学位 | 20（38.5%） |
| | 硕士或博士学位 | 27（25.7%） |
| | 高等教育（硕士或博士） | 26（50.0%） |
| 总人数 | 52 | 105 |

**注：**
- 对于“年龄”：每个单元格表示每个年龄组的平均年龄（括号内为标准差）；
- 对于“年龄范围”：每个单元格表示每个年龄组的最低和最高年龄；
- 对于“性别”、“语言”、“种族/民族”和“父母教育水平”：每个单元格表示每个年龄组的参与者人数（括号内为百分比）；
- 对于“语言”：儿童组有2%的数据缺失；
- 排除了那些父母报告有发育障碍（n = 3）或未能完成任务（n = 3）的儿童的数据。
- 同意程序遵循亚利桑那州立大学（ASU）机构审查委员会（IRB）的规定。7岁以下的儿童还需口头同意，7岁及以上的儿童还需书面同意；
- 参与的家庭会收到一张10美元的电子礼品卡和一本电子涂色书作为奖励。

**2.1.2 成人**

参与研究的英语大学生（n = 105，平均年龄=19.18岁，年龄范围：18–25岁，其中39名为女性，66名为男性）来自ASU心理学导论课程的学生群体。成人参与者获得了在线任务链接，并被要求填写人口统计和语言背景问卷（见表1）。有40名成人表示会说除英语以外的其他语言。另有1名成人因未提供任何回答而被排除在外。成人完成研究后可获得课程学分。同意程序同样遵循ASU IRB的规定。

**2.2 刺激材料**

我们构建了类似英语的单音节伪词对，这些伪词对具有相同的辅音-元音-辅音（CVC）结构（例如，“gl __ p”可以发音为“gleap”和“glup”）。具体来说，我们找到了所有包含[i]和[?]元音发音的英语拼写组合（例如，“eap”和“up”），并且这些拼写组合在发音上是一致的（Ziegler、Stone和Jacobs，1997年）。我们只使用了发音唯一确定的拼写组合，以确保研究人员在录制伪词时能够准确发音。然后我们随机为这些拼写组合添加了开头辅音，从而生成了50对CVC伪词。最后，我们排除了具有实际意义的伪词（例如，同音异义词如“keap”和俚语如“yeet”）。这些伪词对在发音上除了中间位置的元音外完全相同，并且曾在之前的研究中用于验证“gleam-glum效应”（Yu等人，2021a）。为了适应儿童的注意力持续时间较短的特点，我们从中选择了32对伪词。我们通过排除发音相似的伪词对（例如，“smeem-smum”因与“smeen-smun”和“sneme-snum”相似而被排除）来筛选出最具区别性的32对伪词。表2列出了所有32对伪词。

**2.3 设计**

在伪词-场景匹配任务中，所有参与者完成了32次试验。每次试验开始时，会给出一个指导（图1）。指导中会展示一对场景，其中一个卡通角色的情绪价值积极，另一个消极（例如，一只快乐的熊猫和一只悲伤的熊猫）。1秒后，参与者会听到一对[i]音素和[?]音素的伪词（例如，“zeem”和“zum”），每个伪词都嵌入在一个引导短语中（例如，“Here we have zeem. There is also zum”）。伪词对和场景对的展示顺序是随机的，一半的试验以[i]音素伪词开始，另一半以[?]音素伪词开始；一半的场景是积极的，另一半是消极的。每个测试词都嵌入在一个测试短语中（例如，“Which one is zum?”）。为了平衡词与场景映射的时空顺序，共准备了16份测试列表，并随机分配给参与者。

**2.4 程序**

该任务使用PsychoPy Builder（版本2020.2.10；Peirce等人，2019年）构建，并通过Pavlovia（https://pavlovia.org/；Bridges等人，2020年）在线发布。用于此任务的PsychoPy程序可在OSF上找到（https://osf.io/yqd6g/）。同意书和问卷通过Qualtrics（https://www.qualtrics.com）制作。

**2.4.1 儿童**

父母和他们的孩子通过Zoom平台（https://zoom.us/）预约在线会议，与现场实验者一起完成研究。在线会议允许一次测试一个孩子。会议开始时，实验者将研究解释为“名称游戏”，孩子需要猜测一些图片的名称。解释完研究程序后，会获得家长的同意以及孩子的口头或书面同意。然后实验者将屏幕共享给孩子，并将鼠标的远程控制权交给孩子（Zoom的这一功能）。与成人不同，儿童的任务包含了一些额外的步骤，以确保他们理解指示并保持参与度。实验者首先将任务解释为一个游戏。接着向孩子展示了一对手印，并告诉他们每次看到这个手印时，要把手放在电脑旁边。随后向孩子展示了一张电脑鼠标的图片，并指示他们可以用自己的鼠标点击图片。这确保了孩子们在听到完整的听觉刺激之前不会做出任何选择。然后，孩子们被介绍了一个名叫Alex的角色，她喜欢画动物，并且为她的每一幅画都起了特别的名字。孩子们在游戏中的目标是猜出每幅画的特别名字。在实际测试之前，孩子们完成了两次练习测试，以熟悉伪词与场景的对应关系。练习测试中出现的图像和新词在正式测试中不会出现。练习测试之后，孩子们看到了一张大部分被隐藏的图像（见图1）。图像的逐步揭示有助于提高孩子们的参与度，并且每次测试后图像都会逐渐显示更多内容（即，在全部32次测试结束后，图像才会完全显示出来）。实验者在每次图像揭示时用引导性的语言与孩子们交流（例如：“看！这是什么？”），以确保他们的注意力。练习测试和图像揭示的指导结束后，孩子们进行了正式的测试（见图1）。孩子们完成整个任务的时间不到10分钟。在孩子完成任务的过程中或之后，家长们被要求填写一份人口统计调查问卷，然后在实验结束时接受了反馈。整个过程对孩子们来说持续了30到45分钟。

2.4.2 成年人
本科生被提供了一个在线URL链接，让他们自行完成这项研究。该链接首先包含同意书，接着是关于如何完成任务的书面说明，然后是伪词与场景匹配的任务，最后是人口统计和语言背景问卷。在伪词与场景匹配的任务中，成年人连续完成了32次测试（先做指导再做选择）（见图1）。整个过程对成年人来说持续了20到30分钟。

3 结果
所有数据和R语言（版本4.2.2）中的分析脚本都是公开可获取的（OSF链接：https://osf.io/yqd6g/）。为了验证我们的主要假设，我们首先使用了R包lme4（v1.1-26；Bates等人，2015年）进行了广义线性混合效应模型（GLMM）分析，通过似然比测试比较了不同的模型，并报告了贝塔系数、标准误差和z统计量。然后，我们使用了R包basic进行了信号检测理论（SDT）分析。

3.1 主要分析
图2a显示了每个参与者在所有测试中与“光辉-忧郁效应”一致的响应比例（平均值）。我们首先评估了孩子们是否比随机情况（0.5）更频繁地将伪词与与“光辉-忧郁效应”相符的情绪价值的图片匹配起来。我们构建了一个GLMM模型，以每次测试的得分作为结果（1表示将[i]伪词与积极场景匹配，或将[?]伪词与消极场景匹配；0表示不匹配），并考虑了参与者和项目的随机截距。模型规格如下：孩子们的得分～ 1 + logit(0.5) + (1 | 参与者) + (1 | 项目）（注意logit(0.5)实际上是0）。结果显示，孩子们的反应显著高于随机水平，并且与“光辉-忧郁效应”一致（M = 0.60，ΔMAboveChance = 0.10，SD = 0.13；b = 0.45，STE = 0.10，z = 4.37，p < 0.0001，95%置信区间 = [0.25, 0.66]，比值比 = 1.57）。参与者的随机截距方差为0.25（SD = 0.50），项目的随机截距方差为0.20（SD = 0.45），这表明个体和项目之间的变化较小（在典型的行为研究中，这种程度的方差——例如0.05–0.20——通常被认为是小到中等的聚类效应，参见Hox, Moerbeek, & van de Schoot, 2018; Snijders & Bosker, 2012）。这一强有力的效应为幼儿中存在“光辉-忧郁效应”提供了首个证据。图2展示了每个年龄组中每个参与者以及每个伪词对的平均效应大小（a）和（b）。在（a）中，x轴表示年龄组（儿童 vs. 成年人）。y轴表示每个参与者与“光辉-忧郁效应”一致的响应比例，1表示在所有32次测试中始终将[i]伪词与积极场景匹配，将[?]伪词与消极场景匹配；0表示完全相反的情况。虚线黑线表示随机水平（0.50），即[i]和[?]伪词各50%的时间与积极和消极场景匹配。实线黑条表示按年龄组平均的效应大小。单独的点代表个别参与者。在（b）中，x轴显示了每个伪词对在所有参与者中的效应大小（左侧面板为儿童，右侧面板为成人）。x轴表示d值的大小，表示与“光辉-忧郁效应”一致（或不一致）的方向上超过随机水平的标准差数量。y轴按顺序列出了所有32个伪词对。图例条表示伪词对级别的效应大小。接下来，我们进行了探索性分析，以检查儿童的“光辉-忧郁效应”是否随年龄增长而增强。我们通过平均每次测试的得分生成了每个孩子的得分，并与他们的年龄进行了皮尔逊相关性分析。结果显示，在这个年龄范围内，年龄与“光辉-忧郁效应”没有显著相关性（r = 0.14，p = 0.34）。在另一项探索性分析中，我们将年龄（均值中心化）作为协变量加入上述GLMM模型。儿童的表现仍然显著高于随机水平，与相关性结果一致，儿童的年龄并不是“光辉-忧郁效应”的显著预测因素（详见支持信息：https://osf.io/yqd6g/）。我们还检查了成人是否比随机情况（0.5）更频繁地表现出“光辉-忧郁效应”。与儿童类似，我们构建了一个以每次测试的得分作为结果的GLMM模型（1, 0），并考虑了参与者和项目的随机截距。模型规格如下：成人的得分～ 1 + logit(0.5) + (1 | 参与者) + (1 | 项目）。结果确认，成人的反应显著高于随机水平，因此与“光辉-忧郁效应”一致（M = 0.75，ΔMAboveChance = 0.25，SD = 0.21；b = 1.51，STE = 0.15，z = 9.82，p < 0.0001，95%置信区间 = [1.21, 1.82]，比值比 = 4.53）。参与者的随机截距方差为1.92（SD = 1.39），项目的随机截距方差为0.12（SD = 0.34），这表明个体间的变异较大，而项目内部的变异相对较小。成人中的强烈效应与之前的研究一致，这些研究让成人听众对英语和普通话中的真实词汇的情绪价值进行评分（Yu等人，2021a, 2021b），并将“光辉-忧郁效应”扩展到了与描述情绪价值的复杂场景相关联的精心控制和匹配的伪词上。接下来，我们比较了儿童和成人之间的“光辉-忧郁效应”大小。我们构建了一个以每次测试的得分作为结果的GLMM模型（1, 0），固定了年龄组（儿童 vs. 成年人），考虑了参与者和项目的随机截距，以及年龄组的随机斜率。最终模型规格如下：所有参与者的得分～年龄组 + (1 | 参与者) + (1 + 年龄组 | 项目）。结果显示，成人表现出比儿童更强的“光辉-忧郁效应”（b = 0.95，STE = 0.21，z = 4.48，p < 0.0001，95%置信区间 = [0.53, 1.38]，比值比 = 2.59）。参与者的随机截距方差为1.23（SD = 1.11），表明个体间的准确性存在显著差异。项目的随机截距方差为0.11（SD = 0.33），表明项目间的变异较小。项目随机斜率与截距之间的相关性为0.38，表明准确性较高的项目倾向于表现出更大的年龄效应。

3.2 探索性分析
为了评估“光辉-忧郁效应”的稳健性，我们进行了额外的分析，以考虑场景选择偏差的影响。这些分析并未预先注册。

3.2.1 控制场景选择偏差
我们进行了SDT分析，以区分选择积极或消极图像的偏差，从而获得纯粹的“光辉-忧郁效应”测量结果。SDT分析为每个伪词对提供了两个独立的标准化指标，基于二项概率。首先，偏差指标c表示该组对每个伪词对选择积极图像的偏差数量，与50%的随机水平相比。其次，分离指标d（相当于Cohen的d）表示该组对[i]伪词选择积极图像的数量超过[?]伪词选择积极图像的数量。c值表示选择某种情绪价值场景的标准化偏差，无论目标词类型是[i]还是[?]伪词。负的c值表示倾向于选择更多积极场景的标准偏差，正的c值表示倾向于选择更多消极场景的标准偏差。由于我们为每个伪词对计算了c和d指标，因此我们对它们的分布进行了标准t检验分析，以提供积极与消极图像偏差的总体测量，以及不受选择积极或消极场景偏差影响的纯粹“光辉-忧郁效应”测量。这解释了为什么d值效应通常比简单的准确性指标更大，特别是在存在选择偏差的情况下。针对儿童和成人分别进行了每个伪词对的SDT分析。结果显示，儿童在32个伪词对中都有倾向于将目标词与积极场景匹配的偏差（c = ?0.16，t(31) = ?3.48，p = 0.002，d = ?0.62）。成人则普遍倾向于将目标词与消极场景匹配（c = 0.06，t(31) = 2.66，p = 0.012，d = 0.47）。重要的是，即使控制了这种场景选择偏差，儿童和成人的“光辉-忧郁效应”仍然显著（儿童Md = 0.56，SD = 0.57，t(31) = 5.55，p < 0.0001，d = 0.98；成人Md = 1.37，SD = 0.46，t(31) = 17.02，p < 0.0001，d = 3.01）。此外，成人的“光辉-忧郁效应”大小（Md = 1.37，SD = 0.46）通过独立样本t检验（t(62) = 6.24，p < 0.0001）仍然比儿童更强（Md = 0.56，SD = 0.57）。图2b显示了每个伪词对的效应大小（d值），表示与“光辉-忧郁效应”一致（或不一致）的方向上超过随机水平的标准差数量（左侧面板为儿童，右侧面板为成人）。在所有伪词对中，“光辉-忧郁效应”在儿童和成人中都很大且稳健。也就是说，对于儿童，75%的伪词对表现出小到非常大的“光辉-忧郁效应”（其中90.6%的方向与预测一致，25%至少表现出较大的效应，d > 0.80）。对于成人，该效应适用于当前研究中测试的所有伪词对，表现出强烈的效应（100%的方向与预测一致，87.5%至少表现出较大的效应，d > 0.80）。在每个伪词对中，我们可以看到年龄组之间的共性和差异（见图2b）。一些伪词对在儿童和成人中都表现出强烈的“光辉-忧郁效应”（例如，“cleem”–“clum”在这两个列表中都排在前三名），而其他一些伪词对在不同年龄组中的效应大小差异很大（例如，“bleem”–“blum”在儿童中排名第一，但在成人中排名第16）。

4 讨论
第一个目标是开发一种新的方法论，使我们能够首次在成人和幼儿中测试“光辉-忧郁效应”。结果确认，成人和5至7岁的儿童都稳健地表现出“光辉-忧郁效应”：他们可靠地将[i]伪词与描绘积极情绪价值的场景联系起来，将[?]伪词与描绘消极情绪价值的场景联系起来，这种效应的幅度相当大。第二个目标是比较儿童和成人之间的“光辉-忧郁效应”。结果显示，尽管儿童中的“光辉-忧郁效应”很强，但在成人中更为显著。这些发现共同证实了“gleam-glum效应”在英语儿童的样本和大学生中是普遍存在的，并且表明这种效应会随着年龄的增长而增强。此外，这种效应在儿童还处于词汇积累和情绪处理技能发展阶段的早期就出现了，这支持了声音象征作用在提高语言理解、语言使用和语言学习方面的潜力。年轻儿童能够系统地将含有[i]音素的假词与传达积极情感的场景联系起来，将含有[?]音素的假词与传达消极情感的场景联系起来，这是首次证明他们在情感声音象征方面具有能力。这一发现改变了我们对幼儿期声音象征作用的理解。以往的声音象征研究主要集中在婴儿和儿童将单词的声音与其含义的物理属性（如大小或形状）联系起来（例如Fort等人，2018年；Imai和Kita，2014年；Maurer等人，2006年）。而当前的研究表明，年幼的儿童能够将声音与更抽象的含义特征——情感价值——联系起来。年轻儿童中的“gleam-glum效应”表明，在这个发展阶段，声音象征作用已经扩展到了组织世界意义及其相关词汇的关键维度（Vigliocco等人，2009年）。重要的是，这种关联不仅限于特定的象征性词汇，而是扩展到了英语词汇的广泛范围，因为英语中[i]和[?]元音的使用频率很高。5至7岁儿童中也存在这种效应，这进一步强调了语言与情感在早期发展中的紧密联系（Hoemann、Xu和Barrett，2019年）。例如，在婴儿期，语言表达与情感表达在时间上非常接近（Bloom和Beckwith，1989年）。此外，幼儿的表达性语言似乎有助于他们的情感调节能力的发展（Cole、Armstrong和Pemberton，2010年）。另外，学龄儿童的理解词汇量与他们对情感的认识也有关（Beck、Kumschick、Eid和Klann-Delius，2012年）。5至7岁的儿童在语言和情感处理方面仍在发展中（Bloom，2000年；Declercq等人，2019年；Pons等人，2004年）。这一年龄段儿童表现出“gleam-glum效应”表明，语言和情感可能共同促进这两个领域的发展。除了首次提供年轻儿童中“gleam-glum效应”的证据外，当前研究的结果还首次揭示了儿童和成人之间在情感声音象征方面的差异。以往关于声音象征的研究大多只关注儿童或成人，很少同时研究两者（例如Kantartzis等人，2011年；Imai、Kita、Nagumo和Okada，2008年；Tzeng等人，2017年），我们对这种差异如何随发展而变化了解较少。一项关于幼儿“bouba-kiki”声音象征效应的研究表明，这种效应会随着年龄的增长而增强，3岁儿童的表现不如5岁和7岁儿童明显（Tzeng等人，2017年）。研究者将这种变化归因于语言经验。我们的发现支持并扩展了这一观点，表明与年龄相关的经验在情感声音象征中也起着作用：更有经验的听众（成人）在将元音与情感价值联系起来时表现出更强的“gleam-glum效应”。什么样的经验可能增强这种效应呢？首先，对英语单词的普遍了解可能有助于增强“gleam-glum效应”。研究发现，英语词汇中的许多单词都符合这种效应，即含有[i]音素的单词通常被赋予更积极的情感价值，而含有[?]音素的单词则被赋予更消极的情感价值（Yu等人，2021a）。因此，长期使用英语可能会使5至7岁的儿童产生这种效应，并在大学生中加强这种效应。其次，随着经验的增长而来的更高级认知技能也可能是原因之一。儿童的认知技能仍在发展中，而成人的记忆、注意力和词汇学习能力更强（例如Benitez和Li，2024年；Benitez和Robison，2022年；Vogan、Morgan、Powell和Smith，2016年）。这项任务确实对记忆和注意力技能提出了要求，因为参与者需要在听到两个单词的同时保持注意力，然后从两个可能的图片中选择与测试单词相匹配的图片。因此，记忆和注意力技能的差异可能导致了儿童和成人之间的差异。此外，随着经验的增加，完成任务时采用的策略也可能发生变化。在我们的方法中，儿童和成人都需要在多次测试中从两个情感价值相反的场景中选择一个，与[i]或[?]音素的假词相匹配。成人听众可能更倾向于基于规则进行推理（Rabi、Miles和Minda，2015年；Thomas等人，2004年），他们可能更倾向于将某些声音与特定类别的图片联系起来（例如，将发[i]音的假词与所有积极场景联系起来），而较少考虑将单个声音与单个场景的对应关系（参见Monaghan、Mattock和Walker，2012年的类似观点）。相比之下，儿童听众可能更倾向于将单个声音与单个场景联系起来。与此推测一致的是，研究发现，在所有测试中，成人表现出更少的项目级差异（即平均而言，他们对100%的假词对表现出与“gleam-glum效应”一致的反应，而儿童仅为75%，见图2b）。此外，在不同参与者之间，成人表现出更多的个体差异（即与儿童相比，一些成人完全符合“gleam-glum效应”，他们的反应率为100%，而另一些人的反应率仅为15%，见图2a）。另一个可能影响年龄差异的因素是，儿童在选择图片时倾向于偏好积极的图片。这种偏见可能会降低整体准确性。例如，如果每次试验都选择积极图片，那么所有[i]音素的单词都会产生与“gleam-glum效应”一致的结果，但[?]音素的单词则不会。这将导致50%的准确率，从而无法观察到明显的“gleam-glum效应”。尽管儿童表现出强烈的“gleam-glum效应”，但如果在某些试验中儿童倾向于选择积极图片，而不考虑单个单词，这种效应可能会被削弱。最后，虽然儿童倾向于更频繁地选择积极图片，但成人则更倾向于选择消极图片。这揭示了这两个年龄段在推理能力上的潜在差异。例如，儿童可能更习惯于遇到更多积极的图像，并且通常对听到的新奇单词有积极的反应，而成人可能更为谨慎，通常会觉得新奇单词有些令人不安。我们的结果表明儿童和成人在场景选择偏见上存在差异，这有助于我们理解情感声音象征的潜在机制。总的来说，这些发现表明，一个全面的情感声音象征理论模型必须考虑与年龄相关的经验的作用。那么，“gleam-glum效应”背后的机制是什么呢？有几种可能性。一种机制是，表达情感（例如微笑）和发音某些元音（例如[i]）使用相同的口面部肌肉（例如Yu等人，2021a；K?rner和Rummer，2022年；Rummer等人，2014年；Rummer和Schweppe，2019年）。具体来说，发音[i]时的典型动作涉及收缩用于微笑的颧肌，而发音[?]时的动作会抑制该肌肉，并可能收缩其他肌肉（例如下巴下的舌骨肌；Wang和Yiu，2023年），并且在发音中央元音[?]时可能需要降低和收回舌头，涉及舌肌如颏舌肌（例如Takano和Honda，2007年）。因此，情感系统和语言系统可能基于共同的口面部肌肉，情感状态和语言产生或感知通过口面部发音相互关联（例如Havas、Glenberg和Rinck，2007年；Hirayama，2016年；Imai等人，2025年；Rummer等人，2014年；Sidequersky等人，2016年）。这些观点与最近提出的“发音反馈假说”一致，该假说认为情感和元音通过口面部肌肉运动相互关联，从而为说话者提供关于他们情感状态的发音反馈（参见K?rner和Rummer，2022年，2023年；Rummer等人，2014年）。支持这一假说的证据表明，当成人移动用于微笑的颧肌（例如用牙齿握笔）或发音需要这种肌肉运动的元音（例如[i]）时，他们认为卡通更有趣，而当进行其他动作（例如用嘴唇握笔）或发音其他元音（例如德语中的[o]）时，这种效果会减弱（参见Rummer等人，2014年；Rummer和Schweppe，2019年；Yu等人，2021a）。此外，听力受损的成人限制了他们的声音-形状映射判断能力，这支持了声音象征与发音之间的联系（Imai等人，2025年）。因此，语言产生和情感表达之间的重叠可能加强了元音与包含这些元音的单词的情感价值之间的联系。另一种可能的解释是，元音之间的声学差异可能与情感有关（例如Rummer等人，2022年）。例如，[i]音素的自然发音音高高于[?]音素（Patten和McBeath，2025年）。成人认为更高的音高更具吸引力，情感价值也更积极（例如Niculescu、Van Dijk、Nijholt、Li和See，2013年；Re、O'Connor、Bennett和Feinberg，2012年），并且被前语言阶段的婴儿所偏好（例如Masapollo、Polka和Ménard，2016年），并且在婴儿导向的言语中也很常见（例如Narayan和McDermott，2016年）。在探索性分析中，我们评估了任务中使用的假词对之间的音高是否存在系统差异。我们发现配对的[i]和[?]假词在音高上没有显著差异（见脚注2）。因此，当前研究表明，仅音高本身似乎不是“gleam-glum效应”的显著或必要驱动因素。此外，发现元音之间存在系统性的音高差异也可以被视为其他潜在因素的表象，例如产生这些元音所使用的不同口面部肌肉的产物。因此，如果存在音高差异，可以将其解释为发音产生的物理表现，而不是声音象征的另一种解释。无论如何，当前研究的发现为进一步探索促进“gleam-glum效应”发展的机制铺平了道路。当前研究中展示的“gleam-glum效应”的稳定性也鼓励未来的研究来评估这种效应是由测试的两种元音共同驱动的，还是主要由其中一种元音驱动的。有可能某种元音类型（例如[i]）与情感价值的联系比另一种元音（例如[?]）更为普遍。例如，更广泛的声音象征文献表明，“bouba-kiki效应”中的联系是不对称的，即在婴儿早期，“bouba”与圆形形状之间的联系比“kiki”与尖锐形状之间的联系更为强烈（例如Fort等人，2018年）。与当前工作更相关的是，之前研究评估德语中[i]-[o]元音之间的情感价值对比时发现，[i]元音与积极情感价值的联系比[o]元音与消极情感价值的联系更为强烈（K?rner和Rummer，2023年）。鉴于发音[i]和[?]都会引起一些相似但不同的口面部肌肉运动（例如两者都会抑制颧肌收缩，但其他方面有所不同；参见Rummer等人，2014年；Yu等人，2021a），一种可能性是[i]元音与积极情感价值的联系是“gleam-glum效应”的主要贡献因素。另一种可能性是，这两个元音可能对“光辉-阴郁”效应都有同等程度的贡献，甚至[?]可能是英语中的主要贡献者（Adelman等人，2018年；Householder，1946年；Taylor & Taylor，1965年）。与后一种猜测一致的证据包括对英语词汇情感价值的评分（参见Warriner等人，2013年；Yu等人，2021a年），结果显示，平均而言，包含[?]音素的真实单词被英语成人评为稍微更负面（M = 4.83，从最负面的1到最正面的9，平均值为5），而包含[i]音素的单词则被评为更正面（M = 5.12）。这些发现的总和表明，[i]和[?]音素都有潜力对“光辉-阴郁”效应产生贡献。我们的发现首次提供了实证证据，证明5到7岁的儿童也表现出这种效应。这些发现为未来的研究奠定了基础，以评估这种效应是否在更早的儿童时期就出现了。“Bouba-kiki”效应已经在成人（Ramachandra & Hubbard，2001年；?wiek等人，2022年）、幼儿（Imai等人，2015年；Maurer等人，2006年）以及4个月大的前语言期婴儿（例如Ozturk、Krehm和Vouloumanos，2013年）中被发现，尽管在更年轻的年龄段并不总是表现出这种效应（参见Pejovic & Molnar，2017年；Sidhu等人，2023年）。情感声音符号效应的一个关键前提是对现实世界中情感的感知能力。婴儿在6个月大时就能识别父母的情感表达（Walker-Andrews，1998年），并在9个月大时能够将情感与动作联系起来（Barna & Legerstee，2005年）。事实上，早期发展阶段对婴儿和儿童说话时通常会传达强烈的情感（Fernald，1985年；Trainor、Austin和Desjardins，2000年）。此外，在生命的第一个年份，婴儿通过面部肌肉运动轻松表达微笑和哭泣等情感（Illingworth，1955年；Messinger，2002年），并能够发出包括[i]元音在内的各种音素（Buhr，1980年；Lieberman，1980年），这表明面部肌肉、情感和音素之间的跨模态联系可能在婴儿期就已经形成（例如Li & Benitez，2025年）。因此，有理由推测“光辉-阴郁”效应可能比这里测试的年龄出现得更早。我们的研究提供了坚实的方法论基础和实证支持，以检验这种语言-情感联系是否存在于更年幼的儿童中。年轻儿童中存在“光辉-阴郁”效应表明，这种效应有助于促进早期语言学习。先前的研究表明，对其他声音符号模式的早期敏感性可能有助于词汇学习（例如Imai & Kita，2014年），尽管这种自举效应的范围仍有争议——即它是否仅支持象征性词汇的学习，还是包括其他非象征性词汇的学习（Nielsen & Dingemanse，2021年）。我们的研究表明，年轻儿童和成人都倾向于将[i]音素的单词与正面情感联系起来，将[?]音素的单词与负面情感联系起来。这种声音-情感关联，与其他声音符号模式类似，可能成为年轻儿童学习新词汇的基本自举机制。也就是说，对声音-情感关联的敏感性可能帮助学习者掌握包含这些特定音素特征的新词汇（即，英语中有很多词汇包含参与“光辉-阴郁”效应的元音），或者扩展学习者的词汇量，而不仅仅是这些特征的词汇（即，早期建立的词汇-指称映射减少了其他新词汇的指称歧义，参见Hidaka & Smith，2010年）。我们的发现为未来的研究奠定了基础，以实证检验“光辉-阴郁”效应是否有助于整个发展过程中的实时词汇学习——例如，包含[i]音素和正面情感的词汇与包含[?]音素和负面情感的词汇之间的映射是否比与效应不一致的映射更容易学习（参见Monaghan等人，2012年的一个例子）。

5 结论

总之，我们的研究介绍了一种新的伪词-场景匹配方法，支持了一种新兴的声音符号现象——“光辉-阴郁”效应的稳健性——其中音素系统地携带情感价值。无论是5到7岁的英语儿童还是成人，都将包含[i]音素的伪词与积极情感的场景匹配起来，将包含[?]音素的伪词与消极情感的场景匹配起来。“光辉-阴郁”效应在年轻儿童中的稳健性及其在许多词汇中的普遍性扩展了我们对声音符号的理解。结果表明，这种效应超出了物理属性，扩展到了更抽象的意义层面，并且语言和情感在早期发展中是相互关联的。此外，成人比儿童表现出更强的偏向性，这暗示了与年龄相关的经验是“光辉-阴郁”效应背后的一个重要机制。总体而言，我们的发现表明，年轻儿童和成人都倾向于将音素与情感价值联系起来，这表明情感声音符号有可能成为语言理解、语言使用和语言学习的重要机制。

致谢

我们感谢亚利桑那州立大学学习与发展实验室的Jada Randall、Jillian Kuo、Skylar Keefer、Amanda Sather和Chantelle Robinson，以及PEARL实验室的Heather Barnes在招募和测试参与者方面提供的帮助。我们还要感谢Connie Catedral和Emily Wescott分别制作了卡通人物和声音刺激。我们还要感谢我们的第一个试点儿童参与者Jason Zou，他激励我们改进了研究的随机化过程。

1 其他早期关于情感声音符号的研究在一定程度上成功地探讨了[i]音素与[o]音素之间的区别，这与发音反馈假设一致（K?rner & Rummer，2022年，2023年；Rummer、Schweppe、Schlegelmilch和Grice，2014年），但由于几个原因，我们选择了研究“光辉-阴郁”的[i]音素与[?]音素之间的区别，包括它在所测试的英语中似乎能产生非常稳健的效应。

2 我们使用Praat软件（https://www.fon.hum.uva.nl/praat/）获取了每个伪词的平均音高信息，并通过配对样本t检验比较了所有[i]伪词和所有[?]伪词的音高。结果显示，[i]伪词（平均值=272.28 Hz，标准差=44.56）和[?]伪词（平均值=261.01 Hz，标准差=38.86）在音高上没有显著差异，t(62) = 1.08，p = .285。然后，我们通过从[i]伪词的音高（例如zeem）中减去[?]伪词的音高（例如zum）来评估每对伪词内部的音高差异。在每对伪词中，正值表示[i]伪词的音高数值更高，负值表示[?]伪词的音高数值更高；零表示音高没有差异。在32对伪词中，有18对的[i]伪词的音高更高，其余的[?]伪词的音高更高。通过单样本t检验将这些音高差异与零进行比较，结果显示伪词对内部的音高差异与零没有显著差异（t(31) = 1.29，p = .207），表明[i]伪词和[?]伪词在整体音高上相似。

3 我们预先注册的分析计划是进行t检验和ANOVA检验（参见OSF中的预先注册：儿童：https://doi.org/10.17605/OSF.IO/TU7J3；成人：https://doi.org/10.17605/OSF.IO/AZQXU）。我们选择使用广义线性混合效应模型来报告最终数据，因为这种更为保守的方法考虑了二元准确结果（1, 0）、项目的随机效应以及个体间的方差。预先注册计划的结果（参见OSF中的支持信息：https://osf.io/yqd6g/）与手稿中报告的结果一致。

4 我们还探讨了视觉呈现的图像（左侧或右侧图像）与听觉呈现的单词（第一个或第二个单词）之间的对齐是否会影响所有参与者的任务表现，正如一位审稿人建议的那样。结果显示，即使在考虑了单词和图片顺序的对齐后，“光辉-阴郁”效应仍然稳健。详见支持信息（https://osf.io/yqd6g/）。

5 在一项探索性分析中，我们评估了“光辉-阴郁”效应是否因元音类型（[i]伪词与[?]伪词）的不同而有所不同，正如审稿人建议的那样。结果显示，两种元音的效应是可比的（详见支持信息，https://osf.io/yqd6g/）。然而，由于支持信息中提到的原因，这种分析应谨慎解读。

6 原始研究主要测试了[o]音素作为与积极[i]音素对比的负面示例。此外，有证据表明[o]音素与用于一种负面情绪——皱眉的口角降肌收缩有关。在这里，我们注意到有多种普遍可识别的负面情绪，每种情绪都有其独特的口面部肌肉，我们当前和之前的“光辉-阴郁”效应发现包括[?]音素在内。

数据可用性声明

本研究获得了亚利桑那州立大学IRB委员会的批准（ID：STUDY00007151 成人语言学习，以及STUDY00015502 儿童声音符号）。假设和方法已在数据收集之前预先注册（成人：https://doi.org/10.17605/OSF.IO/AZQXU，2022-05-12；儿童：https://doi.org/10.17605/OSF.IO/TU7J3，2022-04-08）。数据分析计划在撰写手稿期间进行了修改（详见手稿中的脚注3）。手稿中呈现的结果与预先注册的结果一致（详见支持信息，https://osf.io/yqd6g/）。发表后，数据、分析脚本和研究材料将向公众共享，包括补充的原始数据、R分析脚本以及用于运行实验的PsychoPy程序（https://osf.io/yqd6g/）。

热点排行