网络科学解码西方音乐旋律与和声结构演化

《Scientific Reports》:Decoding the evolution of melodic and harmonic structure of Western music through the lens of network science

【字体: 时间:2026年04月24日 来源:Scientific Reports 3.9

编辑推荐:

  针对数字时代音乐结构是否趋于简化的问题,研究者运用网络科学方法,对近四个世纪、约2万首西方音乐作品的MIDI转录本进行量化分析。研究将音乐作品建模为加权有向网络,通过拓扑和复杂性度量发现,不同流派的音乐网络特性存在显著差异,且古典和爵士乐展现出更高的结构性复杂度。时间序列分析进一步揭示了所有流派的旋律与和声结构呈现“同质化”和“简化”趋势,包括古典、爵士等传统复杂流派也与新兴流行流派的网络模式日益相似,表明技术变革、文化民主化与高度互联环境可能影响了音乐结构演变。该研究为理解文化演化提供了新的数据驱动视角。

  
音乐,作为人类文明的一面镜子,不仅塑造着情感与社会变迁,其自身结构也在随着技术与文化的浪潮不断演变。进入数字时代,流媒体平台与算法推荐重塑了音乐的创作、传播与消费。然而,一个引人深思的问题也随之浮现:在快速、互联且被算法精心编排的环境中,音乐是否也像社交媒体上的语言一样,正经历着一种“简化”的进程?此前已有研究表明,近五十年的流行歌曲歌词正变得更简单、更重复。那么,承载着音乐核心美感的旋律与和声结构,是否也未能幸免?
尽管音乐理论家们早已从感性角度讨论过音乐的简化趋势,但缺乏一种客观、可量化的科学方法来系统性地测量和比较跨越漫长历史时期、不同流派的音乐结构复杂性。以往的研究多聚焦于较近时期的特定曲风,或受限于数据规模,难以揭示跨越数世纪的长期结构性模式。为了填补这一空白,一项发表于《Scientific Reports》的研究独辟蹊径,将网络科学(Network Science)这一工具引入了音乐分析领域。
研究者们开展了一项大规模分析,旨在从数据驱动的视角解码西方音乐旋律与和声结构的演化。他们构建了一个包含约2万首音乐作品的数据集,这些作品的MIDI(Musical Instrument Digital Interface,乐器数字接口)转录本涵盖了古典、爵士、摇滚、流行、电子和嘻哈六大宏流派,时间跨度近四百年。研究的核心创新在于将每一首音乐作品建模为一个加权有向网络(weighted directed network):网络中的节点(node)代表不同的音符,有向边(directed edge)代表音符之间的前后过渡,边的权重(weight)则代表了该特定过渡在乐曲中出现的次数。通过这种网络表征,旋律与和声的流动被转化为可计算的拓扑结构,从而使得系统性地分析其复杂性成为可能。
为了开展这项研究,研究人员主要运用了以下几个关键技术方法:首先,从公开的MetaMIDI数据集中筛选并处理了涵盖六大流派的MIDI文件,构建了研究的基础数据集。其次,利用Spotify API(Application Programming Interface,应用程序编程接口)和大型语言模型(Large Language Model, LLM)Gemini启发式方法,收集和校对了音乐作品的元数据(如流派、发行年代),以支持基于时间的演化分析。最后,也是最为核心的,是应用了网络科学的整套分析框架,包括构建音符转移网络、计算一系列网络度量(如全局效率、加权互惠性、节点平均熵等)、创建基于音乐音程的嵌入向量,并使用统计检验和降维技术(如UMAP)来比较不同流派和不同时期的网络结构差异。
流派特异性网络属性
研究首先比较了不同音乐流派网络的拓扑属性。结果显示,不同流派的网络具有显著不同的特性。例如,在加权互惠性(weighted reciprocity)上,摇滚、流行、嘻哈和电子音乐表现出非常高的值,意味着这些流派的音乐中,双向的音符过渡对(如A到B和B到A)频繁重复出现。而古典和爵士乐则显示出较低的加权互惠性,甚至出现反互惠性,表明其音符过渡的重复模式更少,结构更多变。在节点平均熵(mean node entropy)上,古典和爵士乐也显示出更高的值,意味着从一个音符出发,转移到其相连的各目标音符的概率分布更均匀,过渡模式更丰富。
分析音乐连通性与变异性
研究者进一步通过“全局效率”(global efficiency)及其加权版本,来度量音乐网络的“传播”特性,并将其解释为结构复杂性的指标。高效率值,尤其是在加权情况下,对应于网络中最短路径承载的权重较低,表明乐曲没有过度集中在少数高频重复的音符过渡上,而是更均匀地探索了各种可能的音符序列,即具有更高的结构性多样性。分析发现,古典和爵士乐在加权效率上显著高于其他流派,这证实了它们在旋律与和声过渡上具有更丰富的结构多样性。相比之下,嘻哈音乐表现出最低的加权效率。通过与随机化网络(null model)的对比,研究还发现,真实的音乐网络其效率值低于仅保留节点出度分布的随机网络,这表明音乐性并不优先形成最短路径,可能避免了某些不和谐或不符合乐理的随机连接。
在高维空间中嵌入音乐结构
为了同时捕捉网络的拓扑和音乐属性,研究者将每个网络嵌入到一个高维空间中。一种方法是基于音乐音程(musical interval,即两音符间的半音数差)创建12维向量。另一种方法是使用graph2vec算法基于拓扑属性生成嵌入。降维可视化(UMAP)结果显示,古典音乐形成了一个独立的簇,与其他流派明显分离,而爵士乐虽然在复杂性(由第二主成分反映)上与古典乐相似,但在第一主成分(主要反映拓扑属性如非加权效率、密度)上有所不同。流行、摇滚、电子等流派则在嵌入空间中聚集得更为紧密。相关性分析表明,第一主成分与稳定音程(如大三度、纯四度)正相关,第二主成分则与不稳定音程(如大小二度、同度)更相关,且与加权效率等复杂度指标强相关。
追溯音乐随时间的演化
研究最后引入了时间维度,分析音乐结构是否随年代发生系统性变化。结果显示,所有流派的音乐在加权效率上均呈现出趋同态势。具体而言,古典音乐的加权效率随时间推移显著下降,爵士乐在早期上升后也趋于下降并稳定。与此同时,摇滚、流行等流派的效率值则保持相对平稳。其结果是,在最近几十年,所有流派的加权效率值变得非常接近。基于音程嵌入的时空演化分析也揭示了类似的模式:音乐的风格中心从高复杂度区域(对应早期古典和爵士)逐渐向低复杂度区域(对应近期的流行流派)移动,1950-1979年间的音乐扮演了过渡桥梁的角色。这表明,不仅新兴流派的结构相对简单,就连古典和爵士这类历史悠久、结构复杂的流派,其近期的作品在旋律与和声结构上也呈现出简化趋势,整个西方音乐生态在研究的结构维度上表现出“同质化”。
研究结论与讨论
本研究的主要结论是,通过网络科学的透镜,可以清晰地区分不同西方音乐流派在旋律与和声结构上的拓扑与复杂性特征。古典和爵士乐在研究的结构维度上展现出最高的复杂性。更重要的是,跨时期的分析揭示了音乐结构的一个系统性演化趋势:向更高的相似性和更低的复杂性发展。即使是古典和爵士乐,其现代作品的结构模式也与近期流行流派日益相似。
研究者强调,这些发现并不直接证明因果关系,但与以下假设一致:近期的技术革新(如数字创作工具、流媒体)、音乐的逐步民主化(更多人参与创作)以及高度互联的环境(算法推荐、社交媒体),可能与音乐特定结构方面的变化有关,类似于在其他文化领域(如歌词、网络语言)观察到的简化模式。同时,他们也谨慎指出,这种在音高、旋律、和声维度上观察到的结构简化,并不等同于音乐整体艺术价值的降低。音乐复杂性可能转向了本研究所用符号化、音高框架未能捕捉的其他表达维度,如音色设计、制作技术和表演实践。
该研究的意义在于,它首次利用大规模数据和网络科学方法,对跨越四个世纪的西方音乐结构演化进行了量化分析,为理解文化演化提供了新颖的数据驱动视角。它架起了音乐学、数据科学和社会学之间的桥梁,为探索数字环境如何影响文化产品的创造与消费奠定了基础。未来的研究可以整合音频特征、歌词分析等多维度表示,以更全面地考察音乐复杂性的演变。
相关新闻
生物通微信公众号
微信
新浪微博

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号