
-
生物通官微
陪你抓住生命科技
跳动的脉搏
基于金字塔深度双向门控循环单元网络(Pyramid Deep Bidirectional Gated Recurrent Unit Network)并结合投票策略的中国文学作者身份识别方法
《Scientific Reports》:Authorship identification for Chinese literature based on a pyramid deep bidirectional gated recurrent unit network with voting strategy
【字体: 大 中 小 】 时间:2026年05月31日 来源:Scientific Reports 3.9
编辑推荐:
摘要在计算语言学中,识别给定文本片段的作者是一项具有挑战性且重要的任务。在本文中,我们提出了一种基于金字塔深度双向门控循环单元(biGRU)网络的新型深度学习模型,用于中文文学作品的作者身份识别。该模型采用分层架构,其中每个GRU层的输出序列在作为后续层的输入之前,会通过一个可优
在计算语言学中,识别给定文本片段的作者是一项具有挑战性且重要的任务。在本文中,我们提出了一种基于金字塔深度双向门控循环单元(biGRU)网络的新型深度学习模型,用于中文文学作品的作者身份识别。该模型采用分层架构,其中每个GRU层的输出序列在作为后续层的输入之前,会通过一个可优化的卷积模块进行逐步降采样。为了提高计算效率,我们在所有层之间实现了参数共享策略。此外,我们还引入了多级软投票机制,使得每一层提取的隐藏特征都能独立地为最终预测做出贡献,从而有效捕捉到不同层次的特征抽象。我们在一个包含超过9万个标记的中文文学数据集上评估了我们的方法,这些标记来自简短、片段化的文本,其中连贯且丰富的上下文信息本身就较为有限。实验结果表明,我们的模型取得了0.8224的优异F1分数,同时所需的FLOPs仅约为同等深度的传统深度biGRU网络的41%,这证明了其在作者身份识别方面的有效性和高效性。