推荐系统(RSs)可以有效减少信息过载并提升用户体验(Wang等人,2022b)。现有的推荐方法,包括协同过滤(Park, Lee, & Lee, 2011)、基于内容的方法(Blanco-Fernández, Nores, Gil-Solla, Cabrer, & Pazos-Arias, 2011)和基于信任的方法(Ardissono & Mauro, 2020),通常依赖于用户身份信息和长期的历史交互行为来推断用户感兴趣的内容。然而,这些方法在实际应用中存在一些缺点,如冷启动、短期交互的数据稀疏性以及用户匿名性,这些都会导致不满意的推荐结果。近年来,基于会话的推荐(SBR)受到了研究人员的广泛关注。SBR根据匿名用户当前的行为序列预测下一个最有可能被交互的项目(Pan, Cai, Chen, Chen, & Chen, 2022),其性能在很大程度上取决于会话序列中相邻项目之间的关联。
传统SBR的一个典型代表方法是马尔可夫链(MC)(Cheng, Yang, Lyu, & King, 2013),它通过建模用户-项目交互行为来预测下一次交互。然而,该模型假设当前序列交互仅依赖于少数最近的项目,因此只能捕捉到短期依赖关系,忽略了序列中的丰富动态信息。因此,需要更有效的推荐模型来处理会话序列数据。由于深度神经网络强大的数据拟合能力,一些基于卷积神经网络(CNN)(Wang, Lee, & Wu, 2022a)和循环神经网络(RNN)(Liu, Zeng, Mokhosi, & Zhang, 2018)的推荐模型应运而生。基于CNN的推荐方法首先将项目序列转换为嵌入矩阵,然后通过卷积核学习序列的局部特征作为序列的表示。然而,这些方法受到卷积核大小的限制,无法有效捕捉序列的长期依赖关系。虽然基于RNN的方法能够获取序列中的长期依赖关系,但在实际应用中可能会过度强调相邻项目之间的顺序并学习许多错误的依赖细节。考虑到Transformer在编码序列方面的强大能力,最近的研究将其应用于RSs并取得了显著成果。Transformer(Vaswani等人,2017)是一种基于注意力机制的深度学习模型,能够同时利用位置嵌入模块来捕捉用户-项目交互序列中不同项目的重要性,从而提高SBR的性能。然而,SBR任务的训练数据集通常更加稀疏,这削弱了Transformer建模序列中项目关联的能力。
在图神经网络(GNN)(Ouyang, Xu, Chen, Xie, Zheng, Song, Zhao, 2023, Wang, Wei, Cong, Li, Mao, Qiu, 2020)首次应用于社交网络分析之后,将其应用于SBR任务的研究受到了广泛关注。基于GNN的SBR模型将会话序列构建为图模型,然后使用GNN来探索项目之间的复杂转换关系。然而,由于GNN更关注成对和局部的邻居项目,因此无法有效获取非成对项目信息。DHCN(Xia等人,2021)使用超图对高阶非成对关系进行建模,并将自监督学习纳入建模过程。现有方法大多关注挖掘用户的总体兴趣,忽略了不同层次兴趣的转换。例如,图1中给出了一个交互序列(“烤箱”、“鸡蛋”和“牛奶”)。如果我们关注用户最后点击的项目“牛奶”,用户可能对“牛奶产品”更感兴趣,下一个合理的推荐可能是“酸奶”。但如果我们关注用户的更高层次兴趣,即同时考虑“鸡蛋”和“牛奶”,用户可能对“早餐”更感兴趣,“面包”可能是一个更好的建议。此外,当我们综合考虑“烤箱”、“鸡蛋”和“牛奶”时,可以发现用户可能更想制作糕点,因此可能需要合适的面粉。上述示例说明了挖掘用户不同层次兴趣的重要性。
在此基础上,研究人员开始结合不同粒度的兴趣来捕捉用户偏好的层次结构。HIDE(Li, Gao, Luo, Jin, & Li, 2022)通过滑动窗口构建意图超边来学习兴趣变化,而MSGIFSR(Guo等人,2022)使用连续的用户意图单元构建异构图来捕捉多粒度意图。尽管这些方法表现出色,但它们有两个显著的限制,阻碍了进一步的改进。首先,长距离依赖关系(指会话中非相邻项目之间的关系)没有得到明确建模。HIDE依赖于局部超边聚合,而MSGIFSR依赖于顺序编码,这两种方法都难以捕捉会话中相隔较远的项目之间的交互。其次,这些方法缺乏有效机制来解决SBR固有的数据稀疏性问题,尤其是对于交互历史有限的短会话。尽管HIDE采用意图分类任务作为辅助目标,但它没有利用对比学习的表示能力。对比学习(CL)(Xie等人,2022)被认为是一种缓解数据稀疏问题的好方法,可以从未标记数据中提取更多监督信息,并减少模型对标记数据的依赖。
为了克服这些限制,本研究提出了一个增强对比学习的多层次兴趣感知图注意力网络(CLEMI-GAT)用于SBR。首先,它构建了一个多层次兴趣感知的超图来捕捉层次化兴趣,同时构建了一个中间交互图来模拟会话内的长距离依赖关系,这是HIDE和MSGIFSR所不具备的功能。其次,融合门控网络结合了多层次和总体兴趣,提供了用户意图的全面表示。第三,将对比学习作为辅助任务整合进来,以增强嵌入并缓解数据稀疏性。最后,重复探索归一化(RENorm)区分了预测中的重复和探索行为。总体而言,这些创新使CLEMI-GAT能够同时建模多层次兴趣、长距离依赖关系、数据稀疏性和重复探索行为,从而实现更准确的SBR。
本研究的主要贡献总结如下:
•构建了一个多层次兴趣感知的超图,有效捕捉用户不同层次的兴趣。中间节点的整合有助于更好地学习序列中项目之间的依赖关系,从而实现兴趣感知的多样化粒度。
•采用重复探索归一化(RENorm)来区分会话内外的项目权重,并联合优化对比学习任务和SBR任务,以提高推荐性能。
•在三个真实数据集上进行了广泛的实验。实验结果表明,CLEMI-GAT在所有选定的推荐性能指标上均优于对比模型,如HIDE和MSGIFSR。