《Expert Systems with Applications》:Enhancing Knowledge Graph Link Prediction through Unsupervised Re-ranking with BGE Sentence Embeddings
编辑推荐:
本文提出一种基于预训练多语言句子嵌入的无监督重新排序框架,结合结构嵌入模型与语义连贯性评分,有效提升知识图谱补全的链接预测性能。实验表明,在FB15K237和FarsPredict数据集上,该框架使RotatE的Hits@10提升24.46%,ConvE的Hits@10达0.7902,显著优于传统KGE模型,且无需额外训练和微调。
Najmeh Torabian|Mohsen Jahanshahi|Behrouz Minaei-Bidgoli
伊朗德黑兰伊斯兰阿扎德大学
摘要
知识图谱补全(KGC)是通过预测缺失链接来改进知识图谱(KGs)的关键任务。虽然基于嵌入的模型能够有效捕捉结构模式,但它们通常难以处理语义细微差别,尤其是在资源匮乏的语言中。相反,大型语言模型(LLMs)提供了丰富的语义理解能力,但计算成本高昂,且难以直接整合到结构推理中。为了解决这一差距,我们提出了一种新颖的、无需训练且即插即用的重新排序框架,该框架通过利用预训练的多语言句子嵌入(特别是BAAI/bge-m3)的语义空间来增强KGC。我们的方法为候选三元组计算一个“语义一致性”分数,并将其与标准KGE模型(例如RotatE、ConvE)的结构分数结合起来。这种方法不需要额外训练或微调,因此效率极高且适应性强。我们在两个不同的数据集上评估了我们的框架:FB15K237(英语)和FarsPredict(波斯语,资源匮乏)。实验结果表明,我们的无监督重新排序方法在FarsPredict上将Hits@10提高了多达116%,在FB15K237上提高了68%,同时在某些情况下将平均排名降低了96%以上。这些发现突显了以轻量级、解耦的方式结合结构和语义模型的潜力。
引言
知识图谱(KGs)已成为表示结构化知识的强大范式,其中著名的例子包括WordNet、Freebase和Wikidata,它们捕获了多样化的事实关系。KGs被组织成三元组(h, r, t),其中h和t通过关系r连接。尽管KGs在信息检索、问答和推荐系统等应用中很有价值,但它们的离散性质和不完整性带来了计算挑战。
知识图谱嵌入(KGE)技术通过学习实体和关系的低维向量表示来解决这些挑战,从而实现链接预测——即预测不完整三元组中缺失的实体。KGE模型使用评分函数S(h, r, t)来评估三元组的合理性,但面临关键限制:(1)几何和代数方法可能无法完全捕捉实体和关系名称中的语义细微差别,(2)复杂模型需要密集训练,而简单模型则牺牲了准确性,(3)不同模型在不同实体和关系类型上的表现各不相同。
为了提高链接预测的准确性,该领域最近出现了将知识图谱与大型语言模型(LLMs)结合的趋势。例如指令调优(Yao, Peng, Hu, Zhang, Huang, & Hua, Zhang, Chen, Guo, Xu, Zhang, & Chen)和生成式重新排序(Wei et al., 2023)等方法建立了新的最佳实践(SOTA)基准。然而,这种准确性是以高昂的计算成本为代价的。用数十亿参数的模型(如Llama-2-13B、ChatGLM)进行微调需要大量的GPU资源和能耗,这与“绿色AI”(Schwartz, Dodge, Smith, & Etzioni, 2020)倡导的以效率为主要评估指标的原则相悖。此外,生成解码的自回归性质引入了显著的延迟,某些方法在标准推理基准测试中需要超过100小时(Zhang et al., 2023)。这种资源密集型特性为资源匮乏的环境设置了障碍,限制了实时部署的可能性。相比之下,我们的工作提出了一种可持续的、资源匮乏的替代方案。通过以严格无监督的、“即插即用”的方式利用预训练的BGE句子嵌入,我们在不进行任何额外训练的情况下实现了优于这些参数密集型基线的性能。该框架有效地弥合了结构学习和语义理解之间的差距,同时保持了传统嵌入模型的计算效率。
本文提出了一种轻量级的、无监督的重新排序机制,该机制利用多语言句子嵌入(BAAI/bge-m3)1来增强链接预测。我们的方法通过语义一致性信号增强了KGEs学习到的结构模式,提供了一个无需额外训练的模型无关的后处理层。这使得我们的方法与资源密集型的基于LLM的方法相比具有更高的成本效益和更易于部署的特点,同时在不同语言(包括资源匮乏的波斯语)中仍然有效。
为了解决上述限制,我们提出了一种新颖的无监督重新排序流程,旨在提高现有知识图谱嵌入(KGE)模型的链接预测准确性。我们的方法利用了强大的预训练多语言句子嵌入模型BAAI/bge-m3提供的丰富语义表示,来改进基础KGE模型生成的候选列表。
我们的方法包括两个阶段。首先,使用OpenKE框架中实现的标准KGE模型生成给定链接预测查询(例如(
h, r, ?)或(?,
r, t)的初始top-k候选实体集。然后,使用从BGE嵌入派生的语义一致性分数对这些top-k候选者进行重新排序。具体来说,对于每个候选三元组(
h, r, t′),我们构建三个文本表示:
1.头部实体‘h’
2.头部-关系对‘h r’
3.完整的三元组‘h r t’
这些文本字符串使用BAAI/bge-m3模型编码为密集向量。然后通过计算这三个嵌入之间的平均成对余弦相似度来量化语义一致性。平均相似度较高的三元组被认为在语义上更合理,因此排名更高。这个重新排序步骤完全是无监督的,依赖于BGE模型中的预训练知识,并通过自定义的RerankTester模块无缝集成到OpenKE工具包中。
本文的主要贡献可以总结如下:
一种新颖的无监督重新排序流程:
我们介绍并实现了一种新的无监督重新排序流程,用于增强知识图谱中的链接预测。该流程独特地利用了由先进的BAAI/bge-m3句子嵌入模型捕获的三元组组件文本表示之间的语义一致性,以改进基础KGE模型的输出。•KGE模型上的显著性能提升:
我们在两个不同的数据集上展示了显著的改进。在英语基准FB15K237上,我们在四种不同模型(RotatE、TransE、Analogy和ConvE)上验证了该方法,其中ConvE取得了优异的结果:最高的MRR为0.5249(+74.91%),是唯一一个提高Hits@1(+93.61%)的模型,并达到了最高的Hits@10,为0.7902(+68.16%)。在资源匮乏的FarsPredict数据集(波斯语)上,我们的方法同样提升了现有的KGE模型;例如,RotatE的Hits@10得分从0.4393提高到了0.5479。这证实了该方法作为通用多语言解决方案的有效性。•模型无关的方法:
所提出的重新排序层是模型无关的,意味着它可以直接应用于各种现有的KGE模型,而无需修改其内部架构或重新训练。它在四种不同模型架构——RotatE(基于旋转的)、TransE(翻译的)、Analogy(混合双线性-翻译的)和ConvE(基于卷积神经网络的)上的成功应用,证明了其广泛的适用性和与不同KGE范式的兼容性。我们选择这些模型作为不同架构的代表性代表,其中ConvE在语义重新排序方面表现出色,同时在所有指标上都有所改进。我们选择TransE作为基础翻译模型,以避免重复并保持范式的多样性。•在OpenKE中的实际实现:
我们在广泛使用的OpenKE框架中提供了我们重新排序策略的实际实现,通过引入一个RerankTester模块,便于社区采用和进一步研究。•跨语言和跨架构验证:
我们在两个语言和结构上不同的知识图谱FarsPredict(波斯语)和FB15K237(英语)以及代表不同范式的多个KGE架构上展示了我们方法的有效性。在两个数据集和所有四个测试模型(RotatE、TransE、Analogy和ConvE)上的一致性和显著改进,验证了我们基于BGE的重新排序方法的稳健性、跨语言能力和架构通用性,展示了其在多语言链接预测方面的潜力及其对不同知识图谱特征和模型范式的适应性。ConvE在FB15K237上的出色表现特别证明了将卷积架构与语义重新排序相结合的强大潜力。相关工作
相关工作
本节将我们提出的方法论置于知识图谱补全(KGC)的更广泛背景下。本文的贡献与三个主要研究方向相交,我们将依次回顾它们:(1)从图结构中学习的基礎知识图谱嵌入(KGE)模型,(2)直接将文本语义整合到其架构中的混合KGE模型,以及(3)包括结构集成方法在内的后处理增强方法。
提出的方法论:基于BGE的重新排序
我们提出的方法论通过引入一个利用预训练句子嵌入的语义信息的无监督重新排序层来增强知识图谱中的链接预测。这种方法旨在与现有的知识图谱嵌入(KGE)模型互补。整个流程包括两个主要阶段:首先由基础KGE模型生成初始的top-k候选实体集,然后使用我们基于BGE的评分机制对这些候选者进行语义重新排序。
实验设置
本节详细介绍了用于评估我们提出的基于BGE的重新排序方法的实验设置,包括数据集、基础KGE模型、评估协议和实现细节。
结果与讨论
本节展示了我们基于BGE的重新排序方法在两个基准数据集上的实验结果。我们首先确定了各种KGE模型在FarsPredict和FB15K237上的基线性能,然后展示了应用我们的重新排序方法所取得的改进,最后通过跨数据集比较讨论了这些发现的意义。
结论与未来工作
我们提出了一种新颖的无监督重新排序方法,通过利用BAAI/bge-m3句子嵌入来增强知识图谱链接预测。我们的方法根据头部实体、头部-关系对和完整三元组之间的文本表示的语义一致性对候选三元组进行评分,为结构KGE模式引入了补充的语义信号。
在FarsPredict(波斯语)和FB15K237(英语)上进行的全面实验使用了四种不同架构的
未来工作
未来研究有几个有前景的方向:
•更广泛的评估:
在额外的基准测试(WN18RR、YAGO3-10、NELL-995)和特定领域的KGs上进行测试,以进一步验证其稳健性和泛化能力。•扩展模型覆盖:
将重新排序应用于其他KGE架构(TransD、TransH、DistMult、SimplE、HolE、TuckER、ComplEx),以全面评估与不同模型范式的协同作用,特别是继ConvE之后基于神经网络的方法。CRediT作者贡献声明
Najmeh Torabian:概念化、方法论、软件、写作——原始草稿。Mohsen Jahanshahi:监督、写作——审阅与编辑。Behrouz Minaei–Bidgoli:监督、项目管理。
利益冲突声明
作者声明他们没有已知的竞争财务利益或个人关系可能影响本文报告的工作。