
-
生物通官微
陪你抓住生命科技
跳动的脉搏
KBDR:基于图匹配的文档检索方法,并结合知识增强技术
《Scientific Reports》:KBDR: document retrieval based on graph matching with knowledge enhancement
【字体: 大 中 小 】 时间:2026年05月29日 来源:Scientific Reports 3.9
编辑推荐:
摘要文档检索是指在语料库中识别语义上最相关的文档内容。现有的匹配算法可能无法识别所有文档中词汇的同义关系,从而导致检索结果不准确。为了解决这一限制,本文提出了基于知识的文档检索(KBDR)方法,该方法利用基于图的知识扩展技术。首先,通过命名实体识别和关系提取来构建文档图谱;其次,
文档检索是指在语料库中识别语义上最相关的文档内容。现有的匹配算法可能无法识别所有文档中词汇的同义关系,从而导致检索结果不准确。为了解决这一限制,本文提出了基于知识的文档检索(KBDR)方法,该方法利用基于图的知识扩展技术。首先,通过命名实体识别和关系提取来构建文档图谱;其次,利用HowNet和ConceptNet等外部知识库来扩展实体,以丰富语义联系;最后,应用图注意力网络(GAT)对实体间的依赖关系进行建模,从而实现相关性排序。通过五个数据集(CIPP、CNSE、CNSS、AAN和OC)的评估,KBDR的表现优于基线方法,在CNSE数据集上达到了25.88%的最高召回率。总体而言,KBDR能够提高文档检索的效率和鲁棒性,有效处理概念偏差,并推动该领域向更复杂的检索系统发展。