
图源百度AI
摘要:随着互联网信息的爆炸式增长和知识图谱技术的发展,知识的规模显著扩大,置信度评分可刻画知识的不确定性。然而,目前大多数面向知识图谱的知识推理方法忽略了知识的不确定性,并且未充分考虑语义信息和不同语义之间的交互作用。为解决上述问题,本文提出一种基于语义感知的不确定知识推理模型(SAUR),通过在实体和事实上捕捉知识图谱的语义信息来丰富推理过程。首先,引入外源语义信息,通过局部空间语义的相互作用增强实体的表征学习。其次,将实体表征作为先验信息,通过三元组序列进一步挖掘知识的上下文信息。最后,SAUR模型对知识图谱的不确定信息进行置信度学习,以推理不确定性知识。通过公开数据集 CN15K、NL27K 和 ppi5K 的实验表明,该方法在置信度预测和链路预测任务上优于已有基线方法。
关键词:知识图谱;知识推理;不确定性;知识图谱嵌入;语义特征
一、研究背景与意义
近年来,随着互联网技术的飞速发展,数据规模呈指数式增长,积累了大量潜在价值的知识。如何高效组织和表达这些知识成为工业界和学术界的研究重点。知识图谱(Knowledge Graph, KG)作为一种结构化知识表达方式,通过建模现实世界中的实体及其关系,为知识的组织和推理提供了有效工具。然而,大多数现有研究基于确定性假设,将知识表示为明确的三元组,但现实世界的知识往往伴随不确定性和复杂性。例如,不同来源可能对同一事实存在矛盾描述,或知识本身具有概率性或模糊性。这种不确定性在医药、法律、金融等依赖推断决策的领域尤为显著,传统方法难以应对。
知识推理是知识图谱应用的核心,能从已有知识中推断未知信息。近年来,基于神经向量的知识图谱嵌入方法随着深度学习的发展得到了广泛应用,并在确定性知识图谱补全任务中表现出色。然而,这些模型难以直接迁移到不确定知识图谱场景。一方面,它们未充分考虑置信度信息,无法有效利用不确定性进行推理;另一方面,不确定知识图谱不仅需要推理相关信息,还需预测信息的置信度,对模型的归纳推理能力提出更高要求。
因此,如何通过知识图谱精准建模现实世界的不确定性,并有效推断未知知识,是当前研究的核心问题,具有重要的理论意义和广泛的实际应用价值。
二、主要内容
为将更丰富的语义信息及其交互作用充分纳入不确定知识图谱推理中,本研究提出了基于语义感知的不确定知识推理框架 (SAUR)。SAUR由语义引导的特征传播、语义增强的事实表征和不确定知识推理三部分组成。首先,通过 BERT 模型引入外源信息,静态表示实体描述信息。然后,引导简化的 GNN 卷积层动态捕捉实体间语义关联。接着,通过 LSTM 学习三元组序列捕捉知识上下文信息。最后,将三者输出联合训练,并通过置信度映射为知识的不确定性。
三、主要结论及政策建议
为验证模型 SAUR 的性能,本文在 CN15K、NL27K和 ppi5K 三个公开数据集上进行了置信度预测和链路预测任务的实验。在置信度预测任务中,SAUR 与UKGE、BEUrRE、UKGsE、UComplEx 和UBetaE五个模型进行对比,结果显示 SAUR 在所有数据集上的表现最佳,表明该模型能够有效拟合不确定性知识图谱的置信度,并具有良好的迁移能力,说明多重语义信息的引入显著增强了知识的表示效果。
在链路预测任务中,SAUR 与 RotatE、UKGE和 BEUrRE 三个模型比较,结果显示 SAUR 在MRR、Hit@1 和Hit@3 指标上最优,Hit@10 略逊于RotatE。RotatE 通过复数空间旋转捕捉长路径关系,而SAUR 更注重邻近关系和上下文语义。SAUR 在特定任务中能精准定位关键关系,但对长尾关系的探索能力有限。结合不同下游任务,合理取舍路径信息,可以更好发挥 SAUR 优势。
综上,SAUR 通过整合多重语义信息和不确定信息,展现出灵活性与优异性能,为不确定知识图谱推理提供了有效解决方案。
四、边际贡献与未来拓展
本文提出了一种基于语义感知的不确定知识推理框架SAUR。该框架综合考虑了外源语义信息、知识图谱的结构信息以及三元组事实的置信度,显著增强了知识图谱的表达能力,并有效整合了知识的不确定性以支持更为准确的知识推理。
在未来的工作中,将考虑以下几个方面:(1) 研究如何结合合理的逻辑规则挖掘未知的事实;(2)考虑关系类型的重要性从而更好地表征实体信息;(3) 考虑不确定性的其它表现形式:概率论、概率语言术语集、模糊集以及可能性论等。
五、写作、投稿过程的心得体会
本文针对知识图谱推理中普遍存在的不确定性和语义交互问题,提出了一种基于语义感知的不确定知识推理模型。通过引入外源语义信息和上下文信息,构建了模型的核心方法,并对多个公开数据集进行了实验验证,最终确定了模型在置信度预测和链路预测任务中的优越性。经过多次撰写和调整,我们将完善后的论文投稿至《系统工程理论与实践》。在审稿过程中,外审专家和编辑部对文章的研究创新点、模型设计、实验结果分析、语义信息的表示方法以及参考文献的完整性等提出了中肯而重要的意见。我们认真吸收这些建议,并对论文进行了反复修改,文章的整体质量和研究深度因此得到质的提升。在此,我们对《系统工程理论与实践》编辑部老师和审稿专家们的辛勤付出表示由衷的感谢。
本文摘编自《系统工程理论与实践》2026年,第46卷,第1期论文《基于语义感知的不确定知识推理模型》(点击题目链接全文);
作者:赵一晴1, 硕士研究生, 研究方向: 知识图谱, 智慧医疗;李喜华1*(通信作者), 博士, 副教授, 博士生导师, 研究方向: 智能决策方法, 智慧医疗;邓彬1,博士研究生, 研究方向: 知识图谱, 智慧医疗
1. 中南大学 商学院, 长沙 410083