知识图谱(Knowledge Graph),是一种以图结构的方式存储、管理和查询知识的方法,它通过对海量非结构化的信息进行形式化建模,构建一个相互关联、层次分明、可理解的知识网络。知识图谱通常由节点(node)和边(border)组成。节点是实体或概念,边则是实体之间或概念与概念之间的关系。其中每个实体都有其相关的属性,这些属性从多个角度定义了一个实体的特征。
定义
知识图谱是一种以图结构的方式存储、管理和查询知识的方法,它将海量非结构化的信息进行形式化建模,构建一个相互关联、层次分明、可理解的知识网络。将数据转化为结构化数据,提供了从数据中获取信息、进行决策分析的能力。
通过对海量非结构化信息进行形式化建模,构建一个相互关联、层次分明、可理解的知识网络,为各种智能应用提供了底层支撑,使得智能应用可以无缝嵌入到各种知识图谱之中。
层次结构
按照层次结构可以分为四层:数据层、本体层、知识表示层、应用层。
数据层包含三元组、实体、属性和关系。本体层描述实体及其关系,本体层提供实体及其关系的形式化表示,是知识图谱的核心和基础。知识表示层是将本体和关系从数据中抽象出来的过程,是知识图谱的表现形式。应用层包括应用系统、知识库和数据仓库。
通过表示和计算将实体与实体之间的关联关系转化为有意义的语义信息,是知识图谱中最重要的部分。知识表示法基于符号逻辑和抽象概念进行建模,其中符号逻辑主要用来表达概念之间的语义关系,抽象概念则用来表示概念所包含的内涵。
查询方式
查询方式有基于关系和基于属性两种。基于关系的查询方式主要有传统的查询,即通过输入关键字查询实体之间的关系,并把关系映射到知识图谱中;基于属性的查询方式则是通过输入一个属性来查询多个实体,然后用它们之间的关系来表示知识图谱。
通常情况下,节点都是实体,而边则是实体之间或概念与概念之间的关系。在图数据库中,一个实体被标记为边,而一个实体被标记为节点。
构建的过程
从数据、概念、实体及关系等多个角度出发,利用多个技术工具进行知识的抽取、融合、存储和应用。
一般来说,知识图谱的构建过程可以分为以下四个阶段:
1.数据准备:将数据中的实体及关系抽取出来,并对数据进行清洗和规范;
2.概念抽取:将知识转化为概念,并构建主体框架;
3.关系抽取:从概念中抽取实体之间的关系,并将其映射为图谱中的实体和属性;
4.图谱构建:完成构建。
常见问题
知识图谱是指由一系列定义明确、相互关联的实体以及它们之间的关系组成的网络。它可以对数据进行可视化,支持高效的查询和分析,并提供更多的信息和知识。
它可以是结构化、非结构化的数据,也可以是文本、视频、图像、语音等非结构化数据。
知识图谱是一个开放、共享和互操作的统一数据模型,可用于在不同类型的数据之间建立关联关系,并支持在多种不同类型数据之间进行推理,其特点是对各种类型数据进行统一表达和存储,并为各类知识之间的相互联系和交互提供统一的接口。
(文章转载于天润融通)