【知识图谱相关理论基础概述2800字】_第1页
【知识图谱相关理论基础概述2800字】_第2页
【知识图谱相关理论基础概述2800字】_第3页
【知识图谱相关理论基础概述2800字】_第4页
全文预览已结束

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

--9-知识图谱相关理论基础概述知识图谱是一种将相关领域数据信息收集融合,并利用可视化的图谱形象展示特定领域知识实体属性关系的模型。本节主要针对本文所提的慕课资源推荐应用场景,对慕课知识图谱构建和知识图谱卷积网络的相关研究基础作出相应介绍。1.1知识图谱构建知识图谱作为一种新兴的知识表示形式,采用了图模型来详细地描述知识之间的相互关系。图模型的组成元素有节点和边。不仅实体可以被认为是节点,例如教师、学生和演员等,概念也可以被认为是节点,例如深度学习、智慧家居和区块链等。边既可以是某个实体的属性,如教师的名字、学生的性别和课程的时长等,又可以是两个实体之间的关系。例如,教师实体和学生实体间存在着教学的关系,学生实体和课程实体存在学习关系,以及课程实体之间存在前置关系。知识图谱结构友好,一般可以表示为三元组的形式,例如三元组(湖南,省会,长沙)。这种描述方式也是万维网联盟指定的资源描述结构(ResourceDescriptionFramework,RDF)格式。RDF是由节点和边构成,一般是“实体-关系-实体”的关系。通过知识图谱可以将事实、概念、知识等统一在一张图谱中描述出来,而且这些实体可以通过语义逻辑的关系关联起来,形成有序组织的知识。在不同场景和领域中,知识图谱的建模和构建会有不同的流程。在概念知识图谱中,其构建流程通常包括关系抽取、关系补全和关系纠错。在百科知识图谱中,其构建流程通常包括数据获取、属性抽取、关系构建和实体分类。因此,知识图谱的构建步骤主要包括信息的获取与抽取,以及知识的融合、推理和表示。图2-2展示了知识图谱构建的常见步骤,其中最重要的步骤分别是信息的获取、知识的融合和处理。本文的知识图谱构建的主要分为五个步骤,分别是数据获取、信息获取、知识融合、知识处理和知识图谱构建。在数据获取阶段,慕课网站上的信息非常丰富,可以分为结构化数据、半结构化数据和非结构化数据。针对结构化数据,例如:网页中的课程信息,会将整体结构进行爬取,并保存在结构化的数据库当中。在结构化数据库中会按照不同的数据源和信息进行建库和建表,数据库的主键、字段和数据类型根据预测进行设计。当完成页面的解析时,会将结构化的数据保存在数据库中,以便后续使用。针对非结构化的数据,例如:评论文本,课程介绍等,会采用非结构化的数据库去保存。文本信息为主要的非结构化数据,保存的方式采用Key-Value的形式保存,Key为网页的编号,Value为文本内容或者段落结构的文本。针对半结构化的数据,会采用分别存储的方式,将非结构化的内容保存在非结构化的数据库,结构化的内容会进行解析并保存在结构化的数据库。在获取数据后,需要对数据进行信息获取。通过爬虫获得的文本内容通常包含了课程、知识点等多个实体信息,因此可以采用实体识别模型进行实体的抽取。实体识别模型的标注数据会通过人工标注的方式进行标注,会将部分的文本数据按照BIO的格式进行标注。在得到标注数据后,可以采用多种实体识别模型进行训练,然后将训练后的模型对其他未标注的数据进行预测,得到所有文本内容的有效实体。同时,关系数据会通过页面结构和关键词匹配的方式定义实体之间的关系。完成以上步骤后,即可获得实体-关系-实体的三元组信息。在获取信息后,由于网页的爬虫获得的实体信息众多,部分实体信息存在歧义的情况,需要对其进行知识融合。例如,知识图谱和KnowledgeGraph这两个单词的意思是一样的,因此需要共指消歧。消歧的方法是利用第三方的数据库和外部的信息对歧义信息进行消除,如果在第三方的数据库中,实体之间的指向是相同,即将实体进行统一并去除冗余的实体信息。在知识处理阶段,实体和关系在得到消歧和纠错后会得到较为正确的本体信息,同时会利用人工抽查,知识搜索和知识推理等方式得到的信息进行质量评估。通过不断地优化质量效果,逐步对实体和关系信息进行纠错、消歧和排查。图2-2知识图谱的构建1.2知识图谱卷积网络知识图谱中包含了大量实体和关系的信息,若直接使用推荐算法进行模型训练,可能会使模型训练速度因数据量太大而过慢。为此,研究可以引入图神经网络(GraphNeuralNetworks,GNN)对这个问题加以改善。目前,大多数图神经网络模型采用的架构是图卷积神经网络(GraphConvolutionalNetworks,GCNs)。图神经网络主要用于识别光谱,使用卷积神经网络将光谱信息进行卷积和映射成低维的稠密向量。图卷积神经网络在图表示的相关任务上的应用非常普遍,因为图的节点的表示可以将图结构进行很好的表示,从而为后续的任务提供了信息的输入,因此图神经网络也成为了研究人员的研究热点。国外对图神经网络的研究相对领先。BrunaJ等人REF_Ref19924\r\h[53]提出利用傅立叶领域的卷积方法并计算拉普拉斯算子的主成分分析。DefferrardM等人REF_Ref19957\r\h[54]通过用切比雪夫拓展对图拉普拉斯算子的卷积核进行优化估计。KipfTN等人REF_Ref19996\r\h[55]利用地理信息一阶优化光谱图像卷积的卷积架构。图神经网络主要的内容是池化算子和卷积算子的设计和构建,其中,节点的表示在相关任务的学习和应用过程显得尤为重要,下面的内容将着重介绍一下图神经网络的卷积算子。图卷积算子的构建分为谱方法和空间方法两类。图卷积神经网络的谱方法,利用卷积定理从谱域定义图卷积。(1)图信号处理卷积定理指的是利用信号傅立叶变换的乘积完成变换,公式如(2-1)所示,F(f(2-1)其中,F(f)表示f的傅立叶变换,然后经过傅立叶逆变换,可以得到:f(2-2)其中,F−1傅立叶逆变换就是为了解决图数据不满足平移不变性而造成的卷积定义的问题进行了信号的转换,实现了图卷积。(2)基于卷积定理的图卷积神经网络卷积定理指的是每一层都会利用图卷积的算子,对每层数据进行卷积,同时卷积核的结果形成多层的卷积结果,然后经过损失函数的反向传播去更新权重,优化网络参数。卷积定理的神经网络结构公式如公式(2-3)所示,X(2-3)其中,p和q分别是变量的输入和输出的纬度,m代表的是m层,F指的是卷积核,h指的是激活函数,在卷积定理的神经网络中,输入变量会经过变换核处理变成q维的输出变量。空间方法主要是通过空间角度重新定义了图神经网络的框架并进行改进。最经典的通用框架就是混合卷积网络,通过定义映射函数将每个节点的局部结构得到等长的向量[56]。映射函数如公式(2-4)所示,D(2-4)其中,N(x)表示x的近邻节点集合,u(x,y)指的是坐标系u下的节点,w指的是权重函数。基于聚合函数的图卷积神经网络是利用聚合函数被做成循环递归函数的形式,将每个节点与周边节点和连边通过聚合的方式得到当前节点的表达。聚合函数如公式(2-5)所示,h(2-5)其中,l代表了节点或者边的标签,fw指的是聚合函数,其会通过递归函数的方式进行迭代,并且更新x,最后达到收敛的状态。近年来,在引入注意力机制方式后,可以通过注意力机制重新构造聚合函数,在定义当前

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论