知识基础工程与应用 2_第1页
知识基础工程与应用 2_第2页
知识基础工程与应用 2_第3页
知识基础工程与应用 2_第4页
知识基础工程与应用 2_第5页
已阅读5页,还剩66页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第三章知识表示

同济大学“智能制造工程专业联盟”教材编委会第一节概述第二节一阶谓词逻辑表示法目录第三节框架表示法第四节语义网络第五节产生式表示法第六节过程表示法第七节状态空间表示法第八节面向对象表示法第九节基于范例表示法目录第十节基于ROUGHSET表示法第十一节基于神经网络的知识表示第十二节基于本体的知识表示法第十三节知识图谱中的知识表示第一节概述一、知识表示的含义利用计算机能够接受并进行处理的符号和方式,来表示人类在改造客观世界中所获得的知识。二、知识表示的准则完整表示领域知识助力知识推理便于知识的管理与维护便于知识的理解和实现第一节概述三、知识表示的发展简史20世纪60年代中期,开始作为一个独立的研究课题20世纪60年代后期,专注于语义网络表示模式20世纪70年代语义网络、一阶谓词逻辑、框架和产生式系统等重要表示方法的出现,标志着知识表示成为一个独立研究的领域,并且在不断的发展中。第二节一阶谓词逻辑表示法一、谓词逻辑表示规则基本组成部分:谓词符号、变量符号、函数符号和常量,并用圆括号、方括号、花括号和逗号隔开,以表示论域内的关系。例如:“张三是学生”,用最简单的原子公式:Student(张三)。Student是谓词符号,张三是常量。某学生在某房间:

Inroom[Student(x),Room(y)]

Inroom,Student,Room谓词符号x,y变量符号第二节一阶谓词逻辑表示法一、谓词逻辑表示规则用联词(与)、(或)以及→(蕴涵,或隐含)等,组合多个原子公式构成比较复杂的合式公式。例如:“张三和李四”可写成:

Student(张三)Student(李四)学生李四住在一幢黄色的房子里:Lives[Student(李四),House(x)]Color[House(x),Yellow]如果该书是张三的,那么它是蓝色(封面)的:

Owns[Student(张三),Book-1]→Color(Book-1,Blue)第二节一阶谓词逻辑表示法二、谓词逻辑表示的演算

两个合式公式的计算表PQP

QP

QP

Q¬PTTTTTFFTTFTTTFTFFFFFFFTT第三节

框架表示法一、框架理论1975年Minsky提出的,作为理解视觉、自然语言对话和其它复杂行为的基础一个框架可以形式地表示如下:FRAME<框架名>

槽名1:侧面名11:侧面值11

侧面名12:侧面值12……

侧面名1m:侧面值1m……

槽名n:侧面名n1:侧面值n1

侧面名n2:侧面值n2……

侧面名np:侧面值np第三节

框架表示法一、框架理论举例一个饭店框架

框架名:<饭店>种类:是否含住宿:<是,否>类别:<自助餐厅,商务餐厅,快餐,其他>地址:营业时间:缺省值<10:00-22:00>场所大小(平方米):人均消费(元):食品风味:地域特色:<中式,美式,法式,意大利风味,日式,韩国料理,其他>缺省值<中式>菜系:<鲁菜,川菜,粤菜,苏菜,闽菜,浙菜,湘菜,徽菜>缺省值<浙菜>特色菜:<片皮鸭、红烧肉、黑椒牛肉、……>相关服务:是否提供停车服务:<是,否>

是否提供预订服务:<是,否>第三节框架表示法二、框架的性质及特点描述事物时,如果进一步描述其中某细节,那么可以扩充为额外一些框架。能够借助框架作出判断能够借助框架来了解一些事物能够通过一系列的实例来修正框架对某些事物的不完整描述重要性质表现在:能够预测相关信息第三节框架表示法二、框架的性质及特点可以描述类型的含义、事件和行为,是一种经过组织的结构化知识表示方法。然而框架结构并没有形成对应的理论架构,框架、槽和侧面等单位没有明确的语义。可以组成框架网络,反映有层次或很复杂的关系,代表完整的知识结构,能够说明复杂的知识内容。附加过程是关键特征,可以融合描述性知识和过程性知识,形成有机的一体化系统。已经推出很多基于框架理论的通用知识语言,但是增加用户建立知识库的负担。框架的主要特点:第四节语义网络一、语义网络的概念和结构1968年J.R.Quillian首先提出语义网络1972年Simon确定语义网络的基本概念语义网络为一个带标识的有向图,其中带有标识的结点表示问题领域中的物体、概念、事件、动作或势态,结点之间的有向弧也带有标识,表示结点之间的语义联系。有时又将弧称为联想弧,所以语义网络又称为联想网络。第四节语义网络一、语义网络的概念和结构典型的语义联系有四类:(1)分类建立在个体的值与类之间。把一组同样类型的个体值划归在某种类型之下,这种个体值叫做类的实例,构成Instance-of关系第四节语义网络一、语义网络的概念和结构典型的语义联系有四类:(2)聚类常使用part-of表示个体与其组成成分之间的关系。第四节语义网络一、语义网络的概念和结构典型的语义联系有四类:(3)泛化常使用is-a表示个体属于一种确切的类型。第四节语义网络一、语义网络的概念和结构典型的语义联系有四类:(4)联合常使用member-of表示个体与整体之间的联系,当个体概念不重要而需要强调整体的某些性质时则引入。第四节语义网络二、语义网络特性传递方式“特性传递”是将高层概念的特性继承下来。有三类:(1)直接传递(pass)子结点直接把父结点的属性继承过来。第四节语义网络二、语义网络特性传递方式“特性传递”是将高层概念的特性继承下来。有三类:(2)附加传递(add)子结点综合父结点的特性和自身特性,不发生矛盾时可以推出新的特性。第四节语义网络二、语义网络特性传递方式“特性传递”是将高层概念的特性继承下来。有三类:(3)排斥传递(exclude)子结点特性与父结点特性不相容情况下,仅取子结点的特性,抑制父结点特性的传递。第四节语义网络三、联结词在语义网络中的表示方法(1)合取合取命题通过引入“与”结点来表示(2)析取析取命题通过引入“或”结点来表示。(3)否定对于基本命题的否定,可以直接采用~ISA,~AKO及~part-of的有向弧来标识(4)蕴含通过引入蕴含关系结点来表示规则中前提条件和结论之间的因果联系第五节产生式表示法最初来源于逻辑学家Post在1943年提出的一种计算形式体系Newell和Simon(1972)之后修改了产生式规则产生式适合于表示有下列特点的领域知识:①领域知识由许多相对独立的知识元组成,彼此间关系不密切,不存在结构关系,例如化学反应等;②领域知识多是经验性的,没有精确、统一的理论,例如医疗诊断等;③领域问题的求解过程可被表示为一组相对独立的操作,一个操作可被表示为一条或多条产生式规则。第五节产生式表示法一、产生式表示法的基本形式特别适合表示“如果P则Q”的因果关系,通常的表示形式为:P→Q或者IFPTHENQ其中,P指的是一组前提,Q指的是一个或多个结论。解释为“若前提P被满足,那么可推出结论Q”例如:r1:IF动物飞行AND产蛋THEN该动物为鸟类其中,r1是该产生式规则的编号不确定性规则知识的产生式的主要形式是:

P→Q(置信度)或者IFPTHENQ(置信度)其中,置信度表示知识正确的可能性例如:r2:IF发烧THEN感冒(0.6)第五节产生式表示法二、产生式系统一个典型的产生式系统由三个主要部分组成:知识库也叫规则库。涵盖了关于问题领域的通用性知识。全局数据库具有解决确定问题的事实依据。推理机

运行问题求解过程的规则解释程序第五节产生式表示法三、产生式的复合形式可交换的产生式系统

当一个产生式系统对于任何一个综合数据库D具备如下性质时,称作可交换的产生式系统:①设R是适用于D的规则集,当使用R中任一条规则改变D的状态后,该R对D依然适用;②假设满足目标条件,那么当R中任一个可适用的规则所生成的新综合数据库依然满足目标条件;③如果对D使用某一规则序列,获得新的综合数据库D’,那么当改变规则的使用次序后,依然可以获得D'。

对于可交换的产生式系统,求解时只需要选用任一个规则序列就可对问题求解,而不必探索多个序列,从而节省了时间,提高了求解的效率。第五节产生式表示法三、产生式的复合形式可分解的产生式系统如果全局数据库的每一个状态都用一切可能的规则进行匹配,就会得到很多个匹配序列,造成时间和空间的浪费。为了避免这种情况的发生,可根据全局数据库的状态分成几个可独立处理的子库,分别对它们应用规则求解。由于把初始数据库分解为若干个子库,这就减少了组合情况,加快了问题求解的步伐。像这样可把全局数据库进行分解,从而尽快求得问题的解的产生式系统称为可分解的产生式系统。第五节产生式表示法四、产生式表示的优缺点自然性模块性有效性清晰性优点:效率较低缺点:不能表示具有结构性的知识第六节过程表示法一、过程表示法的概念将知识包含在若干过程之中,这些过程就是一小段程序,处理某些特殊事件或特殊状况。每个过程都包含说明客体和事件的知识,以及在说明完好的情况下的运行知识。过程通常用子程序或模块实现。在问题求解中,当需要使用某个过程时,调用相应的程序并执行。过程表示法的知识库是一组过程集合。过程表示模式可以表示启发式知识,能够产生更好的推理过程的特定论域信息,在模拟人们的缺省推理等非形式推理方面也有很大优势。第六节过程表示法二、过程表示法的过程规则激发条件包含推理方向和调用模式两部分。演绎操作由多个子目标组成,当满足前面的激发条件时,执行演绎操作。状态转换对综合数据库的增、删、改。返回过程规则的最后一个语句,指出将控制权返回到调用该过程规则的上一级规则。包括四部分:第六节过程表示法三、过程表示法的优缺点有利于表示启发式知识能实现扩充逻辑推理(如缺省推理等)具有高度模块化的优点能够通过类比进行推理优点:知识隐含在过程之中难于修改和证明缺点:固定的控制信息限定了其他可能的方法第七节状态空间表示法一、状态空间表示法的定义一种基于解答空间的问题表示和求解方法,其基础是状态和操作符。系统的一种简单的数学描述,特别适合于数字计算的时间范畴表示法,是现代控制原理中重点研究的问题。来自早期的问题求解系统和博弈程序,自身不是一种知识表示形式,只是利用它在问题的多种可能状态集合中作出更好的选择,来表示问题的结构。状态空间搜索模式包含一个规则集合,一条规则即为一个变换算子,完成状态1到状态2的转移。执行一个算子序列就是问题求解。第七节状态空间表示法二、状态空间表示法的组成(1)状态状态是描述问题求解过程中不同时刻状态的数据结构。通常用一组变量的有序集合表示:Q=(q0,q1,…,qn)元素qi(i=0,1,2,…,n)是集合的分量,称作状态变量。当赋值给每一个分量时,便有一个具体的状态。包括四部分:第七节状态空间表示法二、状态空间表示法的组成(2)算符导致状态的分量发生一定变化,把问题从一个状态变成另一个状态的操作称为算符。算符可分为走步、规则、过程、数学算子、运算符号或逻辑符号等。比如,在产生式系统中,每一条产生式规则就是一个算符;在下棋程序中,一个算符即为一个走步。包括四部分:第七节状态空间表示法二、状态空间表示法的组成(3)状态空间表示一个问题的全部状态和所有可用算符构成的集合叫作问题的状态空间。通常有三部分组成:问题的一切可能初始状态构成的集合S;算符集合F;目标状态集合G。使用三元组表示:(S,F,G)。状态空间的图示形式叫做状态空间图。其中,节点表示状态;有向弧表示算符。包括四部分:第七节状态空间表示法二、状态空间表示法的组成(4)问题的解从问题的初始状态集S开始,进行一系列的算符运算,达到目标状态。从初始状态至目标状态所用算符的序列组成了问题的一个解。包括四部分:第八节面向对象表示法一、对象、消息和方法对象::=<ID,DS,MS,MI>标识符ID又称对象名,用于表示一个特定的对象。数据结构DS能够描述对象当前的内部状态或其具有的静态属性,并且通常由一组<属性名属性值>表示。方法集合MS用于说明对象所具有的内部处理方法或对受理消息的操作过程,反映对象自身的智能行为。消息接口MI为对象相关内部方法和接收外部信息驱动唯一的对外接口。此处的外部信息就是消息。当接收者受理发送者的某一消息时,首先需要对该消息属于哪一消息模式进行判断,找出内部方法与之匹配,接着执行与该消息相联的方法,处理相应的消息或响应某些信息。一个对象的形式定义由四元组表示:第八节面向对象表示法二、类、类层次和继承性类的概念是将具有共同属性的一组对象归为一类。类的定义为具有相同外部特征和内部实现的一组对象的抽象。在一个类的上层有超类,而在其下层有子类,因此形成了类的层次结构,称为类层次。继承分为多重继承和简单继承。如果一个类可以直接继承多个类描述的特征就是多重继承。如果一个类只能具有一个超类或只能继承一个类描述的特征则是简单继承。所有面向对象的语言都提供了一套机制用于继承,用户通常可以通过特定的关键字提供期望的映射类型,并且可以在某些情况下附加信息。第八节面向对象表示法三、面向对象知识表示与语义网络、框架系统的比较结构化的知识表示方法包括语义网络、框架系统和面向对象知识表示,其中面向对象知识表示是其中最为结构化的方法。语义网络具有灵活性的优点,可以无限制地定义网络中的节点和有向弧。语义网络的主要不足在于难以开发和维护的系统,而面向对象方法的封装性能够有效地克服语义网络的这一弊端。框架结构与面向对象的结构很类似,知识都可以使用类的概念按一定的层次结构来组织。第九节

基于范例表示法一、范例的定义基于范例问题求解方法是将以前已解决的问题经验与当前需要解决的问题联系在一起,把需要解决的问题称为目标,而过去已经解决的问题称为范例。当目标与范例之间存在相似性,其推理求解过程依赖于这种相似性,推理源于目标之间相似元素的相互映射。范例是从与目标域同一个一般的问题域中抽取的,因而具有相同的结构。范例是在同一问题类别中原先已求解过的实例。第九节

基于范例表示法二、范例的表示知识的表示不仅应该使知识成为一个结构化和组织化的系统,而且还应该确保记忆的知识是易于存取、检索以及学习的。心理学的研究者专注于记忆的一般理论,并提出了许多记忆模型,例如情节记忆episodicmemory)、语义网络(semanticnetwork)和联想记忆(associativememory)等。Schank的动态记忆理论将知识记忆在一些结构中。主要有以下四种类型的结构:记忆组织包(MemoryOrganizationPacket,MOP),剧本(Script),场景(Scene),主题记忆包(ThematicOrganizationPacket,TOP)。第九节

基于范例表示法三、语义记忆单元语义记忆单元是在学习、分析、理解和记住知识的过程中重点关注的概念、模式、主题等,以及据此形成的知识本身的特征,这些因素能够有效地将知识内在联系在一起。语义记忆单元的功能是概括具体知识和具体问题的某个方面,并认识到具体知识和具体问题的更抽象的本质。对于很新的知识,把其中的概念作为首要的记忆对象。随着关于此类知识的积累愈加丰富,在具备了关于具体问题的分析能力之后,便可从中概括出一些抽象的概念性的认识。第九节

基于范例表示法四、记忆网记忆网是通过使用语义记忆单元作为结点并连接语义记忆单元之间的各种关系而建立的网络;模型所记忆的知识相互间不是孤立存在的,而是一个集成的体系,它们通过某种内在的因素彼此间形成紧密或松散的有机联系。其它表达方式表示的理论知识与具体范例可以被记忆和使用;对较为特殊的知识的记忆,可以通过对结点施加约束达到目的;相似的知识可以被内涵结点组织起来;记忆单元能够作为一个主体,独立地完成某些任务。第十节基于RoughSet表示法一、粗糙集的基本概念粗糙集(Roughset)理论是一种研究不精确、不确定性知识的数字工具,由波兰科学家Pawlak在1982年提出。粗糙集把客观世界或对象世界抽象为一个信息系统,或知识表达系统S,也称属性-值系统。S=<U,A,V,f>式中,U是一组对象(或事例)的有限集合,称为论域;如果有n个对象,则U可表示为:U={x1,x2,....,xn}。A表示有限个属性的有限集合,设存在m个属性,则A={a1,a2,....,am};而V表示属性的值域集,V={V1,V2,...,Vm},其中Vi表示属性Ai的值域;进一步可以将有限集合A划分为两个不相交的集合,分别为条件属性集C和决策属性集D,C和D满足A=C∪D且C∩D=∅,其中D一般只有一个属性;f表示信息函数(informationfunction),f:U×A→V,f(xi,aj)∈Vj。第十节基于RoughSet表示法二、基于粗糙集的知识表示知识表达系统可以方便地使用表格来表达知识,并且知识的表格表达法可以认为是一种特殊的形式语言,使用符号表示等价关系,这样的数据表就是知识表达系统。可以通过知识表达系统的定义来描述与知识库有关的所有定义。故知识系统内的任一等价关系在知识系统数据表中以一个属性和属性表示的关系的等价类进行表示,表中的列可以描述某些范畴的名称,而整个数据表则将相应的知识库中所有范畴的描述包含在内,包括所有能从表中数据推导出的一切可能的规律,其中数据标志是用于描述表达系统对知识库中有效事实和规律的方法。第十一节基于神经网络的知识表示一、人工神经网络的基本思想假设信息处理是通过大量称为“单元”的简单处理元件交互进行的,每个单元都对上层的单元发出激励或抑制信号。“并行性”是指网络针对全局的,所有的目标都同时进行处理;“分布性”是指信息分布在整个网络内部,每个节点及其连线上只表达部分信息,而不是一个完整的概念。人工神经网络学习过程所获得的知识,分布式地存储于网络连结权系数中,使网络有很高的容错性和鲁棒性。人工神经网络的自组织、自适应学习功能,大大放松了传统识别方法所需的约束条件,使对某些识别问题显示出极大的优越性。第十一节基于神经网络的知识表示二、BP神经网络的知识表示BP网络模型是一个常用的神经网络模型。网络由输入层、隐含层、输出层组成,相邻的层均全连接。输入信号进入输入层要先向前传播到隐节点,隐节点将输入数据加权累加,经过激活函数后,再把隐节点的输出信息传播到输出节点,给出输出结果。节点内的激活函数可取为Sigmoid函数(又称S函数),其公式如下:第十一节基于神经网络的知识表示二、BP神经网络的知识表示BP算法的训练过程由正向传播和反向传播组成。在正向传播中,输入信息从输入层经隐含层处理,并传向输出层,每一层神经元的状态只影响下一层神经元的状态。当数据向前传递至输出层时,将与期望输出进行对比,如果不能得到期望的输出,则将计算出损失函数,即误差信号,此刻转入反向传播,将误差信号沿原来的连接通路返回,通过修改各层神经元的权值和偏置,使得误差信号最小。第十一节基于神经网络的知识表示二、BP神经网络的知识表示神经网络结构的示意图如图所示,设输入层的输入数据为;输出层数据为

。隐含层数据设为,表示隐含层的第层的第列神经元的值。神经网络结构示意图第十一节基于神经网络的知识表示三、神经网络表示的特点最主要的特点是以分布方式表达信息。神经网络可以拥有大量知识,若神经网络输入层有N个神经元,并且以二进制逻辑作为输入模型,就可提供2N个知识表示的样本数。采用隐式表达式表示知识,这与其他知识表示方法不同,后者基本上均为显式表达。通过神经网络表达知识,可以实现知识的联想功能,因此在模式识别、图像信息压缩和优化等领域的应用取得了较大的进展,即使图像失真或者畸变也可以进行一定程度上的识别。在一定程度上模拟了专家凭直觉解决不确定性问题的过程。第十二节

基于本体的知识表示法本体(Ontology)最初是一个哲学上的概念,意为一切存在的根本凭借和内在依据,是多样性的世界赖以存在的共同的基础。1994年TomGruber提出:“本体是对概念化的清晰的描述(Anontologyisanexplicitspecificationofaconceptualization)。本质上,本体是一个或几个领域的概念以及反映这些概念间的关系的集合。关系反映了概念间的约束和联系,它本身也是概念,关系之间也可能构成新的关系”。1998年,Studer等人对上述定义进一步解释,“概念化涉及通过标识某个现象的相关概念而得到这个现象的抽象模型。显式地指出所用到的概念的类型,以及定义概念使用的约束。形式化是指本体应该是机器可读的。共享反映了这样一个观念,即本体获取了一致的知识,它不是某个个体私有的,而是可以被一个群体所接受的”。第十二节 基于本体的知识表示法一、本体在知识工程领域的研究(1)知识表示本体:本体不限于某种特定领域来对知识描述的语言进行研究。典型的有KIF(KnowledgeInterchangeFormat)、OIL(OntologyInterchangeLanguage)、Ontolingua等。(2)通用或常识本体:涵盖多个领域并建立庞大的人类常识知识库,以解决计算机软件中的脆弱性问题,例如漏洞等。主要研究如SUMO、Cyc工程等。(3)领域本体:它可以在特定区域中被重用,并提供特定区域中概念的定义与概念之间的关系,以及该领域中发生的活动及其主要理论和基本原理等,例如医学概念本体,生物知识库等。本体通常被分为以下5种类型:第十二节 基于本体的知识表示法一、本体在知识工程领域的研究(4)语言学本体:它是一种关于诸如语言和词汇之类的本体。以WordNet为例,它是Princeton大学开发的一个庞大的语言知识库系统,以词汇源文件作为核心,一个源文件都包含一组“synsets”单元,每组“synsets”单元都由一组同义词、一组关系指针以及其他信息组成,由关系指针表示的关系包括继承和反义。(5)任务本体:共享问题解决方法和推理的研究与领域无关。具体的研究主题包括:通用任务、任务方法结构、与任务相关的体系结构、任务结构和推理结构等。例如Chandrasekaran等人的关于任务和问题求解方法本体的研究。本体通常被分为以下5种类型:第十二节 基于本体的知识表示法二、基于本体的知识表示1.冲压工艺领域本体的定义根据TomGruber对本体的定义以及冲压工艺领域的特点,对冲压工艺领域本体定义如下:冲压工艺领域本体是对冲压工艺领域中存在的概念的一种详尽的特征化描述,即是对冲压工艺领域内的概念、关系、属性和规则四要素的一种描述,是实现领域知识共享和重用的基础。以冲压工艺设计的领域本体为例:第十二节 基于本体的知识表示法二、基于本体的知识表示具体的:定义1设O是冲压工艺领域D的本体,则O={({C},{Re},{A},{Ru})|Ci∈D,i=1..m,Rej∈D,j=1..n,Ak∈D,k=1..p,Rul∈D,l=1..q},其中C称为概念集合,Re称为关系集合,A称为属性集合,Ru称为规则集合。定义2概念是冲压工艺领域中规范化的、公认的术语,是具有相同属性或行为的对象的集合。它除了指一般意义上的概念,还可以指冲压工艺方面的任务、功能、行为等。如圆孔、弯曲是一般意义上的概念,毛坯排样、条料排样是冲压的行为,将这些也作为概念来处理。以冲压工艺设计的领域本体为例:第十二节 基于本体的知识表示法二、基于本体的知识表示具体的:定义3关系是领域概念间的连接或关联。关系存在于多个概念之间。关系本身在概念化的过程中可以概念的形式存在,关系之间也可以构成新的关系。冲压工艺概念间的关系主要有精度约束和靠近约束等。定义4属性是领域中的概念所具备性质的抽象。属性反映概念的特性,包含类型特性和语义描述。类型特性指属性的名称、属性的类型(如字符型,整型等)等。语义描述指属性的功能和目的,记录属性的内容。定义5规则Rule=(Condition,Conclusion,CF),其中Condition表示前提,Conclusion表示结论,CF表示可信度。以冲压工艺设计的领域本体为例:第十二节 基于本体的知识表示法二、基于本体的知识表示2.冲压工艺领域本体的BNF范式是对本体定义的形式化描述,是领域本体的知识表示,也是本体构建的基础。其BNF范式如下:①<冲压工艺领域本体>::=(<领域名称>,<概念>,<关系>,<属性>,<规则>)②<概念>::=(<概念号>,<概念名称>,[<同义词>],[<缩略词>],<概念描述>,[<父类号>],[<所属领域名称>])③<关系>::=(<关系号>,<关系名称>,<关系描述>,<关系前件>,<关系后件>)④<属性>::=(<属性号>,<属性名称>,[<同义词>],[<缩略词>],[<属性值>],<值的类型>,<集的势>,[<允许值>],[<默认值>],[<关系号>],<概念号>)⑤<规则>::=(<规则号>,<前提>,<结论>,<可信度>,[<规则描述>],[<关系号>],<概念号>)⑥<领域名称>::=<标示符>⑦<概念号>::=<整数>…以冲压工艺设计的领域本体为例:第十二节 基于本体的知识表示法三、领域本体知识表示的作用知识的共享知识的重用知识的标准化分析领域知识,辅助知识获取第十二节 基于本体的知识表示法四、基于本体的知识表示存储对于本体形式化的描述国内外学者大多采用BNF范式,但是如何将BNF范式转换成计算机语言并在计算机中存储却分歧很大。目前可以采用中性语言知识交换格式(KIF)、采用XML语言进行转换和存储,或者直接采用关系数据库的形式进行存储。冲压工艺领域本体的BNF范式采用关系数据库的方式进行存储,知识表示的术语都来自本体库,在冲压工艺领域本体关系数据库中,涉及到的各个表结构和表之间的关系如图所示。第十二节 基于本体的知识表示法四、基于本体的知识表示存储冲压工艺领域本体知识表示结构图第十三节知识图谱中的知识表示知识图谱(KnowledgeGraph)是Google公司于2012年提出的新概念。目前知识图谱还没有一个公认的定义。百度百科对知识图谱进行如下定义:“通过将应用数学、图形学、信息可视化技术、信息科学等学科的理论与方法与计量学引文分析、共现分析等方法结合,并利用可视化的图谱形象地展示学科的核心结构、发展历史、前沿领域以及整体知识架构达到多学科融合目的的现代理论。”许多学者认为知识图谱本质上就是语义网络,它基于图的数据结构,是一种最有效的关系表示方式。知识图谱是一种将所有不同种类的信息连接到一起得到的一个关系网络。第十三节知识图谱中的知识表示知识图谱是由节点(Point)和边(Edge)组成的。1.节点:知识图谱包含以下两种节点。(1)实体所谓实体指具有可区别性且独立存在的某种事物,世界万物由具体事物组成。实体是知识图谱中的最基本元素,每一个实体可以用一个全局唯一的ID进行标识。不同的实体间存在不同的关系。(2)语义类/概念语义类是包含相同特征的实体的集合。概念则是反映一组实体的种类或对象类型,是指某种类别、对象类型、集合以及事物的种类。一、知识图谱的通用知识表示第十三节知识图谱中的知识表示知识图谱是由节点(Point)和边(Edge)组成的。2.边:知识图谱包含以下两种边。(1)属性(值)属性是指某个实体可能具备的特性、特点、参数以及特征,也可以表示从某个实体指向其属性值的“边”,不同类型的属性与不同类型的属性的“边”相对应,而属性值主要表示对象指定属性的值。(2)关系关系可以形式化为一个函数,它把若干个节点映射到一个布尔值的函数,提供一种从关系的视角来看世界,即实体与实体之间的关系。这种关系可以是推论关系、因果关系、相近关系、组成关系等。一、知识图谱的通用知识表示第十三节知识图谱中的知识表示知识图谱中的图通常也被称为网络。一个图可以以二元组的形式进行表示:G=G(V,E),式中V表示一个节点集,E⊆V×V则表示边的集合。若一个二元组(u,v)(u,v∈V)存在(u,v)≠(v,u),则说明该二元组是有序的,而图G为有向图。反之如果一个二元组(u,v)(u,v∈V)(u,v)=(v,u),则表明这个二元组是无序的,而图G为无向图。在图G为有向图的情况下,如果有<u,v>∈V,那么<u,v>被称为图G的一条弧。而图G为无向图的情况下,如果有(u,v)∈E,那么节点u和v是邻接的,且称(u,v)为图G的一条边。二、知识图谱中的图表示第十三节知识图谱中的知识表示无向图,图中的三个节点“张三”、“李四”、“王五”互为同学。二、知识图谱中的图表示有向图,节点“莫言”国籍是节点“中国”,出生地是节点“山东”,“山东”属于中国。第十三节知识图谱中的知识表示资源描述框架(ResourceDescriptionFramework,RDF)作为一种资源描述语言,它受到元数据标准、框架系统、面向对象语言等多方面的影响,被用来描述各种网络资源,它的出现为程序设计师在Web上发布结构化数据提供一个标准的数据描述框架。1.由来RDF的概念一开始来自元数据的概念。元数据是一种“描述信息的信息”或者“描述数据的数据”。举个例子,电脑里保存的数码照片都包含一些关于尺寸、创建时间、感光度等额外属性信息,它们都是一种元数据,用于描述二进制图片的数据。由于元数据是一种结构化的数据,机器处理起来十分方便。三、知识图谱的三元组表示第十三节知识图谱中的知识表示2.模型定义RDF使用三元组集合的方式来描述事物和关系。知识图谱中知识表示的基本单位是三元组,简称SPO<Subject-主语

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论