(计算机应用技术专业论文)基于本体论的知识推理查询系统的研究.pdf_第1页
(计算机应用技术专业论文)基于本体论的知识推理查询系统的研究.pdf_第2页
(计算机应用技术专业论文)基于本体论的知识推理查询系统的研究.pdf_第3页
(计算机应用技术专业论文)基于本体论的知识推理查询系统的研究.pdf_第4页
(计算机应用技术专业论文)基于本体论的知识推理查询系统的研究.pdf_第5页
已阅读5页,还剩64页未读 继续免费阅读

(计算机应用技术专业论文)基于本体论的知识推理查询系统的研究.pdf.pdf 免费下载

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

江苏大学硕士研究生毕业论文 摘要 传统知识表示方法下,由于知识资源缺少统一的语义描述,用户难以查找到 与需求相关的知识,难以实现相关资源的语义融合。如何使被管理知识资源具有 应用程序可以理解的含义,方便用户查找到与需求相关的知识资源,并根据信息 资源所具有的领域知识,实现信息资源的语义融合,这些问题是知识表示所面临 的挑战。 知识本体是共享概念模型的明确形式化规范说明,能够以一种明确的、形式 化的方式来表示领域知识,提高异构系统之间的互操作性,促进知识共享。本体 是对领域知识的一种概念化描述,它反映了领域专家对该领域内知识的看法,它 不仅支持对其底层数据内容的查询,而且通过对语义信息的声明性描述来反映数 据之间的相关性,这种描述并不依赖于具体的数据组织方式。 本文在分析了传统的知识表示的不足后,探讨了基于本体论的知识表示,对 知识本体的建模,并在此基础上研究了描述逻辑,分析了本体语言在描述逻辑的 基础上所具有的推理性。 本体有多种表示形式。即本体描述语言,不同的本体在逻辑结构组织上也往 往是不同的。而且在多信息系统的环境中,各个独立开发的系统都有自己的内部 表示模型和自己的本体。因而这些系统之间的信息交流需要由一个专门的知识集 成和融合的过程来实现,这样的一个过程就是本体之间映射的过程。我们从语法 级别和语义级另t j - - 个方面来进行本体元素之间的匹配。最后将本体映射的结果分 配到各个知识库,进行推理查询。 本文最后提出了一个基于本体的知识推理查询系统的原型,同时给出了一个 教学领域内的查询系统的应用。在该系统中知识的表示是以三元组的形式表示, 用户通过相应的选择进行查询,来自用户的请求被客户端收集传送至服务器交由 推理引擎来进行处理,从而用户得到相应的知识。 关键词:本体,描述逻辑,知识表示,本体映射,d a m l 江苏大学硕士研究生毕业论文 a b s t r a c t a c c o r d i n gt ot r a d i t i o n a lk n o w l e d g er e p r e s e n tm e t h o d ,t h ek n o w l e d g er e s o u r c e l a c k sau n i f o r ms e m a n t i cd e s c f i p f i o n i ti sh a r df o ru s e rt of i n dm o r er e l e v a n t k n o w l e d g er e s o u r c ea n dr e a l i z et h ei n f o r m a t i o ns e m a n t i cf u s i o n h o wt oa s s i g nt h e m a n a g e dk n o w l e d g er e s o u r c eam a c h i n e u n d e r s t a n d a b l em e a n i n gt of a c i l i t a t eu s e rt o f i n dw h a tt h e yr e a l l yn e e d ,a n da c c o r d i n gt ot h ed o m a i nk n o w l e d g et or e a l i z et h e i n f o r m a t i o ns e m a n t i cf u s i o n a r ec h a l l e n g i n gt a s k sf o rk n o w l e d g er e p r e s e n t t h ed o m a i n o n t o l o g y i saf o r m a l ,e x p l i c i t s p e c i f i c a t i o n o fas h a r e d c o n c e p t u a l i z a t i o n ,w h i c hc a nr e p r e s e n td o m a i nk n o w l e d g ea n df a c i l i t a t et h e i n t e r o p e r a t i o nb e t w e e nt h eh e t e r o g e n o u sa p p l i c a t i o ns y s t e m s o n t o l o g yi sak i n do f c o n c e p t u a l i z e dd e s c r i p t i o nt o w a r d s d o m a i nk n o w l e d g ew h i c hr e f l e c t s e x p e l s o p i n i o n so nt h i sf i e l d sk n o w l e d g e t h eo n t o l o g yc a l ln o to n l ys u p p o r tc o n t e n t e n q u i r yo fb o r o md a t a b a s e ,b u ta l s or e p r e s e n tt h er e l e v a n c eo fd a t a b a s et h r o u g h s t a t c m e n t a ld e s c r i p t i o na b o u ts e m a n t i ci n f o r m a t i o nw h i c hn o td e p e n d e n to ns p e c i f i c d a t eo r g a n i z a t i o np a r e m a f t e ra n a l y z i n gt h es h o r t c o m i n g so ft r a d i t i o n a lk n o w l e d g er e p r e s e n lt h ea r t i c l e p r o b e st h eo n t o l o g i c a lk n o w l e d g er e p r e s e n ta n di n v e s t i g a t et h ed e s c r i p t i o nl o g i c f a r t h e r ,t h e na n a l y z i n gt h er e a s o no fo n t o l o g yl a n g u a g eo nt h eb a s i so fd e s c f i t ,t i o n l o g i c t h co n t o l o g yh a sm a n yd i f f e r e n tr e p r e s e n tp a t t e r n s ,t h a ti s ,o n t o l o g yd e s c r i p t i o n l a n g u a g e d i f f e r e n to n t o l o g yu s u a l l yh a sd i f f e r e n tl o g i c a ls t r u c t u r a lo r g a n i z a t i o n s i n am o r ei n f o r m a t i o n a ls y s t e me n v i r o n m e n ge a c hi s o l a t e dd e v e l o p e ds y s t e mh a si t s o w ni n t e r n a lp r e s e n tm o d e la n do n t o l o g y t h e r e f o r ei n f o r m a t i o ne x c h a n g eb e t w e e n t h e s es y s t e m ss h o u l db er e a l i z e dt h r o u g has p e c i f i ck n o w l e d g ea g g r e g a t i o na n d p r o c e s s i o nm e r g e n e ew h i c ha l s om e a n st h eo n t o l o g ym a p p i n g e l e m e n tm a p p i n go f o n t o l o g yc a nb ea c h i e v e dt h r o u g ha n a l y z i n gg r a m m a t i c a la n ds e m a n t i cc o n c e p t u a l s i m i l a r i t y t h e nt h er e s u l to f o n t o l o g ym a p p i n gw i l lb ed i s t r i b u t e dt oe v e r yk n o w l e d g e d a t e b a s ea n dc a r r yo nr e a s o n i n ga n ds e a r c h i n g a tl a s t ,ak n o w l e d g er e a s o n i n ga n d s e a r c h i n gs y s t e mp r o t o t y p eb a s e do n o n t o l o g yi sp u tf o r w a r d m e a n w h i l ew ea l s og i v e sa p p l i c a t i o no fi n q u i r ys y s t e mi n t e a c h i n ga n de d u c a t i o nf i e l d k n o w l e d g er e p r e s e n ti nt h i ss y s t e me x p r e s s e sw i t ht h e f o r mo ft r i p l ea n dc o n s u m e r sc a r li n q u i r eb ys e l e c t i n g c o n s u m e r s r e q u i r e m e n t s c o l l e c t e db yc l i e n tw i l lb et r a n s f e r r e dt os e r v e ra n d 血ei n f e r e n e ee n g i n ew i l lh a n d t h e ma f t e rg e r i n gt h ei n f o r m a t i o nf r o mt h es e r v e r , t h e nc l i e n t sc a n g e t t h e c o r r e s p o n d i n gk n o w l e d g e k e yw o r d s :o n t o l o g y ,d e s c r i p t i o nl o g i c ,k n o w l e d g er e p r e s e n t ,o n t o l o g y m a p p i n g ,d a m l i i 学位论文版权使用授权书 本学位论文作者完全了解学校有关保留、使用学位论文的规定,同意学位保 留并向国家有关部门或机构送交论文的复印件和电子版,允许论文被查阅和借 阅。本人授权江苏大学可以将本学位论文的全部内容或部分内容编入有关数据库 进行检索,可以采用影印、缩印或扫描等复制手段保存和汇编本学位论文。 本学位论文属于 保密口,在 年解密后适用本授权书。 不保密 p 多 学位论文作者签名:歹孑 _ 呻j ,年月f 中日 指导教师签名:雳j 8 苁膨 西每6 具f 驷 本人郑重声明:所呈交的学位论文,是本人在导师的指导下,独立进 行研究工作所取得的成果。除文中已注明引用的内容以外,本论文不 包含任何其他个人或集体已经发表或撰写过的作品成果。对本文的研 究做出重要贡献的个人和集体,均已在文中以明确方式标明。本人完 全意识到本声明的法律结果由本人承担。 学位论文作者签名: 天美 日期:们) j 年f 月铲日 江苏大学硕士研究生毕业论文 第一章绪论 自w e b 发明以来,短短几年中w e b 技术和应用在i n t e m e t 中已经完全占据 了主导地位,w e b 技术的发展变化完全引导羞i n t e m e t 的发展变化。通过为网页 扩展面向计算机的信息,并增加计算机可以阅读的文档,就可以将w e b 变为语 义w e b ( s e m a n t i cw e b ) ,实现网络的机器理解,自动提供网络服务。 1 1 研究背景 随着i n t e n c t 的快速发展和计算机的普及,人们已经进入了网络信息时代, 网络信息资源极为丰富;有关专家认为w w w ( w o r l dw i d ew e b ) 的规模正以每4 个月增加一倍的速度扩大,为用户提供了一个快捷方便的信息共享的资源平台。 但随着信息高速增长,同样也出现了“信息迷航”、“信息过载”等问题,人们 从网上查找和获取所需要的知识信息也就变得越来越困难,如何迅速、高效地检 索和访问各领域的知识资源以促进知识的交流与共享是一个急需解决的重要问 题。 目前,网络信息资源检索主要利用基于关键词的查询,以及基于数据库及相 应数据模式和检索语言的深层网络资源( d e c p 2 w e b ) 查询,这些方法或者要求了解 检索对象的数据结构或元数据格式、基于语法结构进行检索,不能处理复杂语义 关系、常常检索出大量和用户不相关的知识资源。实际上,人们在查询时经常面 对复杂的难以事先了解的资源类型及内容结构,但又希望能针对复杂概念进行准 确的语义检索,这就要求检索系统能解析各种内容结构的知识资源及其相互之间 的复杂关系。人们迫切需要高效、准确的信息处理工具来帮助自己查找所需的信 息和知识,极大地促进了网络信息技术的发展。 二十世纪八十年代,t i n lb e m e r s l e e 结合前人有关超文本和因特网研究成 果独创性地发明了统一资源定位符( u n i v e r s a lr e s o u r c el o c a t o r ,u r l ) 、超文本 传输协议( h y p e r t e x tt r a n s f e r p r o t o c a l ,h t t p ) 和超文本标记语言( h y p e r t e x t m a r k u pl a n g u a g e ,h t m l ) ,并于1 9 8 9 年3 月提交了第一份有关万维网的研究 计划报告【l 】,最终于1 9 9 0 年1 2 月建立了第一个万维网的原型系统。 2 0 0 0 年之后,万维网不再仅仅是一个供人浏览数据的空间,而且是各种应 用程序和智能设备( 机器) 获取信息和集成应用的空间,开始进入超越浏览阶段。 这一阶段体现出来的核心思想是资源共享与协同工作。资源包括网络上的硬件、 软件、数据、信息和知识等多个层次上的资源,例如c p u 计算能力、磁盘的存 江苏大学硕士研究生毕业论文 储空间、特定功能软件的服务资源、通用格式的数据、特定用途的信息、领域知 识等。协同工作则是采用工作流、多智能代理等技术对网络上提供的服务进行动 态组装。随着新的应用不断加到w e b 中,h t m l 通过扩展标记来支持新的w e b 应用的方式越来越不适应w e b 发展的需要,大量的信息提取和解释工作还许需 要人工完成,并进一步造成信息孤岛的产生。为此,w 3 c 组织革命性的提出了 “机器理解”的万维网,为提供强大网络服务功能的新一代w e b 绘制了美好的 蓝图。 为了实现面向机器理解的万维网,t i mb e m e r s l e e 于2 0 0 1 年正式提出了语 义万维网【2 ( s e m a n t i cw e b ) 。语义万维网是当前万维网的扩展,逐渐将i n t e r n e t 变成一个巨大的全球化的知识库,这个知识库能够满足人们浏览信息的需要,更 重要的是通过标准的语义规范使计算机自动读取和处理信息。 1 2 研究意义 知识表示信息的应用和生产性使用,而信息是知识的“子集或基石”。比如 消息虽然是一种重要的信息,它提供了何时、何地、何人以及简单的事件因果联 系,但不能提供事实的深层原因和联带关系。知识必须是经过加工提炼,将很多 信息材料的内在联系进行综合分析而得出的系统结论。 知识表达语言通过语义的描述方式体现了知识的不同特性:知识表达必须体 现真实世界语义( r e a lw o r l ds e m a n t i c s ) 。即通过术语或是表达式实现真实世界事 物的描述,实现一神有选择性的本体可体现公理性s ( ( a x i o m a t i cs e m a n t i c s ) , 即知识表达语言可以映射为阶或是高阶谓词逻辑的逻辑理论,实现智能推理和 高效计算;体现可交流的语义( c o m m u n i c a t i o ns e m a n t i c s ) ,即知识表达语言作为 一种正规的对事物的显性描述,以机器可理解( m a c h i n e u n d e r s t a n d a b l e ) 的方式实 现了人与机器以及机器与机器之间无歧义的交流。因此,语义可以看成知识的载 体。 目前,知识的表现方式十分多元化,目前主要有产生式表达法、语义网络表 达法、框架表达法、谓词逻辑表达法等技术,并且新的技术还在开发当中;这些 知识表示方法各有优缺点。目前,f e i g e n b a u m 提出专家系统的效率来自其所拥 有的专家知识,而非其新颖的论调及所使用的推理设计 3 1 。这就是说,在建立推 论引擎时,知识的表示方式对于推论的结果影响很大。语义网扩展了w w w 的 应用,通过给信息一个良好的定义,使得计算机能够理解,其核心思想是网络资 源的机器理解,其思想是使用元数据来描述w e b 的站点和网页的内容,将w w w 上海量的信息以一种机器可以理解的方式组织起来,提供数据的语义关系的表达 2 江苏大学硕士研究生毕业论文 式。既然语义网的目标是是为了让机器能够理解信息,由于这些信息能够被机器 所理解,故能推论出新的知识。语义网中的本体是一种结构化的描述符和已知事 实的模型,可使得知识实现二个功能:分类和推理,分类是将不同的知识信息做 区分,实现层次化的表示方式;推理就是将信息中的隐性知识表达出来。因此本 体论和知识表示具有天然的结合型,能够对知识进行深层的推理查询。 1 3 论文的研究内容 随着信息高速增长,人们从网上查找和获取所需要的知识信息也就变得越 来越困难。如何迅速、高效地检索和访问各领域的知识资源以促进知识的交流与 共享是一个急需解决的重要问题。人们将各种先进的思想和方法引入对知识的表 示以及对知识的推理查询过程中,由此,利用语义网中的本体来进行知识表示并 对知识进行相应的操作逐步成为领域热点,利用本体来表示知识,可以在以在语 义的表现、挖掘隐含的信息方面有很大的改善。 以下本文的研究的主要内容: ( 1 ) 分析比较了几种传统的知识表示方式,指出其中的优缺点,在此基础上 研究了基于本体论的知识表示,分析如何使用本体来进行知识表示、知识建模, 通过本体将知识的本质特征和属性抽象出来,并对知识表示元素进行形式化的描 述。 ( 2 ) 对于领域内的知识本体建模,由于本体的创建者不同,使用的建模方法 也不尽相同,领域内的知识本体之间就存在不匹配的情况,我们通过混合本体的 方式,自动构建了领域内的全局元素,从语法级别和语义级n - 个方面来进行知 识本体之间的匹配。 ( 3 ) 我们提出了一个基于本体的领域知识推理查询系统的原型,该原型系统 采取了三层结构,通过抓取网页上的实例数据来构建领域内的知识库,并将知 识库导入专家系统的推理引擎,用户通过知识库中的专业概念来查找出所需的 知识资源,实现了对知识的推理查询。 1 4 论文的结构概要 论文共分六章,主要内容概要如下: 第一章是绪论,介绍课题的研究背景和研究意义,简要介绍了目前在知识表 示和检索方面存在的一些问题,并引出了当前的语义网技术,利用语义网中的本 体来进行知识表示,提出了本论文的研究课题。 3 江苏大学硕士研究生毕业论文 第二章综述了本体的一些基本知识,讨论了语义w e b 的架构,详细描述了 本体的表示语言并分析了本体语言的基础一描述逻辑,以及现有本体知识的分 类。 第三章介绍了基于本体的知识表示,首先介绍了以往常用的知识表示方法, 比较分析当前知识表示的不足,说明了使用本体来表示知识的优点,分析如何使 用本体来进行知识表示、知识建模,并研究了不同本体之间连通的映射问题。 第四章提出了基于本体的知识推理查询系统的原型,以及对各部分的具体说 明,主要包括知识的获取,本体的映射以及推理查询的过程,详细说明了设计的 概念和系统的架构。 第五章对原型系统的应用,通过一个具体领域内的应用,构建领域内的知识 本体,以及相应的规则,将构建的本体结合规则导入j e s s 引擎进行推理查询,得 出用户所需要的知识信息。 第六章对全文进行总结,以及未来的研究建议。 4 江苏大学硕士研究生毕业论文 第二章本体论的相关知识 万维网的产生对于信息共享来说是向前迈进了一大步,导致了对于信息表示、 共享、获取的标准的发展,主要是对于人类的理解。当前的w e b 是基于h t m l 来 显示内容的,h t m l 提供了程序,主要是带有一系列结构的浏览器来表示信息,而 机器则不能理解这些信息,语义网的方法为信息的内容的增加了结构和语义,意思 就是不仅将文档相互联系起来,而且也能辨认出这些文档的意思( 一般来说,人类 是能够理解的,但是对于计算机来说,却是难于理解的) 。这样做的目的是基于语 义内容进行信息处理,使得匿名软件引擎能够使用信息,组织和过滤适合用户需要 的数据:更重要的a g e n t 能在是在基于语义标签说明的基础上进行推理,得出新的 结论;这种能力表明了能从已经说明的知识中演绎出新的知识,这样就使得系统显 得更加智能,增强了m a k e - d e c i s i o n 的能力。本章2 1 对语义网的概念以及层次图傲 了相关介绍;2 t 2 着重介绍了本体层及本体语言的表现方式;2 3 介绍了知识本体的 划分以及现有知识本体的分类;2 4 分析了本体描述语言的基础一描述逻辑。 2 1 语义网 t i mb e m e r s l e e 于2 0 0 1 年正式提出了语义万维网圆( s e m a n t i cw e b ) 。语义 万维网是当前万维网的扩展,扩展之后,万维网上的信息具备良好定义的含义,可 以帮助人类和计算机更好地协同工作。语义万维网的基本体系结构如图2 - 1 所示: 语义万维网体系结构包括七层,各层的基本功能和相互关系如下: 图2 1语义万维网层次结构 5 江苏大学硕士研究生毕业论文 第一层:u r j s 和u n i c o d e w e b 环境下的应用之间不可避免地需要相互通信,以机器可读的格式传递或 发布信息。这些信息中很大一部分是对w e b 上资源的描述,因此,首先应该以 明确的方式来标识这些资源( 对象) 。语义万维网采用统一资源标识符 ( u n i f o r m r e s o u r c ei d e n t i f i e r s ,u r d 来标识资源及其属性,u r i 是一个 i n t e r n e t 标准,记载于r f c 2 3 9 6 。它和万维网常用的统一资源定位符( u n i f o r m r e s o u r c el o c a t o r ,u r l ) 以及统一资源名称( u n i f o r mr e s o u r c en a m e ,u r n ) 的区 别在于u r i 泛指所有以字符串标识的网络资源,包含了u r l 和u r n 。另外由于 语义万维网的最终目的是要构建一个全球信息的网络,在这个网络上应该涵盖各 种语言和文字的信息资源,所以它采用统一编码u n i c o d e 作为字符的编码方案。 这一层是整个语义万维网的基石,它着眼于解决万维网上资源的定位和跨地区字 符编码的标准格式的问题 第二层:x m l 、n a m e s p a c e 、x m ls c h e m a 在u r i 和u n i c o d e 之上,是x m l 及相关技术层。x m l 允许用户根据需要自 定义一些“有意义的”标签,对所发布信息的内容进行标记,并使用文档类型 定义( d o c u m e n tt y p ed e f i n i t i o n ,d t d ) 或x m ls c h e m a 来约束这些标签的结构”1 。 由于) ( m l 标签可以由用户根据自己的需要来定制,这样不可避免地会造成标签 同名的情况,为了避免这样的冲突,w 3 c 采用了n a m e s p a c e 机制”3 。 第三层:r d f 、r d fs c h e m a x m l 层之上是数据互操作层一资源插述框架( r e s o u r c e d e s c r i p t i o n f r a m e w o r k ,r d f ) 和r d fs c h e m a s 。r d f 本身并没有规定语义,但是它为每一个 资源描述体系提供一个能够描述其特定需求的语义结构的能力。从这个意义上来 说,r d f 是一个开放盼元数据框架,这个元数据框架定义了一种数据模型,可以 用来描述机器能理解的数据语义。r d fs c h e m a 规范用r d f 进一步定义了建模原 语”1 ,提供了r d f 模型中使用的一个基本类型系统。这个类型系统有些类似于面 向对象的编程语言。从描述逻辑( d e s c r i p t i o nl o g i c ,d l ) 的观点来看,r d f s 相 当于t b o x ( t e r m i n o l o g yb o x ) ,而r d f 相当于a b o x ( a s s e r t i o nb o x ) 。 第四层:o n t o l o g yr d fs c h e m a 可以定义类、子类、超类、特性、子特性以及它们的约束,如:定义域( d o m a i n ) 和值域( r a n g e ) 等。因此,从某种意义上说,r d fs c h e m a 本身就是一种简单的 知识本体( o n t o l o g y ) 语言。但是r d f r d f s 对特定应用领域词汇的描述能力比 较弱,需要进行扩展,我们把这个r d f r d f s 之上的扩展层称为知识本体层。d f e n s e l 等人认为嘲:知识本体逐濒引起人们重视的原因在于知识本体能够在人 6 江苏大学硕士研究生毕业论文 们和应用系统之间达成对术语含义的共享和共同理解。而对同一概念的语义共享 和共同理解恰恰是构建语义万维网的关键。 第五层:l o g i c 、p r o o f & t r u s t 到目前为止,利用r d f r d f s 以及对r d f s 进行扩展的一些知识本体语言可 以对万维网上的资源内容做出描述。仅有这些描述还远远不够,基于语义的万维网 应用还需要根据特定的规则从这些描述性的知识中进行推理。逻辑层的目标就是提 供一种方法来描述规则。描述逻辑标记语言( d e s c r i p t i o nl o g i cm a r k u p l a n g u a g e , d l m l1 就是这样的一种方法,它用d t d 封装了描述逻辑中的逻辑连接词【9 ,可将 基于描述逻辑的形式化知识嵌入到被描述的文档之中。针对语义万维网上的各种不 同类型的应用,逻辑层可能会采用多种逻辑语言的实现形式,这一点就和互联网 t c p i p 协议模型中的每一层都会针对不同的硬件和软件系统采用不同的实现类 似。p r o o f 和t r u s t 这部分内容在概念上目前还没有一个公认权威的说法,但是语 义万维网的研究者普遍认为p r o o f 和t r u s t 将是下一代w e b 的重要概念i l 。 2 2 本体 2 2 1 本体的定义 从目前的情况来看,语义网下面三层的研究已经开展较长时间,研究成果相 对较多,并推出了一系列的标准,可以说打下了比较坚实的基础。本体层和逻辑 层,正在引起更多的关注。作为语义w e b 中从语法处理向语义处理的转折,这两 层起着至关重要的作用,相关研究正处在探索之中,已有很多有意义的尝试和应 用,却还没有成熟的技术和标准,因此成为相关领域的研究热点。项部的两层还 没有可靠论证,只是基于逻辑系统的一个构想。 o n t o l o g y 的概念起源于哲学领域,即“对世界上客观存在物的系统地描述 “”。在人工智能乔,最早给出本体定义的是n e c h e s 等人,他们将本体定义为 “给出构成相关领域词汇的基本术语和关系,以及利用这些术语和关系构成的规 定这些词汇外延的规则的定义“2 ”。但是目前较为广泛接受的定义是: 知识本体是共享概念模型的明确形式化规范说明【l ”。该定义包含4 层含义: 概念化通过抽象出客观世界中一些现象的相关概念而得到的模型, 其含义独立于具体的环境状态; 明确用的概念及使用这些概念的约束都有明确( 显式) 的定义; 形式化知识本体是计算机可读的。 共享本体中体现的是共同认可的知识,反映的是相关领域中公认 的概念集,它所针对的是团体而不是个体。本体的目标是捕获相关的 7 江苏大学硕士研究生毕业论文 领域的知识,提供对该领域知识的共同理解,确定该领域内共同认 可的词汇,并从不同层次的形式化模式上给出这些词汇( 术语) 和 词汇之间相互关系的明确定义。 虽然不同研究者对本体有不同的描述,但是从内涵上来看,他们对本体的认识 是一致的,都是把本体当作某个领域内( 可以是特定领域的,也可以是更广的范围) 不同主体( 人、代理、机器等) 之间进行交流( x t 话、互操作、共享等) 的一种语 义基础,即由本体提供明确定义的词汇表,描述概念和概念之间的关系,作为使用 者之间达成的共识。因此,本体的用途包括交流、共享、互操作、重用等等。 目前,本体已经被广泛应用于知识工程、自然语言处理、数字图书馆、信息 检索和w e b 异构信息的处理、软件复用、面向对象技术和语义w e b 等领域”】 2 2 2 本体描述语言 自上个世纪9 0 年代以来,一些基于a i 的本体实现语言陆续被提出,如k i f 、 o n t o l i n g u a 、c y c l 、l o o m ,o c m l ,f l o g i c 。后来,随着w e b 的发展,又出现 了一系列基于w e b 的本体语言,也叫做本体标记语言,如s h o e 、x o l 、r d f 、 r d f s 、o i l 、d a m l 、d a m l + o i l 、o w l 。 1 s h o e l l 6 1 s h o e ( s i m p l eh t m lo n t o l o g ye x t e n s i o n s ) 作为h t m l 的扩展,是马里兰 大学开发的。它是基于框架和规则的。它使用不同于h t m l 的一些标记,使得 可以在h t m l 文档中插入本体。当x m l 产生并成为w e b 上交换信息的标准后, s h o e 的语法被修改为基于x m l 。目前,马里兰大学已经停止研究s h o e ,他 们有关本体的研究项目开始使用o w l 和d a m l + o i l 作为本体的描述语言。 2 x o l l l 7 i x o l ( o n t o l o g ye x c h a n g el a n g u a g e ) 是s r ii n t e r n a t i o n a l 的人工智能中心 ( a i c ) 开发的。它是一种简单通用的定义本体的方法。其目的是在不同的数据库、 本体开发工具、或者其他应用程序之间交换本体。x o l 设计之初是为生物信息 学领域本体的交换,但是它可以应用于各种领域。 3 r d f ,r d f _ s i l s l x m l 是一种语义语言,也是资源描述语言,但是x m l 对于资源关系描述 的能力非常贫乏,因此为了加强资料的处理性,例如资料交换,w 3 c 提出可资 源描述框架r d f ( r e s o u r c ed e s c r i p t i o nf r a m e w o r k ) ,其主要的目的是为元数据 在w e b 上的各种应用提供一个基础的架构,从而实现元数据的交换。 8 江苏大学硕士研究生毕业论文 r d fm o d e la n ds y s t a x 提出了一个抽象世界,由资源( r e s o u r c e ) 、属性 ( p r o p e r t y ) 、值( v a l u e ) 构成的资料模型,透过命名属性和值,模型可以表示 资源之间的内在关系。例如: b o bi st h ec r e a t o ro f t h er e s o u r c eh t t p :w w w w 3 o r g h o m e b o b 其结构如下: r e s o u r c e ( s u b j e c t ) h t t p :w w w w 3 o r g h o m e b o b p r o p e r t y ( p r e d i c t ) h t t p :w w w s c h e m a o r g # c r e a t o r v a l u e ( o b j e c t ) “b o b ” 关系图: 一一s :c r e a t o r 厂 ( ,警咝血业必、_ 一b o b 】咝呈些 。j 图2 2r d f 所描述的资源图 因此,这个数据模型可以方便的描述对象( 或者资源) 以及它们之间的关系。 r d f 的数据模型实质上是一种二元关系的表达,由于任何复杂的关系都可以分 解为多个简单的二元关系,因此r d f 的数据模型可以作为其他任何复杂关系模 型的基础模型。r d fs c h e m a 为r d f 资源的属性和类型提供定义良好的词汇表。 w 3 c 推荐以r d f r d f ,s 标准来解决x m l 的语义局限。 4 d a m l + o i l l 9 1 d a m l + o i l ( d a r p a a g e n t m a r k u p p l u s o n t o l o g y i n f e r e n c e l a y e r ) 是由欧 洲与美洲的联合会所发展出来的一种语义语言。d a m l + o i l 的能力是建立在 x m l 及r d f 的基础上,这些x m l 的应用帮助提供了语义网页的初步的能力。 用d a m l + o i l 所表示的语言适合用来建立语义网页,d a m l + o i l 的语法延伸 了r d f ( s ) 也就是从r d f 的三元组改变为n - - t r i p l e ,所以,d a m l + o i l 的语 言更为复杂。另外d a m l + o i l 也提供一些规则描述资源间的关系及限制 ( c o n s t r a i n t s ) ,所以d a m l + o i l 所表示的文件不仅机器可以理解并能够对内容做 推理( r e a s o n i n g ) 。 d a m l + o i l 延伸了x m l 与r d f 的优势,并且弥补了r d f 所不能描述的 关系,以下是d a m l + o i l 与r d f 的比较: 描述能力更优于r d f ,属性可描述属性,类别的关系可以做e q u i v a l e n c e 以及d i s j o i n m e s s 运算,所以可表达更多更复杂的关系。 l a y e r e da p p r o a c h ,x m l = r d f ( s ) = d a m l + o i l 。x m l 与r d f ( s ) 语 法可用于d a m l + o i l ,它们是相容的关系。 9 江苏大学硕士研究生毕业论文 领域内资源的语义,来自与表示知识的概念: d a m l + o i l 可视为描述逻辑; 可描述o n t o l o g y ; 具有逻辑的规则及推理的能力。 d a m l + o i l 对资源描述以及关系表达十分的强大,所描述的资源也十 分的丰富。 5 o w l i l 9 i o w l ( w e b 本体语言,w e bo n t o l o g yl a n g u a g e ) 是w 3 c 推荐的本体描述语言 的标准,位于w 3 c 绘制的本体语言棱的栈顶( 参见图2 1 ) 。它是为了在w w w 上 发布和共享本体而提供的语义标记语言。o w l 是在d a m l + o i l 的基础上发展起来 的,作为r d f ( s ) 的扩展,目的是提供更多的元语以支持更加丰富的语义表达, 并更好的支持推理。 2 3 现有知识本体分类 g u a r i n 提出以详细程度和领域依赖度两个方面对知识本体进行划分。描述或 刻画建模对象的程度较高的称为引用本体( r e f e r e n c eo n t o l o g i e s ) ,程度较低的称 为共享本体( s h a r e o n t o l o g i e s ) 。根据知识本体对领域的依赖程度由低到高分别分 成了四个类别: 1 顶级本体( t o p 1 e v e lo n t o l o g i e s ) 描述最普遍的概念及概念之间的关系, 如空间、时间、事件、行为等,与具体的应用无关,其他知识本体均为其特例。 2 领域本体( d o m a i no n t o l o g i e s ) 描述特定领域中的概念和概念之间的关系。 3 任务本体( t a s ko n t o l o g i e s ) 描述特定任务或行为中的概念及概念之间的 关系。 4 应用本体( a p p l i c a t i o no n t o l o g i e s ) 描述依赖于特定领域和任务的概念和 概念之间的关系。其关系图为 t o p - l e v e lo n t o l o g y l。m a ;n 。n t 。t 。g yt a s k , o n t o l o g y a p p l i c a t i o no n t o l o g y 图2 3 知识本体的分类 1 0 江苏大学硕士研究生毕业论文 目前己开发的本体项目中,大致可以归类到顶级本体这一类的主要包括有以 下几种: w o r d n e t 普林斯顿大学的英语w o r d n e t l 2 0 1 、基于心理语言规则的英文词 典,以s y n s e t s ( 在特定的上下文环境中可互换的同义词的集合) 为单位 组织信息。m i l l e r l 9 8 5 年在文献中解释这样的思想:使用同义词集合 ( s y n s e t ) 来代表词汇概念,并描述词汇矩阵,即在词的形式和意义之 间建立起映射关系( m a p p i n g ) 。 f r a m e n e t 英文词典,采用称为f r a m es e m a n t i c s 的描述框架,提供很强 的语义分析能力,目前发展为f r a m e n e f f i 。 g u m 面向自然语言处理,支持多语种处理,包括基本概念及独立于各 种具体语言的概念组织方式。 s e n s u s 面向自然语言处理,为机器翻译提供概念结构,包括7 万多 概念。 m i k r o k m o s 面向自然语言处理,支持多语种处理,采用一种语言中间的 中间语言t m r 表示知识。 语义在不同场景下具有不同的含义,领域信息资源语义强调的是面向机器理 解的语义,机器理解资源语义的基础在于能够将符号( 语义描述) 向明确、形式 化封装的领域知识映射。知识本体是共享概念模型的明确形式化规范说明,非常 适合用来表达领域知识,是实现机器理解语义的基石。人工智能领域对知识本体 的研究主要是从知识表示、本体形式化与推理方法、不同本体之间的转换和集成 等方面做了大量研究。由于网络环境下,应用系统之间相互交换可理解语义的信 息需要,w 3 c 也提出了相应的知识本体表示语言。目前w 3 c 已经形成的网络 本体表示语言标准包括:x m l 、r d f r d f s 、o w l 等。同时,一些组织和个人 推出了基于知识本体的应用开发平台。 2 4 描述逻辑 描述逻辑( d e s c r i p t i o nl o g i c ) 是一种功能强大的基于逻辑的知识表达语言 2 q 。描述逻辑基于逻辑的表示机制,根据概念和概念之间的二元关系描述术语学 的知识,二元关系可以用来根据必要和充分条件定义一个概念术语,概念的所有 实例必须满足这些条件。描述逻辑语言是语义w e b 本体层的主要语言之一。在 这里,我们使用的本体表示语言是d a m l + o i l ,也是一种基于描述逻辑的知识 本体表示语言。 江苏大学硕士研究生毕业论文 2 4 1 基本概念 描述逻辑是基于对象的知识表示的形式化,是一阶谓词逻辑的一个可判定子 集。它允许用一套约束的一阶公式说明继承性,与一阶谓词逻辑不同的是,描述 逻辑能提供可判定的推理服务,但推导功能限制在分类和包含。它被认为是以对 象为中心的表示语言的最为重要的归一形式。描述逻辑的基本组成包括概念 ( c o n c e p t ) 、角色( r o l e ) 和实例( i

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论