(计算机应用技术专业论文)领域本体中规则推理研究与实现.pdf_第1页
(计算机应用技术专业论文)领域本体中规则推理研究与实现.pdf_第2页
(计算机应用技术专业论文)领域本体中规则推理研究与实现.pdf_第3页
(计算机应用技术专业论文)领域本体中规则推理研究与实现.pdf_第4页
(计算机应用技术专业论文)领域本体中规则推理研究与实现.pdf_第5页
已阅读5页,还剩63页未读 继续免费阅读

(计算机应用技术专业论文)领域本体中规则推理研究与实现.pdf.pdf 免费下载

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

华东师范大学硕f :学位毕业论文领域本体中规则推理研究与实现 摘要 本体论知识表示方法是目前学术界的研究热点,而领域本体是一种重要的领域 知识共享和复用的方法,它与一定的推理机制一起可以为知识描述和语义共享与提 取等提供良好的解决方案。 本体推理的重要作用主要体现在对知识进行一致性检测和包含检测,即本体推 理一方面可以检测出本体中概念之间是否存在矛盾,另一方面,对给出的一个实 例,本体推理可以根据它的属性,推断出这个实例最适合的类别。虽然推理规则是 本体推理的核心部分,然而在领域本体中规则推理方面,对规则集的研究并不多, 而且规则集的覆盖面也并不广,这在很大程度上制约了本体推理的效率和效用。 针对上述问题,本文从当前比较流行的本体描述语言o w l 的构造符入手,在 分析其特有的蕴涵规则的基础上,扩展出了一套推理规则集,并以这套规则集为核 心构建了s s i s 系统( 世博语义查询系统) ,作为大型知识管理系统m m e s 系统( 基 于元数据的世博知识管理共享系统) 的重要组成部分。从而使得上海世博会相关知 识得到了有效的管理,并实现了对世博知识的语义查询,为世博信息服务提供了有 力的语义支撑。 本文的主要研究成果可以归纳为: 1 分析了本体的相关技术,并给出了一个基于本体的知识管理系统的框架,说 明了本体在知识管理系统中的重要地位。 2 针对本体描述语言o w l 构造符的语义,对o w l 蕴涵的推理规则进行扩 展,提出了一套o w l 推理规则。 3 将扩展的o w l 推理规则应用上海世博会领域本体中,从而实现了领域知识 的一致性分析和知识推理。 4 构建了上海世博会语义查洵系统( s s i s ) ,对其基本工作原理做出了解释。 关键词:知识管理;本体;o w l 语言;本体推理;上海世博会 华东师范大学硕士学位毕业论文领域本体中规则推理研究与实现 a b s t r a c t o n t o l o g yh a sb e e n c o n s i d e r e da sam o s tp r o m i s i n gk n o w l e d g er e p r e s e n t a t i o n m e t h o d ,a n dd o m a i no n t o l o g yi so n eo fe s s e n t i a ls h a r ea n dr e u s ea p p r o a c h e so fd o m a i n k n o w l e d g e d o m a i no n t o l o g i e st o g e t h e rw i t hc e r t a i nr e a s o n i n gm e c h a n i s m sp r o v i d eg o o d s o l u t i o n si nt h ef i e l d so fk n o w l e d g ed e s c r i p t i o n ,s e m a n t i cs h a r i n ga n de x t r a c t i o n ,a n di th a s b e e ne x t e n s i v e l yu s e da n dr e s e a r c h e d o n t o l o g yr e a s o n i n gp l a y sa ni m p o r t a n tr o l ei nk n o w l e d g ec o n s i s t e n c yc h e c k i n ga n d i n c l u s i o nd e t e c t i n g o nt h eo n eh a n d ,o n t o l o g yr e a s o n i n gc a nd e t e c tw h e t h e rt h e r ea r e c o n f l i c t sb e t w e e nc o n c e p t so fo n t o l o g y , o nt h eo t h e rh a n d ,f o rag i v e ni n s t a n c eo ft h e o n t o l o g y , o n t o l o g yr e a s o n i n gc a nf i g u r eo u tt h em o s ts u i t a b l ec l a s sw h i c ht h i si n s t a n c e b e l o n g st ob a s e do ni t sa t t r i b u t e s a m o n ga l lt h e s e ,i n f e r e n c er u l e sa r ct h ec o r ep a r to f o n t o l o g yr e a s o n i n g h o w e v e r , i nt h ef i e l do fr u l e b a s e do n t o l o g yr e a s o n i n g ,t h e r ei ss t i l l n o te n o u g hs t u d y , a n dt h ec o v e r a g eo fr u l es e t si sn o tw i d ee n o u g h a l lo ft h e s er e a s o n s r e s t r i c tb o t he f f i c i e n c ya n de f f e c t i v e n e s so fo n t o l o g yr e a s o n i n g t os o l v i n gp r o b l e m sd e s c r i b e da b o v e ,t h i sp a p e rf i r s tr e s e a r c ho p e r a t o r so fo w l w h i c hi st h em o s tp o p u l a ro n t o l o g yd e s c r i p t i o nl a n g u a g ec u r r e n t l y , t h e nb a s e do na n a l y s i s o fo w l ss p e c i f i ci m p l i c a t i o nr u l e s ,t h ea u t h o rd e s c r i b ea ne x t e n d e dr e l a t i v e l yc o m p l e t e i n f e r e n c er u l es e t t h es s i s ( s h a n g h a i - w o r l d e x p os e m a n t i ci n q u i r es y s t e m ) i sb u i l t b a s e do nt h es u g g e s t e dr u l es e t a sa ni m p o r t a n tp a r to ft h el a r g e - s c a l ek n o w l e d g e m a n a g e m e n ts y s t e m ( m m e s ,m e t a d a t ab a s e dm a n a g e m e n to fe x p ok n o w l e d g es h a r i n g s y s t e m ) ,s s i sp l a y s a ni m p o r t a n tr o l eb o t hi na c h i e v i n ge f f e c t i v ek n o w l e d g em a n a g e m e n t a n ds e m a n t i cs e a r c h i n gr e l a t e ds h a n g h a i - w o r l d - e x p o t h er e s e a r c hr e s u l t sp r o v i d ea n e f f e c t i v e l ys u p p o r t t i n gf o rs h a n g h a i w o r l d e x p oi n f o r m a t i o ns e r v i c e s t h em a i nr e s u l t so f t h i sp a p e rc a nb es u m m a r i z e da sf o l l o w s : 1 a f t e ra n a l y s i sr e l a t i v eo n t o l o g yt e c h n o l o g i e s ,t h ea u t h o rg i v e st h eo n t o l o g y b a s e d k n o w l e d g em a n a g e m e n ts y s t e mf r a m e w o r k w h i c hs h o w st h ei m p o r t a n tp o s i t i o no f o n t o l o g yi nk n o w l e d g em a n a g e m e n ts y s t e m 2 f o rs e m a n t i cm e a i n g so ft h eo n t o l o g yd e s c r i p t i o nl a n g u a g eo w l so p e r a t o r , t h e a u t h o re x t e n d so w li m p l i c a t er e a s o n i n gr u l e s ,a n dp r o p o s e dt h er e l a t i v e l y c o m p l e t eo w l i n f e r e n c er u l e ss e t 1 1 华东师范大学硕上学位毕业论文 领域本体中规则推理研究与实现一 3 t h ea u t h o ra p p l i e dt h ee x t e n d e do w lr e a s o n i n gr u l e st ot h es h a n g h a iw o r l d e x p od o m a i no n t o l o g yi no r d e rt oc h e c k i t sc o n s i s t e n c ya n dk n o w l e d g ed e d u c t i o n 4 a tl a s t ,t h ea u t h o rd e s c r i b e st h es s i s ( s h a n g h a iw o r l de x p os e m a n t i ci n q u i r e s y s t e m ) a n de x p l a i n si t sw o r k i n gp r i n c i p l e k e y w o r d s :k n o w l e d g em a n a g e m e n t ;o n t o l o g y ;o w l ;o n t o l o g yr e a s o n i n g ;s h a n g h a iw o r l de x p o 1 1 1 学位论文独创性声明 本人所呈交的学位论文是我在导师的指导下进行的研究工作及取得的 研究成果。据我所知,除文中已经注明引用的内容外,本论文不包含其他 个人已经发表或撰写过的研究成果。对本文的研究做出重要贡献的个人和 集体,均已在文中作了明确说明并表示谢意。 作者签名:l 啦 授权使用声明 本人完全了解华东师范大学有关保留、使用学位论文的规定,学校有权保 留学位论文并向国家主管部门或其指定机构送交论文的电子版和纸质版。有权 将学位论文用于非赢利目的的少量复制并允许论文进入学校图书馆被查阅。有 权将学位论文的内容编入有关数据库进行检索。有权将学位论文的标题和摘要 汇编出版。保密的学位论文在解密后适用本规定。 学位论文作者签名:i ; 售导师签名:溯 口期:到。虬必日期:五牟f :步 o r i g i n a l i t yn o t i c e i np r e s e n t i n gt h i st h e s i si np a r t i a lf u l f i l l m e n to ft h er e q u i r e m e n t sf o rt h em a s t e r sd e g r e ea t e a s tc h i n an o r m a lu n i v e r s i t y , 1w a r r a n tt h a tt h i st h e s i si so r i g i n a la n da n yo ft h et e c h n i q u e s p r e s e n t e di nt h e t h e s i sh a v eb e e nf i g u r e do u tb ym e a n yo ft h er e f e r e n c e st ot h ec o p y r i g h t , t r a d e m a r k ,p a t e n t , s t a t u t o r yr i g h t ,o rp r o p r i e t yr i g h to fo t h e r sh a v eb e e ne x p l i c i t l ya c k n o w l e d g e d a n di n c l u d e di nt h er e f e r e n c e ss e c t i o na tt h ee n do f t h i st h e s i s s i g n a t ur e :回生 c o p y r i g h tn o t i c e 1h e r e i na g r e et h a tt h el i b r a r yo fe c n us h a l lm a k ei t sc o p i e sf r e e l ya v a i l a b l ef o ri n s p e c t i o n if u r t h e ra g r e et h a te x t e n s i v ec o p y i n go f t h et h e s i si sa l l o w a b l eo n l yf o rs c h o l a r l yp u r p o s e s ,i n p a r t i c u l a r , s t o r i n gt h ec o n t e n to f t h i st h e s i si n t or e l e v a n td a t a b a s e s ,a sw e l la sc o m p i l i n ga n d p u b l i s h i n gt h et i t l ea n da b s t r a c to f t h i st h e s i s ,c o n s i s t e n tw i t h ”f a i ru s e ”a sp r e s c r i b e di nt h e c o p y r i g h tl a wo f h ep e o p l e sr e p u b l i co f c h i n a s i g n a t u 他:囡半d a t e 五l = 虫鸢 j o 华东师范大学硕士学位毕业论文 第1 章绪论 第1 章绪论 本章主要对本文的研究对象作了一个总体的介绍,包括领域本体和本体推 理的概念,以及构建上海世博会本体的研究背景和意义,并探讨了相关领域的 国内外研究现状,在此基础上论述了本文研究的主要内容和本文的结构布局。 1 1 研究背景 随着互联网和信息技术的崛起,人类掌握的各种知识呈爆炸性增长,各应 用领域累积的信息资源飞速增长。以目前受到全球广泛关注的“网上世博”为 例,其涉及各种各样的信息知识,这些信息知识又以音频、视频、网页、文本 等不同媒体形式存在着。这些信息源的形式多样,描述方式不统一,缺乏规范 性。信息源给出的数据可能是结构化的,半结构化的或者非结构化的,这为知 识管理和数据共享带来了很大的挑战。其次,作为一个大型国际化展览会,上 海世博会的知识涉及到很多方而,如园区建设、相关文化、组织机构、人员、 交通、相关资料等诸多方而,因而“网上世博”而临着知识容量的海量性和内 容的多样性等方面挑战,有效地知识表示和知识推理是上海世博会知识管理系 统的一个重要基础,并可为上海世博会各种信息服务提供语义支撑。本文即在 这样的现实背景下展开讨论。 知识表示的概念源自人工智能领域,当前比较流行的知识表示方法有:谓 词演算、概念图、框架、本体论方法等【l ,2 ,3 】,它们各有不同的形式化描述 方法,但均能有效地表示某一类知识。由于知识表述能力和推理能力很难兼 顾,所以这些知识表示方法各有侧重。谓词演算倾向于提供较强的推理能力, 而概念图、框架、本体等基于网络图的知识表示方法侧重在知识表示能力上。 本体是源自哲学领域的概念,近年来,本体概念广泛应用于人工智能研究 中的知识表示、共享以及重用。本体本身可以清晰的、形式化的描述目标领域 的概念和关系,基于本体的知识系统可以为人与计算机之间架起一座沟通的桥 梁,基于本体的知识系统与其他知识系统相比具有高可靠性和重用性的同时, 知识管理和获取能力都大大增强【4 】。就知识表示而言,本体语言作为描述逻辑 语言,兼顾表示能力与推理能【5 】。本体是目前学术界最看好的知识表示方法。 本文采用本体论技术对世博领域知识进行表示,并在此基础上,从w 3 c 华东师范大学硕士学位毕业论文 第1 章绪论 推荐的本体描述语言o w l 的构造符入手,提出了一套o w l 推理规则,并将其 应用的上海世博会领域本体中,从世博知识的一致性检查、实例归类和隐式知 识发现等方面达到了对世博知识的推理和维护,从而为上海世博会信息服务提 供了有力的语义支撑。 1 2 国内外研究现状 1 2 1 领域本体 在当今信息化社会中,智力资本已经超越了土地、劳动力等物质资本,智 力资本是决定一个组织或企业成败的最重要的因素。知识管理( k n o w l e d g e m a n a g e m e n t ,k m ) 就是组织和企业在这种新形势下做出的战略性反映。它通 过对组织所拥有的知识资源进行管理,促进组织内显性知识( e x p l i c i t k n o w l e d g e ) 和隐性知识( t a c i tk n o w l e d g e ) 的共享和重用,从而运用集体的智 慧提高组织的应变能力和创新能力。实践证明k m 真的可以提高知识处理过程 的效率和效用【6 1 。k m 主要包括存组织内、外部获取、表示、细化、访问和维 护知识等【7 】。k m 为我们解决上海世博会的问题,提供了有效的解决方案。 为实现计算机对知识智能推理,提高计算机的职能服务,过去的一二十年 间在人工智能和知识工程等领域发展起来的基于框架、基于规则、基于模型、 基于本体等多种知识建模技术【8 】。其中,基于本体的知识管理模型在一些复杂 的应用领域中表现尤为突出,例如组织知识领域,企业知识领域,城市地理信 息系统领域等等【6 ,7 ,9 】。 领域本体是一种重要的领域知识共享和复用的方法 1 0 】。领域本体为知识 描述,语义共享提取提供了良好的解决方案,并在诸多领域得到的广泛应用和 研究。数字图书馆系统建立了一个国共合作领域本体【l l 】,用来管理复杂的领 域知识并提供有效的错误检查和隐式知识推理的能力。h e a l t h e c h i l d 项目建立 了一个医学领域本体【1 2 】,用来记录和存取概念化的生物学和医学知识,研究 人员利用领域本体来为病人建立等级化的分类,从而实现病人数据的视觉化。 城市地理信息系统【9 】通过城市环境本体来实现用户间的数据和知识共享。此 外,领域本体在医学领域、地理空间信息系统中也得到了广泛的应用,并取得 了巨大的成功。本体技术为解决“网上世博”所面临的信息源形式多样,描述 方式缺乏规范等问题开启了一扇大门,可以利用领域本体来为上海世博会知识 2 华东师范大学硕士学位毕业论文第1 章绪论 建模并通过它来实现语义共享。 1 2 2 领域本体中的推理 随着对领域本体研究的不断开展,针对本体推理方面的研究也逐渐开展起 来了。从m c d e r m o t t 以及a l l e n 等人提出了对于a i 中的时间的推理【1 3 ,1 4 开 始,本体推理逐步从人工智能领域发展到了语义w e b 领域、知识表示领域、语 义相似度领域等等 1 5 ,1 6 ,1 7 1 。 本体推理的首要目标一方面是从显式的、已 知的知识中,推理出隐式的、未知的知识,另一方面是冲突检测、优化表达等 等。h u i y i n gl i 和y a n b i n gw a n g 等人 1 9 1 对基于r d f 和p d 幸语义的推理算法进 行了研究,之后不断有人对这一算法进行改进,设计新的算法。 h u i y i n gl i 等人 1 9 1 提出的算法是以r d f 蕴涵规则为前提,结合p d 宰语义 的前向链推理算法。它利用一个简单的循环来获取r d f 图g 中所有的p d * 闭 包。它利用这样的循环迭代过程来实现将所有的蕴涵规则应用到r d f 图g 上,直到无法得到新的声明为止。详细的算法描述如下: 1 初始化所有规则,作为触发器。 2 读入r d f 图g 和所有的三段式规则( 三元组) 。 3 迭代开始。 4 对于每一个规则,判断它是否是最后一次迭代触发的。如果它的前提与 上次迭代中新产生的三元组相匹配,则将此规则应用于图g ,并记录 由此触发的所有规则。 5 没有新的三元组产生时,迭代终止。 上述算法的前提是r d f 蕴涵规则集,这个规则集是相对较简单的。而在领 域本体中规则推理方面,对规则集的研究并不多,而且规则集的覆盖面也并不 广,这在很大程度上制约了本体推理的效率和效用。而本文就是在这样的研究 背景下,从分析本体表示语言o w l 的构造符入手,在r d f 蕴涵规则的基础 上,提出一套本体推理规则集,包括改进一些规则已经扩展出一些新的规则。 在推理算法方面,仍采用目前业界普遍接受的h u i y i n gl i 等人提出的算法。 华东师范大学硕士学位毕业论文 第1 章绪论 1 3 本文研究内容 本论文以领域本体中推理规则为研究对象,首先介绍了本体的相关技术, 包括本体的基本概念、本体的描述语言、本体推理的作用和本体推理机。然后 从分析本体描述语言o w ld l 构造符的语义入手,在r d f 蕴涵规则的基础上 扩展出了一套o w l 语言推理规则。并将这一套扩展的推理规则应用到上海世 博会领域的知识管理系统中,并对其起到的作用作了分析。最后,解释了世博 知识管理系统中,规则推理不分模块的工作原理。 本文的研究内容可以归纳为以下几点: 1 简要介绍了本体的相关技术,并给出了一个基于本体的知识管理系统的 框架,说明了本体在知识管理系统中的重要地位。 2 针对本体描述语言o w l 构造符的语义,对o w l 蕴涵的推理规则进行 扩展,提出了一套o w l 推理规则。 3 说明了扩展的o w l 推理规则在世博领域知识管理中的作用。 4 提出了为世博信息服务提供语义支撑的s s i s 系统的系统架构,并解释 了其工作原理。 1 4 本文组织结构 本文的组织结构如下: 本论文共分六章,内容安排如下: 第一章对论文的研究对象作了一个总体的介绍,包括世博知识管理的研究 背景以及领域本体和本体推理的发展历程,并给出了本文研究的主要内容和论 文的结构。 第二章探讨了本体的相关技术,包括本体的基本概念主要是给出了一个基 于本体的知识管理系统的框架,说明了本体在知识管理系统中的重要地位。接 着,介绍了当前比较流行的几种本体的描述语言。然后,从本体构建者和本体 使用者两个方面,分析了本体推理的作用。最后简要的介绍了几种本体推理 机。 第三章首先简要介绍了描述逻辑基础,给出了基于描述逻辑的知识系统的 体系结构。然后,分析了本体描述语言o w ld l 的形式化基础。接下来在r d f 蕴涵规则的基础上,针对o w l 构造符的语义,对o w l 蕴涵的推理规则进行扩 4 华东师范大学硕士学位毕业论文 第1 章绪论 展,最后,明确的提出了一套o w l 推理规则。 第四章首先初步构建了上海世博会领域本体,然后,将扩展的o w l 推理 规则应用到其中,并举例说明了这套推理规则有效性。 第五章描述了为世博信息服务提供语义支撑的s s i s 系统的系统架构,并解 释了其工作原理。 第六章对论文全文进行了总结,并对将来的研究方向进行了展望。 1 5 本章小结 本章介绍了世博领域本体中规则推理的研究背景和该领域的研究现状,说 明了研究的重要性和研究的重要意义,介绍了目前学术界常用的方法,指出了 其中的不足之处。本文将针对目前本体推理中推理规则的不足之处,扩展出一 套较完整的推理规则,并将这套推理规则作为研究内容。本章最后给出了本论 文的组织结构。 华东师范大学硕士学位毕业论文 第主章本体相关技术概述 第2 章本体相关技术概述 本章首先给出了本体的基本概念,并分析了本体在知识管理中的作用;随后对 当前比较流行的本体描述语言r d f 和o w l 做了简要的描述;并提出了本体推理的 必要性;最后介绍了本体推理机。 2 1 本体的基本概念 本节首先给出本体的定义,然后介绍了本体的基本元素,接着阐述了本体的分 类,最后简要描述了本体在知识管理中的作用。 2 1 1 本体的定义 本体( o n t o l o g y ) 的概念最初源自于哲学领域。1 7 世纪,德意志哲学家郭克兰 纽( r g o e l e n i u s ) 首次提出“o n t o l o g y ”一词。古希腊哲学家亚里士多德将本体定 义为研究“存在”的科学,又把它分为两个方面:一方面研究存在的本质,另一方 面研究客体对象的理论定义,即整个现实世界的基本特征【2 0 】。 人工智能( a r t i f i c i a li n t e l l i g e n c e ,a i ) 领域引入本体的概念,用于知识表示和 知识组织,其概念的内涵也发生了变化。在a i 领域最早给出本体的定义的是 n e c h e s 等人【2 l 】,他们将本体定义为“给出构成相关领域词汇的基本术语和关系, 以及利用这些术语和关系构成的规定这些词汇外延的规则的定义”。 斯坦福大学的g r u b e r 2 2 在1 9 9 3 年,给出了本体的一个最为流行的定义,即 “本体是概念模型的明确的规范说明”。其后,b o r s t 等 2 3 1 在g r u b e r 的基础之上, 给出了本体的另外一种定义,“本体是共享概念模型的形式化规范说明”。德国卡尔 斯鲁厄大学的s t u d e r 等人 2 4 1 对上述两个定义进行了深入的研究后,指出“本体是 共享概念模型的明确的形式化规范说明”。其中有四大特征:概念化 ( c o n c e p t u a l i z a t i o n ) 、明确( e x p l i c i t ) 、形式化( f o r m a l ) ) 和共享( s h a r e ) 。 概念化:又称概念模型。通过抽象出客观世界中一些现象( p h e n o m e n o n ) 6 华东师范大学硕士学位毕业论文第2 章本体相关技术概述 的相关概念而得到的模型。概念模型所表现的含义独立于具体的环境状 态。 明确:所使用的概念及概念间的联系都有明确的定义。 形式化:精确的数学描述,是计算机可读的。 共享:本体中体现的是共同认可的知识,反映的是相关领域中公认的概念 集,即本体是针对团体而非个体的共识。 p e r e z 等从分类法的角度出发,总结出本体包含五个基本的建模元语( m o d e l i n g p r i m i t i v e ) 【2 5 1 ,分别是:类或概念( c l a s s e so rc o n c e p t s ) 、关系( r e l a t i o n s ) 、函数 ( f u n c t i o n s ) 、公理( a x i o m s ) 和实例( i n s t a n c e s ) 。在实际构建本体时,不一定要严 格按照这五类元语,通常是结合特定领域的具体情况来定义具体的关系,以满足应 用的需求。 2 1 2 本体的分类 在1 9 9 7 年,g u a r i n o 2 6 提出以两个维度一一详细程度和领域依赖度,作为本体 分类的基础。详细程度是一个相对的、较模糊的概念,指描述或刻画建模对象的程 度。详细程度较高的称作参考本体( r e f e r e n c eo n t o l o g y ) ,而详细程度较低的称为共 享( s h a r eo n t o l o g y ) 本体。 依照领域依赖程度,本体可以细分为顶级本体( t o p l e v e lo n t o l o g y ) 、领域本体 ( d o m a i no n t o l o g y ) 、任务本体( t a s ko n t o l o g y ) 和应用本体( a p p l i c a t i o no n t o l o g y ) 四类。 顶级本体:描述最普通的概念及概念之间的关系,如空间、时间、事件、行 为等等,与具体的应用无关。其他利,类的本体都是项级本体的特例; 领域本体:描述特定领域( 食物、医疗等) 中的概念及概念之间的关系; 任务本体:描述特定任务或行为中的概念及概念之间的关系; 应用本体:描述依赖于特定领域和任务的概念及概念之间的关系。 李景博士【2 5 】认为,本体可以分为轻量级本体( l i g h t w e i g h to n t o l o g y ) ,中级本体 ( m i d d l eo n t o l o g y ) 和重量级本体( h e a v y w e i g h to n t o l o g y ) 。 轻量级本体:不具各逻辑推理功能,例如叙词表和w o r d n e t ; 7 华东师范大学硕1 :学位毕业论文第2 章本体相关技术概述 中级本体:具有简单的逻辑推理功能,系统可以识别一阶谓词逻辑的表达 式; 重量级本体:具有复杂的逻辑推理功能,系统可以识别更加复杂的二阶谓词 逻辑的表达式,并为更加复杂的推理功能的实现预留了接口,如c y c 本体 系统。 2 1 3 本体在知识管理中的作用 知识管理就是对组织和企业相关的各种知识内容进行处理,实现知识的生产、 共享、应用以及创新,从,产生价值并形成知识优势。其目标是让正确的知识在正 确的时间到达正确的人。现有知识管理系统通常存在的不足有【2 7 】: 信息检索方面:基于“关键词”的检索不仅会带回大量不相关的信息,还会 遗漏掉很多与主题意义相i j 或相近的信息; 信息抽取方面:大多数信息源缺乏对数据结构的描述,导致应用程序很难理 解文档的内容,很难抽取语义信息; 知识的维护和访问:由于知识源的表示缺乏元数据( m e t a d a t a ) 描述,使得 结构性较弱的资源的可交换性、可访问性较差,维护起来也困难。 而本体这个“共享概念模型的明确的形式化规范说明晗恰可以帮助弥补上述 不足。本体的目标是捕获相关领域的知识,提供对该领域知识的共同理解,确定该 领域内共同认可的词汇,并从不同层次的形式化模式上给出这些词汇( 术语) 和词 汇间相互关系的明确定义 2 8 】。这与知识管理的概念和目标不谋而合,相辅相成。 一个基于本体的知识管理框架如图2 1 所示。 在图2 1 所示的基于本体的知识管理框架中,本体知识库是整个框架的核心。 它是实现数据共享、知识访问和知识维护的基础。所以,本体知识库的构建是知识 管理活动中的核心任务。 在实践中,组织本体知识库的构建过程,一般是先用本体描述语言,例如r d f 或o w l 等,来对组织或企业内部、外部的基于元数据的知识进行表示,之后存储 在本体知识库中,然后在应用的实践中逐步增添组织相关的知识到知识库中。但这 个过程中一般是要有领域专家的参与,领域专家通过本体编辑器直接实现对本体知 识库的修改( 包括增加、删除等) 。对知识库的修改,通常会涉及到知识推理和本 8 $ 乐师大学学* 业论丘* 2 章本# 月* 技 概4 体知识库维护的工作。 当本体知识库初步构建完毕后,就可以为用,、提供语义层次上的知识访问了 当然,本体知识库需要在应用中逐步丰富和完善。 2 2本体的描述语言 田2 - 1 基 奉体的知讽t 曩挂集 2 21 本体描述语言概述 领域本体描述语言应满足良好定义的语法、盎好定义的语义、有效的推理支 持、充分的表选能力、表达的方便性,以为领域模型编写清晰的、形式化的概念描 述,使之能被计算机所理解。近年来,研究学者在该领域的研究十分活跃。目前有 华东师范大学硕: :学位毕业论文 第2 章本体相关技术概述 十几种较为典型且被大家认同的本体描述语言,包括r d f ( s ) 、o i l 、d a m l 、 d a m l + o i l 、o w l 、k i f 、s h o e 、x o l 、o c m l 、o n t o l i n g u a 、c y c l 、l o o m 等。 从应用对象的角度出发,可以将这些本体描述语言做如下分类: 与w e b 相关:r d f ( s ) 、o i l 、d a m l 、o w l 、s h o e 、x o l 。其中 r d f ( s ) 、o i l 、d a m l 、o w l 、x o l 之间有着密切的联系,是w 3 c 的本 体语言栈中的不同层次,也都是基于x m l 的。而s h o e 是基于h t m l 的,在h t m l 的一个扩展。 与具体系统相关:o n t o l i n g u a 、c y c l 、l o o m 。它们基本只在相关项目中使 用。 企业级:k i f ( 美国国家标准) 并没有被广泛应用于互联网,作为一种交换 格式更多的应用于企业级。 2 2 2 r d f ( s ) 资源描述框架( r d f ,r e s o u r c ed e s c r i p t i o nf r a m e w o r k ) 是w 3 c 推荐的一种基 于x m l 的标准,它提出了一个简单模型用来表示任意类型的数据。该数据类型由 节点和节点之间带有标记的连接弧所组成,节点表示w e b 资源,弧表示这些资源的 属性。r d f 标准可以解决x m l 的语义局限。而x m l 和r d f 的结合,不仅可以实 现数据基于语义的描述,也充分发挥了x m l 与r d f 的各自优点,便于w e b 数据的 检索和相关知识的发现。 r d f ( s c h e m a ) 在提供了简单机器可理解语义模型的同时,为领域化的本体语言 o i l 和o w l 提供了建模基础,并使得基于r d f 的应用可以方便地与这些本体语言 所生成的本体进行合并。r d f 的这一特性使得基于r d f 的语义描述结果具备了可 以和更多的领域知识进行交互的能力,也使基于x m l 和r d f 的w e b 数据描述具备 了良好的生命力。 2 2 3 o w i , o w l ( w e bo n t o l o g yl a n g u a g e ) 是w 3 c 推荐的语义网中本体描述语言的标 ( d d a nb r i c k l e y , g u h arvr e s o u r c ed e s c r i p t i o nf r a m e w o r k ( r d f ) s c h e m as p e c i f i c a t i o n1 0 【e b o l h t t p :w w w w 3 o r g t r r d f - s e h e m a 1 0 毕m ”m 大# 4 n 论i 2 $ 木# * # 术概* 准。它是结合欧洲的研究机构提出的本体描述语占o i l ,和美国研究机构提出的 d a m l ,而成的描述语言d a m l + o i l 上发展出来的。o w l 处于w 3 c 提出的本体 语言拽的晟上层,如罔2 - 2 所示。 _ 叵 i 【) a m l - r _ 田1 - 2 韵c 撮出车律爵盲幢 o w l 有三个子语言o w ll i t e 、o w ld l 和o w lf u l l 。这三个子语言分别针对 不同的需求。: o w l l i t e ;用于提供给那些只需要一个分类层次和简单的属性约束的用户。 o w ld l :支持那些需要在推理系统上进行最大程度表达的用户,这里的推 理系统能够保证计算完全性,即所有的结论都能够保证被计算出来和可 决定性,口所有的计算都在有限的时间内完成。它包括了o w l 语言的所有 约束,但是仅可被置于特定的约束下。 o w lf u l l :支持那些需要在没有计算保证的语法自由的r d f 上进行最大程 度表达的用户。它允许一个奉休在预定义的词汇表上增加词汇,因而任何 推理软件均不能支持o w lf u l l 的所有特征。 这三种子语苦与r d f 的关系是:o w lf u l l 可以看成是对r d f 的扩展,而 o w ll i t e 和o w ld l 可以看成是一个约束化的r d f 的扩展。任意一个o w ll i f e 、 o w l 。d i 或者o w lf u l l 文档都是一个r d f 文档;所有的r d f 文档都是一个o w l :茹篙:淼慧:嚣嚣“1 ”“”“一“”“9 “”“ 华东师范大学硕士学位毕业论文第2 章本体相关技术概述 f u l l 文档,然而只有一些r d f 文档是合法的o w ll i t e 和o w ld l 文档。 每个合法的o w ll i t e 都是一个合法的o w ld l ,而每个合法的o w ld l 都是 一个合法的o w lf u l l 。另外,每个有效的o w ll i t e 结论都是一个有效的o w ld l 结论,每个有效的o w ld l 结论都是一个有效的o w lf u l l 结论【3 0 】。 o w ll i t e 只是使用了o w l 语言的部分特征,并且做了更多的关于特征使用的 限制。例如,在o w ll i t e 中,类之间的等价关系和子类关系只能在具名类上做声 明,不能应用于任意的类表达式。类似地,o w ll i t e 只允许属性限制应用于命名了 的类。另外,o w l l i t e 中基数取值范围只能是0 和l 。 在实际应用中,选择o w ll i t e 还是o w ld l 主要取决于用户需要整个语言在 多大程度上给出了约束的可表达性;选择o w ld l 还是o w lf u l l 主要取决于用户 在多大程度上需要r d f 的元模型机制,例如定义类型的类型以及为类型赋予属性: 在使用o w lf u l l 而不是o w ld l 时,推理的支持不可预测,因为目前还没有完全 的o w l f u l l 的实现。 由于本文的研究对象上海世博会,具有概念涉及范围广、且概念问层次丰 富,属性关系复杂的特点,o w ll i t e 的表达能力并不能够满足我们的需求,而 o w lf u l l 不能为我们的应用提供有力的推理支持。而o w ld l 的语法保证了数据 共享时数据格式的统一,同时其语义推理机制解释了概念的隐含意义,保证了机器 对信息资源的智能化处理,所以本文采用o w ld l 这套完整的形式化体系来帮助我 们实现对上海世博会领域知识的管理。具体关于o w ld l 及其形式化的内容将在下 一章中做详细介绍。 2 3 本体推理的作用 2 3 1 从本体的构建者角度看 对于本体的构建者来说,本体的构建虽然是要遵循一定的原则和方法,但是目 前知识工程界,仍然没有一套统一的标准。大家在构建领域本体时,都是凭借自身 的经验和该领域的具体情况,按照自己的原则和方法来构建的。当前业界比较认可 的构建原则是g r u b e r 3 1 在1 9 9 5 年提出,之后陆续有人对其原则进行了补充【3 2 】。 在本体的构建方法方面,目前比较有名的有多伦多大学企业集成实验室研制的 1 2 华东师范大学硕士学位毕业论文第2 章本体相关技术概述 “t o v e 法”【3 3 ,m i k eu s c h o l d d e d e 和k i n g 的“骨架法”【3 4 ,西班牙马德里理工 大学人工智能实验室提出的“m e t h o n t o l o g y 方法”【3 5 ,美国南加州信息科学研究所 研发的“s e n s u 法”【3 6 ,美国k b s i 公司开发的永远描述和获取企业本体的 “i d e f 5 法 。这些方法都是由项目开发的实践经验中得出的,都需要“需求分 析”,“构建”和“评价”三个阶段。虽然这在一定程度上接近软件工程的开发生命 周期过程,但是将这些方法同i e e e l 0 7 4 1 9 9 5 一i e e e 标准软件开发生命周期法, 进行比较后,得出这些方法都没有完全成熟的结论。 尽管目前学术界对本体构建方面的讨论如火如茶,但是缺少公认的成熟的本体 建模标准和开发指导

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论