(计算机软件与理论专业论文)基于owl容错性推理系统的研究与实现.pdf_第1页
(计算机软件与理论专业论文)基于owl容错性推理系统的研究与实现.pdf_第2页
(计算机软件与理论专业论文)基于owl容错性推理系统的研究与实现.pdf_第3页
(计算机软件与理论专业论文)基于owl容错性推理系统的研究与实现.pdf_第4页
(计算机软件与理论专业论文)基于owl容错性推理系统的研究与实现.pdf_第5页
已阅读5页,还剩57页未读 继续免费阅读

(计算机软件与理论专业论文)基于owl容错性推理系统的研究与实现.pdf.pdf 免费下载

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

j 塑! 兰童堂些堡里墨竺竺里塞塑塞里 论文题目: 专业: 硕士生: 指导教师: 基于o w l 容错性推理模型的研究与实现 计算机软件与理论 郑海涛 梁华金副教授 摘要 网页本体语言是共享概念模型的明确形式化规范说明,能够以一种明确的、 形式化的方式来表示领域知识,提高异构系统之间的互操作性,促进知识共享。 而r d f r d f s 是一个完整的形式化系统,具备b n f 形式语法、基于模型理论的 形式语义,是一个完备、可靠的形式化系统。通过这些,保证了r d f 描述语义 推理的形式正确性,保证了应用程序对r d f s 描述的网页本体语言的语义解释。 网页本体语言是一种基于语义网的语言,网页本体语言试图提供一种语言能 够描述存在于网络文档和应用程序中的类以及它们之间的关系,它是r d f 在词汇 上的扩展。 现实生活中我们是怎么样理解和使用概念,一个通常意义上的词语的意思是 怎么样用来定义对象的,传统上有两种截然不同的方法来解决这个问题,那就是 一1 1 , 理学的方法和逻辑学的方法。本文主要研究怎么样调节这两种方法来对概念的 理解达到最好的效果,并且结合网页本体语言,开发了一个基于阏页本体语言的 容错性推理系统。 本文将首先提出一个基于理论的概念推理模型,以及解释各种智能体( 例如 人) 是怎么样对应于具体的环境来激活观点( 由多个理论来组成) 的,而这些观 点就是使用概念推理时所要调用的。本文所说的理论是代表事实和规则的集合, 无论是严格的还是容错性的。每个理论都会组织成内在的观点,本文所说的观点 就代表着智能体的思维形态或者一个智能体相对于另一个智能体的观点而建立 的模型。本文所指观点是组织成层次性的。在某个观点中,对于一个概念的理论 是可以优先于在另一个观点中代表相同概念的理论的。哪个观点优先级更高就要 根据上下文来判断了。 基于网页本体语言的容错性推理系统利用网页本体语言来对上述基于理论 的概念推理模型对现实对象进行建模,然后结合智能体的具体观点来对对象的属 性进行判断,利用观点的优先级解决了有冲突的属性之间的矛盾,从而为用户推 理出更合理的结果。 同时,o d r s 利用网页本体语言的内在特性,即对象之间都是三元组的关系, 适当扩展了功能,即定义了相应的语法来满足用户对于对象之间或者对象和属性 之间的一般性推理。 关键字:网页本体语言,资源描述框架,理论,观点,容错性,智能体,基于网 页本体语言的容错性推理系统,基于理论的概念推理模型 第2 页 茎主竺! ! 查堂垡堡堡至笙堕堑茎塑窒銎 t i t l e :r e s e a r c ha n d i m p l e m e n tt h eo w l b a s e d d e f e s i b l e r e a s o n i n gs y s t e m m a j o r :c o m p u t e rs o f t w a r ea n dt h e o r y n a m e : z h e n g h a l t a o s u p e r v i s o r :a s s o c i a t e p r o f e s s o rl i a n gh u a - j i n a b s t r a c t o w li sal a n g u a g e w h i c hc a nb eu s e dt od e f i n i t e l ya n df o r m a l l yd e s c r i b et h e s h a r e dc o n c e p tm o d e l i tc a nb eu s e dt or e p r e s e n tt h ek n o w l e d g ei na ne x p l i c i ta n d f o r m a l i z e d w a y i t e a r lb eu s e d t o i m p r o v e 也ei n t e r o p e r a f i o n b e t w e e nt h e h e l e r o g e n o n ss y s t e m s a n db o o s tt h es h a r eo ft h e k n o w :l e d g e r d 到r d f si s a l l i n t e g r a t e df o r m a l i z e ds y s t e m ,w h i c hh a st h eb n fs y n t a x ,f o r m a t i z e ds e m a n t i cb a s e d o nt h et h e o r yo f m o d e l i n g r d f r d f si sac o m p l e t e d a n dr e l i a b l es y s t e m a c c o r d i n g t ot h o s e i tc a ne u s u r et h ec o r r e c t n e s so f d e s c r i b i n gt h es e m a n t i ci n f e r e n c ea n dt h e s e m a n t i ci n t e r p r e t a t i o no f t h e0 w lw h i c hi sd e s c r i b e db yt h ea p p l i c a t i o n 7 西eo 记i si n t e n d e dt op r o v i d eal a n g u a g et h a tc a nb eu s e dt od e s c r i b e 也e c l a s s e sa n dr e l a t i o n sb e t w e e nt h e mt h a ta r ei n h e r e n ti n b bd o c u m e n t sa n d a p p l i c a t i o n s 0 w l i sa v o c a b u l a r ye x t e n s i o no f r d f i nt h ew o r l d h o wc a r lw eu s ea n d1 1 1 1 d e r s t a n dm e c o n c e p t ? i ng e n e r a l t h e r ea r e t w om e t h o d so f h o wt ou s et h em e a n i n go f 也ew e r dt od e f i n et h eo b j e c t ;o n ei s p s y c h o l o g i c a la p p r o a c h a n o t h e r i sl o g i c a la p p r o a c h 矶1 i sp a p e r m a i n l y r e s e a r c hh o w t oa d a p tt h e s et w om e t h o d st oa c h i e v et h eb e s tu n d e r s t a n dt h ec o n c e p t , a n dd e v e l o pa n d e f e a s i b l ei n f e r e n c es y s t e mb a s e do nt h eo 帑兄 t i l i sp a p e r 、v i p r o p o s ea nc o n c e p t u a l i z e di n f e r e n c em e d e lw h i c hb a s e do nt h e t h e o r ya n de x p l a i nt h ev a r i o u sa g e n t sh o w t oa c t i v a t ea p e r s p e c t i v e ( w h i c hc o n s i s t so f t h e o r i e s ) i nr e s p o n s et oas i t u a t i o ni nw h i c hr e a s o n i n gu s i n gac o n c e p ti sc a l l e df o r t h e o r i e sa r er e p r e s e n t e da ss e t so f f a c t sa n dr u l e s ,b o t hs t r i c ta n dd e f e n s i b l e e a c h t h e o r yi so r g a n i z e d i nac o h e r e n tp e r s p e c t i v ew h i c hs t a n d sf o ra na g e n t sm e n t a ls t a t e o r 锄a g e n t sm o d e lo fa n o t h e ra g e n t sp e r s p e c t i v e p e r s p e c t i v e sa r eo r g a n i z e di n t o h i e r a r c h i e sa n dt h et h e o r yf o rac o n c e p ti no n ep e r s p e c t i v em a y d e f e a tt h et h e o r yf o r t h es a m e c o n c e p t i na n o t h e r p e r s p e c t i v e w h i c hp e r s p e c t i v e i s s u p e r i o r j s c o n t e x t d e p e n d e n t n 旧o d r si sm o d e l e da c c o r d i n gt ot h ea b o v et c i m ,a n d j u d g e t h ep r o p e r t i e so f t h eo b j e c tw i t ht h eh e l po ft h ec o n c r e t ep e r s p e c t i v eo ft h ea g e n t s o d r su s et h e s u p e r i o r i t yo f t h ep e r s p e c t i v et os o l v et h ec o n t r a d i c t i o nt h ec o m p e t i t i v ep r o p e r t i e s , w h i c hc a nb eu s e dt or e a s o nam o r es o u n dr e s u l tf o rt h en s e l s i m u l t a n e o u s l y , 0 d r su s et h ei n s t i n c to f t h e0 w l w h i c hi st h et r i p l er e l a t i o n a m o n g t h eo b j e c t s ,t os a t i s f yt h er e q u i r e m e n to fr e a s o n i n gt h er e l a t i o nb e t w e e nt h e o b j e c t s0 1 t h eo b j e c t a n dt h e p r o p e r t y k e y w o r d :o w l ,r d f , t h e o r y , p e r s p e c t i v e , d e f e a s i b l e , a g e n t , o n t o l o g y 。b a s e d d e f e a s i b l er e a s o n i n gs y s t e m ,t h e o r y b a s e dc o n c e p t i n f e r e n c em o d e l 第3 页 一 一 量主垡坠查堂丝堡翌至望塑! 壅塑塞望 1 1 问题的提出 第一章综述 人作为一种高级的智能体,通过在他们思想中的知识和信仰来构建他们自己 的概念世界。人同时也是一种社会化的智能体,通过交流和别的智能体( 例如人) 来共享他们的思想世界。没有概念,人们的智能化和社会化行动将会是不可能的。 如果我们观察到或者经历的对象只是作为一种唯一的特殊性事物来存在,那么我 们将不可能记得那些无穷的事物,我们也不能够理解别的人所谈论的内容,除非 我们和那人一样,也有着对这些特殊化事物的相同经历。因此,我们都有着对事 物的推理性思维方式,传统的理论上有两种不同的方式帮助我们理解和使用一个 概念,利用一个词语的意思是来定义对象,那就是心理学的方法和逻辑学的方法。 但是这两种方法都存在各自的优势和不足之处,从心理学上来对事物进行推 理,能够得到最大的容错性,就是说对于事物的变化,它都是可以理解的,并且 做出相应的推理判断,因此无论事物怎么样变化,它都能感知并且有相应的判定: 但是,这些推理也是模糊性的,似是而非的,就是说,对事物的理解都是基于感 性认识的,没有对事物进行一个确定的概念化,没有利用某些词语的意思来对事 物进行判定,从而对事物是没有一个确定的判断的,这对于我们利用计算机来帮 助人们进行事物属性的推理是极其不利的,因为它的不确定性,我们很难完全从 心理学的角度来帮助人们对事物或者说是对象,做出准确的推理。 从逻辑学的角度来对事物进行推理,是根据规则来推理从而对事物的推理判 断都是有其确定性并且可以用机器来表达的,但是,因为规则是一开始就确定的, 一旦事物发生了改变或者它的属性和某些事物的属性发生了冲突,逻辑学上的推 理都是无法相应的发生改变来立即对事物做出一个准确的判断的,就是说,它的 容错性很低。 本文针对以上问题,研究了怎么样调节这两种方法来对知识的推理达到最好 的效果,并且结合网页本体语言,开发了一个基于网页本体语言的容错性推理系 统( o d r s ) ,提出一个基于理论的概念推理模型( t c i m ) ,以及解释各个智能体 是怎么样对应于具体的环境来激活观点( 由多个理论来组成) 的,而这些观点就 是使用概念推理时所要调用的。本文所指的理论是代表事实和规则的集合,无论 是严格的还是容错性的。每个理论都会组织成内在的观点,本文所指的观点就代 表着智能体的精神状态或者一个智能体相对于另一个智能体的观点而建立的模 型。本文中观点是组织成层次性的。在某个观点中,对于一个概念的理论是可以 优先于在另一个观点中代表相同概念的理论的。而哪个观点优先级更高就要根据 上下文来判断了。 本文首先对当前的研究现状以及对网页本体语言的背景知识进行说明,其次 提出一个基于理论的概念描述来对以上两种方法进行调解从而使对知识的推理 达到最好的效果,再结合网页本体语言来分析研究一个基于网页本体语言的容错 性推理系统( o d r s ) ,然后讨论o d r s 怎么样实现来对事物的属性达到较好的推理 并分析实验的结果,最后对研究工作进行总结并提出将来研究工作的进一步展 望。 第6 页 1 2 当前国内外的研究现状 目前国内外语义网以及网页本体语言的研究十分活跃,到目前为止,国际上 已经基于语义网研究开发了很多产品,而国内各大高校也成立了很多研究室来对 新一代的网络语言:语义网,进行研究。 语义嚼( s e m a n t i cw e b ) 可以说是新事物,是由w w w 的创始人b e r n e r s l e e 在 2 0 0 1 年正式提出的【2 ,7 】。它的提出,立即引起了人们极大的兴趣,在2 0 0 1 年就 召开两次关于语义网的专题学术讨论会,今年则已经是第三次。语义网研究的主 要目的就是扩展当前的w w w ,使得网络中所有信息都是具有语义的,是计算机 能够理解和处理的,便于人和计算机之间的交互与合作。因而其研究的侧重点就 是如何把信息表示为计算机能够理解和处理的形式,即带有语义。b e m e r s l e e 给出了语义网中的层次关系,它主要基于x m l 和r d f r d f s 9 , l 钟,并在此之 上构建本体和逻辑推理规则,以完成基于语义的知识表示和推理,从而能够为计 算机所理解和处理。在语义网的研究中,知识表示、本体论、智能主体等都是其 重要的研究内容,它们都是不可分割的【4 】。 w 3 c 2 0 0 2 年7 月3 1 日透露了发行o w lw e b 本体论语言( o w lw e b o n t o l o g yl a n g u a g e )工作草案的细节,其目的是为了更好地开发语义网 ( s e m a n t i cw 曲) 。 w 3 c 发言人i a nj a c o b s 说,开发语义网的目的是能够在互联网上进行更结构 化的智能处理,伊j 如,当一个人确定要参加某个城市的会议后,就可以自动查找 有关航班和酒店的信息。w 3 c 称,w 3 cw 曲本体论工作小组正在对o w lw 曲 本体论语言进行设计,o w l 是本体论w e b 语言( w e bo n t o l o g yl a n g u a g e ) 的 字母缩写。设计的最终目的是为了提供一种可以用于各种应用的语言,这些应用 需要理解内容,从而代替只是采用人类易读的形式来表达内容。作为语义网的一 部分,以l 、r d f 和r d f s 支持通过提供针对术语描述的词汇表,共同推进了 机器的可靠性。 w 3 c 发行的三种工作草案名为特色大纲( w e bo n t o l o g yl a n g u a g e ( o w l ) g u i d ev e r s i o nlo ) 、抽象句法( o w lw e bo n t o l o g yl a n g u a g el 0a b s t r a c t s y n t a x ) 和语言参考。 w 3 c 今年还发行了其w e b 服务架构使用方案集合的工作草案,目的是为下 一代的w e b 服务提供使用案例和方案。 w 3 cw e b 服务架构工作小组特别发行的方案包括诸如旅行社使用案例和类 似电子数据交换的采购等情形。j a e o b s 说:“w 3 c 官员正在制定有关w e b 服务架 构范围的文件。” 阿页本体语言( o w l ) 是语义网的一种形式化语言。 o n t o l o g y 的概念最初起源于哲学领域,可跌追溯到公元前古希腊哲学家亚里 士多德( 3 8 4 3 2 2b e ) 。它在哲学中的定义为“对世界上客观存在物的系统地描 述,r 口存在论”,是客观存在的一个系统的解释或说明,关心的是客观现实的抽 象本质i n 。 在人工智能界,最早给出o n t o l o g y 定义的是n e e h e s 等人,他们将o n t o l o g y 定义为“给出构成相关领域词汇的基本术语和关系,以及利用这些术语和关系构 成的规定这些词汇外延的规则的定义”【“】。n e e h e s 认为:“本体定义了组成主 题领域的词汇表的基本术语及其关系,以及结合这些术语和关系来定义词汇表外 第7 页 基于o w l 容错性推理系统的研究和实现 延的规则。”( “a no n t o l o g yd e f i n e st h eb a s i ct e r m sa n dr e l a t i o n sc o m p r i s i n gt h e v o c a b u l a r yo f a t o p i ca r e a a sw e l la st h er u l e sf o rc o m b i n i n gt e r m sa n dr e l a t i o n st o d e f i n ee x t e n s i o n st ot h ev o c a b u l a r y ”) 【6 i 。 本人和韩国檀国大学的金鸿基教授对o w l 进行了深入地研究,特别在 o n t o l o g y 整合 1 】以及基于o w l 的推理方面有定的研究成果。 在信息系统、知识系统等领域,也越来越多的人研究o w l ,并给出了许多 不同的定义以及应用,限于篇幅,本文就不一一说明了。 而对于事物的推理性研究早在古希腊就开始了,帕拉图提出了对事物的推理 的心理学上的方法,而亚里斯多德则最早提出了利用逻辑的观点来对事物进行推 理定义。本论文所涉及的非单调逻辑是关于非单调推理的逻辑,它的研究开始于 2 0 世纪8 0 年代。1 9 8 0 年,d 麦克多莫特和j - 多伊尔初步尝试着系统发展一种关 于非单调推理的逻辑。他们在经典谓词演算中引入一个算子m ,表示某种一致 性”断言,并将其看做是模态概念,通过一定程序把模态逻辑系统t 、s 4 和s 5 翻译成非单调逻辑。b 摩尔的论文非单调逻辑的语义思考( 1 9 8 3 ) 据认为在 非单调逻辑方面作出了令人注目的贡献。他在“缺省推理”和“自动认知推理”之间 做了区分,并把前者看作是在没有任何相反信息和缺少证据的条件下进行推理的 过程,这种推理的特征是试探性的:根据新信息,它们很可能会被撤消。自动认 知推理则不是这种类型,它是与人们自身的信念或知识相关的推理,可用它模拟 一个理想的具有信念的有理性的代理人的推理。对于在计算机和人工智能中获得 成功的应用而言,非单调逻辑尚需进一步发展。 直到现今,有关事物的容错性推理的研究已经有了较大的发展了,如r e i t e r 提出了非单一性( n o n m o n o t o n i c i t y ) 的推理,也是有关怎么样对事物进行有效的 容错性推理的 1 3 1 ,m c d e r m o t t 等人甚至提出了容错性推理的规范形式 1 4 1 ,还 有韩国的金鸿基教授也提出了为将来可以有效的进行容错性推理的心理上似是 而非的概念化模型【8 】:但是,这些研究大都是在理论上的,缺乏应用性,这是 因为没有有效的工具能把事物容错性的属性表达出来并且可以让计算机在语义 上识别事物的这些属性从而可以进行有效的推理。目前还很少关于利用语义网来 对事物的溯因推理( a b d u c t i o n ) 进行的研究,更不用说利用语义网的理论来进行 事物的建模并为用户进行对象属性的容错性推理( d e f e a s i b l er e a s o n i n g ) 了 第8 页 基于o w l 容错性推理系统的研究和实现 第二章研究背景 2 1 语义网的定义 “语义网”的目的就是要成为现今网络的一个扩展,对资源能够提供一个明 确的描述信息。从w 3 c ( w o d d w e b c o n s o r t i u m ) 的官方网页,我们可以知道“语 义网页”的定义【7 1 : 定义:“语义网页是万维网中数据的表现形式。它是由w 3 c 领导,一大批研究人 员和工业合作伙伴共同合作的结果。语义网页是基于r d f ( r e s o u r c ed e s c r i p t i o n f r a m e w o r k 资源描述框架) 的,它结合了各种不回的应用程序,这些程序使用x m l 作为语法,使用u r i 来命名。”( “t h es e m a n t i cw e b i st h er e p r e s e n t a t i o no f d a t ao n t h ew o r l dw i d ew 曲i ti sae o t l a b o r a t i v ee f f o r tl e db yw 3 cw i t hp a r t i c i p a t i o nf r o ma l a r g en u m b e r o f r e s e a r c h c r sa n di n d u s t r i a lp a r t n e r s i ti sb a s e do nt h er e s o u r c e d e s c r i p t i o nf r a m e w o r k ( r d f ) ,w h i c hi n t e g r a t e s av a r i e t yo f a p p l i c a t i o n su s i n gx m l f o r s y n t a xa n d u r i sf o rn a m i n g ” 语义网页通过提供灵活和可扩展的方法在形式上描述资源,这就让用户可以 文档化他们内容,从而让搜索引擎能够快速准确的找至n 这些内容。 2 2 资源描述框架( r d f ) 概述 资源描述框架( r d f ) 最初是于1 9 9 7 年作为一个表示一般信息和元数据的 方法提出来的。它是一种信息的描述语言,能够通过元数据来标志许多问题。 r d f 有如下性质: 基于简单化原贝l j 的; 灵活盼; 可扩展并且可向后兼容的; 能被众所周知的格式所描述,如x m l 。 这里限于篇幅,本文只对r d f 进行一个简短的介绍。r d f 的核心是构建三 元组。这些三元组可以被看作一幅图,每个三元组都是由一个节点指向另一个节 点。图2 1 显示了最简单的r d f 图形。 图2 - 1 :一个简单的r d f 图形 回2 - 1 的语义可以理解成某对象( s u b j e c t ) a g e n t 1 ( t h e p r e d i c a t e ) ,属性的 值是另一个对象( o b j e c t ) 一个具体的例子如图2 - 2 所示: 第9 页 基于o w l 容错性推理系统的研究和实现 图2 2 :d c :c r e a t o r 的属性表示 图2 2 的含义是网页:h t t p :e x a m p l e n e t m y p a g e 是由j o h ns m i t h 创建的。作 者j o h ns m i t h 是在一个长方形中,而h t t p :e x a m p l e n e t m y p a g e 是在一个椭圆中。 这是r d f 传统上用来区分资源和值的方法,通常事物用u r i :s l 的方法来表示, 这样有利于使用命名空间来定义唯一名字:而值只是字母或数字的组合序列,不 能表示唯一的定义。 另一方面属性写成d e :c r e a t o r ”d e :”就是h t t p :p u r l o r g d c e l e m e n t s 的缩写。 r d f 只是允许资源可以作为属性,因为值不是唯一表示对象的,所以不能作为 属性。通过使用唯一的资源作为属性,我们可以给属性一个准确的定义。r d f 属性的对象:h t t p :p u r l o r 型d c e l e m e n t s c r e a t o r 就是由d u b l i n 的核心元数据初始 化后并作为一个实体来定义的,主要用来描述资源的内容 1 5 】。 d u b l i n 核心元数据是一个组织,它定义了在事物当中广泛被使用和识别的一 些基本属性i 1 5 1 。 另一个区别资源和值的原因是资源也应该是唯一的,而值不一定,资源还可 以成为别的三元组的主题( s u b j e c t ) 。这里有两个原因为什么我们要用资源而不 是值来表示网页h t t p :e x a m p l e n e t m y p a g e 的作者。第一个是正如以上所说的, 字符串的值并不是唯一的。有可能多过一个人的名字是“j o h ns m i t h ”的。 另一个原因就是我们或许想要添加额外的信息来描述作者,例如电子邮件和 电话号码。如图2 - 3 所示,一个唯一的资源h t t p :e x a m p l e n e f f e x p l o y e e s j o h n s m l t h , 就表示一个作者有着额外的描述信息,这些属性是一些例子,这里“e x :”是 h t t p :e x a m p l e n e t r d f 缩写。 图2 - 3 :资源可以是主体( s u b e c t ) 也可以是客体( o b j e c t ) 2 3w e b o n t o l o g yl a n g u a g e ( o w l ) 概述 现今万维网的数据结构是很差的,就象一幅杂乱无章的地图。当我们深入研 究网络中的文档和有效信息的时候,都是基于关键字来进行检索,还要灵活的使 用文档相互之间的超级链接以及了解其使用模式。没有有效工具的支持,这些大 量的数据是不易于管理的。各种计算性的工具需要对这些数据的内容以及可访问 的资源有个机器可读的描述,从而把它们能够更加精确的反映出来【2 】。同时, 第l o 页 基于o w l 容错性推理系统的研究和实现 这些描述也必须要让人们可以理解。这些复杂的描述就需要个强大的工具来支 持,这里,人们提出了o w l 语言。 2 3 1o w l 的定义 o n t o l o g y 最早是一个哲学的范畴,后来随着人工智能的发展,被人工智能界 给予了新的定义。然后最初人们对o n t o l o g y 的理解并不完善,这些定义也出在 不断的发展变化中,比较有代表性的定义列表如下 范畴提出时间提出人定义 客观存在的一个系统的解释和 哲学 说明,客观现实的一个抽象本质 1 9 9 1 n e c h e s 等给出构成相关领域诃汇的基本 术语和关系,以及衬用这些术语和关 系构成的规定这些词汇外延的规则 的定义 计算机 1 9 9 3 g r u b e r概念模型的明确的规范说明 1 9 9 7 b o r s t共事概念模型的形式化规范说 明 1 9 9 8 s t u d e r共享概念模型的明确的形式化 规范说明 关于最后一个定义的说明体现了o w l 的四层含义: 概念模型( c o n c e p t u a l i z a t i o n ) 通过抽象出客观世界中一些现象( p h e n o m e n o n ) 的相关概念而得到的模型, 其表示的含义独立于具体的环境状态 明确( e x p l i c i t ) 所使用的概念及使用这些概念的约束都有明确的定义 形式化( f o r m a l ) o w l 是计算机可读的。 共享( s h a r e ) o w l 中体现的是共同认可的知识,反映的是相关领域中公认的概念集,它 所针对的是团体而不是个体。 o w l 的目标是捕获相关的领域的知识,提供对该领域知识的共同理解,确 定该领域内共厨认可的诃汇,并从不同层次的形式化模式上给出这些词汇( 术语) 和词汇之间相互关系的昵确定义。 2 3 2 为什么要用o w l 当用户询问到:“告诉我,我应该买这些卖单上面的哪种酒,还有,我并不 喜欢喝葡萄酒。”对于用户这样的询问,现今很难找到这样的工具能够在网络上 检索出这样的酒来满足用户的要求。相似地,要一个软件代理来对网络上的资源 进行序列化整理也是非常困难的。 而语义网就是要对将来网络信息的一个清晰的描述,使得网络信息对机器来 说更加容易进行自动化处理和集成网络上有效的信息。语义网将会在x m l 的基 第1 l 页 一 墨竺! 竺窒筻丝堡型墨竺塑! 塞塑塞堡 础上定义标记化的框架和r d f 等可扩展方法来代表数据。语义网页所需要的第 一层在r d f 之上是一种存在论语言( o n t o l o g yl a n g u a g e ) 。o w l 语言能够正式 的描述各种在阿络文档中术语的意义。如果机器要在这些文档上面实现有效的推 理任务,o w l 语言就必须建立在r d f 框架的基本语义之上,实际上,o w l 就 是r d f 在词汇上的扩展 3 】。 o w l 是语义网页动作的一个部分。它努力去使得网络资源更加容易理解。 从而通过添加描述或提供网络内容的资源信息进行自动化处理。因为语义网页本 质就是分布式的,o w l 必须允许信息能够从分布式资源中收集得来。这可以部 分地从允许的有关o n t o l o g i e s 中获得,包括明确从别的o n t o l o g i e s 中引入所需信 息。 另外,o w l 是假定了世界是开放的。就是说,资源的描述是不限制在一个 单一的文件或者范围中的。当类c l 初始被定义在o w l 0 1 中的时候,它可以被 扩展到别的o n t o l o g i e s 中。那些有关c l 的附加的命题是无变化的。新的信息不 能从先前的信息中得到。新的信息可以是存在矛盾性质的,不过事实( f a c t s ) 和 限制条件( e n t a i l m e n t s ) 只能被添加,决不能被删除。 因此,o w l ( w e b o n t o l o g y l a n g u a g e ) 适用于这样的应用,在这些应用中, 不仅仅需要提供给用户可读的文档内容,而且希望处理文档内容信息。o w l 能 够被用于清晰地表达词汇表中的词条( t e r m ) 的含义以及这些词条之间的关系。 而这种对词条和它们之间的关系的表达就称作o w l 。o w l 相对x m l 、r d f 和 r d f s c h e m a 拥有更多的机制来表达语义,从而0 w l 超越了x m l 、r d f 和 r d f s c h e m a 仅仅能够表达网上机器可读的文档内容的能力。 2 3 3o w l 在语义网中的地位 语义网是对未来网络的一个设想,在这样的网络中,信息都被赋予了明确的 含义,机器能够自动地处理和集成网上可用的信息。语义网使用x m l 来定义定 制的标签格式以及用r d f 的灵活性来表达数据,下一步需要的就是一种o n t o l o g y 的网络语言( 比如o w l ) 来描述网络文档中的术语的明确含义和它们之间的关 系。 o w l 是w 3 e 推荐的语义网络“栈”中的一部分,这个“栈”被表达如下: 名称描述 x m l 结构化文档的表层语法,对文档没有任何语义约束。 x m ls c h e m a定义订l 文档的结构约束的语言。 r d f对象( 或者资源) 以及它们之间关系的数据模型,为 数据模型提供了简单的语义,这些数据模型能够用 x m l 语法进行表达。 r d fs c h e m a描述r d f 资源的的属性和类型的词汇表,提供了对 这些属性和类型的普遍层次的语义。 0 w l 添加了更多的用于描述属性和类型的词汇,例如类型 之间的不相交性( d i s j o i n t n e s s ) ,基数( c a r d i n a l i t y ) , 等价性,属性的更丰富的类型,属性特征( 例如对称 性,s y m m e t r y ) 。以及枚举类型( e n u m e r a t e d c l a s s e s ) 。 第1 2 页 苎q ! ! 窒堡壁堡里墨竺塑堑塞塑塞墨 图2 - 4 给出了w 3 c 的o n t o l o g y 语言栈描述: 图2 4w 3 c 的o n t o l o g y 语言栈 当描述一种x m l 或者两络文档时。你或许会闯“为什么菲要我甩o w l 而 不用x m l 或者x m ls c h e m a ? ”这里有两方面的要点回答这个问题 2 】: 1 o w l 区另于x m ls c h e m a 的一个重要方面就是它的知识化的表示, 不是一个单纯的信息格式。绝大多数的基于网络标准的工业都是基于 信息格式和各种协议标准的组合。这些格式已经被赋予了一个可操作 性的语义,就象“当收到订购信息的时候。要求把相应数额的钱从一 个账户拨至4 另一个账户,然后发送产品。”不过,这些信息并不是设 计成能够在交易外部进行推理。例如,我们通常不能有这样的机制来 推理得鲰由于产品是一种威士忌所以它必须是种红酒。 2 o w l 的另一个优势是它能够成为一个自我推理的有效工具。这工具 能够提供一个通常意义上的支持,但是对于特殊的主题领域没有特殊 化。这种情况下,有利于建立一个系统针对特殊的工业标准的x m l s c h e m a 来进行演绎推理。建立一个合理有效的推理系统并不是一个 简单的任务。构建一个o w l 是一个相对容易管理并且有效的策略。 我们期望多个匝队能够从o w l 的构建来着手。他们将能够从基于 0 w l 语言中正式属性的第三方工具得益,这些工具能传达一种性能 上的分类,这是绝大多数的组织很难去复制的。 2 3 4o w l 的建模元语 p e r e z 等人用分类法组织了o w l ,归纳出5 个基本的建模元语( m o d e l i n g p r i m i t i v e s ) : 类( c a s s e s ) 或概念( c o n c e p t s ) 指任何事务,如工作描述、功能、行为、策略和推理过程。从语义上讲,它 第1 3 页 一苎主竺坚窒堂丝丝型墨竺竺堑塞塑塞翌 表示的是对象的集合,其定义一般采用框架( f r a m e ) 结构,包括概念的名称, 与其他概念之间的关系的集合,以及用自然语言对概念的描述。 关系( r e l a t i o n s ) 在领域中概念之间的交互作用,形式上定义为n 维笛卡儿积的子集:r :c 、 c 2 x g a 如子类关系( s u b c l a s s o f ) 。在语义上关系对应于对象元组的集 合。 函数( f t m c t i o n s ) 一类特殊的关系。该关系的前n 一1 个元素可以唯一决定第n 个元素。形式 化的定义为f :c l c 2 g 。l c 。如m o t h e r - o f 就是一个函数, m o t h e r - o f ( x ,y ) 表示y 是x 的母亲。 公理( a x i o m s ) 代表永真断言,如概念乙属于概念甲的范围。 实例( i n s t a n c e s ) 代表元素。从语义上讲实例表示的就是对象。 另外,从语义上讲,基本的关系共有4 种: 关系名关系描述 p a r t - o f表达概念之间部分与整体的关系。 k i n d - o f表达概念之间的继承关系,类似于面向对象中 的父类与子类之间的关系。 i n s t a n c e o f表达概念的实例与概念之间的关系,类似于面 向对象中的对象和类之间的关系。 a t t r i b u t e o f表达某个概念是另一个概念的属性。如“价格” 是桌子的个属性。 在实际建模过程中,概念之间的关系不限于上面列出的4 种基本关系,可以 根据领域的具体情况定义相应的关系。 2 3 5o w l 和语义网络 o w l 和语义网络的联系和区别列表如下: 第1 4 页 基于o w l 容错性推理系统的研究和实现 联系 它们都是知识表示的形式,均可以通过带标记的有 向图来表示,适合于逻辑推理。 比较方面o w l语义网络 是对共享概念模型的规范说从数学上讲是一种带有 明,即其概念在某个特定领标记的有向图,最初用 域是公认的,是面向特定领于表示命题信息,现广 域的概念模型。泛用于专家系统表示知 识。其节点表示物理实 描述的对 体、概念或状态。边用 于表示关系,但是对节 象和范围 点和边都没有特殊规 定,所以描述的范围比 区别 o w l 广。 【例子】:语义网络中可以表达“我的汽车是红色的”, 而o w l 则适合表达如“团体组织的内部构成”等整体 内容。 表不附深有5 个要素“元语,类,关 深度上不如o w l ,对建 度上系,函数,公理和实例”,它模没有特殊要求。 通过这5 个要素来严格、正 确地亥4 画所描述的对象。 建模条件建立必须有专家的参与,相 不必有专家的参与。 对更加严格和困难,这也是 o w l 目前的主要缺点之一。 2 3 6 构造o w l 的规则 出于对各自问题域和具体工程的考虑,构造o w l 的过程各不相同。日前没 有一个标准的o w l 的构造方法。最有影响的是g r u b e r 在1 9 9 5 年提出的5 条规 则: 明确性和客观性:o w l 应该用自然语言对所定义的术语给出明确、客观的 语义定义。 完全性:所给出的定义是完整的,完全能表达所描述的术语的含义。 一致性:由术语得出的推论与术语本身的含义是相容的,不会产生矛盾。 最大单调可扩展性:向o w l 中添加通用或专用的术语时,不需要修改已有 的内容。 最小承诺:对待建模对象给出尽可能少的约束。 目前大家公认在构造特定领域的o w l 的过程中需要领域专家的参与a 第t 5 页 一 苎! 竺型! 窒笪堡堡墨薹竺竺翌窒塑塞翌 第三章基于理论的概念推理模型 3 1 概念的模糊性 在西方哲学的历史中,有关事物的含义( i m p l i c a t i o n ) ,概念( c o n c e p t s ) ,意 义( m e a n i n g ) 的问题是最重要的也是争论的最激烈的问题之一。同时,这个论 题虽是如此普遍但也是模糊的,以至于每个理论( 理论是代表事实和规则的集合) 使用同样的词语的时候会讨论到完全不同的事物,或者会使用完全不同的词语来 表达同样的事物。就象“含义”,“概念”,“意义”这些词,它们联系紧密,但 “含义”是形而上学论中的词语,“意义”是语义学中的词语,而心理学家和研 究心理学的人工智能专家就喜欢使用“概念”,“计划”,“念头”这些词语。 例如,我们是如何定义一个词语x 的概念的问题能够重新描述成我们如何知 道x 这个词语的意义这个问题。同时,这个问题也能关联到形而上学论中的问 题,例如这里就是x 的含义和我们是怎么样认知和描述有关“x ”的具体事物的。 本文的一个主要目的就是建立一个可计算的模型,这个模型

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论