已阅读5页,还剩76页未读, 继续免费阅读
(计算机应用技术专业论文)基于语义web的自动推理技术研究.pdf.pdf 免费下载
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
西北大学学位论文知识产权声明书 y 8 9 3 40 3 本人完全了解学校有关保护知识产权的规定,即:研究生在校攻 ;学位期间论文工作的知识产权单位属于西北大学。学校有权保留并 j 国家有关部门或机构送交论文的复印件和电子版。本人允许论文被 i 阅和借阅。学校可以将本学位论文的全部或部分内容编入有关数据 i 进行检索,可以采用影印、缩印或扫描等复制手段保存和汇编本学 论文。同时,本人保证,毕业后结合学位论文研究课题再撰写的文 一律注明作者单位为西北大学。 保密论文待解密后适用本声明。 学位论文作者签名:嶙指导教师签名:毖越 砌z 年月万日 矽二年月西,目 西北大学学位论文独创性声明 本人声明:所呈交的学位论文是本人在导师指导下进行的研究工 及取得的研究成果。据我所知,- 除了文中特别加以标注和致谢的地 亨外,本论文不包含其他人已经发表或撰写过的研究成果,也不包含 与获得西北大学或其它教育机构的学位或证书而使用过的材料。与我 一同工作的同志对本研究所做的任何贡献均已在论文中作了明确的 抱明并表示谢意。 学位论文作者签名:橼 训j 年g 月z 一日 摘要 语义w e b 是由万维网的创始人b e m e r s l e e 在2 0 0 1 年正式提出的。语义w e b 研究的主要目的就是扩展当前的万维网,使得网络中的信息都具有语义,使计算 机能够理解和处理,便于人和计算机之间的交互及协作。因而其研究的重点就是 如何把信息表示为计算机能够理解和处理的形式。关于计算机的推理,首先需要 解决的问题就是计算机对知识的理解问题,只有计算机理解了所建立的知识,才 能在此基础上展开推理服务。语义w e b 出现的目的就是为了解决机器和人对知 识的理解的问题,因此我们可以在语义w e b 的基础上展开推理。 本文首先分析了语义w e b 的体系结构及其相关知识,然后对本体论的逻辑基 础一描述逻辑进行了研究。最后在此基础上提出了一种有效的推理系统。描述逻 辑系统可以提供一些典型的推理服务,例如,概念分类,概念的可满足性及概念 的实现,知识的一致性检测等一系列的推理服务。这些推理服务能够很好的发现 知识中的隐藏知识并且能够发现知识定义中相互矛盾的概念。本体论的理论基础 是描述逻辑,o w l d l 和描述逻辑有很好的对应关系,因此我们在建立知识库时 使用了o w ld l 。使用o w ld l 的好处在于:f 1 ) n 用描述逻辑的推理机能够发现 在知识定义过程中相互矛盾之处,并且发现隐藏知识。( 2 ) 能够更好的进行知识 的分享和再次利用。为了克服o w l d l 在推理机制上的不足,我们引入了s w r l 来表示稆应觏则,以便更好的进行推理服务。因为s w r 乙规则的定义本身就是在 o w l d l 本体之上的,所以我们利用o w l d l 所定义的领域知识能够很好的和规 则相结合。由于目前的专家系统的推理部分均不能直接接受o w ld l 格式的知识 和s w r l 所表示的规则,因此,我们建立起本体之后,首先利用r a c e r 等支持 描述逻辑推理的推理机对本体进行推理,发现矛盾,及隐含知识。然后利用p r o t 6 9 6 的j e s s t a b 接口实现o w l d l 格式至o j e s s 格式的转换,使j e s s 推理引擎可以获得知 识。另外,关于s w r l 规则的转换我们使用t x s l t 。最后我们将知识和规则导 入推理引擎进行推理。 关键词:语义w e b ,本体论,描述逻辑,s w r l ,推理引擎 r e s e a r c ho nt e c h n olo gie so fs e m a n ticw e bb a s e d a u t o m a t i cr e a s o n i n g a b s t r a c t t h es e m a n t i cw e bi sf o r m a l l yp u tf o r w a r db yb e m e r s - l e e ,t h ei n i t i a t o ro f w w i n2 0 0 1 t h em a i np u r p o s eo ft h es e m a n t i cw e br e s e a r c hi st oe x t e n dt h e c u r r e n tw e bi no r d e rt om a k et h ei n f o r m a t i o ni nt h en e t w o r kh a v ei t ss e m a n t i c u n d e r s t a n d i n g ,a n dt ob e u n d e r s t o o da n dh a n d l e db yt h ec o m p u t e r , a n dt ob e c o n v e n i e n tt ot h ei n t e r a c t i o na n dc o o p e r a t i o nb e t w e e np e o p l ea n dc o m p u t e r s o ,t h e i m p o r t a n c eo fr e s e a r c hi sh o w t or e p r e s e n tt h ei n f o r m a t i o na st h ef o r mt h a tc o m p u t e r c a nu n d e r s t a n da n dh a n d l e ,t h a ti s ,t h ei n f o r m a t i o nh a si t ss e m a n t i cu n d e r s t a n d i n g i n o r d e rt om a k ec o m p u t e rh a v et h ec a p a c i t yo fi n f e r e n c es e r v i c e s ,f i r s to fa l l ,w em u s t m a k ec o m p u t e ru n d e r s t a n dt h ek n o w l e d g e b e c a u s ew h e nc o m p u t e ru n d e r s t a n d st h e k n o w l e d g e ,i tc a nm a k ei n f e r e n c es e r v i c e s t h em a i np u r p o s eo ft h es e m a n t i cw e b r e s e a r c hi st os o l v et h ep r o b l e m ,t h a ti sp e o p l ea n dc o m p u t e rc a nu n d e r s t a n da n d h a n d l et h ek n o w l e d g e s o ,w ec a nd e v e l o pt h ei n f e r e n c es e r v i c e sb a s eo nt h es e m a n t i c w 曲 t h i st h e s i s f i r s t l ya n a l y z e dt h ef r a m e w o r ko ft h es e m a n t i cw e ba n do t h e r r e l a t e dk n o w l e d g e ,a n dt h e nw em a k et h er e s e a r c ho nt h eb a s eo f l o g i ca b o u to n t o l o g y a tt h ee n do ft h i s t h e s i s ,w ep r o p o s e dar e a s o n i n gs y s t e mb a s eo nt h a tr e s e a r c h d e s c r i p t i o nl o g i c ss y s t e m so f f e ras e to ft y p i c a li n f e r e n c es e r v i c e s ,s u c ha sc o n c e p t s c l a s s i f i c a t i o n ,s a t i s f i a b i l i t ya n dr e a l i z a t i o n ,k n o w l e d g eb a s ec o n s i s t e n c yc h e c k i n g t h e s ei n f e r e n c es e r v i c e sc a nf i n dm u c hc o n n o t a t i v ek n o w l e d g ea n di n c o n s i s t e n c i e s a b o u tt h ek n o w l e d g eb a s e t h et h e o r e t i c a lb a s eo fo n t o l o g yi s d e s c 却t i o nl o g i c s s y s t e m ,o w ld la n dd e s c r i p t i o nl o g i c sh a v eag o o dc o r r e s p o n d i n gr e l a t i o n ,s ow e u s et h eo w ld lt ob u i l dt h ek n o w l e d g eb a s e t h ea d v a n t a g e so f u s i n gt h eo w l d l a r ea sf o l l o w s :( 1 ) w ec a nf i n dm u c hc o n n o t a t i v ek n o w l e d g ea n di n c o n s i s t e n c i e s a b o u tt h ek n o w l e d g e b a s e ( 2 ) w ec a ns h a r ea n dr e u s et h ek n o w l e d g eb e t t e r i no r d e rt o 2 r e p a i rt h eo w l d l si n s u f f i c i e n c yo nt h ei n f e r e n c e ,w eu s et h es w r lt oe x p r e s st h e r u l e s ,s ot h a tw ec a l lm a k er e a s o n i n gs e r v i c eb e t c e r t h er u l eo fs w r li sb a s eo nt h e o w ld l ,s ow ec a r lm a k et h ek n o w l e d g eb a s ea n dt h er u l ec o n n e c tb e t t e r b e c a u s e t h ei n f e r e n c ee n g i n eo f t h ee x p e r ts y s t e mc a l ln o td i r e c t l yh a n d l et h ek n o w l e d g eo f t h e o w ld la n dt h er u l eo fs w r la tp r e s e n t ,a f t e rt h eo n t o l o g yi sb u i l t ,w ef i r s t l yu s e t h et o o l so f p r o v i d i n gt h ed e s c r i p t i o nl o g i c sr e a s o n i n g ,f o re x a m p l er a c e r ,t or e a s o n , t h e nw ec a nf i n dc o n n o t a t i v ek n o w l e d g ea n di n c o n s i s t e n c i e sa b o u tt h ek n o w l e d g e b a s e w es e c o n d l yu s et h ei n t e r f a c eo fj e s s t a bp r o v i d e db yp r o t 6 9 6t ot r a n s l a t ef r o m o w ld lf o r m a tt oj e s sf o r m a t ,s ot h ei n f e r e n c ee n g i n ec a nh a n d l et h ek n o w l e d g e b a s e i na d d i t i o n ,w eh a n d l et h es w r lr u l eb yt h eu s eo fx s l t f i n a l l y , w e t r a n s f e r r e dt h ek n o w l e d g eb a s ea n dt h er u l et oi n f e r e n c ee n g i n et or e a s o n k e yw o r d s :s e m a n t i cw e b ,o n t o l o g y , d e s c r i p t i o nl o g i c ,s w r l ,i n f e r e n c ee n g i n e 3 1 1 研究背景 第一章引言 9 0 年代,万维网诞生以来,万维网上的网页资料以几何级数爆炸式增长,但 由于缺乏一个好的组织和管理方法,导致整个万维网上的信息变的很庞大且缺乏 系统的分类,从而使人们难以充分利用这些信息资源。传统w e b 方式主要是通过 人工处理搜索关键字并利用w e b 文件中的超级链按来查询所需要的资料,这样的 使用方式有很多缺点,如:需要过多的人工干预、效率低下;不容易选取合适的 关键字;往往返回过多的无关信息。另外,在传统万维网上的资源很难被其它机 器使用和共享。造成这种现象的主要原因是由于传统的万维网,没有可以清晰表 达语义信息的方式,从而导致信息资源不能充分利用。因此目前的万维网迫切需 要能够清晰表达语义的方法,这也就是语义w e b 现的原因。由于语义w e b 能够 为w e b 上的资源附加上计算机可以理解的内容,便于计算机处理,给出了一种计 算机能够理解的表示资源的手段,语义w e b 的研究逐步受到重视。t i m b e m e r s - l e e 将语义w e b 定义为“一个可以被机器所理解的网站,同时也是信息的 一个集合体 1 】”,既然机器可以理解w e b 上的信息,那么就可以在理解的基础上 进行推理,从而可以推理出新的信息。这是传统万维网仅仅通过信息存取和对比 所无法完成的。 语义w 曲的出现很大程度上归功于可扩展标记语言( x m l ,e x t e n s i b l em a r k u p l a n g u a g e ) 的出现。它的最大特点在于用户可以根据需要制订能够反映数据内容 的标签,实现数据内容和数据表现方式的分离。x m l 及其相关技术,使传统万 维网上的信息表示方式向计算机自动处理迈出了非常重要的一步。 要让计算机自动处理信息的前提是计算机可以理解数据的内容或者说对描 述了数据内容的一些概念的理解。对于人类来说,理解了某个事物意味着他能够 将这个事物与其它早已熟知的事物相联系,而计算机能够理解某个概念是指计算 机能够执行一些和这个概念相关的查询或其它操作。当前语义w e b 为了能够达到 语义清晰表达的目的,采用的方式是使用本体论定义特定使用领域的知识,这些 知识主要包括特定领域的事物概念以及相互之间的关系。本体论是x m l 为基 础的,这样方便网络上的其它设备的使用。语义w e b 采用本体论进行信息表达可 以起到的作用是,信息的分类以及信息之间相互关系的推理。信息的分类是为了 将不同的信息进行区分,形成概念化的定义,并且使之阶层化。而推理系统则可 以根据本体中元素的相互关系得出隐含其中的隐性知识。语义w e b 就是一个由大 量机器可以理解的数据所构成的一个分布式的体系结构,在这个体系结构中,数 据之间的关系通过一些术语表达,这些术语之间又形成一种复杂的网络联系,计 算机能够通过这些术语得到数据的含义,并且可以在这种联系上应用逻辑来进行 推理。 目前针对语义w e b 本体的推理主要是采用描述逻辑的推理机制进行的,其完 成的功能主要有:一致性检测,包含检测( 层次化推理) ,等价检测,实例检测。 对于我们通常使用来说,描述逻辑的推理机也有很多选择,比如,r a c e r 、p e l l e t 、 f a c t 等都被广泛使用在各种应用中。但是纯粹的描述逻辑推理也存在很多不足, 主要有:描述逻辑的推理能力受到某种具体的描述逻辑算子的多少而制约其推理 能力的大小。比如a l c 仅仅具有概念合取、概念析取、概念取反、存在约束、值 约束这五种运算算子,这也就是说其推理能力是受这五种运算算子的组合而制约 的;描述逻辑的推理机通常在处理海量数据时效率不高;缺乏规则的表示,描述 逻辑虽然可以定义多种限制,但对于我们通常使用的i f , ,e l s e 却缺乏定义。虽 然描述逻辑存在这些不足,但是其作为本体的冲突检测以及本体的层次化推理方 面,仍然是一个很好的选择。 1 2 问题的提出 语义w e b 发展的一个很重要的目的就是要建立起一个人和机器都可以理解 的知识系统,将信息用语义w e b 中本体论的思想来表达可以部分解决机器无法 理解人类所描述知识的问题。既然,通过语义w e b 的本体论可以建立机器和人 共同可以理解的信息库,那么,我们是否可以在语义w e b 本体论的基础上建立 一个机器进行自动推理的方法呢? 因为,机器要进行推理最基本的前提是要理解 知识。要将所描述的知识进行推理并重新的组织加工,必须对知识有一个共同的 概念化的认识。 目前,具有通用性的推理系统主要是专家系统,在专家系统中所使用的知识 呈现方式十分多元化,包含语义网络、框架、法则、逻辑等,这些知识的表示方 法各有其优点,但在建立推理系统时都存在各种各样的缺点和不足。以传统的框 架表示知识无法表现交集、合集等概念:以语意网络表现的知识由于表现方式不 是结构化的所以带来了运算不便的问题;以法则表现知识通常很难表现类的层次 关系,存在知识表现不紧凑的问题;以逻辑的方式表现知识存在的问题是,无法 将类别和实例分开,这样使我们在推理时就无法单独从类别出发去推导一些公理 性的知识,使推理的效率难以提高 2 ,3 】。另外,通过传统的知识表现形式所表达 的知识只能应用于特定的应用环境中,很难做到被其它系统重复利用,而语义 w e b 却完全可以做到这一点,因为语义w e b 本体论的出发点就要建立一个人和 机器都可以理解的知识体系。 综合以上两点,我们希望在语义w e b 本体层来寻找解决机器推理存在的知 识表示问题的解决办法,并且希望基于本体描述的知识能够多次重复的利用于相 关领域的推理,这样可以充分利用我们所建立起来的知识库。本文主要就是按照 这两个出发点作为起点,来探究关于语义w e b 本体论应于传统的专家系统进行 推理时需要解决的问题。 1 3 本研究所做的工作 本研究主要是通过对语义w e b 本体论的逻辑基础进行分析,找出了一种可 以使用语义w e b 本体论作为知识的表现形式并且结合基于本体的规则s w r i , ( s e m a n t i cw e br u l el a n g u a g e ) 进行机器自动推理的推理系统。在具体实现上, 由于目前能够进行大量数据处理的高效推理方式大多使用专家系统的推理引擎, 而目前专家系统的推理引擎都不能直接使用语义w e b 本体表示的知识,也不能 直接使用语义w e b 规则语言s w r l 编写的规则,所以,我们需要进行格式转换。 格式转换包括两部分,第一部分,将o w ld l 描述的知识转换成为专家系统中 的知识库;第二部分,将s w r l 表示的规则转换成为专家系统规则。 本文所做工作主要包括以下几个方面: ( 1 ) 对整个语义w e b 的体系结构作了一个完整的剖析,特别是对我们在研究过程 中所要使用的技术进行了详细的说明。这一部分介绍了语义w e b 的思想和理 论概况,并且引出了我们下一步要研究的内容。 ( 2 ) 对语义w 曲中本体论的逻辑基础进行了分析,从而找出了语义w 曲中信息 表示的基本原理,并且就o w l d l 与描述逻辑做了一个统一化的分析。另外 展示了针对描述逻辑的推理方法t a b l e a u x 算法,根据t a b l e a u x 算法我们很容 易实现以描述逻辑为基础的o w l d l 本体的推理。 ( 3 ) 基于上一部分的理论分析,我们提出了,采用语义w e b 本体描述语言o w l 作为推理系统中知识的表现形式,通过语义w e b 建立好本体知识后,针对描 述逻辑中无法呈现某些规则描述的问题,我们提出了使用s w r l 作为规则的 表现形式,这样可以对描述逻辑中无法表示的复杂限制条件或规则进行扩充。 并且,s w r l 是在o w l 本体上建立起来的规则,所以知识和规则能够很好 的结合。另外,我们就o w l 本体知识和s w r l 规则向专家系统知识的格式 转化进行了相关的研究。 ( 4 ) 通过建立教学资源本体,并且在教学资源本体上展开推理,检验了我们所建 立的系统。 ( 5 ) 对整个研究过程中存在的一些问题作了一个说明,并对以后研究的方向作了 一个建议性的展示。 第二章语义w e b 的技术要点 2 1 语义w o b 的体系结构 为了实现语义w e b 信息服务智能化与自动化的目标,语义w e b 研究者们开 发了许多新技术并提出了一系列的技术标准。从某种程度上讲,语义w e b 的发 展主要就是建立在一定逻辑基础上的信息表示语言和标准的发展。由于语义w e b 的知识表示具有创建上的分散性,同时又具有应用上的通用性,所以需要一个统 一的框架,这个框架应该能够满足这种分散性以及由这种分散性所带来的安全 性,满足这些知识跨应用、跨领域的可互操作性。b e m e r s l e e 在x m l 2 0 0 0 大会 上描述了这个体系结构 4 ,如图2 1 所示。 陛 卧当 t r u s t d a t a 一| |p r 。o f 皇 甍 s e l a d a t a l o g i c 晶 罚 d e s c o n t o l o g y + v o c a b u l a r y趸 面 d o c r d f + t d fs c h e m a萏 x m l + n s + x m ls c h e m a u n i c o d eu r i 图2 1 语义w e b 的体系结构 ( 1 ) u n i c o d e 和u r j 层 由于语义w e b 的最终目的是要构建一个全球信息网络,在这个网络上应该 涵盖各种语言和文字的信息资源,所以它采用统一编码u n i c o d e 作为字符的编 码方案。这一层是整个语义w e b 的基石,它成功地解决了万维网上资源的定位 和跨地区字符编码的标准格式的问题。u r i 是i n t e m e t 资源的一种识别方法,记 载于r f c 2 3 9 6 1 5 ,在语义w e b 中,任何可以被描述的事物,无论是网络中的一 个w 曲页面或者站点,还是现实中的一个人、一座房子、一张桌子等都可以称 为资源,每一个资源都由唯一的一个u r i 所标识,不同的资源拥有不同的u r i , 通过指定的u r i 可以确定互联网中唯一的一个资源。 ( 2 ) x m l + n s + x m ls c h e m a 层 这是语义w e b 中首要的关键技术,也是整个体系结构的基础。x m l 允许用 户根据需要自定义一些“有意义的”标签对发布的内容进行标记,并使用文档类 型定义( d o c u m e n tt y p ed e f i n i t i o n ,d t d ) 或x m ls c h e m a 来约束这些标签的结 构。x m l 已经成为描述w e b 文档和数据的标准化语言。名称空间n s ( n a m e s p a c e ) 为x m l 文档中的结构化标记提供了上下文环境,一方面为文档中的每一个标记 都赋予了确定的含义,另一方面将不同上下文环境中相同名称的标记区分开来, 从而避免了语义上的歧义。x m ls c h e m a 在标记的使用和文档结构上,为x m l 文档提供了明确的语义限制,最终确保每一个x m l 文档都是语义合法、结构完 整、内容有效的。 ( 3 ) r d f + r d fs c h e m a 层 r d f ( r e s o u r c ed e s c r i b i n gf r a m e w o r k 资源描述框架) 定义了一种用以描述 资源及其相互关系的简单模型,是语义w e b 实现的关键技术之一,也是语义信 息描述的有效手段。其基本数据模型包含三类对象:资源( r e s o u r c e s ) 、属性 ( p r o p e r t i e s ) 和声明( s t a t e m e n t s ) 。资源可能是整个网页,网页的一部分,页面 的全部集合,或者是不能通过w e b 直接访问的对象;属性是描述某个资源特定 的方面、特征、属性或关系;声明是指一个特定的资源和属性名称加上该属性的 值一同构成了一个r d f 声明。 资源之间的关系通过属性和值来描述。描述特定资源特定属性的值,就构成 了r d f 中的一个陈述,通常可以用三元组 描述,其中, 被描述的资源称为s u b j e c t ,描述资源的属性称p r e d i c a t e ,o b j e c t 则是属性对应的 值。r d f 建立在x m l 和u r i 的基础上。 r d f 通过属性和值描述了资源及资源之间的关系,但并没有提供描述这些 属性及属性问关系的机制。r d fs c h e m a 简称r d f s 提供了这种表达机制,它描 述了r d fp r o p e r t i e s 的使用规则,为r d f 定义了领域字典,并用类型层次结构 来组织该字典,从而构成完备的语义空间。r d f 和r d fs c h e m a 合称r d f ( s ) 。 r d f s 中主要的类、特性和约束如下: 核一1 1 , 类:包括r d f s :r e s o u r c e 、r d f i p r o p e r t y 以及r d f s :c l a s s 。所有用r d f 表达 式所描述的事物都被看成是r d f s :r e s o u r c e 的实例。r d f :p r o p e r t y 是用来刻画 r d f s :r e s o u r c e 实例的所有特性的类。最后,r d f s :c l a s s 用来定义r d f s 中的概念。 核心特性:包括r d f :t y p e 、r d f s :s u b c l a s s o f 和r d f s :s u b p r o p e r t y o f or d f :t y p e 关 系建立了资源和类之间的i n s t a n c e o f 关系的模型。r d f s :s u b c l a s s o f 关系建立了类 之间的包容层次模型。r d f s :s u b p r o p e r t y o f 关系建立了特性之间的包含层次关系模 型。 , 核心约束:包括r d f s :c o n s t r a i n t r e s o u r c e 、r d f s :c o n s t r a i n t p r o p e t y 、r d f s :r a n g e 和r d f s :d o m a i n 。r d f s :c o n s t r a i n t r e s o u r c e 定义了所有约束的类。 r d f s :c o n s t r a i n t p r o p e r t y 是r d f s :c o n s t r a i n t r e s o u r c e 和r d f :p r o p e r t y 的子集,它包括 了所有用来定义约束的特性。 x m l 和r d f 都能为所表述的资源提供一定的语义。但是x m l 中的标签和 r d f 中的属性集都没有任何限制,x m l 和r d f 不能处理以下问题:同一概念 有多种词汇表示:同一个词汇表示多种概念。这一问题能够在语义w e b 的本体 层解决。 ( 4 ) o n t o l o g y 层 语义信息的交流必须以共同理解为前提,否则双方就会发生误解或者不理 解。在语义w e b 中,这一“共同的理解”,即共同的语义空间,是由本体建立和 提供的。 本体最早是个哲学上的概念,用于描述事物的本质。在近一、二十年来, 本体论已被计算机领域所采用,用于知识表达、共享及重用。许多学科和研究都 在使用“本体”这个术语,但存在不同的定义。在人工智能界,最早给出o n t o l o g y 定义的是n e c h e s 等人,他们将o n t o l o g y 定义为“给出构成相关领域词汇的基本 术语和关系,以及利用这些术语和关系构成的规定这些词t l j t - 延规则的定义 6 ”。1 9 9 3 年,g r u b e r 给出了o n t o l o g y 的一个最为流行的定义,即“o n t o l o g y 是概念模型的明确的规范说n 7 】”。后来,b o r s t 在此基础上,给出了o n t o l o g y 的另外一种定义:“o n t o l o g y 是共享概念模型的形式化规范说明【8 】i 。 1 9 9 8 年 s t u d e r 对上述两个定义进行了深入的研究,将本体定义为“共享概念模型的明确 的形式化规范说n 9 , ,其中概念模型指通过抽象出客观世界中一些现象的相关 概念而得到的模型,其表示的含义独立于具体的环境状态,是具有层次化含义的。 明确,指的是所使用的概念及使用这些概念的约束都有明确的定义;形式化,指 的是计算机可读的;共享,指的是本体中体现的是共同认可的知识,反映的是相 关领域中公认的概念集。 关于本体,目前尚无一个明确的形式化定义,可以将一个本体定义为一个四 元组:o = ( c ,r ,a ,i ) 。其中c 表示0 ( o n t o l o g y ) 中的概念集合,概念可以 是一个具有某种特征的知识的集合,另外定义一个概念后,其更广泛的定义可以 包含此概念,也就说,概念具有层次化的特点;r 表示0 中概念之间的关系集 合;a 表示公理的集合,通常其中定义o 中的相关约束;i 是c 的实例集合,i 是定义在c 的基础上的。 从上面的概念来看,本体通过定义属性并建立一个分类层次结构,将不同的 概念区别和组织起来,同时也通过属性将概念相互联系起来,从而建立概念的语 义空间,也就是对某一个领域内事物的共同理解。这些概念和属性的名字构成了 本体的词汇表。在语义w e b 中,本体具有非常重要的地位,是解决语义层次上 w e b 信息共享和交换的基础。为了便于w e b 上应用程序使用方便,本体需要有 一个通用的标准语言来描述和建构,目前通常使用o w l 来描述和构建本体。 ( 5 ) 本体的上层:l o g i c ,p r o o f 和t r u s t 层 这三层位于语义w e b 体系结构的顶部,也是语义表达的高级要求,目前正 处于研究阶段,也有一些简单的示范性应用系统正在建设中。其中,逻辑层提供 了推理规则的描述手段,证明层通过运用这些规则进行逻辑推理和求证,而信任 层则负责为应用程序提供一种机制以决定是否信任给出的论证。 ( 6 ) 数字签名( d i g i t a ls i g n a t u r e ) 数字签名位于层次模型的右侧,并且贯穿于中间的四层。数字签名是一种基 于互联网的安全认证机制。当信息内容从一个层次传递到另一个层次时,允许使 用数字签名说明内容的来源和安全性,这样接受方就可以通过数字签名鉴别其来 源和安全性以决定是否接受。数字签名对于语义w e b 及其它使用x m l 进行信息 交换的系统非常重要。 在这个层式结构中,上层将下层的语言机制作为本层的支撑语言,如表2 1 所示,通过分析器,从合法有效的下层描述中抽取出本层所能理解的模型,实现 更多的语义处理功能。因此,语义w e b 是向下兼容的,比如,当用r d f x m l 表达o w l 时,如果只有r d f 分析器,可以部分解释该本体内的类结构,只要 忽略其中带o w l :前缀的元素即可,但能完全解释该本体内的所有实例,因为这只 是r d f ( s ) 语法相关的。由于w e b 上的海量信息不可能在短时间内全部建立语义 标记,而且语义的标记方法也将不断发展,将会提供更广泛的语义支持能力。这 种上层兼容下层的方式,为语义w e b 的发展提供了良好的基础。 表2 1 语义w e b 的层次依赖关系 层次名称描述 整个语义w e b 的基础,u n i c o d c 处理资源的 第一层 u n i c o d e 和u r i 编码,u r i 负责标识资源。 x m l + n s + 下第二层用于表示数据的内容和结构。 层 x m ls c h e m a 为 上 r d f + r d f 层 提 第三层-用于描述w e b 上的资源及其类型。 供 s c h e m a 支 撑o n t o l o g y i 。垂 第四层用于描述各种资源之间的联系。 h v o c a b u l a r v i 第五层 l o g i c 第六层 p r o o f在下面四层的基础上进行的逻辑推理操作。 第七层 t r l l s t 注:+ 核心层,用于表示w e b 信息的语义。 2 2 语义w e b 本体描述语言o w l 语义w e b 实现的手段是在现有网页信息的基础上增加用于对网页进行描述 的信息( 元数据) ,机器可理解网页。而对元数据中的术语及其关系,则在w e b o n t o l o g y 中存储。从技术手段上而言,语义w e b 依赖于:( 1 ) x m l x m ls c h e m a 技术:x m l 可自定义标记,为表示结构化的文档提供语法支持,其不足在于对 文档内容不提供语义支持。x m l s c h e m a 对x m l 文档的结构进行限制,并扩展 了x m l 的数据类型:( 2 ) r d f r d f s :r d f 借助x m l 的语法来表示w e b 上的资 源及资源的关系,具有简单的语义特征。r d f s 为描述r d f 资源的类和属性提 供一组具有语义的词汇;( 3 ) o w l 等语义w e b 本体语言:o w l 是基于描述逻辑 的语义w e b 本体表示语言,由于描述逻辑是可判定的,故机器可在o w l 表示 4 的本体的基础上进行推理,从而实现真正意义上的语义w e b 。o w l 旨在用于那 些需要由应用程序而不是由人类来处理文档中的信息的情形。 o w l 可被用来明确表示词汇表中术语的含义以及术语间的关系,语义w e b 中的本体就是通过如此来表示的。在表达含义和语义方面,o w l 比x m l 、r d f 和r d f s 有更多的表达手段,因此在w e b 上表达机器可理解内容的能力也比这 些语言强。o w l 是d a m l + o i l w e b 本体语言的修订版,通过在d a m l + o i l 的 设计和应用中得到的经验教训而演变而来的,如图2 2 所示。 2 2 10 w i 的三个子语言 :势 图2 2 0 w l 来源 o w l 提供了三种表达能力递增的子语言以分别用于特定的实现者和用户团体。 o w l l i t e 用于提供给那些只需要一个分类层次和简单约束的用户。例如, 虽然o w l l i t e 支持基数限制,但只允许基数为0 或1 。提供支持o w l l i t e 的工具应该比支持其他表达能力更强的o w l 子语言更简单,并且从辞典 ( t h e s a u r u s ) 和分类系统( t a x o n o m y ) 转换到o w l l i t e 更为迅速。相比 o w l d l ,o w l l i t e 还具有更低的形式复杂度。 o w l d l 用于支持那些需要最强表达能力而需要保持计算完备性( 即所 有的结论都能够确保被计算出来) 和可判定性( 即所有的计算都能在有 限的时间内完成) 。o w l d l 包括了o w l 语言的所有语言成分,但使用 时必须符合一定的约束,例如,一个类可以是多个类的子类时,但它不 能同时是另外一个类的实例。o w l d l 这么命名是因为它对应于描述逻 辑,它是一个作为o w l 形式基础的逻辑的研究领域。 o w lf u l l 支持那些需要尽管没有可计算性保证,但有最强的表达能力和 完全自由的r d f 语法的用户。例如,在o w l f u l l 中,一个类可以被同 时作为许多个体的一个集合以及本身作为一个个体。它允许在一个本体 增加预定义的( ) f 、o w l ) 词汇的含义。这样,不太可能有推理软件 能支持对o w lf u l l 的所有成分的完全推理。 在表达能力和推理能力上,每个子语言都是前面的语言的扩展。这三种子语 言之间有如下关系成立,但这些关系反过来并不成立 1o 。 每个合法的o w l l i t e 本体都是一个合法的o w l d l 本体; 每个合法的o w l d l 本体都是一个合法的o w l f u l l 本体: 每个有效的o w ll i t e 结论都是一个有效的0 w l d l 结论; 每个有效的o w l d l 结论都是一个有效的o w l f u l l 结论。 使用o w l 的本体开发者要考虑哪个子语言最符合他的需求。选择o w ll i t e 还是o w l d l 主要取决于用户在多大程度上需要o w l d l 提供的表达能力更强 的成分。选择o w ld l 还是o w lf u l l 主要取决于用户在多大程度上需要r d f s c h e m a 的元建模( m e t a m o d e l i n g ) 机制( 如定义关于类的类和为类赋予属性) ; 使用o w l f u l l 相比于o w l d l ,对推理的支持是更难预测的,因为目前还没有 完全的o w l f u l l 的实现。 o w l f u l l 可以看成是对r d f 的扩展,而o w l l i t e 和o w l d l 可以看成是 对一个受限的r d f 版本的扩展。所有的o w l 文档( l i t e d l ,f u l l ) 都是一个 r d f 文档;所有的r d f 文档都是一个o w l f u l l 文档,但只有一些r d f 文档是 一个合法的o w l l i t e 和o w l d l 文档。因此,用户在把r d f 文档转换到o w l 文档时必须谨慎。当o w ld l 或o w ll i t e 的表达能力认为是适当时,必须注 意原来的r d f 文档是否满足o w l d l 或o w l l i t e 对r d f 的一些附加的限制。 其中,每个作为类名的u r i 必须明确地声明为类型为o w l :c l a s s ( 属性也类似) , 每个个体必须声明为属于至少一个类( 即使只有o w l :t h i n g ) 。 2 2 2o w l 的表达能力 o w l :t h i n g 是o w l 所有类的基类,也就是说o w l 所有类都是o w l :t h i n g 的 子类。o w l :n o t h i n g 是o w l 所有类的子类,它也表示空集的概念。 1 、o w l 中的类和属性 o w l 提供了以下多种类定义方法: ( 1 ) 直接定义类:o w l :c l a s s 例如: 这样便定义了一个c l a s s r o o m 的类。 ( 2 ) 枚举类:o w l :o n e o f 例如: 枚举类中所有个体的类,用到了o w l 的o w l :o n e o f 的属性,必须将所 有的实例枚举。我们用到r d f i p a r s e t y p e = ”c o l l e c t i o n ”。这里的o w l :t h i n g 是 o w l 中的所有类的基类,也就是说o w l 中的所有类的都是o w l :t h i n g 的 子类。 ( 3 ) 属性值的约束 所有的属性值都被限制:o w l :a l l v a l u e s f r o m 至少有一个属性值被限制:o w l :s o m e v a l u e s f r o m 含有某个制约的属性值:o w l :h a s v a l u e 例子: 这里表示的含义是:r i v e r 类是s t r e a m 类的一个子类,并且这个子类是 匿名类的一个子类,这个匿名类属性的限制是:存在最少一个值可以 c o n n e c t s t ob o d y o f w a t e r 的实例。 ( 4 ) 个数制约 限制最大值:o w l :m a x c
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 钽铌压制成型工岗前安全培训考核试卷含答案
- 钻井液工岗前岗位环保责任制考核试卷含答案
- 耐火制品浸渍工操作规程竞赛考核试卷含答案
- 井下作业工安全实操能力考核试卷含答案
- 苯乙烯类热塑性弹性体(SBCs)装置操作工安全培训效果知识考核试卷含答案
- 工艺美术品设计师风险评估与管理水平考核试卷含答案
- 电机检修工操作评估考核试卷含答案
- 纸盒制作工岗前操作技能考核试卷含答案
- 成果转化责任承诺书学术版(9篇)
- 生产车间安全管理流程优化指南
- 露天矿山施工组织设计方案
- 《室内装饰装配式施工》课件-装配式装修技术
- 三年级数学下册《暑假作业》(共50套)
- 玻璃安装合同
- DB14∕T 1925-2019 流通领域供应链标准体系
- 2022年中考语文12本名著导读考点梳理
- GB/T 30791-2014色漆和清漆T弯试验
- 噪声污染与控制
- 春潮现代文阅读理解答案
- 管桩应力释放孔施工方案
- 专项质量培训--碗扣式钢管脚手架ppt课件
评论
0/150
提交评论