




已阅读5页,还剩54页未读, 继续免费阅读
(计算机应用技术专业论文)本体查询与推理研究及其实现.pdf.pdf 免费下载
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
摘要 语义w e b 作为目前w e b 的一个延伸,目标是使w e b 上的数据具 有机器可识别的语义,便于人机之间的交互与合作。本体推理机是实 现语义w e b 的关键基础支撑软件之一,基于此,本文研发了d o o r ( d l b a s e do n t o l o g yr e a s o n e r ,基于描述逻辑的本体推理机) ,d o o r 作为一个本体查询推理引擎,它有两个明确的任务:一个是接受用户 对本体的查询命令,执行查询并向用户提交查询结果,另一个就是负 责执行对本体进行一致性检验及分类等推理功能。本文的工作主要围 绕以下几个方面展开: 首先,全面剖析了当前本体推理机系统,剖析角度涵盖了本体推 理机类别、作用、主要实现技术、应用系统一般结构等方面,另外还 总结了本体推理机的最新发展趋势。这些可以为本体推理机应用和开 发用户提供有益的参考; 其次,设计并实现了一个基于描述逻辑的本体查询推理系统 d o o r ,它不仅可以解析和执行本体查询命令,也能够执行针对 o w l d l 级别本体的推理功能。同时作者结合当前一些主流本体推 理机实现的本体推理功能,基于o w l a p i 提出了一个o n t o l o g y i n f e r e n c e a p i 方案,为本体推理机和应用程序之间的交互提供了一个 统一的接口; 再次,提出了一套较为全面完善的针对本体推理机系统测试对比 的实验方案,从功能角度、用户角度和开发角度对本体推理机进行全 面的对比测试,实验证明,测试方案是可行有效的; 最后,总结了本文所做的主要研究工作和实验内容,指出了进一 步研究的发展方向,也说明了本文对推动语义w 曲的研究与发展具 有定的理论和实践意义。 关键词语义w e b ,本体,描述逻辑,本体推理,本体查询 a b s t r a c t a sad e v e l o p m e n to fc u r r e n t 腑b js e m a n t i c 腑ba i m st oe n r i c ht h e 阮bd a t aw i t hs e m a n t i cf o r m a ta n dm a k et h e mm a c h i n e r e a d a b l e 刀) u si t w i l lb ec o n v e n i e n tf o rh u m a nt oc o o p e r a t e o n t o l o g yr e a s o n e ri sak e y s u p p o r t i n gp a r tf o rr e a l i z i n gs e m a n t i cw e b d u et o i t si m p o r t a n c e ,t h e a u t h o rr e s e a r c ha n dd e v e l o pd o o r ( d l b a s e do n t o l o g yr e a s o n e r ) i t h a st w om a j o rf u n c t i o n s :1 ,r e c e i v eo n t o l o g yq u e r yc o m m a n df r o mu s e r s , e x e c u t eq u e r ya n ds u b m i tq u e r yr e s u l t st ou s e r s ;2 ,p e r f o r mc o n s i s t e n c y c h e c k ,c l a s s i f i c a t i o na n do t h e rf u n c t i o n sf o ro n t o l o g y t h et h e s i sa c h i e v e s n e x tr e s u l t s : f i r s t l y , c u r r e n to n t o l o g yr e a s o n e rs y s t e m sa r ec o m p l e t e l ya n a l y z e d , f r o mt h ea s p e c t so fo n t o l o g yr e a s o n e e sk i n d , a b i l i t y , m a i ni m p l e m e n t i n g t e c h n o l o g ya n dg e n e r a la p p l i c a t i o ns y s t e ms t r u c t u r e ,e t c t h et h e s i sa l s o s u m m a r i z e st h el a t e s td e v e l o p i n gt r e n d a l lt h e s ec o u l dg i v et h eo n t o l o g y r e a s o n e ru s e r sa n dd e v e l o p e r sau s e f u lr e f e r e n c e ; s e c o n d l y ,d o o rh a sb e e nd e s i g n e da n di m p l e m e n t e d i tc a np a r s e a n de x e c u t eo n t o l o g yq u e r yc o m m a n d sa sw e l la so w l - d lo n t o l o g y r e a s o n i n g m e a n w h i l e ,b a s e do no w l a p ia n dc o m b i n i n gp r i n c i p l eo f c u r r e n tw e l l 。k n o w no n t o l o g yr e a s o n e r s ,ar e a s o n e ra p ii sp u tf o r w a r d t h ea p ip r o v i d e sa nu n i f o r mi n t e r f a c ef o ri n t e r a c t i o na m o n gd i f f e r e n t o n t o l o g yr e a s o n e r sa n da p p l i c a t i o n s ; t h i r d l y , ac o m p r e h e n s i v e t e s ta n d c o m p a r i s o ne x p e r i m e n t a p p r o a c h e sf o ro n t o l o g yr e a s o n e rh a v eb e e np r o p o s e d t h ec o m p a r i s o n t e s t i n ge x p e r i m e n tf o rd i f f e r e n to n t o l o g yr e a s o n e r sh a sb e e nd o n ef r o m v i e wo ff u n c t i o n a l i t y , u s e ra n dd e v e l o p e r t h er e s u l ts h o w st h a tt h e a p p r o a c h e sa r ef e a s i b l ea n de f f e c t i v e ; a tt h ee n do ft h et h e s i s ,t h em a j o rt h e o r ya n de x p e r i m e n tr e s e a r c h a c h i e v e m e n t sh a v eb e e ns u m m a r i z e d t h ef u t u r er e s e a r c hp r o p o s a l sh a v e b e e nm a d e t h et h e o r e t i c a la n dp r a c t i c a li m p a c tt h ea c h i e v e m e n t si m p o s e o ns e m a n t i cw e br e s e a r c ha n dd e v e l o p m e n ti sd e s c r i b e d k e yw o r d ss e m a n t i cw e b ,o n t o l o g y ,d e s c r i p t i o nl o g i c ,o n t o l o g y r e a s o n i n g ,o n t o l o g yq u e r y i i 原创性声明 本人声明,所呈交的学位论文是本人在导师指导下进行的研究 工作及取得的研究成果。尽我所知,除了论文中特别加以标注和致谢 的地方外,论文中不包含其他人已经发表或撰写过的研究成果,也不 包含为获得中南大学或其他单位的学位或证书而使用过的材料。与我 共同工作的同志对本研究所作的贡献均已在论文中作了明确的说明。 关于学位论文使用授权说明 本人了解中南大学有关保留、使用学位论文的规定,即:学校 有权保留学位论文,允许学位论文被查阅和借阅;学校可以公布学位 论文的全部或部分内容,可以采用复印、缩印或其它手段保存学位论 文;学校可根据国家或湖南省有关部门规定送交学位论文。 作者签名:盟导师签名兰豇盥日期:三卫年上月兰日 1 1 1 硕士学位论文第一章绪论 第一章绪论 随着语义w e b 逐渐成为研究的热点,为了探索语义w e b 的理论和实践之道, 我们设计了一个微型语义w e b 系统- - s n a x ( $ e m a m i cn a t i v ex m ld a t a b a s e s y s t e m ,语义原生数据库系统) 【l l ,d o o r 是它的一个子部分,主要负责实现针对 本体的查询和推理,本章将先介绍语义w e b ,本体以及描述逻辑,然后阐述s n a x 系统以及d o o r 与s n a x 系统之间的关系,随后给出了本文将要研究的主要内 容并给出了目前国内外关于本体推理机的研究现状,最后简要说明了本文的组织 结构。 1 1 前言 设计和实现d o o r 系统的大背景是语义w e b ,推理的对象是语义w e b 七层 结构中的本体层,推理的逻辑基础是描述逻辑,因此本节将简要介绍语义w e b 、 本体以及描述逻辑。 1 1 1 语义w e b t u nb e m e r s - l e e 于2 0 0 0 年1 2 月在x m l 2 0 0 0 大会上给出了语义w e b 的层次 关系基于x m l 和r d f r d f s ,并在此之上构建本体和逻辑推理规则,以完 成基于语义的知识表示和推理,从而能够为计算机所理解和处理。表示该层次关 系的体系结构t 2 1 如图i - i 所示: 图i - ! 语义w e b 的体系结构 语义w e b 设计的目标是:使得w e b 上的信息具有计算机可以理解的语义, 满足a g e n t 对w e b 上异构和分布信息的有效访问和搜索,它要解决的问题是目 前万维网上大多数信息的语义不能被机器理解,也就不便于机器对信息进行自动 处理。 硕七学位论文第一章绪论 该体系中从底层到高层分别为:u r i u r l 、x m l 、r d f 、o n t o l o g y 、l o g i c 、 p r o o f 、t r u s t ,其中核心层为x m l 、r d f 、o n t o l o g y ,这3 层被用于表示w e b 信息的语义。 w 3 c 的x m l 、r d f ( s ) 和o w l 标准构成了语义w e b 的核心,从地位上看它 们大致可以分成下面的层次: o w l d l 本体层 o w l l t t o 数据层 基础层 u m m l 一 图l - 2 x m l ,r d f 、r d f s 和o w l 在语义w e b 中的地位 x m l 结合u r i 和n a m e s p a c e 构成语义w e b 的基础层:r d f 提供一种通用 的数据表示,用来对机器可读的信息进行交换和集成;本体层包含r d f s 和o w l 两大部分,提供用在r d f 数据中的词汇集,是机器进行推理的基础。d o o r 系 统推理的主要对象是o w l 和r d f s 层中的数据,它的目标是确保本体层中的本 体是一致的,也能够通过推理得到蕴含在本体中的全部语义信息。 l 1 2 本体 本体最早是一个哲学的范畴,后来随着人工智能的发展,被人工智能界给予 了新的定义,目前被大部分人公认的定义是t o mg r u b e = r 在1 9 9 4 年提出的:“本 体是概念化的明确的规范说明”【3 】。 本体目标是捕获相关领域的知识,提供对该领域知识的共同理解,确定该领 域内共同认可的词汇,并从不同层次的形式化模式上给出这些词汇和词汇之问相 互关系的明确定义,本体通过对词汇的严格定义和词汇之间的关系来确定词汇的 精确含义,本体对词汇建立的模型可以让机器理解w e b 页面的语义,是解决语 义层次上w e b 信息共享和交换的基础,因此在语义w e b 中,本体具有非常重要 的地位。 针对本体在语义w e b 中的重要地位,本体的相关研究也逐渐成为了研究的 热点,总的说来,本体的研究与应用主要包括三方面【4 】: l 、理论上的研究,主要研究概念及其分类、本体上的代数; 2 、在信息系统中的应用,主要包括处理信息组织、信息检索和异构信息系 统互操作问题; 3 、本体作为在知识层提供知识共享和重用的工具在语义w e b 中的应用。 2 硕士学位论文 第一章绪论 本体可以应用在问题求解、多a g e n t 系统、数据挖掘等许多领域。本体技术 已经发展成为知识表示、知识管理、知识共享、知识复用的主流技术之一,正成 为自然语言处理、w e b 信息检索、数据库和知识库的管理、异构数据集成、数字 图书馆、g i s 、语义w e b 等研究领域共同关心的一个核心。 本体具备重要的研究和应用价值,保证本体本身的一致性并能有效挖掘出隐 含在本体中的语义信息已经成为了它广泛应用和实现语义w e b 的一个基础前提, 即能否为用户提供简便易用,正确有效的本体推理工具成为了实现语义w e b 的 一个前提条件。 1 1 3 描述逻辑 描述逻辑( d l ,d e s c r i p t i o nl o g i c ) ,又称术语逻辑,是一种功能强大的基于 逻辑的知识表示语言,它根据概念和概念之间的二元关系描述术语学的知识,二 元关系可以用来根据必要和充分条件定义一个概念术语,概念的所有实例必须满 足这些条件,它是一阶谓词逻辑的一个可判定子集。 描述逻辑的知识库由术语( t b o x ) 和断言( a b o x ) 组成,其中t b o x 和a b o x 都 是由公理组成的,t b o x 通常以蕴含公理的形式断言关于概念( 对象集合) 和属性 ( - - 元关系) 韵事实;a b o x 通常以例化公理的形式断言关于个体( 单一对象) 的事实。 图1 - 3 给出了一个描述逻辑系统的典型结构i 习: i 一 图1 3 典型描述逻辑系统结构图 从图1 3 我们可以得出一个描述逻辑系统主要由四大部分组成:一套用来构 建知识库的d l 语言;一个由t b o x 和a b o x 组成的知识库:对知识库中的内容 进行推理的推理引擎以及应用程序与d l 知识库进行交互的接口部件。对这四个 组成部分的不同选择造成了描述逻辑系统的表示能力与推理机制的不同。 根据不同的应用环境,描述逻辑有许多变种,最为简单的是a l c ,基于a l c 变化的描述逻辑种类又有a l c n 、a c f 、a l c q 、s h i n 、s h i f 、s h i q 、s h o q , s h o i n 、s h i f ( d ) 、s h o i n ( d ) 等,表1 1 给出了一些s h 描述逻辑家族与语言构 子的对应关系。 硕j 二学位论文第一章绪论 表1 1s h 描述逻辑家族简表 s y n t a x + j脚十t r a n s r i v er o l e * ”l eh i “o a c h y f 妇”穗f s er o i # q q u a l i f i e d a t m t b “ r e s t r i c t i o n o c c m c e p td m m e r m i o a 倒d a t a 谚p e sa n dv 村s 描述逻辑作为一个用于表述以及推理概念知识的逻辑公式的集合体,对语义 w e b 的发展非常重要,它的作用是为语义w e b 本体语言如o i l 、d a m l + o i l 及 o w l 等提供了逻辑基础和自动推理服务,其中d a m l + o i l 对应s h i q ,o w l - l i t e 对应s h i f ( d ) ,o w l d l 对应s h o i n ( d ) 6 1 ,表1 2 给出了o w l 构子与d l 语言 对应的关系: 表1 2 0 w l 构子与d l 语言对应表 c o m t r 眦t o rd ls y m a x e x m n p l e n t e r s e c t i o n o f q n n gh u 删n 尼研砒 m i o n o f gu 。u gd o c t o rut e a c h p r x m l 川e m e n t o f c f e r n a l e m e o f 识) 伽,t o m ) 以l a * s v p cv h a s p a r e n t t e a c h _ i a s c l a s sj 粥 3 h a s p a r e n t d o c t o m s v 出l 壕 3 p 3 c i t i z e n o f c h i n ( m c a r d m a h t y q n p c 2 h a s c h i l d 屁所( n a x c a r d l n l f l i t y q ( ? pr d f :t y p er d f :p r o p e r t y ) , ( ? xr d f :t y p er d f s :r e s o u r c e ) ,( ? y r d f :t y p er d f s :r e s o u r c e ) r d f s 7 b : r d f s 2 : 【r d f s 3 : 【r d f s 5 a : r d f s 5 b : 【r d f s 6 : r d f s t : r d f s 8 : r d f s 9 : r d f s l 0 : ( ? ar d 锣p ef a l l s :c l a s s ) ( 孙r d f s :s u b c l a s s o f r d f s :r e s o u r c e ) 】 ( ? x g p ? y ) ,( ? pr d f s :d o m a i n ? c ) ( ? xr d f t y p c ? c ) 】 ( ? x ? p ? ”,( ? pr d f s :r a n g e ? c ) 一 ( ? yt a l l :t y p e ? c ) 】 ( ? ar d f s :s u b p r o p e r t y o f ? b ) , ( ? br d f s :s u b p r o p e r t y o f ? c ) ( ? ar d f s :s u b p r o p e r t y o f ? c ) 】 ( ? ar d f t y p er d f :p r o p e r t y ) ( ? ar d f s :s u b p m p e r t y o f ? a ) 】 ( ? a9 p ? b ) ,( ? pr d f s :s u b p r o p e r t y o f ? q ) ( ? a9 q ? b ) 】 ( ? ar d f t y p er d f s :c l a s s ) ( 9 ar d f s :s u b c l a s s o f ? a ) ( ? ar d f s :s u b c l a s s o f 9 1 ) ) ,( ? br d f s :s u b c l a s s o f ? c ) ( ? ar d f s :s u b c l a s s o f ? c ) 】 ( ? xr d f s :s u b c l a s s o f ? y ) ,( ? ar d f :t y p e ? x ) ( ? ar d f :t y p e ? ”】 ( ? xr d t y p er d f s :c o n t a i n e r m e m b e r s h i p p r o p e r t y ) - ( ? xr d f s :s u b p r o p e r t y o f r d f s :m e m b e r ) 】 图3 - 7 r d f s 推理规则 下面将通过一个例子详细地阐述语义闭包的计算过程: 硕士学位论文第三章d o o r 系统设计与实现 类碟 子类 图3 - 8 一个简单的r d f 资源图 图3 8 给出了一个简单的r d f 资源图,其中a ,b ,c ,d 代表类名,x 代 表个体,其中它既是类b 的一个个体,也是类d 的一个个体。如果采用三元组 查询类a 的个体实例,则返回为空。 下面我们依据r d f s 推理规则对图3 - 8 进行语义扩展,依据规则8 我们可以 得出类d 是类a 的子类;依据规则9 我们可以得出类x 也是类c 和类a 的个体 实例。这样图3 - 8 对应的语义闭包就如图3 - 9 所示: 类型 子类 推导出的类型 推导出的子类 图3 - 9 r d f 资源图语叉闭包 我们基于图3 - 9 进行三元组查询类a 的个体实例,则个体x 应该被返回。 d o o r 系统实现用户对本体的语义查询便基于上述的实现思路:先对本体资 源图进行语义扩展,然后再在本体的语义闭包上实现三元组匹配查询,最后得到 执行语义查询后的完整结果。 3 1 4 a p i 接口 为了给开发用户提供编程方便,语义w e b 的支撑软件一般都会提供开发a p i 给用户,有些是自己提出的,有些是一些标准组织制定的,如在传统描述逻辑推 理机与外部程序交互过程中遵循的d i g 接口。 在d o o r 系统设计与实现中,我们也利用了j e n a 和p e l l e t 系统提供的一系 列a p i ,其中就包括了o w l a p i 以及d i g 接口。 硕士学位论文第三章d o o r 系统设计与实现 下面将简单介绍o w l a p i 与d i g 接口,一般说来o w l - a p i 主要负责为 o w l 文件提供建模、解析、序列化、编辑和推理操作接口,它不负责具体的实 现,它只为应用程序提供一个统一的开发接口。目前应用得比较广泛的o w l - a p i 是由英国曼切斯特大学提出来的【4 蜘。 o w l - a p i 在开发过程中所扮演的角色如图3 1 0 所示: 图3 1 0o w l - a p i 的作用 o w l - a p i 向应用程序屏蔽了下层具体实现技术细节,从而为应用程序提供 了一个统一的标准接口。 另一个在本体推理系统中应用的比较广泛的接口是d i g 接口,它由d i g 描 述逻辑实现组开发,d i g 接口为描述逻辑推理机系统向外提供推理服务提供了一 组标准的接口,作用类似于数据库中的o d b c ,它允许前端如本体编辑器挂接到 后台不同的推理引擎上,目前最新的版本为2 0 。 d o o r 系统与外部程序如本体编辑器可以通过d i g 接口进行交互,交互过 程如图3 - l l 所示: 图3 - 1 1d i g 接口与外部程序交互 d i g 推理机通过h t t p 端口向外部程序提供推理服务,外部程序先t e l ld i g 推理机要推理的本体文件,然后再a s k 要对本体文件进行的推理任务,d i g 推理 机在执行相关的推理之后,把推理结果r e s p o n s e 给外部程序。 设计o w l - a p i 的主要目的是为了向用户提供一个较为全面的操作o w l 本 体文件的程序编程接口,它虽然包含了推理这个子部分,但是设计的非常的简单。 例如t a x o n o m y 层次推理只涵盖了类层次,而没有涉及到属性层次,还有诸如只 支持对单个本体文件的解析而没有考虑到o w l 的i m p o r t 子句等,还有一点就是 它缺乏从传统描述逻辑和方便用户查询角度进行考虑和设计,如没有提供传统的 a b o x 和q b o x 查询推理的编程接口。 硕士学位论文 第三章d o o r 系统设计与实现 j e n a 也提供了一个o n t o l o g y a p i ,同时也包含了一个i n f e r e n c e a p l 4 6 ,不过 设计它的主要目的是为了方便用户实现语义查询,它可以根据用户定制的推理机 计算包含不同语义信息的语义闭包,如它向用户提供了r d f s ,o w l 等具有不 同推理能力的推理机,然后把它和需要进行推理的本体文件绑定在一起便可得到 原本体中蕴含的语义信息,这样用户便可以很方便地存取那些原本体中存在的隐 含知识。j e n ai n f e r e n c ea p i 没有提供诸如分类等推理a p i ,很显然,一个本体推 理a p i 的设计如果只是单独着眼于用户的语义查询方面肯定是不全面的。 p e l l e t 在o w l - a p i 和j e n a 提供的推理a p i 的基础上,提出了自己的一个 r e a s o n e ra p i ,它能够实现o w l - a p i 的涵盖的所有推理功能,同时也提供了属 性层次的推理,也能够实现对o w l 模型灵活的语义扩展,尽管如此,它还是存 在着一些不足之处,例如它把所有的操作函数都集中在一个r e a s o n e r a p i 中,这 样显得层次关系在逻辑上不是很清楚,另外就是它也缺乏对传统描述逻辑的进一 步支持,如它只提供了r e a s o n e r g e t k b 0 这样一个操作接口。 f a c t 也提供了一个关于t b o x 推理的a p i ,不仅提供了t b o x 分类、包含、 超类、子类推理操作接口,还提供了相交推理等操作接口,它与o w l a p i 比较 起来虽然从传统描述逻辑角度考虑了用户的推理需求,但是它没有考虑到a b o x , 这与当初设计它的目标是一致的,因为它本身就只是一个快速分类器,不提供对 a b o x 提供推理和查询支持。还有r a c e r 等传统d l 推理机,它虽然提供了一系 列的t b o x 、a b o x 查询的a p i ,但是提供的a p i 对一般用户来说显得太过于繁 琐,同时由于它把推理接口紧密地和查询接口结合在一起,因此显得a p i 层次 显得有点混乱。 基于上述分析,作者从本体的基本推理功能,语义查询,以及传统描述逻辑 三个方面综合考虑的基础上,提出了一套较为全面的针对o w l 语言的o n t o l o g y i n f e r e n c ea p i ,它的基本组成如图3 1 2 所示: 毽3 1 2o n t o l o g yi n f e r e n c e a p i 体系结构 在设计o w l r e a s o n e r 接口时,我们提供了用户定制本体推理机计算本体语 3 0 硕士学位论文 第三章d o o r 系统设计与实现 义闭包的操作函数和得到a b o x 以及t b o x 的操作函数,这就结合了j e n a 推理 a p l 和p e l l e t 推理a p i 的一些优点,具体的更为详细a p i 设计请参考附录。 总的说来我们提出的这套o n t o l o g yi n f e r e n c e a p i 具备下面的特点和优越性: l 、结构层次分明,方便用户使用:o n t o l o g yi n f e r e n c ea p i 主要由两部分组 成,其中o w l r e a s o n e r 主要负责对o w l 本体中的类、属性、个体以及 层次关系进行推理,这样设计也符合一般用户对o w l 本体文件组成的认 知;另外一部分即o w l c o n s s i s t e n c y c h e e k e r 它主要负责对o w l 本体的 一致性进行检查; 2 、支持多个本体:支持o w l 推荐标准中的i m p o r t 子句功能,而一般的o w l 推理a p l 只是提供了针对单个本体的接口; 3 、支持语义闭包的计算:用户可以定制具备不同推理能力的推理机来计算 本体资源图的语义闭包,从而实现用户的语义查询; 4 、提供传统描述逻辑系统的操作接口:例如o w l r e a s o n e r 提供的g e t k b 、 g e t a b o x 、g e t t b o x 等方法; 5 、方便用户查询操作:在整个推理a p i 设计的过程中,我们也充分考虑了 用户的查询要求,例如,在o w l c l a s s r e a s o n e r 接口中定义的i s i n s t a n c e o f 方法就能很方便地执行用户判断个体是否属于某一类型的布尔查询。 目前d o o r 系统只是实现了其中的部分a p i 接口功能,下一步的工作将是 实现全部接口功能,完成之后争取能够开源发布以接受大家的建议而加以进一步 改进完善。 3 2 规则扩展支持 从2 1 节我们可以了解到,o w l 描述语言的描述能力对于描述推理规则面 言是不够的,而在实际的语义w e b 应用中,往往又需要推理规则的支持,在s n a x 系统中,我们也有着现实的应用,例如下层本体库就包含有以s w r l 格式描述 的本体文件以及规则知识库,同时如何在本体推理引擎中支持规则的推理已经成 为了许多学者研究的内容之一1 4 7 1 ,d o o r 系统在前人研究的基础提出了如图3 1 3 的规则扩展支持方案: 硕士学位论文第三章d o o r 系统设计与实现 图3 1 3 规则扩展支持模块结构图 其中s w r l 推理引擎负责解析s w r l 文件并实现基于它的查询和推理,这 样就可以使得s n a x 系统具备处理s w r l 本体文件的能力;而一般r u l e 引擎负 责解析执行一般的推理规则,其作用就相当于传统的规则推理引擎;r u l e 语义 闭包计算模块负责对本体资源图实现基于规则的语义扩展,这样就可以增加用户 在查询方面的能动性。 在d o o r 规则扩展支持模块的具体实现过程中,s w r l 推理引擎主要借鉴 了p e l l e t 和b o s s a m 本体推理系统,一般r u l e 引擎和r u l e 语义闭包计算模块是 基于1 e n a 提供的规则推理引擎而开发,下面简单介绍一下d o o r 系统处理用户 在查询过程中融入定制规则的流程: l 、解析本体文件得到本体模型; 2 、利用r d f s ,o w l 等推理规则计算第一步得到的本体模型的语义闭包: 3 、在第二步的基础上计算用户定制规则的语义闭包; 4 、返回第三步得到的语义闭包。 到耳前为止d o o r 系统的规则支持模块目前还只是一个非常简单的功能模 块,进一步提出针对s w r l 的推理算法以及更好地结合s n a x 系统的应用对规 则推理引擎进行优化将是下一步研究的工作。 3 3t a b l e a u 算法 t a b l e a u 算法是传统描述逻辑推理系统的核心算法,因为所有其它的推理功 能如分类、包含等都可以规约为概念的一致性检查,而t a b l e a u 算法就是具体负 责概念一致性检查,它最早由s c h m i d b s c h a u 和s m o l k a 为检验a l c 概念的可满 足性而提出,该算法能在多项式时间内判断描述逻辑a l c 概念的可满足性问题; t a b l e a u 算法被广泛用于各种描述逻辑中以判定概念的可满足性或概念问的包含 关系,各种优化的t a b l e a u 算法也已在实用推理机例如f a c t 、r a c e r 等中得以实 现。其中f r a n zb a a d e r 等人在文献f 4 8 】中对t a b l e a u 算法进行了较为全面的总结和 硕士学位论文第三章d o o r 系统设计与实现 分析,h o r r o c k s 也在他的博士论文中对t a b l e a u 算法的优化技术进行了全面的 总结和分析。d o o r 系统也是基于t a b l e a u 算法实现一致性和分类等推理功能, 下面将通过a l ct a b l e a u 算法来详细介绍t a b l e a u 算法的概念、规则、处理流程 以及t a b l e a u 算法引擎的典型系统结构。 t a b l e a u 的定义;设d 是一个a l c 概念( d 是否定范式) ,c 为所有可能概 念的集合,r o 是出现在d 中的角色集合,r d = rir 出现在d 中) 。定义d 的 a l ct a b l e a u 为一个三元组( s ,l ,) : s :个体的集合 l :s c 将s 中的个体映射为c 中的概念 8 :l b 一2 瓢3 将r d 中的角色映射为个体,个体对的集合,同时要求存在某 个个体s e s 使得d l ( s ) 可以很轻松地通过t a b l e a u 构造模型,或通过 模型构造t a b l e a u 。 一个a l c 概念d 是可满足的,当且仅当存在个d 的a l c 表t ,而在建 表t 的过程中,一般又需要遵循相对应的t a b l e a u 算法规则,例如,我们在构建 一个a l c 概念d 的t a b l e a u 过程中,所遵循的t a b l e a u 算法规则如表3 - 1 所示: 袁3 - 1a l ct a b l e a u 算法规则 肇曩( 1 ,c l r - i c i t 一 n 靓珂位 e 岛c l 正“神 嚣么t ) l o ul c l c t 如曩1 1 c l u q 神 2 ) ic 1 c 1 ) n ( d - i i u - 娩崩 一幺时_ ( 时u i c 对于藁十c e l c i c l 如暴n js c , 2 h 覆有一十s - 嚣辨斗 j 一蟪囊艘耨c e ( ,) 群幺新增十蛄点抑麓值 “z ,) ) 4 s 且工如- - i c ) 蝴囊( i ,v s c t ,) ¥- 基撼 ( 2 h 宥一十5 - 学壤,恒c 皇上( 一 辱幺上( 曲三b ,u c 从表3 1 我们可以看出,只有了规则才可能产生新增节点操作,这样它就可 能导致扩展树的深度迅速膨胀,为了减少新增节点操作从而产生了许多优化算 法。下面我们将通过一个具体事例来说明t a b l e a u 算法的具体执行流程,假设我 们想要知道( j 五彳) n ( 3 r 口) 是否被j 月( 一n 占) 所包含,这意味着我们必须检测一 下概念描述c = ( j 胄一) n ( 3 r b ) n - , o r ( 4 n b ) ) 是否是不可满足的。 首先,我们把描述中的所有的符号都换成否定符号,并使用笛摩根定律以及 常用的量词定律,我们得到描述c o = ( j r 4 ) n ( 3 r b ) n v r ( “n - 1 丑) ,这是一 个否定范式,也就是说,否定只出现在概念名的前面。 硕士学位论文 第三章d o o r 系统设计与实现 接下来,我们将构造一个有限解释i ,并且c o ,这意味着i 中必须存在 一个是c :的一个元素的个体,构造过程一般都是根据构子按照t a b l e a u 规则添加 变量,并检查是否有冲突,无冲突表明可满足,有冲突则不可满足。 在这个例子中,c o 满足了所有的限制,而没有遇到一个明显的矛盾,这表 明c o 是可以满足的,所以( j r 4 ) n ( 3 r b ) 不能被3 胄a n 占) 所包含,这个算法产 生了一个解释i 作为这个事实的证据:l = b ,c ,d ;r i = ( b ,c ) ( b ,d ) ) ;a 1 = ( c ) 以及 a t = - d ,对于这个解释,b c :,这意昧着b ( ( j r a ) n ( 3 r ,历) ,但是 b 仨( 3 r ( 彳n 曰”。 一般来说基于t a b l e a u 算法实现的本体推理机具有下面典型的系统结构: 图3 - 1 4 基于t a b l e a u 算法的本体推理机结构图 其中本体解析器负责解析本体和获取本体中t b o x 知识和a b o x 知识,并分 别把它们送入预处理器和一致性检查引擎中;预处理器主要负责把概念表达式进 行范式化,即把概念描述转换成一个标准的否定范式,然后再执行简化 ( s i m p l i f i c a t i o n ) 操作,经过预处理之后,包含和一致性问题能够得到简化,有时 可以通过语法检测明显的可满足性从而完全避免了比较耗时的一致性检查, a b s o r p t i o n 操作主要是为了把一般从理( g e n e r a la x i o m s ) 转化成原子定义公理,通 过这个a b s o r p t i o n 操作,能够大幅度提高推理机的性能,经过上述两步之后t b o x 分成了t u 和t g 两大部分,t u 直接送入一致性检查引擎,t g 则还需要通过一个 内化操作( i n e m a l i z a t i o n ) ,它可以把一个全局属性( r o l e ) 的问题归约为单个概念的 可满足性检查,除了上述的体系结构图所描述的一些基本优化器之外,还有许多 的优化器没有整入,譬如偏序优化( p a r t i a lo r d e r i n go p t i m i s a t i o n s ) ,它在对k b 进 行分类的过程中可以减少包含测试的次数,还有包含检查优化( s u b s u m p t i o n o p t i m i s a t i o n s ) ,它可以避免采取代价昂贵的一致性检查策略,同样如果采用了一 致性检查优化( s a t i s f i a b i l i t yo p t i m i s a t i o n s ) 策略还可以进一步减少一致性检查时 间。 硕士学位论文第三章d o o r 系统设计与实现 3 4d o o r 系统运行演示 目前d o o r 系统已经实现了本体的一致性检查和分类等推理功能,也实现 了传统的三元组匹配查询和语义查询,下面给出系统演示图: 图3 1 5d o o r 系统运行后的总界面 从图3 1 5 很容易看出d o o r 系统实现的主要功能。用户发出命令主要通过 菜单栏选择命令,用户也可以通过命令行方式来调用系统相关功能:本体文件面 板、查询文件面板以及结果显示面板则是展示给用户的交互界面。 图3 - 1 6 对m a d _ c o w s 本体文件执行分类结果演示图 硕士学位论文 第三章d o o r 系统设计与实现 图3 一1 6 给出了系统对m a d c o w s 本体执行分类后的结果,可以看到,通过 分类操作我们能得出概念m a d _ c o w 是不可满足的,即m a dc o w 概念不可能存在 任何实例。 图3 1 7 执行用户查询结果演示固 图3 一1 7 给出了系统执行用户输入的查询并返回结果的演示图,其中查询语 法采用s p a r q l 语法表达,用户对于返回结果的格式可以定制,可以是文本格式、 x m l 格式和数据表格形式等,图3 1 7 查询结果的数据格式采用了一般的文本格 式。 3 5 小结 作者在本章详细讲解了d o o r 系统的总体架构以及系统关键功能模块的设 计及其实现,其中系统关键功能模块的介绍包括了本体解析器、查询引擎和本体 推理引擎和a p i 接口,作者在a p i 接口一节中还给出了一套o n t o l o g yi n f e r e n c e a p l 参考方案并阐述了它的优点。除此之外,三元组查询的基本概念和怎样利用 推理机和三元组查询引擎实现用户的语义查询在本章中也得到了介绍,最后作者 在简要给出规则扩展模块和t a b l e a u 算法的介绍之后,给出了d o o r 系统运行演 示图。 硕士学位论文第四章本体推理机对比测试实验 第四章本体推理机对比测试实验 目前已经存在了许多的本体推理机,但还缺乏一套比较成熟的本体推理机系 统对比测试方案,为了使用户更好地了解、使用和开发本体推理机,作者在本章 中提出了一套对比本体推理机的测试方案,该方案从系统功能、用户和开发者三 个不同的角度对本体推理机进行考察。为了验证该方案的有效性,作者随后用该 方案对d o o r 和其它三个典型本体推理机( p e l l e t 、r a c e r 、f a c t + + ) 进行了详细的 实验对比,实验结果证明:该测试方案是可行和有效的。 4 1
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2026届广渠门中学高三化学第一学期期末教学质量检测模拟试题含解析
- 山东省齐鲁名校2026届高一化学第一学期期中质量跟踪监视试题含解析
- 益气健脾中药对肠道菌群的调控机制
- 创意职业探索者:副业潮流面试题目与求职策略深度解析
- 细胞的衰老和死亡
- 销售内勤数据汇报
- 贪吃蛇游戏讲解
- 现在完成时的讲解
- 2026届山东省费县化学高一第一学期期末学业质量监测模拟试题含解析
- 习惯的养成汇报
- 医院综合门诊部综合管理体系建设
- 2025年中医师承出师考试题库
- 2025年宜昌市猇亭区招聘化工园区专职工作人员(6人)笔试备考试题及答案详解(夺冠)
- uom无人机考试题库及答案2025
- 预防接种基础知识课件
- 护栏生产及安装方案(3篇)
- 污水厂培训课件
- 科协单位涉密管理制度
- 体育教师专业考试试题及答案
- 陕西省专业技术人员继续教育2025公需课《党的二十届三中全会精神解读与高质量发展》20学时题库及答案
- 教练技术探索课程一阶段导师讲义
评论
0/150
提交评论