




已阅读5页,还剩51页未读, 继续免费阅读
(计算机软件与理论专业论文)一个基于本体和规则推理的查询系统的设计与实现.pdf.pdf 免费下载
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
目录 摘要 基于本体的查询是当前的研究热点,但本体的语义表达能力局限于描述逻辑,不能表达 一般形式的规则,因此人们提出了语义w e b 规则语言( s w r l ) 。研究s w r l 及其应用对 语义w e b 的应用发展具有意义。 本文的主要工作是:分析s w r l 的研究现状及主要特点;在此基础上,提出了基于j e s s 的s w r i ,解析器框架;然后,基于所提出的s w r l 解析器构建了一个基于s w r l 的查询系 统框架,并通过大学排课系统验证了基于本体和规则推理的查询能力。 本文共分为5 章:第一章绪论主要介绍本文的研究背景、意义、内容、及其技术路线; 第二章主要介绍语义w 曲规则语言( s w r i ,) ,分析s w r l 解析器的解析原理;第三章在 s w r l 解析器的基础上设计了基于s w r l 的查询系统框架;第四章是基于所设计的s w i u 查询系统框架实现了一个关于大学排课问题的查询系统,以验证基于本体和规则推理的查询 能力;结束语中总结本文所做的研究工作,指出将来的工作。 关键词本体规则s w r l 解析器大学排课系统 东南大学硕士学位论文 a b s t r a c t r e s e a r c h e s0 no n t o l o g y - b a s e d q u e r i e sa r ec u r r e n tr e s e a r c hc o n c e m s b u ts i n c et h es e m 锄t i c e x p r e s s i v ea b i l i t yo fo n t o l o g yi sl i m i t e dt ot h ed e s c r i p t i o nl o g i c ,b e i n g 岫a b l et oe x p r e s st h e r e g u l a t i v er u l e s ,t h es e m a n t i cw 曲r u l el a n g u a g e ( s w r i 。) i sp r o p o s e d t h er e s e a r c ho ns w r l a n di t s a p p l i c a t i o ne x e r c i s e sas i g n i f i c a n ti n f l u e n c e o nt h ea p p i i c a t i o nd e v e l o p m e n to fw 曲 s e m a n t i c t h em a i nt h e m e so ft h i sp a p e ri i ei nt h ef 0 1 l o w i n ga s p e c t s :f i r s tw ea n a i y s et h ec u l l r e n tr e s e a r c h d e v e l o p m e n to fs w r la n di t sm a i nc h a r a c t e r i s t i c s b a s e do nt h ea n a l y s i so fp r e v i o u s l yr e l e v a n t w o r k ,t h ef r a m e w o r ko fp a r s e rb a s e do nj e s si sp r o p o s e d t h e nw ec o n s t i t u t e saq u e r ys y s t e m f r a l n l e w o r kb a s e do ns w r l t h eq u e 叫a b i l i t yb a s e do no n t o l o g ya n dr u l e sw i l lb ef i n a u y v a l i d a t e dt h r o u g ht h es y s 钯mo fu n i v e r s i t yc o u r s e sa r r a n g e m e n t t h i sp 印e rf a l l si n t o5c h a p t e r s t h ef i r s tc h 印t e r ,a sa ni n 仃o d u c “o n ,m a i n l yi n t r o d u c e s t h e r e s e a r c hb a c k g r o u n d ,s i g n i f i c a n c e ,a sw e l la st e c h n o l o g i c a im e t h o d s t h es e c o n dc h a p t e rm a i n l y i n t r o d u c e ss w r l ,a 1 1 dm a k e sa na n a l y s i so ft h e o r i e so fs w r lp a r s e r t h et h i r dc h 印t e r i n t r o d u c e st h eq u e 拶s y s t e mf r 锄e w o r ko fs w r lb a s eo ns w r lp a r s e r t h ef o u r t hc h a p t e r i n t r o d u c e st h ed e s i g no fq u e r ys y s t e mc o n c e m i n ga m m g e m e n t so fu n i v e r s i t yc o u r s e sb a s e do n s w r lq u e r ys y s t e m t h el a s tc h 印t e r ,a sac o n c l u s i o n ,s u m su pt h er e s e a r c hw o r kd o n e t h r o u g h o u tt h i sp 印e r , a n dm e n t i o n ss o m ea s p e c t sr e m a i n i n gu n s o l v e do rr e q u i r i n gf u r t h e r i m d r o v e m e n t k e yw o r d s :0 n t 0 1 0 9 y ,r u l e ,s w r i ,p a r s e r ,a r r a n g e m e n to fu n i v e r s i t yc o u r s e ss y s t e m i i 东南大学学位论文独创性声明 本人声明所呈交的学位论文是我个人在导师指导下进行的研究工作及取得 的研究成果。尽我所知,除了文中特别加以标注和致谢的地方外,论文中不包含 其他人已经发表或撰写过的研究成果,也不包含为获得东南大学或其它教育机构 的学位或证书而使用过的材料。与我一同工作的同志对本研究所做的任何贡献均 已在论文中作了明确的说明并表示了谢意。 研究生签名:拗凄日期:丝盘占7 东南大学学位论文使用授权声明 东南大学、中国科学技术信息研究所、国家图书馆有权保留本人所送交学位 论文的复印件和电子文档,可以采用影印、缩印或其他复制手段保存论文。本人 电子文档的内容和纸质论文的内容相一致。除在保密期内的保密论文外,允许论 文被查阅和借阅,可以公布( 包括刊登) 论文的全部或部分内容。论文的公布( 包 括刊登) 授权东南大学研究生院办理。 日期:竺垡7 第一章绪论 1 1 研究背景 第一章绪论 w e b 白出现以来,为人们提供了一个极其丰富而有价值的信息资源库。然而,由于w e b 环境下的数据量日渐庞大,所以迅速并准确地定位有效信息变得越来越困难。用户在基于关 键字方法搜索信息时经常会得到过多不相关结果或者根本就没有符合搜索要求的结果。其原 因为同一个单词在不同的上下文中可能有不同的含义,或搜索使用的关键字在网页中根本没 有出现。尽管可以通过包含更多的关键字或者同义词得到改进,但人们经常会搜到一些不是 自己想要的信息。这些缺陷的主要原因是现在的w e b 并不是为计算机处理而设计的,计算机 不能理解w e b 页面内容。为了使计算机能够处理网页内容,t i mb e m e r s l e e 提出了语义w e b 的构想,其核心技术之一是本体技术。 本体技术基于描述逻辑框架,为w 曲环境下面向领域的知识共享和推理提供了可能, 将其运用到信息查询系统中可有以下好处:通过本体可以充分利用描述逻辑的推理特色;基 于领域使得问题描述的复杂度缩减;本体可以重用,从而避免重复的领域知识分析。目前国 内外对于本体在信息查询中应用的研究已经有很多,主要有以下几个方面: l 、利用本体刻画的概念之间的内在联系将一些隐含( 或不明的) 信息挖掘出来,使这 些信息在查询中起着引导作用。文【l 】提出了一个智能搜索引擎模型,该模型利用本体和信息 过滤技术对用户的查询请求进行启发式引导,从而准确的表明了用户的查询意图。 2 、利用本体的领域信息,在这些领域信息的协助下,对要检索的文档进行分类。同时, 按照用户的兴趣爱好,对用户也进行分类,从而提高查询效率。文1 2 j 以英文词汇的本体库 w b r d n e t 中的本体作为背景本体,并对其中术语的每种含义和相应的领域建立了对应关系, 此外,定义了一些函数用于从本体中求出文档关键字的定义,从某一领域对映的本体中求出 该领域的术语集,并在这些函数和本体的协助下对被检索文档按领域进行分类。 3 、如何将用户的查询语言和资源描述用本体加以规范化和形式化,这样查询请求和资 源描述相一致,消除了表达上的差异,可以提高查询的精确度,这种情况适合于在线黄页以 及产品目录之类的信息查询系统。文献【3 j 提出的o n t o s e e k 系统即以在线黄页和产品目录为 研究对象,将在线黄页和产品目录中的主要数据以本体的方式表达并存储于数据库中:同时, 用户需求也以本体的形式表示,并与数据库中的本体相匹配。o n t o s e e k 针对匹配提出了一 系列的规则与限制。 4 、利用本体概念之间的关系,将所有潜在相关的信息作为查询的依据,提高查询的查 全率。文 4 】提出了单词语义模型( w o r ds e m a n t i c sm o d e l ) ,利用本体将文档内容和用户查询 进行语义扩展,以此提高检索的查全率。 5 、用本体概念对文档进行标注( a n n o t a t i o n ) ,这些额外的元信息可以帮助查询工具准确 的判断哪些文档更符合查询要求。文【5 】提出了e s c r i r e 系统,此系统以生物基因领域的文章 摘要和该领域的本体为试验基础,将需要表达的非形式化信息已形式化的概念加以标注。同 时该文献还探讨了有关标注中几个值得思考的问题。 6 、如何在x m l 这一类的半结构化文档中发挥本体的作用。通常将本体的术语概念嵌 入到x m l 标签中,增加x m l 标签的语义表达能力。通过使用本体可以集成访问不同的x m l 文档类型。文i 0 1 提出了0 s i r j x ( o n t o l o g y g u i d e ds e a r c hf o ri n f o m a t i o nr e t r i v a li nx m ld o c u m e n t s ) 系统,o s i r i x 系统从预先定义好的本体中产生标注d t d ,与原先的d t d 共同作用,形成了 东南大学硕十学位论文 嵌有本体概念的x m l 文档,这样,当o s i r i x 系统执行查询时,就可以利用本体中的概念层 次,查询到更多的符合需求的文档。文【7j 开发的o n t o b r o k e r 系统,与o s i r i x 原理基本相似。 但是,本体的语义表达能力还是有局限性的,其表达能力局限于描述逻辑,不能表示一 般形式的规则,更不能表示涉及时空关系的连续变化的事件流或是基于统计数据的不确定知 识( 容许矛盾冲突) 。因此,以上基于本体的查询系统的推理能力仅仅局限于以类别为基础 加上关联性的推理,而对于i f t h e n 这样很普通的关系则推理能力不足。例如,你可以用 一阶逻辑来定义概念u n c l e :p a r e n t ( ? x ,? y ) b r o t h e “? y ? z ) - u n c l e ( ? x ? z ) ,而o 、l 则不 能定义这样的关系。因此,我们相信规则的表示将在语义w e b 中发挥重要的作用【8 j ,一方 面,规则可以表达更多的知识,范围从隐含在人们头脑中的常识到公司的商业策略;另一方 面,规则表达能力可以大大节省知识的存储空间,因为一些事实可以通过知识库中已有的事 实和规则动态地推导出来,丽不必事先将它们存储起来。近年来,很多研究致力于在o 、肌 提供的本体层上结合不同类别的规j j l 0 语言,以提供更强大的知识表示和推理能力,这些工作 已经提供了一些扩展o 帆语言的途径。2 0 0 3 年11 月d a r p a 组织提出了一套语义w 曲规 则语言s w r i ,( s e m a n t i cw 曲r u l el a n g u a g e ) ,其目的就是为了驱使h o m 1 i k e 规则可与o w l 知识库产生结合。因此,本文的主要工作就是利用s w r l 所提供的强大的语义表达能力, 来设计与实现一个具有本体和规则推理能力的查询系统。 1 2 相关研究现状 s w r l 相关研究主要包括三个方面: 第一是关于s w r i ,语言本身方面的研究。s 帆i ,最初是由d a 照a 组织于2 0 0 3 年1 1 月1 9 日所发展的一套语义w 曲规则语言,当时所发布的版本为v e r s i o n o 5 p 1 ( d 锄1 o 唱,2 0 0 3 ) 。 2 0 0 4 年5 月2 1 日s w r i 正式成为w 3 c 的成员提案之一,当时的版本为垤r s i o n o 6 【lo 】,相 比较v e r s i o n o 5 ,完善了s w r l 的语法架构,并增加了一些说明的例子和增加了b u i l t i n s 的 定义。目前可用的最新版本是于2 0 0 4 年1 2 月2 1 日发布的v e r s i o n 0 7 i j 。v e r s i o no 7 比 v e r s i o n o 6 定义了更多的b u i l t _ i n s 。 s w r l 是由o w l 子语言o w ld l 与o w ll i t e ,以及u n a 哕b i n a yd a t a l o gr u l e m l 为 基础的规则描述语言,其目的是为了驱使h o m 1 i k e 规则可与o w l 知识库产生结合。s w r l 是由r u l e m l 演变而来,一样是x m lb a s e d 的规则格式,具有人机可读的优点,可较为清 楚地表现规则之间的关系,此外s w r i ,可以引用本体中的元素来编辑规则,这是和r u l e m l 的不同之处。 第二是关于如何对s w r i ,进行推理解析方面的研究,这也是研究环节中最重要的一环, 它将是构建相关应用系统的基础。s w r l 的规范没有限制应该如何来推理s w r l 规则。因 此用户可以自由地选择多种类型的推理引擎来通过s w r l 规则推理存储在一个o w l 知识库 中的知识,同样,也可以自由实现自己的编辑工具来创建s 舳i ,规则。 当前国内外对于如何来解析s w r l 规则的研究主要方向是将s w r i ,的编辑器与第三方 的规则引擎( 如j e s s 、a l g e m o n 和s w e e t r u l e s ) 加以整合以实现对s w r l 的推理解析。例 如,文【1 2 】中提出了一个将运行于p r o t e 酌o w lp l u g i n 中的s w r i ,编辑器与j e s s 引擎整合以 实现对s w r l 推理的方式。 最后是有关基于s w r l 的应用系统方面的研究。由于s w r l 的规范还在进一步的发展 当中,目前还没有该语言的正式版本,因此这一方面的研究还比较少。文【i 列中提出了一个 基于o w ld l 与s w r l 的大学排课系统的设计与实现,但是该文虽然提出了一个可行的思 路,却没有真正地解决大学排课中的资源冲突问题,没有能够充分体现s w r l 强大的知识 表示与推理能力。 2 第一章绪论 本文的工作主要的思路就是借鉴以上这些已有的工作,特别是关于s w r i ,推理解析方 面的工作,寻找相关的应用场景来建立一个基于s w r l 的查询系统。 1 3 研究目标与内容 本文的研究目标是以大学排课系统为应用场景设计并实现一个基于s 吼的查询系统, 探讨本体与规则相结合的应用模式。 本文的研究内容包括: 1 分析已有相关工作的s w r l 语言的推理解析原理,并找到相关的应用编程接口,作 为应用原型的基础: 2 在s w r i ,解析器的基础上提出并构造基于s w r l 的查询系统框架; 3 构建一个基于s 吼的大学排课系统,以验证基于s 吼的查询系统的能力。 1 。4 研究方法及路线 本文的主要二【作是分析研究s w r i ,的推理解析机制及相应的查询系统的构建,并研究 相关原型系统的设计实现方法。 首先,本文将针对s w r l 语言的特点,分析已有相关工作的s w r l 语言的推理解析原 理,构造一个s w r l 的解析器,这将是后面的查询系统的重要组成部分。s 吼的引入是 为了能够实现基于推理的查询,而s w r i ,目前还没有专门的推理引擎,因此本文将采用j e s s 引擎来作为查询系统的推理引擎。j e s s 引擎是根据事实和规则来推理的,但j e s s 引擎不能直 接推理以o w l 和s w r i ,表示的知识与规则,所以s w r l 解析器的主要作用是将作为j e s s 引擎事实库和规则库来源的o w l 本体和s w r l 规则进行相应的格式转换,将其转换为j e s s 引擎可接受的格式。格式转换包含两部分:一是o w l 描述的本体知识到j e s s 事实的转换, 这部分的转换不仅仅是格式上的转换。因为本体中不仅包含了s c h e m a 和实例,还蕴涵了隐 性的知识,所以需要一套引擎可进行语义的推理来将本体中蕴含的隐性知识解释出来,本文 将采用已有的描述逻辑推理机r a c e r 来进行这样的推理。经过推理后的本体的s c h e m a 部分 将被映射为j e s s 的模板,实例层信息将被表示为j e s s 断言;二是s w r l 表示的规则到j e s s 规则的转换,因为s w r l 是x m l 格式的文件,所以将采用x s t ,t 的方式来转换格式。 随后,在s w r l 解析器的基础上,我们将构建相应的查询系统。该查询系统是针对某 一特定领域的,因而在此之前我们需要先建立好相应的领域本体,并在领域本体的基础上建 立相应的领域规则。然后通过s w r l 解析器将本体知识导入j e s s 的事实库,规则导入j e s s 规则库,完成查询系统的初始配置。用户查询的数据源是包含了实例信息的o w l 知识库。 用户的查询需求将在领域本体的引导下通过系统提供的查询接口输入,并通过查询控制器启 动相应的查询过程。查询过程可分为两种:简单查询和复杂查询。简单查询不需要经过推理 引擎的推理可以直接在0 w l 知识库中找到所需信息的查询;复杂查询则会因为查询需求要 求改变o w l 知识库中的内容而触发推理引擎对o w l 知识库进行整理和更新。查询的结果 将以表格的形式显示给用户。 最后,本文将以大学排课问题为应用场景设计实现一个原型系统,以验证本文查询系统 的推理能力。 1 5 本文结构安排 本文共分为5 章:第一章绪论主要介绍本文的研究背景、意义、内容、及其技术路线; 3 东南大学硕士学位论文 第二章主要介绍语义w 曲规则语言( s 、v r i ,) ,分析s w r l 解析器的解析原理;第三章在 s w i u 解析器的基础上设计了基于s w r i ,的查询系统框架;第四章是基于所设计的s w r l 查询系统框架实现了一个关于大学排课问题的查询系统,以验证基于本体和规则推理的查询 能力;结束语中总结本文所做的研究工作,指出将来的工作。 4 第二章语义w e b 规则语言( s w r l ) 第二章语义w e b 规则语言( s w r l ) s w r i ,( s e m a n t i cw 曲r u i el a l l g u a g e ) 是集本体和规则于一起的一种语言,s w r l 的 规则部分概念是由r u l e m l 【1 4 】所演变而来,再结合o w l 【1 5 】形成,目前s 、r i ,是w 3 c 规范 的一员。 本章结构安排如下:我们将首先介绍作为s w r i 语言基础的o w l 本体语言,然后再 介绍s w r i ,语言并分析s w r l 解析器的解析机制。最后将介绍一下s w r i ,的编辑工具s 吼 e d i t o r ,该工具提供了可视化的规则编辑界面,并提供了可以与已有规则引擎方便地进行整 合的机制。 2 1o w l o w l ( w 曲o n t o l o g yl a n g u a g e ) 是w 3 c 推荐的本体描述语言,是由d a m l 和o i l 所结合演变而来,o i l 是第一个本体语言结合描述逻辑的元素,以x m l 、r d f 的方式表示。 0 i l 中提供良好的对映方式,使语义( s e m a i l t i c ) 可以通过描述逻辑表示。图2 1 是w 3 c 提出 的本体语言架构。0 w l 具有较强的表达能力,但是计算得复杂度较高。出于对表达能力和 可接受的计算复杂度的妥协与折衷,o w l 有三种表达能力依次提高的子语言:o w ll i t e 、 o w ld l 、o w lf u l l 。这其中,0 w ll i t e 是o w ld l 的子集,而o w ld l 又是o w lf u l l 的子集。 图2 1 本体语言架构 本节我们将首先简要描述0 w ll i t e 的语言成分,然后再介绍o w ld l 和o w lf u l l 的 额外成分。 5 东南大学硕士学位论文 2 1 1o w ll i t e 语言概要 和o w ld l 和o w lf u l l 相比,o w ll i t e 只是使用了o w l 语言的部分特征,并且做了 更多的关于特征使用的限制。例如,在o w l l i t e 中,类只能根据命名了的父类( s u p e r c l a s s , 它不能是任意的类表达式) 定义,而且只能使用某些特定类型的类约束( c l a l s sr e s t r i c t i o n ) 。 类之间的等价关系( e q u i v a l e n c e ) 和子类关系只能在具名类( n 锄e dc l a s s ) 上做声明,不能 应用于任意的类表达式。类似地,o w ll i t e 只允许属性限制应用于命名了的类。另外,o w l l i t e 对基数的概念也有限制一它的取值范围只能是0 和1 。 o w l l i t e 语言的构词( c o n s t m c t s ) 如下列出: i t d fs c h e m a 特性: 堂:一个类定义了因共有某些属性而同属一组的一些个体。一个内置的最一般的类被称 为此( 矗f 妒。w w w w 3 d 懵仍咒0 w ,- g “池崩d 咖以筘抑p 彪c 如琊p s ) ,它是所有个体的类,因 此是所有o w l 类的父类。另外还有一个内置的最特殊类被称为丛她 ( 向印伽ww w 3 d 馏仃r d w ,髻“础渊d p 励魄拶所p 彪c ,( 疆s p s ) ,它没有任何实例,因此是任意 o w l 类的子类。 型筮型垒地q f :可以给出一个或多个关于“一个类是另一类的子类”的陈述来创建一个 类层次结构( c l a s sh i e r a r c h i e s ) 。 堕筮垫坚! 星也:属性能用来表述个体之间或者从个体到数值的的关系o w l :o b j e c t p r o p e r t y ( 对 象属性) 和o w l :d a t 啦p e p r o p e n y ( 数据属性) 都是r d f 类r d f i p r o p e r t y 的子类。 型盈型丝塑垫型芝缈通过给出一个或多个陈述声明“某属性是另外一个或多个属性的子属 性”可建立属性层次。 堕筮也避:一个属性的定义域用来约束该属性可以适用的个体。如果一个个体以一个属 性和另一个体关联,并且该属性用某个类作为它的一个定义域,那么该个体必然属于这个类。 盥堑丝熊丝:一个属性的值域用来限制哪些个体可以成为属性的值。如果一个个体以一个属 性和另一个体关联,并且该属性的值域是一个类,那么另外那个个体必然属于此类。 鱼盟幽:个体是类的实例,个体之间可以用属性相互关联。 ( 不) 等价性: 竺g 型i ! 堡! 堡丝! :墨i ! 堕、垡垡型i ! 塑! 望丝圭哑堡! 里、点照型i g :笪点、型! 旌丝丝巨! ! 旦塑、41 1 旦! 旌丝! 属性特征: 、d i s t i n c t m e m b e r s 鱼垒应坐丛型曼理、旦堡丝她旦兰猩曼理、边望曼楚堡q f 、亚旦! ! ! ! 坦竺旦蛩臣垡丝、! 她塑旦堡! 丛姚丛y 、 立生! f ! q 丝垡2 丝2 臣呈型、互! ! 堡! 笪堡立! 塑垡f ! q 丝旦2 箜2 臣呈丝、 属性约束: ! 醛堡5 堑! f 叠塑、翌丝2 丛拦z ! 垒、盟丝堕丝堡点查兰q 盟 受限基数: 、s o m e 玩l 锐s f r o m 塑边鱼幽丝堡丛丝( 仅仅0 或1 ) 、丝丛鱼l 盔边鲍理( 仅仅0 或1 ) 、缨型盘! 垡丛驰( 仅仅0 或1 ) 头信息: 鱼垄逝、堑坚墅煎 类的交集: ! 丝f 堡! 笪旦鲤q 丝q f 版本信息: 丝丛直塑点坚色旦! 丛丝型! q 丝、垒旦垃巡q 丝绝堡丝垒丝陋丝、地q 丝巨塑壁垒丝l ! 至丛、旦缨丝堡曼旦蟹箜鄞 :臣苎垡堡堡垒! :塑2 卫堡丛z 注解属性: 苎色丛:! 堡垒皇f 、! j 量垂:q 丝塑望丝f 、箜g 丛:苎堡璺4 1 点垒、苎彦疆! 垄旦垡厦丝堡! 窒旦z 、4 丝丝鱼f 堡鲤旦丝:曼q 旦生丝、 q 丝q 翻坐蛩罂曼理 6 第二章语义w e b 规则语言( s w r i ,) 数据类型: 2 签型建查丝妞堡苎 我们在后面建立本体时会经常用到的构词主要包括r d fs c h e m a 特性和属性特征。r d f s c h e m a 特性包括了与r d fs c h e m a 有关系的o w ll i t e 特性,包括定义类、子类、属性、子 属性、定义域、值域和实例的构词:属性特征用以提供关于属性及其值的信息,其中用到的 o w l 公理我们会在后面单独介绍。 2 1 2o w ld l 和o w lf u 的附加语言描述 o w lf u l l 包含了0 w l 的所有语言结构,可以自由地、不受约束地使用r d f 结构。o w l f u l l 也允许使用类别名称作为实例,一个类甚至可以是它本身的属性。在o 、l f u u 中,d w ,? 劢觇和砌尺甜d 甜坩p 也是等价的。这意味着对象属性和数据类型属性不是互斥的。这种 不互斥的好处是可以提供很强的表达能力。但是,缺点是计算的不可判定性。尽管理论上, o w lf u l l 可以通过些一阶逻辑引擎来处理,但是却不能保证能快速且完整地给出答案。 0 w ld l 和o w lf u l l 使用相同的词汇集,只不过o w ld l 的词汇集受到一些限制。粗 略地说,o w ld l 要求类型分离( 一个类不能同时是一个个体或属性,一个属性也不能同时 是个体或类) 。这意味着,约束不能应用于0 w l 语言自身的成分( o w lf u l l 中是允许的) 。 此外,o w ld l 要求属性是对象属性,或数据属性:数据属性是类的实例和砌) f 文字和x m l s c h e m a 数据类型的值的关系;而对象属性是两个类的实例之间的关系。下面是对o w ll i t e 扩展了的o w ld l 和o w lf u l l 词汇集: 类的公理: q 丝望q 盘丝星丝程、丛迓q 丝磁丝、鲤些! 塑丝丝笪箜( 可应用于类表达式) 箜堑:点地g 箜点z ( 可应用于类表达式) 类表达式的布尔组合: ! 旦! i 2 丝2 f 、鱼! 丝趔堡丝! 曼丝丛2 f 、! 丝生坐生垒鲤f 鲨y 任意的基数: 塑边垒璺煎丝垡丛必趔型鱼型壁! 垡丝丝、笾型叠! 旦丝丝( 完全基数) :在o w ll i t e 中,基数的值被限制 为最小,或最大为0 或1 ,完全的o w l 允许其取值为任意非负整数。 填充值信息: 珊玩忽p 2 1 3o w l 公理 表2 1 中是o w l 三种子语言都接受的对于属性限制的一些公理,本文后面在建立排课 本体时将会用到其中的i n v e r s e o f 、f u n c t i o n a l 和i n v e r s e f u n c t i o n a l 。 a x i o md ls y n t a x e x a m p l e s u b c l a s s o fc l c 2c l c 2 e q u i v a l e n t c l a s sc 1 三c 2c 严c 2 d i s j o i n t w i t h c 1 1c 2 c ll - c 2 s a l n e i n d i v i d u a l a s x l 三 x 2 ) i l = 1 2 d i 行e r e n t f r o m x 1 ) 一 x 2 )1 11 = 1 2 s u b p r o p e 哪o f p 1 p 2p l p 2 e q u i p m e n t p r o p e r t y p 1 三p 2p l _ p 2 i n v e r s e o f p 1 三p 2 。i f p l ( x ,y ) t h e np 2 ( y ,x ) 7 东南大学硕士学位论文 仃a n s i t i v e p + c p i f p ( x ,y ) a n dp ( y ;z ) m e np ( x ,z ) s y m m e t r i c p 三p 。 i f p ( x ,y ) t h e np ( y ,x ) f u n c t i o n a lt c 1p i f p ( x ,y ) a n dp ( x ,z ) t h e ny = z i n v e r s e f u n c t i o n a l t c 1p i f p ( y ,x ) a i l dp ( z ,x ) t h e ny 2 z 表2 1o w l 公理 关于o w l 的详细说明可见:h 娅;垃塑盟型三:q ! g 理基:鱼型! :鱼筮望鳆。 2 2s w r l s w r l 是由o w l 子语言o w ld l 与o w ll j t e ,以及u n a 秽肥i n a yd a t a i o gr u l e m l 为 基础的规则描述语言,其目的是为了驱使h o m 1 i k e 规则可与o w l 知识库产生结合。s w r l 是由r u l e m l 演变而来。 s w r l 最初发布的版本为2 0 0 3 年1 1 月1 9 日的v e r s i o n 0 5 ,之后的2 0 0 4 年5 月2 1 日 s w r l 正式成为w 3 c 的成员提案之一,当时的版本为v e r s i o n 0 6 ,相比较v e r s i o n 0 5 ,完善 了s w r l 的语法架构,并增加了一些说明的例子和增加了b u i l t i n s 的定义。目前可用的最 新版本是于2 0 0 4 年1 2 月2 1 日发布的v e r s i o n 0 7 。与v e r s i o n o 6 相比,v e r s i o no 7 改动很小, 增加了一些b u m i n s ,其余部分都是一样的,后面我们将以v e r s i o n 0 7 为基础详细介绍s w i 也 的架构。本文的工作也都是基于v e r s i o n o 7 的。 s w r l 在o w l 中加入了规则,因为规则能够提供更强的逻辑表达能力。例如,你可以 用一阶逻辑来定义概念u n c l e 。 p a r e n t ( ? x ,? y ) “b r o t h e r ( ? y ,? z ) 2 u n c l e ( ? x ,? z ) o w l 则不能定义这样的关系。尽管s w r l 刚刚被研究,但是一阶逻辑已经被很充分地 研究过了。另外,结合一阶逻辑也使得s w r l 可以容易地与传统的关系数据库进行交流。 s w r l 的特点是直接在0 w l 上加h o mr u l e ,并且对r u l e 的解释是和o w ld l 兼容的, 为了这个兼容性,r u l e 里面常用的失败即否定( n e g a t i o na sf a i l u r e ,n a f ) ,还有原子公式的 否定都抛弃了,其原因主要是在语义w 曲这样的开放环境下,确定一个全集是很困难的, 因而也就无法表示一个原子的否定。尽管s 、u 仍然处于设计阶段,但是可以确定的一点 是,s w i u 的计算复杂度是不可判定的【l 州,另外,因为描述逻辑( d l ) 只是一阶逻辑( f o l ) 的一个子集,所以它的推理能力要比一阶逻辑差许多。一个可行的解决办法是借鉴o w l 的 方法发展多个子语言来获得推理能力与计算的复杂度的折衷,这项工作虽然还没有正式 的开始,但是已经被考虑过了。2 0 0 5 年9 月1 1 日p e t e rf p a t e l s c h l l e i d e r 等人就提出了一个 s w r lf u l l 的候选方案s w r i ,f o l 【1 7j ,该提案通过一阶逻辑来扩展s w r l 以获得更强的语 义表达能力。另外,针对w e b 开放环境下的模糊性,也有学者提出了利用模糊逻辑扩展s w r l 来处理w 曲上的不完整的和不精确的信息。 2 2 1s w r l 架构 图2 2 是分析s w r i ,语言规范后得出的架构图: 8 第二章语义w e b 规则语言( s w r l ) 图2 2s w i 也语言架构图 s w r l 的规则由i m p 组成,在i m p 中保留了r u l e m l 中以h e a d 表示推理结果,b o d y 表 示推理前提的基本形态。 h e a d 和b o d y 中的允许出现的基本成分是a t o m ,即其架构中所使用的h o m 子句都是由 a t o m 所组成。i m p 的h e a d 部分只允许出现有一个a t o m ,而b o d y 部分允许出现若干个a t o m 的合取,即规则具有h o m 子句的特征,而具有h o m 子句形式可以便于推理。 a t o m 中所使用的变量部分记录在v a r i a b i e 中,在a t o m 中包含了一条条的限制式,这些 限制式主要可分为四种: c ( x ) :c 是o w l 的类描述 p ( x ,y ) :p 是o w l 的属性而x 、y 可以是变量、o w li n d i v i d u a l s 或是o w ld a t av a l u e s a n l e a s ( x ,y ) :x 币y 相等 d i f r e r e n t f r o m ( x ,y ) :x 和y 不同 b u m i n 是s w r i ,模块化的组件,b u i l t i n s 中记录了s w l u 可以引用的逻辑比较关系。 这些b u i l t i n s 主要是借鉴了x q u e 拶和x p a t h 中的b u i l t i n s ,可以帮助s w r l 延伸和其他格 式的语言或架构整合。例如s w r l b :e q u a l 是由x q u e 科的o p :e q u a l 而来。 因此s w r l 可视为规则和本体的结合,通过两者的组合可使撰写规则时,直接使用本 体中所描述的关系和字词,这些类别之间的关系本来可能还需要额外的规则描述,但s w r l 中可以直接使用本体的描述。例如在本体中定义了下列关系: 9 东南大学硕士学位论文 h a s p a r e n t ( x 2 ,x1 ) h a s b r o t h e r ( x 1 ,x 3 ) 通过本体的描述我们可以知道x 1 是x 2 的父母,x l 有一个兄弟是x 3 ,此时欲使用s w r l 设计一条规则说明x 2 和x 3 之间的关系,在何种情形下) ( 2 和x 3 有叔叔的关系,如下: b o d y h a s p a r e n t ( x 2 ,x1 ) h a s b r o t h e r ( x l ,x 3 ) h e a d h a s u n c l e ( x 2 ,x 3 ) 这时s w r i ,可以直接使用本体中已经建立好的关系如h a s p a r e n t ( x 2 ,x 1 ) ,h a s b r o t h e r ( x l ,x 3 ) 和本体中所定义的属性资料例如性别、姓名、年龄和其他人的关系等等,进而推理出本体未 建立的关系h a s u n c i e ( x 2 ,x 3 ) ,若是使用r u l e m l 则需将x 1 ,) 【2 ,x 3 的关系全部定义在b o d y 中,若b o d y 未定义的部分则不会有相关的资料,所以s w r i ,是种以本体为基础的规则语 言,所支持的本体语言为o w l ,因为o w l 为w 3 c 标准且具有较丰富的关系表示。 2 2 2s w r l 的表示方式 s w r l 主要的表示方式可分为两种,分别是以x m l 和r d f 的方式表示,使用x m l 的 方式表示是以r u l e m l 加o w l x 的方式描述,r d f 的方式表示则是o w l 加上r d f 。 以x m l 方式表示的优点如一卜i : 任意o w l 的类可以作为谓词( p r e d i c a t e s ) 出现在规则中。 规则和本体的公理( a x i o m ) 可以混用。 可以通过x s l ,t 将o w l x 转换为其他语法。 现存的r u l e m l 工具可以继续编辑s w r l 。 另一种r d f 方式则是直接使用语义w 曲的标准语言进行描述,因为能直接针对o w l 所建立的本体结合,不需要经过其他的转换,s 帆i ,中的格式也由o w l 格式所规范以这 种方式所设计的规则,最大的好处在于内部的变量都是砌”的方式表示,可使得将变量对 应到本体的工作较为简单。而以r u l e m l 的方式表示,变量只是单纯的文字比对,这些变量 本身并不带有实际资源的意义。 下面两个分别是以两种方式所表示的规则形态的例子。 以x m l 形式表示: x 1 x 2 r u l e m l :v 驴 x 2 x 3 o w b ( :i n d i v j d u a lo w l x :n a m e = ”撑m a l e ”胗 1 0 第二章语义w e b 规则语言( s w r l ) xl x 3 以r d f 形式表示: s w r l :p r o p e n y p r e d i c a t er d f = r e s o u r c e ;”& e g ;h a s p a r e n t ” s w r l :a r g u m e n t1r d f r e s o u r c e = ”撑xl ”胗 s w r l :a r 窑u m e n t lr d f r e s o u r c e = ”撑x 2 ”扮 s w r l :a r g u m e n t 2r d f - r e s o u r c e = ”拌x 3 ”p s w r l :p r o p e n y p r e d i c a t er d f i r e s o u r c e = ”& e g ;h a s s e x ”今 s w r l :a r g u m e n t 2r d f :r e s o u r c e = ”释m a l e ”今 s w r l :a r g u m e n t 2r d f r e s o u r c e = ” f | x 3 ”胗 本文的工作将基于r d f 的语法格式。在本文原型系统中使用的工具p r o t 6 醇所保存的 s w i u 语法格式也是r d f 的。 东南大学硕士学位论文 2 2 3b u i l t - i n s b u i l t i n s 中记录了s w r i 可以引用的逻辑比较关系。为s w r l 设置b u i l t - i n s 的主要动 机是可以通过模块化的途径为将来的版本做进一步的扩
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年老年人健康管理服务项目试卷及答案(班前)
- 2025年农业系统职称考试考前冲刺练习题及答案详解(历年真题)
- 2025年美容美发店长面试预测题与经营策略
- 2025年机关单位招聘面试热点解析及模拟题集
- 2026届四川省宜宾市六中高高一化学第一学期期中质量检测模拟试题含解析
- 2025年本科院校基建处招聘考试备考指南与模拟题
- 公务员面试题及答案解读
- 2025年快递行业职业技能鉴定高级模拟题集
- 2025年数据分析师技能进阶教程与模拟题解析
- 2025年内科学专业知识初级考试题库及答案详解
- 让情绪有着落-2025年情绪营销8大趋势洞察报告
- 教师校园安全培训课件
- 头皮健康与头发生长关系的研究
- Odoo面试题及答案
- 2025年全国I卷英语 高考真题
- 北京车牌结婚过户协议书
- 赃款退还协议书
- 中华护理学会团体标准|2024 针刺伤预防与处理
- 肌少症知识试题及答案
- 北京市石景山区2025年中考一模英语试题(含答案)
- 2025-2030中国陶瓷涂料行业市场发展趋势与前景展望战略研究报告
评论
0/150
提交评论