(计算机应用技术专业论文)基于本体推理的web服务匹配研究.pdf_第1页
(计算机应用技术专业论文)基于本体推理的web服务匹配研究.pdf_第2页
(计算机应用技术专业论文)基于本体推理的web服务匹配研究.pdf_第3页
(计算机应用技术专业论文)基于本体推理的web服务匹配研究.pdf_第4页
(计算机应用技术专业论文)基于本体推理的web服务匹配研究.pdf_第5页
已阅读5页,还剩63页未读 继续免费阅读

(计算机应用技术专业论文)基于本体推理的web服务匹配研究.pdf.pdf 免费下载

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

基于本体推理的w e b 服务匹配研究 摘要 随着i n t e m e t 中w e bj i 务的数目和种类的增加,如何在诸多服务中找到符合 要求的服务,即服务匹配成为利用w e b 服务进行资源共享必须解决的问题。当 i l l s w e b 服务并没有以语义网为基础,基本上采用固定的标准化分类方式来描述服 务的功能、提供者以及获取服务的方式,由于w c b 服务技术只在语法层面上限定 了服务描述所采用的协议,因此它们对服务的语义描述能力非常有限,使得在服 务匹配对只能采用简单的关键字授索方法,显然不能满足服务匹配的需要。 w e b 服务匹配豹研究目标是服务匹配的高效率和自动化,在服务匹配技术中, 利用语义描述和服务本体论是达到该目标的有效途径;所以本文研究了如何用一 种明确的、计算机能够理解的语言描述服务,如何将语义w c b 、本体论和语义推 理应用n w e b 服务的查找和匹配中。 本文首先研究了语义网的体系结构。体系结构中各层次的含义及其之自j 的关 系。语义网技术的兴起促进了本体技术的发展,本体作为语义网的基石,在知识 表示与知识推理方面发挥着重要作用。本文深入研究了本体的概念、功能及描述 语言,本体理论的研究现状,本体建设工具等内容。 本体表示语言与描述逻辑相结合,为本体推理的合理性和有效性提供了保 证。作为一种知识表示的有效机制,描述逻辑被广泛地应用到计算机科学的许多 领域中。本文从描述逻辑的定义、基本语法及语义、体系结构以及推理功能及其 算法等方面做了系统阐述。 在分析了现有的w c b 服务标准和语义w e b 的基础上,引入了一种把二者结合 起来的语义w c b 服务。它可以实现在不需要人的参与下,w 曲服务的自动发现、 自动调用和自动组合。通过构建语义w c b 服务本体o w l - s ,以及服务匹配器,传 统w 曲服务中的u d d i 有了语义信息,原来基于关键字的服务匹配转换为基于本 体推理的服务匹配。匹配的结果按照匹配等级由高到低排列。在此基础上,本文 进一步改进基于本体推理的w e b 服务匹配,方而通过刑j 3 需求的重新定义,系 统把较完善的用户需求重新提交给匹配器:另力面提出语义相关度的概念及其 计算公式,用精确的数值细化匹配等纵,为服务清求肯提供更有意义的参考。 关键词:本体推理;描述逻辑:o w l s ;语义相关度;w e b l 务匹配 r e s e a r c ho nw e bs e r vic eg a t c h m a kin g b a s e do no n t o i o g yr e a s o n i n g a b s t r a c t a l o n gw i t ht h ei n c r e a s eo f t h en u m b e ra n dv a r i e t yo f w e b s e r v i c e si nt h e i n t e r a c t ,h o wt of i n dt h es e r v i c ec o n f o r m i n gt ot h er e q u e s ta m o n gs om a n ys e r v i c e s , n a m e l yt h es e r v i c em a t c h i n g ,h a sb e c o m e a q u e s t i o nw h i c hm u s t b er e s o l v e di n r e s o u r c e ss h a r i n gu s i n gt h ew e bs e r v i c e t h ec u r r e n tw 曲s e r v i c ed o e s n tt a k et h e s e m a n t i cw e b 嬲t h ef o u n d a t i o n b u tb a s i c a l l ys e l e c t st h ef i x e ds t a n d a r d i z e d c l a s s i f i c a t i o nm e t h o dt od e s c r i b et h es e r v i c ef u n c t i o n t h ep r o v i d e ra sw e l la st h e w a yo f g a i n i n gt h es e r v i c e b e c a u s et h ew e b s e r v i c et e c h n o l o g yd e f i n e st h e a 铲e e m e n to f t h es e r v i c eo n l yi nt h e8 r a r a r n a rs t r a t i f i c a t i o n ,t h e r e f o r et h e ya r e e x t r e m e l yl i m i t e dt ot h ea b i l i t yo f t h es e r v i c es e m a n t i cd e s c r i p t i o n w h i c hm a k e s i t o n l yu s e t h es e a r c m n gm e t h o dw i t hs i m p l ek e yw o r d s ,s oo b v i o u s l yi tc a n n o ts a t i s f y t h en e e do f t h es e r v i c e m a t c h i n g t h ea i mo f t h ew e bs e r v i c em a t c h i n gr e s e a r c hi st h eh i 曲e f f i c i e n c ya n d a u t o m a t i o n ,a n du s i n gt h es e m a n t i cd e s c r i p t i o na n dt h es e r v i c eo n t o l o g yt h e o r yi st h e e f f e c t i v ew a yt 0a c h i e v et h ea i mi nt h es e r ,i c em a t c h i n gt e c h n o l o g y t h e r e f o r et h e p a p e rm a k e sar e s e a r c ho nh o w t ou s eal a n g u a g ew h i c hi se x p l i c i ta n dt h ec o m p u t e r c a nu n d e r s t a n d 。t od e s c r i p t i o nt h es e r v i c e ,h o wt oa p p l yt h es e m a n t i cw c b ,t h e o n t o l o g yt h e o r ya n d t h es e m a n t i cr c a s o n m gi n t ot h ew e bs e r v i c em a t c h i n g t h e p a p e rm a k e sa r e s e a r c ho nt h es y s t e ma r c h i t e c t u r eo f s e m a n t i cw e b t h e s i g n i f i c a n c eo fe v e r yl e v e la n dt h er e l a t i o n sb e t w e e nt h e m t h er i s eo f t h es e m a n t i c w e bt e c h n o l o g yh a sp r o m o t e dt h ed e v e l o p m e n to f o n t o l o g yt e c h n o l o g y o n t o l o g yi s r e g a r d e da st h ef o u n d a t i o ns t o n eo f t h es e m a n t i cw e b ,a n di sp l a y i n ga ni m p o r t a n t r o l eu i t ht h ek n o b 7 l e d g ee x p r e s s i o na n dk n o x l e d g er e a s o n i n g t h ep a p e rm a k e sa d e e p l yr e s e a r c ho nt h ec o n c e p ta n dt h ef u n c t i o no fo n t o l o g ya n di t sd e s c r i p t i o n l a n g u a g e s ,t h ep r e s e n ts i t u a t i o no fi t sr e s e a r c h ,i t sb u i l d i n gt o o l sa n d s oo n t h eo n t o l o g yd e s c r i p t i o nl a n g u a g e sa n dd e s c r i p t i o nl o g i ca r ec o m b i n e d t o g e t h e r ,w h i c he n s u r e st h eo n t o l o g yr e a s o n i n gr a t i o n a l i t ya n dv a l i d i t y a sa b e f f e c t i v em e c h a n i s mo f k n o w l e d g er e p r e s e n t a t i o n ,d e s c r i p t i o nl o g i ci se x t e n s i v e l y a p p l i e dt ov a r i o u sf i e l d so f c o m p u t e rs c i e n c e t h ep a p e ra n a l y z e sd e s c r i p t i o nl o g i c i nt e r m so fi t sd e f i n i t i o n ,t h eb a s i cs y n t a xa n ds e m a n t i c ,a sw e l la si t ss y s t e m a r c h i t e c t u r ea n dt h er e a s o n i n gf u n c t i o na n di t sa l g o r i t h ma n ds oo i l b a s e do na n a l y z i n ge x i s t i n gs t a n d a r d so fw e bs e r v i c e sa n ds e m a n t i cw e b ,t h e p a p e ri n t r o d u c e ss e m a n t i cw e b s e r v i c et h a ti tp u t st o g e t h e rs e m a n t i cw c ba n dw e b s e r v i c e w i t h o u th u m a na s s i s t a n c e s ,i tw i l lr e a l i z ea u t o m a t i cw e bs e r v i c ed i s c o v e r y , a u t o m a t i cw e bs e r v i c ei n v o c a t i o n ,a u t o m a t i cw e bs e r v i c ec o m p o s i t i o n a c c o r d i n gt o s e m a n t i cw e bs e r v i c eo n t o l o g yn a m e do w l - sa n dw 曲s e r v i c em a t c h m a k i n g e n g i n e ,u d d ih a ss e m a n t i ci n f o r m a t i o n ,a n dt h es e r v i c em a t c h m a k i n g b a s e do n k e y w o r d si st r a n s f o r m e di n t ot h eo l l eb a s e do no n t o l o g yr e a s o n i n g m a t c h m a k i n g r e s u l t sa l eo r d e r e db yt h em a t c h m a k i n gg r a d e b a s e do i lt h ew o r ka b o v e ,t h ep a p e r i m p r o v e sw e bs e r v i c em a t c h m a k i n gb a s e do i lo n t o l o g yr e a s o n i n g o nt h eo n eh a n d a c c o r d i n gt ou s e r s q u e r yr e f i n e m e n t ,t h es y s t e ms u b m i t su s a n 3 m o r ec o n s i d e r a t e r e q u i r e m e n t st ot h em a t c h m a k i n ge n g i n e ;o nt h eo t h e rh a n d , b yg i v i n gt h ec o n c e p to f s e m a n t i ca f f i n i t ya n di t sf o r m u l a , i tu s e sn u m e r i c a lv a l u et os u b d i v i d et h e m a t c h m a k i n gg r a d e ,t op r o v i d em o r es i g n i f i c a t i v er e f e r e n c ef o rs e r v i c er e q u e s t e r s k e y w o r d s :o n t o i o g yr e a s o n i n g ;d e s o r j p t i o nl o g i c ;o w l - s :s e m a n t i c f f i n i t y = w e bs e r v i c e 哟t c h m a k i n g 独创声明 本人声明所呈交的学位论文是本人在导师指导下进行的研究工作及取得的研究成果。 据我所知,除了文中特别加以标注和致澍的地方外。论文中不包含其他人已经发表或撰写 过的研冗成果,也不包含未获得 l 建i 垫丛直基丝益翌挂墨9 壹盟 盟:奎拦亘窒2 或其他教育机构的学位或证书使用过的材料。与我一同工作的同志对本研 究所做的任何贡献均已在论文中作了明确的说明并表示谢意。 学位论文作者签名:镏澎羽签字同期;产多月弓同 学位论文版权使用授权书 本学位论文作者完全了解学校有关保留、使用学位论文的规定,有权保留并向国家有 关部门或机构送交论文的复印件和磁盘,允许论文被查阅和借阅。本人授权学校可以将学 位论文的全部或部分内容编入有关数据库进行检索,可以采用影印、缩印或扫描等复制手 段保存、汇编学位论文。( 保密的学位论文在解密后适用本授权书) 学位论文作者签名:衿彩翻 导师签字: 签字日期: 7 年月弓日 学位论文作者毕h k 唇去向 工作单位: 通讯地址: 纷建良 签字日期i 辟6 月6 日 电话 邮编 毕卜奉件拊删的w e b 麒j 心配州究 1 绪论 1 选题背景 现今w e b 上的信息基本都是用h t m l 或者x m l 来表示的,通过浏览器人们可 以很直观地获得网页中的信息,但是随着网上信息量的迅速膨胀,很多时候信息 的获耿并不容易,人们不得不做大量的关于知识的查找、收集、索引等工作。而 且目前,网络信息资源检索主要利用基于关键字的查询,不能处理复杂语义关系, 常常检索出大量与用户需求不相关的知识资源,因此,如何迅速、高效地检索和 访问各个领域的知识资源以促进知识的交流和共享成为一个急需解决的重要问 题,为此,t i mb e r n e r s - l e e 提出了语义万维网【1 ( s e m a n t i cw e b ) 的概念。在语 义网中,资源信息是共享的,是机器可理解的。为了让计算机能够理解和处理w e b 的内容,需要建立本体 2 1 ( o n t o l o g y ) ,并用本体描述语言对w e b 信息资源进行 语义上的描述。 在w e b 开放和异构的环境下,人们不能仅仅依靠手工来建立大规模的本体应 用。所以对于本体的应用来说,推理的作用就体现在辅助人们建立、维护和应用 本体这些方面。具体来说推理有验证本体定义的有效性,检测冲突,发掘概念之 问的联系,获取本体中表达的知识等功能。通过对描述逻辑1 3 1 ( d e s c r i p t i o nl o g i c ) 进行大量关于知识表达能力和推理的复杂性的研究,很多研究者认为描述逻辑 是一阶谓词逻辑的可判定子集,能够精确地刻画语义,从语义w e b 知识表示标记 语言的需求看,描述逻辑作为形式化基础是合适的。 随着电子商务的迅速崛起,w e b 应用从局部化发展到全球化,从b 2 c ( b u s i n e s s - w - c u s t o m e r ) 发展到b 2 b ( b u s i n e s s - t o - b u s i n e s s ) ,从集中式发展到分布 式。w e b 服务1 4 】在i n t o n e t 环境中提供了一种与平台、语言无关,而在机器与机 器之间可以共享数据和服务的模式。w e b 服务是一个崭新的分布式计算模型,是 w e b 上数掘和信息集成的有效机制。现有的行业标准u d d i 5 】提供了一种基于分 布式的商业泣j j j j 1c 、饥;乩进,亍服务描述文件的注册、管理和发现服务。 随着i n t e r n e t 中w e b 服务的数目和种类的增加,如何在诸多服务中找到符 合要求的服务,即服务匹配,成为利用w e b 服务进行资源共亨必须解决的问题。 当| j w e bs e r v i c e 并没有以语义网为基础,基本上采用同定的标准化分类方式来 墒十一- 体拊理的w e b 服务牲雕圳究 描述服务的功能、提供者以及获取服务的方式,由于w e bs e r v i c e 技术只在语法 层面上限定了服务描述所采用的协议,因此它们对服务的语义描述能力非常有 限,而且缺少必要的灵活性,使得在服务匹配时只能采用简单的关键字搜索方法, 显然不能满足服务匹配的需要。语义网的应用将对电予商务领域产生重要影响, 特别是语义w e b 服务引起国内外了众多研究人员的关注。 学术界在语义网的研究中提出了一些基于本体的服务描述语言如o w l 【6 j 等,这些语言为s e m a n t i cw e b 和w e bs e r v i c e 的结合提供了一个良好的契机。 w e b 服务匹配的研究目标是服务匹配的高效率和自动化,在服务匹配技术中,利 用语义描述和服务本体论是达到该目标的有效途径;所以我们需要研究的是如何 用一种明确的、计算机能够理解的语言描述服务,如何将语义w e b 、本体论和语 义推理应用到w e b 服务的查找和匹配中。 1 2 国内外研究现状 1 本体 虽然国际上关于语义w e b 的研究时间很短,但其发展却异常迅猛。在商业应 用领域,关于语义w e b 的研究更是如火如荼,如基于语义w c b 的互联网信息检索, 企业知识管理与工作流管理,及w e b 服务发现等。 本体层是当前语义w e b 研究的热点问题,当前的语义w e b 研究者都认为本体 层将为语义w e b 提供语义级的共享,是语义w e b 实现的关键所在。本体研究的热 点包括本体的管理、本体的适应、本体的映射和本体的推理。 1 ) 本体的管理( m a l l a g e m e n t ) 本体的主要目的是知识的共享与重用,因此一个典型的本体库系统要支持开 放式的存储与组织、标志和版本化。研究本体库如何存储和组织才能便于本体的 访问和管理;标志为每个本体给定一个唯一的标记符;本体是随时间而不断发展 的,所以需要有一个版本机制求保证不同版本本体的一致性。 2 ) 本体的适应( a d a p t a t i o n ) 因为本体l j ! n q 问而发展,所以如何扩展和更新现有的本体足一个重要的课 题。这包括在本体库中对本体进行搜索、编辑和推理。 3 ) 本体的映射( m a p p i n g ) 早十奉体拊理的w e b 服务p k 眦圳究 对异构的、分布式的本体要能够进行集成和互操作,而要实现这一点就要 对本体进行映射。 4 ) 本体的推理( r e a s o n i n g ) 很多专家研究认为描述逻辑是本体推理的逻辑基础,因此,描述逻辑的研 究就体现了本体推理的研究现状。 模糊描述逻辑( f u z z yd e s c r i p t i o nl o g i c ) 将描述逻辑与模糊逻辑结合起来, 发挥了模糊逻辑对模糊度以及不确定性进行处理的优势,为新一代的描述逻 辑提供了处理模糊概念的应用基础。 时念描述逻辑( t e m p o r a ld e s c r i p t i o nl o g i c ) 用时间约束的方法把状态、动 作和规划的表示统一起来,并结合描述逻辑,形成一个很好的知识表示方法。 动态描述逻辑( d y n a m i cd e s e r i p t i o nl o 百c ) 将描述逻辑和命题逻辑p d l 相 结合,较好地刻画了多主体系统模型。 在实际应用方面,许多工程在开展之中,比较有名的有:c y c 7 ,o n t o s a u r u s ;q , e n t e r p r i s e t r l ,k a c t u s 7 1 ,p l i n i u s t 7 1 ,p a n g l o s s 9 ,l o o m 8 1 ,0 r 岫w 曲【8 】, o n t o k n o w l e d g e t s 等。 2 语义w e b 服务的研究 由于传统的w e b 服务语义表达能力有限,且服务匹配一般是基于关键字匹配 或者模式匹配,匹配效率低下。而本体可以提供丰富的语义信息,因此,如果在 w e b 服务中引入本体技术,就可以解决语义问题。语义w e b 服务是以语义w e b 和本体论为基础的一个重要的应用基础研究领域。语义w e b 中,本体是描述文 档语义信息的工具,它可以定义w e b 服务的属性、功能、执行接口、服务执行 的先决条件和后置结果,这种增强w e b 应用和智能引擎的语义信息,使得应用 更加智能化,更加接近人类的概念思维。 目前,国内外在智能w e b 服务研究上主要着眼于两个方面:一方面是创建一 种计筇机之间可以能够相互理解的并能充分表示w e b 服务的内容、功能、属性、 接口以及规则和限制条件的语言;另方面是在这种语言基础之上提出一种使 w e b 服务之问能够实现自动发现、执行、合成以及交互的模型或体系结构。 d a m l s 0 1 ( d a r p aa g e n tm a r k u pl a n g u a g ef o rs e r v i c e ) 采用本体描述语言 d a m l + 0 i l t 描述w e b 服务,提供了足够的表示w e b 服务能力和特性的语义信 拱十奉休推_ l ! i ! 的w e b 服务世雕州究 息,目的是实现自动的w e b 服务发现、调用、合成和执行监控【1 5 】。 目前,关于语义w c b 服务匹配的研究成为一个热点,列举一些主要的研究: 美困c a r n e g i em e l l o n 大学的m a s s i m op a o l u c c i l 3 8 i 等人一赢致力于知识共 享和服务功能匹配的研究。 h p 实验室的j a v i 一垃1 对w e b 服务采用d a m l + o i l 语言+ 进行语义标注, 并提出一个服务匹配算法,同时还对当前著名的描述逻辑推理机f a c t 和r a c e r 在服务匹配中的应用进行了讨论和分析。 d c h a k r a b o r t y i 3 1 等人通过p r o l o g 推理语言实现基于服务描述内容的匹 配,并对其应用于移动商务领域进行了研究。 清华大学计算机系知识工程研究室对w e b 服务展| 丌高层次的研究和- 丌 发,包括半结构化信息智能处理模型t i p s i ( t h ei n t e l l i g e n t c ep r o c e s s o ro f s e m i s t r u c t u r e di n f o r m a t i o n ) ,同时还研制开发了个基于j 2 e e 和w e b 服务的旅游电子商务平台,用户能共享全世界上千家四星级以上标准酒 店的订房、订机票、租车等服务。 1 3 研究的主要内容 ( 1 ) 研究和总结了本体论的基本理论,如本体的基本要素、本体描述语言、 本体建设工具等。 ( 2 ) 深入研究了本体语言的基础描述逻辑的推理实现,并在此基础上探 讨了本体语言所具有描述复杂关系的能力。 ( 3 ) 利用描述逻辑强大的推理功能,研究了一种提高服务匹配效率的方法一 一查询重新定义的方法,即重新定义服务请求者的查询请求,而不要求请求者有 完全的领域知识,或者不需要请求者苦苦考虑提交的请求是否面面俱到,方便了 请求者,提高了服务匹配效率。并且把这种方法在网上选课系统中做了演示。 ( 4 ) 分 = f i 现宵w e b 毗务模型的丝础上,提出住w e b 服务中有效利用本体论 领域建模进行服务的概念建橙砂指导w e b 叽务r 、i 用的设计:存w e b 服务中有 效利用语义信息,进行w e b 服务和晤义w e b 的有机结合,进一步提高w e b 服 务的质量。 ( 5 ) 通过分析和比较现有服务描述模型中存在的问题,构建了基于本体推理 4 苹十奉体推理的w e b 舭务雌配埘究 的w e b 服务匹配模型,研究了如何在u d d i 中加入语义层,以及如何利用本体 推理实现语义匹配。 ( 6 ) 分析了基了:本体推理的w e b 服务匹配1 1 1 存在的不足,捉出语义相天度 及其算法,将本体推理、查询重新定义和语义相关度结合起来以提高服务匹配的 效率。 桀十奉休推剧的w e b 臌务匹雕圳究 2 语义万维网 2 1 语义w e b 体系结构 为了使w e b 上的资源能够被计算机理解和自动处理,b e m e r s 在 年_ l e e 2 0 0 0 1 2 月的x m l 2 0 0 0 会议上做了题为s e m a n t i cw e b 的演讲,对语义w e b 的概念做 了解释,并提出语义w e b 体系结构,如图2 1 所示。语义w e b 是国际互联网组 织w 3 c ( w o r l dw i d ew e bc o n s o r t i u m ) s 1 | 定的关于未来w e b 的一个蓝图。w 3 c 组 织的语义w e b 活动论坛在其宣言中指出:“语义w e b 是当前w e b 的一个扩展, 其中信息被注以明确定义的含义,有助于计算机之间及其与人之间的协同工作。 其思想是使w e b 上的数掘以这样一种方式来定义与链接,使其能够被机器用于 各种不同应用系统,而且可以实现数据的自动化处理、集成与复用。仅当w e b 成为不仅为人也为自动化工具所共享加工的场所方能实现其全部潜力。”语义 w e b 的目标是使得w e b 上的信息具有计算机可理解的语义,满足智能代理软件 对w w w 上异构和分布信息的有效访问和搜索。 层数名称描述 第一层u n i c o d e 和u r iu n i c o d e 处理资源的编码,u r i 负责标识资源。 第二层 x m u n s + _ 于表示数据的内容和结构 x m ls c h e m a 第三层 r d f + r d fs c h e m a 棚子描述w e b 上的资源及其类型 第四层o n t o l o g yv o c a b u l a r y 用于描述各种资源之间的关系 第五层 l o g i c 在卜面四层的基础上进行的逻辑推理 :作 第人层 p r o o f 第七层 t r u s t 图2 1s e m a n t i cw e b 的体系结构 x m l 使每一个人可以创建自己的标签来标注网页或者网页的部分文本。 x m l 允许用户为他们的文档添加结构信息,但并没说明这些结构的含义,所以 在语义w e b 摧j 中,x m l 只是为语义w e b 自:j 建立提供语法基础。 为了进一步说明语义w e b f ( , j 体系结构,给出如 - r d f ) _ | 。段: l a s s i l a 6 牡十奉体拇理的w e b 船务眺削州究 上述r d f 片段符合x m l 的语法,其目的是为了告诉计算机h t t p :w w w w 3 o r g h o m e l a s s i l a 的作者足l a s s i l a 。代码编写人员可能会用w r i t e r 或a u t h o r 或其 他的单涧七表示“作者”,那么机器如何理解不同词表示的足同一概念呢? 相似 的情况是:计算机如何理解同一个诃在不同情况下表示的是不同的概念( 即语义) 昵? l g 如某医院和某大学的w e b 页上都有 ,那么怎么判断它是代表医生 还是代表博士。综上,r d f 在处理语义上存在的问题是: 同一概念有多种词汇表示; 同一词汇有多种概念( 含义) 。 这些问题得依赖于本体( o n t o l o g y ) 得以解决。本体通过对概念的严格定义和 概念之间的关系确定概念精确含义,表示共同认可的、可共享的知识。通过定义 共享的、通用的领域知识,本体帮助人和机器明确的交流,支持语义级的交换, 而不仅仅是语法级的。因此在语义w e b 中,本体具有非常重要的地位,是解决语 义层次上w e b 信息共享和交换的基础。 逻辑层( l o g i c ) 提供了一种规则描述方法,逻辑主要通过能由计算机自动推 理的规则集来反映,这些规则集则通过各种机器可识别的逻辑描述语言表示出 来,从而便于推理。 目前有关语义网的研究主要集中在前三层的研究,对p r o o f 和t r u s t 这两部 分内容在概念上目前还没有一个成熟的说法。但语义万维网的研究者普遍认为 p r o o f 和t r u s t 是下一代力维网的重要概念,p r o o f 层主要计算机对其经过推理 所得的结论,自动给出一个合理的解释。由于w e b 所特有的- 丌放性,使得任何人 都能很方便的发布信息,因此,在语义网中还需要构建一个t r u s t 层,用以对资 源信息以及推理的可信度提供有效的衡量和评价。 2 2 本体的概述 2 2 1 本体的概念 o n t o l o g y 本来是哲学巾研究存在的- f - j 学科,近年来,o n t o l o g y 开始在人 工智能界引起研究人员的兴趣,并越柬越多地应用在w e b 信息的表示、组织与管 理上,一个蕈要原因就是因为当前对知识共享和知识交换的巨大需求。随着各种 苹十奉休推理的w e b 服务匹配岍究 已有的和将要丌发的w e b 应用系统的不断增多,人们希望不同的系统能够共享某 个共同公认的知识库或者词汇( 术语) 集合,提供统一的领域模型,这样就能够 极大地促进实现不同系统1 8 j 的数掘或知识共享、交换和复用。 最著名并被引用的最广泛的定义由g r u b e r 等人提出,“本体是共享概念模型 的明确的形式化规范说明”。这个定义体现了o n t o l o g y 的四层含义: 概念模型( c o n c e p t u a l i z a t i o n ) :通过抽象出客观世界中一些现象的相关概 念而得到的模型,其表示的含义独立于具体的环境状态; 明确( e x p l i c i t ) :概念及它们之白j 的联系都有明确的定义; 形式化( f o r m a l ) :o n t o l o g y 是计算机可处理的: 共享( s h a r e ) :o n t o l o g y 中体现的是共同认可的知识,反映的是相关领 域中公认的概念集,它所针对的是团体而不是个体的共识。 o n t o l o g y 的目标是捕获相关的领域知识,提供对该领域知识的共同理解,确 定该领域内共同认可的词汇,并从不同层次的形式化模式上给出这些词汇( 术语) 和词汇之间相互关系的明确定义。 2 2 2 本体的建模元语 本体有五个基本的建模元语,或者称为本体的五个基本元素: ( 1 ) 类( c l a s s e s ) 或概念( c o n c e p t s ) :指任何事物的抽象,从语义上讲,它表示的 是对象的集合。 ( 2 ) 关系( r e l a t i o n s ) :在领域中概念之间的交互作用,形式上定义为,n 维笛卡 儿积的子集:r :c l c 2 x c 3 xc l l 。如子类关系( s u b c l a s s - o f ) ( 3 ) 函数( f u n c t i o n s ) :一类特殊的关系。该关系的前n - 1 个元素可以唯一决定第 n 个元素。形式化的定义为映射f :c i x c 2 c 3 c n i c - i 。如函数m o t h e r - o f ( x ,y ) 表示y 是x 的母亲。 ( 4 ) 公理( a x i o m s ) :代表永真断吉。如:概念乙属于概念甲的范围。 ( 5 ) 实例( i n s t a n c e s ) :代表元素从语义上讲实例表示的就是对象。 本体的基本关系有4 种: p a r t o f 表达概念之i - 日j 部分与整体的关系。 k i n d o f :表达概念之问的继承关系,类似于面向对象的父类与子类的关 牡十奉体j f f :理的w e b 服井睢配究 系。给出两个概念c 和d 如果c 的所有实例都属于d ,则称d 是c 的父 概念,c 是d 的予概念。 i n s t a n c e o f 表达概念的实例与概念之州的关系,类似于面向对象种的对 象与类之| 日j 的关系。 a t t r i b u t e o f 表达某个概念是另一个概念的属性。如概念“姓名”是概念 “人”的一个属性。 图2 2 反映了一个计算机领域本体的关系结构图。 图2 2 一个计算机本体的简单结构图 在实际建模过程中,不一定要严格按照上述五类基本建模元语来构造本体, 概念之间的关系不限于上面列出的四种基本关系,可以根据领域的具体情况定义 相应的关系,以满足应用的要求。 2 3 本体描述语言 为使语义w e b 工作,计算机必须能够访问结构化的信息集合以及一套推理规 则并据此进行自动推理,因此必须首先提供w e b 上信息的合适的表示方法。现在 的w e b 是用h t m l 语言柬组织数据的,h t m l 提供了组织数据以一种普遍的方式 进行昆示的标准,其简币性促进了w e b 的快速发展,但其简荦倒:同时也限制了 w e b 的进一步发展。 基于h t m l 信息表达能力的不足,2 0 世纪9 0 年代仞,基于a i 的本体描述语言 被提出,代表性的有k if 【l6 1 、o n t o l i n g u a 1 ”、l o o m 、o c m l 1 ”、f l o g i c 【2 1 等。 堆十奉仆批脞的w e b 撇貉匹配州究 其中,k i f 是基于一阶逻辑的,o n t o l i n g u a 、o c m l 和f l o g i c 是基于框架和一阶逻 辑的,而l o o m 是基于描述逻辑的。后来。随着w e b 的发展,又出现了一系列基于 w e b ( q 本体语言也h q 本体标记语言1 2 0 】,如s h o e 、x o l 、r d f ( s l ,o i l 、d a m l + o i l ,o w l , o n t o l o g y 在语义w e b 研究领域的发展注入了活力。 本体语言使得用户为领域模型编写清晰的、形式化的概念描述,因此它应该 满足以下要求【6 l : 良好定义的语法( aw e l l d e f i n e ds y n t a x ) 良好定义的语义( aw e l l d e f i n e ds e m a n t i c s ) 有效的推理支持( e f f i c i e n tr e a s o n i n gs u p p o r t ) 充分的表达能力( s u f f i c i e n te x p r e s s i v ep o w e r ) 表达的方便性( c o n v e n i e n c eo f e x p r e s s i o n ) 2 3 1r d f ( s ) r d f ( s ) 是r d f ( r e s o u r c ed e s c r i p t i o nf r a m e w o r k ,资源描述框架) 和r d f s c h e m a 的合称。r d f 解决的是如何采用x m l 的标准语法无二义性的表述资源对 象的问题,使得所描述的资源的元数据( m e t a d a t a ) 信息成为及其可理解的信息。 元数据是一个由来已久的概念,它的具体含义是关于信息的描述性信息,可以将 它简单地理解为“关于数据的数据”。假设某网页的文本是“数据”,那么此网 页的作者、标题等信息就是这个网页的“元数据”,这是一个很典型的例子。元 数据一旦从原始内容中提取出来,就可以把它与原始的内容分开,单独对它进行 处理,从而大大简化了操作过程。 所有被r d f 描述和规范的信息和文档都成为资源。r d f 采用三元组( 资源, 属性,属性值) 来描述w e b 上的各种资源,属性表明了这些属性值和资源之间 的关系。属性值要么是一些被认为具有原子性的事物( 如字符串或者数字) ,要 么是其它资源。r d f 的元数据模型可以表示为一个有向标记罔,萁由节点和节 点之间带有标记的连接弧所组成,节点表示w e b 上的资源,弧表示这些资源的 属性。 1 0 堆十奉休j f i :理的w e b 服务吐雕圳究 幽2 3 一个r d f 模型 图2 3 是一个r d f 模型的例子。一个网页( h u p :1 w w w 3 c o r g h o m e l a s s i l a ) 由一个人( h t t p :w w w w 3 c o r g s t a f f l d 8 5 7 4 0 ) g i j 建,这个人的名字为o r al a s s i l a ,邮 件地址为l a s s i l a w 3 c o r g 。图2 3 的r d f 文档如下: o r al a s s i l a l a s s i l a w 3 c o r g 从上面的例子可以看到r d f 中两个重要的技术u r i 和x m l 。u r i 可唯一地标 识资源,而x m l 贝z j 定义了r d f 表示语法,以x m l 嵌套的形式定义的数据结构和 以r d f 三元组的形式来表示的数据关系,使语义、句法和结构得到了很好的统一。 但这种说明性的语言没有提供机制来描述属性,或说明属性和其他资源的关 系,因此提出了需要r d f 的词汇描述语言r d fs c h e m a ( r d f s ) 。r d f s 是在r d f 的蛙础上引进了类的概念、类之删的包含关系、鞲性之问的包含关系,以及属性 的定义域和值域。 r d f s 对r d f 原语的扩展可以分为3 类,核心类:r d f s :r e s o u r c e ,r d f s :p r o p e r t y , r d f s :c l a s s :核心属性:r d f s :t y p e ,r d f s :s u b c l a s s o f r d f s :s u b p r o p e r t y o f 核心约束: 璀j 二奉体批艘的w e b 服务匹雕州究 r d f s :c o n s t r a i n r e s o u r c e ,r d f s :c o n s t r a i n p r o p e r t y ,r d f s :r a n g e ,r d f s :d o m a i n 。 f a l l s :r e s o u r c e 是r d fs c h e m a 资源的总类,所有被f a l l s :r e s o u r c e 描述的对象都 是r d fs c h e m a 类的实例。r d f s :p r o p e r t y 和r d f s :c

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论