已阅读5页,还剩43页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
山东大学硕士学位论文 摘要 随着i n t e r n e t 的迅猛发展,w e b 上可获得的w e b 服务的急剧增多,如何从庞大 的服务群中有效地获得所需功能的w e b 服务成为了值得关心的问题。然而传统的 服务发现技术是在语法描述的基础上,通过关键词匹配来实现,由于缺乏对w e b 服务的语义信息的描述,智能化程度不高,无论在精确度还是在返回率上都无法 满足人们日益增长的需求。而语义w e b 的目的就是扩展当前的w e b ,使得网络中所 有信息都是具有语义的,是计算机能够理解和处理的。因此,基于语义的w e b 服 务发现逐渐成为了当前的研究热点。 本文总结了现有服务发现技术的优势,提出了一种基于语义距离的w e b 服务 发现算法,通过计算概念之间的语义距离来计算概念之间的相似度,通过概念之 间的相似度可以计算服务之间的相似度。为此,本文针对如下几个关键问题展开 研究: 语义距离算法的改进:概念之间的基本关系包括等价关系、继承关系、包含 关系和自定义关系,本文根据这些关系重要性的不同进行加权,在此基础上 进行概念之间语义距离的计算,使得概念语义距离的计算更加准确。 语义相似度的计算:基于语义距离的目的是为了进行相似度的计算,本文语 义相似度包括三种分别用于表示w e b 服务不同层次的匹配程度:概念相似度、 概念集合相似度、服务相似度,本文给出了这三种相似度的计算算法。 w e b h 艮务匹配算法:基于语义相似度的计算,本文提出了一种基于服务相似 度的匹配算法,该匹配算法采用两层匹配模型,首先对服务类别进行相似匹 配,再对服务的输入、输出进行相似度计算,最后对结果排序,将最佳结果 返回给服务请求者。 通过对本体概念间多种关系及其重要性的不同的考虑,使得概念相似度的计 算更加准确,提高了服务发现的准确率。 关键词:服务发现,语义距离,o w l s ,语义相似度 山东大学硕士学位论文 a b t r a c t w i t ht h ef a s td e v e l o p m e n to fi n t e r n e t ,t h eg r o w i n gn u m b e ro fw e b s e r v i c e sa v a i l a b l eo nt h ew e br a i s e sn e wa n dc h a l l e n g i n gs e a r c hp r o b l e m s : e f f i c i e n t l yl o c a t i n gf u n c t i o n a l i t y d e s i r e dw e bs e r v i c e sa m o n gn u m b e r so f w e bs e r v i c e s h o w e v e r ,t r a d i t i o n a lw e bs e r v i c ed i s c o v e r i n gt e c h n o l o g yi s d o n eb yk e y w o r dm a t c hb a s e do nt h es y n t a c t i cd e s c r i p t i o no fw e bs e r v i c e s u c hw e bs e r v i c ed i s c o v e r i n gt e c h n o l o g yc a nn o tc a p t u r et h es e m a n t i c i n f o r m a t i o no fw e bs e r v i c ea n di sl a c ko fi n t e l l i g e n c e t h ep u r p o s eo f s e m a n t i cw e bi st oe x t e n dt h ec u r r e n tw e b ,m a k e st h ei n f o r m a t i o no nt h e w e bs e m a n t ic a n du n d e r s t o o d ,m a n a g e d b ym a c h i n e s os e m a n t i c b a s e dw e b s e r v i c ed i s c o v e r i n gt e c h n o l o g yi sb e c o m i n gah o tr e s e a r c ht o p i c t h i sp a p e rm a k eas u m m a r yo fa d v a n t a g eo fe x i s t i n gs e r v i c ed i s c o v e r i n g t e c h n o l o g y ,p r o p o s e saw e bs e r v i c ed i s c o v e r ya l g o r i t h mb a s e do ns e m a n t i c d i s t a n c e ,w h i c hu s i n gs e m a n t i cd i s t a n c eo ft w oc o n c e p t sc o m p u t et h e c o n c e p ts i m i l a r i t y ,a n dt h e nu s i n gc o n c e p ts i m i l a r i t yc o m p u t et h e s i m i l a r i t yo fs e r v i c e ,f o rt h i s ,t h ef o l l o w i n gt h r e ep a r t sa r es t u d i e d i nt h i sp a p e r : i m p o r v e m e n ta l g o r i t h e mo fs e m a n t i cd i s t a n c e :t h eb a s er e l a t i o no f c o n c e p t si n c l u d ee q u a v a l a t i o nr e l a t i o n 、s u b s u m er e l a t i o n 、i n h e r i t a n c e r e l a t i o na n ds e l f d e f i n er e l a t i o n ,t h ep a p e rb a s e do nt h ed i f f e r e n c e o ft h i sr e l a t i o n ,g i v eas t r e n g t hf o re a c hr e l a t i o n ,a n dt h e nc o m p u t e t h es e m a n t i cd i s t a n c eo fc o n c e p t s ,m a k et h ec o m p u t i n go fs e m a n t i c d i s t a n c em o r ep r e c i s e l y t h ec o m p u t eo fs e m a n t i cs i m i l a r i t y :t h ep u r p o s eo fs e m a n t i cd i s t a n c e i sf o rt h ec o m p u t eo fs e m a n t i cs i m i l a r t i y ,i nt h i sp a p e r ,s e m a n t i c s i m i l a r i t yi n c l u d et h r e ek i n d so fs i m i l a r i t y :c o n c e p ts i m i l a r i t y 、 c o n c e p ts e ts i m i l a r i t y 、s e r v i c es i m i l a r i t y t h i sp a p e ra l s os h o wh o w t oc o m p u t et h i ss i m i l a r i t y i i 山东大学硕士学位论文 a l g o r i t h mo fw e bs e r v i c em a t c h :b a s e do nt h es e m a n t i cs i m i l a r i t y 。t h i s p a p e rp r o p o s eas e r v i c em a t c ha l g o r i t h m ,w h i c ha d o p tt w ol a y e rm a t c h m o d e l ,f i r s ti st h es e r v i c e c a t e g o r ym a t h c ,t h e ns e p e r a t ec o m p u t i n gt h e i n p u ta n do u t p u to fs e r v i c e s ,f i n a l l y ,s o r tt h em a t c hr e s u l t ,a n dp u t t h eb e s tr e s u l tt os e r v i c er e q u e s t b yt a k ei n t oa c c o u n tt h em u l t i p l er e l a t i o na n dt h ed i f f e r e n c eo f r e l a t i o ni m p o r t a n t c e ,m a k et h ec o m p u t i n go fc o n c e p ts i m i l a r i t ym o r e p r e c i s e l y ,t h e r e b yi n c r e a s i n gt h ea c c u r a t e l yo fs e r v i c ed i s e o v i n g k e y w o r d s :s e r v i c ed i s c o v i n g ,s e m a n t i cd i s t a n c e ,s e m a n t i cs i m i l a r i t y ,o w l s i i i 原创性声明 本人郑重声明:所呈交的学位论文,是本人在导师的指导下, 独立进行研究所取得的成果。除文中已经注明引用的内容外,本 论文不包含任何其他个人或集体已经发表或撰写过的科研成果。 对本文的研究作出重要贡献的个人和集体,均已在文中以明确方 式标明。本声明的法律责任由本人承担。 论文作者签名:盏整日期:2 二:刍 关于学位论文使用授权的声明 本人完全了解山东大学有关保留、使用学位论文的规定,同 意学校保留或向国家有关部门或机构送交论文的复印件和电子 版,允许论文被查阅和借阅;本人授权山东大学可以将本学位论 文的全部或部分内容编入有关数据库进行检索,可以采用影印、 缩印或其他复制手段保存论文和汇编本学位论文。 ( 保密论文在解密后应遵守此规定) 论文作者签名:蜇遣导师签名:弛日期:z 丝 山东大学硕士学位论文 基于语义距离的w e b 服务发现算法 第1 章绪论 1 1 研究背景 w e b 服务“。2 1 技术是随着互联网特别是w e b 技术的发展而出现并不断发展、成 熟,从集中式发展到分布式。w e b 服务作为一种新兴的w e b 应用模式,是一个崭新 的分布式计算模型,是w e b 上数据和信息集成的有效机制。在商务应用中,w e b 服务能够解决传统电子商务应用的高维护代价和更新代价问题,成为目前应用环 境中最为合理的解决方案。 随着互连网的广泛应用和高速发展,各种基于网络的w e b h 务如雨后春笋般 出现了,w e b 已从静态的页面的存储库发展到了今天的交互式的,自动的,智能 的w e b h 务的存储库。多个w e b 服务的协作能满足用户动态地、即时地提出的任务 执行,信息提供、商业交易的需要。w e b 服务为应用开发者和终端用户带来了前 所未有的优势。由于w e b 服务采用被广泛接受的标准女n s o a p 等,w e b 服务应用模式 简化了商业应用的开发和交互,实现了代码重用和松散耦合。此外,它还提供给 终端用户直观的浏览界面,使得他们来选择,设定和组装自己的w e b 服务。但是, 与此同时,用户面对表现形式和复杂性都可能不相同的服务,如何正确、高效地 从如此庞大的w e b 服务群中找到自已所需的服务则变得越来越具有挑战性。特别 地,w e b 数量的急剧增多,用户将面临大量功能相似的服务选择,如何从众多的 功能相似的w e b 服务中发现最佳服务成为当今w e b h 务的热点研究之一。而这些正 是w e b 服务发现的任务。因此,进行提高w e b 服务发现的能力的研究具有重要意义。 高效的w e b 服务发现技术成为用户有效利用w e b n 务的关键。为此,研究者们针对 提高w e b 服务发现高效性和准确性展开了研究。目前,基于w e b 服务发现的研究主 要体现在如下两个方面:( 1 ) 基于u d d i 扩充服务语义信息,以提供对服务发现的支 持:( 2 ) 在服务描述的基础上研究支持智能化的语义匹配,以提供对服务准确定 位。 1 2w e b 服务发现 所谓w e b 服务发现,就是用户或程序以某种方式在不同类型的w e b 服务中找到 其需要的服务,以执行w e b 服务请求,w e b 服务发现是w e b 服务系统架构中的一个 山东大学硕士学位论文 重要部分。w e b 服务发现整个过程由如下四个步骤组成如图卜1 所示 圈卜1w e b 服务体系结构 服务提供者描述其提供地服务( 服务描述) 。 服务提供者将服务在服务注册中心注册,把服务描述发布( 服务发布) 。 服务请求者通过a p i 向服务注册中心寻求它所需要的服务( 服务请求) 。 服务注册中心把服务请求与已注册的服务进行匹配,把匹配结果返回给服务 请求者( 服务匹配) 。 为了达到高效性,整个发现过程必须达到一些基本的需求。接下来,我们来 分析一下上面提到的服务发现过程中四个步骤的各自的基本需求: 服务描述需求 对服务的分类,发现和使用而言,w e b 服务的功能的描述是很重要的。服务 描述应该包括服务的功能性的属性描述和非功能性的属性描述。服务描述需要能 被人工和机器理解,这意味着服务描述语言应该能用语义和语法的表示方式来描 述w e b 服务功能性的,非功能信息,描述语言应该支持基于描述的推理。例如: 我们想要找一个预定服务,我们希望我们的请求与任何提供旅店预定的服务进行 匹配。一种可行的方法就是使用本体。本体包含了对领域中基本概念以及它们之 间关系的计算机可使用的定义。本体用于人之间,数据库之间和应用之间的领域 信息的共享。 服务发布需求 服务发布是服务提供者把对服务的描述向其服务注册中心注册服务( 发布 ) ,因而能被广泛使用的基本步骤。它提供了服务共享的平台,因而需要建立一 个全球化的、与平台无关的、开放式的架构以共享信息,共享应用。u d d i 是一种 解决方案。它是一套基于w e b 的、分布式的、为w e b 月及务提供信息注册和查询的 山东大学硕士学位论文 实现标准规范,u d d i 注册中心为w e b h 务提供了一个良好的服务发布、维护和管 理环境,受到业界的深厚的支持。 服务请求描述的需求 服务请求描述是服务发现过程重要的一部分,必须能描述服务的功能。为了 能使服务请求与广告服务能在共享语义基础上进行匹配,遵循与服务发布时的相 同的服务描述规范。 服务匹配需求 服务匹配过程是在服务描述的基础上,对服务请求与已发布的服务描述进行 匹配。因此,为了提供服务匹配能力,需要利用服务请求描述和广告服务描述中 的属性的语义和语法信息基础上,以准确和高效性为目标,进行智能化的匹配。 1 2 1w e b 服务发现所面临的问题 目前在w e b 服务的描述和匹配方面,仍然存在着许多技术缺陷,制约着w e b 服务的准确、高效的发现。主要体现在以下一些方面: 以语法性语言表达的w e b 服务,主要是面向人直接阅读的,不利于计算机直 接阅读和处理; 不同团体对同一领域事物的认识和表示往往不同,使得来自服务提供者与 服务请求者关于同- - w e b 服务的描述存在着冲突,这种认识上的差异所产生的描 述述差异可被称作语义异构,具体表现在:( 1 ) 不同的服务描述使用多种术语表 示同一概念:( 2 ) 同一概念在不同的服务描述中表达不同的含义:( 3 ) 各服务描述 使用不同的结构来表示相同( 或相似) 的信息; 以关键字匹配的方式为主的检索,根据发布服务描述中是否包含请求查询中 的关键词来返回结果,由于许多不相关的服务也会在它的描述中包含查询关键 词,检索的结果往往会出现很多不相关的w e b 服务,随着服务数量的增大,检索 的准确率就越低。同时这种关键字匹配的方法,查询关键词与广告服务描述中的 关键词可能是语义相同但是非语法相同的,遗漏了大量与检索概念同义或相关的 内容信息,因此检索在查全率方面不高,难以达到期望效果; 服务的检索只是对服务功能描述的关键词匹配,无法充分反映服务所提供 服务的功能信息,造成服务检索结果不理想; 山东大学硕士学位论文 12 2 语义方法的提出 为了解决上面提出的服务发现所面临的问题,可以使用语义方法来描述w e b 服务的功能信息和非功能信息,这也是实现智能服务发现的要求。 信息在各个方面有所不同,其中的一个区别就是,有些信息是主要提供给人 使用的,而有些则主要是给机器用的。为计算机所使用的文档加入意义,就可以 把w e b 变成一个语义网。所以语义网并非独立的另一个w e b ,而是现在的w e b 的一 个延伸。在其中,如w e b 服务等信息具有定义完好的含意,则将利于机器之间、 人机之间的合作。计算机将会有能力发现数据的语义含义。这种基础研究的最终 结果就是能够刺激开发自动化的网络服务,完成一些例如w e b 服务发现等复杂的 任务。 语义w e b 提供以下两方面的作用: ( 1 ) 提供了本体( o n t o l o g y ) ,起着共享知识库( s h a r e dk n o w l e d g eb a s e s ) 或统一 词典( u n i v e r s a ld i c t i o n a r i e s ) 的作用。这就能实现仅使用x m l 技术所不能实现 的w e b 服务功能描述。o n t o l o g y 是描述概念及概念之间关系的概念模型,通过概 念之间的关系来描述概念的语义。 ( 2 ) 提供了一套逻辑以进行推理,以o n t o l o g y 中的术语来构成更加复杂的概念, 并相互作用。 1 2 3 研究现状 最早为发现w e b 服务而增加语义信息的是d a m l s 。1 。o w l s “j5 1 是在d a m l s 的 基础上发展起来的。o w l s 采用o w l 描述w e b 服务,提供了足够的表示w e b 服务能力 和特性的语义信息,目的是实现自动的w e b 服务发现、调用、合成和执行监控。 目前,许多研究都是基于o w l s 展开的,如语义表示的研究,服务绑定 的研究”1 ,基于本体的服务匹配的研究,o w l s $ 口u d d i 相结合的研究等。,”1 。其 中将o w l s 与u d d i 相结合,补充u d d i 的w e b 服务表示语义,增强服务发现能力,是 服务最佳发现的一种趋势。在当前存在的研究中,主要分为两类: ( 1 ) 实现o w l s 本体描述信息至i u d d i 的映射,补充u d d i 的w e b 服务语义描述能力, 通过将d a m l - s 概要信息映射到u d d i 注册库中,来补充w e b 服务描述语义。1 ”1 : ( 2 ) 基于o w l 扩展w s d l 模式,并基于扩展的w s d l 实现w s d l 到0 w l s 本体的映射,再 将语义信息扩展到u d d i 中。o w l s 服务概要信息全面地描述了服务,是服务发现 的依据。采用将o w l 本体扩展到w s d l 模式的方法补充w e b 服务的语义描述信息,其 山东大学硕士学位论文 扩展的信息类似于o w l - s 中的s e r v i c e g r o u n d i n g 描述,强调的是从w e b , q 务描述的 多个操作中发现恰当的操作“。 1 3 研究内容 基于语义的w e b 服务发现主要包括两个关键技术: 如何利用语义表示w e b 服务,即语义w e b 服务的描述模型,主要是如何描述 w e b 服务的功能性信息。 如何利用语义改进w e b 服务发现策略,使得基于语义的w e b 服务在查准率和 查全率方面比传统的基于关键字的发现机制更加符合用户的需求,即如何进 行基于语义的w e b 服务的匹配。 本文总结了现有服务发现策略的优势,提出了一种基于语义距离的w e b 服务 匹配算法,基本思想: 1 ) 基于语义计算请求服务和发布服务的语义相似度,2 ) w e bj 务通过一系列 概念集合进行描述的,因此计算服务的语义相似度,可以通过计算概念集合的相 似度来获得,首先应该计算两个概念的语义相似度,3 ) 而计算概念间语义相似度 的方法是,将两个概念映射到本体后,计算概念之间的语义距离,语义距离越大, 相似度越小,语义距离越小,相似度越大。为此,本文针对如下几个关键问题展 开研究: 语义距离的计算 本体通过概念与概念之问的关系来表示语义,本体基本的关系包括等价关 系、继承关系、包含关系( 整体部分关系) 和自定义关系,本文根据这些关系重要 性的不同进行加权,在此基础上进行语义距离的计算。 语义相似度的计算 基于语义距离可以进行相似度的计算,本文语义相似度包括三种分别用于 表示w e b 服务不同层次的匹配程度:概念相似度、概念集合相似度、服务相似度。 本文给出了这三种相似度的计算算法。 w e b h 务匹配算法 基于语义相似度的计算,本文提出了一种基于服务相似度的匹配算法,该匹 配算法采用两层匹配模型,首先对服务类别进行相似匹配,再对服务的输入、输 出进行相似度计算,最后对结果排序,将最佳结果返回给服务请求者。 山东大学硕士学位论文 原型系统的实现 本论文最后在采用上述各部分研究内容的基础上,给出一个基于语义的w e b 服务发现原型系统的实现,为本文的研究提供了试验条件。 1 4 论文组织 本文其余内容的组织如下: 第二章,主要介绍了本文中需要用到的相关技术。 第三章,语义相似度计算,包括语义距离计算算法及概念相似度、概念集合相似 度的计算算法。 第四章,w e b 服务匹配算法,基于语义相似度的计算,本文提出了一种基于服务 相似度的匹配算法,该匹配算法采用两层匹配模型,首先对服务类别进行相似匹 配,再对服务的输入、输出进行相似度计算,最后对结果排序,将最佳结果返回 给服务请求者。 第五章,介绍了本文的研究背景i p v i t a ,以及基于本文提出的w e b 服务匹配算法 的一个原型系统。 第六章,结束语,对本文的工作进行了总结并对今后的工作进行展望。 山东大学硕士学位论文 第2 章相关技术介绍 目前w e b 在信息表达和检索方面的缺陷,主要在于它的设计目的是面向用户直 接阅读和处理的,没有提供给计算机可读的语义信息,所以限制了计算机在信息 检索中自动分析处理以及进一步智能处理信息的能力。而语义w e b 作为一项面向 因特网应用的通用技术,语义网的设计目标是为实现因特网上的信息提供具有机 器可以理解的语义信息,为解决上述因特网发展在信息表达和检索方面存在的瓶 颈问题提供了新的思路和处理手段。因此,将语义网的相关技术应用到w e b 服务 发现中,使w e b 务的描述以一种语义清晰的方式表达,提高服务定位的准确率, 实现更高程度的智能化服务匹配。在服务发现技术中,利用语义描述是达到该目 标的有效途径。 本章主要介绍语义w e b 、本体论技术以及w e b n 务的本体描述语言o w l - s 。 2 1 语义w e b 2 1 1 语义w e b 概述 语义w e b 是由w w w 的创始人t i mb e r n e r s l e e 作为第二代w e b 的概念提出来的, 在文献“2 1 中给出这样的解释:“语义w e b 是现在的w e b 的一种扩展,在其上信息被 给予明确定义的含义,使得计算机和人类更好地协同工作”。简而言之,语 义w e b 基于这样一种思想:w e b 上定义和链接的数据不应该仅仅是为了格式上的显 示,使人更容易理解,而且可以在各种应用程序中让机器也能够理解,并自动进 行相应处理。语义w e b 的目标就是通过向数据中添加机器可理解的语义,以及使 用使用启发性的元数据来将w e b 上的海量信息以一种机器可理解的方式组织起 来,以满足w e b 应用对数据互操作性的要求。语义w e b 主要实现以下目标: 表达意义:将w e b 资源的含义以一种结构化的形式表达出来,改变目前w e b 内 容面向人工处理的表示方式,使计算机能自动处理w e b 的语义,理解其含义, 能代替人类自动处理信息,从这个角度看,语义w e b 集成了w e b 的普遍性和尽 可能分散的特点: 知识表示:与人工智能中的知识表示有联系也有很大的区别,其中重要的不 同点是传统知识表示是集中式控制的,也即概念定义是全局的,这种方式无 法适应w e b 高度分布式的结构。语义w e b 针对w e b 的特点提出了基于o n t o l o g y 山东大学硕士学位论文 的知识表示,能很好的支持高度分布式应用如w e b 服务描述与发现; 本体论( o n t o l o g y ) ( 概念知识说明) :本体论是语义w e b 的基础,它是用来描述 语义信息的元数据的元数据。在语义w e b 中,人们都可以定义自己的语义表 述,但是在与其它服务交互时需要有一种机制声明所定义的概念,否则就不 可能解释元数据的含义。本体论定义了对象的类以及这些类间的关系,还定 义了推理规则,以文档的形式随语义描述一起发布,已经发布的本体论语言 标准是o w l ; 知识的演化:语义w e b 中人们可以很方便的根据自身需要定义概念知识,而语 义w e b 规定了统一的语义标记语言,可以将这些层出不穷的概念组织在一起, 大大加快w e b 女h 识的优化和更新。 21 2 语义w e b 结构 下面简要的讨论语义w e b 的结构。正如本章前面所述,目前w e b 所面临的问题 主要是元数据信息的处理及语义的缺乏,导致 w e b 的信息只是机器可读的,而 不是机器可理解的。语义w e b 的目的就是要提供一种具有语义支持的计算平台, 这样可以以一种机器可以处理的方式来表示和处理信息。语义w e b 是一种逻辑上 一致的数据,是一种体系结构,语义w e b 的体系结构如图2 1 所示“: 图21 语义w e b 的体系结构 山东大学硕士学位论文 在语义w e b 的分层结构中,u n i c o d e $ 口u r i 是整个语义化w e b 的语法表示基础, u n i c o d e 提供了资源编码,而u r i 用于标识资源。第二层x m l + x m l n s + x m l s 提供了 表示数据内容和结构的语法:第三到第五层是语义化w e b 提供语义交互支持的核 心,其中r d f m s + r d f s 提供了描述w e b 资源的数据模型及类型原语,这样可以表示 论断、定义模式,而o n t o o g y 层是在r d f s 基础上定义的概念和关系抽象描述,用 于描述应用领域的知识,而第五层主要定义逻辑描述原语,为更高层的逻辑推理 提供语义上的支持。第六和第七层主要是在下面各层提供的功能基础上进行逻辑 推理、证明等操作。 x m l 与r d f 都能为所描述的资源提供一定的语义,但在处理语义上存在两个 问题( i ) 同一概念有多种词汇表示:( 2 ) 同一个词有多种含义( 概念) 。为了解决这 两个问题,很自然地需要引入本体论。本体论通过对概念的严格定义和概念与概 念之间的关系来确定概念的精确含义,从而表示共同认可的、可共享的知识。因 此在语义w e b 中,本体论具有非常重要的地位,是解决语义层次上w e b 信息共享和 交换的基础。 2 2 本体论 22 1 本体定义 本体论最早是一个哲学的范畴,后来随着人工智能的发展,被人工智能界给 予了新的定义。然而最初人们对o n t o l o g y 的理解并不完善,这些定义也处在不断 的发展过程中,比较有代表性的定义“”如下: 范畴 提出时间提出人 定义 客观存在的一个系统的解释和说明, 哲学 客观现实的一个抽象本质 1 9 9 1 n e c h e s 等给出构成相关领域词汇的基本术语 和关系,以及利用这些术语和关系构成的 规定这些词汇外延的规则的定义 计算机 1 9 9 3 g r u b e r概念模型的明确的规范说明 1 9 9 7 b o r s t共享概念模型的形式化规范说明 1 9 9 8 s t u d e r共享概念模型的明确的形式化规范 说明 山东大学硕士学位论文 最后一个定义的说明体现了本体论的四层含义: 1 ) 概念模型( c o n c e p t u a l i z a t i o n ) :通过抽象出客观世界中一些现象 ( p h e n o m e n o n ) 的相关概念而得到的模型,其表示的含义独立于具体的环境状态: 2 ) 明确( e x p l i c i t ) :所使用的概念及使用这些概念的约束都有明确的定义; 3 ) 形式化( f o r m a l ) :o n t o l o g y 是计算机可读的; 4 ) 共享( s h a r e ) :o n t o l o g y 中体现的是共同认可的知识,反映的是相关领域中公 认的概念集,它所针对的是团体而不是个体。本体论的目标是捕获相关的领域的 知识,提供对该领域知识的共同理解,确定该领域内共同认可的词汇,并从不同 层次的形式化模式上给出这些词汇( 术语) 和词汇之间相互关系的明确定义。 2 22 建模原语 对于语义w e b 而言,用分类法组织的本体论最有意义,p e r e z 等人用分类法组 织了本体论,归纳出5 个基本的建模元语: 1 ) 类( c l a s s e s ) 或概念( c o n c e p t s ) :指任何事务,如工作描述、功能、行为、策 略和推理过程。从语义上讲,它表示的是对象的集合,其定义一般采用框架结构, 包括概念的名称,与其它概念之间的关系的集合,以及用自然语言对概念的描述: 2 ) 关系( r e l a t i o n s ) :在领域中概念之间的交互作用,形式上定义为n 维笛卡儿 积的子集:r :c 1 c 2 c n 。如子类关系( s u b c l a s s - o f ) 。在语义上关系对 应于对象元组的集合: 3 ) 函数( f u n c t i o n s ) :一类特殊的关系。该关系的前n 一1 个元素可以唯一决定 第n 个元素。形式化的定义为f :c l c 2 x c n 一1 一c n 。如m o t h e r o f 就是一个函 数,m o t h e r o f ( x ,y ) 表示y 是x 的母亲: 4 ) 公理( a x i o m s ) :代表永真断言,如概念乙属于概念甲的范围; 5 ) 实例( i n s t a n c e s ) :代表元素。从语义上讲实例表示的就是对象。 另外,从语义上讲,基本的关系共有4 种: 山东大学硕士学位论文 关系名 关系描述 p a r t o f 表达概念之间部分与整体的关系。 k i n d o f 表达概念之间的继承关系,类似于面向对象中的父类 与子类之间的关系。 i n s t a n c e o f 表达概念的实例与概念之间的关系,类似于面向对象 中的对象和类之间的关系。 a t t r i b u t e o f 表达某个概念是另一个概念的属性。如“价格”是桌 子的一个属性。 在实际建模过程中,概念之间的关系不限于上面列出的4 种基本关系,可以 根据领域的具体情况定义相应的关系,例如可以定义同义词关系。 2 23 本体语言 本体通常使用基于逻辑的语言来表达,于是详细性、准确性、一致性、健壮 性和明显的区别能够在类、属性和关系之间达到。一些本体工具能够使用本体来 执行自动的推理,因此可以用来向智能的应用提供高级的服务,比如:概念上 语义的查找和检索、软件a g e n t s 、决策支持、语音和自然语言理解、知识管理、 智能数据库和电子商务等。 语义w e b 中的本体作为一种描绘文档语义的方式,使这些文档的语义能够被 w e b 应用和智能a g e n t 所使用。使用本体来构造和定义当今正在聚集和标准化的元 数据术语是非常有用的,明天的应用将是更加智能的,在这种意义上它们能够达 到人类的概念层次上。 本体对于那些想要查找或者合并分散信息的应用是非常关键的。虽然x m l d t d 平h x m ls c h e m a 对于在两个遵守预先定义的协议的应用是足够的,但是由于它们缺 乏语义使得机器难以利用新的x m l 词汇来执行任务。同样的术语在不同的上下文 可以具有不同的意思,不同的术语可以被用来表达相同的意思。r d f 和r d fs c h e m a 通过允许联系与标识符的简单语义来着手处理这个问题。使用r d fs c h e m a ,一个 人能定义具有多个子类和超类的类,定义具有子属性、领域和范围的属性。在这 种意义上,r d fs c h e m a 是一种简单的本体语言。然而,为了达到在众多独自发展 和管理的模式之间的交互操作,丰富的语义是必须的。例如,r d fs c h e m a 不能定 义p e r s o n 并h c a r 类是不相交的,或者一支四重唱曲刚好有四个音乐家作为成员的。 这就是为什么必须在r d fs c h e m a 之上引入本体层的原因。 o w l 全称w e bo n t o l o g yl a n g u a g e ( w e b 本体语言) “1 ,是w 3 c 推荐的语义互联 山东大学硕士学位论文 网中本体描述语言的标准。它是从欧美一些研究机构的一种结合性的描述语言 d a m l 十o i l 发展起来的,结合了d a m l 十o i l 设计和应用中得到的经验教训。其中 d a m l 来自美国的提案d a m l o n t ,o i l 来自欧洲的一种本体描述语言。 o w l 通过提供一个具有形式语义的附加词汇表,使得它比e 自x m l 。r d f ; i r d f s c h e m a 支持的w e b p q 容更具有机器可解释性。o w l 采用面向对象的方式来描述领域 知识,即通过类和属性来描述对象,并通过公理( a x i o m s ) 来描述这些类和属性的 特征和关系。 对于语义w e b 来说,并不是所有的应用都需要完备的逻辑推理,可能只用到 逻辑模型的一个子集。o w l 的设计就体现了这个思想,针对不同的需求有三个表 述能力递增的子语言,描述如下: 子语言o w ll i t e 是o w l 中相对容易实现部分的子集合,只提供了层次分类和 简单的约束功能,用于提供给那些只需要一个分类层次和简单的属性约束的 用户。 子语言o w ld l 提供了大部分o w l 词汇支持和r d f s 支持,并在语义上等同于描 述逻辑d l ( d e s c r i p t i o n l o g i c s ) 。它支持那些需要在推理系统上进行最大程 度表达的用户, 这里的推理系统能够保证计算完备性( c o m p u t a t i o n a l c o m p l e t e n e s s ,即所有地结论都能够保证被计算出来) 和可决定性 ( d e c i d a b i l i t y ,即所有的计算都在有限的时间内完成) 。它包括了o w l 语言 的所有约束,但是可以被仅仅鼍于特定的约束下。 子语言o w lf u l l 描述包括所有的o w l 词汇和r d f s 提供的原语,能够提供最大 程度的知识描述能力,但是由于过于复杂,且还不成熟,因此还在不断的更 新中。它支持那些需要在没有计算保证的语法自由的r d f 上进行最大程度表 达的用户。它允许在一个o n t o l o g y 在预定义的( r d f ,o w l ) 词汇表上增加词汇, 从而任何推理软件均不能支持o w lf u l l 的所有属性。 2 3o w l = s o w l s 。1 是使用w e b 本体论语言o w l 定义的一种w e b 服务的本体,它为w e b 服务 提供了核心的标记语言结构,用于精确描述w e b 服务的属性和能力,这些描述能 被计算机无二义的解释理解,这样就可以实现服务的自动发现、执行、组合、互 操作及执行监控。o w l - s 主要定义t w e b 服务三个方面的语义,如图2 2 所示:类 s e r v i c e 提供了声明w e b 服务的基础,每个服务都将对应为s e r v i c e 类的一个实 山东大学硕士学位论文 例:p r e s e n t s ,d e s c r i b e d b y 和s u p p o r t s 是s e r v i c e 类的三个属性:类 s e r v i c e p r o f i l e ,s e r v i c e m o d e l 和s e r v i c e g r o u n d i n g 分别为其可取值,它们的细 节因服务的不同而不同。 从图2 - 2 中可以看出,o w l 。一s 本体论主要包括三个类: s e r v i c e p r o f i l e :对应商业层面,即描述服务是干什么的。它向寻找服务的 请求者提供服务的抽象描述从而使其能够判断该服务是否满足需要,通常作 为广告发布在服务目录中;同时,服务请求者也可将s e r v i c e p r o f i l e 作为表 达服务发现条件的语言,从而使得服务发现过程中的匹配能够更加方便。 s e r v i c e p r o f i e 描述服务的三个基本方面:服务提供者的信息、服务的功能 和服务的其他特征:( a ) 服务提供者的信息主要是其联系方式:( b ) 服务的功 能通过描述服务执行的状态转变来表达,具体地讲,首先它指定了服务所需 的输入和产生的输出;另外,由于服务执行前某些外部条件可能需要满足, 而服务执行后一些条件将发生变化,因此这方面的描述还包括服务所需的前 置条件以及服务执行的结果;( c ) 服务的其它特征包括各种有关该服务的信 息,如服务类属或分类法、服务质量信息、扩展或自定义服务参数,如最大 响应时间、服务可及的地理范围等。 图2 2w e b 服务的上层本体 s e r v i c e m o d e l :基于过程描述服务是如何工作的。这使得搜索服务的请求者 能够:( a ) 做进一步深入的分析以判断服务是否满足需求;( b ) 把多个服务的 描述组合起来完成特定的任务:( c ) 在服务执行时协调各参与者的活动;( d ) 监控服务的运行。个过程可以具有任意多的输入、输出、先验条件和结果。 山东大学硕士学位论文 过程被分为原子过程( 可直接调用,无子过程) 、简单过程( 不可直接调用, 可被认为没有子过程,用作某些原子过程的视图或者复合过程的简单表达) 和复合过程( 由子过程组成) 。控制结构包括序列( s e q u e n c e ) 、并发 ( c o n c u r r e n t ) 、分支( s p l i t ) 、分支连接( s p l i t + j o i n ) 、乱序( u n o r d e r e d ) 、 选择( c h o i c e ,i f t h e n e l s e ) ,循环( r e p e a t u nt i l w h i l e ) 等。 s e r v i c e g r o u n d i n g :对应技术层面,描述如何访问服务,包括网络协议、消 息格式、串行化、传输和编址等。在这个层面通过指向w s d l 扩展文档,重用 已有的服务描述,实现服务调用和集成。 由于基于语义的w e b 服务发现主要利用s e r v i c e p r o f i l e ,所以下面将着重介绍 s e r v i c e p r o f i l e ,如图2 - 3 所示,服务的p r o f i l e 为服务及其提供者提供了高级 描述,它通常包含三种类型的信息: 对服务及其提供者的描述; 服务的功能性行为描述 为自动的服务选择而定义的服务的功能性属性描述 图2 - 3 服务p r o f i l e 上层本体 山东大学硕士学位论文 2 3 2 服务及其提供者的描述 服务及其提供者信息提供可供人工阅读的信息,包括s e r v i c e n a m e , t e x t d e s c r i p t i o n 和c o n t a c t l n f o r m a t i o n - - 个元素。s e r v i c e n a m e 指定了s e r v i c e 的名称,可以作为其标识。t e x t d e s c r i p t i o n 提供t s e r v i c e 的简要描述,一般总 结其功能,描述所需要的输入以及编写者希望请求者知道的其它信息。 c o n t a c t i n f o r m a t i o n 指定了s e r v i c e 提供者给出的个人或者其它形式的
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
评论
0/150
提交评论