(计算机科学与技术专业论文)语义web服务语义匹配算法的研究与实现.pdf_第1页
(计算机科学与技术专业论文)语义web服务语义匹配算法的研究与实现.pdf_第2页
(计算机科学与技术专业论文)语义web服务语义匹配算法的研究与实现.pdf_第3页
(计算机科学与技术专业论文)语义web服务语义匹配算法的研究与实现.pdf_第4页
(计算机科学与技术专业论文)语义web服务语义匹配算法的研究与实现.pdf_第5页
已阅读5页,还剩61页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

语义w e b 服务语义匹配算法的研究与实现 摘要 随着互联网技术与应用的迅速发展,w e b 服务作为一种新兴的 w e b 应用模式及远程访问标准,很好地解决了异构平台上的数据和应 用的整合与共享问题。但是w e b 服务的增多,给在海量的w e b 服务 中准确而有效地找到满足需求的服务带来了很大困难。传统的w e b 服务发现机制主要是基于关键字匹配,缺乏机器可理解的语义信息, 使得服务发现的查全率、查准率偏低,无法实现智能化搜索。因此需 要引入机器可以理解的语义信息,在基于语义的基础上,如何提供更 准确、效率更高的语义w e b 服务匹配算法和机制以快速找到相关的 w e b 服务,成为一个亟待解决的问题。 通过语义相似度算法的研究,本论文提出了一种全面考虑本体间 关系的单概念相似度算法和多概念相似度算法。通过对本体间继承关 系和属性关系的预处理,可以高效、准确地计算本体概念之间的相似 度,简单明了地区分各个w e b 服务与用户请求的符合程度。同时在 服务功能性要求满足的基础上加入基于用户兴趣模型的用户偏好匹 配算法,并按照综合相似度大小依次输出相关服务。为了减小对不相 关服务的相似度的计算量,本论文提出了分阶段进行过滤的匹配机 制,较大的提高了w e b 服务匹配的效率。 最后,本论文设计并实现了多层次的语义w e b 服务匹配系统。 该系统在旅游领域的测试数据验证了基于相似度排序并分阶段过滤 的语义w e b 服务匹配机制在提高查准率、降低语义w e b 服务匹配的 响应时间方面都具有很好的效果。 关键字:语义w e b 服务、语义匹配、相似度、本体、用户偏好 t h es t u d ya n di 卫仰l e n n t a t i o no fs e n t i c m a t c h i n ga l g o r i t h m si ns e 【a n t i c 、砸b s e r c e s a b s 。l 。上认c i a san e w 肫6 a p p l i c a t i o nm o d e la n dr e m o t ea c c e s ss t a n d a r d 。腑6 s e r v i c ei sap e r f e c ts o l u t i o nt oi n t e g r a t i n ga n d s h a r i n gt h ed a t aa n d a p p l i c a t i o nf o r mh e t e r o g e n e o u sp l a t f o r m sw i t ht h er a p i dd e v e l o p m e n to f i n t e r n e tt e c h n o l o g ya n da p p l i c a t i o n s 。b e c a u s eo ft h ei n c r e a s eo f 缪砀 s e r v i c e s ,h o w e v e r , i tm a k e sm o r ed i f f i c u l t t ol o c a t e t h es e r v i c e s a c c u r a t e l ya n de f f i c i e n t l yt h a tm a t c hc l i e n t sr e q u i r e m e n t s t r a d i t i o n a l w e bs e r v i c e s d i s c o v e r ym e c h a n i s mi sm a i n l yb a s e do nk e yw o r d s c o m p a r i n g t h el a c ko fm a c h i n e - u n d e r s t a n d a b l es e m a n t i ci n f o r m a t i o n l e a d st ol o wr e c a l lr a t i oa n dl o wp r e c i s i o n i n t e l l i g e n ts e a r c hc a n tb e a c h i e v e d t h e r e b yh o wt op r o v i d e am o r ee f f e c t i v ea n de f f i c i e n t m a t c h m a k i n gm e c h a n i s m i s b e c o m i n gav e r yi m p o r t a n ti s s u ei n a u t o m a t i c 肫6s e r v i c e sd i s c o v e r yb a s e do ns e m a n t i cd e s c r i p t i o no f 朊b s e r v i c e sa f t e ri n t r o d u c i n gm a c h i n e - u n d e r s t a n d a b l es e m a n t i ci n f o r m a t i o n f i r s t ,t h i sp a p e rp r e s e n t st w os i m i l a r i t ym e a s u r e sa l g o r i t h m sb y c o n s i d e r i n ga l lt h ed e t e r m i n a t i o ns u c ha so n t o l o g yr e l a t i o n s h i pa n dt h e d e p t ho f ac o n c e p t o n ei sb e t w e e nt w oo n t o l o g yc o n c e p t s a n dt h eo t h e r i sb e t w e e nt w oc o n e 印t ss e t s t h es i m i l a t i t yw h i c hi su s e dt od e s c r i b e h o wm u c ht h ec a n d i d a t es e r v i c em a t c ht h ec l i e n t s r e q u e s tw i l lb e o b t a i n e da c c u r a t e l ya n de f f i c i e n t l yi nu s eo ft h es i m i l a r i t ym e a s u r e a l g o r i t h m s w i t hm e e t i n gt h ef u n c t i o n a lr e q u i r e m e n t s ,au s e rp r e f e r e n c e m a t c h i n ga l g o r i t h mb a s e do nt h eu s e ri n t e r e s tm o d e l i sa d d e di n t h e n ,a l l t h es e r v i c e sc o n c e r n e dw i l lb eo u t p u ta l t e rb e i n gs o r t e di na c c o r d a n c e w i t ht h ei n t e g r a t e ds i m i l a r i t y t h ef i l t e r i n gm e c h a n i s mi si n t r o d u c e di n t o t h ep r o c e s so fm a t c h m a k i n gi no r d e rt or e d u c et h ea m o u n to fs i m i l a r i t y c o m p u t i n go ft h ei r r e l a t i v ew e bs e r v i c e s ,w h i c hg r e a t l yi m p r o v e st h e e f f i c i e n c yo ft h em a t c h m a k i n ga l g o r i t h m a tl a s t ,t h i sp a p e rp r o p o s e sas o l u t i o nt of a c i l i t a t et h ed e s i g na n d r e a l i z a t i o no fs e m a n t i c 朊bs e r v i c e sm a t c h m a k i n gs y s t e m 。t r a v e l l i n g d o m a i no n t o l o g ya n d t a x o n o m yo n t o l o g y a r eb u i l tu pt ot e s tt h e p e r f o r m a n c eo ft h em a t c h m a k i n gm e c h a n i s m t h et e s tr e s u l tv e r i f i e st h a t t h i ss y s t e mb a s e do ns i m i l a r i t ys o r t i n ga n ds t a g e sf i l t e rc a ni m p r o v e p r e c i s i o na n dr e d u c e t h er e s p o n s et i m eo fs e m a n t i cw e bs e r v i c e s m a t c h m a k i n gs y s t e m k e y w o r d s :s e m a n t i cw e bs e r v i c e s ,m a t c h m a k i n g ,s i m i l a r i t , o n t o l o g y ,u s e rp r e f e r e n c e 声明 独创性( 或创新性) 声明 本人声明所呈交的论文是本人在导师指导下进行的研究工作及取得的研究 成果。尽我所知,除了文中特别加以标注和致谢中所罗列的内容以外,论文中不 包含其他人已经发表或撰写过的研究成果,也不包含为获得北京邮电大学或其他 教育机构的学位或证书而使用过的材料。与我一同工作的同志对本研究所做的任 何贡献均已在论文中作了明确的说明并表示了谢意。 申请学位论文与资料若有不实之处, 本人签名:乏陲吐啦 本人承担一切相关责任。 日期:j 掣盔坐一 关于论文使用授权的说明 学位论文作者完全了解北京邮电大学有关保留和使用学位论文的规定,即: 研究生在校攻读学位期间论文工作的知识产权单位属北京邮电大学。学校有权保 留并向国家有关部门或机构送交论文的复印件和磁盘,允许学位论文被查阅和借 阅;学校可以公布学位论文的全部或部分内容,可以允许采用影印、缩印或其它 复制手段保存、汇编学位论文。( 保密的学位论文在解密后遵守此规定) 保密论文注释:本学位论文属于保密在一年解密后适用本授权书。非保密论 文注释:本学位论文不属于保密范围,适用本授权书。 本人签名: 导师签名: 日期: 垫竺2 三: 日期:趁革主:星 1 1 研究背景和意义 第一章绪论弟一早三百下匕 随着互联网的飞速发展,它的缺陷逐渐暴露了出来,如网页功能单调、搜 索引擎智能化程度低等,这是因为大部分w e b 上的内容是设计给人阅读的,而 不是让计算机程序按其意义进行操作的。2 0 0 0 年,互联网的创始人t i m b c r n e r s l e e 提出了语义w e b 的概念和体系结构:“语义w e :b 是现有w e b 的扩 展,信息被赋予定义良好的含义,更便于计算机和人的协同一【l j 。可以看出,语 义w e b 的基本思想是为w e ;b 上的资源( 包括数据、程序、网页、图片或其他抽 象事物等) 引入清晰的语义和结构化的描述,这样w e b 将成为一个存在海量的 潜在知识、具有推理能力的知识网络,使得计算机可以分辨和识别这些语义信息, 并对其自动进行解释、交换和处理。 另一方面,w e b 服务作为一种新兴的w e b 应用模式及远程访问标准,其目 的是要解决异构平台上的数据和应用的整合与共享问题。虽然w c b 服务模型与 所使用的编程语言、平台和对象模型无关,但是w e b 服务技术也存在一些缺陷 及不足:如传统的服务发现技术需要用户自己去查找服务;如果单个w e b 服务 的交换模式发生了变动,则服务请求端必须由编程人员自己来应对变动,不够灵 活等。 在这样的背景下,语义w e b 服务( s e m a n t i cw e bs e r v i c e s ) 成为了w e b 服务一 个新的发展方向。语义w e b 服务是语义w e b 和w e b 服务的结合,它结合了传 统w e b 服务技术和语义w c b 技术的优点,使用语义信息对w e b 服务的功能属 性,非功能属性以及行为进行描述,可为w e b 服务的发现、执行、解释组合的 自动化提供有效的支持。 语义w e b 服务领域的关键技术包括基于语义的w c b 服务描述、语义w c b 服务匹配、语义w e b 服务组合、语义w e b 服务执行及监控等,其中如何准确而 有效地找到满足用户需求的服务即所谓的w e b 服务匹配成为一个亟需解决的关 键问题。传统的w e b 服务发现机制主要是基于关键字匹配,缺乏机器可理解的 语义信息,使得服务发现的查全率、查准率偏低,无法实现智能化搜索。虽然目 前基于w s d l 和u d d i 的w e b 服务已经发展得较为成熟,并得到工业界的广泛 支持,在一定程度上解决了服务的描述和匹配问题,但由于w s d l 只能实现语 法层次上的服务匹配,故不能满足用户对于语义层次上的服务查找和匹配的要 求。因此,本文的主要研究内容是基于语义的w e b 服务匹配问题,保证效率及 高查全率、查准率的w e b 服务匹配算法对语义w e b 服务的后续环节如服务选择、 服务组合、服务执行等具有重要的意义。 1 2 主要研究工作 本人在硕士研究生期间,参加了国家9 7 3 课题“新一代互联网体系结构理论 研究一新一代互联网服务模型和服务管理理论 ( 课题编号:2 0 0 3 c b 3 1 4 8 0 6 ) , 主要负责语义w e b 服务语义匹配算法的研究和实现。 1 3 论文组织和结构 本文主要研究内容是语义w e b 服务在分布式环境下的匹配问题,包括基于 语义的单概念、多概念匹配算法的研究,用户偏好的模型建立、匹配算法的研究 及仿真,并在此基础上提出了多层次的语义w e b 服务匹配算法和匹配框架。论 文共分为七章,论文结构简要概述如下: 第一章引言 本章主要介绍了本论文的研究背景、研究工作和论文的整体结构。 第二章w e b 服务与语义w e b 服务 本章主要对w e b 服务和语义w e b 服务技术进行了综述,介绍了目前国内外 对语义w e b 服务匹配问题的研究现状,分析了语义w e b 服务匹配的意义和重要 性。 第三章基于语义相似度的概念匹配算法 本章主要讨论在本体的基础上,基于相似度的概念匹配算法,从相关研究、 算法介绍两方面分别阐述单概念和多概念匹配算法。 第四章基于用户偏好模型的用户偏好匹配算法 本章根据对用户偏好的研究,介绍了用户偏好模型的建议及基于此模型的匹 配算法,并采用具体仿真数据模拟计算过程和结果。 第五章语义w e b 服务功能匹配 基于第三章的语义概念匹配算法和第四章的用户偏好匹配算法,利用 o w l - ss e r v i c ep r o f i l e 中的语义信息,本章讨论了多层次的语义w e b 服务匹配算 法及匹配框架的设计,最后确定了系统的性能评估参数。 2 第六章测试与分析 本章首先对旅游领域建立了领域本体和分类本体,然后在此基础上构建了大 量待匹配的语义w c b 服务数据,最后测试并分析了第五章设计的系统的性能、 验证了算法的有效性和系统的效率。 第七章结束语 本章简要归纳了本论文所研究内容的创新点,提出了语义w e b 服务语义匹 配问题的下一步研究方向。 第二章语义w e b 服务相关技术综述 语义w e b 服务是语义w e b 和w e b 服务的结合,它结合了传统w e b 服务技 术和语义网技术的优点。本章将从w e b 服务开始,阐述w e b 服务的概念、体系 结构和支撑技术,然后介绍语义w e b 的概念及相关技术,第三节将具体介绍语 义w e b 服务,最后分析目前国内外对语义w e b 服务匹配技术的相关研究成果。 2 1w e b 服务 w c b 服务是可以通过w e b 描述、发布、定位和调用的模块化应用。w 3 c 这样定义w e b 服务: w e b 服务是一种软件系统,它支持网络上机器与机器之间的互操作;它有一 个以机器可以处理的格式描述的接口;其它系统通过s o a p 消息与w e b 服务进 行通信,s o a p 消息通常以x m l 序列化的形式采用h t r p 协议以及其它w e b 相 关协议进行传输【2 1 。 从上述定义可以看出,w e b 服务本质上是一种应用程序之间的通信机制, 它独立于硬件平台、操作系统和编程语言。w e b 服务有一个软件接口,它描述 了一组在网络上可以通过标准化的x m l 消息传递进行访问的操作。更重要的是, w c b 服务的协议都是开放的标准,如s o a p 和h 1 r r r p 。 2 1 1w e b 服务体系结构 w e b 服务的目的是要解决异构平台上的数据和应用的整合与共享问题,以 前的许多分布式技术都试图解决这个问题,如c o r b a 、d c o m c o m + 、r m i 等, 但是这些技术要么过于复杂、难于使用,要么不能穿透防火墙、不能在i n t e r n e t 上进行工作,并且不同标准之间不能很好地实现互操作。w e b 服务技术很好地 解决了这些问题,它使用标准的、正式的x m l 来描述服务交互的所有必须细节, 包括消息格式、传输协议和位置,它的接口隐藏了实现的细节,可以保证独立于 编写它的语言和实现它的软硬件平台。这样基于w e b 服务技术实现的应用具有 松耦合性,也能够组合完成更复杂的功能,它的体系结构如图2 1 所示。 4 图2 1w 曲服务体系结构 在w e b 服务体系结构中包括三种角色:服务提供者,负责创建和发布服务; 服务请求者,查找所需的服务并使用该服务;服务注册中心,负责为服务的发布 和定位提供支持。在各个角色之间有如下三种操作: 发布:服务提供者向注册中心注册自己的服务及访问接口。 查找:服务请求者通过服务注册中心查找特定种类的服务。 绑定:服务请求者执行绑定操作以调用由服务提供者提供的服务。 2 1 2w r e b 服务支撑技术 w e b 服务建立在一系列的标准协议和技术之上,如:统一描述、发现和集 成协议( u n i v e r s a ld e s c r i p t i o n ,d i s c o v e r ya n di n t e g r a t i o n , ,即u d d i ) 、w e b 服 务描述语言( w e bs e r v i c e sd e f i n i t i o nl a n g u a g e ,即w s d l ) 、简单对象访问协 议( s i m p l eo b j e c ta c c e s sp r o t o c o l ,即s o a p ) 、w e b 服务流语言( w e bs e r v i c e s f l o wl a n g u a g e ,即w s f l ) 等,如图2 2 所示。 5 w 汛 三日 s t a 廿c u d d i d i 咒c t ,u d d i w s d l s o a p h ”曙,f t p ,e 珊a n , m q ,i i o p ,e t c 图2 - 2w e b 服务的协议栈 在w c b 服务体系中,使用w s d l 来描述服务,u d d i 用来发布、查找服务, 而s o a p 用来执行服务调用、在w e b 服务之间进行消息传递和承载,这是w c b 服 务最基本的三项技术。 w s d l w s d l 是一种用来描述w e b 服务的基于x m l 的规范模式。w s d l 把w e b 服务定义为消息上的一组端点或端口操作,端口通过将一个网络地址与一个可重 用的网络地址关联来定义,并且端口的一个集合就定义了一个服务。消息可以是 消息类型也可以是r p c 类型。w s d l 是可以扩展的,它允许对端点以及与其相 关联的消息进行描述,不管消息是什么格式或者采用何种网络协议进行通信。基 本上,某项w e b 服务的w s d l 文档都会指定w e b 服务中使用的方法、数据类 型、使用的传输协议和w e b 服务宿主的终点u r l 。 u d d i u d d i 是一套基于w e b 的、分布式的、为w e b 服务提供的信息注册中心的 实现标准规范,同时也包含一组使企业能将自身提供的w e b 服务注册以使别的 企业能够发现的访问协议的实现标准。u d d i 使服务提供者能把他们机构的详细 资料和所提供的w e b 服务的详细情况发布到中心注册表,并提供一个标准使服 务请求者能找到服务提供者以及关于他们w e b 服务的详细资料。 s o a p 6 一 oc一寸o,orvico 一 一 墨arp阳。暑。亭 一 一 oourt、, 一 s o a p 是在分散或分布式的环境中通过x m l 交换信息的一种简单协议。 w e b 服务通过简单对象访问协议s o a p 来调用。s o a p 消息采用可扩展标记语 言( x m l ) 进行编码,一般通过h 哪进行传输。s o a p 是一种轻量级的消息协 议,它允许用任何语言编写的任何类型的对象在任何平台之上相互通信。 22 语义w e b 现有互联网技术的核心是超文本系统,它的主要思想是通过u r i ( u n i f o r m r e s o u r c ei d e n t i f i e r ,即统一资源标识符) 对互联网上的信息进行标记,使人们可 以迅速地对互联网上的信息资源进行定位。然而,现有互联网技术并没有对信息 的古义进行描述,计算机在处理信息时只是按照u r i 来定位信息,但对信息的 内容并不关心。w e b 的功能仅在于定位和显示数据,提供人类可阅读的信息而 非提供机器可理解的语义信息,这使得计算机在自动处理大量w 曲信息时变得 无所适从,无法实现智能地理解和处理网页的内容。 语义w e b 的思想就是为了弥补这方面的不足而被提出来的。从语义w e b 的 发展起源来看,语义w 曲是人工智能领域和w e b 技术相互结合的产物。语义网 构建在自定义标记的x m l 和数据表示灵活的r d f ( r e s o u r c ed e s c r i p t i o n f r a m e w o r k ,即资源描述框架) 基础之上其目标是应用有效的标准和技术使得 计算机能够理解w e b 网络上的信息,实现智能信息检索、知识发现和数据集成 等。2 0 0 0 年,t i mb e m e r s - l e e 在世界x m l 大会上,提出了语义w e b 的概念和 体系结构【l 】,如图2 _ 3 所示。该结构从底层到高层分为七层:u n i c o d e 和u p ; x m l 、r d f 和r d fs c h e m a ;本体( o n t o l o g y ) ;逻辑( l o g i c ) ;证明( p r o o f ) ; 信任( t r u s t ) 。 h nm 叫具导 习型篱l _ o n t a ( o g f v o 口b u b j 圈豳- ! 二二二二二圈_ 图2 - 3 语义w e b 体系结构 下面将简单介绍语义网的体系结构中每层的概念和功能: 蜀到 u i u 和u n i c o d e w c b 环境下的应用之间需要相互通信,以机器可读的格式传递发布信息。 这些信息中大部分都是对w e b 上资源的描述,因此需要用明确的方式来标识这 些资源。语义网采用u r i 表示资源及其属性。由于语义网的最终目的是要构建 一个全球信息网络,在这个网络上应该涵盖各种语言和文字的信息资源,所以它 采用统一编码u n i c o d e 作为字符的编码方案,这一层是整个语义网的基础,它成 功的解决了万维网上资源的定位和跨地区字符编码的标准格式问题。 。x m l 、n a m e s p a c e 、x m ls c h e m a 在u r i 和u n i c o d e 之上,是x m l 及相关技术层。x m l 作为一种“元语言 , 允许用户根据需要自定义标签对内容进行标记,并使用x m ls c h e m a 来约束这 些标签的结构【4 】。由于x m l 标签可以由用户根据自己的需要来定制,为了避免 命名上的冲突,w 3 c 采用了n a m e s p a c e 机制。因此,这一层通过x m l 的特性, 实现了文档对自身结构的描述,实现了跨应用的语法互操作层。然而,x m l 只 是一种数据交换格式,它只是解决了文档内容的次序、结构等语法层次的问题, 并没有解决文档内容的语义,相互联系的问题。x m l 标签的具体含义和互操作 要交给上层去解决。 r d f 、r d fs c h e m a x m l 层之上是数据互操作层:资源表述框架r d f 和r d f 的扩展r d f s c h e m a 。r d f 是处理元数据的基础,它为在应用之间交换机器可理解的网络数 据提供了可互操作性。r d f 是一个开放的元数据框架,用来描述元数据以及元 数据与元数据之间的关系。这个元数据框架定义了一种描述机器可理解的数据语 义的数据模型。该数据模型主要包含以下三个对象类型: 资源( r e s o u r c e ) :资源可能是整个网页、网页中的一部分、页面的全部集 合或者是不通过w e b 访问的对象。 特性( p r o p e r t i e s ) :特性是描述某个资源特定的方面、特征、属性或关系。 声明( s t a t e m e n t s ) :一个特定的资源和特性名称加上该特性的值一起构成 了一个r d f 声明。一个声明中的这三个部分分别被称为:主体( s u b j e c t ) 、谓 词( p r e d i c a t e ) 和对象( o b j e c t ) 。r d f 定义o b j e c t p r o p e r t y - v a l u e 三元组作为基 本建模原语,然而它只是提供了一个表达元数据的模型,并没有定义任何一个特 定领域的语义。r d fs c h e m a ( r d f s ) 进一步定义建模原语,增强了r d f 对资 源的描述能力,可以用来定义一个描述类和类与类之间的简单关系。r d f s 提供 了一种机制来定义领域相关的属性能够以及用于使用这些属性的资源类,其机制 8 提供了r d f 模型中使用的一个基本类型系统。r d f 和r d f s 共同描述前面事实 所用到的结构,需要说明的是,r d f 解决如何无二义性的描述资源对象的问题, 使得描述的资源的元数据信息成为机器可以理解的信息。r d f 通过基于x m l 语 法的明确定义的模型来帮助建立语义协定( i f s ) 和语法编码( l ) 之间的 桥梁,并以此来实现元数据的互操作能力。但是,r d f r d f s 描述语义的功能非 常有限,对特定领域的词汇描述能力比较弱,需要进一步扩展。 。o n t o l o g y 由于r d f r d f s 的描述能力较弱,需要进行扩展,这个r d f r d f s 之上的 扩展层称为本体( o n t o l o g y ) 层。本体是共享概念模型的明确的形式化规范说明。 对同一概念的语义共享和共同理解是构建语义w e b 的关键,而本体作为一种能 在语义和知识层次上描述信息系统的概念模型建模工具,能够在用户和应用之间 达成对术语含义的共享和共同理解,因此,本体层是构建语义w e b 的关键和核 心层。 。l o g i c 、p r o o f & t r u s t 本体层以及r d f r d f s 层可以对w e b 上的资源内容做出描述。然而除了描 述之外,基于语义的w e b 还需要根据特定的规则从这些描述性的知识中进行推 理。逻辑层的目标就是提供一种方法来描述规则。针对语义网的各种不同类型的 应用,逻辑层可能会采用多种逻辑语言的实现形式。 p r o o f & t r u s t 在概念上还没有形成一个共识,但人们普遍认为p r o o f 和t r u s t 对于语义网来说是必要的。用户在知识描述上进行推理的过程就是证明的过程, 而推理后得出的结论应该是可以信任的。 2 3 语义w ,e b 服务 语义w e b 服务是w e b 服务和语义w e b 技术的结合,它把语义w e b 的研究 成果引入w e b 服务中,可以实现自动化的服务发现、调用、组合、监视和恢复。 语义w c b 的研究将使得访问w e b 资源不再仅仅依靠关键字来查找和访问, 而是根据内容来访问。w e b 服务作为w e b 上的一类越来越重要的资源,同样要 求语义w e b 对其提供广泛的语义支持,从而实现语义w e b 服务。o w l - s 就是 一种用来描述w e b 服务属性和功能的o w l 本体规范,它使用一系列基本的类 和属性来描述服务,提供了一个可共享的框架,使得w e b 服务成为计算机可理 解的实体,从而便于实现以下任务:服务的自动发现、选择、调用、互操作、组 合、执行监控等。 9 2 3 1 语义w e b 服务描述语言o w l s o w l - s 是基于o w l 的w e ;b 服务本体,它建立了一套标记语言结构来描述 w e :b 服务的属性和服务能力,使w e b 服务的自动化成为了可能。o w l - s 是位于 w s d l 层之上的w e b 服务语义描述语言,和w s d l 相比,不仅说明了服务和服 务之间以及服务与用户之间的互操作,而且说明了互操作的语义内容。o w 【广s 包括关于服务的三部分信息:s e r v i c e p r o f i l e ,描述服务能做什么;s e r v i c e m o d e l , 描述怎样来使用服务;s c r v i c c g r o u n d i n g ,描述怎样来访问服务。o w l - s 的顶层 结构如图2 - 4 所示。 图2 - 4o w l - s 顶层结构图 服务概要( s e r v i c ep r o f i l e ) 在o w l s 模型中,s e r v i c e p r o f i l e 既可描述提供者提供的服务,又可描述请 求者所需的服务。s e r v i c e p r o f i l e 包含关于w c b 服务三个方面的基本信息:服务 的非功能信息,服务的功能信息,以及服务的一些附加特征信息。 服务的非功能性信息提供了用户可读的信息,这些信息一般不能进行自动化 的处理,例如服务名、服务提供者的联系信息等其它供人阅读的信息。 服务的功能信息由输入、输出、前置条件和效果( i n p u t s ,o u t p u t s ,p r e c o n d i t i o n 和e f f e c t , 简称i o p e ) ,例如一个订阅机票的服务可能需要信用卡有效作为前置 条件,信用卡号作为输入,产生一个收据是它的输出,信用卡上余额减少是它的 效果。p r o f i l e 本体通过h a s i n p u t 、h a s o u t p u t 、h a s p r e c o n d i t i o n 、h a s e f f e c t 等属性 l o 来描述i o p e ,但所有i o p e 的实例都在p r o c e s s 部分创建,p r o f i l e 的实例只是简 单地指向这些实例。 服务的非功能性特征信息包括服务的分类信息和服务的q o s 信息,通过 s e r v i c e p a r a m e t e r 、s c r v i c c c a t e g o r y 等属性来描述服务承诺的质量等级、服务所属 的分类以及其它可能会描述的参数( 如服务响应时间、覆盖地域范围等) 。 服务模型( s e r v i c em o d e l ) s e r v i c e m o d e l 用来描述服务的内部过程( p r o c e s s ) ,o w l - s 的过程模型主 要描述关于p r o c e s s 的两个方面信息:一是描述从外部看到的p r o c e s s 的i o p e s ( i n p u t , o u t p u t , p r e c o n d i t i o n , e f f e c t i o n ) ,另一方面是描述p r o c e s s 的内部控制结构。 根据描述粒度,过程分为三种:原子过程,简单过程和组合过程。 原子过程可以直接调用,没有子过程。从服务请求者的角度来看,一步就可 以完成。它们接收一个输入消息、执行、然后返回输出消息。服务的执行对服务 请求者来说是透明的。对于每一个原子过程,必须提供一个g r o u n d i n g ,使得服 务请求者可以构造这些消息。 简单过程不可直接调用,也没有对应的g r o u n d i n g 。但是它们可以看成像原 子过程一样是一步执行的过程。简单过程用于抽象,可以用来提供原子过程的视 图或复合过程的简化表示( 复合过程看成黑盒,用于规划和推理) 。这时,简单 过程由原子过程实现或展开为复合过程。 复合过程可以由其它的原子或复合过程通过一些控制构造符来组合而成。每 个过程由一个控制构造( c o n t r o l c o n s t r u c t ) 定义。控制构造( c o n t r o l c o n s t m c t ) 定义了复合过程中每个子过程的执行顺序。o w l - s 中定义的控制流有 s e q u i 舶c e ,s p l i t ,s p l i t + j o i n ,u n o r d c r c d ,c h o i c e ,i f - t h e n - e l s e ,i t e r a t e ,r e p e a t - u n t i l 这几种。 s e r v i c e m o d e l 也使用了i o p e ,它和p r o f i l e 中的l o p e 并不需要完全一致。 通常,p r o f i l e 中的i o p e s 是s e r v i c e m o d e l 中的l o p e s 的子集,这根据服务提供 者需要发布哪些功能而定。 服务绑定( s e r v i c eg r o u n d i n g ) s e r v i c e g r o u n d i n g 描述怎样访问服务的细节,主要是和协议、消息格式、序 列化、传输、寻址等相关的细节。g r o u n d i n g 可以看成是从调用服务所需元素( 特 别是原子过程的输入和输出) 的抽象描述到具体描述的映射。 由于w s d l 是已有的工业界广泛采用和支持的消息格式规范,o w l s 选择 利用w s d l 作为g r o u n d i n g 机制的基础。w s d l 基于x m l 格式,将网络服务描 述为一系列操作和消息的端点,消息可以包含文档信息或是过程信息。定义一个 端点时,先抽象地描述操作和消息,然后绑定到具体的网络协议和消息格式。一 组相关的具体端点合并成抽象的端点服务。 可以利用o w l s 和w s d l 这两种语言规范互补的优势来描述服务【i o 】。一 方面,用o w l - s 的过程模型来表示服务的抽象描述,以充分利用o w l 类型机 制的丰富表达力。另一方面,用w s d l 来表示服务的具体描述,以重用w s d l 及相关语言( 如s o a p ) 的工作及基于这些规范的支持消息交换的软件。这样, o w l - s w s d lg r o u n d i n g 用o w l 类来描述消息的抽象类型,然后通过w s d l 绑定来描述消息的格式。 o w l - s 和w s d l 的联系如图2 5 所示,可按照如下规则进行互相转化: ( 1 ) o w l s 的原子过程对应于w s d l 的操作。它们大多数时候是一一对应的, 也可以是一对多的关系。 ( 2 ) o w l s 原子过程的输入和输出分别对应于w s d l 输入和输出消息的概 念。 0 ) o w l - s 原子过程中输入、输出的类型( 即o w l 的类) 对应于w s d l 抽 象类型的表示。 。: o w l - s :。- :p r o c e s s m o d e l d l - b a s e dt y p e s : 一卜十、 a t o m i cp r o c e s s i n p u t s o u t p u t s ll 一黑一声鼍 b i n d i n g t os o a p , h 几 p ,e t c 一一一厂一一w s d l 一一一! l 一j 一一, 图2 - 5o w l - s 与w s d l 之间的映射 2 3 2 语义w e b 服务相关技术 语义w e b 服务领域中相关的研究重点及热点包括以下几个方面。 1 2 j71 i iiil=;t 基于语义的服务描述 用语义描述服务的目的是让计算机能够理解信息,从而实现计算机的自动处 理,这是其它关键技术的基础。语义描述的研究重点是如何用一种语言形式化的 描述一个服务的语法及语义信息( 如何描述服务的功能性信息,非功能性信息 等) 。目前广泛使用的是w 3 c 制定的标准o w l o w l s 来描述服务,此外还有 欧洲的研究组织提出的w e b 服务的建模本体w s m o 。 基于语义的服务发布 发布服务的目的是让服务提供者把自己开发的服务公布出去,让服务请求者 使用服务。它的研究重点是如何来发布自己的服务,或者网络中如何来管理提供 者提供的服务。目前的服务发布分为集中式发布和分布式发布。p 2 p 技术在分布 式服务发布和发现中被广泛采用,根据p 2 p 网络的不同组织方式,可以采用不 同的服务发布规则。 基于语义的服务发现 服务发现的目的是根据用户的请求找到满足用户要求的一个服务或者一组 服务。在分布式的服务发布环境中,实现基于语义的服务发现需要基于语义路由 和语义匹配技术,其中语义路由是指根据语义信息直接定位相关服务注册中心的 地址,在此基础上应用语义匹配技术更精确地进行服务定位。 基于语义的服务组合 当网络中没有单一的服务能满足用户请求的时候,需要利用网络上已有的服 务实例组合一个能满足用户需求的复杂服务。服务组合可以利用模板来优化组合 的过程,组合模板是指抽象的服务组合流程,可以先查找是否有相应的模板,再 根据模板查找每个环节的具体服务。基于模板的服务组合的研究重点是如何描述 服务模板的语义信息,如何建立服务模板,以及在服务模板库中没有相应模板的 情况下,如何组成一个新的组合服务模板,以满足用户需求。 基于语义的服务选择 基于语义的服务选择是指在考虑q o s 的情况下,选择一个最为符合需求的 服务或一组服务。如果网络中有满足用户功能要求的多个原子服务,则可以直接 考虑单个服务的q o s 并进行选择;如果网络中没有满足用户要求的单个服务, 则需要通过服务组合,此时服务选择的目的是从多个组合服务中选出全局q o s 最优的一个或一组服务。基于语义的服务选择的研究重点是如何来量化一个组合 服务的全局q o s ,如何构造一个高效的选择算法。 基于语义的服务协商 如果采用静态的机制,则用户在服务发现与选择的过程中不能修改提出的要 求,通过服务协商可以引入一种机制使服务提供者和服务请求者进行进一步的协 商,请求者能够通过修改服务请求来定制自己的服务以达成一致。它的研究重点 是如何建立一个通用的服务协商协议描述框架,如何建立协商模型。 基于语义的服务执行与监控 服务执行时需要引入异常处理机制,以保障服务的顺利执行,它的研究重点 是如何建立服务执行的事务机制以及执行过程中出错时的补偿机制。 此外在服务执行时需要对服务执行的状态进行监控,监控获得的数据可以作 为下次服务选择的参考,监控参数的选择及反馈模型的建立是服务监控的研究重 点。 在上述研究方向中,服务发现中的语义匹配是指基于用户的功能性和非功能 性的要求,在已发布的服务里查找一个最为接近用户请求的服务或服务序列。语 义匹配是渗透到语义路由,服务选择,服务组合中的,它也是服务选择和服务组 合等后续流程的基础。本论文的研究重点在于语义匹配中的基于i o ( i n p u t 、 o u t p u t ) 的功能性匹配和基于模型的用户偏好匹配。 2 4 语义w e b 服务匹配的相关研究 目前,很多机构展开了对服务匹配算法广泛而深入的研究,研究方法和侧重 点各不相同。 文献 1 1 ,1 2 ,1 3 ,1 4 ,1 5 使用o w l - s ( 前身是d a m l - s ) 进行w e b

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论