(系统工程专业论文)基于语义标注的Web服务发现框架及实现.pdf_第1页
(系统工程专业论文)基于语义标注的Web服务发现框架及实现.pdf_第2页
(系统工程专业论文)基于语义标注的Web服务发现框架及实现.pdf_第3页
全文预览已结束

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

摘要 摘要 w e b 服务作为一种新兴的w e b 应用模式和分布式计算模型,从根本上解决了企 业之间及企业内部异构系统之间的互操作和互通信问题。然而现有的主流w e b 服 务发现方法是采用基于u d d i 框架的服务匹配,由于u d d i 注册中心只能提供基于关 键字的查询,并且缺乏对语义信息的支持,使得服务匹配是基于关键字和语法级 的匹配,不能实现基于服务功能的匹配,从而造成服务查准率查全率较低。另一 方面,w s d l 描述语言是语法级的服务描述语言,主要提供w e b 服务的物理信息, 即调用具体服务所需的技术细节,缺乏对服务功能的语义描述,因此不能很好的 提供服务的功能信息。 针对目前w e b 服务中遇到的问题,研究界提出了将语义w e b 的技术应用至u w e b 服务领域,为w e b 服务的描述提供语义信息,即语义w e b 服务( s e m a n t i cw e b s e r v i c e s ) 。旨在实现服务发现的自动化,在服务发现阶段借助于本体语义标注 和逻辑推理,加强服务描述信息的机器可理解性,可以实现服务的灵活匹配,提 高服务匹配的质量。本文所作的研究如下: l 、论文比较全面地介绍了w e b 服务及其现有的服务匹配技术,语义w e b 等的 相关知识背景,以及它们的最新发展状况。 2 、设计并实现了基于语义的w e b b 艮务发现框架,主要包括以下功能模块:1 ) 通过s a w s d l 标准把相应的本体概念标注至u w s d l 中;2 ) 扩展u d d i 注册中心,使其能 够支持服务的语义信息;3 ) 语义w e b 服务匹配模块利用服务本体和领域本体提供 的语义信息并结合词汇网络和语义推理实现服务的匹配。 3 、研究基于语义的w e b 服务发现匹配算法,该算法采用了分层匹配的思想, 首先通过根据词汇网络得出服务需求模板的部分匹配度,然后通过语义推理推出 各词汇的语义匹配度,根据相应公式计算出w e b b 艮务最后的匹配度,判断是否与 用户要求匹配。最后按服务匹配度显示,提高了用户请求与服务匹配的准确性与 简效性。 关键词:w e b 服务,语义w e b ,u d d i ,w s d l ,本体,s a w s d l a b s t r a c t w e bs e r v i c er e s o l v e dt h ep r o b l e mo fi n t e r c o m m u n i c a t i o na n di n t e r o p e r a b i l i t y w i t h i nt h eb u s i n e s se n t e r p r i s ea n dh e t e r o g e n e o u ss y s t e mi nt h ei n t e r n a lb u s i n e s s e n t e r p r i s eb yt h er o o t h o w e v e rt h et r a d i t i o n a lw e bs e r v i c e sd i s c o v e r ym e t h o di s w e bs e r v i c e sm a t c h m a k i n gw h i c hi sb a s e do nt h eu d d if r a m e w o r k ,b e c a u s eu d d i c 锄o n l yo f f e rt h eq u e r yb a s e do nk e y w o r d ,a n du d d iu s ex m l t od e s c r i b ei t sd a t a s t r u c t u r e ,i s l a c ko f s u p p o r t f o rs e m a n t i ci n f o r m a t i o n , s ot h ew e bs e r v i c e s m a t c h m a k i n gi sb a s e do nt h ek e y w o r da n ds y n t a xm a t c h m a k i n g ,c a l l ti m p l e m e n t w e bs e r v i c e sf u n c t i o n a l i t y - b a s e dm a t c h m a k i n ga n dt h e nc a u s et h el o wp r e c i s i o n o n t h eo t h e rh a n d , w s d ll a n g u a g ei sas y n t a xl e v e l l a n g u a g e ,o f f e rt h ew c bs e r v i c e s p h y s i c a li n f o r m a t i o n , a n d l a c ko ft h es e m a n t i c d e s c r i p t i o no fw e bs e r v i c e s f u n c t i o n a l i t yi n f o r m a t i o n a g a i n , t h et r a d i t i o n a lw e bs e r v i c e sd i s c o v e r yt e c h n o l o g yi s l a c ko ft h ea b i l i t yo fe x t r a c t i o n ga n dp r o c e s s i n go ft h eu s e f u li n f o r m a t i o n , c a n t e f f e c t i v e l yd e s e r i b l et h ew e bs e r v i c e sc a p a b i l i t yf r o mt h es e r v i c e sr e q u e s t ,g oa g a i n s t l o c a t et h eb e s tw e bs e r v i c e s t or e s o l v el o wp r e c i s i o ni nw e bs e r v i c e sd i s c o v e r y ,t h er e s e a r c hc o m m u n i t y b r i n g ss e m a n t i c st ow e bs e r v i c e s 1 1 1 eo b j e c to ft h es e m a n t i cw e b s e r v i c ed i s c o v e r y t e c h n o l o g yi sa c h i e v i n gt h ea u t o m a t i cs e r v i c ed i s c o v e r y i tc a ne n h a n c et h eq u a l i t yo f s e r v i c em a t c h i n gb yi m p r o v i n gt h em a c h i n e su n d e r s t a n d a b i l i t yo fs e r v i c ed e s c r i p t i o n w i t ho n t o l o g ys e m a n t i ca n n o t a t i o na n dl o g i c a lr e a s o n i n gi ns e r v i c ed i s c o v e r yp h a s e s e m a n t i cw e bs e r v i c e sh a v et h e i rs e m a n t i cd e s c r i p t i o i l sa n dt h u sm a k ei tp o s s i b l ef o r s e r v i c e st ok n o wt h ec o n t e n t , f u n c t i o na n da t t r i b u t e so fe a c ho t h e r 1 、硼1 ek n o w l e d g ea b o u tw e bs e r v i c e ,c u r r e n tm a t c h i n gt e c h n o l o g ya n ds e m a n t i c w e bw i l lb ei n t r o d u c e da l l s i d e d ,i n c l u d i n gt h el a t e s tp r o g e r e s s 2 、1 1 l i sp a p e rd e s i g nas e m a n t i c b a s e dw e bs e r v i c e sd i s c o v e r yf r a m e w o r k 。t h e f r a m e w o r ki n c l u d e s :1 ) u s et h es p e c i f i c a t i o ns a w s d lt oa n n o t a t et h ew s d lw i t h s o m ec o r r e s p o n d i n go n t o l o g yc o n c e p t s ;2 ) e x t e n dt h eu d d ir e g i s t r yc e n t e r , w h i c hm a k ei ti n c l u d et h es e m a n t i ci n f o r m a t i o n ;3 ) s e m a n t i cw e bs e r v i c e m a t c h i n gm o d u l eu s e st h es e m a n t i ci n f o r m a t i o nw h i c hd o m a i no n t o l o g y p r o v i d e s ,v o c a b u l a r yn e t w o r ka n ds e m a n t i cr e a s o n i n gt oi m p l e m e n tt h e m a t c h i n go fw e bs e r v i c e s i i 3 、s e m a n t i cw e bs e r v i c e sm a t c h m a k e ru s e st h eh i e r a r c h i c a lm a t c ha l g o r i t h m f i r s to fa l l ,t h r o u g ht h ev o c a b u l a r yn e t w o r kt og e tt h ep a r t i a lm a t c h i n g d e g r e e s ,t h e nu s et h eo n t o l o g yr e a s o n i n gt og e tt h em a t c h i n gd e g r e e so ft h e v o c a b u l a r yw o r d s ,a tl a s tv i at h er e l e v a n tf o r m u l at og e tt h el a s tm a t c h i n g d e g r e e so ft h ew e bs e r v i c e t i l i sa l g o r i t h md e f i n e sas e m a n t i cs i m i l a r i t y d e g r e et om e a s w et h em a t c hd e g r e ea saf l o a tn u m b e r ,a n dc o n s e q u e n t l y d i s t i n g u i s ht h ed i f f e r e n c eb e t w e e nt h ew e b s e r v i c e s m a t c hd e g r e e k e y w o r d s :w e bs e r v i c e s ,s e m a n t i cw e b ,u d d i ,w s d l ,o n t o l o g y ,s a w s d l n 同济大学学位论文原创性声明 本人郑重声明:所呈交的学位论文,是本人在导师指导下,进行 研究工作所取得的成果。除文中已经注明引用的内容外,本学位论文 的研究成果不包含任何他人创作的、已公开发表或者没有公开发表的 作品的内容。对本论文所涉及的研究工作做出贡献的其他个人和集 体,均已在文中以明确方式标明。本学位论文原创性声明的法律责任 由本人承担。 学位论文作者签名:弓爱多粘 f 年弓月 7 日 f 学位论文版权使用授权书 本人完全了解同济大学关于收集、保存、使用学位论文的规定, 同意如下各项内容:按照学校要求提交学位论文的印刷本和电子版 本;学校有权保存学位论文的印刷本和电子版,并采用影印、缩印、 扫描、数字化或其它手段保存论文;学校有权提供目录检索以及提供 本学位论文全文或者部分的阅览服务;学校有权按有关规定向国家有 关部门或者机构送交论文的复印件和电子版;在不以赢利为目的的前 提下,学校可以适当复制论文的部分或全部内容用于学术活动。 7 e t牵阴弓 长 三 务年 0 1 , o : o 名 2 签者作文论位学 第l 章引言 1 1 课题的背景和意义 第1 章引言 w e b n 艮务是可以通过i n t e r n e t 发布、定位和调用的软件组件,它具有面向组 件、自描述和自包含的特点n 1 。w e b 服务是一种分布式对象技术,它可以使企业 间异构系统集成更加快速、方便。目前,许多基于w e b 的分布式应用( 如电子商务、 电子政务等) 已将w e b e r 务作为其架构的关键技术基础。与此同时,用户面对表现 形式和复杂性都可能不相同的服务,如何正确、高效地从如此庞大地w e b 服务集 合中找到自己所需要地服务则变得越来越有挑战性。特别地,w e b 服务数量的急 剧增多,用户将面临大量功能相似的服务来选择。如何从众多的功能相似的w e b 服务中发现最佳组合成为当前w e b 服务基本问题的研究热点之一,而这些基本问 题则包括了w e b 服务发现这个任务。因此,如何提高w e b 服务发现能力的研究具 有重要意义。高效的w e b 服务发现技术成为用户有效利用w e b 服务的关键。 统一描述、发现与集成协议u d d i ( u n i v e r s a ld e s c r i p t i o n ,d is c o v e r ya n d i n t e g r a t i o n ) 口1 是一套基于w e b 的、分布式的、为w e b j 艮务提供信息注册中心的实 现标准规范。它包含一组使企业能将自身提供的w e b 服务注册以使得别的企业能 够发现的访问协议的实现标准,并且提供了一组基于标准的规范,这些规范用于 描述和发现服务。但如同使用搜索引擎一样,人们在感谢u d d i 注册中心带来的寻 找w e b 服务的便捷的同时,也常常为查准率和查全率不高困扰。用户通常需要对 u d d i 返回的查询结果进行手工选择,服务查找和选择的自动化程度较低。主要原 因是,u d d i 提供的基于关键字和简单分类的服务查找机制存在缺陷:( 1 ) 服务描 述和查找过程都缺乏语义支持,对所需查询的目标不能准确描述:( 2 ) 不能度量 候选者和查询目标间的符合程度;( 3 ) 不能使用细化、泛化、平级扩展等语义操 作进行查询等。 为了实现w e b 服务自动化发现的目标,必须有一种描述w e b 服务语义的机制, w e b 服务和语义w e b 技术结合产生的语义w e b 服务技术口1 为此提供了一种可行的解 决方案。语义w e b 服务用来实现服务发现,优势是很明显的。它能够在现有的w e b 服务标准的基础上为w e b 服务扩展语义信息h 1 ,以一种机器可解释的形式来标识 用于服务发现的信息:在可接受的时间和资源的限制下,自动操作和推理,极大 地减少了人为参与。本体在语义w e b 服务技术中扮演着关键的角色,它为w e b 资源 的描述提供了共享的、精确定义的语义术语。基于描述逻辑的本体描述语言 o w l ( o n t o l o g yw e bl a n g u a g e ) 已经成为人们广泛接受并使用的标准,基于o w l 晦1 第1 章引言 的w e b j j 艮务标注语言s a w s d l ( s e m a n t i ca n n o t a t i o n sf o rw s d l ) 嘲可以为服务的发 布和请求者提供统一的语义基础,使得服务请求者能够发现自己真正需要的服 务。 本文旨在研究语义w e b 技术与w e b h 艮务技术的结合,将语义w e b 技术引入到现 有的服务发现工业标准u d d i 。利用本体的知识共享语义来提高w e b n 艮务发现的效 率和服务发现自动化水平。 1 2 研究现状 目前国内对于该领域的研究还很少,而国外的一些国际性公司、组织和大学 都参与到了语义w e b 服务的研究中,并制定了一些相关的标准和提案,主要有 d a r p a ( d e f e n s i v ea d v a n c e dr e s e a r c hp r o j e c t sa g e n c y ) 资助的d a m l 项目1 、 s w s i ( s e m a n t i cw e bs e r v i c e si n i t i a t i v e ) 叫提交的s w s f ( s e m a n t i cw e bs e r v i c e s f r a m e w o r k ) 规范、e s s i ( e u r o p e a ns e m a n t i cs y s t e m si n i t i a t i v e ) 嘲联盟和 s a w s d l ( s e m a n t i ca n n o t a t i o nf o rw s d l ) 标准。 d a m l 项目提出了o i j | l s n 岫规范( 之前为d a m l - s ) ,这是一个基于o w l ( w e b o n t o l o g yl a n g u a g e ) 的w e b 服务本体,为实现w e b 服务的自动发现、调用、组合和 互操作提供支持。 s w s f 是由s w s i 组织提交至v j w 3 c 的规范,s w s i 的成员包括n i s t ( n a t i o n a l i n s t i t u t eo fs t a n d a r d sa n dt e c h n o l o g y ) 。加拿大国家研究委员会,s r i 国际, 斯坦福大学,东芝公司和南安普顿大学,这些成员同时也是w 3 c 的成员。s w s f 包 括s w s l ( s e m a n t i cw e bs e r v i c e sl a n g u a g e ) 和s w s o ( s e m a n t i cw e bs e r v i c e s o n t o l o g y ) 。s w s l 用来规定w e b 服务的概念和个体服务描述中的形式化特性。而 s w s o 提供了一个w e b 服务的概念模型,以及对该模型的公理化和形式化。 e s s i 项目是为了通过提议全球化的标准来加强欧洲研究和工业水平,该项目 下包括六个子项目:a s g ( a d a p t i v es e r v i c e sg r i d ) ,d i p ( d a t ai n f o r m a t i o na n d p r o c e s si n t e g r a t i o nw i t hs e m a n t i cw e bs e r v i c e s ) ,k n o w l e d g ew e b , s e k t ( s e m a n t i ck n o w l e d g et e c h n o l o g i e s ) ,s u p e r ( s e m a n t i cu t i l i s e df o r p r o c e s sm a n a g e m e n tw i t h i na n db e t w e e ne n t e r p r i s e s ) ,t r i p c o r n ( t r i p l e s p a c ec o m m u n i c a t i o n ) 。e s s i 项目的研究领域包括语义w e b 服务,及将语义加强 的系统解决方案与语义s o a 相结合。 s a w s d l 为w 3 c 最新提出的关于w s d l 语义的标准,支持w e b h 艮务的分类、发现、 匹配、组合以及调用。 2 第1 章引言 1 3 论文研究内容 本文主要致力于在已有研究成果的基础上,研究基于语义标注的w e b 服务发现 框架。试图在w e b h 艮务发布和匹配两个方面对现有技术进行改进。进行如下几个 方面的探讨和研究: ( 1 ) 研究s a w s d l 标准 分析其他语义w e b 服务描述语言的不足,并研究w 3 c 新推出的标准s a w s d l ,并 分析该规范的优势。 ( 2 ) u d d i 的语义扩展 为了在u d d i 中存储语义信息,需要对现有u d d i 的数据结构进行扩展。在研究 u d d i 原本结构的基础上,提出通过扩展t m o d e l 和c a t e g o r y b a g 的方法来存储w e b 服务和语义模型的映射关系。 ( 3 ) 研究与实现语义w e b 服务匹配算法 在发布框架的基础上,根据需求构造服务请求模板,利用现有的语义词汇网 络和本体推理推出的中间结果,经过公式演算得出最终的w e b 服务匹配度。此算 法具有较高的匹配精确度和服务区分能力,具有较强的服务选择能力。算法的实 现主要是基于p o r t a l 平台开发p o r t l e t ,然后集成已有的语义词汇网络和本体推 理模块,设计具体j a v a 类来实现结果的演算。 1 4 论文组织结构 本论文共分为六章,内容组织如下: 第一章:前言。本章论述论文选题的背景和意义,简单介绍了作者的研究工 作。 第二章:基于语义标注的w e b 服务发现框架。概述了框架的主要结构,w e b n 眨 务的基本概念以及它的核心支撑技术,并详细介绍了语义w e b 的概念及其相关的 技术。 第三章:语义w e b 服务发布。主要介绍s a w s d l 标准的主要内容,标注方法,语 义u d d i 的实现及相关功能模块的思想。 第四章:语义w e b 服务匹配。利用语义词汇网络和本体推理来加强w e b 服务的 搜索,并提出基于语义标注的w e b 服务匹配算法。 第五章:原型实现。结合电风扇模具材料选择的案例来说明原型系统的实现。 第六章:总结与展望。对本文的研究工作进行总结并提出进一步的研究方向。 第2 章基于语义标注的w e b 服务发现框架 第2 章基于语义标注的w e b 服务发现框架 21 框架概述 框架采用删l 作为本体描述语言,并通过s a w s d l 标准为w e b 服务添加语义标 注。技术人员首先必须获得描述w e b 服务相关业务领域的o w l 本体文件,然后用 s a w s d l 为其想要查找的w e b 服务的描述添加语义注解。这样发现框架即可通过内 置的语义搜索算法自动查找服务注册中心中的w e b 服务,并将匹配度最高的若干 w e b 服务返回给技术人员以作进一步的分析与筛选。语义的采用可以明显提高w e b 服务查找的准确度。发现框架的体系结构如图2 1 所示: 呵璧j 目。丁j 图2l 基于语义标注的w e b 服务发现框架幽 基于语义标注的w e b 服务发现框架分为两个部分:一部分是语义w e b 服务的发 布,对w e b 服务进行语义标注,完成语义信息的添加,并注册到语义u d d i 中;另 一部分是语义y e b 服务的匹配,用户请求模板通过语义词汇模糊匹配和本体推理 得到相应的服务匹配结果。本论文将在第三章详细介绍语义w e b 服务发布的相关 技术,第四章详细介绍语义w e b e r 务匹配的相关技术。 第2 章基于语义标注的w e b 服务发现框架 2 2w e b s 眨务及其相关技术 w e b 服务技术是一种面向开放互联网协议的软件应用,它通过x m l 消息及协议 完成与其他应用软件的直接交互,实现更大范围内系统间的互联、互通和互操作, 其接口及绑定形式是基于x m l 标准的定义、描述和检索。目前,国际标准化组织 已经制定了一系列基于) ( m l 的w e b 服务标准,如通用描述发现集成协议u d d i 、w e b 服务描述语言w s d l 和简单对象访问协议s o a p 等。 2 2 1w e b 服务的基本架构 w e b 服务模型由3 个角色和3 个基本操作构成。3 个角色分别是服务提供者 ( s e r v i c ep r o v i d e r ) 、服务请求者( s e r v i c er e q u e s t o r ) 和服务注册中心( s e r v i c e r e g i s t r y ) ;3 个基本操作分别为发布( p u b l i s h ) 、发现( d i s c o v e r ) 和绑定( b i n d ) , 如图2 1 所示。 图2 2w e b 服务模型图 ,t 一 服务j 。| 一。 p 、 服务描述; - ( 1 ) 服务提供者:使用w s d l 文件来描述和定义w e b 服务,并在服务注册中心发 布这些服务的信息,使其可以被其它应用访问:接收和处理w e b 服务请求者的调 用。 ( 2 ) 服务请求者:要求满足特定服务的用户。从体系结构的角度看,它是寻 找并调用服务或启动与服务交互的应用程序。 ( 3 ) 服务注册中心:服务提供者在此发布他们的服务描述,服务请求者发现 服务并获得服务的信息。 对于w e b 服务的应用来说,必须发生以下三个功能操作: ( 1 ) 发布服务描述:服务提供者为了使自己的服务能够被使用,需要向服务 注册中心发布服务描述,以使服务请求者可以查找它。 第2 章基于语义标注的w e b 服务发现框架 ( 2 ) 匹配服务描述:在查找操作中,服务请求者直接检索服务注册中心,查 询满足要求的服务。 ( 3 ) 绑定服务:最后需要绑定服务。在绑定操作中,用户使用服务描述中的 绑定细节来定位、联系和调用服务,从而在运行时调用或启动与服务的交互。 2 2 2w e b 服务描述语言w s d l w e b j 艮务描述语言w s d l 是描述w e b j 艮务的x m l 格式语言,它由i b m ,m i c r o s o f t 等公司共同起草,于2 0 0 1 年3 月正式提交给w 3 c ,并获得了批准。 w s d l 提供了进行互操作时所必需的调用信息,它以文档的形式描述了交互时 所涉及的细节。它的基本构想是将w e b 服务描述为能够进行消息交换的通信端口 的集合,调用服务所需的参数以及服务返回的结果均以消息的形式进行传递,这 样就可以对w e b 服务在通信中所涉及的细节进行结构化描述。调用者可以通过 w s d l 了解通信所需知道的数据类型、消息结构、传输协议等信息,从而调用相关 服务。 w s d l 2 0 h 玎由类型( t y p e s ) 、接口( i n t e r f a c e ) 、绑定( b i n d i n g ) 、服务( s e r v i c e ) 等四种元素组成,如图2 2 所示。 图2 3w s d l 描述图 6 第2 章基于语义标注的w e b 服务发现框架 “类型 是消息的数据类型定义,通常用来描述交换信息;“消息代表待 传输数据的抽象定义,“消息 使用由“类型 所定义的类型来定义整个消息的 数据结构,即“消息”由一个或多个类型定义及类型的实例组成;“接口”表示 抽象操作的集合,每个操作一般会引用一条输入消息和一条输出消息;“绑定” 使操作和消息的具体协议与数据格式规范关联,即为“接口 中定义的操作和输 入输出消息指派具体的传输协议和数据格式规范;“终端节点 指定一个用于绑 定的地址,由此定义一个通信端点,w e b 服务通过该端口与其他w e b h 艮务或应用程 序交互;“服务 用于聚合一组相关的“终端节点构成一个w e b 服务的定义。 “类型 、“接口”和“绑定”属于w e b 服务接口定义部分,它们抽象描述 了w e b n 艮务基本接口信息,与具体的网络布置和数据格式绑定相分离,这样就可 以抽象定义w e b n 艮务的消息和端口类型,实现对它们的重用。在此基础上,“服 务 属于w e b 服务实现定义,它们描述了服务的运行信息,如调用服务的网址、 服务所绑定的协议( h t t p ,s o a p 等) 。 w s d l 描述的是调用某个w e b h 艮务的详细信息。w s d l 描述说明的是以下三个基 本属性:服务做些什么服务所提供的操作;如何访问服务一数据格式详细 信息以及访问服务操作的必要协议:服务位于何处_ 有特定的协议决定的网络 地址,如u r l 。 但是,w s d l 只包括了服务描述的较低层次,即服务接口的原始技术描述。这 是一种非功能描述( 定义了消息的目的地、消息的语法以及如何使用协议和编码 方案) ,而在此之前最好还有功能描述( 为什么服务请求者应该调用这个w e b 服 务) 。例如,这个w e b , i f 务提供了哪些商务功能? w e b 服务的质量如何? 服务提供者 的安全策略,是否能够为请求者保密等等。 2 2 3w e b n 臣务发现与u d di ( 1 ) w e b 服务发现 w e b h 曼务发现是服务请求者寻找服务提供者和服务描述文档的过程,是整个 w e b 服务模型的关键。服务发现的基本过程:在2 1 1 节所述w e b 服务架构中,w e b 服务发现其实是通过服务注册中心寻找满足服务请求者需求的服务提供者的过 程。基本步骤如下: 步骤1 :服务提供者使用w s d l 描述其服务( 服务描述) : 步骤2 :服务提供者将服务描述和w s d l 文档发布至u u d d i 注册中心( 服务发布) ; 步骤3 :服务请求者向u d d i 注册中心查找是否存在具有合适功能的服务提供 者( 请求者需求描述) ; 步骤4 :u d d i 注册中心将服务请求者的需求与存储的服务描述进行匹配并返 7 第2 章基于语义标注的w e b 服务发现框架 回结果( 服务匹配) ; 步骤5 :最后,服务请求者根据发现的服务描述定位和调用目标w e b j 艮务。 ( 2 ) u d d i u d d i 定义了w e b 服务的发布和发现方法,是一套基于w e b 的、分布式的、为w e b 服务提供信息注册中心的实现规范。同时也包含一组使企业能将自身提供的w e b 服务注册以使得别的企业能够发现的访问协议的实现标准。 可以把企业与服务的注册信息分成以下三组:白页、黄页和绿页。白页表示 有关企业的基本信息,如企业名称、联系信息等。黄页信息通过支持使用多种具 有分类功能的分类法系统产生的类别划分,能够在更大的范围内查找在注册中心 注册的企业或服务。这样的类别划分不仅可以关联企业及其服务,还可以关联 t m o d e l 。如果只提供白页和黄页中的一种或者这两种都提供,那么对于通过程序 发现和使用服务,注册中心的条目的价值就很有限。为此,有关怎样、哪里能通 过程序的方式调用服务的信息就很有必要了,而绿页就提供了这样的信息。绿页 是指与服务相关联的绑定信息,并提供了指向这些服务所实现的技术规范的引用 和指向基于文件的u r l 的不同发现机制的指针。 u d d i 注珊中心由u d d i 规范的一种或多种实现组成,它们可以互操作以共享注 册中心数据。通过u d d i ,企业可以发布希望被别的企业发现的w e b 服务。企业可 以通过u d d i 注册中心的w e b 界面或者是其提供的编程接口来通过应用程序来访 问。u d d i 提供了一种分布式的商业注册中心的方法,该商业注册中心维护了一个 企业和企业所提供的w e b 服务的全球目录,而且其中的信息描述格式是基于通用 的x m l 格式的。u d d i 同时也是一组基于w e b 的注册中心的名字,这些注册中心存储 了商业或其他实体的信息及其提供的服务的相关技术调用界面。这些注册中心通 过多个u d d i 操作入口站点运作,通过访问任意一个公共的u d d i 操作入口站点,任 何人都可以查询商业实体提供的或代表商业实体的w e b 服务。u d d i 商业注册中心 在逻辑上是集中的,在物理上是分布的,由多个根节点组成,相互之间按一定的 规则进行数据同步。当一个企业在u d d i 商业注册中心的一个实例中实施注册后, 其注册信息会被复制到其他u d d i 根节点,于是就能实现数据同步。u d d i 真正实现 了w e b ) 1 艮务注册信息的“一次注册,到处发布 。 如图2 3 所示,u d d i 的主要数据结构包括: 8 第2 章基于语义标注的w e b 服务发现框架 图2 4u d d i 的数据结构 商业实体( b u s i n e s s e n t i t y ) :商业实体信息可以被看成是一个关于商业机构 的标准描述元数据。作为注册和发现的核心,包括b u s i n e s s g e y ( 商业实体标识) 、 n a m e ( 名称) 、d e s c r i p t i o n ( 描述) 、b u s i n e s s s e r v i e e ( 商业服务集) 、 id e n tif ie r b a g ( 企业或商品标识集) 、c a t e g o r y b a g ( 分类集) 等元素。 商业服务信息( b u s i n e s s s e r v i c e ) :作为搿绿页 服务,对w e b 服务进行商业 业务描述,是b u s i n e s s e n t i t y 的子结构,一个b u s i n e s s e n t i t y 可以有多个 b u s i n e s s s e r v i c e s 。b u s i n e s ss e r v i c e 也是元数据容器,通过商业服务标识、商 业实体标识、名称、描述、绑定模版、分类集等元素,对特定企业所提供的特定 服务进行描述。 技术绑定信息( b i n d i n g t e m p i a t e ) :对于每一个b u s i n e s s s e r v i c e ,存在一个 或者多个技术实现方式,这些方式的技术描述通过b i n d i n g t e m p l a t e 来实现,包 括应用程序连接远程w e b 服务并与之通讯所必须的信息,例如b i n d i n g k e y ( 绑定标 识) 、s e r v i c e k e y ( 服务标识) 、d e s c r i p t i o n ( 描述) 、a c c e s s p o i n t ( 访问点) 等。 技术模型( t m o d e l ) :当一个程序或是程序员需要调用某个特定w e b 服务时, 必须根据应用要求得到足够充分的调用规范等相关信息,使得调用被正确执行。 因此,每一个绑定模板元素都包含一个特殊的列表元素,该元素包含了一个列表, 列表中的每个子元素都是一个调用规范的引用。这些引用是访问服务所需要的关 键的调用规范信息,即被称为“t m o d e l ”的数据项,它包括服务名称,发布服务 的组织以及指向这些规范的u r l 指针等。其中t m o d e l k e y ,o p e r a t o r 和 a u t h o r i z e d n a m e 分别表示t m o d e l 的主键、实施注册的u d d i 操作入1 2 站点以及对该 t m o d e l 拥有所有权的用户i d 。t m o d e l k e y 在注册后由u d d i 自动赋予,并在t m o d e l 整个生命周期中有效;仅能通过a u t h o r iz e d n a m e 指定的用户i d ,由o p e r a t o r 指定 的操作入口,进行该t m o d e l 的信息更新和对象删除,任意其他i d 不能操纵本对象, 9 第2 章基于语义标注的w e b 服务发现框架 也不能在其他操作入口站点上对该实体对象的数据进行维护。o v e r v i e w d o c 包含 的是规范的关键信息,包含了一系列的u r l ,通过这些u r l 可以访问到这个t m o d e l 的具体技术规范。 关联信息( p u b l i s h e r a s s e r t i o n ) :用以描述两个商业实体之间的关系信息。 u d d i 是当前描述并发现w e b 服务的工业标准,它提供了描述和注册服务的平台, 允许服务使用者发现满足需求的服务并集成到商务应用中( 服务描述至u u d d i 的映 射关系如图2 4 所示) 。虽然u d d i 有很多优势使其成为最主要的服务注册机制,但 它的服务发现机制却有着很大的缺陷。u d d i 是基于x m l 的,它并没有对服务提供 基于语义的描述。这使得u d d i 仅能提供基于语法层关键字匹配的服务发现机制, 这种机制不能准确描述所要查找服务的准确功能,查准率和查全率较低。同名异 义和同义异名都将导致基于语法关键字匹配的服务发现机制的低精确性。 图2 。5w s d l 2 o 至i j u d d i 的映射图 2 3 语义w e b 及其相关技术 随着i n t e r n e t 的发展,人们已经习惯于在w e b 上获得各种各样的信息。人们 借助于搜索引擎,门户网站来查询自己想要的信息。然而,由于今天的w e b 的内 i o 第2 章基于语义标注的w e b 服务发现框架 容基本上都是只有人才能读懂得,而w e b 上的数据却急剧的上升,使人淹没在数 据的海洋中,却难以找到想要的信息,搜索引擎返回的结果也多到人们不能逐一 的进行挑选。所谓的w e b ,实质是一个u r i 的空间,在这个空间中,任何一个u r i 都可以连接到另一个u r i 上,而毫无限制和说明。w e b 的这种模型,一方面是它成 为一个可以包容万物的普通的模型,另一方面却使机器难以加入其中来帮助人们 找到和处理所需的信息,而不是淹没在数据的海洋中,人们设计的w e b 的初衷是 使它成为一个信息空间,它应该不仅适用于人与人之间的交流,更应该能使机器 加入进来以帮助人们。 语义网之父t i m b e r n e r s - l e e 对语义万维网做了如下的描述n 羽:语义万维网 并不是一个孤立的万维网,而是对当前万维网的扩展,语义万维网上的信息具有 定义良好的含义,使得计算机之间以及人类能够更好的彼此合作。根据上面的描 述,可以给语义万维网做出这样的定义:机器可以理解数据含义的下一代万维网, 称之为语义万维网,语义万维网中的语义表示计算机对某个概念、术语或者符号 可以理解的“含义 。 从语义万维网的发展起源来看,语义万维网是人工智能领域和w e b 技术相互 结合的产物。人工智能领域中的知识工程研究从孤立的知识库系统逐渐发展到基 于i n t r a n e t 、e x t r a n e t 的信息系统集成,最后扩展到整个i n t e r n e t ,在这个研 究过程中,逐渐加深了对知识表示和推理的认识,并总结出了一些新的描述和推 理方法。另一方面,万维网经过十几年的发展,积累的海量数据需要一种新的, 机器可以自动完成的方式来处理和管理。因此,当两个领域的积累都比较成熟, 而且有了需求,就必然会走向结合。 因此可以说语义万维网建立的基础,是知识的概念化和形式化以及相应的推 理,并且它和人工智能有着深厚的渊源关系。因此,许多分析都需要从人工智能 领域的角度来考察。但是由于两者的应用环境不同,还存在着一些差异。例如: 从人工智能的逻辑学派和认知学派的观点看来,知识与概念化是人工智能的核 心。传统的人工智能系统,要求共同遵守一些公共概念的完全一致的定义,并且 一般都有它们各自狭义的,特有的用于信息推理的规则集合。尽管数据能够从一 个系统转换到另一系统,但由于系统间的推理规则通常以完全不同的形式存在, 而致使一个系统的规则不能用于其他系统。从这一点上来看,传统的人工智能系 统是一种集中、孤立( 专有) 的系统。同样,语义万维网也是以知识的概念化表示 为基础展开的。语义万维网中的知识,就是一系列对资源的建模及描述。资源, 是一个非常广泛的概念,它可以是网站、网页,甚至网页的某一个部分的内容。 这种描述采用某种形式的符号和表达式对w e b 上的与该资源相关的其它资源,以 及这些资源之间的关系进行刻画。但是,和传统的人工智能系统不同,语义万维 第2 章基于语义标注的w e b 服务发现框架 网的知识表示的特殊性在于,它本身要符合w e b 的分散性和通用型。知识的表示 本身可能是由众多的独立团体或个人,咀各种各样的方式来提供,而这些知识却 又要求能够被各种各样的应用实现共同理解,并且在一定的逻辑规则的指导下进 行推

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论