




已阅读5页,还剩47页未读, 继续免费阅读
(计算机软件与理论专业论文)基于本体的语义web服务搜索技术的研究.pdf.pdf 免费下载
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
基于本体的语义w e b 服务搜索技术的研究 摘要 随着i n t e r n e t 的发展和w e b 服务数量的增多,w e b 服务越来越难被准确地 搜索。其原因有四个方面:w s d l 主要是对服务的参数类型、消息格式、服 务操作、绑定协议和服务地址等物理信息进行语法级的描述,缺乏对服务功能 的语义描述;w s d l 中没有提供服务的q o s 信息,无法满足用户对服务性能 的需求:u d d i 注册中心不支持o w l s 和服务语义信息的注册,仅仅提供基 于关键字的查询,服务查准率不高;传统w e b 服务搜索技术缺乏对查询条件 中功能信息的有效处理,服务匹配效率较低。 本文基于领域本体,对语义w e b 服务搜索技术进行研究,提出了种基于 领域本体的语义w e b 服务搜索模型s w s f 0 ,其具体工作包括:在服务的语 义描述方面,使用q o s 本体对o w l s 中s e r v i c e p r o f i l e 的s e r v i c e p a r a m e t e r 参 数进行扩展,使得o w l s 不仅能描述w c b 服务的功能,还支持服务q o s 描述; 在服务注册机制方面,使用t m o d e l 类型对传统u d d i 进行了扩展,使u d d i 的数据结构能与o w l sp r o f i l e 各元素进行映射存储;在服务查询条件处理 方面,提出了c s e r 算法,对查询描述中的功能参数进行语义扩展,并将处理 过的查询信息转化为服务请求p r o f i l e :在服务匹配方面,采取服务分类匹配、 功能匹配和q o s 匹配的分步匹配策略。在功能匹配时,提出了o c d s 算法对服 务请求p r o f i l e 和服务广告p r o f i l e 的功能参数的相似度进行准确度量。并提出了 基于服务池的q o s 匹配方法,以满足用户对服务性能的需求。 基于s w s f 0 做了四组模拟实验,实验结果表明了s w s f 0 和对w e b 服 务搜索技术的改进达到了提高服务查询查准率和满足用户对服务性能需求的目 的。 关键词:语义w e b 服务;领域本体;o w l 。s ;服务搜索 t h er e s e a r c ho no n t o l o g y b a s e ds e m a n t i cw e bs e r v i c e s e ar c ht e c h n o l o g y a b s t r a c t w i t ht h er a p i dd e v e l o p m e n to fi n t e r n e ta n dt h ef a s ti n c r e a s eo fw e bs e r v i c e , w e bs e r v i c ei sd i f f i c u l tt ob ef o u n da c c u r a t e l y t h er e a s o n sa r ef o l l o w i n g : f i r s t l y ,t h ew s d li s as y n t a xl e v e ll a n g u a g ew h i c hj u s tb eu s e dt od e s c r i b e w e bs e r v i c e sp o r t t y p e ,m e s s a g e ,o p e r a t i o n ,b i n d i n g t e m p l a t ea n ds e r v i c eu r l i t l a c k st h es e m a n t i cd e s c r i p t i o nf o rw e bs e r v i c e s e c o n d l y ,t h ew s d l d o n tp r o v i d e q o si n f o r m a t i o n s ot h a ti t sh a r dt om e e tt h eq u a l i t yr e q u i r e m e n to fw e b s e r v i c e f o ru s e r t h i r d l y , t h eu d d il a c k st h es u p p o r tf o ro w l sa n dj u s to f f e r st h eq u e r y b a s e do nk e y w o r d t h ep r e c i s i o no fs e a r c hr e s u l t sa r ev e r yl o w l a s t l y , t h e t r a d i t i o n a lw e bs e r v i c e ss e a r c ht e c h n o l o g y s h o r to fp r o c e s s i n gt h eu s e f u l i n f o r m a r i o nf r o mq u e r yc o n d i t i o nw h i c hm a k e st h em a t c h i n gi n e f f i c i e n t b a s e dt h er e s e a r c ho no n t o l o g y b a s e ds e m a n t i cw e bs e r v i c e s e a r c h t e c h n o l o g y t h eo n t o l o g y - b a s e ds e m a n t i cw 曲s e r v i c es e a r c hm o d e l o fs w s f - 0i s p r e s e n t e di nt h i sd i s s e r t a t i o n t h er e s e a r c h e sf o rt h es w s f o a r ef o l l o w i n g : f i r s t o nt h ed e s c r i p t i o no fw e bs e r v i c e ss e m a n t i c ,t h es e r v i c e p a r a m e t e ro f s e r v i c e p r o f i l ei se x t e n d e df o rq o s ,t h a tm a k e st h eo w l sc o u l db eu s e dt on o t o n l yd e s c r i b ef u n c t i o ni n f o r m a t i o no nw e bs e r v i c eb u ta l s os u p p o r tt h ed e s c r i p t i o n o fs e r v i c eq o s s e c o n d o nw e bs e r v i c e sr e g i s t r a t i o nm e c h a n i s m ,t h ed a t am o d e lt m o d e li s u s e dt oe x p a n dt h et r a d i t i o n a lu d d lw h i c hm a pb e t w e e nt h eo w l - sp r o f i l ea n d u d d io ns e m a n t i ci n f o r m a t i o n t h i r d ,o nq u e r yc o n d i t i o np r o c e s s i n g ,t h ec s e ra l g o r i t h mi sp r e s e n t e dt o e x t e n dt h ec a p a b i l i t yi n f o r m a t i o no fq u e r yc o n d i t i o n ,a n dt h e nt h en o r m a t i v e r e q u e s tp r o f i l ei st r a n s f o r m e dt o0 w l sp r o f i l e f i n a l l y o n w e bs e r v i c e sm a t c h i n g ,t h eh i e r a r c h i c a lm a t c hs t r a t e g y i s i m p l e m e n t e df o rm a t c h i n gi n t h i sd i s s e r t a t i o n t h ef i r s t l e v e li ss e r v i c e c a t e g o r y m a t e h i n g t h eo c d sa l g o r i t h mi su s e dt om a t c hw 曲s e r v i c e s f u n c t i o n a l i t yb a s e d s e m a n t i cm a t c h i n gi bt h es e c o n dl e v e l t h el a s tl e v e li sq o sm a t c h i n gt om e e t u s e r s p e r f o r m a n c er e q u i r e m e n t sb a s e do ns e r v i c ep 0 0 1 f o u rs i m u l a t i o ne x p e r i m e n t sa r ed o n eb a s e do nt h es w s f 一0 t h ef o u rs e t so f r e s u l ta f f i r mt h a tt h ep r e c i s i o nm a t c h i n gi si m p r o v e db yi m p r o v i n go n 溉6 s e r v i c e s e a r c ht e c h n o l o g y ,a n du s e r s p e r f o r m a n c er e q u i r e m e n t sc o u l db e m e tb yt h e l l s w s f o k e y w o r d s :s e m a n t i cw e bs e r v i c e ;d o m a i no n t o l o g y ;o w l s :s e r v i c es e a r c h i i i 图2 1 图2 2 图2 3 图2 4 图2 5 图3 1 图3 2 图3 3 图3 4 图3 5 图4 1 图4 2 图4 3 图4 4 图5 1 图5 2 图5 3 图5 4 图5 5 图5 6 图5 7 图5 8 表2 1 表3 1 表5 1 表5 2 表5 3 表5 4 图表清单 w e b 服务的体系结构6 w e b 服务的协议栈7 语义w e b 层次模型8 t r a v e l 领域本体层次结构树的部分结构1 0 0 w l s 的结构模型1 2 w e b 服务语义描述体系1 4 b o o kh o t e l 服务的语义描述片段1 6 w e b 服务q o s 描述模式1 7 o w l sp r o f i l e 与u d d i 的映射关系1 8 a i r p l a n er e s e r v a t i o n 服务的部分注册信息1 9 用户查询条件的处理和语义扩展过程2 l c s e r 算法的部分代码2 2 语义w e b 服务三级匹配策略示意图2 4 服务池框架图2 8 s w s f 一0 模型结构图3 0 语义w e b 服务发现流程3 1 t r a n s p o r t a t i o n 本体的部分概念和属性关系3 4 可视化的服务查询界面3 5 i o 参数扩展前后服务搜索结果返回情况3 6 o c d s 算法与o w l s u d d i 算法的服务搜索结果返回情况3 7 三种搜索方法的查准率对比3 8 基于服务池的q o s 匹配界面3 9 四种基本的本体论语义关系1 0 i n p u t t m o d e l 定义1 9 i o 参数扩展前后情况3 5 服务广告描述信息3 6 i o 参数扩展前后r s 、r s 与o s l 、0 s 2 的匹配相似度3 6 o c d s 算法与o w l s u d d i 算法的服务相似度匹配结果3 7 v i i 独创性声明 本人声明所呈交的学位论文是本人在导师指导下进行的研究l 作及取得的研究成 果。据我所知,除了文中特别加以标注和致谢的地方外,论文中不包含其他人已经发表 或撰写过的研究成果,也不包含为获得 金8 曼薹些太堂 或其他教育机构的学位或 证书而使用过的材料。与我一同工作的同志对本研究所做的任何贡献均已在论文中作了 明确的说明并表示谢意。 学位论文版权使用授权书 本学位论文作者完全了解佥墨些盔堂有关保留、使用学位论文的规定,有权保 留并向国家有关部门或机构送交论文的复印件和磁盘,允许论文被查阅和借阅。本人授 权金目垦王些盔堂可以将学位论文的全部或部分内容编入有关数据库进行检索,可以采 用影印、缩印或扫描等复制手段保存、汇编学位论文。 ( 保密的学位论文在解密后适用本授权书) 学位论文作者签名: ) 乞 签字日期:2 , o ,一年9 月钐佃 学位论文作者毕业后去向: 工作单僦: 通讯地址: 导师签名: 彖叩 签字日期0 口年月谚日 电话: 邮编: 致谢 毕业在即,回首三年的研究生学业生涯。首先,感谢我的导师李心科副教 授,本文的研究工作是在李老师的精心指导和悉心关怀下完成的,在我的学业 和研究工作中无不倾注着导师辛勤的汗水,导师严谨的治学态度、渊博的知识 和丝不苟的工作作风,给我今后的学习和工作带来深远的影响,从李老师身 上,我不仅学到了扎实的专业知识,更重要的是学到了做人的道理。在此,再 次向李老师致以最衷心的感谢和诚挚的敬意。 同时,也要感谢本实验室邵望副教授和王钊副教授,他们在我的平时的学 习和科研中给予了无私的帮助和指导,在本论文的写作过程中,给予了很多的 启发和指导,提出了很多改进的意见。 我还要感谢软件工程研究所的戴必翔、郭斌、胡媛和许年芳以及师弟师妹 们,和他们一起工作和学习使我受益匪浅,也正是在和他们一起协作讨论,才 使得各项科研课题得以顺利完成。感谢潘文娟同学对论文格式方面的勘误,同 时也感谢计算机与信息学院的各位老师和和院系领导给我的帮助。 特别要感谢我的父母和家人,是他们含辛茹苦抚养我成人,给我人生指导, 给我学业以物质和精神支持,没有他们也就没有我的现在。 再次向所有关心和支持我的老师、同学、朋友、亲人表示由衷的感谢! i v 作者:丁先 2 0 10 年3 月 第一章导论 1 1 概述 1 1 1 本论文研究的背景、目的 w e b 服务( w e bs e r v i c e s ) 是通过w e b 接口提供的某个功能程序段,是可以通 过标准i n t e r n e t 协议访问的w e b 组件。作为种新兴的w e b 应用模式,可以很 好的集成w e b 上的数据,解决异构系统之间互操作和互通信的问题,降低复杂 应用系统的维护费用,这是因为w e b 服务有以下四个优点: ( 1 ) 平台无关性。w e b 服务使用的h t t p 和s o a p ( s i m p l eo b j e c ta c c e s s p r o t o c 0 1 ) 等协议己是互联网上通用的协议,任何能够访问i n t e r n e t 的平台都可以 访问w e b 服务,任何与i n t e r n e t 建立连接的应用程序都可以向w e b 服务发送 x m l 格式的s o a p 消息,也可以接收来自w e b 服务的s o a p 消息。 ( 2 ) 通信的安全性。w e b 服务像所有w e b 应用程序一样安全,对w e b 通信 应用程序使用的保护技术也可用于w e b 服务。 ( 3 ) 易复用性。“软件就是服务 已是软件发展的一个潮流,用户可使用面 向对象技术和组件对象技术来创建系统,采用接口技术可获得描述w e bs e r v i c e 的w s d l ( w e bs e r v i c ed e s c r i p t i o nl a n g u a g e ) 文件,生成客户端代理访问并调用 w e bs e r v i c e 。 ( 4 ) 商务集成的方便性。企业通过把业务软件的核心模块以w e bs e r v i c e 的 形式向其合作伙伴发布,方便其他企业对其核心业务的应用集成,这样既保留 了原有的数据和软件,又方便了彼此间的联系。 正是由于w e b 服务的以上优点,使其在目前电子商务应用中成为复杂应用 环境的解决方案之一【i l 。 w e b 服务中使用的技术有【2 j :服务接口技术s o a p ;服务描述技术w s d l ; 服务的注册技术u d d i ( u n i v e r s a ld i s c o v e r yd e f i n i t i o na n di n t e g r a t i o n ) 。 在w 曲服务架构中,服务的发现是重要部分,也是实现服务复用、组合的 前提,服务发现的结果直接关系到服务调用的质量,影响到服务组合的相容性 和可替换性。然而传统的w e b 服务发现技术存在不足,服务的查准率不高,不 能完全满足用户的功能需求。制约w e b 服务被准确的查询的原因主要有以下几 个方面: ( 1 ) 服务描述语言w s d l 主要是对服务的参数类型、消息格式、服务操作、 绑定协议和服务地址等物理信息进行语法级的描述,缺乏对服务功能的语义描 述,用户很难就服务的功能对服务进行准确定位。 ( 2 ) 服务描述中没有提供服务的q o s 信息( 如服务费用、服务响应时间、服 务提供者的信誉度等信息) ,这些q o s 信息可能在服务的组合和应用中很重要, 无法满足用户对服务性能的需求。 ( 3 ) u d d i 注册中心采用x m l 来描述它的数据结构,不支持o w l s 和服务 语义信息的注册,只提供基于关键字的查询,检索结果中会出现很多不相关或 相关度不大的服务,服务查准率不高;而且不支持语义约束的模糊匹配,容易 遗漏与检索概念同义或相关的服务,服务查全率低。 ( 4 ) 传统的服务发现技术没有采用统一规范来描述服务请求和服务广告,并 且缺乏对查询描述中功能信息的处理,不能准确的描述用户的功能需求,不利 于实现服务匹配的高效性。 本文研究的目的是对传统w e b 服务搜索技术进行改进,提高服务查询的查 准率,满足用户对服务功能和性能的需求,实现服务查询的自动化和智能化。 1 1 2 国内外研究状况分析 t i mb e r n e r s l e e 于l9 9 8 年就提出了语义w e b ( s e m a n t i cw e b ) 的概念,其思 想是利用元数据( m e t a d a t a ) 语言对w e b 资源的内容进行语义描述,通过建立公 共的本体( o n t o l o g y ) p 】,使i n t e r n e t 中所有信息都具有语义,实现资源在语义层 次上的互连,使计算机能够理解语义并作出判定和推理,便于人和计算机进行 交互。语义w e b 中的知识表示技术还可以用来对w e b 服务的注册、管理和搜 索等过程进行指导,规范服务提供者和服务请求者对服务的描述,提高w e b 服 务搜索的准确率。 w 3 c 在2 0 0 1 年2 月9 日正式成立“s e m a n t i cw e ba c t i v i t y ”,2 0 0 2 年6 月 在意大利的s a r d i n i a 举行了第一届语义w e b 国际会议,2 0 0 3 年1 0 月在美国 f l o r i d a 举行了第二届语义w e b 国际会议。目前w 3 c 推荐的语义w e b 语言是 r d f ( r e s o u r c ed e s c r i p t i o nf r a m e w o r k 资源描述框架) 【4 1 和o w l ( w e bo n t o l o g y l a n g u a g ew e b 本体语言) 【5j 。最早为w e b 服务增加语义信息的语言是 d a m l s t ,在d a m l s 的基础上发展起来的语言是o w l s t 5 l ( o n t o l o g yw e b l a n g u a g ef o rs e r v i c e sw e b 服务的本体语言) ,这两种语言都是从本体论的角度 对w e b 服务进行语义描述。 在语义w e b 服务的搜索方面,典型研究有卡内基梅隆大学的a u g m e n t u d d ir e g i s t r y 系统1 7 1 ( 基于d a m l s ) 和乔治亚大学的s p e e d r 项目t s j ( 基于 o w l s ) 。 在服务匹配算法方面,卡内基梅隆大学的m a s s i m op a o l u c c i 提出基w e b 服 务能力的语义匹配算法【9 j ,该算法采用d a m l s 语言来描述服务广告,把体现 服务功能的输入输出参数作为匹配依据,并根据预定义的匹配类型来计算服务 的匹配程度。还有k a t i as y c a r ab o 】,d a v i dm a r t i n i l l l 和m a s s i m op a o l u c c i 在文献 【12 】中提出的o w l s u d d i 匹配算法,但这些算法基本上都是从功能性和接口 上进行的匹配。其预设匹配类型不能很好对服务匹配程度进行准确度量。 在服务搜索模型方面,e a s t e r nm e d i t e r r a n e a n 大学的d u y g uc e l i k 和a t i l l a 2 e l c i 提出了一种语义w e b 服务智能搜索模型i s w s f ( i n t e l l i g e n ts e m a n t i cw e b s e r v i c ef i n d e r ) ”l ,该模型使用智能代理对查询条件中的关键字进行同义词扩 展,使用扩展后的关键字查询本体库,并返回本体检索结果供用户选择。该模 型仅扩展关键字的同义词,且服务搜索缺乏自动化。 国内在w e b 服务的搜索方面,北京大学的刘旅哲、黄罡等提出了基于服务 社区的w e b 服务发现方法i l4 。其思想是在服务注册时,将功能相同或相似的服 务聚合为服务社区,再基于服务社区进行服务搜索。并在文献【1 5 】中提出了基 于服务社区的服务聚合方法及其支撑框架,其思想是将服务社区作为服务发现 和服务调用的中心,使用q o s 对服务进行了扩展描述,以支持q o s 搜索。虽然 基于服务社区的搜索方法一定程度上简化服务发现过程,满足用户对服务性能 需求,整个服务发现框架是基于w s d l 的,服务的查询也是基于关键字的,没 有进一步考虑到基于功能的语义检索。 在语义w e b 服务研究方面,代表性的是中科院的史忠植实现了多主体服 务环境m a g e ( m u f t i a g e n t e n v i r o n m e n t ) ,该系统采用基于描述逻辑d l f d e s c r i p t i o nl o g i c ) 的主体服务匹配算法,运用描述逻辑对本体概念进行推理 l l 引,进而实现语义相似度匹配。 在匹配框架和匹配算法方面,同济大学的刘敏等提出了一种多层语义w e b 服务匹配框架【l 7 1 ,中国民航飞行学院的陈华英等提出了基于语义的w e b 服务二 次匹配算法【i 引,使用的算法都是o w l s u d d i 算法,本文的第四章会详细分 析该算法存在的缺陷。在对查询条件的处理上,武汉大学的曾志浩等提出了在 语义w e b 匹配中使用语义条件表达式【l9 】的方法,其思想是将查询条件转化为语 义条件表达式,再将语义条件表达式转换为一般表达式使用智能代理进行语义 推理,这种对查询条件的处理过于复杂,反而降低了服务匹配的效率。还有同 济大学的邹国兵等提出了一种基于本体的语义扩展搜索方法【2 ,虽然对查询条 件进行了一定的语义标注和扩展,提高了搜索的查准率,但是该扩展搜索方法 不是用于w e b 服务的搜索,而是对w e b 数据中关键信息进行语义标注和扩展。 1 2 本论文的研究内容、拟解决的关键问题及创新之处 1 2 1 研究内容 在w e b 服务体系中引入本体对w e b 服务的进行语义描述是目前改进w e b 服务发现技术的主流方向,在结合了w e b 服务框架中服务的描述、注册和搜索, 本文研究的主要内容按章节次序编排如下: ( 1 ) 分析传统w e b 服务发现技术和其存在的问题,通过对国内外研究成果 的分析和比较,将本体和语义推理引入到w e b 服务搜索中,确定了将“基于本 体的语义w e b 服务搜索 作为本文的研究方向。 ( 2 ) 在服务的语义描述方面,研究了如何使用o w l s 来描述w 曲服务,并 3 使用q o s 本体对o w l s 中s e r v i c e p r o f i l e 的s e r v i c e p a r a m e t e r 参数进行了扩展, 使得o w l s 不仅能描述w e b 服务的功能信息,还支持服务q o s 描述。在服务 注册机制方面,使用t m o d e l 类型对传统的u d d i 进行了扩展,使u d d i 的数据 结构能与o w l sp r o f i l e 各元素进行映射存储。 ( 3 ) 在服务查询条件处理方面,提出了c s e r ( c o n c e p ts e m e n t i ee x p a n d r e a s o n e r 概念语义扩展推理) 算法,对查询条件中的功能信息进行语义扩展,并 将处理后查询信息按照o w l sp r o f i l e 规范转化为服务请求p r o f i l e 。在服务匹 配方面,使用服务分类匹配、服务功能匹配、q o s 匹配的三级分步匹配策略, 在功能匹配中,提出了o c d s ( o n t o l o g yc o n c e p td i s t a n c es i m i l a r i t y 本体概念距 离相似度) 算法对服务的相似度进行准确度量。为满足用户对服务性能的需求, 提出了基于服务池的q o s 匹配方法。 ( 4 ) 在服务的语义描述、注册机制、查询条件处理和匹配策略及算法的研究 基础上,提出了一种基于本体的语义w e b 服务搜索模型s w s f o ( s e m a n t i cw e b s e r v i c es e a r c hf r a m e w o r k o n t o l o g y ) ,通过模拟实验验证了该模型在查准率得到 了一定的提高,能够基本满足用户对服务性能的需求。 1 2 2 本论文拟解决的关键问题和创新之处 1 2 2 1 拟解决的关键问题 ( 1 ) 使用q o s 本体对o w l s 进行扩展。o w l s 在对w e b 服务进行语义描 述时没有定义q o s 参数,需要建立q o s 本体来扩展o w l s 中s e r v i c ep r o f i l e 的s e r v i c e p a r a m e t e r 参数,使o w l sp r o f i l e 框架支持服务的q o s 描述,用于服 务的q o s 匹配,进而满足用户对服务的性能需求。 ( 2 ) w e b 服务语义描述在u d d i 中的注册。传统的u d d i 注册中心不支持 o w l s 和服务的语义信息存储,需要对u d d i 的数据结构进行扩展,使得u d d i 的数据结构能与o w l sp r o f i l e 各元素进行的映射存储。 ( 3 ) 对服务查询条件进行处理。传统的服务搜索技术没有采用统一的规范来 描述服务请求和服务广告,并且缺乏对查询描述中服务功能信息的处理,不能 很好的描述用户的功能需求,因此需要对查询描述中的功能信息进行处理,提 取查询条件中的功能信息,并将查询信息转换为服务请求p r o f i l e ,规范服务的 请求描述。 ( 4 ) 服务功能匹配算法改进。传统o w l s u d d i 算法的预设匹配类型不能 很好对服务相似度进行准确数字度量,需要对该算法进行改进。 1 2 2 2 本论文的创新之处 ( 1 ) 在对查询条件进行处理时,提出了c s e r 算法对查询条件中功能参数概 念参照引用的本体进行了语义扩展,用于提高服务查询的准确度。 4 ( 2 ) 在服务功能匹配时,提出了o c d s 算法对服务请求p r o f i l e 实例和候选 服务广告p r o f i l e 实例的i o 参数的相似度进行准确度量,用于提高服务查询的 查准率。 ( 3 ) 使用q o s 本体对o w l s 中s e r v i c ep r o f i l e 的s e r v i c e p a r a m e t e r 进行扩展, 使服务描述中支持服务的q o s 描述,用于实现基于服务池的q o s 匹配,满足用 户对服务性能的需求。 1 3 论文组织结构 本论文的组织结构如下: 第一章导论:介绍了论文研究的背景、国内外的研究现状、研究主要内 容、拟解决的关键问题、创新之处和论文的组织绐构。 第二章w e b 服务及语义w e b 相关技术:前一部分介绍w e b 服务的定义、 特点、体系结构及规范标准;后一部分介绍了语义w e b 的目标、体系结构、本 体、本体的建模方法、本体描述语言o w l 、语义w e b 服务和o w l s 。 第三章w e b 服务的语义描述与注册机制的研究:前以部分介绍了如何使 用q o s 本体对o w l s 中s e r v i c e p r o f i l e 的s e r v i e e p a r a m e t e r 参数进行扩展;后 一部分介绍了如何使用t m o d e l 类型对传统的u d d i 进行了扩展,使u d d i 的数 据结构能与o w l sp r o f i l e 各元素进行映射存储。 第四章语义w e b 服务查询处理和匹配算法的研究:前一部分介绍了如何 使用c s e r 算法对查询条件进行中的功能参数进行语义扩展;后一部分分析了 o w l s u d d i 算法的不足,介绍了服务分类匹配、o c d s 算法和基于服务池的 q o s 匹配。 第五章基于本体的语义w e b 服务搜索模型s w s f 0 及实验验证:在第三 章和第四章的基础上提出了基于本体的语义w e b 服务搜索模型s w s f o ,基于 s w s f 0 做了四组模拟实验,并对实验结果作了详细分析。 第六章总结与展望:总结本文所作的工作并展望未来研究前景。 第二章w e b 服务及语义w e b 服务 2 1 w e b 服务概述 w 3 c 对w 曲服务的定义是:w e b 服务是由统一资源定位符标识的软件系 统,具有自包含、自描述以及模块化等特点,用户可通过现有i n t e r n e t 协议使 用s o a p 消息来访问和调用【2 。 2 1 1w e b 服务的体系结构 w e b 服务框架包含:服务提供者、服务请求者和服务注册中心三个部分以 及发布、发现和绑定等基本操作b - 2 ,其逻辑结构如图2 1 所示。这三部分有如 下功能和操作: 图2 1w e b 服务的体系结构 ( 1 ) 服务提供者:负责使用w s d l 来描述和定义w e b 服务的功能、接口、 绑定地址等信息,并通过“发布 操作向服务注册中心发布服务信息,使其服 务可以被服务请求者查找和调用。 ( 2 ) 服务请求者:是要求满足特定功能需求的用户,通过“发现 操作向服 务注册中心提交查询服务请求,当找到目标服务,可通过“绑定”操作实现服 务调用。 ( 3 ) 服务注册中心:充当管理者的角色,用来存储和维护服务的注册信息, 它是服务发布和查询的中介。 2 1 2w e b 服务的相关技术和协议 完整的w e b 服务体系涉及的一系列协议可由如图2 2 所示的w e b 服务的协 议栈1 2 l j 表示。使用到基本的技术和协议有:s o a p 、w s d l 和u d d i 。 ( 1 ) 简单对象访问协议s o a p 是一种基于x m l 的标准化通信规范,是用于 分布式的环境下交换信息的协议【z2 。s o a p 主要使用t c p i p 应用层的h t t p 、 s m t p 、f t p 等协议,在服务请求者和服务提供者之间定义了一个通信标准。 ( 2 ) w s d l 是一种用来描述w e b 服务和说明如何与w e b 服务通信的x m l 语 言【2 3 1 。w s d l 采用t y p e s 、m e s s a g e 、p o r t t y p e 、b i n d i n g 、p o r t 和s e r v i c e 等元 素来描述w e b 服务支持的操作和信息,还包括调用w e b 服务时需要绑定的协 6 议和信息格式。 ( 3 ) u d d i 是统描述发现和集成协议,是一套基于w e b 的、分布式的、为 w e b 服务提供信息注册的标准规范【2 4 1 ,用于描述和发现服务。u d d i 还包括了 s o a p 消息的x m ls c h e m a 和u d d i 规范a p i 的描述。 u d d i 中心非常类似于“黄页系统,u d d i 商业注册中心提供的信息包括 三个部分:“白页 包括企业地址、联系方法和已知的企业标识:“黄页 包括 基于标准分类法的行业类别:“绿页”包括有关业务公开的服务的技术信息。 u d d i 商业注册中心在逻辑上是集中的,物理上是分布的,由多个根节点组成, 并且相互之间按一定的规则进行数据同步。企业在某个u d d i 商业注册中心的 实例上注册服务后,其注册信息会被自动的复制到其它的u d d i 根结点,便于 用户发现。 u d d ix m ls c h e m a 定义了四种主要的信息类型:商业实体信息 b u s i n e s s e n t i t y 是服务提供者的信息实体,包括企业基本信息、分类、标识等; 服务信息b u s i n e s s s e r v i c e 是服务信息实体,是b u s i n e s s e n t i t y 的子结构,它和 b i n d i n g t e m p l a t e 一起构成了“绿页”信息;绑定信息b i n d i n g t e m p l a t e 是服务 入口信息实体;t m o d e l 是服务接口或者分类法的信息描述实体。 为了支持发布和检索的自动化,u d d i 还定义了规范的查询a p i 和发布 a p i ,其中发布a p i 必须通过授权,每个操作入口站点都负责选择和实现一种 与发布a p i 兼容的授权协议,同时提供新用户的注册,使用查询a p i 功能不需 要经过任何授权,查询和发布都是使用基于h t t p 的s o a p 消息机制的协议实 现的。 w s f l 【 ! 旦:! ! ! ! 1 2 ) h t t p , 图2 2w e b 服务的协议栈 2 1 3 传统w e b 服务搜索技术的不足 u d d i 具有规范的一致性、强大的分类法、可扩展性等优点,集成了基于 工业标准的w e b 服务发布、发现技术,是目前分布式架构的典型解决方案,但 是基于u d d i 框架的传统w e b 服务搜索技术存在的不足之处主要有以下四个方 面: 7 ( 1 ) u d d i 不支持o w l s 。u d d i 注册中心存储的是服务的w s d l 文档,而 w s d l 语言只能描述w e b 服务的技术信息,不支持语义信息描述。 ( 2 ) w s d l 中没有提供服务的q o s 信息。有些q o s 信息( 如服务费用、服务 响应时间、服务提供商的信誉度等信息) 可能对服务的组合和应用很重要,无法 满足用户对服务性能的需求。 ( 3 ) 服务查询是基于的关键字的。搜索服务是根据u d d i 的分类法目录对服 务的服务名、分类等信息进行匹配。服务分类法的目录结构是唯一具有一定语 义的,但分类法的划分没有统一的标准和规范,因此服务搜索结果的准确度不 古 同o ( 4 ) 缺乏对服务描述中的关键信息的处理。服务查询时没有对服务查询描述 中服务信息( 尤其是功能信息) 进行提取,很难准确的描述用户对服务功能的需 求,在服务广告描述和服务请求描述间没有形成统一的规范,服务搜索的准确 度和效率不高。 2 2 语义w e b 语义w e b 是对目前w e b 技术的延伸和扩展,目的是解决数据管理有序性 与w e b 上信息无序性之间的矛盾,解决搜索引擎对查全率和查准率的要求与 w e b 信息缺乏语义之间的矛盾,让计算机可以理解w e b 上的文本信息,实现 w e b 搜索的自动化和智能化【2 5 1 。 语义w e b 采用基于x m l 的多层次的表示框架,其层次结构本身是没有语 义的。需r d f 来描述层次结构的语义,r d f 使用三元组集( 概念谓词对象, 类似于句子的主体、动词、客体) 来定义其结构元素之间的关系。x m l 加上r d f 相当于人工智能中s e m a n t i cn e t w o r k ,可使计算机相互理解并进行简单推理, 但还需要o n t o l o g y 作为标准概念体系。x m l + r d f + o n t o l o g y 构成了信息资源 的一个语义数据模型,是计算机理解内容的基础。 t i mb e r n e r s l e e 描述了如图2 3 所示的s e m a n t i cw e b 的层次结构【2 6 1 ,从下 层到上层功能逐渐增强。 图2 3 语义w e b 层次模型 第一层u r i 和u n i c o d e :对资源进行编码和标识,该层是语义w e b 的基础。 第二层x m l + n s ( x m l 名字空间) + x m ls c h e m a :对数据的内容和结构进 行表示。 第三层r d f + r d fs c h e m a :对w e b 的资源和类型进行描述。 第四层o n t o l o g y 本体层:对于应用领域的知识、概念以及概念间的关系 进行抽象描述,使得这些概念和关系在共享的范围内有着明确唯一的定义,使 机器能够在语义上和知识体系上理解数据,实现机器间的互操作。 第五层l o g i c :在知识体系的基础上提供了逻辑推理能力,利用语义w e b 各层的断言做出推理。 第六层p r o o f :对逻辑层的推理进行证明。 第七层t r u s t :为应用程序是否可被信任提供检测机制。 d i g i t a ls i g n a t u r e 跨越各层,主要采用加密技术和数字签名技术渗透到每层 的规范中,从而形成一个可信任的w 曲。 x m l 、r d f 、o n t o l o g y 是这七层的核心,用于表示w e b 信息的语义。目前 对x m l 、r d f 研究较为成熟,o n t o l o g y 是研究的重点。 2 3 本体 本体最早是一个哲学上的概念,从哲学的范畴来说,本体是对客观存在的 某个系统的解释或说明,它关心的是客观现实的抽象本质,为了给w e b 服务加 入的语义描述信息,将本体引入到计算机领域中。 w nb o r s t 给出了本体的一个定义【2 7 】:“本体是对共享概念模型明确的、形 式化的规范说明 。这其中体现了四层含义:概念模型:对客观世界中一些现 象的相关概念进行抽象而得到的模型,其表示的含义独立于具体的环境状态; 明确的:所使用的概念和对概念的约束都有明确的定义;形式化:是计算 机可读的;共享:o n t o l o g y 中反映的是相关领域中公认的概念集,体现的是 共同认可的知识体系,它所针对的是团体而不是个体。 2 3 1 本体的建模方法 根据p e r e z 等人关于领域本体的定义【2 8 1 ,一个本体( d o ) 可以被标识为一个 五元组:d - o = c ,r ,a ,i ,p ) 。 c ( c l a s s c o n c e p t ) 是类或概念集,可以是任何抽象实体。从语义上讲,它表 示是对象
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 基于PDCA循环的V公司污水处理工程项目质量管理优化研究
- 钻机设备操作安全手册
- 体育教学现状与教学方法分析
- 学习项目一 生活中的音乐说课稿-2025-2026学年初中艺术·音乐人教版简谱2024七年级上册-人教版简谱2024
- 银行柜员风险管理与防范措施
- 工程项目招投标管理操作手册
- 物流运输成本核算与节约策略
- 第2节 种群数量的变化说课稿-2025-2026学年高中生物人教版2019选择性必修2 生物与环境-人教版2019
- 小结与评价说课稿-2025-2026学年初中数学湘教版2024七年级上册-湘教版2024
- 学生科学学习时间规划表
- 2025年10月10日江苏省税务遴选笔试真题及答案解析
- 矿山道路土路施工方案
- 丽水2025年丽水市生产力和投资促进中心招聘4人笔试历年参考题库附带答案详解
- 2025-2026学年人教版(2024)初中生物八年级上册(全册)教学设计(附目录)
- 2025-2026学年 小学数学二年级上册 第一次月考(一、二)(含答案)(人教版)
- 汽车展示大厅设计方案
- HAZOP分析法在绿氢制氢站工艺风险评估中的应用探索
- 2025年云南省劳动合同书版
- 吊绳外墙施工方案
- 周转材料质量验收标准
- 北京MBA实战课堂《管理学课堂游戏》的演示与运用
评论
0/150
提交评论