已阅读5页,还剩51页未读, 继续免费阅读
(计算机应用技术专业论文)基于语义的web服务发现研究(1).pdf.pdf 免费下载
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
摘要 w e b 服务发现是w 曲服务体系架构的重要组成部分,发现满足 用户需求的服务是实现服务复用、服务组合的重要前提。随着w e b 服务的迅速发展和急剧增加,特别在服务自动组合和复杂服务互操作 进程中,有效的w e b 服务发现己成为具有挑战性的问题。因此,如 何在诸多的w e b 服务中,快速、准确和高效地发现满足用户需求的 w e b 服务是现阶段急需解决的关键问题之一。 针对目前w e b 服务发现中存在的问题,本文结合语义w 曲相关 技术,进行基于语义的w e b 服务发现研究。为了能够准确地描述w e b 服务,以实现服务请求与注册服务的有效匹配,给出了一个基于 o w l s 的语义w e b 服务发现描述模型和相应的服务请求描述模型, 较全面地描述了服务的功能和非功能属性。目前,概念相似度算法存 在片面性和多样化,本文给出一种综合的语义概念相似度算法,较全 面地考虑了影响本体概念相似度的相关因素;并在此基础上,研究了 服务功能匹配,以提高了服务查全率和查准率。同时,为提高服务发 现效率和发现服务的可用性,给出了一种基于语义的w e b 服务发现 模型和基于服务聚类的语义w e b 服务发现机制。使用服务聚类算法 将具有一定相似度的注册w e b 服务进行聚类组织;在服务发现时, 计算服务请求描述与服务聚类的相似度,过滤掉不相关聚类的服务, 以减少服务查询处理时间,来提高服务发现效率。同时,结合服务质 量对w e b 服务进行最优选择。 本文主要在w e b 服务描述、服务匹配算法、w e b 服务发现模型 和服务发现机制等方面进行了研究,来提高了服务发现的性能:查全 率、查准率和查询效率。 关键词w e b 服务,语义w e b ,服务匹配,语义w e b 服务发现,服务 聚类 a bs t r a c t we bs e r v i c ed i s c o v e r yl sa ni m p o r t a n tc o m p o n e n to fw e bs e r v i c e a r c h i t e c t u r e d i s c o v e r i n gw e bs e r v i c e st om e e tt h en e e d so fu s e r si s a n i m p o r t a n tp r e r e q u i s i t et oa c h i e v ew e bs e r v i c er e u s ea n dc o m p o s i t i o n w i t ht h er a p i dd e v e l o p m e n to fw e bs e r v i c ea n dt h es h a r pi n c r e a s ei n n u m b e r ,e f f e c t i v ew e bs e r v i c ed i s c o v e r yh a sb e c o m eac h a l l e n g i n gi s s u e , p a r t i c u l a r l yi nt h ea u t o m a t i cs e r v i c ec o m p o s i t i o na n di n t e r o p e r a t i n g p r o c e s so fc o m p l e xs e r v i c e t h e r e f o r e ,i ti s o n eo ft h ek e yi s s u e st ob e r e s o l v e da tt h i ss t a g et h a th o wt od i s c o v e rs e r v i c e sm e e t i n gu s e r sf r o ma l a r g en u m b e ro fw e b s e r v i c e si nar a p i d ,a c c u r a t ea n de f f i c i e n tw a y i no r d e rt or e s o l v et h ee x i s t i n gp r o b l e m so fw e bs e r v i c ed i s c o v e r y , t h es e m a n t i c b a s e dw e bs e r v i c ed i s c o v e r yi n t e g r a t i n gw i t hs e m a n t i c w 色bt e c h n o l o g yi sp r o p o s e di nt h ep a p e r i no r d e rt oa c h i e v et h ee f f e c t i v e m a t c h i n gb e t w e e ns e r v i c er e q u e s t sa n dr e g i s t e r e ds e r v i c e s ,aw e b s e r v i c e d e s c r i p t i o nm o d e la n dac o r r e s p o n d i n gd e s c r i p t i o nm o d e lo ft h es e r v i c e r e q u e s ta r eg i v e n ,d e s c r i b i n gf u n c t i o n a la n dn o n f u n c t i o n a la t t r i b u t i o n s o fs e r v i c e sm o r ec o m p r e h e n s i v e l y a tp r e s e n t ,o na c c o u n to ft h ed i v e r s i t y a n do n e s i d e d n e s so ft h e e x i s t i n gc o n c e p ts i m i l a r i t ya l g o r i t h m s ,a n i n t e g r a t e ds e m a n t i cs i m i l a r i t ya l g o r i t h mi sp u tf o r w a r dt ot a k et h ei m p a c t f a c t o r so nt h es i m i l a r i t yb e t w e e no n t o l o g yc o n c e p t si n t oa c c o u n ti na m o r ec o m p r e h e n s i v ew a y o nt h i sb a s i s ,t h ef u n c t i o nm a t c h i n gb e t w e e n s e r v i c e si sr e s e a r c h e di nt h ep a p e rt oi m p r o v et h er e c a l la n dp r e c i s i o no f w e bs e r v i c ed i s c o v e r ye f f e c t i v e l y i nt h em e a n t i m e ,as e m a n t i c b a s e d w e bs e r v i c ed i s c o v e r ym o d e la n das e m a n t i c b a s e dw e bs e r v i c e d i s c o v e r ym e c h a n i s mw i t hc l u s t e r i n g ,a r ep r e s e n t e dt oe n h a n c et h e e f f i c i e n c yo fw e bs e r v i c ed i s c o v e r ya n dt h ea v a i l a b i l i t yo ft h ef o u n d s e r v i c e s b yu s i n gt h ec l u s t e r i n ga l g o r i t h m ,t h er e g i s t e r e dw - e bs e r v i c e s w i t ht h ec e r t a i ns i m i l a r i t ya r eg r o u p e dt o g e t h e r w h i l es e r v i c ed i s c o v e r y , f i r s t l y , t h es i m i l a r i t yb e t w e e nt h ed e s c r i p t i o no fas e r v i c er e q u e s ta n dt h e s e r v i c ec l u s t e r i n gi sc a l c u l a t e d ;t h e n ,n o n c l u s t e r i n g r e l a t e ds e r v i c e sa r e f i l t e r e da c c o r d i n gt ot h es i m i l a r i t y , w h i c hc a ni m p r o v et h ee f f i c i e n c yo f t h es e r v i c ed i s c o v e r yt h r o u g hr e d u c i n gt h ep r o c e s s i n gt i m e a n df i n a l l y , t h ec o m b i n a t i o no ft h es e r v i c eq u a l i t yi su s e dt oc h o o s et h eo p t i m a l s e r v i c e s i nt h ep a p e r ,w e bs e r v i c ed e s c r i p t i o n ,s e r v i c em a t c h i n ga l g o r i t h m , w e bs e r v i c ed i s c o v e r ym o d e la n dw e bs e r v i c ed i s c o v e r ym e c h a n i s ma r e s t u d i e dt oi m p r o v et h ep e r f o r m a n c eo fw e bs e r v i c ed i s c o v e r y :t h er e c a l l , t h ep r e c i s i o na n dt h ee f f i c i e n c y k e yw o r d sw e bs e r v i c e ,s e m a n t i cw e bs e r v i c em a t c h i n g ,s e m a n t i c w e bs e r v i c ed i s c o v e r y , s e r v i c ec l u s t e r i n g i i i 原创性声明 本人声明,所呈交的学位论文是本人在导师指导下进行的研究工作 及取得的研究成果。尽我所知,除了论文中特别加以标注和致谢的地方 外,论文中不包含其他人已经发表或撰写过的研究成果,也不包含为获 得中南大学或其他单位的学位或证书而使用过的材料。与我共同工作的 同志对本研究所作的贡献均已在论文中作了明确的说明。 作者签名:奎塾日期: 学位论文版权使用授权书 本人了解中南大学有关保留、使用学位论文的规定,即:学校有权 保留学位论文并根据国家或湖南省有关部门规定送交学位论文,允许学 位论文被查阅和借阅;学校可以公布学位论文的全部或部分内容,可以 采用复印、缩印或其它手段保存学位论文。同时授权中国科学技术信息 研究所将本学位论文收录到中国学位论文全文数据库,并通过网络向 社会公众提供信息服务。 日期:到! 年上月4 日 硕士学位论文 第一章绪论 1 1 引言 1 1 1 研究背景 第一章绪论弟一早三百记 2 0 世纪9 0 年代初,为了能够在异构网络上快速方便地构建分布式系统,o m g ( 对 象管理组织) 、m i c r o s o f t 、s u n 和i b m 等许多公司和组织都推出了自己的分布式对象 技术,比较流行的有o m g 的c o r b a ,m i c r o s o f t 的d e c o m c o m + 和s u n 的r m f e j b 。 分布式对象技术允许用户把不同的应用集成到一起,这是一重大进步。但这些分布式 对象技术都是紧耦合平台,不同的分布式对象技术之问缺少良好的互操作性,例如 c o r b a 和d c o m 之间要通过d c o m c o r b a 桥才能通信,如果c o r b a 和d c o m 的底层协议改变,就必须修改d c o m c o r b a 桥。针对分布式对象技术之间的上述 缺陷,m i c r o s o f t 、i m b 、s u n 等公司提出了w e b 服务i lj 。 w | e b 服务是自包涵自描述性的、独立的、模块化的应用程序,具有分布、异构、 自治、松耦合、以及运行时间长和不可预见性等特点。w e b 服务是一种新的分布式技 术,采用开放标准,支持任何应用之间的互操作性,能有效地集成i n t e r n e t 上的业务 过程和应用程序。w e b 服务涉及到的最基本的技术规范【2 j 包括:w e b 服务描述语言 w s d l 、统一描述、发现和集成u d d i 以及简单对象访问协议s o a p 。w e b 服务的所 有规范都是基于x m l 的,因此继承了x m l 良好的数据互操作性和扩展性,基于任 何平台和编程语言的应用都可以采用标准的i n t e m e t 技术和协议方便地访问w 曲服 务。随着w e b 服务技术应用的日益广泛,w e b 服务成为i n t e r n e t 网络环境中资源封装 的标准。 以w e b 服务为代表的软件服务及软件服务协同已经成为开放协同的网络环境下 一种典型的i n t e m e t 应用形态,特别是将传统业务设计成可重用的和柔性的w e b 服务 组件,通过松散耦合交互、按需组合实现商务活动,更能为w r e b 服务提供广阔的应 用前景。无论是基于w e b 服务的软件开发方法,还是通过w e b 服务跨越企业界限实 现业务迅速集成,w e b 服务发现都扮演着极其重要的角色【i 】。 1 1 2 问题提出 随着i n t e m e t 上w e b 服务数目和种类的增加,如何在诸多服务中找到符合要求的 服务,成为利用w e b 服务进行资源共享必须解决的问题。w e b 服务发现与传统的信 息检索有很多相似之处,但前者具有更高的复杂性和实现技术的不成熟性,将有更广 硕士学位论文第一章绪论 阔的应用领域【3 j 。目前因特网在w 曲服务的描述和检索方面,仍然存在着许多技术缺 陷,制约着w e b 服务的准确、高效的发现。因此,如何从如此众多的信息中过滤出 相关信息就是服务发现、服务匹配急需解决的问题【4 1 。 目前已有的w e b 服务发现技术大都是采用基于关键字的服务匹配机制。在描述 语言上,广泛采用w e b 服务描述语言w s d l 。它主要提供w e b 服务的物理信息,并 仅描述w e b 服务接口的语法,缺乏对服务功能的语义描述,使得机器无法理解和处 理,因此并不能对行为约束进行有效地支持;在匹配算法上,大多采用基于关键字的 匹配1 5 j 。典型系统有i b m 、m i c r o s o f t 、s u n 等公司的各类u d d i 系统,只能提供基于 关键字的匹配,检查结果中会出现很多不相关的w e b 服务,查准率不高;另一方面 由于只支持关键字的精确匹配,不支持语义约束的模糊匹配,容易遗漏大量与检索概 念同义或相关的服务,因此查全率也不高。 为了解决上述问题,研究界将语义网技术应用到w e b 服务,提出了基于语义的 w e b 服务发现。语义w e b 服务使用语义w e b 的知识标记方法描述服务的语义,从而 使其成为计算机可理解的实体,以支持服务的自动发现、匹配、执行和组合等操作【2 】o 与传统的w e b 服务发现相比,基于语义的w e b 服务发现具有较高的查全率和查准率 j ,提高了w e b 服务发现的性能。但现有的基于语义的w 曲服务发现存在下列问题: 1 w e b 服务语义描述模型与现有的模型不兼容。当前w e b 服务主要采用w s d l 描述、u d d i 存储。而语义w e b 服务描述模型主要采用w e b 服务本体语言o w l s 描述。 2 现有的w e b 服务描述语言大都缺少服务质量描述。虽然,研究界进行了很多 相关的研究,但目前还没有制定出一个统一的服务质量标准。随着w e b 服务的发展, 具有相同或相似功能的w e b 服务越来越多,但其性能可能存在着很大差异。因此, 结合服务质量进行服务最佳选择成为w e b 服务发现研究中的一个热点。 3 w e b 服务发现描述体系结构多样化。现有的w e b 服务发现描述体系结构主要 分为三类:集中式结构、p 2 p 结构和混合式结构,每种体系结构又存在不同的实现方 式。 4 服务匹配算法存在着多样化和片面性的特点。目前,存在多种基于语义的w e b 服务匹配算法,但大多都不能够全面考虑语义相似度的影响因素,出现了同等条件下 服务之间难以区别的情况。 5 服务匹配效率问题。基于语义的w e b 服务发现虽然具有较高的服务查全率和 查准率,但由于是基于语义推理,实现比较复杂,匹配效率较低。 1 1 3 研究目的与研究意义 本论文针对目前w e b 服务发现中存在的问题进行研究。在语义w e b 服务相关技 术,特别是本体技术研究的基础上,进行w e b 服务发现描述模型和服务匹配算法的 2 硕士学位论文第一章绪论 研究,进一步提高服务的查全率和查准率;同时,对现有w e b 服务发现模型进行研 究,提出了一个以u d d i 为基础的基于语义的w e b 服务发现模型,实现基于语义的 w e b 服务发现。针对语义w e b 服务发现低效率的不足,使用聚类算法将具有一定相 似度的w e b 服务组织在一起;在服务发现时,减少服务查找处理时间,进而提高服 务效率。此外,服务发现时,结合服务质量对w e b 服务进行最优选择,达到提高服 务发现质量和服务可用性的目的。总的来说,进行基于语义的w e b 服务发现研究, 以提高w e b 服务发现性能:查全率、查准率和发现效率。 w | e b 服务发现是w e b 服务体系架构的重要组成部分,发现满足用户需求的服务 是实现服务复用、服务组合的重要前提。随着w e b 服务的迅速发展和急剧增加,特 别在服务自动组合和复杂服务互操作进程中,有效的w e b 服务发现己成为具有挑战 性的问题。因此,如何在诸多的w e b 服务中,快速、准确和高效地发现满足用户需 求的w e b 服务是现阶段急需解决的关键问题之一。 1 2 研究现状 针对传统w e b 服务发现中存在的底查全率和查准率问题,研究界提出了将语义 w e b 技术应用到w e b 服务领域,为服务的描述提供语义信息,即语义w 曲服务1 7 芦j ( s e m a n t i cw r e bs e r v i c e ,s w s ) 。语义w e b 服务结合语义w e b 技术 9 1 和w 曲服务技术, 为提高w e b 服务发现性能提供了条件。对w e b 服务发现技术来说,语义w e b 无疑是 一种根本的解决方案,它力图将人类的智慧转化为机器的智能,使其能代表人类工作。 语义w e b 服务为w e b 服务的发现、执行、解释和组合的自动化提供有效支持,从而 实现异构系统的互操作以及无缝集成。 语义w e b 服务作为一个独立的领域,最早开始于2 0 0 1 年。m d l r a i t h ,t r a nc a os o n 及h o n g l e iz e n g 首先指出了将语义w 曲技术应用到w _ e b 服务中的重要性和前景【l 。 同年,o w l s 的原始版本( d a m l s 的后继版本) i l l 发布。2 0 0 4 年2 月,w 3 c 正式宣 布o w l 成为w e b 本体语言的建议标准【1 2 】。基于语义的w e b 服务描述语言还包括: w s d l s ,w s m i 和s w d l 等。研究界开始提出基于语义的w e b 服务发现研究。 美国卡梅隆大学m a s s i m op a o l u c c i 等人提出的a u g m e n tu d d ir e g i s t r y 系统【1 3 1 , 对u d d i 进行语义扩充,使用d a m l s 描述w e b 服务的语义信息,服务发布时,将 其存储在知识库中。通过d a m l s u d d i 转换器建立d a m l s 服务和u d d i 中存储 服务的关系。此外,在u d d i 之上增加一个d a m l s 匹配器模块来处理所发布的 d a m l s 描述,完成基于语义的推理。l s d i s 1 4 】实验室在对w s d l 进行语义扩充的 基础上也对u d d i 进行扩展。它的扩展内容主要包括两个方面:将基于w s d l s 描 述的w e b 服务的语义标准存储在现有的u d d i 结构中;提供一个接口来构件语义标 准的查询。u d d i 利用其内部的结构t m o d e l 和c a t e g o r y b a g 来表示服务描述中所涉及 到的本体概念。文献 1 5 定义一个获取服务语义的高层模型,在抽象层次上对服务框 3 硕士学位论文 第一章绪论 架建模,用于语义w 曲服务发现、选择和通信。文献 1 6 】介绍一种基于本体的灵活的 语义w e b 服务发现框架。它依赖于用户提供的信息和具体上下文,将用户本体映射 到用于描述w e b 服务的相关领域本体;允许用户按照按照某一标准对发现的服务进 行排序。文献1 7 】介绍了o w l s 与u d d i 之间的映射,对u d d i 注册器和u d d ia p i 进行语义扩展,使得支持语义匹配;在服务注册时,将发布服务中概念与所有本体概 念进行匹配,注释匹配度,以加快服务查询速。文献【1 8 ,1 9 各提出一个结合语义和搜 索引擎技术的语义w e b 服务发现查询模型,该模型可以搜索和融合u d d i 注册器的 信息,然后提供用户查询的服务。文献 2 0 ,2 1 使用一种有效的聚类算法,将大量的查 询结果划分为较小的结果组,帮助用户快速准、确地浏览到相关服务。针对目前的表 示方法不足以准确地描述和发现人类所要求的服务,文献 2 2 1 为服务建立一个基于领 域本体的模糊本体模型,以促进w e b 服务的模糊计算:同时给出了一个使用模糊本 体进行w e b 服务发现的框架。文献 2 3 ,2 4 给出了基于语义的目标w e b 服务描述本体, 从功能、性能和语义特征等方面描述w e b 服务,并提出了一个基于w e b 服务特征元 素的的服务发现模型。 基于语义的w e b 服务匹配是一个自动决定提供的服务是否能够满足指定的服务 请求和合理地配置服务的过程。基于语义的w e b 服务服务匹配可以通过两种方法实 现:一种方法是通过本体概念之间的逻辑包含关系( 包含、等价等) 来实现基于语义的 服务匹配;另一种方法,则通过本体概念之间的相似性为基础通过计算服务描述之间 相似性来实现。l a r k s 2 5 j 是最早研究基于语义服务匹配的系统,支持三个等级上的 匹配:e x a c t 、p l u g i n 和r e l a t e d 。m a s s i m op a o l u c c i 等人提出的u d d i d a m l s 语义 w e b 匹配,将w e b 服务匹配分为四个等级:e x a c t 、p l u g i n 、s u b s u m e 和f a i l ,成为 经典的语义w e b 服务匹配方法。o w l m x 2 6 】综合利用逻辑推理和基于内容的信息检 索方法进行计算基于o w l s 规范描述定义的服务之间的相似度,将服务去和服务发 布之间的匹配分为五个不同的层次:e x a c t 、p l u gi n 、s u b s u m e s 、 s u b s u m e d b y 和n e a r e s t - n e i g h b o r 。文献 2 7 】提出一种基于o w l s 语言的服 务描述和查发现方法,将服务匹配度用本体概念的语义相似度来衡量,将服务请求和 服务之间的匹配度量化为 o ,1 】区间上的任意数值来表示,引入弹性匹配策略,提高 w e b 服务匹配的灵活性。文献 2 8 ,2 9 提出一种基于语义距离的本体概念相似度计算方 法。同时,在此基础上,后者提出了一种多层次的w e b 服务匹配方法,将服务匹配 等级扩充到无限。文献 3 0 提出一种基于功能语义的w e b 服务发现方法,通过定义 w e b 服务功能描述模型,规范服务提供者和使用者对w e b 服务功能的描述;同时构 建领域功能本体,提出语义标注的机制,用户可以基于功能发现w e b 服务。 随着w 曲服务的迅速发展,提供相同或相似功能的w e b 服务越来越多,面临着 如何挑选出最好服务的问题,而w e b 服务的非功能属性服务质量q o s 描述就是这个 问题的解决方案。但目前语义w e b 服务描述语言大都缺少服务质量描述,且统一的 4 硕士学位论文第一章绪论 服务质量标准,因此,服务质量成为语义w e b 服务,特别是服务发现中的一个热点。 l e h u n gv u l 3 1 j 为服务质量q o s 信息提供了通用的语义描述:q o s 参数和服务提供者 所提供的q o s 等级的描述;服务提供者提供某个特定q o s 值所必须满足的条件。该 描述将将场景引入了服务的q o s 描述,从而使服务提供者可以基于s l a 提供服务的 q o s 质量。k y f i a k o s l 3 2 1 等人提出一个基于q o s 的w e b 服务描述超本体o w l q ,用于 扩展o w l s ,描述可能的部分q o s 指标和制约因素;并提出一个计算两个不同q o s 指标相似性的语义匹配算法。文献 3 3 1 提出一个服务质量描述模型,较客观地反映了 服务非功能属性的特征,并研究了该q o s 模型上的各种计算和评价方法。并在此q o s 模型的基础上研究了一种q o s 驱动的服务匹配算法。文献 3 4 】提出一个基于q o s 本 体的语义w 曲服务发现模型。在服务发现过程,该模型使用分类和反馈机制加入q o s 本体信息,以提高服务发现的质量。 综观现有研究,各自不同的w e b 服务发现机制大多考虑在服务描述上增加语义 信息,并给出相应的语义w e b 服务匹配算法。因此,结合语义w e b 和w e b 服务技术 研究技术实现服务的语义匹配,是服务发现领域的重要研究方向,也是解决服务发现 性能问题的重要途径。 1 3 研究内容 随着面向服务计算的发展,w e b 服务的数目和种类的不断增加及对w e b 服务应 用要求的不断提高,如何在诸多服务中找到符合要求的服务己成为面向服务的分布式 系统中一个研究热点。但目前存在的w e b 服务发现、匹配机制还存在一定的缺陷。 传统的基于u d d i 接口的服务发现,查准和查全率低,同时不能实现服务的自动发现; 基于语义服务发现,查准率和查全率有一定提高,但是基于语义的服务发现和匹配策 略存在匹配程度划分粗糙、相应时间长等问题。发现符合用户需求的服务是实现服务 复用、组合的重要前提,服务发现的效果直接关系服务调用的质量和能否真正实现服 务的即插即用,影响服务组合的相容性和可替换性。因此提高服务的查准率和查全率, 发现最符合用户需求的服务是面向w e b 服务计算中一个很重要的环节。 本课题研究的是基于语义的w e b 服务发现,具体研究内容如下: 1 w 曲服务发现描述模型 w e b 服务描述是服务发现的基础。w e b 服务发现就是通过匹配算法较两个服务 描述之间的精确程度。因此,服务描述直接影响服务发现的性能,良好的w e b 服务 描述有助服务发现。目前的w e b 服务描述语言分为两大类:语法级别的w e b 服务描 述语言( 如w s d l ) 矛 i 语义级别的w e b 服务描述语言( 如o w l s ) 。语法级的w e b 服务 描述语言,着重描述w e b 服务接口的语法,对行为约束缺少有效支持。语义级的w e b 服务描述语言,增强对w e b 服务功能、行为的语义描述,但缺少服务质量描述。 论文在对当前w e b 服务描述语言分析和研究的基础上,特别是对o w l s 语言研 气 硕士学位论文 第一章绪论 究的基础上,提出了一个w e b 服务发现描述模型,较全面地描述服务的功能和非功 能信息,以准确描述发布服务和服务请求,进而提高w e b 服务发现性能。 2 基于语义的w 曲服务匹配 服务匹配是指通过一定的匹配算法比较两个服务描述之间的精确程度。服务匹配 算法是服务发现机制的核心,因此,如何利用服务描述中的信息来进行服务的匹配是 服务发现的关键所在。服务发现系统将服务查找请求映射为服务请求描述,从而将服 务发现的问题转化为服务请求描述与服务广告描述之间的匹配问题。 本文在基于概念逻辑包含关系的等级匹配算法研究的基础上,综合考虑影响概念 相似度的多种因素:概念包含关系、语义距离和概念划分细致程度等,提出一种综合 的概念相似度计算方法,以准确地计算本体概念之间的的相似度。同时,在本体概念 相似度的基础上,研究和分析了w e b 服务功能匹配算法,以较准确地计算服务相似 度,提高w e b 服务发现性能:查全率和查准率。 3 基于语义的w e b 服务发现 目前的w e b 服务发现机制是基于统一描述、发现和集成,即u d d i 。由于缺乏 语义描述和基于关键字的服务发现机制,致使u d d i 具有较低的服务发现性能。但 u d d i 已是目前公认的w e b 服务注册、发现标准,已经被广泛采用,因此u d d i 标 准不应该被替换。本文在对现有u d d i 研究的基础上,提出一个基于语义的w e b 服 务发现模型,对u d d i 进行语义扩充,增加服务的语义描述。同时,为了提高服务发 现效率,及服务发现的质量和可用性,该服务发现模型考虑了服务聚类组织和服务质 量控制。 由于w e b 服务的剧增和语义w e b 服务匹配的复杂性,导致基于语义的w e b 服务 发现低效率较低。本文借助于本体模块化思想,将具有一定相似度的w e b 服务组织 在一起,形成服务聚类,在服务发现时,减少服务查找时间,以提高w e b 服务发现 效率。此外,服务发现时,结合服务质量对w e b 服务进行最优选择,提高服务发现 的质量和可用性。 1 4 本文组织结构 本文共分为五个章节,各章节内容安排如下: 第一章,主要介绍了w e b 服务发现研究的背景,分析了w e b 服务发现的研究现 状,指出本文研究的目的和意义,并在此基础上提出了本文所研究的主要内容。 第二章,介绍语义w 曲服务的相关技术w e b 服务和语义w e b ,着重分析和研究 了本体和o w l s 语言。此外,在对o w l s 服务描述语言的基础上,提出了一个w e b 服务发现描述模型,描述服务的功能和非功能信息。 第三章,分析和研究当前的语义w e b 服务匹配算法,深入分析其优缺点。针对 当前基于语义的w e b 服务匹配算法的多样性和片面性,提出一种较优的概念相似度 6 硕士学位论文 第一章绪论 匹配算法和服务功能匹配算法。 第四章,在现有u d d i 架构研究的基础上,提出一个基于语义的w e b 服务发现 模型,对u d d i 进行语义扩充,增加服务的语义描述。同时,提出一种基于服务聚类 的语义w e b 服务发现机制,对发布的w e b 服务进行聚类组织,在服务发现时提高服 务发现效率,并合服务质量对w e b 服务进行最优选择。 第五章,对本文的工作进行总结,并指出本文工作的不足及未来的研究方向。 7 硕士学位论文第二章语义w e b 服务发现研究基础 第二章语义w e b 服务发现研究基础 2 1w e b 服务 w 3 c 将w 曲服务定义如下【l 】: w e b 服务是由u r i 标识的软件应用,其接口和绑定可以用x m l 来定义和描述的 并且可以被发现,与其他软件通过基于i n t e m e t 的协议以x m l 消息交换的方式直接 交互。 w e b 服务是一个可编程的模型,它具有标准接口模型,这种描述保证了通过标准 通信协议可以随意访问。w e b 服务的功能实现不局限于编程语言,也不限于开发平台, 即w e b 服务通过标准语言发布,通过标准办议进行访问。w e b 服务作为一种特殊的 服务继承了服务的自治性、开放性、自描述性和实现无关性,同时w e b 服务是通过 i m e m e t 实现远程访问的。w e b 服务具有以下特征:松散耦合,高度的互操作性;标 准的协议规范,应用解决方案与平台、语言等无关;完好的封装性和高可集成能力。 w e b 服务使用的是s o a 架构( s e r v i c eo r i e n t e da r c h i t e c t u r e ,面向服务的架构) , 如图2 1 所示,此架构由三个部分和三个基本操作构成。 图2 - 1w e b l 臣务架构模型 三个组成部分:服务提供者( s e r v i c ep r o v i d e r ) 、服务请求者( s e r v i c er e q u e s t e r ) 和 服务注册中- l , ( s e r v i c er e g i s t r y ) 。三个基本操作:发布( p u b l i s h ) 、发现( f i n d ) 和绑定 ( b i n d ) ,将三个组成部分链接起来。其基本过程是:服务提供者将它的服务注册到服 务注册中心;当服务请求者需要调用该服务时,首先到服务注册中心查询该服务,得 到如何调用该服务的信息,然后根据这些信息去调用服务提供者服务的服务。w 曲 服务最基本的三项核心技术是:w e b 服务描述语言w s d l 、w e b 服务之间进行消息 8 硕士学位论文第二章语义w e b 服务发现研究基础 传递和承载的x m l 消息通信协议s o a p 协议、提供w e b 服务发布与发现的服务注册 中心规范u d d i 规范。在w e b 服务架构中,使用w s d l 描述服务,u d d i 发布服务 和查找服务,s o a p 则用来执行服务调用。 虽然w e b 服务的应用前景十分广阔,但w e b 服务发展依然存在各种不足,尤其 是w e b 服务的自动发现、组合以及调用。例如,现存的u d d i 中心只是一个服务目 录,记录了服务的黄页、白页、绿页信息以及服务功能、调用的描述,存储的服务信 息缺少语义描述,致使w e b 服务发现、组合及调用的实现很困难。为解决这些问题, 研究界提出语义w e b 服务( s e m a n t i cw e bs e r v i c e ,s w s ) ,将语义网技术和w e b 服务 结合,使计算机理解服务描述信息,从而实现服务的自动发现、匹配及组合等。 2 2 语义w e b 语义w e b ( s e m a n t i cw e b ) 的概念由w w w 之父t i m eb e r n e r s l e e 在x m l2 0 0 0 会 议上提出的。语义w e b 的目标是使得w e b 上的信息具有机器可理解的语义,满足智 能软件代l 里( a g e n t ) 对w w w 上异构和分布信息的有效访问和搜索,通过将语义信息 加入到w e b ,提高机器之间的交互能力,提高自动化处理能力。 h t r u s t k r u l e s p r o o f k d a t a l o g i c 专 b d a t a 虽 竺 s e l f - o n t o l o g yv o c a b u l a r y 甚 d e s c 否 d o c r d f + r d f s c h e m a x m l + n s + x m i s c h e m a u n i c o d eu r l 图2 - 2 语义w e b 层次结构图 语义网作为一项面向因特网应用的通用技术,语义网的设计目标是为实现因特网 上的信息提供具有机器可理解的语义信息,为因特网发展在信息表达和检索方面存在 的瓶颈问题提供新的思路和处理方法。因此,将语义网相关技术应用到w e b 服务发 现中,使w e b 服务描述以一种语义清晰的方式表达,提高服务定位的准确率,实现 更高程度的智能化服务匹配。 9 硕士学位论文第二章语义w e b 服务发现研究基础 b e r n e r s l e e 为未来的w e b 发展提出了基于语义的体系结构一一语义w e b 体系结 构。s e m a n t i cw e b 框架【9 l 的层次结构如图2 2 所示。 语义w e b 体系结构从底层到高层分别为u n i c o d e 和u r i ,x m l ,r d f , o n t o l o g y ,l o g i c ,p r o o f 和t r u s t 。第一层是整个语义w e b 的基础,其中u n i c o d e 处理资源的编码,u 标识资源。第二层是x m l 十n s + x m ls c h e m a ,用于表示 数据的内容和结构。第三层为r d f + r d f s ,用于描述w e b 上的资源及其类型。第四 层为o n t o l o g yv o c a b u l a r y ,用于描述各种资源之间的联系。第五层到第七层是在下面 四层的基础上进行的逻辑推理操作。语义w e b 的核心层为x m l ,r d f 和o n t o l o g y , 用于表示w e b 信息的语义。 x m l 作为一种资源描述语言,由于其良好的可扩展性和灵活性,适合于表示各 种信息,被广泛接受,被认为是未来w e b 上数据交换的标准。r d f 是w 3 c 推荐用 于描述和处理元数据的一个草案,为w e b 上应用程序之间交互提供机器可理解的信 息。x m l 和r d f 都能够为所描述的资源提供一定的语义,但二者在处理语义上存在 两个问题:同一概念有多种词汇表示;同一词汇有多种含义( 概念) 。为解决上述两个 问题,引入了o n t o l o g y 。o n t o l o g y 通过对概念的严格定义和概念与概念之间的关系确 定概念的精确含义,表示共同认可的、可共享的知识。在语义w e b 中,o n t o l o g y 具 有非常重要的地位,是解决语义层次上w 曲信息共享和交换的基础。 2 3 本体 2 3 1 本体定义 本体起源于哲学领域。人工智能( a r t i f i c i a li n t e l l i g e n c e ,a i ) 引入领域本体概念,用 于知识表示和知识组织,其概念的内涵发生了改变。n e c h e s 等人于1 9 9 1 年最早给了 o n t o l o g y 定义,即“给出构成相关领域词汇的基本术语和关系,以及利用这些术语和 关系构成的规定这些词汇外延的规则的定义。最著名并被广泛引用的本体定义是由 g r u b e r 提出的,即“本体是概念模型的明确的规范化说明”。b o r s tp r i m 博士1 3 5 j 等人 在g r u b e r 定义的基础上做了一些修正,本体的概念定义为:“本体是共享概念模型的 明确的形式化规范说明”。 本体定义体现了四层含义,即本体的四大特征【3 6 , 3 7 】: 1 明确( e x p l i c i t ) :被引用概念所属的上位类与在使用此概念时的限制条件应具 有明确的定义和说明。 2 概念模型( c o n c e p t u a l i z a t i o n ) - 通过抽象出客观世界中一些现象相关的概念而 得到的模型,其表示的含义独立于具体的环境状态; 3 共享( s h a r e d ) :本体中所体现的知识是共同认可的,反映的是相关领域中公认 的概念集,它所针对的对象是团体而不是个体; l o 硕士学位论文第二章语义w e b 服务发现研究基础 4 形式化( f o r m a l ) :具有机器可读性。 本体是用来描述某个领域甚至更广范围内的概念及概念之间的关系,使得这些概 念和关系在共享范围内具有大家共同认可的、明确的、唯一的定义。这样,人机之间 及机器之间就可以交流。它的目标是捕获相关领域知识,提供对该领域知识的共同理 解,确定该领域内共同认可的词汇,并从不同层次的形式化模式上给出这些词汇之间 相互关系的明确定义。 将本体o n t o l o g y 技术应用到w e b 中,对w e b 进行语义描述,即是能够根据语义 进行推理判断的语义w e b 。本体通过概念与概念之间关系的严格定义以精确地确定概 念,解决语义层次上w 曲信息共享和交互,在语义网中占有重要位置。 2 3 2 本体建模 p e r e z t 3 8 】等人认为本体可以按分类法来组织,并归纳出五个基本的本体建
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 《设备管理》试题试题库大全与参考答案解析
- 2025年儿科护理知识竞赛题库及答案(共150题)
- 中医七方行测题库及答案
- 信息安全测试题
- 中医科学院中医药信息研究所复试参考书目
- 危重急症抢救流程解析及规范考试(附答案)
- 2025年安徽省公务员考试申论作文押题
- 助理医师资格证考试之口腔助理医师历年经典题含答案
- 奥鹏秋季《计算机应用基础》作业解答
- (完整版)十大安全目标考核试题
- 变压器绝缘测试评分表
- 近八年宁夏中考数学试卷真题及答案2024
- 小学生心理健康与辅导(第4版) 课件 第九章 小学生心理健康教育课程
- 园区安全管理培训
- 2024年人教版四年级数学上册 第5单元《平行四边形和梯形》能力提升卷(含解析)
- 护理危急值管理
- 外贸船务知识培训班课件
- 课题申报书:基于项目式学习的高中语文整本书阅读实践研究
- 【MOOC】药事法规-中国药科大学 中国大学慕课MOOC答案
- 旅游景区服务质量提升培训
- 药店医保内部管理制度模版(3篇)
评论
0/150
提交评论