




已阅读5页,还剩55页未读, 继续免费阅读
(计算机应用技术专业论文)语义web服务匹配算法研究.pdf.pdf 免费下载
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
摘要 w e b 服务是架构在x m l 和i n t e m e t 技术之上的分布式计算技术。如何正确、高效 得从庞大的w e b 服务群中找到自己所需的服务越来越具有挑战性。主流的w e b 服务发 现采用基于u d d i 、w s d l 框架的服务匹配方法,只能提供基于关键字的查询,缺乏 对语义信息的支持,服务的查全率和查准率不高。针对以上现状,业界提出了将语义 w e b 技术应用于w e b 服务,以增加服务的语义信息,即所谓的语义w e b 服务。语义 w e b 服务用语义w e b 标记语言来描述服务的语义,使w e b 服务成为机器可理解的实体, 有望实现w e b 服务的自动发现。 本文在分析了基于o w l s 的语义w e b 服务相关技术的基础之上,设计了语义 w e b 服务发现模型。该模型通过o w l s u d d i 转换器支持基于语义的服务发现。在分 析经典匹配算法的不足的基础上,提出一种基于服务功能的两阶段匹配算法。第一阶 段通过分类服务过滤性的匹配,将不满足要求的服务筛选掉。第二阶段基于服务功能 的语义匹配,通过输入、输出参数的匹配来实现。其中引入了改进的本体匹配函数, 该函数通过引入语义相似度可以细粒度区分服务间匹配的差别,便于用户选择所需服 务。 关键词:w e b 服务发现本体o w l s 语义相似度语义匹配 a b s t r a c t w e bs e r v i c e si sa d i s t r i b u t i n gt e c h n o l o g yb a s e do nx m li ni n t e r n e t h o wt op r e c i s e l v a n de f f i c i e n t l yf i n dau s e f u ls e r v i c eb e c o m em o r ea n dm o r e c h a l l e n g e i nc u n e n tw e bs e i 弋,i c e s d i s c o v e r yw h i c hb a s e do nu d d ia n dw s d ll a c k so fs e m a n t i ci i l 】白n n a t i o n 1 e a d st ol o w p r e c l s l o na n dr e c a l l a c c o r d i n gt ot h ef a c t sd e s c r i b e da b o v e ,w e a p p l ys e m a n t i cw e bt o 、 ,e b s e r v l c e st oi n c r e a s e s e m a n t i ci n f o r m a t i o ni nw e bs e r v i c e s d i s c o v e r y w i t hs e m a n t i c i n f o r m a t i o nw e bs e r v i c e sd i s c o v e r yw i l lb e c o m ea u t o m a t i z a t i o n i nt h i st h e s i s ,a f t e ra n a l y z i n gt h et e c h n o l o g yo fs e m a n t i cw e b s e i c e sb a s e do w l s w ed e s i g nam o d e lo fs e m a n t i cw e b d i s c o v e r y t h i sm o d e lr e a l i z e ss e m a n t i cd i s c o v e r yu s i n g o w l u d d i a f t e ra n a l y z i n gt h es h o r t a g eo ft r a d i t i o n a lm a t c ha l g o r i t h m ,w ep r o p o s e da 加,o p h a s e sm a t c h i n ga l g o r i t h m t h ef i r s tp h a s ei ss e r v i c e c a t e g o r ym a t c h i n g ,i ti su s e dt of i l t e rt h e w e bs e r v i c e sw h o s es e r v i c e c a t e g o r yv a l u ed o e s n te q u a lt ot h er e q u e s t e ds e r v i c ep r o f i l e ,s t h es e c o n dp h a s em a t c h i n gi sw e bs e r v i c e sf u n c t i o n a l i t y b a s e ds e m a i l t i cm a t c h i n gw h i c h i s i m p l e m e n t e db yc a l l i n g i n p u t p a r a m e t e r m a t c h i n g a n d o u t p u t p a r a m e t e r m a t c h i n g t h i s a l g o r i t h mi m p o r to n t o l o g ym a t c h i n gf u n c t i o nw h i c hd e f i n e sas e m a n t i cs i m i l a r i t yd e g r e et o m e a s u r et h em a t c hd e g r e e ,a n dc o n s e q u e n t l yd i s t i n g u i s ht h ed i f f e r e n c e b e t w e e nt h ew e b s e r v i c e s m a t c hd e g r e e k q w o r d s :w e bs e r v i c e sd i s c o v e r y o n t o l o g y o w l ss e m a n t i cs i m i l a r i t y d e g r e e s e m a n t i cm a t c h i n g 西安电子科技大学 创新性声明 本人声明所呈交的论文是我个人在导师指导下进行的研究工作及取得的研究 成果。尽我所知,除了文中特别加以标注和致谢中所罗列的内容外,论文中不包 含其它人已经发表或撰写过的研究成果;也不包含为获得西安电子科技大学或其 它教育机构的学位或证书使用过的材料。与我一同工作的同志对本研究所做的任 何贡献均已在论文中做了明确的说明并表示了谢意。 申请学位论文与资料若有不实之处,本人承担一切相关责任。 本人签名: 日期: 关于论文使用权的说明 本人完全了解西安电子科技大学有关保留和使用学位论文的规定,即:研究 生在校攻读学位期间论文工作的知识产权单位属西安电子科技大学。本人保证毕 业离校后,发表论文或使用论文工作成果署名单位仍然为西安电子科技大学,学 校有权保留送交论文的复印件,允许查阅和借阅论文;学校可以公布论文的全部 或部分内容,可以允许采用影印、缩印或其它复制手段保存论文。( 保密的论文在 解密后遵守此规定) 本学位论文属于保密,在年解密后使用本授权书。 本人签名: 导师签名: 日期: 日期: 第一章绪论 第一章绪论 1 1 引言 w e b 服务f 1 2 】是近几年提出的一个新概念,是指通过w e b 提供的各种服务,是 一种新兴的分布式计算技术。它的基本思想是提供基于i n t e m e t 的与开发环境无关 的软件服务。w e b 服务是w e b 应用的新标准,是自包含、自描述的应用模块,一 旦发布,其他应用( 或服务) 就可以调用。所以w e b 服务是一种按标准语言描述 并通过网络发布、发现和调用的自包含、自描述、松散耦合的构件集合。w e b 服 务使得w w w 从静态的、松散的w e b 页面集合逐渐演化成动态的、互联的应用和 服务的平台。依循w e b 服务架构的分布式系统可以方便地实现应用的集成,满足 企业发展的需要。在该体系下分布式对象采用基于h t t p 、x m l 等i n t e m e t 标准 协议的s o a p 协议进行数据通信,无需采用专用通信协议r p c 、i i o p 等,所以可 以很轻易的穿越防火墙;同时,任何支持h t t p 和x m l 的设备均可以使用w e b 服务。它较好的解决了i n t e m e t 上的数据相互孤立的格局,只要服务是遵循w e b 服务体系结构,它们就可以相互调用,从而为基于i n t e m e t 的数据集成做了很好的 技术基础。 w e b 服务发现是w e b 服务系统框架中的重要组成部分。发现符合用户需求的 服务是实现服务复用、组合的重要前提。服务发现的效果直接影响到服务调用的 质量,影响到服务组合的相容性和可替换性,关系到能否真正实现服务的即插即 用。然而随着互联网的高速发展,w e b 服务的数量急剧增加,并且为用户提供了 不同类型的服务,这些服务可能具有不同的形式,并且他们的复杂程度不相同。 面对这些形式多样、复杂程度不同的w e b 服务,如何准确高效的从庞大的w e b 服 务群中找到所需服务,尤其是如何从众多功能相似的服务中找到最符合用户需求 的服务,为进一步进行服务的执行、组合是w e b 服务面临的巨大挑战。 目前关于w e b 服务的研究已经达到了一定的标准化程度。w 曲服务描述语言 w s d l ( w e bs e r v i c e sd e s c r i p t i o nl a n g u a g e ) 3 1 ,统一描述、发现和集成u d d i ( u i l i v e r s a ld e s c r i p t i o n ,d i s c o v e r ya n di n t e g r a t i o n ) 4 j 和简单对象访问协议s o a p ( s i m p l eo b j e c t a c c e s sp r o t o c 0 1 ) 5 】的推出都为w r e b 服务的研究和发展奠定了基础。 以上协议都是基于x m l 作为语法基础,彼此间有一定的兼容性。但是由于这些 w e b 服务协议缺乏良好定义的语义信息和w e b 服务间交互的表达能力,因而很难 满足w e b 服务发现、执行、组合的自动化需求。目前的w e b 服务发现主要是基于 u d d i ,w s d l 之上的基于关键字的检索,导致服务的查全率和查准率不高。主要 2 一 语义w e b 服务匹配算法研究 原因是这些协议缺乏语义信息。首先,以语法性语言描述w 曲服务,不利于机器 理解和处理;其次,基于关键字的检索无法充分反映服务所提供的功能信息;最 后缺乏语义的w e b 服务描述使得服务需求者和服务发布者关于同一w e b 服务的描 述上可能存在冲突,造成认识上的差异。所以w e b 服务发现迫切需要语义信息的 支持。 针对上述w 曲服务基础协议缺乏语义信息,业界提出了将语义w e b 6 j 技术应 用于w 曲服务,以增加服务的语义信息,即所谓的语义w 曲服务。语义w e b 是 w w w 的创始人b e r n e r - l e e 在2 0 0 1 年提出的概念,被认为是下一代互联网技术。 语义w e b 主要研究如何让机器理解互联网上的信息,旨在赋予w e b 上所有资源唯 一标识,以结构化方式描述w e b 资源的语义,并在资源之间建立计算机可处理的 各类语义联系。要实现语义w e b 服务,实现w e b 服务发现的自动化和智能化,利 用语义是达到该目标的有效途径。对于服务发现不能仅仅依赖关键字搜索,而要 根据服务的功能进行搜索,这要才能找到所需的服务。服务的功能不可能依靠若 干关键字完整表达。 要实现w e b 服务发现的语义化,就需要开发一种能够很好描述w e b 服务的语 言,这种语言能够很好的表达服务的语义信息。目前研究语义w e b 服务的主要方 法是用w 曲服务本体语言o w l s 【7 】( w e bo n t o l o g yl a n g u a g ef o rs e r v i c e s ) ,它可 以描述w e b 服务的功能信息和属性,从而为w e b 服务的自动发现奠定基础。目前, 关于语义w e b 服务的研究主要是围绕o w l s 来展开。 1 2 1 什么是w e b 服务 1 2w e b 服务相关背景 w e b 服务是指通过w e b 提供的各种服务,是一种可以通过u r l 地址来访问 的网络资源,是一种新兴的分布式计算技术。它的基本思想是提供基于i n t e r n e t 的 与开发环境无关的软件服务,这种面向服务的架构被认为是传统的c s 架构的取 代。w e b 服务是一种完全建立在x m l 等i n t e r n e t 标准协议或规范上的应用程序, 客户程序可以通过h t t p 和s o a p 协议来访问它。 w 曲服务具有如下特点: 良好的封装性:w e b 服务是部署在w e b 上的对象,对于使用者而言,他仅能 看到该对象提供的功能列表。 松散耦合性:传统的分布式应用程序要求服务客户端与系统提供的服务本身 之间必须进行紧密耦合,即要求一个同类基本结构。这样的系统往往十分脆弱: 第一章绪论 如果一端的执行机制发生变化,那么另一端便会崩溃。例如,如果服务器应用程 序的接口发生更改,那么客户端便会崩溃。相反,w e b 服务彼此是松散偶合的。 连接中的任何一方均可更改执行机制,却不影响应用程序的正常运行。 协议适用标准性:w e b 服务构建在x m l 基础之上,w e b 服务描述语言 w s d l ( w e bs e r v i c e sd e s c r i p t i o nl a n g u a g e ) ,统一描述、发现和集成u d d i ( u n i v e r s a l d e s c r i p t i o n ,d i s c o v e r ya n di n t e g r a t i o n ) 和简单对象访问协议s o a p ( s i m p l eo b j e c t a c c e s sp r o t o c 0 1 ) 的推出都为w e b 服务的研究和发展奠定了基础。 w e b 服务架构包括三个角色和三种基本操作【l4 ,如图1 1 。 图1 1w e b 服务体系架构 三个角色如下【1 5 j : 服务提供者( s e r v i c ep r o v i d e r ) :从商务角度看它是指服务的所有者,从体系 结构上看它是指提供服务的平台。 服务请求者( s e r v i c er e q u e s t e r ) :从商务角度看它是指需要请求特定功能的 企业,从体系结构上看它是指查找和调用服务的客户端应用程序。 服务注册中心( 服务代理s e r v i c eb r o k e r ) - 它是指用来存储服务描述信息的 信息仓库,它负责为服务提供方发布服务,为服务请求方查找服务,并且将获取 服务的信息绑定给请求方。 三种基本操作如下: 发布( p u b l i s h ) :服务提供者需要将服务进行一定的描述并发布到注册服务器 上。在发布操作中,服务提供者需要通过注册服务器的身份验证才能对服务描述 信息进行发布和修改。 查找( f i n d ) :服务请求方根据注册服务器提供的规范接口发出查询请求,从 而获取所需服务的相关信息。 绑定( b i n d ) :服务请求方通过分析将从注册服务器中得到的服务绑定,例如 服务的访问路径、服务调用的参数、返回结果、传输协议、安全要求等,对自己 的系统进行相应的配置,进而可远程调用服务提供者所提供的服务。 图1 1 描述w e b 服务发现机制。服务提供者首先利用w s d l 描述所提供的 4 一 语义w e b 服务匹配算法研究 w e b 服务,然后向u d d i 注册中心注册服务。u d d i 注册中心存储该服务的w s d l 文档地址,并提供查询接口供服务请求者查询所需服务。服务请求者向u d d i 注 册中心提出服务查询请求,u d d i 注册中心通过关键词匹配的方式返回匹配成功的 服务列表,服务请求者获得如何访问w - e b 服务的信息后,通过s o a p 消息与w - e b 服务进行通信,并调用目标服务。 u d d i 、w s d l 和s o a p 是构成w e b 服务发现的核心技术。w s d l 提供描述 w e b 服务的方法,主要提供调用具体服务所需技术细节,如消息格式、参数类型、 操作、协议绑定和服务地址等。u d d i 注册中心提供服务发布和更新操作,使服务 提供者可在u d d i 注册中心发布和更新服务信息。查询a p l 支持服务请求者的查 询操作。s o a p 提供w e b 服务和服务请求者的通信机制,服务请求者通过s o a p 消息与w e b 服务进行通信,并调用目标服务。 下面我们给出w r e b 服务的体系结构图。 w e bs e r v i c e sc o m p o s i t i o n : w s c i ,b p e l 4 w s d i s c o v e r y :u d d i 一 笺 i n t e r f a c es p e c i f i c a t i o nl a y e r :w s d l m e s s a g i n gl a y e r :s o a p t r a n s p o r tl a y e r :h t t p t c p , u d p , a n ds oo n 图1 2w e b 服务体系结构 图中我们可以看出最底层是传输层,使用h t t p ,t c p ,u d p 等通用协议。 其余各层都基于x m l 协议。第二层为消息层,采用s o a p 作为w e b 服务消息传 输格式。第三层为接口规范层,w s d l 为如何描述w e b 服务提供了通用的规范。 w e b 服务组合采用w s c i ,b p e l 4 w s 等协议,w e b 服务发现采用工业界广泛支持 的u d d i 基础架构。 1 2 2w e b 服务核心协议 下面介绍构成w e b 服务架构的三大核心协议:简单对象访问协议s o a p 、w e b 服务描述语言w s d l 和统一描述、发现和集成u d d i 。 1 s o a p s o a p ( s i m p l eo b j e c ta c c e s sp r o t o c o l ,简单对象访问协议) 是一种简单的、 轻量级的基于x m l 的机制,用于在网络应用程序之问进行结构化数据交换,它包 第一章绪论 含三个部分【1 6 1 : ( 1 ) 一个定义描述消息内容的框架的信封。 ( 2 ) 一组表示应用程序定义的数据类型实例的编码规则。 ( 3 ) 表示远程过程调用和响应的约定。 s o a p 可以和各种网络协议( 如h t t p 、s m t p 、f t p 和i i o p 或r m i ) 结合 使用,或者用这些协议重新封装后使用。 s o a p 消息包括四个部分:( 1 ) s o a p 信封( e n v e l o p ) ,信封定义了一个描述 消息中的内容、所要接收者和消息的处理要求的框架。信封包含可选h e a d e r 元素 和b o d y 元素两个部分,h e a d e r 元素提供处理指令给消息的应用程序。b o d y 元素 包含所要传送给接收者的应用程序的特定数据。( 2 ) s o a p 编码规则( e n c o d i n g r u l e s ) ,用于表示应用程序需要使用的数据类型的实例。( 3 ) s o a pr p c 表示,表 示远程过程调用和应答的协定。( 4 ) s o a p 绑定( b i n g d i n g ) ,使用底层协议交换信 息。 2 w s d l w s d l ( w 曲s e r v i c e sd e s c r i p t i o nl a n g u a g e ,w e b 服务描述语言) 是一种描述 w e b 服务的语言,它定义了一套基于x m l 的语法,用来将w e b 服务描述为能够 进行消息交换的服务访问点的集合,以表达一个w e b 服务能做什么,它的位置在 哪里,如何调用它等。在一个w s d l 文档中,定义w e b 服务一般使用下列元素i l7 】: t y p e ( 类型) 数据类型定义容器,提供了用于描述交换消息的数据类型定义。 m e s s a g e ( 消息) 消息数据结构的抽象类型化定义,消息使用t y p e s 所定义的 类型来定义整个消息的数据结构。 o p e r a t i o n ( 操作) 对服务中所支持的操作的抽象描述。m e s s a g e 元素包含了 一组p a r t 元素。 p o r t t y p e ( 端口类型) 某个访问入口点类型所支持的操作的抽象集合。一个 p o r t t y p e 可以包含若干个操作,而一个操作则是指访问入口支持的一种类型的调 用。在w s d l 中支持四种访问入口调用的模式:单请求、单响应、请求响应及响 应请求。p o r t t y p e 的定义中可能会引起个或多个消息,作为请求或响应消息的 格式。 b i n d i n g ( 绑定) 特定端口类型的具体协议和数据格式规范的绑定。可以将p o r t t y p e 与s o a p h t t p 绑定,也可以将p o r tt y p e 与m i m e s m t p 相绑定。 p o r t ( 端口) 协议数据格式绑定与具体w e b 访问地址组合的单个服务访问点, 它指出了用于绑定的地址,因此定义了单个通信终端。 s e r v i c e ( 服务) 相关服务访问点的集合,它集成了一组相关的端口。 w s d l 虽然在x s d 中定义了输入输出类型的概念,但它并不支持在输入输出 参数之间的逻辑约束的定义,它不能对服务进行语义描述,w e b 服务描述都是语 6 一 语义w e b 服务匹配算法研究 法性的,不能很好的表达w e b 服务的语义信息。 3 u d d i u d d i ( u n i v e r s a ld i s c o v e r y 、d e s c r i p t i o n 、i n t e g r a t i o n ,通用发现、描述、集 成) 定义了一个通用服务信息注册中心软件,该注册中心软件以x m l 格式存储和 管理各类服务元信息,并以w e b 服务的方式提供基于元信息的服务发现和发布。 u d d i 的工作方式和邮局公开发行的电话黄页类似,它可以把特定的企业信 息和w e b 服务在i n t e r n e t 上广而告之,并且提供具体的联系地址和方式。u d d i 商 业注册中心所提供的信息从概念上来说分为三部分: 白页( w h i t ep a g e ) 表示与企业有关的基本信息,包括企业名称、经营范围、 联系地址、企业标识等。、 黄页( y e l l o wp a g e ) 依据标准分类法区分不同的行业类别,使企业能够在更 大的范围内查找已经在注册中心注册的企业或w e b 服务。 绿页( g r e e np a g e ) 包括企业所提供的w e b 服务的技术信息,其形式可能是一 些指向文件或是u r l 的指针,而这些文件或u r l 是服务发现机制的必要组成部 分。 u d d i 数据结构主要包括四类数据结构的定义,四类数据结构是:商业实体 ( b u s i n e s s e n t i t y ) 、商业服务( b u s i n e s s s e r v i c e ) 、绑定模板( b i n d i n gt e m p l a t e ) 和 技术模型( t m o d e l ) 。 b u s i n e s s e n t i t y :发布服务信息的商业实体的详细信息,包括企业名称、关键 性标识、可选的分类信息和联络方法等。该数据结构定义了白页和黄页信息的结 构。 b u s i n e s s s e r v i c e :一组特定的技术服务的描述信息,该数据结构定义了绿页信 息,是b u s i n e s s e m i t y 的子结构。b u s i n e s s s e r v i c e 结构是一个描述性的容器,它将 一系列有关商业流程或分类目标的w e b 服务的描述组合到一起。 b i n d i n g t e m p l a t e :定义商业服务的访问方式和技术细节信息的结构,这些信 息属于绿页。调用一个服务所需的信息是在b i n d i n g t e m p l a t e 结构中定义的。 t m o d e l :w e b 服务或分类法的规范描述信息,也就是关于调用规范的元数据, 包括w e b 服务名称、注册w e b 服务的企业信息和指向这些规范本身的u r l 指针 等。u d d i 通过t m o d e l 的概念描绘了抽象和实现之问的区别,t m o d e l 结构代表 了接i s 和元数据的抽象类型,b i n d i n gt e m p l a t e 则是一个或多个t m o d e l 的具体实 现。在b i n d i n gt e m p l a t e 中,要为t m o d e l 的特定实现注册访问点。 u d d i 定义了一套用来访闯u d d i 注册中心的a p i ,包括发布a p i 和查询a p i 。 发布a p i 主要用于在应用程序和u d d i 注册中心存储和修改信息的互操作用途; 查询a p i 主要用于当应用程序需要访问注册中心并从注册中心读取信息。 目前的w e b 服务发现主要采用u d d i 架构来实现,但是u d d l 只支持基于关 第一章绪论 键字查找,不支持语义描述,导致查询结果查全率和查准率不高。 1 2 3w e b 服务发现存在的问题 7 1 w e b 服务采用语法级别的w s d l 描述语言进行描述,以语法性语言表达的 w e b 服务,主要是面向用户直接阅读的,不利用计算机阅读和处理。其着重描述 服务接口的语法而缺乏对服务功能的语义描述。 2 以关键字匹配的服务发现中,根据发布服务描述中是否包含请求查询中的 关键词来返回结果,由于许多不相关的服务也会在它的描述中包含查询关键词, 检索的结果往往会出现很多不相关的w e b 服务,随着服务数量的增大,检索的准 确率降低。 3 服务发布者和服务请求者对于同事物的认识可能不同,使得他们对于同 一w e b 服务的描述也不同。如不同的服务可以用多种术语描述同一事物,同一概 念在不同服务中可能代表不同的含义。所以很难度量服务需求者和服务发布者的 符合程度,导致查准率不高;遗漏了大量与查询关键词同意或相关的信息,导致 查全率不高。 4 对服务的功能检索通过关键词来描述,无法充分反映服务所提供的功能信 息,造成服务查找结果不理想。 1 3 论文的主要工作及组织 随着w e b 的迅速发展,w e b 服务的潜在提供者是整个因特网上所有的w e b 服务提供者,可供选择的候选服务数量巨大,同时,它具有高度的自治性,而且 其应用环境也是异类的。这些特性导致了一系列问题,如w e b 服务的描述、w e b 服务的匹配等。为了有效的实现w e b 服务的应用价值需要解决如下关键问题:如 何发现满足需要的服务:如何选择最佳的服务等。 在结合语义w e b 和w e b 服务技术的基础上,本文将主要设计了语义w e b 服 务发现模型,该模型基于领域本体,解决了w e b 服务发现过程中存在的语义异构 问题,达成领域内一致的语义理解。并采用语义w e b 服务本体描述语言( o w l s ) 分别对w e b 服务请求进行语义描述,产生的w e b 服务本体使服务请求者能够了解 服务的功能细节,加强服务描述信息的机器可理解性,同时服务请求p r o f i l e 能精 确描述服务请求者所需服务的功能信息,为实现功能的语义匹配提供充分的语义 信息。该模型通过扩展u d d i 注册中心,使其能支持服务功能的语义描述。同时 本文设计了两阶段的服务匹配策略,第一阶段为s e r v i c e c a l e g o r y 的服务匹配,通 过判断服务请求者所需服务与已发布的广告服务是否为同一分类来缩小搜索范 8 一 语义w e b 服务匹配算法研究 围。第二阶段为基于服务功能的匹配,把输入、输出参数作为匹配依据,在匹配 中运用本体相似度函数,依据概念语义匹配度来计算服务的匹配程度。然后把匹 配结果返回给匹配引擎。匹配引擎根据用户对匹配度阈值的要求,对结果进行过 滤,得到最终的结果,发送给服务请求者。 对本体相似度函数g c s m 进行了充分的分析,指出该函数只考虑了概念间的 继承关系,并未考虑概念间的二元关系,导致部分结果不精确。通过对语义距离 进行加权处理,给出了改进后的g c s m 算法。在基于功能的服务匹配中,通过服 务输入、输出参数构造匹配参数矩阵,引入改进后语义相似度函数,给出了基于 功能匹配的可量化匹配度,从而确定最终的服务候选集。 章节安排: 第一章,绪论。主要阐述论文的选题背景和选题的意义。w e b 服务相关技术: 包括w e b 服务的架构,三个主要的协议( s o a p 、w s d l 和u d d i ) 以及w e b 服 务的体系结构。最后给出本文的研究工作和论文的章节安排。 第二章,主要阐述了语义w e b 服务相关的背景知识,一些相关的服务匹配算 法。主要有语义w 曲的层次结构, o n t o g l o y 的相关知识,本体描述语言o w l 、 r d f 和r d f s ,语义w e b 服务描述语言o w l s 以及o w l s 本体中s e r v i c ep r o f i l e , s e r v i c em o d e l 和s e r v i c eg r o u n d i n g 的相关知识及基于o w l s 的w e b 服务体系结 构。最后分析了国内外研究的现状和一些经典的服务匹配算法。 第三章,主要阐述了语义w e b 服务发现框架的设计。给出了服务匹配引擎, 本体库和o w l s u d d i 转换器等模块的详细分析。 第四章,阐述了语义w e b 服务发现匹配算法,这是本文的核心部分。在语义 距离的基础上给出了改进的本体相似度函数,以及两阶段的服务匹配过程。给出 了一个匹配实例研究以及程序实现过程。给出了将w e b 服务的w s d l 文件转化为 语义描述文件o w l s 的过程。 第五章,结束语。对本文的工作进行总结,并提出进一步的研究方向。 第二章语义w e b 服务相关技术 第二章语义w e b 服务相关技术 2 1 1 语义w e b 模型 2 1 语义w e b 及本体论 9 一 语义w e b 的概念是w w w 之父t i mb e m e r s l e e 在x m l 2 0 0 0 会议上首次提出 的。作为一项面向因特网的通用技术,语义w e b 设计目标是为实现因特网上的信 息提供机器可理解的语义信息。语义w 曲是一个层次结构1 9 1 ,如图2 1 。 图2 1 语义w e b 层次结构 该结构共有七层,最底层u n i c o d e 用来处理字符的编码,u r i 提供对资源的唯 一标识;第二层x m l + n s + x m l s c h e m a ,其中x m l 定义了结构化的数据描述方式, n s 提供命名分类机制,x m l s c h e m a 定义x m l 文档的语法;第三层r d f + r d f s c h e m a , 其中r d f 是描述数据语义的基础,它通过主体( s u b j e c t ) 、谓词( p r e d i c a t e ) 、客 体( o b j e c t ) 三元组来描述资源以及资源之间的关系。r d f s c h e m a 在r d f 之上定义 了一个最小的语义模型支持复杂词汇的建模,包括r e s o u r c e ,c l a s s ,p r o p e r t y , s u b c l a s s o f ,s u b p r o p e r t y o f , r a n g e ,d o m a i n 等基本元素;第四层o n t o l o g yv o c a b u l a r y 用来定义共享的知识,从而对各种资源之间的语义关系进行描述,揭示资源本身 以及资源之间更为复杂和丰富的语义信息;第五层l o g i c 提供逻辑推理能力。其余 两层是p r o o f 和t r u s t 提供认证和信任机制。 由以上层次结构可知,语义w e b 主要基于x m l 和r d f r d f s c h e m a ,并在此基 l o 语义w e b 服务匹配算法研究 础上构建本体和推理规则,以完成基于语义的知识表示和推理,从而能够为计算 机理解和处理。 2 1 2o n t o l o g y 相关概念 o n t o l o g y ( 本体) 最初是一个哲学范畴,是指客观存在的一个系统的解释和说 明。随着人工智能的发展业界给出了各种新的定义,其中最著名并被引用最为广 泛的定义是由g r u b e r 提出的【2 1 j :o n t o l o g yi saf o r m a l ,e x p l i c i ts p e c i f i c a t i o no f as h a r e d c o n c e p t u a l i z a t i o n 。中文翻译为:本体是共享概念模型的明确的、形式化规范说明。 概念模型( c o n c e p t u a l i z a t i o n ) 指通过识别世界上的一种现象的相关概念来对这种 现象所建立的抽象模型;明确( e x p l i c i t ) 指所使用的概念及使用这些概念的约束 都有明确的定义;形式化( f o r m a l ) 指o n t o l o g y 是计算机可读的;共享( s h a r e d ) 指o n t o l o g y 体现的是共同认可的知识,反映相关领域公认的概念集。本体和元数 据的区别在于:元数据解决资源的语义描述问题;本体解决资源概念相互关系问 题。 o n t o l o g y 的目的是捕获相关领域的知识,提供对该领域知识的共同理解,确 定该领域内共同认可的词汇,并从不同层次的形式化模式上给出这些词汇( 术语) 和词汇问相互关系的明确定义。o m o l o g y 作为领域内部不同主体之间进行交流的 基础提供了一种明确定义的共识,这种共识是为机器服务的,使机器能够理解因 特网上的语义信息。 按照o n t o l o g y 在知识库中扮演的角色,o n t o l o g y 分为:领域本体( d o m m n o n t o l o g y ) ,通用本体( g e n e r i co n t o l o g y ) ,应用本体( a p p l i c a t i o no n t o l o g y ) 和表 示本体( r e p r e s e m a t i o n a lo n t o l o g y ) 。领域本体为特定领域的知识和结构;通用本 体主要描述客观世界一般性知识,如时间、空间等;应用本体针对特定应用领域 知识的抽象和建模;表示本体仅仅提供了一种表示实体的方式。 o m o l o g y 理论上主要研究概念、概念分类及其概念之问的关系。对于一个本 体,一般首先给出一组概念的层次性结构及概念间的组成关系、子类关系等。 概念:具有相同性质的实体的抽象集合。从语义上讲,它表示的是一定知识 范围内术语的集合。概念通常称为类( c l a s s ) 。 类( c l a s s ) :同一类概念的抽象表达。 实例( i n s t a n c e s ) :从语义上讲实例表示的就是类的对象。 关系( r e l a t i o n ) :指在论域中概念之f i j 的交互作用。概念的含义通过概念之间 的关系来体现,如子类关系( s u b c l a s s o f ) 、组成关系( p a r t o f ) 。 属性:某一概念具有的特征。 从语义上讲概念之间的基本关系有4 种,如表2 1 。 第二章语义w e b 服务相关技术 表2 1 概念间的基本关系 关系名关系描述 p a r t - o f 表达概念之间部分与整体的关系 表达概念之间的继承关系,类似于面向对象中父类与子类 k i n d o f 之间的关系 表达概念的实例与概念之间的关系,类似于面向对象中对 i n s t a n c e o f 象和类之间的关系 a t t r i b u t e o f 表达某个概念是另一个概念的属性 目前,o n t o l o g y 已经被广泛的应用于知识工程、自然语言处理、数字图书管、 信息检索和w e b 异构信息的处理、软件复用、面向对象技术和语义w e b 等领域。 2 1 3 本体描述语言 1 r d f 和r d f s r d f ( 资源描述框架语言,r e s o u r c ed e s c r i p t i o nf r a m e w o r k ) 【2 u j 可以对“w r e b 资源”进行语义描述,并保证机器对资源语义描述的正确理解和根据语义进行推 理的形式正确性。将w 如资源这一概念一般话后,r d f 可用于表达关于任何在 w r e b 上可以被标识的事物的信息。r d f 为语义w e b 发展建立了一个基础框架。 语义w e b 的目的是让机器理解w e b 上的语义信息。让机器理解信息的一种方 式就是给数据信息加上机器能理解的“标签 ,这种标签称为元数据,它描述了信 息某一方面的显著特征。例如一本书的内容是书的数据信息,而作者的名字,出 版社的地址或版权信息就是书的元数据。r d f 就是用来描述元数据以及元数据之 间的关系。当然数据和元数据的划分不是绝对的,有的数据既可以作为数据处理, 也可以作为元数据处理,如可以将书的作者作为数据而不是元数据处理。 r d f 通过主体( s u b j e c t ) 、谓词( p r e d i c a t e ) 、客体( o b j e c t ) 三元组来描述资 源以及资源之间的关系。主体就是资源,资源用资源标识符u r l 来标识;谓词就 是资源的属性,而客体表示资源性质的取值。r d f 的每一个部分都可以用u r i 来 表示,因此语句不仅能够被人读懂,也可以被机器理解。这罩引用w 3 c 的r d f 教 程上的一个例子,假没有陈述:h t t p :w w w e x a m p l e o r g i n d e x h t m lh a sa c r e a t o rw h o s e v a l u ei sj o h ns m i t h ,该陈述可以由r d f 陈述来表示,在这里主体表示为 h t t p :w w w e x a m p l e o r g i n d e x h t m l ,谓词表示为h t t p :p u r l o r g d c e l e m e n t s 1 1 c r e a t o r ,客体表示为h t t p :w w w e x a m p l e o r g s t a t i i d 8 5 7 4 0 。该陈述可以表示为图2 2 。 语义w e b 服务匹配算法研究 图2 2r d f 不例 r d f 定义了一个模型,通过指定的属性和相应的值描述了资源之间的关系。 但是r d f 本身对语句是无知的,它只是提供了一个表达元数据的模型,但是机器 仍然不知道这些元数据是否都有效,元数据之间的关系是否都正确。另外,在某 些情况下,用户希望能够根据需要自定义一些词汇,然后用这些词汇来描述资源。 这时我们需要r d f s ,资源描述框架模式r d f s ( r e s o u r c ed e s c r i p t i o nf r a m e w o r k s c h e m a ) 为r d f 提供了一个类型系统,通过该类型系统可以约束元数据的取值范 围,并可以检验元数据之问关系表达式的正确性。 r d f s 主要完成两个工作: ( 1 ) 描述类与他的子类之间的关系; ( 2 ) 定义类的性质。 r d f s 中三个重要的类属是资源( r d f s :r e s o u r c e ) ,类( r d f s :c l a s s ) 和性质 ( r d f :p r o p e r t y ) ,性质通过定义域( r d f s :d o m a i n ) 和值域( r d f s :r a n g e ) 和类建立关 联。类可以有子类,子类是类的子集,子类和类之间的关系可以用r d f s :s u b c l a s s o f 表示。性质也可以有子性质,这个关系用r d f s :s u b p r o p e r t y o f 标识。可见,r d f s 大大增强了r d f 对资源的描述能力。 2 o w l ( w e bo n t o l o g yl a n g u a g e ) o w
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 培训房屋销售代表
- 装修管理流程图
- 固定资产会计年终总结
- 江苏省镇江市部分学校2026届九上化学期中经典模拟试题含解析
- 湖北省襄阳市枣阳实验中学2026届化学九上期中质量检测试题含解析
- 2026届山东省滕州市业水平考试数(基础卷)九年级化学第一学期期中达标测试试题含解析
- 商场内员工培训
- 河南省商丘市虞城县2026届九年级英语第一学期期末综合测试模拟试题含解析
- 幼儿园教师年底工作总结
- 年会展部工作总结
- 4.1夯实法治基础教学设计 2025-2026学年度九年级上册 道德与法治 统编版
- 连铸工岗位操作规程考核试卷及答案
- 2025兵团普通职工考试试题及答案
- 第一单元 第2课《童真时光》 【人教版】美术 三年级上册
- 广州市公安局天河分局招聘辅警考试真题2024
- 2025年全国货运驾驶员职业技能资格考试试题(基础知识)含答案
- GB/T 46150.2-2025锅炉和压力容器第2部分:GB/T 46150.1的符合性检查程序要求
- 2025年甘肃省高考历史真题卷含答案解析
- 中华优传统文化(慕课版)教案
- 2025年广东国家公务员申论考试真题及答案-地市级
- 2025广东广州市国资委选调公务员2人笔试模拟试题及答案解析
评论
0/150
提交评论