(计算机软件与理论专业论文)基于本体的web服务发现关键技术与模型研究.pdf_第1页
(计算机软件与理论专业论文)基于本体的web服务发现关键技术与模型研究.pdf_第2页
(计算机软件与理论专业论文)基于本体的web服务发现关键技术与模型研究.pdf_第3页
(计算机软件与理论专业论文)基于本体的web服务发现关键技术与模型研究.pdf_第4页
(计算机软件与理论专业论文)基于本体的web服务发现关键技术与模型研究.pdf_第5页
已阅读5页,还剩72页未读 继续免费阅读

(计算机软件与理论专业论文)基于本体的web服务发现关键技术与模型研究.pdf.pdf 免费下载

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

中文摘要 摘要 近年来,w e b 服务以其协议标准化、低耦合以及平台无关性的优点,在应用集成方 面得到了迅猛的发展。随之而来的问题是,如何在海量的w e b 服务中找到合适的服务, 即服务发现,已经成为w e b 服务研究领域的热点问题之一。目前,w e b 服务发现机制 主要采用基于关键字的查询,这种方法存在明显的不足,因为服务很难通过一两个关键 字描述清楚,而且不同组织或个人对某个领域的理解不同,往往会导致服务发现的查准 率和查全率低。 本文将本体引入到w e b 服务发现领域,用o w l - s 本体描述w e b 服务,服务提供 者可以用本体来标记服务,服务请求者也可以利用本体来表达查询请求,这样就可以通 过匹配语义请求和语义服务描述来获得更精确的结果,使得匹配达到语义层次的深度。 本文在国家自然基金项目的支持下,对基于本体的w e b 服务发现进行了研究。首 先,本文探讨了本体的构建技术,根据需要建立了船舶本体用以支持语义标注,并介绍 了如何使用o w l - s 本体语言来描述w e b 服务;其次,采用将o w l - s 的s e r v i c ep r o f i l e 本体映射到u d d i 中的方法扩展了u d d i 注册中心,使之支持语义信息;然后,研究了 基于本体的w e b 服务发现的匹配算法,采用分层匹配的原则,分别在服务分类、服务 描述、i o 和o o s 各层中采用不同的匹配算法,尤其是在服务的功能性匹配( 1 0 匹配) 中,改进了基于平均关系距离( e r d ) 的服务匹配算法,体现出本体在w e b 服务发现 中的优势。最后,本文提出了一个基于本体的w e b 服务发现系统的模型,并在此基础 上实现了一个原型系统,通过一个案例对提出的算法进行了实验,分析了实验结果,证 实了所提出方案的可行性。 本文对传统的w e b 服务发现进行了分析,在服务描述和服务匹配方面,利用本体 对其进行扩展,使之支持语义,能从根本上解决传统w e b 服务发现查准率和查全率不 高的缺点。本文提出的w e b 服务发现方法和技术对提高服务发现的效率有一定的理论 和应用价值。 关键词:w e b 服务;w e b 服务发现;语义w e b ;本体;0 1 i i l s 英文摘要 r e s e a r c h e so nk e yt e c h n i q u e sa n dm o d e lo fo n t o l o g y - b a s e dw e b s e r v i c ed i s c o v e r y a b s t r a c t r e c e n t l y ,w e bs e r v i c eh a sd e v e l o p e dr a p i d l ya n dp l a y e da l li m p o r tr o l ei nt h ee n t e r p r i s e a p p l i c a t i o ni n t e g r a t i o n i th a s al o to fa d v a n t a g e s ,s u c ha ss t a n d a r dp r o t o c o l ,l o wc o u p l i n ga n d p l a t f o r mi n d e p e n d e n c e y e t ,h o wt of i n dt h ea p p r o p r i a t es e r v i c ea m o n gt h em a s s i v ew e b s e r v i c e s ,t h a ti sw e bs e r v i c ed i s c o v e r y ,h a sb e c o m eah o tt o p i ci nt h ea r e ao fw e bs e r v i c e r e s e a r c h n o w a d a y s ,w e bs e r v i c ed i s c o v e r ym a i n l yd e p e n d s o nk e y w o r d - b a s e dq u e r yw h i c h f i n d st h es e r v i c eb ym a t c h i n gt h es e r v i c en a m e ,i n p u t , o u t p u ta n ds oo ni nt h eu d d io r w s d lt h ed i s a d v a n t a g eo ft h i sm e t h o di so b v i o u s b e c a u s eas e r v i c ec a nn o tb ed e s c r i b e d f u l l yo n l yb ys e v e r a lk e yw o r d s ,m o r eo v e r , p e o p l eh a v ed i f f e r e n tu n d e r s t a n d i n g so ft h e s e r v i c e ,w e bs e r v i c ed i s c o v e r yu s u a l l yh a sal o wr e c a l la n dp r e c i s i o n t h i sp a p e rb r i n g st h ec o n c e p to fo n t o l o g yi n t ot h ef i e l do fs e r v i c ed i s c o v e r ya n d d e s c r i b e st h ew e bs e r v i c eb yo w l - so n t o l o g y u s i n go n t o l o g ya sab r i d g e ,b o t hs e r v i c e p r o v i d e ra n ds e r v i c er e q u e s t e rc 柚d e s c r i b e t h es e r v i c ec l e a r l y ,w h i c hr e f i n e st h em a t c hr e s u l t i nas e m a n t i cl e v e l b yt h es u p p o r to fn a t i o n a ln a t u r es c i e n c ef u n d ,t h i sp a p e rm a k e ss o m er e s e a r c ho n w e bs e r v i c ed i s c o v e r yb a s e do no n t o l o g y f i 贼0 fa l l ,t h e p a p e rr e s e a r c h e so n t o l o g y c o n s t r u c t i o nt e c h n o l o g ya n dc o n s t r u c t sas h i po n t o l o g yi no r d e rt oa n n o t a t ew e bs e r v i c eb y o w l - s ;s e c o n d ;t h i sp a p e re x t e n d st h eu d d ir e g i s t e rc e n t e r , m a p st h eo w l - s ss e r v i c e p r o f i l eo n t o l o g yi n t ot h eu d d i ,s oa st os u p p o r ts e m a n t i ci n f o r m a t i o n ;t h e n ,t h ep a p e r r e s e a r c h e so n t o l o g y b a s e dw e bs e r v i c em a t c h i n ga l g o r i t h mw h i c ha d o p t sl a y e r e dm a t c h i n g m e c h a n i s m ,t h a t sm e a n sd i f f e r e n ta l g o r i t h m sa r ea p p l i e dt od i f f e r e n tl a y e r ss u c ha ss e r v i c e c a t e g o r y ,s e r v i c ed e s c r i p t i o n ,i oa n dq o s ,e s p e c i a l l yi m p r o v e st h ea l g o r i t h mb a s e do ne r d i ni om a t c h i n gw h i c he x h i b i t st h ea d v a n t a g eo ft h eo n t o l o g yi nw e bs e r v i c ed i s c o v e r y ;a tl a s t , t h i sp a p e rp u t sf o r w a r da na r c h i t e c t u r ea b o u taw e bs e r v i c ed i s c o v e r ye n g i n ea n di m p l e m e n t s ap r o t o t y p et op r o v et h ef e a s i b i l i t yo ft h ea l g o r i t h m sb ya n a l y s i n gt h er e s u l t so fac a s e 英文摘要 t h i sp a p e ra n a l y s e st r a d i t i o n a lw e bs e r v i c ed i s c o v e r ym e t h o d s ,a n d e x t e n d st h e d i s c o v e r y m e c h a n i s mb yo n t o l o g yi nt h ef i e l d so fs e r v i c ed e s c r i p t i o na n ds e r v i c e m a t c h i n g t h e s ei m p r o v e m e n t sc o u l ds o l v e t h ep r o b l e m sl i k el o w e rm a t c h i n gr a t e t h e m e t h o da n dt e c h n o l o g yp r o p o s e di nt h ep a p e rc o u l dp r o m o t et h ee f f i c i e n c yo fw e bs e r v i c e d i s c o v e r yb o t hi nt h e o r ya n da p p l i c a t i o n k e yw o r d s :w e bs e r v i c e :w e bs e r v i c ed i s c o v e r y :s e m a n t i cw e b :o n t o l o g y ;o w l - s 大连海事大学学位论文原创性声明和使用授权说明 原创性声明 本人郑重声明:本论文是在导师的指导下,独立进行研究工作所取得的成果,撰写成 硕士学位论文= = 基王奎住的堕业丛经羞毽撞莶皇槿型婴塞:。除论文中已经注明引用 的内容外,对论文的研究做出重要贡献的个人和集体,均已在文中以明确方式标明。本 论文中不包含任何未加明确注明的其他个人或集体已经公开发表或未公开发表的成果。 本声明的法律责任由本人承担。 论文作者签名荔加鹅加孑年弓肋f 日 学位论文版权使用授权书 本学位论文作者及指导教师完全了解“大连海事大学研究生学位论文提交、版权使 用管理办法,同意大连海事大学保留并向国家有关部门或机构送交学位论文的复印件 和电子版,允许论文被查阅和借阅。本人授权大连海事大学可以将本学位论文的全部或 部分内容编入有关数据库进行检索,也可采用影印、缩印或扫描等复制手段保存和汇编 学位论文。 保密口,在年解密后适用本授权书。 本学位论文属于;保密口 不保密口( 请在以上方框内打“ ) 论文作者签名反埋乡 导师签名: 同期:榔年- 3 月2 1 日 弓铷仍 基丁本体的w e b 服务发现关键技术与模型研究 第1 章绪论 1 1 选题背景 随着计算机网络技术的发展和计算机应用的普及,分布式计算得到了长足的发展。 分布式对象计算实现了对象之间的透明互操作,解决了企业计算中的诸多问题,已经在 通信、金融等行业得到了广泛的应用。随着i n t e r n e t 在各个领域应用的普及和深化, 人们迫切需要能够方便地实现在i n t e r n e t 上跨平台、语言独立、松散耦合的异构应用 的交互和集成,这对分布式计算提出了新的要求。w e b 服务作为一种新的技术应运而生, 提出了面向服务的分布式计算模式。在当前的软件开发技术中,基于x m l 的w e bs e r v i c e 技术被认为是最有发展前途的一种分布式计算模式。因为,其采用的协议简单、灵活, 远程服务访问的语义定义和数据表示是采用流行的x m l 格式,而消息的格式又支持广泛 认可的h t t p 消息格式绑定,这就很好的解决了服务与客户之间的系统异构和服务提供 的语言的区别。m i c r o s o f t 、i b m 等业界技术厂商都对其表示了密切的关注。目前,w e b 服务已成为计算机领域的一个研究热点。 , 从基于w e b 的应用领域来看,复杂的应用连接和高耦合性的程序代码意味着w e b 应 用程序的开发、维护和更新要付出很高的代价,w e b 服务的出现刚好能解决这一问题。 它具有良好的分布性、低耦合性、可插拔性,程序员只需要知道服务的接口,而无需了 解它的实现细节,这样使得w e b 应用的开发、维护和更新的效率大大提高。 在s o a p w s d l u d d i 体系结构成为事实上的标准之后,w e b 服务有了突飞猛进的发 展,各大厂家纷纷推出支持w e b 服务体系结构的产品,使得w e b 服务的开发、部署、调 用变成一种很方便的事情。在这种背景下,w e b 服务数量日益增长。随之而来的问题是, 在浩如烟海的w e b 服务海洋中找到适合自己的服务越来越困难。 客户以某种方式在这些不同类型的w e b 服务中找到想要的服务,从而执行w e b 服务 调用,被称为w e b 服务发现。w e b 服务发现是w e b 服务系统架构中的一个重要部分,是 进行w e b 服务组装的前提。 目前,w e b 服务发现广泛采用w s d l u d d l 的解决方案。这种服务发现技术是通过关 键字匹配实现的,不能较好地支持基于语义约束的模糊匹配,主要存在以下不足: 第1 章绪论 1 ) 以语法性的语言描述的w e b 服务,主要是面向用户直接阅读的,不利于计算机 直接阅读和处理。这样会导致某些情况下,即使两个服务的输入和输出参数的类型和个 数都相等,计算机也无法断定这两个服务是匹配的。 2 ) 不同团体对同一领域事物的认识和表示往往不同,从而导致来自服务提供者与 服务请求者关于同一w e b 服务的描述存在着差异。这种认识上的差异所产生的w e b 服务 描述差异具体表现在: ( a ) 不同的服务描述使用多种术语或者词汇表达同一概念。例如某个服务提供者注 册的服务名称是“宠物食品一,而服务请求者请求的服务名称是“猫粮 ,显然这两个 服务在语义上是可以匹配的,但在w s d l u d d i 体制下,将不会被检索到。 ( b ) 同一概念在不同的服务描述中表达不同的含义。这主要体现在不同领域中的词 的含义。例如在书店“b o o k 的含义和在酒店“b o o k 的含义是完全不相同的。但是在 传统的服务发现体制下,“借书”和“订酒店一的服务可能会被看作是匹配的。 3 ) 以关键字匹配方式为主的检索是根据发布服务描述中是否包含请求查询中的关 键词来返回结果。由于许多不相关的服务也会在它的描述中包含查询关键词,所以在检 索的结果中往往会出现很多不相关的w e b 服务。随着服务数量的增大,检索的准确率越 来越低。同时这种关键字匹配的方法,查询关键词与发布服务描述中的关键词可能是语 义相同但语法不同的,从而遗漏了大量与检索概念同义或相关的内容信息,因此检索在 查全率方面也不高,难以达到理想的效果。 4 ) 服务的检索只是对服务功能描述的关键词匹配,无法充分反映服务所提供的服 务功能的语义信息,造成服务检索结果不理想; 5 ) 针对大量相似服务的发现,缺乏高效的w e b 服务择优策略以实现最佳服务的发 现。 本论文的研究目标是使w e b 服务发现高效率和自动化,缩短用户的等待时间而且尽 可能避免无效的查询结果。 1 2 课题来源 本论文题目来源于国家自然科学基金项目“面向分布式软件开发的软构件协同计算 模型及形式化验证 ( 编号:6 0 5 7 3 0 8 7 ) 。 基丁本体的w e b 服务发现芙踺技术与模型研究 该基金项目的一个研究重点是“面向分布式软件开发的软构件协同计算模型”。针 对这一研究重点,课题组提出了一个“基于过程网络的服务协同计算模型( c c m ) 如 图1 1 所示。 图1 1c c l t 模型 f i g 1 1c c mm o d e l 本论文的研究课题基于本体的w e b 服务发现引擎,是该模型的个重要组成部分。 本论文力求对服务发现引擎的设计和实现在满足上述模型要求的同时,尽量具有高内聚 性和低耦合性,可以作为通用的模块单独使用,以求未来可以发展成为一个独立的产品。 1 3 相关研究历史与现状 u d d i i l 】作为当前描述并发现w e b 服务的工业标准,应用最为广泛。它提供了描述 和注册服务的平台,服务使用者通过查询在u d d i 中注册的服务,就可以将满足需求的 服务集成到自己的应用当中。u d d i 采用了x m l 的格式,虽然解决了跨平台问题,但 x m l 本身不含语义信息,所以只能提供基于关键字的匹配。在实践中人们发现w e b 服 务的功能不可能依靠若干个关键词就可以完整表达,这也是目前在u d d i 机制下服务发 现的查准率和查全率不高的根源。 第1 章绪论 w e b 的发明人t i mb e m e r s l e e 在1 9 9 8 年提出了语义w e b 的概念,在w e b 中引入 本体( o n t o l o g y ) ,使w e b 具有计算机可以理解的语义,从而使人和计算机对w e b 服 务有统一的认识,能更好的合作。目前研究语义w e b 服务的主要方法是利用本体来描 述w e b 服务,然后通过这些带有语义信息的描述来实现w e b 服务的自动发现,调用和 组装。o w l - s 1 2 l ( w e bo n t o l o g yl a n g u a g ef o rs e r v i c e s ) ,是用o w l 语言描述的w e b s e r v i c e 的本体。在o w l - s 中,一个w e b 服务由三个本体来描述:s e r v i c e p r o f i l e , s e r v i c e m o d e l ,s e r v i c e g r o u d i n g 。简单来说,s e r v i c e p r o f i l e 描述服务是做什么的,基于 语义的w e b 服务发现主要关注这个本体,s e r v i c e m o d e l 描述服务是怎么做的, s e r v i c e g r o u n d i n g 描述怎么访问服务。o w l - s 已成为语义w e b 服务的标准,语义w e b 服 务的研究主要围绕o w l - s 展开。 学术界致力于语义w e b 服务发现的主要研究有: ( 1 ) 美国卡内梅隆大学的m a s s i m op a o l u c c i 提出了基于w e b 服务能力的语义匹配 思想1 3 l ,该思想的匹配算法主要匹配服务的输入与输出,并将服务的匹配度分成了四个 等级。它成为后来服务发现研究的核心思想 ( 2 ) 德国柏林工业大学( t e c h n i s c h eu n i v e 巧i t a tb e r l i n ,t u b ) 的o w l - sm a t c h e i i 引, 该项目用o w i ,s 对w c b 服务进行描述,然后利用其中s e r v i c e p r o f i l e 的功能行为信息对 服务请求和服务描述进行匹配。它将匹配过程分为i n p u t 匹配、o u t p u t 匹配、p r o f i l e 匹 配和用户自定义的p l u g i n 匹配。 ( 3 ) 美国乔治亚大学( u n i v e r s i t yo fg e o r g i a ) 的m e t e o r s 项目l s l ,该项目的主 要出发点是基于现行的w e b 服务工业标准,不同于上述的o w l - sm a t c h e r 项目在w e b 服务上另外建模,它对w s d l 进行了扩展,加入了与w s d l 元素对应的语义本体概念, 在匹配中主要关注带有语义标注信息的w s d l 的匹配。 ( 4 ) 英国曼彻斯特大学的l a nh o r r o c k s 和f r a n zb a a d e r ,u l r i k es a t t l e r 共同提出了将 描述逻辑运用到语义网本体语言中的思想1 6 l ,并提出将d a m l - o i l 本体翻译为s h i q 描 述逻辑语言,实现对d a m l - o i l 本体的推理。 基丁本体的w e b 服务发现关键技术与模型研究 ( 5 ) 美国马萨诸塞州理工学院的m a r kk l e i n 和美国纽约大学的a b r a h a mb e m s t e i n 提出了基于过程本体论的服务发现技术川,过程本体论将每个w e b 服务分解成几个过 程,前一个过程的输出是后一个过程的输入。 ( 6 ) o l g ac a p r o t t i 和m i k ed e w a r 等人运用描述逻辑和o w l 语言规范设计出数学 w e b 服务的匹配算法i 剐。它由m o n e t 项目发展而来,作为语义w e b 服务在特殊领域 的应用有着深远的意义。 ( 7 ) 斯坦福大学开发的p r o t e g e 系统【1 0 l 在构建本体方面已经相当成熟。 ( 8 ) 国内的研究有中国科学院的史忠植教授等人研制的多主体服务环境m a g e 和 基于描述逻辑的主体服务匹配算法;国防科学技术大学的胡建强等人提出来的q w s d l 描述语言和“三层次、五类型”的匹配模型【9 j ,主要通过基本描述、基调描述、服务质量 来对w e b 服务进行描述。 1 4 本文的研究目标及主要研究内容 1 4 1 课题研究目标 本论文的研究目标是使w e b 服务发现高效率和自动化,缩短用户的等待时间而且 尽可能避免无效的查询结果。在w e b 服务发现技术中,本文将利用本体对服务进行描 述和匹配来达到该目标。 1 4 2 主要研究内容 本论文所研究的主要内容包括以下几点: ( 1 ) 将语义w e b 中的本体技术引进到w e b 服务中,采用w e b 服务描述语言o w l 来描述服务。 ( 2 ) 构建领域本体库,重点研究领域本体内部结构,抽象为概念、概念实体以及概 念间关系三种类型,对其进行分类和定义,最终形成一个语义清晰的网状结构,能够支 持w e b 服务发现的匹配功能。 ( 3 ) 扩充现有的w s d i a j d d i 服务发现模型,使其支持语义处理能力。 ( 4 ) 在分析现有匹配算法的基础上,分析其不足,加入相似度概念,提出改进算法。 第1 章绪论 ( 5 ) 开发实验系统,实现本课题提出的改进算法,通过比较分析实验结果验证本论 文提出的匹配算法的可行性。 1 4 3 拟解决的关键性问题 在本论文中有以下关键问题需要解决: ( 1 ) 如何设计服务匹配器。其核心是匹配策略和算法的确定。 ( 2 ) 如何对现有的注册中心u d d i 进行语义扩展。因为o w l - s 框架是对服务进行 语义描述的,而目前的u d d i 并不具备语义处理能力,所以必须对u d d i 进行语义扩展。 ( 3 ) 如何构建领域本体库。构建本体库是一个很大的课题,目前构建本体库有很多 方法,采用何种方法,如何正确高效的构建本体库是一个亟待解决的问题。 1 5 本文的组织与结构 本文的组织与结构如下: 第l 章是绪论,主要介绍课题的背景、研究现状、研究内容和关键问题等。 第2 章是w 曲服务发现研究概述,对语义w e b 及w e b 服务发现等进行了简要的介 绍,为下文的论述奠定理论基础。 第3 章是基于本体的w e b 服务发现基础设施构建与扩展关键技术研究,重点介绍了 如何构建领域本体,如何利用t m o d e l 扩展u d d i 使其支持语义。 第4 章是匹配策略及算法,主要介绍了分层匹配的策略以及在各层所采用的匹配算 法。 第5 章是实验原型系统的实现,本章首次提出了一个基于本体的w c b 服务发现系统 的体系结构模型,然后基于该模型,介绍了如何采用j 2 e e 技术实现前几章提出的策略 及算法,并通过一个案例验证了该系统的可行性。 第6 章是对本文工作的总结及对未来工作的展望。 基于本体的w e b 服务发现关键技术与模型研究 2 1f f e b 服务 第2 章f f e b 服务发现概述 2 1 1w e b 服务简介 i n t e r a c t 突飞猛进的发展,使得传统的分布式计算模型d c o m c o r b a i l o p 已经不 能适应w e b 环境下的应用。随之而来的是一种全新的由w 3 c 倡导的新型计算模型w e b 服务模型。w e b 服务模型具有高度的自治性和自包含性,非常适合于分布式w e b 环境 下的应用。它对外界提供调用的接口,而不需要让外界了解具体的实现细节,降低了系 统的耦合性;它通过标准的x m l 格式描述服务;用标准化的x m l 格式的消息机制通 过网络来调用w e b 服务,完全独立于硬件或软件平台。总结起来它具有以下几个特点: ( 1 ) 使用标准的协议规范,与具体的软硬件平台无关; ( 2 ) 完好的封装性; ( 3 ) 松散耦合,提供高度的交互操作性; ( 4 ) 高度的可集成能力。 2 1 2w e b 服务的体系结构 w e b 服务采用面向服务的体系架构( s o a ) ,体系结构图如下图2 1 所示。 图2 1w e b 服务体系结构图 f i g u r e 2 1w e b s e r v i c ea r c h i t e c t u r e 第2 章w e b 服务发现概述 此架构由三个部分和三个基本操作构成。三个部分分别是服务提供者、服务请求者 和服务注册中心;三个基本操作是发布、查找和绑定。 其基本的工作过程如下:服务提供者将所提供的服务发布到服务代理的一个目录 上,服务请求者首先到服务代理提供的目录上搜索服务,得到如何调用该服务的信息, 然后根据得到的信息调用服务提供者提供的服务。 在技术上采用w s d l 描述服务,u d d i 发布和查找服务,s o a p 调用服务。 2 1 3w e b 服务的技术规范 w e b 服务主要利用h 丁r p 和s o a p 协议使服务数据在w e b 上传输,s o a p 通过h 兀t 调用服务对象执行远程功能调用,w 曲用户能够使用s o a p 和h t i p 通过w e b 调用的 方法来调用远程对象。具体地说就是客户根据自己的需求,使用浏览或直接获取两种途 径( 具体使用哪种模式与要查找的内容及已知信息有关) 查找通过u d d i 发布在网上满 足自己需要的w s d l ,生成客户端代理。使用该客户端代理就像使用本地组件一样,而 代理通过s o a p 协议去激活远程方法,实现数据访问。实现一个完整的w e b 服务体系 需要有一系列的协议规范来支撑。 s o a p ,w s d l ,u d d i 等是该体系结构应用的关键技术。s o a p ( 简单对象访问协 议) 是w e b 服务通讯的基础,其中s o a p 封装了通讯中交换的消息。因为w e b 服务是 自治的软件模块,因此需要有一个标准化的通讯方式表示服务之间通讯的消息,s o a p 就发挥了这个作用。s o a p 是一种简单的、轻量级的基于可扩展标记语言( e x t e n s i b l e m a r k u pl a n g u a g e ,x m l ) 的机制,用于在网络应用程序之间进行结构化数据交换。w s d l ( w e b 服务描述语言 和u d d i ( 统一描述、发现和集成) 协议是描述、发布、发现以 及调用w c b 服务的基础。 2 1 3 1w s d l 在面向服务的体系结构( s o a ) 中,服务描述是关键性的,它涉及s o a 的三个操 作:发布、查找和绑定。服务提供者向一个或多个服务注册处发布服务描述,服务描述 并不是实际代码本身。服务提供者使用服务描述通知服务请求者所有必要事项,以便请 求者理解如何调用服务。服务描述对于查找操作也同样是重要的。服务描述是服务请求 者查找服务注册的基础,查找操作的最终结果就是获得服务描述。服务描述对于绑定操 基丁本体的w e b 服务发现关键技术与模型研究 作的重要性体现在:它确切描述了调用w e b 服务的消息格式以及目标网络地址。w s d l 是w e b 服务中用于服务描述的语言,它是基于i d l ( i n t e r f a c ed e f i n i t i o nl a n g u a g e ) 技 术的一种服务描述语言。w s d l 定义了一套基于x m l 的句法,将w e b 服务描述为能够 进行消息交换的服务访问点的集合。在w s d l 文档中描述了服务的地址,所支持的操 作以及通信的细节,比如参数数目和参数类型等。由于w s d l 中的语义信息都是预先 定义好的,通过解析w s d l 文档,能够在运行时调用服务而不需要手工配置。同时, 将服务描述成w s d l 的形式,服务提供者能够隐藏服务内部复杂的实现机制,而服务 请求者能够绕过平台细节从而根据接下来介绍的服务规范来调用服务。 一个w s d l 文档包含了w e b 服务的四个重要信息,它们分别是:接口信息、数据 信息、绑定信息以及地址信息。为了以一种标准x m l 形式来描述这些信息,x m l 格式 的w s d l 文档定义了以下元素: ( 1 ) t y p e s :定义了w e b 服务使用的所有数据类型集合,可被元素的各消息部件所 引用; ( 2 ) m e s s a g e :具体定义了在通信中使用的消息的数据结构,m e s s a g e 元素包含了一 组p a r t 元素,每个p a r t 元素都是最终消息的一个组成部分,每个p a r t 都会引用一个 d a t a t y p e 来表示它的结构; ( 3 ) o p e r a t i o n :对服务中所支持的操作的抽象描述,一般单个o p e r a t i o n 描述了一 个访问入口的请求响应消息对: ( 4 ) i n t e r f a c e :一个i n t e r f a c e 元素组将m e s s a g e s 与o p e r a t i o n s 联系起来。它可以看 作是传统的编程语言中的类。在i n t e r f a c e 中定义的每个o p e r a t i o n 可以看作是一个类的方 法: ( 5 ) b i n d i n g :定义了特定端口类型的具体协议和数据格式规范的绑定。一个w e b 服务能够支持不止一种通信协议,因此客户端可以根据自身的具体情况来选择其中一种 绑定: ( 6 ) p o r t :描述的是一个服务访问入口的部署细节,包括通过哪个w e b 地址来访问, 应当使用怎样的消息调用模式来访问等; ( 7 ) s e r v i c e :相关服务访问点的集合。 第2 章w e b 服务发现概述 z 1 3 2u d d i w s d l 用来描述w c b 服务的相关信息,而w e b 服务开发商还需要一个方法将自己 开发的w e b 服务进行发布,广而告之。于是,统一描述、发现和集成协议u d d i 应运 而生。u d d i 是一个跨产业、跨平台的开放性架构,它可以帮助w e b 服务开发商在i n t e r n e t 上公布自己推出的w e b 服务。简单的说,w e b 服务是一种开发的规范,使得通过网络 可以对基于规范开发的各种应用进行调用、整合,从而在互联网上完成更复杂的任务, u d d i 就是w e b 服务的服务中介。 图2 2u d d i 信息模型结构图 f i g u r e2 2u d d ii n f o r m a t i o nm o d e ls t r u c t u r e u d d ix m ls c h e m a 定义了四种主要的信息类型,它们是技术人员在需要使用合作 伙伴所提供的w e b 服务时必须了解的技术信息。它们是:商业实体信息( b u s i n e s s e n t i t y 结构) 、服务信息( b u s i n e s s s e r v i c e 结构) 、绑定信息( b i n d i n g t e m p l a t e 结构) 和技术 规范信息( t m o d e l 结构) ,如图2 2 所示。 u d d i 是w c b 服务技术中的一个核心组成部分,它意图建立一个全球化的、平台无 关的、开放式的架构,使得w e b 服务能够通过统一的方式被发现和集成。u d d i 最重要 的优势来源于在所有行业和项目中对该标准的广泛使用。 基于本体的霄e b 服务发现关键技术与模型研究 2 2 语义w e b 现在,互联网已经成为人们进行信息交流的重要工具。人们可以通过互联网来寻找 自己关心的信息,也可以通过互联网来将自己的信息发布出去。但随着互联网应用的不 断扩展,现有互联网技术的局限也逐渐暴露出来。现有互联网技术的核心是超文本系统, 它的主要思想是通过统一资源标识符( u n i f o r mr e s o u r c ei d e n t i f i e ru r i ) 对互联网上的 信息进行标记,使人们可以迅速地对互联网上的信息资源进行定位【l l l 。然而,现有互联 网技术并没有对信息的含义进行描述,计算机在处理信息时只是按照u r i 来定位信息, 但对信息的内容并不关心。而人们真正关心的是信息的内容,也就是互联网上的文本、 图片等资源所包含的意义。由于现有互联网技术的局限,互联网上信息处理的自动化、 智能化程度是很低的;计算机处理器的强大功能也没有得到有效利用。 互联网技术的研究者正在研究新的技术以改变这种状况,而其中最令人瞩目的就是 语义w e b 技术。语义w c b 是互联网研究者对下一代互联网的称谓,通过扩展现有互联 网,在信息中加入表示其含义的内容,使计算机可以自动与人协同工作。也就是说,语 义w e b 中的各种资源不再只是各种相连的信息,还包括其信息的真正含义1 1 2 _ 引,从而 提高计算机处理信息的自动化和智能化。而计算机并不具有真正的智能,语义w e b 的 建立需要研究者们对信息进行有效的表示,制定统一的标准,使计算机可以对信息进行 有效的自动处理。 在2 0 0 0 年的世界x m l ( e x t e n s i b l em a r k u pl a n g u a g e ) 大会上,万维网创始人蒂 姆伯纳斯李做了题为s e m a n t i cw e b 的演讲,对语义w e b 的概念进行了解释,并提出了 语义w e b 的体系结构。2 0 0 1 年5 月,s c i e n t i f i ca m e r i c a n 封面文章发表了蒂姆伯纳斯 李的n es e m a n t i cw e b ) 一文,描绘了语义w e b 的美好前景,并对其中的主要技术进 行了简明的介绍。 我们可以给语义万维网做出这样的定义:机器可以理解数据含义的下一代万维网, 称之为语义万维网,语义万维网中的语义表示计算机对某一个概念、术语或者符号可以 理解的“含义”。 语义万维网中的知识,就是一系列对资源的建模及描述。语义w e b 上的知识具有 创建上的分散性,同时又具有应用上的通用性。语义w e b 的层次结构如下图所示: 第2 章w e b 服务发现概述 绷麟黼 、曼皇然黢j 遴蓊 l o g i c l 蓊 q j * 、 一。缫 阳l e s q u e r y 灞 。一o 。n 。t 。o l o g y 篓羔羔麴雾 # m ,fv,tm 1 4 蚰o m m 一日静 r d f m 溅i ,s y n ,t a x ! | :i | :誓。j 雾 糍麟瀵鬻瓣麟凝羹 缫黼戮缀躐缓瀚缫嬲斓 图2 3 语义w e b 层次结构 f i g u r e 2 3s e m a n t i cw e bh i e r a r c h y 语义w e b 体系结构包括七层,各层的基本功能和相互关系如下: ( 1 ) u r i s 和u n i c o d e :w e b 环境下的应用之间不可避免地需要相互通信,以机器可 读的格式传递或发布信息。这些信息中很大一部分是对w c b 上资源的描述,因此,首 先应该以明确的方式来标识这些资源( 对象) 。语义w e b 采用统一资源标识符( u n i f o r m r e s o u r c ei d e n t i f i e r su r i ) 来标识资源及其属性,u r i 是i n t e r n e t 标准,记载于r f c 2 3 9 6 1 1 4 l 。 它和w e b 常用的统一资源定位符( u n i f o r mr e s o u r c el o c a t o r ,u r l ) 以及统一资源名称 ( u n i f o r mr e s o u r c en a m eu r n ) 的区别在于u r i 泛指所有以字符串标识的网络资源, 包含了u r l 和u r n 。另外由于语义w e b 的最终目的是要构建一个全球信息的网络,在 这个网络上应该涵盖各种语言和文字的信息资源,所以它采用统一编码u n i c o d e 作为字 符的编码方案。这一层是整个语义w e b 的基石,它着眼于解决w e b 上资源的定位和跨 地区字符编码的标准格式的问题。 ( 2 ) x m l 、n a m e s p a c e 、x m ls c h e m a :在u r i 和u n i c o d e 之上,是x m l 及相关 技术层。x m l 允许用户根据需要自定义一些“有意义的”标签,对所发布信息的内容 进行标记,并使用文档类型定义( d o c u m e n tt y p ed e f i n i t i o n ,d t d ) 或x m ls c h e m a 基- 丁本体的w e b 服务发现关键技术与模型研究 来约束这些标签的结构1 1 5 l 。由于x m l 标签可以由用户根据自己的需要来定制,这样不 可避免地会造成标签同名的情况,为了避免这样的冲突,w 3 c 采用了n a m e s p a c e 机制 1 1 6 1 ( 3 ) r d f 、r d fs c h e m a :x m l 层之上是数据互操作层一资源描述框架( r e s o u r c e d e s c r i p t i o nf r a m e w o r kr d f ) 和r d fs c h e m a s 。r d f 本身并没有规定语义,但是它为每 一个资源描述体系提供一个能够描述其特定需求的语义结构的能力。从这个意义上来 说,r d f 是一个开放的元数据框架1 1 7 1 。这个元数据框架定义了一种数据模型,可以用 来描述机器能理解的数据语义。r d fs c h e m a 规范用r d f 进一步定义了建模原语【埘,提 供了r d f 模型中使用的一个基本类型系统。这个类型系统有些类似于面向对象的编程 语言。 ( 4 ) o n t o l o g y :r d fs c h e m a 可以定义类、子类、超类、特性、子特性以及它们的 约束,如定义域( d o m a i n ) 和值域( r a n g e ) 等。因此,从某种意义上说,r d fs c h e m a 本身就是一种简单的知识本体( o n t o l o g y ) 语言。但是r d f r d f s 对特定应用领域词汇 的描述能力比较弱,需要进行扩展,我们把这个r d f r d f s 之上的扩展层称为知识本体 层。d f e n s e l f l 9 j 等人认为:知识本体逐渐引起人们重视的原因在于知识本体能够在人们 和应用系统之间达成对术语含义的共享和共同理解。而对同一概念的语义共享和共同理 解恰恰是构建语义w e b 的关键。 ( 5 ) lo g i c ,p r o o f & t r u s t :到目前为止,利用r d f r d f s 以及对r d f s 进行扩展的 一些知识本体语言可以对w e b 上的

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论