(计算机应用技术专业论文)基于语义的web服务发现研究(5).pdf_第1页
(计算机应用技术专业论文)基于语义的web服务发现研究(5).pdf_第2页
(计算机应用技术专业论文)基于语义的web服务发现研究(5).pdf_第3页
(计算机应用技术专业论文)基于语义的web服务发现研究(5).pdf_第4页
(计算机应用技术专业论文)基于语义的web服务发现研究(5).pdf_第5页
已阅读5页,还剩51页未读 继续免费阅读

(计算机应用技术专业论文)基于语义的web服务发现研究(5).pdf.pdf 免费下载

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

碗十论史罄于浯史的w e b 腱舞发跳研究 摘要 照着h a t c m e t 的飞速发展,w e b 上提供的服务越柬越多,必须要有一个合适的服 务菠瑗机聿i 来支持w e b 服务。箧静在u d d i 主酶餍务奁我骞法是班关键字袭服务势 类为基础的方法。这种方法并不能有效地帮助使用者找到他们所需要的服务,查全搴 和焱准率都得不到傈证。 论文提出一拿基于语义的服务发现方法寒解决这个阕题,认为w e b 服务的查我 必须肇于服务请求耆提出的理想服务与服务提供者发布的服务进行匹配,从而找到符 合服务请求者需求的服务。目静的w e b 服务描述语言是以w s d l 为主要标准,但是 w s d l 缺乏语义的描述,本篇论文采用o w l s 来作为w e b 毅务的描述滔言。o w l - s 是一个戬本薅沦为墓穑的w e b 暇务绉述语煮,具有语义煞描述髓力。 匹配方法是谮义w e b 服务发现最关键的部分。论文提出的匹配方法是将服务请 求与服务发柿的文字描述、功能描述和服务参数三个方面进行相似度比较,分别得到 骚务请求与疆务整奄之闻熬文本莲配度、珐裁匿配瘦弱参数莲配瘦,综会这三令寿藤 的匹配度进行排序,帮助服务请求者找出符含其请求的服务。最后本文按照提出的匾 配方法设计了一个匹配引擎,经过实验验证,证明本论文的方法是有散的。 关键谲:w e b 服务、语义w e b 、本体、w e b 胶务发现、服务禚配 礤士论文基予语义的w e b 搬务发貔酶究 a b s t r a c t w i 也t h er a p i dd e v e l o p m e n to fi n t e r a c t , t h e r ea r em o r ea n dm o r ew e bs e r v i c e s a v a i l a b l eo nt h ew e b 。i no r d e rt oe m p l o yi t sf u l lp o t e n t i a l ,t h ew e bs e r v i c ep a r a d i g mm u s t b es u p p o r t e db ya na p p r o p r i a t ed i s c o v e r ym e c h a n i s m 。c u r r e n tw e bs e r v i c e sd i s c o v e r y t e c h n o l o g yi s b a s e do nu d d ia n dw s d l i ti sb a s e do i lt h ek e y w o r d b a s e dd i s c o v e r y m e t h o d + h o w e v e r , t h i sm e t h o dc a n th e l pt h eu s e r st od i s c o v e rt h ee x p e c t e ds e r v i c e sb e c a u s e t h es h o r t c o m i n g so f k e y w o r d b a s e dt e c h n i q u e sw i l ll e a d st ol o wp r e c i s i o na n dr e c a l l , i nt h i sp a p e r , a l le f f e c t i v ew e bs e n , i c e sd i s c o v e r ya p p r o a c hb a s e do nt h es e m a n t i ci s p r o p o s e dt o s o l v et h i sp r o b l e m ,i tc l a i m st h a ts e r v i c ed i s c o v e r ys h o u l db eb a s e do n s e m a n t i cm a t c h i n gb e t w e e nad e c l a r a t i v ed e s c r i p t i o no ft h es e f v i c eb e i n gs o u g h ta n da d e s c r i p t i o no ft h es e r v i c eb e i n go f f e r e d t h et r a d i t i o n a lw e bs e r v i c ed e s c r i p t i o nl a n g r a g e , i e w s d l ,l a c k so f s e m a n t i c sa n ds o ,an e wl a n g u a g e ,i 。e o w l si su s e da st h ed i s c r i p t i o n l a n g u a g eo fw e bs e r v i c e s i nt h i sp a p e r , s oi tc a nd e s c r i b ew e bs e n , i c e sw 鞭ls e m a n t i c i n f o r m a t i o n 。 t h em o s ti m p o r t a n ts t e po ft h es e r v i c e sd i s c o v e r yi st h em a t c h i r l ga p p r o a c h t h e p r o p o s e da p p r o a c hi s at h r e e - m e t r i cm a t c h i n ga p p r o a c h t h et h r e em e t r i c si n c l u d et e x t m a t c h i n g ,c a p a b i l i 桫m a t c h i n g a n d p a r a m e t e rm a t c h i n g e a c h m e t r i c c o m p a r e s t h e m a t c h i n gd e g r e eb e t w e e nt h er e q u i m e n ta n dt h ea d v e r t i s e m e n ta c c o r d i n gl oo n ek i n do f w e bs e r v i c ec h a r a c t e r t h i sm a t c h i n ga p p r o a c ha n dt h ed e s i g n e dr a n k i n gs c h e m ec a nh e l p s e r v i c er e q u e s t e r st of i n ds u i t a b l es e r v i c e s w i t ht h eh e l po ft h ep r o p o s e do n t o l o g y b a s e d a p p r o a c h ,w ec a l lm e a s u r eaw e bs e r v i c em a t c h i n gd e g r e e 协ag i v e nr e q u e s ta n dd e t e r m i n e t h er a n ki nw h i c ht h ea d v e r t i s e m e n tm a t c h e st h er e q u e s t t h ep r o p o s e da p p r o a c hi sa l s o i m p l e m e n t e dt od e v e l o pt h er e a lm a t c h i n gs y s t e m 。s i m u l a t i o n sf o rt h es y s t e ma r ea l s o p e r f o r m e d ,a n dt h er e s u l t ss h o wt h a tt h ep r o p o s e dm e t h o do f t h i sp a p e ri se f f e c t i v e k e y w o r d s :w e bs e r v i c e s 、s e m a n t i cw e b 、o n t o l o g y 、w e bs e r v i c ed i s c o v e r y , s e r v i c e sm a t c h i n g 珏 声明 零学位论文是我在导嬲的指导下啜得的研究成果,尽我所知,在 本学艇论文中,除了加以标注穗致谢熬部分外,不包含其德入已经发 表戏公布过的石丹究成果,也不包含我为获得任何激育机构的学位或学 耨两使殿过熬材料。与我蘑工作戆同攀对零学位论文霰爨戆贾献壤 己糕论文中作了明确豹说明。 研究生签名: 枷刍年汨旧 学位论文使瘸授权声瞒 辫索理工大学有投傈襻本学位论文盼电予帮纸矮文楼,可以鹰阂 或上瀚公布本学位论文的全部或部分内容,可以囱有关部门藏祝梅送 交并授毂英保存、鹰阕葳上瓣公布本学整谂文静全落蓑部分内容。对 于保密论文,拔保密的有关规定和穰序处理。 瑟究生签氢一易哆 渊哆年娴f 囊 硕 论史摹f 语义的w e b 服务莨现研究 1 绪论 1 1 研究背景 w e b 服务”1 是一种新兴的分布式技术,是w e b 技术的最新发展成果。传统w e b 应用技术解决的问题是如何让人来使用w e b 应用所提供的服务,丽w e bs e r v i c e s 则 要解决如何让计算机系统来使用w e b 应用所提供的服务。实现软件的互操作性。 要想使分布于i n t e m e t 上的服务器可以通过w c b 更自动化地,更智能化地交互,就 必须解决目l i w e b 上广泛存在的信息格式的异构性、信息语义的多重性以及信息关系 的匮乏和非统一。 将本体”。的概念和相应技术引入w e b l 强务技术中,将从根本上解决以上问题。语 义w e b ”的构想由t i mb e m e r s l e e 于1 9 9 8 年首次提出,并在2 0 0 1 年正式提出了语义 w e b 的概念。语义w e b 是当前万维网的扩展,扩展之后,万维网上的信息具备良好定 义的含义,可以帮助人类和计算机更好地协同工作。 语义w e b 的思想就是利用元数据( m e t a d a t a ) 语言对w e b 信息资源的内容进行语义 的描述,从而使计算机能够利用这些语义信息对信息资源的内容进行理解和处理,并 在此基础上实现更高层的、基于知识的智能应用。语义描述语言,比如w e b 本体语言 o w l ( w e bo n t o l o g yl a n g u a g e ) 为w e b 资源的标记和描述提供了强有力的表达能力。 为了让w e b 服务更加灵活和具有表现力,需要让其具有更多的语义内容。这就要 让服务具有机器可理解性,对用户明显易懂,并且是智能代理使能的:让个性化的智 能代理支持自动的w e b 服务发现、执行、组合和交互,冲破虚拟世界,将它扩展到物 理世界。语义w e b 服务的研究就是为了实现以上目的。 语义w e b 服务是语义w e b 与w e b 服务相结合而得的产物,在w e b 服务中有效利用 本体领域模型进行服务的概念建摸,可以指导w e b 服务应用的设计:在w e b 服务中有 效利用语义信息,进行w e b 服务和语义w e b 的有机结合可提高w e b 服务的质量。总之, 语义w e b 服务可为w e b 服务的发现、执行、解释和组合的自动化提供有效的支持,从 而实现异构系统的互操作以及无缝集成。其研究目标是扩展当莳w e b ,使w e b 中的所 有信息具有定义良好的语义,让计算机能够理解和处理,从而充分发挥w e b 的潜力。 由于本体具有丰富的语义和广泛的关系,它将变革现有的w e b 服务,使之成为语义 w e b 服务,使w e b 实现从自动化到智能化的转变成为可能。也就是说,通过合理的设 计,可以充分发挥它们各自的优势,既结合语义w e b 的语义扩展,也结合w e bj 报务的 分布特性,最终提供一种基于语义的自动w e b 服务协作机制。这种协作机制目前主要 硕t 论文基于语义的w e b 暇务发现研究 有五个研究环节:基本语义的w e b 服务的描述;w e b 服务的自动发现;被发现的w e b 服务的自动执行;w e b n 务的自动组装和交互:w e b 服务的自动执行监控。论文的研 究对象是w e b 服务发现。 最近几年,基于语义的w e b 服务发现己成为语义w e b 服务领域内十分活跃的研 究课题,一些研究项目着重于用基于o w l 的语义信息或o w l s 描述来增强当前 u d d i ”注册中心的查找能力。目前,关于语义w e b 服务方面的国际会议有很多,最 具代表性的国际会议有i s w c ( i n t e m a t i o n a ls e m a n t i cw e bc o n f e r e n c e ,自从2 0 0 2 年首 届会议召开以后,随后每年召开一届) :i c w s ( i m e m a t i o n a lc o n f e r e n c eo nw e bs e r v i c e s , 首届会议于2 0 0 3 年在美国拉斯韦加斯召开,每年一届,今年9 月1 8 日将在芝加哥召 开第四届) 等。这些会议重点讨论了w e b 服务以及语义w e b 服务发展中的热点问题。 国内对于语义w e b 的研究虽然刚刚起步,但是也吸引了越来越多的高校和科研机构 研究人员的注意,如北京航空航天大学、清华大学、上海交通大学以及中国科学院计 算技术研究所等。语义w e b 与w e b 服务的结合推动了w e b 服务领域向更高层次发展, 掀起了一股新的研究热潮,国内外对于在这方面的研究刚刚起步。 1 2 提出问题 用户要想使用w e b 服务,首先必须查找到合适的w 曲服务,因此,w e b 服务架 构需要一个合适的服务发现机制来支持。当前,发现技术是w e b 服务技术的主要挑 战之一。有效和自动地查找和选择相关的服务对使用者( 开发者或非技术人员) 和程序 ( 比如说软件代理) 都是同样重要的。 所谓服务发现就是通过一个服务代理为服务请求者寻找一个合适的服务提供者 的过程,这个过程的主要步骤如图1 2 1 所示。其主要步骤如下: 图1 2 1w e b 服务架构 1 ) 服务提供者描述其服务 2 ) 服务代理分类和发布这些服务描述 3 ) 服务请求者询问代理是否存在所需的服务 4 ) 服务代理将服务请求与已注册的服务描述相匹配,并向请求者返回结果 硕t 论文基于语义的w e b 暇务发现研究 w e bs e r v i c e s 的主要标准是u d d i ,w s d l 1 和s o a p 1 。在面向服务的体系结构 ( s o a ) ”1 中,服务提供者开发并发布一个服务到u d d i 注册中心。当服务请求者需 要一些服务的时候,就从u d d i 注册中心查找。如果服务请求者找到一个合适的w e b 服务,就能按照基于x m l 1 的w s d l 的规定,发送s o a p 消息来调用w e b 服务。这 就是在分布式系统中服务发现的标准步骤。 目前在u d d i 上的查找方法是以关键字和服务分类为基础的方法,这种方法并不 能有效地帮助使用者找到他们所需要的服务,查全率和查准率都得不到保证,因此目 前网络服务的查找仍然是一个有待解决的问题。本文的研究目标就是对服务发现的关 键步骤服务匹配1 方法进行研究。 1 3 研究方法 为了解决由于u d d i 的不足而带来的查找效率低的问题,卡内基梅隆大学的 m a s s i m op a o l u c c i 等人将语义网和本体论技术引入w e bs e r v i c e ,使用d a m l s 语言 对其进行描述、匹配。在匹配算法中,匹配效率和精度是应当考虑的重要问题。因此, 本文将在上述研究成果的基础上,进行如下几个方面的探讨和研究: 第一,研究当今w e b 服务的主要技术和语义w 曲的主要技术。包括u d d i ,w s dl , r d f ,x m l ,0 、l 等: 1 1 l 第二,对语义w e b 服务标记语言o w l s ”。进行了深入的探讨: 第三,在现有语义匹配算法的基础上,提出了一种有助于提高效率的匹配算法, 即文本匹配、功能匹配、参数匹配三个方面的匹配机制,以此来提高服务与请求问的 匹配效率: 第四,设计了一个语义w e b 服务匹配引擎,能够实现较好的服务匹配。 1 4 论文结构 第一章是绪论。介绍了目前语义w e b 技术的研究背景和国内外的研究情况, 并由其发展的趋势提出服务发现的问题,并提出本论文的研究内容和研究方 法。最后还介绍了论文的结构。 第二章介绍了语义w e b ,w e b 服务以及语义w e b 服务的相关理论和主要技术。 主要介绍了u d d i ,s o a p ,w s d l ,本体论和0 w l 。它们是进行语义w e b 服务研究的基石。 第三章对语义w e b 服务标记语言o w l s 作深入的探讨,并对语义w e b 服务 发现系统进行介绍,结合o w l - s 介绍了语义w e b 服务发现的主要任务以及 硕 论文基于语义的w e b 服务发现研究 要解决的两个问题,即u d d i 的语义扩展和匹配方法。最后对u d d i 的语义 扩展进行简单介绍。 第四章对语义w e b 服务的匹配方法作了深入研究,提出了从文本、功能、参 数三个方面进行匹配的服务发现策略,并详细给出了在每一种匹配中的具体 匹配方法,最后提出一个匹配度排序的方法。 第五章是对前面提出的匹配方法的验证和实现,通过语义w e b 服务匹配引擎 的实现完成。 第六章总结全文,并对下一步的研究工作进行展望。 4 敞卜论史摹于语义的w e b 服务发现研究 2 相关技术 本章将对w e b 服务发现的相关技术进行介绍。分别从w e b 服务,语义w e b 进行 介绍,并引入语义w 曲服务的概念。 2 1w e b 服务 2 1 1w e b 服务概述 w e bs e r v i c e 是一种新的w e b 应用程序分支,是自包含、自描述、模块化的应用, 可以发布、定位、通过w e b 调用,可以执行从简单的请求到复杂商务处理的任何功 能。一旦部署以后,其他w e bs e r v i c e 应用程序可以发现并调用它部署的服务。w e b s e r v i c e 是一种可以使用标准的互联网协议( 如超文本传输协议h r r p ,x m l 等) ,将 功能纲领性地体现在互联网和企业内部网上的应用程序。因此可以把w e b 服务看作 w e b 上的组件编程。 w e b 服务建立在一些通用协议的基础上,如h r r p ,s o a p ,x m l ,w s d l ,u d d i 等。这些协议在涉及到操作系统、对象模型和编程语言的选择时,没有任何倾向,因 此将会有很强的生命力。但具体到w e b 服务编程时,n e t 和j 2 e e 有一些区别。n e t : w e b 服务可用c 撑,v b ,j s c r i p t 等语占编写,还能利用一些w i n d o w s 资源;j 2 e e : w e b 服务一般使用j a v a 语言及j 2 e e 资源,像b e a n ,e j b ,c o r b a 等。它们在编 程环境,语法结构,管理配置等方面也各有自己的特色。n e t :w e b 服务用j a 、,a 语 言实现了n e t 类库中提供的w e b 服务a p i s 。它能把用户用n e t 开发的w 曲服务移 植到与平台无关的j a 、後,因此也可以利用j a v a 的资源。 如上所述,w e bs e r v i c e 平台是一套协议来实现分布式应用程序的创建。任何平 台都有它的数据表示方法和类型系统。要实现互操作性,w e bs e r v i c e 平台必须提供 一套标准的类型系统,用于沟通不同平台、编程语言和组件模型中的不同类型系统。 w e bs e r v i c e 平台也必须提供一种标准来描述w e bs e r v i c e ,让客户可以得到足够的信 息来调用这个w e bs e r v i c e 。最后,还必须有一种方法来对这个w e bs e r v i c e 进行远程 调用。这种方法实际是一种远程过程调用协议( r p c ) 。w e bs e r v i c e 的组件基本包括 h r r p ,x m l ,s o a p u d d i ,w s d l 。 x m l 是在w e b 上传送结构化数据的方式,w e bs e r v i c e s 要以一种可靠的自动的方 式操作数据,h t m l 不能满足要求,而x m l 可以使w e bs e r v i c e s 十分方便的处理数据, 它的内容与表示的分离十分理想。 5 硕 论文摹于语义的w e b 服务发现研究 u d d i 和w s d l 技术与x m l 和s o a p 技术紧密结合用于服务发现,在下面的章节中 将对它们进行详述。 最基本的w e bs e r v i c e s 平台是x m l + h t t p 。h t t p 是一个在i n t e r n e t 上广泛使用的 协议。剐l 是一种元语言,你可以用它书写特定的语言来描述客户和服务之间或者 组件和复杂服务之间的交互。在w e bs e r v e r s 之后,x m l 格式的消息被转变成中日】件 的请求,返回的结果也会转化成x m l 格式。有必要增加一些服务,同时保持简单性 和普遍性,来把w e b 构建成一个功能更强大的平台。可以认为功能全面的w e bs e r v i c e s 平台是x m l + h 下r p + s o a p + w s d l + u d d i 。在更高层次上,可能还要加上一些尚 未广泛接受的技术如x a m l ,x l a n g ,x k m s 和x f s 。实现一个完整的w e b 服务体系 需要一系列协议规范来支撑,具体如图2 1 1 1 _ i i f l r 示。 s t a t i c u d d i服务发现暑 d i r e c t u d d i 服务发布县 服务描述层 w s d l 服务发现 安服 服务接口全 管 务 s o a p x m l 消息 性 理质 x m ls c h e m a数据模犁层 量 x m l 数据表示屡 h 丁t p f r p ,s m t p传输层 2 1 2w e bs e r v i c e s 的基石u d d i 图2 i 1 1w e b 服务协议栈 u d d i 是一套基于w e b 的、分布式的、为w 曲服务提供信息、注册中心的企业 能够发现服务的访问协议的实现标准,意图建立一个全球化的、平台无关的、开放式 的架构,通过创建、使用一个全球性的商务注册中一t l , ,以共享信息在定义的i n t e m e t 交互方式下使得企业能对外发布自己的服务并且轻松快捷地寻找到需要的w e b 服务, 从而加速全球b 2 b 电子商务的应用。 u d d i 的核心组件是u d d i 商业注册,它使用一个x m l 文档来描述企业及其提 供的w e b 服务。从概念上来说,u d d i 商业注册所提供的信息包含白页、黄页和绿页 三个部分。所有的u d d i 商业注册信息存储在u d d i 商业注册中心中,通过u d d i 注册,各企业可以将自身的描述、服务描述以及服务访问方式的描述公开发南。 通过使用u d d i 的发现服务,企业可以单独注册那些希望被别的企业发现的自身 提供的w e b 服务。企业可以通过u d d i 商业注册中心的w e b 界面,或使用实现了 、 6 硕t 论文基于语义的w e b 服务发现研究 “u d d ip r o g r a m m e r sa p i 标准”所描述的编程接口的工具,将信息加入到u d d i 的 商业注册中心。u d d i 商业注册中心在逻辑上是集中的,在物理上是分布式的,由多 个根节点组成,相互之间按一定规则进行数据同步。当一个企业在u d d i 商业注册中 心的一个实例中实施注册后,其注册信息会被自动复制到其他u d d i 根节点,于是就 能被任何希望发现这些w e b 服务的人或单位所发现。 因而可以归纳u d d i 的基本功能为: 发布:w e b 服务的提供者按照u d d i 规范,在u d d i 注册中心注册其w e b 服务,包括注册其实体名,以及其服务的描述w s d l 文档的相关信息并 发布到注册中心。 查找:w e b 服务的请求程序可以通过u d d i 规范的程序员a p i ( 一组定 义的s o a p 消息) 搜索所需服务。 绑定:找到需要的w e b 服务后,服务请求方缓存w s d l 描述的服务调用 规范文本的副本并绑定服务。 然而如同当前大多数搜索引擎一样,u d d i 仅仅允许基于关键字来查询w 曲服 务:例如,要搜寻能够报告当前南京地区天气的w e b 服务,但在u d d i 中只查找到 报告当前中国所有省会天气的w 曲服务。尽管“所有省会”这一较大本体在逻辑上 包含“南京”这一本体,并且w e b 服务可能也会接纳值为“南京”的省会城市名字 查询参数,但在u d d i 的w s d l 文档库中来查询关键字包含“南京”的天气报告w e b 服务,便不会得到任何结果。从而只可能搜索到在字面上符合w s d l 中服务描述的 w e b 服务。显然这种现状与所需要更加准确的信息、更加智能化的发现的需求是充满 矛盾的。 2 1 3w e b 服务的关键技术s o a p s o a p ( s i m p l e o b j e c t a c c e s sp r o t o c o l ,简单对象访问协议) 是为了解决由于用传统 方式提供w e b 服务所产生的问题而提出的。它有助于实现大量异构程序和平台之间 的互操作,从而使存在的应用能够广泛地被用户所访问。s o a p 把成熟的基于h 丁r p 的w e b 技术与x m l 的灵活性和可扩展性结合在了一起。 s o a p 协议包含3 个部分,一个定义描述消息内含和s o a p 处理方法架构的信息 包,一个定义描述数据类型编码规则的集合,一个解决描述远程调用和应答的转换机 制。 简单的说,s o a p 提供了使用完全独立于平台的访问服务、对象和服务器的技术。 通过s o a p ,你将能够查询服务、调用服务、与服务通讯并处理服务,而不用去关心 远程系统的位置、所在的操作系统或平台到底是什么样的。s o a p 本身提供了与w e b 服务交换信息的方法,但是它没有提供查找w e b 服务消息的方法。而且它还不提供 7 硕t 论文 基于语义的w e b 服务发现研究 查找w e b 服务或与之交涉的方法。 s o a p 消息的框架s o a p 消息是一个x m l 文档,它由一个必需的s o a p e n v e l o p e , 一个可选的s o a ph e a d e r 和一个必需的s o a pb o d y 组成。s o a p 消息的结构如图 2 1 3 1 v 8 1 所示。 图2 1 3 1s o a p 消息的结构 ( 1 ) 一个顶层元素s o a p e n v e l o p e 。 ( 2 ) 一个s o a ph e a d e r ,h e a d e r 是为了支持在松散环境下,在通讯方( 可能是s o a p 发送者、s o a p 接受者或者是一个或多个s o a p 的传输中间节点) 之间尚未预先达成 一致的情况下,为s o a p 消息增加处理特性的通用机制。 ( 3 ) 一个s o a pb o d y ,b o d y 为该消息的最终接收者所想要得到的那些强制信息提 供了一个容器。s o a pb o d y 元素提供一个简单的用于和消息的最终接收者交换强制 信息的机制。b o d y 元素的典型应用包含r p c 调用和错误报文。 通过绑定s o a p 消息到h r r p 、s m t p 等网络上最常使用的、极为流行的通信协 议,s o a p 消息就能够轻易地穿越企业的防火墙。将s o a p 消息用h r r p 传输并不意 、 s 颀 论文 基于语义的w e b 暇务发现研究 味着s o a p 重载h t t p 己有的语义,而是s o a p 的语义通过h t t p 的映射而成为h r r p 的语义。s o a p 很自然地利用h r r p 的请求响应消息模型,将s o a p 请求的参数放 在h r r p 请求里,而将s o a p 响应的参数放在h t l p 响应里面。当需要将s o a p 消 息体包含在h r r p 消息中时,h t t p 应用程序必须依照r f c 2 3 7 6 使用媒体类型 “t e x t x m l ”。 2 1 4w e b 服务描述语言w s d l w e b 服务的原理是使用一个标准的输出接口来定义程序的实现代码所提供的功 能,以便外界可以通过这一接口来调用服务。这个接口就是w e b 服务描述语言( w e b s e r v i c ed e s c r i p t i o nl a n g u a g e ,w s d l ) 。w s d l 使用x m l ( e x t e n s i b l em a r k u p l a n g u a g e ,可扩展标记语言) 进行描述,是对一个w e b 服务的位置、支持的传输协 议、接口( 包含方法和方法的参数类型) 和实现细节等等详细而明确的说明。 w s d l 文档的根元素为 ,包括了多个命名空日】声明。w s d l 模型如 图2 1 4 1 所示。w s d l 基本元素如下: s e r v i c e s - p o r t b i n d i n g + l p 。r t t v p c i io p e r a t i o n ( s ) i j - n m e s s 鹅e | io u t m e s s a s ej i a b s t r a c ti n t e r f a c e 2 1 _ 4 1w s d l 模型 数据类型定义的容器,它使用某种类型系统( 一般地使用 x m l s c h e m a 中的类型系统) : 元素包含了方法参数或消息文档说明,是对通信所用的数据类型 的抽象定义; 、 o 硕十论文 基于语义的w e b 服务发现研究 对服务中所支持的操作的抽象描述,一般单个o p e r a t i o n 描述了 一个访问入口的请求响应消息对。 元素则使用m e s s a g e s 部分的消息定义来描述方法( 操作名称、输 入出参数) ,这将定义 i n p u t , , 元素,并按操作的类型来分组信息。 元素用于为一个特殊的端口类型的操作和信息来声明信息格式和 协议细节: 。 定义为协议数据格式绑定与具体w e b 访问地址组合的单个服务访问 点。 元素指定每个绑定的p o r t 地址。 w s d l 在技术层面上规范了如何对w e b 服务所使用的数据类型进行定义,如何 对正在通信的数据进行抽象定义,如何对服务支持的行为进行抽象描述,从而使异构 系统相互间的自动化调用成为可能。但它不能解释这些标识所表达出的语义。 2 2 语义w e b 2 2 1 什么是语义w e b 随着i n t e r n e t 的发展,人们已经习惯于在w e b 上获得各种各样的信息。人们借助于 搜索引擎,门户网站来查询自己想要的信息。然而,由于今天的w e b 内容基本上都是 只有人才能读懂的,而w e b 上的数据却急剧的上升,使人淹没在数据的海洋中,却难 以找到想要的信息,搜索引擎返回的结果也多到人们不能逐一的进行挑选。所谓的 w e b ,实质是一个u r i ( u n i f o r m r e s o u r c e i d e n t i f i e r ) 的空间,在这个空间中,任何一个 u k i 都可以连接到另一个u r j 上,而毫无限制和说明。w e b 的这种模型,一方面是它 成为一个可以包容万物的普遍的模型,另一方面却使机器难以加入其中来帮助人们找 到和处理所需的信息。 人们设计w e b 的初衷是使它成为一个信息空间,它应该不仅适用于人与人之间 的交流,更应该能使机器加入进来以帮助人们。为了这个目标,t i mb e m e r s l e e 提出 了m a c h i n e u n d e r s t a n d a b l ei n f o r m a t i o n 的概念,也就是s e m a n t i cw e b 。 s e m a n t i cw e b 并不是抛开今天的w e b 的另一条道路,而是今天的w e b 的扩展。它 使包含在它内部的信息拥有明确定义的语义,而这种语义能够使机器与人进行更好的 合作。具体地说:“w e b 是个可导航的空间,在其中每一个u r i 都映射到一个资源。 “s e m a n t i c ”意味着机器可处理的,对于数据来说,s e m a n t i c s 告诉了机器在这些数据上 所能做的操作。然而自然语言却不能表达这种s e m a n t i c s ,因为虽然自然语言有很强的 表达能力,但由于它的歧义性,机器不能准确地识别,使得它不能满足机器可处理的 1 0 硕 论文 摹于语义的w e b 服务发观研究 要求。 2 2 2 语义w e b 的体系结构 t i mb e m e r s l e e 提出了s e m a n t i cw e b 的一种层次化的结构,如图2 2 2 1 所示。 第一层:u n i c o d e 和u r i 。u n i c o d e 是一个字符集,这个字符集中所有字符都用两 个字节表示,可以表示6 5 5 3 6 个字符,基本上包括了世界上所有语言的字符。数据格 式采用u n i c o d e 的好处就是它支持世界上所有主要语言的混合,并且可以同时进行检 索。u r i ( u n i f o r mr e s o u r c ei d e n t i f i e r ,统一资源定位符) 用于唯一标识网络上的一个概 念或资源。在语义网体系结构中,该层是整个语义网的基础,其中u n i c o d e 负责处理 资源的编码,u r j 负责资源的标识一。 第二层:x m l + n s + x m l s c h e m a 。x m l 是一个精简的s o m l ( s t a n d a r dg e n e r a l i z e d m a r k u pl a n g u a g e ,标准通用标记语言) l 一,它综合 s g m l 的丰富功能与h t m l 的易用 性,它允许用户在文档中加入任意的结构,而无需说明这些结构的含意。n s ( n a m e s p a c e ) b 1 命名空间,由u r i 索引确定,目的是为了避免不同的应用使用同样的字符描 述不同的事物。x m ls c h e m a 是d t d ( d o c u m e n t d a t a t y p e ) l 拘替代品,它本身采用x m l 语法,但比d t d 更加灵活,提供更多的数据类型,能更好地为有效的x m l 文档服务 并提供数据校验机制”。正是由于x m l 灵活的结构性、由u r i 索引的n s 而带来的数 据可确定性以及x m l s c h e m a 所提供的多种数据类型及检验机制,使其成为语义网体 系结构的重要组成部分。该层负责从语法上表示数据的内容和结构,通过使用标准的 语占将网络信息的表现形式、数据结构和内容分离”“。 第三层:r d f + r d f s c h e m a 。r d f 是一种描述w w w 上的信息资源的一种语言, 其目标是建立一种供多种元数据标准共存的框架。该框架能充分利用各种元数据的优 势,进行基于w e b 的数据交换和再利用。r d f 解决的是如何采用x m l 标准语法无 二义性地描述资源对象的问题,使得所描述的资源的元数据信息成为机器可理解的信 息。如果把x m l 看作为一种标准化的元数据语法规范的话,那么r d f 就可以看作 为一种标准化的元数据语义描述规范。r d f s c h e m a 使用一种机器可以理解的体系来定 义描述资源的词汇,其目的是提供词汇嵌入的机制或框架,在该框架下多种词汇可以 集成在一起实现对w e b 资源的描述”。 第四层:o n t o l o g y v o c a b u l a r y 。该层是在r d f ( s ) 基础上定义的概念及其关系的抽 象描述,用于描述应用领域的知识,描述各类资源及资源之间的关系”一,实现对 词汇表的扩展。在这一层,用户不仅可以定义概念而且可以定义概念之间丰富的关系 【1 7 】 碗t 论文 摹于语义的w e b 服务篾现研究 第五至七层:l o g i c 、p r o o f , t r u s t 。l o g i c 负责提供公理和推理规则,而l o g i c 一旦建立,便可以通过逻辑推理对资源、资源之间的关系以及推理结果进行验证,证 明其有效性。通过p r o o f 交换以及数字签名,建立一定的信任关系,从而证明语义网 输出的可靠性以及其是否符合用户的要求。 。 图2 2 2 1 语义w e b 的层次结构 语义网的体系结构正在建设中,当前国际范围内对此体系结构的研究还没有形成 一个另人满意的严密的逻辑描述与理论体系,我国学者对该体系结构也只是在国外研 究的基础上做简要的介绍,还没有形成系统的阐述。 2 2 3 语义w e b 的关键技术 语义网的实现需要三大关键技术的支持:x m l 、r d f 和o n t o l o g y 。x m l 可以让 信息提供者根据需要,自行定义标记及属性名,从而使x m l 文件的结构可以复杂到 任意程度。它具有良好的数据存储格式和可扩展性、高度结构化以及便于网络传输等 优点,再加上其特有的n s 机制及x m ls c h e m a 所支持的多种数据类型与校验机制, 使其成为语义网的关键技术之一。目前关于语义网关键技术的讨论主要集中在r d f 和o n t o l o g y 身上。 r d f : r d f 是w 3 c 组织推荐使用的用来描述资源及其之间关系的语言规范,具有简单、 易扩展、开放性、易交换和易综合等特点”值得注意的是,r d f 只定义了资源的 1 2 硕 论文 摹f 语义的w e b 服务慧现研究 描述方式,却没有定义用哪些数据描述资源。r d f 由三个部分组成:r d fd a t am o d e l 、 r d fs c h e m a 和r d f s y n t a x l l 9 1 r d f d a t a m o d e l 提供了一个简单但功能强大的模型,通过资源、属性及其相应 值来描述特定资源。模型定义为: ( 1 ) 它包含一系列的节点n : ( 2 ) 它包含一系列属性类p : ( 3 ) 每一属性都有一定的取值v ; ( 4 ) 模型是一个三元组: 节点,属性类,节点或原始值v ; ( 5 ) 每一个d a t am o d e l 可以看成是由节点和弧构成的有向图。 模型中所有被描述的资源以及用来描述资源的属性值部可以看成是“节 点”( n o d e ) 。由资源节点、属性类和属性值组成的一个三元组叫做r d fs t a t e m e n t ( 或 r d f 陈述) 。在模型中,陈述既可以作为资源节点,同时也可以作为值节点出现,所 以一个模型中的节点有时不止一个。这时,用来描述资源节点的值节点本身还具有属 性类和值,并可以继续细化。 。 r d fs c h e m a 使用一种机器可以理解的体系来定义描述资源的词汇,其功能就像 一个字典,可以将其理解为大纲或规范”。r d fs c h e m a 的作用是: ( i ) 定义资源以及属性的类别; ( 2 ) 定义属性所应用的资源类以及属性值的类型: ( 3 ) 定义上述类别声明的语法: ( 4 ) 申明一些由其它机构或组织定义的元数据标准的属性类。 r d fs c h e m a 定义了三个核心类:r d f :g e s o u r c e 、r d f s :p r o p e r t y 、r d f s :c l a s s :五个 核心属性:r d f :t y p e 、r d f s :s u b c l a s s o f 、r d f s :s e e a l s o 、r d f s :s u b p r o p e r t y o f 、r d f s :i s d e f i n e d b y : 四个核心约束:r d f s :c o n s t r a n t r e s o u r c e 、r d f s :r a n g e 、r d f s :c o n s t r a i n t p r o p e r t y 、r d f s :d o m a i n 。 r d fs y n t a x 构造了一个完整的语法体系以利于计算机的自动处理,它以x m l 为 其宿主语占,通过x m l 语法实现对各种元数据的集成。 o n t o l o g y ( 本体) : 本体提供了一种明确的定义语义的方式,通过本体定义的语义

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论