已阅读5页,还剩41页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
| | i 删 3 9 东南大学、中国科学技术信息研究所、国家图书馆有权保留本人所送交学位论文的复印 件和电子文档,可以采用影印、缩印或其他复制手段保存论文。本人电子文档的内容和纸质 论文的内容相一致。除在保密期内的保密论文外,允许论文被查阅和借阅,可以公布( 包括 刊登) 论文的全部或部分内容。论文的公布( 包括刊登) 授权东南大学研究生院办理。 研究生签名:垄:描导师签名:研究生签名:毯墅刍导师签名: 摘要 摘要 w e b 服务匹配是异构平台上数据与应用整合与共享的关键问题。与传统基于关键字匹配的方法 相比,语义w e b 服务匹配算法效果更好、准确率更高、时间复杂度更差,服务的响应时间随着待匹 配w e b 服务的增加而增加。因此,如何基于语义的服务匹配实现快速查找所需的w e b 服务成为亟待 解决的问题。 根据目前语义w e b 服务相关技术的研究成果,本文提出基于概率模型的w e b 服务描述分类方法, 通过提取w e b 服务描述和训练文档中的文本特征信息和概念信息,建立文档特征向量和类别特征向 量;基于概率模型,计算请求服务描述与各类别间的相似度,将相似度达到预定阈值的w e b 服务作 为服务候选集,从而可减少待匹配服务数量。在w e b 服务接口匹配中,根据领域本体中概念间关系 的特点,提出改进型r g m 概念集合匹配算法,将概念集合的匹配转化为带权生成树之间的匹配, 并改进生成树节点的权重计算方法,提高概念集合匹配的准确率。基于改进型r g m 算法,结合服 务功能匹配和非功能描述信息匹配,提出w e b 服务综合匹配方法,全面计算w 曲服务间的相似度。 最后,本文设计并实现了语义w e b 服务分类匹配原型系统,对所提出的分类和匹配方法的有效 性和实用性进行了验证。实验表明,相对于经典的w e b 服务匹配算法,本文的综合匹配方法在查全 率和查准率方面都有明显提高。 关键词:w e b 服务,服务匹配,o w l s ,服务分类 a b s t r a c t a bs t r a c t w e bs e r v i c em a t c h i n gi so n eo ft h ek e yp r o b l e m sf o rd a t aa n da p p l i c a t i o n ss h a r i n ga n di n t e g r a t i n go h t h eh e t e r o g e n e o u sp l a t f o r m a l t h o u g hs e m a n t i cm a t c h i n gi sm o r ef e a s i b l ea n dp r e c i s et h a nt h et r a d i t i o n a l k e y w o r db a s e dm a t c h i n ga l g o r i t h m ,i t sm o r et i m e - c o n s u m i n g t h e r e f o r e ,a l le f f e c t i v es e m a n t i cm a t c h i n g m e t h o di sc r u c i a lt ow e bs e r v i c ed i s c o v e r i n g i nt e r m so ft h es t a t e - o f - t h e - a r to fw e bs e r v i c ed i s c o v e r i n ga n dm a t c h m a k i n g ,ac l a s s i f i c a t i o nm e c h a - n i s mf o rs e m a n t i cw e bs e r v i c ei sp r o p o s e db a s e do nt h ep r o b a b i l i t ym o d e l b ye x t r a c t i n gt h et e x tf e a t u r e i n f o r m a t i o na n dc o n c e p t u a li n f o r m a t i o nf r o mt h es e m a n t i cw e bs e r v i c ed e s c r i p t i o n sa n dt h et r a i n i n g d o c u m e n t s ,t h ed o c u m e n tf e a t u r ev e c t o r sa n dc l a s s i f i c a t i o nv e c t o r sa r ec o n s t r u c t e d a c c o r d i n gt ot h ep r o b - a b i l i t ym o d e l ,t h es i m i l a r i t i e sa lec o m p u t e db e t w e e nt h es e r v i c ed e s c r i p t i o na n dt h ep r e d e f i n e dc l a s s e s i n o r d e rt om i n i m i z et h es e r v i c ec a n d i d a t es e t , o n l yt h ew e bs e r v i c ew i t ht h es i m i l a r i t ye x c e e d i n gt h et h r e s h - o l dv a l u ei sp u ti n t ot h es e r v i c ec a n d i d a t es e t d u r i n gt h ep r o c e s so ft h ew e bs e r v i c e sf u n c t i o n a lm a t c h m a k i n g , a ne n h a n c e dr g mc o n c e p ts e tm a t c h i n gm e t h o di sd e v e l o p e db a s e d 0 1 1t h ec h a r a c t e r i s t i c so ft h e c o n c e p t u a lr e l a t i o n s h i pa m o n gt h eo n t o l o g y i nt h i sm e t h o d ,t h em a t c h m a k i n gb e t w e e nt h ec o n c e p ts e t si s t r a n s f o r m e dt ot h a tb e t w e e nt h ew e i g h t e d - s p a n n i n gt r e e s t h em a t c h i n gp r e c i s i o nc a nb ei m p r o v e db y m o d i f y i n gt h ew e i g h tc a l c u l a t i o na p p r o a c hf o rn o d e so nt h et r e e o nt h eb a s eo ft h ee n h a n c e dr g m m e t h o d ,c o m p r e h e n s i v em a t c h i n gm e t h o di si n t r o d u c e dt oc o m p u t et h es e r v i c es i m i l a r i t yb yc o m b i n i n gt h e s e r v i c ef u n c t i o n a lm a t c h m a k i n gw i t ht h en o n f u n c t i o n a ld e s c r i p t i o nm a t c h m a k i n g as e m a n t i cw e bs e r v i c em a t c h m a k i n gp r o t o t y p es y s t e mi sd e s i g n e da n di m p l e m e n t e dt ov a l i d a t et h e e f f e c t i v e n e s sa n df e a s i b i l i t yo ft h em e t h o d sm e n t i o n e da b o v e e x p e r i m e n t a lr e s u l t ss h o wt h a tt h ep r e c i s i o n a n dr e c a l lo f t h ec o m p r e h e n s i v em a t c h i n gm e t h o da r eb e t t e rt h a nt h o s eo f t h ec l a s s i c a lm a t c h i n gm e t h o d k e y w o r d s :w e bs e r v i c e ,s e r v i c em a t c h i n g ,o w l s ,w e bs e r v i c ec l a s s i f i c a t i o n i i 目录 目录 摘要i a b s t r a c t i i 目录i i i 第1 章绪论l 1 1 研究背景1 1 2 国内外研究现状1 1 3 论文的研究内容3 1 4 论文的组织结构4 第2 章w e b 服务与文本分类相关技术。5 2 1w e b 服务体系结构。5 2 2w e b 服务支撑技术。5 2 3w e b 服务的语义描述6 2 3 1o w l 本体描述7 2 3 2o w l s 语义w 曲服务描述7 2 3 常用的文本分类方法。l o 2 4 本章小结1 0 第3 章w e b 服务的语义提取与分类1 l 3 1w e b 服务的分类需求1 1 3 2 基于概率模型的w e b 服务分类方法l l 3 2 1 基于概率模型的w e b 服务分类框架1 l 3 2 2 向量化o w l - s 文档中的本体概念和文本信息1 2 3 2 3 基于概率模型的类别相似度1 5 3 3w e b 服务分类对服务匹配的影响1 7 3 4 本章小结1 8 第4 章基于语义的w e b 服务匹配方法1 9 4 1 概念集合匹配算法1 9 4 2 改进型r g m 概念集合匹配算法2 0 4 3 改进型r g m 概念集合匹配算法应用举例一2 4 4 4w e b 服务功能匹配2 5 4 5w e b 服务描述匹配2 6 4 6w e b 服务综合匹配方法2 6 4 7 本章小结2 7 第5 章语义w e b 服务分类与匹配原型系统的设计2 8 5 1 系统体系架构2 8 i i i 目录 5 2 系统实验平台 5 3 语义w 曲服务匹配过程 5 4 原型系统 5 4 1 原型系统的评估 5 4 2 原型系统运行情况 5 5 本章小结一 第6 章总结与展望 6 1 本文工作总结。 6 2 后续工作展望 j 弓【谢 参考文献 攻读学位期间发表的学术论文 i v 第1 章绪论 第1 章绪论 1 1 研究背景 随着互联网特别是w 曲技术的发展,w e b 服务技术开始出现,并不断进步、成熟。w 3 c 小组 对w e b 服务的定义是:“w e b 服务是由u r l 标识的软件应用程序,其接口和绑定可以通过x m l ( e x t e n s i b l em a r k u pl a n g u a g e ) 构件来进行定义、描述和发现,w e b 服务支持通过基于因特网的协 议,使用基于x m l 的消息与其他软件应用程序直接交互”【l l 。w 曲服务作为一种新兴的w e b 应用 模式,是一种可重用、松散耦合的分布式计算模型,它可以跨越应用系统的对象体系、运行平台、 开发语言等界限,以服务的形式封装应用并在互联网上发布,供不同的服务请求者使用。w e b 服务 应用模式简化了商业应用的开发和交互,实现了代码重用和松散耦合,被认为会将改变网络上商业 流程运作的方式。它的成功归功于底层所采用的x m l ,实现异构系统间异步、松耦合的通信和信息 共享机制。 与此同时,w e b 服务发现与匹配是w e b 服务应用模式的重要部分,旨在实现从众多的w e b 服务 中定位到满足要求的服务,发现符合需求的服务是实现服务复用、组合的重要前提,服务发现的效 果直接关系到服务调用的质量,影响到服务组合的相容性与可替换性,关系到能否真正实现服务的 即插即用。但是面对各种类型和功能都不同的服务,如何准确、高效地从庞大的w e b 服务群中找到 所需服务,并进一步满足自动、智能化的服务发现、匹配、执行、组合及互操作等要求是w e b 服务 技术面临的巨大挑战。因此,研究w e b 服务自动分类机制,采用基于本体的语义分析和推理技术【2 1 , 设计高效的基于语义的服务匹配算法来改进w e b 服务发现和匹配,提出能够提高服务发现性能的 w e b 服务匹配方案具有一定的理论价值和现实意义。 1 2 国内外研究现状 目前,国内外很多机构展开了对服务匹配技术广泛而深入的研究,研究方法和侧重点各不相同。 在国外,文献【3 叫使用o w l s ( 前身是d a m l s ) 进行w e b 服务的语义匹配。它根据请求与服务的 输入输出匹配情况将服务匹配程度分为四种:精确匹配、插入匹配、包含匹配和不匹配。服务请求 和待选的服务之间的匹配取决于它们所有的输出和输入之间的匹配。每个输出或者输入之间的匹配 又取决于它们的概念之间的包含关系。该方法查准率和效率都很高,但同一等级内的服务匹配程度 无法进行更细致的区分。 文献【7 母1 把服务匹配分为两个阶段。第一阶段,先根据请求的服务的功能性需求( 服务做什么、 它的输入输出、前提及结果) 。这个阶段确保了返回的服务能够满足请求的基本需求。第二阶段,为 当前请求任务确定最适合的服务,这基于非功能性需求,比如第一阶段返回的服务的q o s 。第二阶 段在过程联合和服务发现领域是一个重要的研究方向,因为动态绑定和调用是一种更加优越的方法。 为了实现第二阶段,他们定义了q o s 本体。使用o w l - s 描述和q o s 本体描述进行服务匹配。该匹 配方法综合考虑了服务的功能性和非功能性需求,但是仍然是基于四个匹配等级的区分,因此同样 存在区分度不够精确的问题。 文献【1 0 1 的服务匹配算法比较灵活,提供了多种匹配策略,并考虑了服务质量与服务效率的平衡。 1 东南大学硕士学位论文 采用了语义距离的机制来实现近似服务匹配。尽管使用w o r d n e t 等工具可以更方便地计算概念之间 的语义距离( w o r d n e t 是一种基于认知语言学的英语词典) ,但因为语义距离仍然需要人工建立,工 作量大、主观因素和不确定性因素很大,所以服务匹配算法的实用性和可靠性都有一定的局限性。 澳大利亚新南威尔士大学的b o u a l e mb e n a t a l l a h 等人i n 提出将w e b 服务匹配问题转换为获取请 求( 概念的析取) 的最佳覆盖( b e s tc o v e r ) 问题,即给定一个请求和知识库,要找到作为请求的最 佳覆盖的服务集合,这个集合中的每个服务描述都包含与请求尽可能多的共有信息和尽可能少的多 余信息。他们首先形式化定义了描述逻辑中的概念差异,并以此为基础定义了概念之间的相对的多 余( r e s t ) 和缺失( m i s s ) ,接着又指出概念的覆盖就是指知识库中任何与该概念共享公有信息的任 意概念的析取的集合。从而概念的最佳覆盖就是相对于此概念具有最小多余和最小缺失的一个覆盖。 最后提出了一个基于超图的算法来有效地计算最佳覆盖,并且通过计算超图横截的代价来量化匹配 度。该算法能有效地在服务描述和请求之间进行灵活匹配,但是由于最佳覆盖大多数情况下是一些 服务的集合,因此很多时候得到的匹配服务是多个,也不能提供更精确的区分。 纽约大学的m a r kk l e i n 等提出了一种基于过程本体的w e b 服务发现方、法【1 2 1 3 1 ,利用过程本体来 描述查询请求与w e b 服务,服务的发现是通过把查询的过程本体与服务的过程本体相匹配得到的, 该算法大大提高了服务匹配的精度,但是它过分地依赖于所建立的过程模型,如果建模方式不同或 者所建立的过程模型不够准确,将直接影响服务发现的最终结果,并且算法实现的复杂度较高。 卡耐基梅隆大学软件智能实验室( s o f t a g e n tl a b ) 的p a o l u c c i 等人【1 4 1 5 】开发了一系列工具来部 署和运行语义w e b 服务。这些工具的核心是一个w e b 服务匹配器o w l s a j d d im a t c h m a k e r 和一个 o w l s 虚拟机,匹配器采用了文献中的算法实现了自动化的基于语义的w e b 服务发现,o w l s 虚 拟机则可以实现自动化的w 曲服务调用。 德国人工智能研究中心的k l u s c h 等人【1 纠7 1 提出了一种将基于逻辑的推理匹配和基于语法相似度 计算的匹配相结合的匹配器o w l s m x ,基于本体的包含关系定义了5 种匹配度:e x a c t ,p l u g - i n , s u b s u m e s ,s u b s u m e d b y 和n e a r e s t - n e i g h b o r ,其中前3 种是纯粹基于逻辑的,后两种则是混合的,需 要额外计算本体概念间的语法相似度,其中用到了4 种方法来计算语法相似度:l o s s o f - i n f o r m a t i o n , e x t e n d e dj a c q u a r d ,c o s i n es i m i l a r i t yv a l u e , 以及j e n s e n s h a n n o ni n f o r m a t i o nd i v e r g e n c e 。该方法使得 在某些情况下,混合的匹配方法能够获得更好的查全率和查准率。 纽约州立大学石溪分校的h u ig u o 纠1 8 】提出了根据通过w e b 服务描述文档进行解析,自动生成 本体,并将其保存至特定的本体库中;在服务匹配阶段,借助本体库中概念和概念之间的关系,提 高服务匹配的精度和效率。 在国内,中国科学院史忠植1 1 9 1 等人开发了多主体服务环境m a g e ,并提出基于描述逻辑 ( d e s c r i p t i o nl o g i c ) 的主体服务匹配算法;该算法主要特点在于将w e b 服务表示为( 概念:动作) 的格式,然后运用描述逻辑对本体概念进行分层推理,从而实现相似度的匹配。清华大学提出的语 义w | e b 服务采用了完全分布式的发现架构,为国内的语义w | e b 服务发现技术开辟了一个全新的研究 方向。 浙江大学计算机科学与技术学院吴朝晖、吴建、李莹、邓水光等【2 0 】提出了基于本体论和词汇语 义相似度的w e b 服务发现方法,通过构建w e b 服务本体,给出了一个明晰的w e b 服务发现的研究 对象,指出可对w e b 服务进行的几种相似度计算,并对其中的词汇语义相似度计算进行详细讨论, 2 第l 章绪论 文中具体给出了两种词汇语义相似度的计算方法,其中第一种方法计算词汇语义相似度基于词语间 距离度量,第二种方法计算词汇语义相似度则建立在语义原相似度基础上。 叶蕾、张斌等【2 l 】提出了一种基于功能语义的w e b 服务发现方法,通过定义w 曲服务功能描述 模型,规范服务提供者和使用者对w e b 服务功能的描述,同时构建了领域功能本体,提出语义标注 的机制,从而让用户可以基于功能语义发现w e b 服务。 综上所述,现有的一些匹配算法还存在以下问题: ( 1 ) 过于强调w e b 服务的功能匹配,没有充分考虑w e b 服务描述中非功能信息( 如文本描述) 对w 曲服务匹配的影响。 ( 2 ) 计算相似度时,过多采用词汇间的语义距离公式,没有从概念集合角度来整体分析服务功 能相似度。 ( 3 ) 缺乏对服务描述中所包含的文本信息和语义信息进行提取和分类,导致候选服务集内待匹 配服务过多,降低服务匹配的效率。 1 3 论文的研究内容 本文在充分理解基于语义的w e b 服务匹配机制的基础上,设计了服务描述语义分类机制,提出 了基于改进型r g m 概念集合匹配算法和w e b 服务描述综合匹配方法。最后,设计并实现原型系统, 对所提出匹配方法的有效性和实用性进行验证。具体的研究内容如下: ( 1 ) 语义w e b 服务描述( o 、l s ) 的语义和描述信息提取与向量化。 主要解决语义w e b 服务描述中信息提取的问题。与一般文档相比,从语义w e b 服务描述文档 中提取信息并对其统计分析更加困难。该方法用于解析o w l s 文档,重点关注服务描述中包含的与 功能有关的语义信息,根据w e b 服务描述文档半结构化的特点,改进描述文档的预处理和解析过程, 分别统计概念和单词出现频数,过滤文档冗余词汇,提取具有关键语义的特征项,建立o w l s 文档 的特征向量。 ( 2 ) 基于概率模型的语义w e b 服务描述分类方法。 研究并改进基于概率模型的分类方法,计算待分类描述文档与各类别的相似度,将w e b 服务描 述归入相似度达到预定阈值的类别。 ( 3 ) 改进型r g m 概念集合匹配算法。 该算法利用领域本体,将概念集合扩展成概念生成树,并根据领域本体的结构特点,改进生成 树节点的权重计算方法,从而将概念集合的匹配转化为带权生成树之间的匹配。该算法主要用于w e b 服务的功能匹配。 ( 4 ) 提出基于语义相似度的综合服务匹配方法。 服务匹配算法借助语义分类算法的结果,将匹配过程分为非功能匹配和功能匹配两个阶段,全 面计算w e b 服务之间的相似度:其中,功能匹配利用改进型r g m 算法,服务描述匹配则充分挖掘 w e b 服务描述中的非功能信息( 如文本信息) ,利用特征向量模型的余弦相似度公式,计算服务之间 非功能信息的相似度。最后,加入调节系数综合计算以上两部分匹配的结果。 ( 5 ) 原型系统的设计和实现。 为了验证本文所提出匹配算法的有效性,需要构建基于语义提取和分类的w e b 服务匹配原型系 3 东南大学硕士学位论文 统,通过运行原型系统来分析算法在查准率、查全率等方面的表现,并与其它的经典匹配算法进行 对比。 1 4 论文的组织结构 本文的其余章节内容如下: 第2 章介绍了语义w e b 服务及其相关技术,着重介绍了w 曲服务、本体、本体语言o w l 、描 述逻辑以及w e b 服务本体描述语言o w l - s ,以及常用的文本分类方法。 第3 章提出了w e b 服务分类框架,介绍了建立o w l - s 服务描述中的本体概念和文本信息特征 向量,设计了基于概率模型的w e b 服务分类方法。 第4 章对语义w e b 服务匹配方法进行研究,提出了改进型r g m 概念集合匹配算法,设计并实 现了基于服务接口匹配和服务描述匹配的综合匹配方法。 第5 章介绍了w e b 服务匹配原型系统的设计和实现,以及原型系统上所运行的测试服务集,对 分类方法和匹配方法进行验证,并对测试结果进行了分析比较。 第6 章对已完成的工作进行了总结,并对后续的改进工作进行了展望。 4 第2 章w e b 服务与文本分类相关技术 第2 章w e b 服务与文本分类相关技术 2 1w 曲服务体系结构 标准的w e b 服务体系结构包含3 个基本的角色:服务提供者、服务注册中心和服务请求者。服 务提供者创建并维护w e b 服务,用w s d l 【z z j ( w e bs e r v i c e sd e s c r i p t i o nl a n g u a g e ) 来定义w e b 服 务的服务描述,通过u d d i 2 3 j ( u n i v e r s a ld e s c r i p t i o n ,d i s c o v e r y , a n di n t e g r a t i o n ) 把它发布到服务注 册中心。服务注册中心是一个统一的注册库,用来管理已经发布的服务,并提供服务的检索。服务 请求者是i n t e m e t 上对w e b 服务感兴趣的用户,他们通过服务注册库来发现能满足其需求的服务, 然后基于s o a p l 2 4 j ( s i m p l eo b j e c t a c c e s sp r o t o c 0 1 ) 来绑定和调用该服务。 w e b 服务匹配是w e b 服务体系结构的重要部分,旨在实现从众多的w e b 服务中定位到满足要求 的服务,发现并匹配符合用户需求的服务是实现服务复用、组合的重要前提,服务匹配的效果直接 关系到服务调用的质量,影响到服务组合的相容性和替换性,关系到能否真正实现服务的即插即用。 在w e b 服务体系结构中,服务请求者向服务注册中心发出查询请求时,服务注册中心将请求映射为 服务请求描述并与广告服务的描述进行匹配,服务发现的问题就转化为请求服务的描述与广告服务 的描述之间的匹配问题。匹配算法是实现有效的w e b 服务发现和匹配的核心技术,服务匹配应该保 证较高的查准率、查全率、良好的灵活性,同时应该具有较高的效率。这里的查准率定义为查询结 果中与请求服务相关的服务数目和返回的服务总数目之比,查全率定义为查询结果中与请求服务相 关的服务数目和服务注册中心中与请求服务相关的服务数量之比。 2 2w e b 服务支撑技术 w e b 服务建立在一系列的标准协议和技术之上,如:统一描述、发现和集成协议( u n i v e r s a l , d e s c r i p t i o n ,d i s c o v e r ya n di n t e g r a t i o n ,u d d i ) 、w e b 服务描述语言( w e bs e r v i c ed e f i n i t i o nl a n g u a g e , w s d l ) 、简单对象访问协议( s i m p l eo b j e c t a c c e s sp r o t o c o l ,s o a p ) 、w e b 服务流语言( w e bs e r v i c e f l o wl a n g u a g e ,w s f l ) 等如图2 1 所示。在w e b 服务体系中,使用w s d l 来描述服务,u d d i 来发布、查找服务,而s o a p 用来执行服务调用,在w e b 服务之间进行消息传递和承载,这是w e b 服务最基本的三项技术。 工作流w s f l 服务发现与集成 u d d i 服务描述 w s d l 服服 务务安 管质全 服务消息 s o a p 理量 传输h t t p ,f t p ,s m t p 互联网i p v 4 ,i p v 6 图2 1w e b 服务协议栈 5 东南大学硕士学位论文 ( 1 ) s o a p s o a p 是一个基于x m l 的在分布式环境中交换信息的协议。它包括四个部分:s o a p 封装,它 定义了一个描述消息中的内容是什么、是谁发送的、谁应当接受并处理以及如何处理的框架;s o a p 编码规则,它用于表示应用程序需要使用的数据类型的实例;s o a pr p c ,它表示远程过程调用和 应答的协定;s o a p 绑定,使用底层协议交换信息。任何传输协议都可以用来交换s o a p 消息,只 要发送和接收消息的应用程序理解该协议即可。 ( 2 ) w s d l w s d l 是一种基于x m l 的用来描述w e b 服务接口的标准,用以指明w e b 服务中使用的方法、 数据类型、使用的传输协议和w e b 服务宿主的终点u r l 。w s d l 将w e b 服务描述为能够对消息进 行操作的服务访问点的集合。操作和消息都被抽象地描述,然后绑定到一个具体的网络协议上,而 消息格式定义了一个服务访问点,相关的具体服务访问点被合成抽象的服务访问点。w s d l 是可扩 展的,允许对服务访问点和他们的消息进行描述而不考虑用于通讯的消息格式或者网络协议。 ( 3 ) u d d i u d d i 是o a s i s 发起的一个项目,它是一个基于x m l 的规范,可以使世界范围内的企业在互 联网上发布自己所提供的w e b 服务,并查找所需的w e b 服务。各公司可以使用u d d i 描述其商业 服务过程,描述信息包括三部分: 白页:有关企业的基本信息,如地址、联系方式以及已知的标识。 黄页:基于标准分类的类别信息。 绿页:与服务相关联的绑定信息,以及指向这些服务所实现的技术规范的引用。 这些描述信息可以被存储到注册中心。同时,u d d i 规范还提供了一种可以对这种描述信息进 行发布和查找的方法。u d d i 是最常用的w e b 服务发现标准,但还有其它的技术也能用于w e b 服 务的发现,如e b x m l 和w s i n s p e c t i o n ,它们都可以和u d d i 结合起来使用。 在传统的基于w s d l u d d i 的w e b 服务发现模型中,w s d l 主要描述与服务调用有关的具体信 息,例如:网络协议、消息格式、参数类型等,它主要集中在w e b 服务接口信息的描述上,而没有 充分地描述服务的功能语义信息和性能信息。w e b 服务的发现是通过对u d d i 上已注册服务的名称、 服务l d 、服务属性等信息进行关键字匹配来实现的,缺乏对用户查询请求中所需服务能力信息的提 取和处理,同时服务请求者无法从广告描述中获取服务的功能信息,因此其查准率不高,很难保证 服务调用的质量。无论是w s d l 还是u d d i ,它们对w e b 服务及其提供者的描述信息都只是基于语 法层次的描述。在终端服务是人的情况下,可以通过这种统一的描述方式和语言,实现一定程度的 w e b 服务自动化处理,使服务双方达成一致的理解。只有通过为w e b 服务增加语义层次的描述才能 实现计算机理解w e b 服务功能和其提供商的描述信息,进而实现w e b 服务的发现、组合、调用和监 控等环节的自动化和智能化的处理。 2 3w 曲服务的语义描述 随着语义w e b 技术引入到w e b 服务领域f 2 5 1 ,出现了基于语义w e b ( s e m a n t i cw e b ) 的w e b 服 务描述,形成了语义w e b 服务的研究领域。而基于语义的w e b 服务是w e b 服务和语义w e b 技术的 结合,它把语义w e b 的研究成果引入w e b 服务中,可以实现自动化的服务发现、调用、组合、监视 6 第2 章w e b 服务与文本分类相关技术 和恢复。语义w e b 的研究将使得访问w e b 资源不再仅仅依靠关键字来查找和访问,而是根据内容来 访问。o w l s t 2 6 1 和d a m l s 1 2 7 】都是用来描述w e b 服务属性和功能的上层本体规范,它使用一系列 基本的类和属性来描述服务,提供了一个可共享的框架,使得w e b 服务成为计算机可理解的实体, 从而便于实现以下任务:服务的自动发现、选择、调用、互操作、组合、执行监控等。此外,领域 本体对于w e b 服务匹配来说也很重要,自二十世纪九十年代初,本体的概念被广泛地引用到计算机 领域,旨在克服计算机系统之间“语义鸿沟”。目前,本体已经成为语义w 曲的核心内容,也是语 义w e b 的语义基础。语义w e b 应用需要通用的标准语言来表示共享的概念与知识。w 3 c 先后推荐 了r d f ( s ) ,d a m l + o i l 和o w l 作为本体描述语言标准【2 引。但是,目前服务匹配中存在的一个问 题是服务合作伙伴可以任意的选择领域本体,导致具有相同需求的服务合作伙伴可能采用不一致的 领域本体,增加服务匹配的难度。 2 3 1o w l 本体描述 o w l ( w r e bo n t o l o g yl a n g u a g e ) 是w 3 c 推荐的o n t o l o g y 描述语言的标准2 9 1 ,是在w w w 上发 布和共享o n t o l o g y 语义的标记语言。o w l 是建立在r d f s 基础上的一种新的o n t o l o g y 语言,是 d a m l + o i l 语言的延伸,基本语法和功能和d a m l + o i l 接近,丰富了语义定义机制,目的是提供 更多的原语以支持更加丰富的语义表达,并支持推理。o w l 有三个子语言:o w ll i t e 、o w ld l 和o w l f u l l 。 o w ll i t e 用于提供给那些只需要一个分类层次和简单属性约束的用户。 o w lf u l l 支持那些需要在没有计算保证的语法自由的r d f 上进行最大程度表达的用户,它允 许在一个o n t o l o g y 在预定义的( r d f 、o w l ) 词汇表上增加词汇。 o w ld l 则介于上述二者之间,支持那些需要在推理系统上进行最大程度表达的用户,这里的 推理系统能够保证计算完备性( 即所有的结论都能被计算出来) 和可判定性( 即所有计算都在有限 时间完成) 。o w ld l 是基于描述逻辑( d l ) 的,正是d l 使得o w ld l 具有了良好的表达能力和 可计算性。 d l 描述逻辑,是一种功能强大的基于逻辑的知识表达语言。d l 的一个显著的特性就是可以定 义概念( 通常又称为类) ,逻辑描述确定了对象必须满足的属性。表达描述的语言允许构造复合描述, 包括对象之间属性关系的约束。d l 的表示机制中所适用的主要推理机制是包含关系检查,当我们说 一个概念包含另一个概念时,后者的成员关系隐含了在前者中的成员关系中。 2 3 2o w l s 语义w 曲服务描述 语义w | e b 技术使得对w e b 资源的访问不再仅仅依靠关键字来查询和访问,而是可以根据内容的 语义信息来进行访问和自动处理。w e b 服务作为w e b 上一种日益重要的信息和服务提供方式,已经 成为w e b 上最重要的资源之一,因此利用语义w 曲技术来为w e b 服务提供语义层的支持,增强w 曲 服务各个应用环节的自动化和智能性,很自然地成为两者相互结合的发展研究方向,也就形成了语 义w e b 服务的研究领域。 o w l s t 3 0 1 就是一种采用本体描述语言o w l 定义的一套专门描述w e b 服务的本体,是d a r p a a g e n tm a r k u pl a n g u a g e 项目的研究成果,其前身被称为d a m l - s 。o w l s 提供了一套核心标记语 言,以一种明确的、计算机能够解释执行的方式描述w e b 服务的属性和功能等。这些描述能被计算 7 东南大学硕士学位论文 机无二义的解释和理解,从而为实现服务的自动发现、执行、组合、互操作及执行监控提供语义支 持。总之,o w l s 使服务的自动交互成为可能。 o w l s 的顶层本体结构中,s e r v i c e 类为声明w e b 服务提供了组织参考点,每个具体的w e b 服 务都将对应为s e r v i c e 类的一个实例;p r e s e n t s ,d e s c r i b e d b y 和s u p p o r t s 是s e r v i c e 类的三个属性:类 s e r v i c e p r o f i l e ,s e r v i c e m o d e l 和s e r v i c e g r o u n d i n g 分别为上述三个属性的取值,其主要功能如下: s e r v i c e p r o f i l e 主要描述w e b 服务能做什么。类似于w e b 服务的黄页,描述了服务查询代理用来判断 服务是否满足它的要求的一组服务基本属性信息,主要包括:服务的文本描述信息,服务功能属性 信息( 输入( i n p u t s ) 、输出( o u t p u t s ) 、前置条件( p r e d i c a t i o n s ) 、执行效果( e f f e c t s ) ) 等。其主要 用于w e b 服务的匹配与发现。s e r v i c e m o d e l 描述w e b 服务如何工作。以流程的形式描述服务中的各 个子活动的控制流程和协同关系。主要和s e r v i c e g r o u n d i n g 配合用于服务的自动组合和执行。 s e r v i c e g r o u n d i n g 描述如何使用w e b 服务。将s e r v i c e m o d e l 描述的过程流程与w s d l 中的通信协议 以及消息描述联系起来,给出访问w e b 服务的通信协议及其它一些特定细节,可以看成是一个与服 务交互所必需的服务描述元素规范的从抽象到具体的映射。我们进行的w e b 服务匹配和发现研究一 般只涉及到服务的描述,不涉及服务的具体执行过程和调用,因此我们下面只对s e r v i c e p r o f i l e 部分 进行详细的论述,对其它两部分本体的详细描述可以参见w 3 c 提供的相关文档。 w e b 服务的一次业务,涉及到三方:服务请求者、服务提供者和服务注册中心。上述三者的关 系与现实中的房屋出租方、求租方和出租中介的关系类似,在i n t e r n e t 这样的开放环境中,服务请求 者无法事先得知是否有满足其要求的服务提供者存在,需要通过类似u d d i 这样的服务注册中心来 查找合适的服务,就像人们通常通过搜索引擎来查找w e b 信息一样。而服务的提供者为了让其他人 能够发现并使用自己的服务,会首先在服务注册中心注册登记自己的服务。而服务注册中心的作用 就是对服务双方的要求进行匹配,并按照匹配程度为服务请求者提供合适的服务提供者。这个过程 中一个最重要的环节就是服务双方对其服务要求的描述。在o w l s 中,s e r v i c e p r o f i l e 就是这样的服 务描述工具,它既可以描述提供者的服务,也可以描述请求者的服务需求。具体来说,p r o f i l e 本体 模型如图2 2 所示,主要包含以下四个部分: 图2 - 2s e r v i c e p r o f i l e 的部分类和结构 8 第2 章w e b 服务与文本分类相关技术 ( 1 ) 描述连接s e r v i c e p r o f i l e 类与s e r v i c e 类的属性 s e r v i c e p r o f i l e 类为服务的所有类型描述提供了一个超类,并通过一对互逆的属性p r e s e n t s 和 p r e s e n t e
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2026年第一季度人工智能风险投资趋势报告
- 航空服务技能教学标准
- 农业机器人应用结题报告
- 半导体应变计压阻系数研究报告
- 家庭手摇晾衣架钢丝绳更换指南
- 植物细胞考试试题及答案
- 2026年河北省石家庄市裕华区中考英语定心试卷(一)(含详细答案解析)
- 2025-2026学年浙江省温州市环大罗山联盟高二(上)期中信息技术试卷(含答案)
- 2025年海南万宁一级建造师考试(机电工程管理与实务)题库含答案
- 一级建造师考试(通信与广电工程管理与实务)真题及答案(日喀则)
- 中医药产业科技成果转化方案
- 2025海南东方市招聘社区专职工作人员196人(第1号)考试参考试题及答案解析
- 克雷氏骨折课件
- 2024煤矿地质工作细则
- 南宁三中小升初数学试卷
- 2025中小学教师考试《教育综合知识》试题及答案
- 广东广州2012-2024年中考满分作文130篇
- DGTJ08-2271-2018 工程物探技术标准
- 卫生健康事业高质量发展路径
- 暖通可行性研究报告
- 电气建修公司运营方案
评论
0/150
提交评论