(图书馆学专业论文)基于元数据大纲的信息检索服务描述研究.pdf_第1页
(图书馆学专业论文)基于元数据大纲的信息检索服务描述研究.pdf_第2页
(图书馆学专业论文)基于元数据大纲的信息检索服务描述研究.pdf_第3页
(图书馆学专业论文)基于元数据大纲的信息检索服务描述研究.pdf_第4页
(图书馆学专业论文)基于元数据大纲的信息检索服务描述研究.pdf_第5页
已阅读5页,还剩51页未读 继续免费阅读

(图书馆学专业论文)基于元数据大纲的信息检索服务描述研究.pdf.pdf 免费下载

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

基于元数据大纲的信息检索服务描述研究 图书键学专业 磷究生:黄莺指替教师:张晓椿教授 分稚环境正逐渐成为各类图书情报机构和信息资源系统的主流环境,分布 环境下爨掏系统懿发理和灞瘸、戳及在越基磴上豹激务集残,是数字图书饿壕 域警薜辑懿载重点帮难点之一。 零文滋分布式的信息环境和解决分雍式环麓中髯搦信息系统互操终的有效 途径开放描述机制为切入点,引入信息服务描述的概念,并选择信感b 鼹务 黪一个黧黉类型信息检索缀务为其髂鼢磷究对象,分辑了癌息鼹务攒遮取 黎惑检索羧努攒述懿意义;系绞磋究慧缝了支持黢务发现楚骚务攒逮凝裁,考 察西前已霄的信息服务描述谣言秘方法楚否可以殿瘸到以开放播述为嗣搽的信 息服务描述中,介绍了在信息服务描述方面研究得较多的两个项目j i s ci e s r 和m e t a s e a r c hi n i t i a t i v e ,分析它们魁如何描述信息服务的。通过分析,得出 结论:元数据大纲是实现信息资源系统开放描述中信息检索服务描述的良好途 径。论文辫第疆章就信惠检索服务元数攥大纲设计抟闯题进幸亍了深入的探讨, 毽瑟大缨竣诗戆盛要毪,要遵缀熬瓣粼、竣诗瀚瘫密、设计步骤;挺窭了令 糠略的羧索服务元数据大纲实体模型,分耩了检索务元数据大缀应该定义敬 属性元素;并对服务元素定义的鼹点问题的解决掇t 出了笔者个人的看法。文章 最艏分橱了如何对信息检索服务元数爨大纲加以发展和完善,探讨了梭索臌务 元数攥大缎豹应矮裁暴。 关键谰: 信息服务信息检索服务服务描述元数据大纲 i n f o r m a t i o nr e t r i e v a ls e r v i c ed e s c r i p t i o ns t u d y b a s e do nm e t a d a t as c h e m a m a j o r :l i b r a r ys c i e n c e p o s t g r a d u a t e :h u a n gy i n g a d v i s e r :p r o f z h a n gx i a o l i n t h ed i s t r i b u t e de n v i r o n m e n ti sb e c o m i n gt h em a i n s t r e a me n v i r o n m e n to fa l l k i n d so fi n f o r m a t i o nf c s o b t c cs y s t e m s i nt h i sd i s t r i b u t e de n v i r o n m e n t ,t h ep r o b l e m o ft 1 1 ed i s c o v e r y t r a n s f e ra n di n t e g r a t e ds e r v i c e sb e t w e e nh e t e r o g e n e o u ss y s t e m si s o n eo f t h es t u d ye m p h a s e si nt h ed i g i t a ll i b r a r yf i e l d t h i sp a p e ri n t r o d u c e st h ei d e ao fi n f o r m a t i o ns e r v i c ed e s c r i p t i o n ,b a s e do nt h e o p e nd e s c r i p t i o nm e c h a n i s m s ,w h i c h i sa ne f f e c t i v em e t h o dt ot h ei n t e r o p e r a b i l i t yo f t h eh e t e r o g e n e o u ss y s t e m si nt h ed i s t r i b u t e de n v i r o n m e n t ;m o r e o v e r ,s e l e c t st h e i n f o r m a t i o nr e t r i e v a ls e r v i c ea st h es t u d yo b j e c t a ni m p o r t a n tt y p eo fi n f 0 n a t i o n s e r v i c e ,a n a l y s e st h es i g n i f i c a n c eo fi n f o r m a t i o ns e r v i c ed e s c r i p t i o na n di n f o r m a t i o n r e t r i e v a ls e r v i c ed e s c r i p t i o n ;s y s t e m a t i c a l l yr e s e a r c h e sa n ds u m m a r i z e st h es e r v i c e d e s e r i p d o nm e c h a n i s m st h a ts u p p o r ts e r v i c ed i s c o v e r y ,r e v i e w sw h e t h e rt h ee x i s t i n g s e r v i c ed e s c r i p t i o nl a n g u a g e sa n dm e t h o d sc a nb ea p p l i e dt os e r v i c ed e s c r i p t i o no f t h eo p e nd e s c r i p t i o nm e c h a n i s m s t h ep a p e rs y s t e m i c m l yi n t r o d u c e st w os t u d yr e p r e s e n t a t i v e si nt h ea s p e c to f s e r v i c ed e s c r i p t i o n :j i s ci e s ra n dm e t a s e a r c hi n i t i a t i v e ;a n a l y s e sh o wt h e y d e s c r i b e dt h ei n f o r m a t i o ns e r v i c e s a c c o r d i n gt ot h ea n a l y s i s ,t h ep a p e rd r a w st h e c o n c l u s i o nt h a tm e t a d a t as c h e m ai sar a t h e rb e r e rm e t h o dt os e r v i c ed e s c r i p t i o no f t h eo p e nd e s c r i p t i o nm e c h a n i s m s t h ef o u r t hc h a p t e ro f t h e p a p e r i st h ei m p o r t a n tp a r ta n dr e s e a r c h e st h ed e s i g no f m e t a d a t as c h e m ao f t h ei n f o r m a t i o nr e t r i e v a ls e r v i c ed e s c r i p t i o ni nd e p t h ;r e s e a r c h e s t h en e c e s s a r y ,p r i n c i p l e s ,c o n t e n ta n dp r o c e s s e so f t h ed e s i g no f t h em e t a d a t as c h e m a ; m o r e o v e r ,p r o p o s e s ac u r s o r ye n t i t i e sm o d e lo ft h em e t a d a t as c h e m ao ft h e i n f o r m a t i o nr e t r i e v a ls e r v i c ed e s c r i p t i o na n dt h ep r o p e r t i e se l e m e n t st h a tt h e m e t a d a t as c h e m ao ft h ei n f o r m a t i o nr e t r i e v a ls e r v i c ed e s c r i p t i o nm u s td e f i n e ;t h e a u t h o rp r o p o s e st h eo w no p i n i o n so ft h ed i f f i c u l t i e si nt h ed e s i g no ft h em e t a d a t a s c h e m aa n dt h ed e f i n i t i o no f p r o p e r t i e se l e m e n t s h lt h ee n d t h ep a p e ra n a l y s e sh o wt od e v e l o pa n dc o n s u m _ w i a t et h em e t a d a t a s c h e m ao ft h ei n f o r m a t i o nr e t r i e v a ls e r v i c e ,a n de x p l o r e st h ea p p l i c a t i o np r o s p e c to f t h em e t a d a t as c h e m a k e yw o r d s :i n f o r m a t i o ns e r v i c e ,i n f o r m a t i o nr e t r i e v a ls e r v i c e ,s e r v i c e d e s c r i p t i o n ,m e t a d a t as c h e m a 综述 分布环境下异构信息系统的发现、调用和服务集成即异构系统的互操作问 题是数字图书馆领域当前研究的热点和难点,开放描述机制为解决这一难题提 供了一种有效的途径。 本文从开放描述机制的概念、原理出发,提出信息服务的开放描述是信息 资源系统实现开放描述不可缺少的部分,分析了信息服务描述的概念和意义, 并系统研究总结了支持服务发现的服务描述机制:关键词描述、模块描述、对 象描述和本体描述,对不同层面描述机制的典型代表的结构、原理进行分析, 选择有代表性的服务描述案例j i s ci e s r 和m e t a s e a r c hi n i t i a t i v e 进行了剖 析;并在此基础上以检索服务为例,提出了一个粗略信息检索服务元数据大纲 的实体模型以及大纲的设计原则、设计内容和实体属性;最后文章对信息检索 服务元数据大纲的发展、完善及其应用前景进行了简要的探讨。 由于本文的研究涉及尚未成熟的前沿领域,问题比较复杂,国外在这方面 的研究尚处于试验研究阶段,国内也还没有成型研究成果,本文研究的重要意 义就在于:对开放描述机制在信息资源系统中信息服务层面的应用进行了初步 的探索;对建立方便和可靠的支持动态服务发现和服务集成的系统环境有着一 定的理论指导意义和参考价值。 然而,由于信息环境所涉及的服务对象的复杂性,完整的服务描述还有许 多待解决的问题,在此基础上的服务发现和集成还需要在复杂环境中进行系统 测试,这都需要通过新的研究来进一步探索。这也是本课题的研究需要深入的 地方。 本文的选题是笔者在导师张晓林教授的指导下确定的。该选题也与笔者在 研究生阶段主要学习和研究元数据、信息服务描述这一个方向一致。 本文的研究是按照“提出问题、分析问题、解决问题”这样的思路来进行 的a 首先提出了检索服务描述的必要性,然后考察已有的描述机制、方法、语 言和相关研究项目,考察结果是目前的描述方法和语言并不适合应用到信息系 统开放描述中,另一方面,相关项目的研究成果为开发设计信息检索服务元数 据大纲提供了参考和借鉴。通过对问题的分析,得出了问题的解决办法元 数据大纲的设计。 本文所采用的主要研究方法是文献调研法。 本文的创新点主要包括以下几个方面: 1 分析了信息服务描述和信息检索服务描述的概念和意义; 2 提出了在基于开放描述的信息资源系统中,利用元数据大纲描述信息服 务( 以信息检索服务为例) 的方法; 3 归纳检索服务元数据大纲设计应遵循的几点原则,提出检索服务元数据 大纲设计应包括的内容、设计的一般步骤; 4 在分析j l s ci e s r 和m e t a s e a r c hi n i t i a t i v e 中元数据大纲实体模型基 础上提出了一个信息检索服务大纲的实体模型;并分析了每个实体需要描述的 属性; 5 为构建方便、可靠的支持动态服务发现和服务集成的系统环境提出了一 种新的思路和方法。 1 引言 1 1 研究背景 随着网络化和数字化进程的加快,无论是传统图书馆还是数字图书馆都发 展成为由众多分布、异构和自主的子资源系统组成的开放系统,这些开放系统 同时又处于不断变化的环境之中。所以,面对如此分布、异构、变化和开放的 数字信息资源与服务环境,包括各类图书馆在内的信息资源系统需要对这些分 布的资源和服务进行集成,通过互操作、整合处理以及集成管理,提供面向用 户的逻辑上统一或相互有机连接的数字信息服务机制,从而支持在整个数字信 息环境中信息资源的有效使用、广泛获取和长期保存。为实现在这样的分布环 境下信息资源与服务的集成,图书情报研究与应用领域探索和试验了多种途径, 包括基于标准的互操作、基于分布式对象请求的互操作、基于元数据转换的互 操作、基于开放元数据搜寻和检索的集成、基于开放描述的开放体系集成。 由于基于开放描述机制构建的信息资源系统能灵活地应对复杂、多变的信 息环境,同时有着良好的可伸缩性和持续性,成为当前图书情报领域的一个研 究热点。所谓开放描述,指信息资源系统通过计算机可识别的开放语言和规范 方式来描述自己资源系统各个层次的内容,尤其是自己的数据格式、组织体系 和管理机制。所形成的描述文件及其定义语言置于本系统公知位置、或递交公 共登记系统,第三方系统可以对这些描述文件进行搜寻,按照开放语言规则进 行解析,从而使第三方系统能识别、理解本系统的格式和规则,并在此基础上 实现系统问的互操作。【1 1 这就意味着信息资源系统不仅要开放、规范地描述资 源系统的信息内容、作品与对象、作品对象的集合,同时还要描述与作品对象 及其集合相关的管理机制和服务机制,乃至服务的过程和模式,最终形成一个 完整的信息资源系统开放描述层次体系。 近几年来,无论是图书馆学领域还是情报学领域都对如何开放、规范地描 述信息内容、信息作品与对象、乃至作品与对象的集合进行了大量的研究,许 多研究成果已经成熟,并应用到实际工作中,极大地促进信息资源的建设、利 用和共享。而在如何描述信息作品对象及其集合的管理与服务机制、信息服务 张晓林数字图书馆建设中的开放描述机制现代图书情报技术,2 0 0 2 ,( 3 ) :6 - 9 过程和服务系统模式方面的研究却很少看到。所以,根据信息资源系统开放描 述机制的基本原理和目标,我们迫切地需要研究出一种或几种开放描述信息资 源的管理机制和服务机制、服务过程与模式的方法,从而使信息资源系统丌放 描述体系得到完善。 1 2 国内外研究现状 根据笔者文献调研的结果看,无论是国内还是国外对信息服务描述的研究 主要都集中在电子商务、计算机和人工智能领域。在国内的图书情报领域,除 了在研究信息资源集合描述的时候附带地研究与资源集合相关的服务描述外, 还没有学者或研究项目将信息服务描述作为一个单独的研究对象进行专门研 究。而国外的图书情报领域里,对信息服务描述研究得最多的是英国j o i n t i n f o r m a t i o ns y s t e m sc o m m i t t e e ( j i s c ) 下i n f o r m a t i o ne n v i r o n m e n ts e r v i c e r e g i s t r y ( i e s r ) 试验,该试验性研究提出了一套具体的元数据大纲用来描述 j i s c 的信息资源集合及其相关的服务,并开发了一个类似与机器可读目录的登 记系统,供第三方系统( 包括应用程序和代理) 访问、获取、解析和集成。目 前该试验研究还在进一步的完善中。此外,美国信息标准化组织( n a t i o n a l i n f o r m a t i o ns t a n d a r d so r g a n i z a t i o n ,以下简称n i s o ) 的m e t a s e a r c h i n i t i a t i r e 项目下的一个工作组也正在研究利用z e e r e xe x p l a i ns c h e m a 来描 述图书馆的检索服务以实现信息检索系统的集成。 目前,电子商务、计算机领域的研究者们已经研究出了一些信息服务描述 的机制或方法,它们大致可以分为两类:一类是在研究信息服务定位时所涉及 到的信息服务描述方法,这类方法主要基于应用协议层面,如s l p 、s d l 、u p n p 、 j i n i 、c o r b a :另一类是应用在电子商务和语义网络中的语言层面的描述方法, 如r d f 、w s d l 、o w l 、o w l s 、e b x m l 。上述这些方法和语言已经在电子商务、计 算机网络的实际工作中得到较为广泛的应用。所以,目前国内外也有学者致力 于将这些方法、机制、语言引入到图书情报领域,以描述图书情报领域的信息 服务。 1 3 研究意义 由于信息服务的范围广泛、种类繁多,在本文的研究中,笔者选择了一种 4 重要的、有代表性的信息服务检索服务为研究对象,在分析了信息服务描 述的含义、意义基础上归纳了信息检索服务描述的含义和意义。通过对现有的 信息服务描述方法和语言的考察、对相关研究项目的介绍总结出检索服务元数 据大纲设计的必要性。所以,本论文的主要研究意义在于:通过对基于元数据 大纲的信息检索服务描述的可行性、必要性的探索性研究为研究设计出完整的 信息检索服务元数据大纲做好铺垫、提供参考;为开放设计信息资源体系中其 他类型服务的描述方法提供了一种可借鉴的思路;同时为设计和开发图书馆集 成检索系统提供一种可行的方法。利用检索服务的元数据大纲,服务提供方负 责对他们的检索系统进行描述,并将描述结果登记到系统的公知位置或公共登 记系统中供其他应用程序和代理自动集成,信息资源的集成检索系统可以自动 查找将被集成的检索服务的描述,通过对查找结果的分析了解检索系统的信息 组织方法、检索协议、数据结构等,从而开发出集成检索系统,实现信息资源 的集成检索、跨库检索。 2 图书馆信息检索服务描述概述 2 1 信息检索服务及其描述的含义 2 1 1 信息检索与信息检索服务 目前,学术界对“信息检索”这一基本概念并没有一个准确、统一的解释。 因为对“信息检索”概念的理解很大程度上取决于对“情报检索”这一概念的 理解。在对“情报检索”的多种定义中,更多的人认同这样的说法:“情报检 索是将情报按一定的方式组织和存贮起来,并根据用户的需要找出有关情报的 过程”。作为人类社会活动不可分割的一部分,情报检索有着悠久的历史,但 作为一门独立的学科,其发展历史并不算长,其发展也是随着计算机技术和网 络通信技术的迅速普及而突飞猛进的。同样,也是由于计算机技术和通信技术 的发展,社会信息化进程加快,信息在人们生活中所扮演的角色越来越重要, 人们的信息需求也越来越多。沿用“情报检索”中“检索”的概念,人们将信 息用户为处理解决各种问题而查找、识别、获取相关的事实、数据、知识的活 动及过程称为信息检索。【1 l 这一定义将“信息检索”看成是一种活动过程;而 从信息服务的角度看,信息检索服务需要将信息按照一定的方式组织和存贮起 来,并尽可能地提供方便、快捷的方法和途径供信息用户查找,获取他们所需 要的信息。 本文对信息检索服务描述的研究正是从后一种理解出发的。 2 1 2 对信息检索服务描述的理解 作为一种信息服务的信息检索,其描述首先要满足信息服务描述的要求。 根据信息资源系统开放描述的概念和基本原理【2 1 ,笔者认为信息服务描述需要 满足以下几个方面的要求: 1 描述的对象应当包括服务的内容、机制、技术原理、流程,服务的接入 条件、传输条件、检索条件和应用条件,而且针对不同的应用目的,描述的深 入程度不同。 王知津,李明珍十年来我国信息检索研究述评现代图书情报技术,2 0 0 4 ,( 1 2 ) :2 53 1 1 2 1 张晓林教宁图书馆建设中的开放描述机制现代图书情报技术,2 0 0 2 ( 3 ) :69 6 2 描述的原则、框架应当尽可能同信息内容、对象及其集合的描述原则、 框架保持一致,从而保证整个数字信息资源系统各层描述的无缝整合。 3 具体描述方法应该尽可能基于开放的标准和规范,以确保信息资源系统 之间的互操作,但也不排斥任何系统采用自己的特殊方法描述其系统,只要能 保证自主系统与包括第三方系统在内的外界用户交互时采用标准的机制。 4 描述所采用的标准、规范、自主系统的特殊描述方法以及描述结果应该 登记发布到系统的公知位置或公共登记系统中,从而支持通过开放的搜寻和调 用机制实现对分布、异构、变化的信息服务系统的发现、调用和配置。 事实上,在图书情报领域里,对“信息服务”的理解有广义和狭义之分。 从广义的角度出发,信息服务属于信息资源集合的范畴,图书情报领域的信息 服务都是和信息资源集合密切联系着的,信息资源集合是图书馆提供信息服务 的基础。而从狭义的角度看,可以将信息资源集合和信息服务看成是两个单独 的实体,这样理解的“信息服务”就可以把图书馆提供的诸如o p e n u r l 解析之 类的不和任何资源集合发生联系的服务归纳于其中。 由于信息检索服务和信息资源集合存在着的依赖关系,信息检索服务描述 所采用的方法必须能准确地揭示服务、资源集合、用户三者之间的相互关系。 2 2 信息检索服务描述的意义 信息检索服务描述的意义可以归纳成两个部分:它首先具备所有信息服务 描述的意义和作用,同时作为一种具体的信息服务,其开放描述有着它特殊的 意义。 2 2 1 信息服务开放描述的意义 ( 1 ) 分布、异构、变化的数字信息环境给各类信息资源系统带来机遇和挑 战,如何在这样的环境下提高其服务的可获取性、可互操作性、可持续性是各 类信息资源系统应对这样的机遇和挑战必须思考的问题。开放描述机制为这一 问题提供了一种有效的解决办法。信息服务的开放描述能极大地提高异构系统 之间的互操作性,从而使信息服务在新型的环境下能够被有效利用、广泛获取; 提高信息资源的利用率,实现资源的共享。 ( 2 ) 无论是电子商务领域还是计算机领域,信息服务描述研究已经取得一 定的成果,比如u d d i 、w s d l 、o w l s ,尤其是电子商务领域的研究成果已经开始 为该领域创造效益。网络环境下,图书馆尤其是数字图书馆,信息服务的范围 已经突破传统的教学科研领域,不断地向应用领域拓展,所以图书馆信息服务 描述成为图书馆扩大服务领域、同时又与其他领域服务接轨的必要举措。 2 2 2 信息检索服务开放描述的意义 ( 1 ) 对信息检索服务的描述是信息资源系统开放描述不可缺少的部分。资 源集合的描述能为所描述的对象提供一个整体的概况信息,有利于用户方便、 快捷地定位所需要的信息。信息检索服务描述在资源集合描述的基础,用户通 过搜寻、解析获取资源的检索服务的描述文档,从而了解检索服务的交互界面、 所支持的协议,实现资源的自动获取。 ( 2 ) 为实现跨库检索、集成检索提供了一种有效的途径。按照开放描述的 要求,信息检索服务描述大纲的定义文件及其根据该大纲所形成的服务描述文 件置于本系统公知位置、或递交公共登记系统,第三方系统可以对这些定义文 件和描述文件进行搜寻,按照开放语言规则进行解析,从而使第三方系统能识 别、理解被描述检索服务的格式和规则,并在此基础上为用户开发出统一的检 索界面,实现异构系统的集成检索。 3 信息服务描述的方法与实例 3 1 信息服务描述的方法 笔者在前言部分已经论述到,目前的信息服务描述方法绝大部分来源于电 子商务、计算机领域,而且这些方法、语言已经得到了广泛地应用,并对资源 和服务的共享起到积极的促进作用。所以对这些方法和语言的分析对本课题的 研究有着重要的参考意义。 根据信息服务描述所基于的不同层面,可以把信息服务描述的方法分为四 类:基于关键词的描述、基于模块的描述、基于对象的描述和基于本体的描述。 3 1 1 基于关键词的描述方法 服务描述最简单的方法是基于关键词的描述。这种方法利用若干关键词或 可供人们阅读的文本来揭示服务的基本特征。g n u t e l l a 和n a p s t e r 就是这种方 法的典型例子。在采用这种方法的服务系统中,文件以文件下载服务的形式被 提供给用户,文件下载服务用一个或几个关键词来描述这些关键词通常都 来源于那些文件的文件名。这种描述的缺点是语义表达性很低,为找到所需的 文件,往往需要人们对众多的查找结果进行人为地筛选;优点是匹配器能较容 易地实现服务描述和服务需求描述之间的自动比较。 3 1 2 基于模块的描述方法 w s d l 、e b x m l 、s l p 都是具体的模块描述方法。这种方法的原理是将服务的 特征分成几个模块,再为每个模块定义一组相关的属性来描述模块的信息,每 个属性在描述服务时被赋予具体的关键词或特定的属性值,这种方法在一定程 度上提高描述结果的表达能力,在对服务描述结果进行匹配查找时,也比基于 关键词的方法更容易一些。 w s d l 是一种用来描述w e bs e r v i c e ( w e b 服务) 的x m l 格式的语言,是w e b 服务体系结构的组成部分,所以,对w s d l 的认识应该从w e b 服务的概念和原理 出发。 w e b 服务是自包含的、模块化的应用程序,它可以在w e b 中被描述、发布、 查找以及调用:另一方面,也可以将w e b 服务理解为基于网络的、分布式的模 块化组件,它执行特定的任务,遵守具体的技术规范,这些规范使得w e b 服务 能与其他兼容的组件进行互操作。 w e b 服务技术作为w e b 网络中的多种异构应用之间的标准交互机制,为开 放环境下发布、发现、调用和捆绑w e b 服务提供了一整套方法: ( 1 ) 对w e b 服务( w e b 网络上可实现一定服务功能的软件模块) ,采用规 范方式( 如w s d l 协议) 进行描述,描述内容包括数据类型、消息格式、传输协 议、位置、使用条件和服务质量等。 ( 2 ) w e b 服务提供者可在自己系统公知位置发布关于w e b 服务的规范描述 文件,供服务请求方利用搜索引擎进行搜寻;或者将这些描述文件发布到开放 的w e b 服务注册系统( 如u d d i ) ,供服务请求方查询; ( 3 ) 在此基础上,服务请求方与提供方通过基于x m l 的s o a p 协议来进行 服务调用和服务信息传递。s o a p 通过一个组件封装模型和模型内部数据的编码 机制来表达应用的语义,可与其它网络协议如h t t p 、s m t p 、f t p 等绑定使用, 或被其他协议重新封装使用; ( 4 ) 如果需要多个w e b 服务交互以实现复杂集成或商务交易,则需要一定 的机制来定义多个w e b 服务间的合作方式和工作流程,如w s f l 、b p e l 4 w s 等。 【l 】 在w e b 服务的技术架构中( 图3 1 ) ,u d d i 作用于服务发布层和服务发现层。 网络是w e b 服务的基础,x m l 是s o a p 消息协议的基础,s o a p 消息支持w e b 服务 结构中的发布、发现和绑定操作。我们可以利用基于x m l 的描述语言( w s d l ) ,对 这些服务系统的操作类型、输入输出数据流、数据类型与传输协议和数据格式 及安全控制机制等的捆绑方式、网络位置等进行规范描述,描述结果是一个规则 的x m l 文件,成为被描述服务系统的标准界面( 类似于c o r b a 的i d l ) 。服务发布 就是将描述服务的w s d l 文档发布到u d d i 登记上,服务的发现依赖于服务的发布 服务发现层的发现机制对应于服务发布层的发布机制。 图3 1 :w e b 服务的技术架构 w e b 服务主要建立在三个角色的交互上:服务的提供者、服务的登记者和服 务的请求者,交互的内容包括服务的发布、查找和绑定。在w e b 服务分布服务体 系( 图3 - - 2 ) 中,各个分布的信息系统或其具体功能、功能组都被视为服务系统, 王欣,张晓林应用o w l - s 实现w e b 服务的语义描述现代图书情报技术,2 0 0 5 ,( 2 ) :1 5 1 9 1 0 亘互习蔓 它们应能以规范的x m l 消息传递方式( s o a p 协议) 通过远程程序调用或数据单元 传递进行交互。这些服务系统可以作为服务请求者调用其它服务系统,也可作为 服务提供者被其它服务系统调用。信息系统可以通过多种形式将w e b 描述文件 进行发布( p u b l i s h ) ,例如直接以电子邮件、f t p 文件等方式传送给服务请求者, 置于本系统w e b 服务器根目录指定位置支持搜索引擎搜寻,或者在内部或公共 的分布服务登记系统( s e r v i c er e g i s t r i e s ) 进行登记。 图3 2 :w e b 服务的分布服务体系 由图3 - 1 和3 - 2 可知,w e b 服务为分布式环境下通过对服务的描述、发现, 实现在不同的平台上、以不同的语言开发的各种程序组件之问的通信、调用和 集成。 在w e b 服务技术架构中,处于服务说明层的w s d l 用于描述w e b 服务及其函 数、参数和返回值。它将w e b 服务描述为一组对消息进行操作的网络端点。它 用t y p e s ( 类型) 、m e s s a g e s ( 消息) 、p o r t 、y p e s ( 端口类型) 、b i n d i n g s ( 绑定) 、 p o r t s ( 端口) 和s e r v i c e s ( 服务) 等元素来定义w e b 服务。其中,t y p e s ( 类型) 粱娜张晓林u d d i 与w e b 月臣务发现情报杂志2 0 0 3 ,2 2 ( 3 ) :3 8 3 9 4 3 1 1 是消息的数据类型定义,通常用来描述交换消息;m e s s a g e s ( 消息) 代表待传输 数据的抽象定义;p o r t t y p e s ( 端口类型) 表示抽象操作的集合;b i n d i n g s ( 绑 定) 使操作和消息的具体协议与数据格式规范关联;p o r t s ( 端口) 指定一个用于 绑定的地址,由此定义一个通信端点;s e r v i c e s ( 服务) 则是相关端口的集合。 t y p e s 、m e s s a g e s 、p o r t t y p e s 以独立于平台和语言的方式定义输入输出s o a p 消息,它们不包含任何随机器或语言而变的元素,我们将它们一同称为w s d l 文档 的抽象定义部分,而b i n d i n g s 和s e r v i c e s 一同称为具体定义部分。一个w s d l 服务描述包括对一组操作和消息的一个抽象定义,一个绑定到这些操作和消息 上的具体协议,和绑定的一个网络端点规范。所以w s d l 具有很强的可扩展性, 它实现了对服务所提供的抽象功能的描述和对具体的“服务如何实现”、“在 哪儿实现”之类的问题的描述的分离。w s d l 规定了服务描述的绑定,包括s o a p 协议和简单的h t t p g e t 和p o s t 请求。w s d l 文档描述了如何调用服务,并提供一 些信息,包括交换的数据、操作的消息队列,绑定协议,还有用u r i 标识服务的 位置。 e b x m l 是联合国贸易促进和电子商务中心( u n c e f a c t ) 及结构化信息标准发 展组织( o a s i s ) 于1 9 9 9 年1 1 月成立的工作组。其目标是构建一个以开放的x m l 标准为基础的电子商务基础架构,为全球统一的电子交易市场提供全球透明的、 安全的、一致的电子数据交换环境,使得任意规模的企业可以通过交换基于x m l 的信息来进行商务活动。e b x m l 标准是由通用的x m l 语法和结构化文件组成的一 套技术规范,与其他电子商务标准的最大不同之处在于它不针对某一具体的行 业,而是面向世界上任何规模、任何行业的企业。【1 1 e b x m l 商务流程规范大纲( e b x m lb u s i n e s sp r o c e s ss p e c i f i c a t i o ns c h e m a ) 为定义商务流程提供了一个标准的框架。它与e b x m l 协作协议规范( e b x m l c o l l a b o r a t i o np r o t o c o lp r o f i l e ,c p p ) ,以及协作协议协定( c o l l a b o r a t i o n p r o t o c o la g r e e m e n t ,c p a ) 一起,为遵循e b x m l 标准的电子商务软件的商务流 程建模与配置之间搭起了一座桥梁。e b x m l 的e b x m lb u s i n e s sp r o c e s s s p e c i f i c a t i o ns c h e m a 提供了定义商务协作必需的语法、元素和属性。1 2 1 李颖e b x m l 全球电子商务标准e b 删l 技术架构概览世界标准化与质量管理,2 0 0 3 ,( 1 2 ) :3 3 3 5 【2 】e b x m lb u s i n e s sp r o c e s ss p e c i f i c a t i o ns c h e m av e r s i o n l0 1 h t t p :w we b x m l e b b p s sp d f , 2 0 0 54 3 0 1 2 s l p ( s e r v i c el o c a t i o np r o t o c 0 1 ) 是一种用于服务定位的i e t f ( t h e i n t e r n e te n g i n e e r i n gt a s kf o r c e ) 协议标准。i e t f 中的服务定位协议( s v r l o c ) 工作组于1 9 9 7 年公布了s l p 的第一版,即r f c 2 1 6 5 。1 9 9 9 年6 月,i e s g ( i n t e r n e t e n g i n e e r i n gs t e e r i n gg r o u p ) 公布了第二版,其相关文档是s l p v 2 ,即r f c 2 6 0 8 , 该文档更新并取代了s l p v l 。s l p 使得基于i p 网络的应用程序能自动对所需要 的服务进行定位( 包括网络地址、域名以及其它配置信息) ,用户为了获得某项服 务,只需要提供该服务的类型以及描述该服务的一组属性( a t t r i b u t i o n ) ,s l p 将用用户提供的信息自动找到该项服务。s l p 的结构和服务定位过程可参看图3 3 ( 以打印服务为例) ,它包括三种代理: ( 1 ) 用户代理( u s e ra g e n t :u a ) 。运行在用户计算机( 客户机) 上的软件, 通过服务定位找到它所要的服务的属性及其在网络中的位置,即完成服务发现 功能。 ( 2 ) 服务代理( s e r v i c ea g e n t :s a ) 。运行在服务器上的软件,发布服务定 位信息及其属性( a t t r i b u t e ) ,并向服务目录代理注册服务的属性信息。 ( 3 ) 目录代理( d i r e c t o r ya g e n t :d a ) 。运行在一种计算机( 可能既不是客 户机也不是服务器) 上的软件,它负责从s a 处收集服务信息,并对这些信息集中 存储;对用户代理的服务请求做出晌应。 事实上可以说u a 是服务的最终使用者,s a 是服务的提供者,d a 是服务的中 介。当s a 希望自己提供的服务供他人使用时,可以在d a 上注册,登记服务的属 性和位置。当u a 希望利用某种类型的服务时,有两种情况:一种是u a 不知道服 务的具体位置,或者是否有浚类服务,可以用某种属性的组合在d a 上进行查询, 如果有一个以上的匹配,根据应用场合的不同,可以只返回一个服务,也可以返 回多个服务:另一种是u a 知道具体服务的位置,可以直接用服务的u r l 或i p 地 址进行定位。 s l p 能描述服务主要是因为它有这两个重要的概念:服务通告( s e r v i c e a d v e r t i s e m e n t s ) 和服务模板( s e r v i c et e m p l a t e s ) 。服务通告包含了服务的定 位信息:i p 地址、端口号、服务类型以及路径。客户应用程序获得了这个服务通 告的u r l 就拥有了足够的信息,能够连接到该通告的服务上。服务模板( s e r v i c e t e m p l a t e s ) 用来描述服务,服务模板定义了与服务通告相关的属性,并指定了 属性、属性的默认值及其说明。s a 按照服务模板中的属性定义来描述服务,产生 服务通告。u a 则用相同的属性定义服务请求并发送请求,从而保证了用户系统 和服务系统之间的互操作性。 图3 3 :$ l p 中各实体间的关系及服务定位过程图 除了介绍的三种基于模块的描述方法外,s u n 的j x t a s e a r c h 、m i c r o s o f t 的u n i v e r s a lp l u ga n dp l a y ( u p n p ) 也都是应用较广的协议,都定义了用来描述 信息服务的模块。 3 1 3 基于对象的描述方法 基于对象的描述与基于模块的描述很相似,它除了将描述分成几个属性外, 引入“对象”的概念和方法,允许在一个服务描述中使用对象参照将对象联结 起来。基于对象的描述提高了描述的准确性,但仍需要对查找结果进行人为的 分析。所以,多数情况下计算机之间仍然不可能实现自动交互。 这种方法的典型代表是j i n i 和c o r b a 技术机制。 4 j i n i 是s u n 在j a v a 基础上开发的面向对象分布式计算技术。在j i n i 中, 硬件设备和应用程序都用服务来表示,而服务实际上就是j a v a 对象,用对象接 口表示其功能,用属性表示其特征。j i m 有三个主要的实体:服务、客户和查找 服务。查找服务存储服务的接口和属性值等服务描述信息,并负责将这些描述 信息同客户的服务请求进行匹配。为达到互操作,s u n 正在为服务接口的描述制 定通用标准。【1 1 c o r b a 是o m g 制定的一种分布对象计算的规范,o m g 制订的o m g ( o b j e c t m a n a g e m e n ta r c h i t e c t u r e :对象管理体系结构) 参考模型由5 个部分组成,分 别是对象请求代理o r b ( o b j e c tr e q u e s tb r o k e r ) 、c o r b a 服务( c o r b as e r v i c e ) 、 c o r b a 设施( c o r b aa c i l i t i e s ) 、c o r b a 应用对象( a p p l i c a t i o no b j e c t ) 和领域 接口( d o m a i ni n t e r f a c e s ) 。c o r b a 服务( c o r b as e r v i c e ) 的其中一种就是属性服 务( p r o p e r t ys e r v i c e ) 。在属性服务( p r o p e r t ys e r v i c e ) 中,属性是对象的成 份,反映对象的特征,它与对象动态地联系在一起,提供了动态建立和查询对 象成份的功能,以及对属性的批处理操作。o m g 在t r a d i n go b j e c ts e r v i c e s p e c i f i c a t i o n 【z 1 中详细说明了如何进行服务对象的交易( 图3 4 ) ,规定了 描述服务的方法,并定义了一套概念、数据类型。包括: 图3 4 :服务交易的过程示意图 ( 1 ) e x p o r t e r :e x p o r t e r ( 服务输出方) 向一个t r a d e r ( 服务交易) 通告 u 1 周跷,沈振宇,陈鸡服务发现机制的比较与分析计算机工程与科学,2 0 0 3 ,2 s ( 2 ) :5 6 6 0 c o r b a :t r a d i n go b j e c ts e r v i c es p e c i f i c a ti o nh t t p :w w wo m g o r g d o c s f o r m a i 0 0 0 6 2 7 n f , 2 0 0 54

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论