(计算机应用技术专业论文)面向信息交换系统的sxmep的设计与实现.pdf_第1页
(计算机应用技术专业论文)面向信息交换系统的sxmep的设计与实现.pdf_第2页
(计算机应用技术专业论文)面向信息交换系统的sxmep的设计与实现.pdf_第3页
(计算机应用技术专业论文)面向信息交换系统的sxmep的设计与实现.pdf_第4页
(计算机应用技术专业论文)面向信息交换系统的sxmep的设计与实现.pdf_第5页
已阅读5页,还剩57页未读 继续免费阅读

(计算机应用技术专业论文)面向信息交换系统的sxmep的设计与实现.pdf.pdf 免费下载

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

内容摘要 面向信息交换系统 的s x m e p 的设计与实现 学科专业:计算机l 应用技术 指导教师:程小平 研究方向:计算机网络 研究生:闫英战 内容摘要 目前,在不同行业的应用环境中,存在着形式各异的信息交换系统,但是这些系统 或多或少都存在某些不足。这些不足主要表现在数据的描述方法和方式的差异,没有规 范和统一的表示方法,难以满足系统间的方便交互、可扩展性、健壮性等诸多性能方面 的需求。本文研究的信息交换系统旨在为某大型信息网络的各类应用系统的信息交换提 供一个统一的、规范的、方便使用的信息交换环境,为应用系统提供信息共享和数据整合 手段。 x m l ( e x t e n s i b l em a r k u pl a n g u a g e ) 是一种与平台无关的描述性语言。它允许数据被 序列化成一个可以传递的形式,具有容易在任何平台上被解码的特点。它的出现和广泛 应用较好的解决了困扰已久的异构环境下的数据表示、数据交换方面的问题。s x m e p ( s i m p l e x m l m e s s a g ee x c h a n g ep r o t o c 0 1 ) 是基于x m l 的消息交换协议。是指在该信息 交换系统下各信息节点间的通信所采用的信息交换格式用x m l 文档来表示,用专用的 x m ls c h e m a 文档来规范。通过x m l 消息交换技术的运用增强了该信息交换系统的可 扩展性。 本文在信息交换系统架构的基础上,提出了s x m e p 协议,根据该协议设计了用于 交换的x m l 消息文档的s c h e m a ,并对系统中信息节点间通信的各类消息作了详细的设 计。消息的生成和解析是本文的关键,x m l 消息文档不能直接被系统中其它模块调用, 需要借助封装和解析工具。本文在消息的封装和解析的设计和实现方面做了大量的工 作,通过比较现有几种生成和解析x m l 文档的方式,提出了合理的解决方案,即对照 消息的x m l 架构设计出相应的消息包类来完成与应用程序的交互。 关键宇:信息交换系统;消息交换;s x m e p 协议;x m l 架构; 内容摘要 t h e d e s i g n a n dr e a l i z a t i o no fs x m e p p r o t o c o l a p p l i e d f o r i n f o r m a t i o n e x c h a n g es y s t e m s p e c i a l i z e ds u b j e c t :c o m p u t e ra p p l i e dt e c h n o l o g y d i r e c t i o n :c o m p u t e r n e t w o r k s u p e r v i s o r :c h e n g x j a o p i n g g r a d u a t e :y a h u n g z h a n a b s t r a c t h ar e c e n ty e a r s ,t h e r ea l eav a r i e t yo fd i f f e r e n tf o r m so fi n f o r m a t i o ne x c h a n g es y s t e m s b e i n ga p p l i e di na l ls o r t so fi n d u s t r i e s h o w e v e r , t h e s es y s t e m s ,m o r e o rl e s s ,h a v et h e i ro w n d i s a d v a n t a g e s t h e s ed i s a d v a n t a g e s o rs h o r t c o m i n g sa r em a i n l y r e p r e s e n t e d a st h e f o l l o w i n g s : t h ed i f f e r e n c e so na p p r o a c h e sa n dm o d e so fd a t a sd e s c r i p t i o n ;l a c k i n gs t a n d a r da n du n i f i e d m e t h o d so f e x p r e s s i o n ,w h i c hm a k e i td i f f i c u l tt om e e tt h en e e d so fc o n v e n i e n ti n t e r a c t i v i t i e s b e t w e e nd i f f e r e n ts y s t e m s ,e x t e n s i b i l i t ya n dah e a l t hd e v e l o p m e n ta n dt h eo t h e rp e r f o r m a n c e s t h ei n f o r m a t i o ns y s t e md i s c u s s e di nt h i st h e s i si sa i m e da tp r o v i d i n gau n i f i e d ,s t a n d a r da n d e a s y - t o - u s e di n f o r m a t i o n - e x c h a n g e e n v i r o n m e n tf o ri n f o r m a t i o n e x c h a n g e i nd i f f e r e n t a p p l i c a t i o ns y s t e m si nac e r t a i nb i gi n f o r m a t i o nn e t w o r k ,a sw e l li tp r o v i d e s d a t as h a r i n ga n d d a t ac l a s s i f i e dm e t h o d sf o r a p p l i c a t i o ns y s t e m s x m l ( e x t e n s i b l em a r k u pl a n g u a g e ) ad e s c r i p t i v el a n g u a g eh a v i n gn or e l a t i o n s h i p sw i t h p l a t f o r m i ta l l o w sd a t a t ob ea r r a y e di n t oat r a n s m i t t a b l ef o r m ,c o n t a i n i n gt h ec h a r a c t e r i s t i c s o f b e i n ge a s i l yd e c o d e di na n yp l a t f o r m i t sa d v e n ta n d c o m m o nu s ee n a b l eu st os o l v et h e l o n g - t r o u b l e dp r o b l e m sc o n c e r n i n g d a t a r e p r e s e n t a t i o n i nd i f f e r e n ts c h e m a sa n dd a t a e x c h a n g e t h ex m l - b a s e dm e s s a g ee x c h a n g ei n d i c a t e st h a t t h ec o m m u n i c a t i o nb e t w e e n n o d e sa n dt e r m i n a l sa l er e a l i z e dt h r o u 曲t h ef o r m a to fx m ld o c u m e n ta n du s i n gx m l d o c u m e n tt os t a n d a r d i z eu n d e rt h ei n f o r m a t i o ne x c h a n g es y s t e m w i t ht h ea p p l i c a t i o no f x m li n f o r m a t i o ne x c h a n g et e c h n o l o g y , w ee n h a n c et h ee x t e n s i b i l i t yo f i n f o r m a t i o ne x c h a n g e s y s t e m b a s e do nt h ed i s c u s s i o no nt h es c h e m ao fi n f o r m a t i o ne x c h a n g es y s t e m ,t h et h e s i sp u t s 2 内容摘要 f o r w a r ds x m e pp r o t o c o l ,n a m e l ys i m p l ex m l m e s s a g ee x c h a n g ep r o t o c o l ,a n di t a l s o d e s i g n st h es c h e m au s e di ne x c h a n g i n gx m lm e s s a g ed o c u m e n t s t h ef o u n d a t i o na n dt h e p a r s i n go f t h em e s s a g e sa r et h ek e yp o i n t si nt h i st h e s i s x m lm e s s a g ed o c u m e n tc o u l dn o t b ea p p l i e dd i r e c t l yb yt h eo t h e rm o d e si nt h eo p e r a t i n gs y s t e m ;i tn e e d sb o r r o w i n gt h et o o l so f p a c k a g i n ga n dp a r s i n g t h ep a p e r t a k e sal o te f f o r to nt h er e a l i z a t i o na n dd e s i g no f m e s s a g e p a c k a g i n g a n d p a r s i n g b yc o m p a r i n g t h ee x i s t i n gm e a n so ff o r m a t i o na n d a n a l y s i so nx m l d o c u m e n t ,i 啪t r y i n g t op r o p o s er e a s o n a b l es o l u t i o n ,n a m e l y , b yc o n t r a s tt h em e s s a g ex m l s c h e m a , ic o n s t r u c tar e l a t i v em e s s a g ep a c k a g e st oa c c o m p l i s ha n da p p l y i ti n t e r a e t i v i t yw i t h p r o g r a m s k e y w o r d s :i n f o r m a t i o ne x c h a n g es y s t e m ;m e s s a g ee x c h a n g e ;s x m e pp r o t o c o l ;x m l s c h e m a ; 3 第一章绪论 第一章绪论 1 1 研究背景 近年来随着信息技术和i n t e m e t 的迅速发展和应用的深入,带来了信息爆炸式的 增长,同时各类信息传播交换方式及作用也随之发生着变化。这些信息通常阻文本、图 形、图像、声音或视频的形式存放在各种数据服务器中。目前电子商务在技术上的一个 最棘手的问题就是如何在各种应用程序之间传输、处理数据,即实现产品目录、销售、 订单、财务管理等所有商业过程的数据交换。在电子政务方面,也存在着类似的问题, 即不同部门业务系统之间的信息交换共享问题。因此,许多软件研究机构和公司很早就 开始设想建立一个信息交换系统来及时的收集、发布并管理这些信息,实现系统间的信 息交换,从而提高整个行业的工作效率,增强自身的竞争力。目前,市场上已经存在着 多种多样的信息交换系统。 本文所述的信息交换系统是构建在基于p 2 p 的分布式信息集成系统上,主要研究如 何解决分布信息的有效采集和发布,信息的发现、验证、集成、加工和安全管理等问题。 该系统目前已经能有机集成市场上已有的大多数数据库以及业务信息处理系统,把分散 的应用系统连接在一个完整的体系中,并为用户提供一致、方便的信息处理手段。 x m l 是互联网联合组织( w 3 c ) 创建的一种标准的标记语言,现在已成为数据表 示的一个开放标准。x m l 语言定义了结构化描述信息的标准格式,使数据在不同平台、 不同系统之间可以使用不同的编程语言来实现操作。随着x m l 语言的出现,其相关的 一些技术规范也相继出现。目前x m l 已经开始广泛用于数据和信息的管理、数据的交 换、w e b 应用、电子商务等领域。 有的信息交换系统内的信息节点问的消息交换是通过一个固定格式的数据包来传 递,这种数据包不够灵活,几乎没有自我描述能力,没有开放性。为了使信息交换系统 更好的适应异构环境,需要统一系统内各信息节点间消息交换的格式和协作处理方式。 x m l 技术正好符合这些要求,因为它具有灵活的可扩展性,自描述性,开放性,数据 和形式分离等特点,并且x m l 是一个开放的基于文本的格式,在网上传输起来非常便 捷。 1 2 国内外研究现状 随着网络技术的不断发展,信息发布已经在各个领域内广泛运用。在信息发布方 面w e b 技术和p 2 p 技术的运用是两种典型的代表。目前的信息发布系统多是基于w e b 第一章鳍论 方式的数据库信息发布系统,而且已经存在许多的信息发布工具,例如w e b 网站、f t p 服务器、邮件系统、公文交换系统等等。另外还有大家熟知的基于p 2 p 技术应用的信息 共享工具,如国外公司开发的n a p s t e r , g n u t e l l a ,f r e e n e t ,国内的代表有深圳腾讯公司开 发的基于i n t e m e t 的即时通信软件q q 、r e a l l i n k 等等。 1 9 9 6 年,万维网联合组织( w 3 c ) 开始对h t m l 的后续语言进行研究,并于1 9 9 8 年2 月正式完成了可扩展标记语言( x m l ) 标准的制定。x m l 的出现解决了h t m l 语 言的一些固有缺陷。由于x m l 所拥有的可扩展性、自描述性、自相容性以及跨文种等 优点,使得它非常适于数据交换与信息发布,已经广泛应用到电子商务、远程医疗、远 程教育、数据库与搜索引擎等许多领域。目前x m l 语言的主要研究领域有:异构系统 之间的互连,信息检索,无线上网,w e b 自动化等等。有关各个行业基于x m l 规范的 研究非常热门,2 0 0 0 年1 2 月份由i b m ,a r i b a , m i c r o s o f t 等公司发起的u d d i ( u n i v e r s a l d e s c r i p ti o nd i s c o v e r y a n di n t e g r a t i o n ) 提出了跨平台电子商务开放框架,它支持 h t t p , x m l ,s o a p 等其它标准,其目的是为各公司参与网络市场提供一个注册标准。我 国在网络教育信息标准化中也运用了x m l 技术。相信随着x m l 技术的成熟,和它相 关的研究应用会越来越广泛。 1 - 3 本课题主要研究内容 基于x m l 的消息交换技术,就是利用x m l 文档来表示各信息节点间的消息交换, 各个信息节点通过x m l 消息交换来实现协作。本课题主要是围绕对x m l 消息的格式 定义和如何有效地对x m l 消息的生成与解析来进行的,其主要研究内容有以下四个方 面: 1 x m l 技术的研究 2 消息交换模型及实现方案 3 消息交换的x m ls c h e m a 设计 4 消息封装及解析模块的设计与实现 1 4 理论与实际意义 尽管我国大多数行业的信息化建设取得了长足的进步,许多大型企业从信息技术的 应用中受益非浅。但是在发展的同时,在信息化的过程中也不同程度的产生了许多信息 孤岛,降低了信息的利用率。阻碍了社会整体信息化的进展。信息交换系统的开发正是 为了解决信息孤岛问题,它将使信息传输的效率和可靠性得到大大的提高。 第一章绪论 在系统中采用种可扩展的,可跨平台的消息格式来实现传输是目前信息交换系统 中要解决的主要问题。基于x m l 的消息交换技术为实现信息交换提供了一个很好的解 决方法,是一项重要技术,对它的研究是十分重要的。 1 5 论文组织结构 本文共分五章,其中第一章为绪论,介绍课题的研究背景、现状、内容、意义等内 容。第二章是信息交换系统的介绍。主要介绍信息交换系统的系统架构及相关的x m l 、 p 2 p 技术。第三章介绍信息交换系统中消息交换的模型及其主要功能模块等内容。第四 章阐述x m l 消息交换技术在信息交换系统中的应用,包括消息交换x m l s c h e m a 设计。 第五章是消息封装与解析模块的设计与实现。第六章是全文的总结与展望。 第二章信息交换系统的介绍 第二章信息交换系统的介绍 本文所讨论的信息交换系统是基于p 2 p 技术、x m l 等技术建立的, 它方便、高效地解决异构数据库信息以及其它类型的信息在网络上发布、 查询、访问、加工等问题。本章将在信息交换系统所采用的有关p 2 p 技 术、x m l 技术的基础上,进一步对信息交换系统的系统结构做详细的介 绍和分析。 2 1 信息交换系统的技术背景 2 1 1p 2 p 技术 p 2 p ( p e e r t o p e e r ,中文简称为点对点) 是一种网络模型,又称对等网。 在该网络模型中,所有节点都是对等的( 称为对等点) ,对等点之间直接 互连,共享信息资源,无须依赖集中式服务器资源即可完成。p 2 p 技术 是目前国际计算机网络技术领域研究的一个热点,被财富杂志誉为 将改变互联网未来的四大新技术之一。 2 1 1 1p 2 p 概述 p 2 p 技术并非一种全新的技术,在2 0 世纪7 0 年代就已出现,其典 型代表是u s e n e t 和f i d o n e t 两个分散、分布的信息交换系统,真正的 p 2 p 技术的大规模应用起源于文件交换软件n a p s t e r 。虽然“客户,服务 器”模型是目前互联网上占统治地位的计算模型,但从某种意义来说, p 2 p 计算可以说是一种向传统互联网技术的回归,体现了互联网的本质, 因为互联网最初的设计目标就是让网络上的计算机互相之间可以直接通 信而不需要中介。 p 2 p 技术它打破了传统的c l i e n t s e r v e r 模式,在对等网络中,每个 节点的地位都是相同的,具备客户端和服务器双重特性,可以同时作为 服务使用者和服务提供者,每个节点直接从其他节点而不是从服务器的 参与中受益。 2 1 1 2p 2 p 结构模型 基于p 2 p 的模型与客户,服务器 了对服务器的依赖和它的分散控制。 ( c s ) 模型相比。其优势在于降低 一些p 2 p 模型甚至不需要服务器, 第二章信息变换系统的介绍 用户可以不经过服务器和其他用户进行连接。用户在p 2 p 模型下比传统 的c s 结构有更多的命令。p 2 p 系统和c s 系统不同,它没有单一的失 败点。在一些模型中,p 2 p 将服务器放到合适的位置,服务器的作用被 限制到最小。下面介绍两种常见的p 2 p 模型。 纯p 2 p 模型 纯p 2 p 模型是无核心服务器,每个节点维护本地的共享信息。所有 参与的计算机都是对等点,各对等点之间直接通信。查询只送往自己相 邻的节点。主要优点是:任何一个节点停机或离开不会对这个系统产生 影响。主要缺点是:网络中的消息会随时间的变化而迅速增多,使网络 负担增加,查询结果不完全。 图2 一l 纯p 2 p 模型 混合p 2 p 模型 混合p 2 p 模型则依赖于核心服务器专门来提供服务。主要优点是: 服务器上维护目录列表来管理节点共享的信息:查询方便、完整;信息 实体发送不经中间节点( 直接由节点到节点) 。主要缺点是:服务器如果 停机,该服务器所提供的服务将不能使用。 第二章信息交换系统的介绍 服务嚣 2 1 1 3 p 2 p 技术的应用 信息节点c 图2 2 混合p 2 p 模型 p 2 p 技术有着广阔的应用领域,目前主要的应用有文件交换、分布 式计算、协同工作、分布式接索和电子商务等。 1 文件交换 在传统的w e b 方式中,实现文件交换需要服务器的大力参与,用 户将文件上传到服务器,其他用户再到服务器下载使用。而在p 2 p 方式 中,用户不是从服务器搜索和下载资料,而是从其他节点直接获得。 2 对等计算 p 2 p 用于对等计算的优势在于,每个对等节点不再只是单纯地接受 计算任务,它还可以根据自身的情况( 比如分到的任务太多) ,再搜索其 它的节点,把分到的任务发下去,中间结果层层上传,最后到达任务分 发节点。对等节点之间还可以直接互换中间结果,协作计算。 3 搜索引擎 p 2 p 技术使用户能深度搜索文档,无需通过w e b 服务器,也不受文 档格式和宿主设备的限制,就可达到传统目录式搜索无可比拟的深度。 4 协同工作 p 2 p 技术的运用使互联网上任意两台计算机都可建立实时联系。这 6 第二章信息交换系统的介绍 样,多个用户之刚就可通过网络中的协同计算平台,共同完成某项任务 或共享信息资源等。 5 即时通信 所谓即时通信,是指诸如i c q 、o i c q 等称为“在线聊天”的软件。 p 2 p 的即时通信软件不仅可以随时知晓对方是否在线,而且双方交流完 全基于点对点通信,不依赖服务器的性能和网络带宽。 6 开发平台的研究 随着p 2 p 技术日益显示强大的应用潜力,p 2 p 应用开发平台的研究 得以发展。目前,s u n 公司致力于研究的“j x t a ”工程,目的是实现一 套底层的实用应用程序,用于构建跨平台、跨操作系统和跨编程语言的 各种p 2 p 应用。 2 1 2x m l 技术 2 1 2 1x m l 简介 x m l ( x t e n s i b l e m a r k u pl a n g u a g e ,即扩展标记语言) 的发展起源 于1 9 9 6 年。x m l 规范的第一份草稿于1 9 9 6 年1 1 月发布后不久,1 9 9 7 年1 月首个x m l 解析器就面世了。随后,便出现了x m l 的应用以及新 的规范和解析器。x m l 语言是s g m l 语言的子集,它保留了s g m l 主 要的使用功能,同时大大减小了s g m l 的复杂性。它不仅能表示文档的 内容,而且可以表示文档的结构,这样在能够被人类理解的同时,也能 够被机器所理解。 x m l 与h t m l 是有很大区别的。一是x m l 允许使用者为某种特殊 目的而定义自己的元素。二是x m l 要求遵循一定的严格标准,其分析 程序比h t m l 浏览器对语法和结构的要求更加严格。同时。x m l 标准 是对数据的处理应用,不只是针对w e b 页,它还可涉及到数据库电子商 务系统,以及任何显示系统的高级应用。开发者可根据特定的需求,利 用x m l 创建自定义的数据结构。 2 1 2 2x m l 的三个要素及特点 1 x m l 的三个要素 x m l 主要有三个要素:d t d ( d o c u m e n t t y p ed e c l a r a t i o n ,文档类型 声明) 或x m ls c h e m a ( x m l 架构) 、x s l ( e x t e n s i b l es t y l e s h e e tl a n g u a g e , 7 第二章信息交换系统的介绍 可扩展样式语言) 和x l i n k ( e x t e n s i b l el i n kl a n g u a g e ,可扩展链接语言) 。 d t d 和x m ls c h e m a 规定了x m l 文件的逻辑结构,定义了x m l 文件中 的元素、元素的属性以及元素与元素属性之问的关系;x s l 是用于规 定x m l 文档呈现样式的语言,它使得数据与其表现形式相互独立。x l i n k 表示x m l 链按语言,它进一步扩展了目前w e b 上已有的简单链接。 n a m e s p a c e ( 名称空间) 实现了统一的x m l 文档数据表示以及数据的相互 集成。 2 x m l 的特点 ( 1 ) 灵活的扩展性:x m l 提供了通用的机制,允许各种不同的专业 ( 如音乐、化学、数学等) 的用户灵活的自定义各种数据,开发与自己 的特定领域有关的标记语言。 ( 2 ) 形式与内容分离;x m l 只关心数据的内容,而其它表现形式则 交给程序或者x m l 样式语言来处理。 ( 3 ) 自描述性:x m l 具有结构化特点使得数据上下文间有结构和数 据有关联。不仅能够为人所阅读,更重要的是它提供的编程接e l 使程序 可以方便的对x m l 文档解析和处理; ( 4 1 平台无关( 开放) 性:x m l 提供了中立的纯粹数据定义方式, 它和具体的编程语言和操作平台无关,通过和网络传输协议的结合,非 常适合在i n t e r n e t 中传输和处理。而且每个编程环境或者平台上都有大 量的x m l 编码和解码软件包; ( 5 ) 数据交换的统一格式:x m l 是以文本形式来描述的种文件格 式。由于x m l 是以文本形式描述的,所以适合于各种平台环境的数据 交换。同样由于使用文本来描述内容,可以越过不同平台的障碍进行正 常的数据交换。 x m l 的以上特点决定了它是作为数据交换格式的最佳选择。 2 。l 。2 3x m ls e h e 抛a 现在,s c h e m a 取代d t d 已是大势所趋。它是x m l 的一种应用,它 将d t d 重新使用x m l 语言规范来定义。这从某种意义上讲,正充分体 现了我们前面所提到的x m l 自描述性的优点。x m ls c h e m a 有以下几项 优点: 毫 第二章信息交换系统的介绍 ( 1 ) 一致性:s c h e m a 建立在x m l 之上,它的样子和般的x m l 文 档完全相同,使得x m l 达到了从内到外的完美统一。s c h e m a 本身也是 一种x m l 。可以被现有的x m l 编辑制作工具所编辑、被x m l 语法分 析器所解析、被x m l 应用系统所利用。 ( 2 ) 扩展性:s c h e m a 对d t d 进行了扩充,引入了数据类型、命名空 间,从而使其具备较强的可扩展性。 ( 3 ) 规范性:s c h e m a 提供了一套完整的机制以约束x m l 文档中置标 的使用,同d t d 相比,更具有规范性。 ( 4 ) 易用性:因为它本身便是x m l 文档,因此具有简单明了的特点, 撰写模式要比d t d 简单得多。同d t d 一样,s c h e m a 利用元素的内容 和属性来定义x m l 文档的整体结构,如哪些元素可以出现在文档中、 元素间的关系是什么、每个元素有哪些内容和属性、以及元素出现的顺 序和次数等等,一目了然。 r 5 1 互换性:用户可根据需要设计适合自己应用的s c h e m a ,并且可以 同其他人交换彼此的s c h e m a 。另外,通过映射机制,还可阻将不同的 s c h e m a 进行转换,以实现更高层次的数据交换。例如微软的b i z t a l k s e r v e r ,对此就有很好的支持。 因此,考虑到x m ls c h e m a 的特点,在该项目实施过程中对于消息 交换中用到的x m l 文档消息一律采用相应的x m l s c h e m a 来规范。 2 1 2 4x m l 解析器的应用程序接口 x m l 不仅规定了如何表示和显示数据,还提供了标准的a p i 供处理 x m l 数据。应用程序不是直接对x m l 文档进行访问和操作的。首先应 用程序通过x m l 分析器对x m l 文档进行分析然后应用程序通过x m l 分析器所提供的d o m ( d o c u m e n to b j e c tm o d e l 。文档对象模型) 接口或 s a x ( s i m p l e a p if o rx m l ,x m l 简单a p i ) 接口对结果进行操作,从而 间接的实现对x m l 文档的访问与操作。使用d o m 接口与使用s a x 接 口解析x m l 文档各有其优点,第五章对d o m 和s a x 接口进行了比较, 根据系统内消息交换的需要,本文做出了合适的选择。 9 第二章信息交换系统的介绍 2 2 信息交换系统 2 2 1 信息交换系统简介 本课题研究的信息交换系统是针对异构数据库信息及其它分布式的 信息( 包括各类文档、短消息等) 之间的交换需求而开发的软件系统。 该系统内以改进的混合p 2 p 模型为基础,充分的利用p 2 p 技术、x m l 技术和数据库等技术的结合,实现了特有的信息交换模式,解决了互连 网内现有信息交换中固有的信息发布的瓶颈问题、信息浪费问题、不同 信息需要不同的信息系统进行处理的问题。实现了信息发布随心所欲, 可以方便地构建办公自动化系统的基础框架和信息交流的基本平台。所 处理的信息包括各种文档、电子邮件、短消息、数据库信息等。其系统 结构如图2 一l 所示。 图2 3 信息交换系统的系统结构 信息交换系统的组成包括了信息目录服务器、用户服务器、信息池 服务器和信息节点。系统中的服务器部分只负责简单的管理功能,服务 器部分和信息节点之间是传统的c s 结构。信息节点是系统中最主要和 最活跃的部分,它们之问构成了p 2 p 结构 从软件系统的结构上看,该信息交换系统的软件系统主要包括了信 1 0 第二章信息交换系统的舟嚣j 息发布端程亭、信息目录服务器程序、用户服务器程序、信息池服务器 程序四个部分。 1 信息发布端程序:是该信息交换系统的核心。为了实现信息交换, 信息发布端程序在交换系统的各信息节点处运行。它的主要功能是完成 信息定义的生成( 包括文件类型信息定义和数据库信息定义的生成) 、信 息加工、信息的发布( 注册到信息目录服务器) 、信息查询、信息访问、 信息数据的发送等功能。 信息定义是信息的元数据描述,说明了信息的类型、信息的内容概 要、信息访问的途径、还有信息访问所需的权限等等,这些信息以x m l 文档形式来表达。对于以文件形式存放的信息,它们的信息定义基本上 是文件的存放路径:对于数据库信息,信息定义的内容就是可访问数据 的描述。信息发布端程序通过友好的图形化入机界面,根据用户指定的 数据范围,例如数据库中的一张数据表或者数据视图,或者用户机器上 的一些数据文件等等,生成相应的信息定义;信息发布端程序也可以对 各种信息定义进行综合加工,产生综合性的新的信息定义。信息发布端 程序可以把各种信息定义传送到信息目录服务器保存。当用户需要获取 网上的信息的时候,通过信息发布端在信息目录服务器中查询用户所关 心的信息定义。最后。信息发布端程序可以根据信息定义的内容,与信 息发布的来源进行通信,获得信息的具体数据,显示给用户。 2 信息目录服务器程序:负责信息定义的存储,为信息节点提供信 息目录索引。主要功能是为信息节点提供信息检索服务以及管理用户发 布的信息定义和信息定义的查询,并对信息进行归档。 3 用户服务器程序:实现用户帐号的管理,并对信息进行安全访问 控制。例如用户的注册、登录、访问信息的权限检查等等。 4 信息池服务器程序:主要用来存储需要长期使用的信息和消费者 范围比较大的信息。 2 2 2 基于信息交换系统的信息交换 建立在信息交换系统上的信息发布和处理过程分以下几种:信息定 义的抽取、信息定义的发布、信息定义的获取、信息定义的综合加工以 及信息内容的获得。信息交换的流程如下图所示: 第二章信息交换系统的介绍 图2 4 信息交换系统内信息交换的流程 首先,信息发布端a 通过信息定义抽取,从自己能访问的数据库系 统中抽取信息的描述。通过这个信息的描述,说明了所访问数据的范围, 以及访问该数据的方法。例如,对于存储在关系数据库的数据,信息定 义的描述就包括了访问数据的s q l 语句,以及连接数据库的连接方法。 接着,信息发布端a 就把定义好的信息定义发布到信息目录服务器。在 这一个过程中,信息发布端仅仅是把信息定义交给信息目录服务器,而 具体的数据则还是保存在本地。 信息发布端除了可以发布信息以外,还可以查询和获取其他发布端 发布出来的信息。如图2 4 中的信息发布端b ,它可以通过访问信息目 录服务器,查找用户感兴趣的信息定义。当用户发现目录服务器上有自 己感兴趣的资料以后,于是就从服务器上读取相应的信息定义。在这个 过程中,信息目录服务器交给用户的还是信息定义,而不是具体数据信 息。而在查询和获取信息定义的同时,用户服务器会协同信息目录服务 器按用户权限对用户信息进行筛选,对于那些用户没有权限查询和访问 的信息都会被过滤。 因为信息定义的内容中包括了发布者的信息,以及访问数据的方法。 所以当用户需要浏览信息的具体内容的时候,用户就可以通过信息发布 端b ,根据所获得的信息定义内容的指导,与信息发布端a 通信并进行 信息交换,从信息发布端a 处获得具体的数据。 总之,在整个信息交换过程中数据源与信息访问者是分布式的,也 就是说,这是一种分布式的信息访问模式。在信息交换系统中,信息只 有在需要被访问具体内容的时候,才从数据源经过网络传输到访问者的 机器。而在发布端与服务器之间的信息交换,仅仅是交换信息定义的内 容,而不交换具体的信息内容。因此,在系统中,信息目录服务器是轻 1 2 蔓三兰堕星塞壅墨塾些坌望 量级的服务器c 与传统的c s 架构相比,信息目录服务器不再是系统数 据流的瓶颈。 2 2 3 基于信息交换系统的信息加工 信息交换系统内不但可以进行简单的信息交换,还允许用户对已发 布的信息进行进一步的加工。其中包括信息的进一步抽取和信息的综合。 来自不同发布端的信息定义,经过信息加工以后,就可以生成新的信息 定义。新的信息可以再次在信息交换系统内发布。例如下面的例子: 图2 5 信息交换系统内的信息加工 信息发布端a 和信息发布端b 分别发布了各自的信息定义。信息发 布端c 从信息目录服务器上获得这些信息定义。用户通过观察信息数据, 了解到这些信息所描述的含义,发现这些信息之闯的内在联系。用户发 现这些信息经过综合后可以获得更有价值的信息内容。于是用户根据这 些信息定义,建立新的信息定义,并把新的信息定义发布到信息目录服 务器。信息发布端d 的用户从信息目录服务器获得发布端c 所发布的新 的信息定义后。当用户需要阅读该信息定义下的具体数据的时候,信息 发布端d 分别从信息发布端a 和信息发布端b 获取它们所发布的具体 数据。然后再根据发布端c 发布的新信息定义的内容,对来自发布端a 和b 的数据进行综合处理。最后发布端d 的用户就可以获得新信息定义 下的新信息的内容。 第二章信息交换系统的介绍 2 2 4 信患交换系统的特点 信息交换系统具有以下的优点: 混合p 2 p 的工作模式,信息分散在各个发布源或者信息池服务器上, 发布端负责本地数据的发布,数据综合工作交由信息访问端完成。这种 模式分散了工作负荷。信息目录服务器只需要完成信息定义的管理工作, 并不存储信息内容,因而是轻量级的服务器。 在系统内的各信息节点间的信息交换和系统内各信息节点、服务器间通 信时消息的交换都充分应用了x m l 技术。方便系统内的信息交互,增 强了系统的可扩展性。 一般情况下,具体的数据信息只保存在发布端,服务器和其他客户 端都不保存数据,一方面减少了信息冗余,另一方面当发布端的数据出 现更新以后,发布端并不需要主动地逐一通知其它的所有用户。而其他 用户每次访问信息都是直接从发布端获得实时的数据内容。用户在浏览 数据信息的时候可以选择把当前获得的数据保存在另外的存储介质上, 保存后,这些信息数据与原来的信息数据没有任何联系了。 信息定义的数据量一般比信息内容的数据量少很多。通过信息定义 的发布和交流来传递信息,提高了交流的效率,减少了瓶颈现象。 用户可以对网上发布的数据库信息进行再加工,形成新的信息并发 布。也就是说实现了信息的再利用,提高了信息的利用价值。 信息查询方便高效。用户把要发布的信息定义注册到信息目录服务 器,信息定义集中管理,方便用户的查找。 实现了跨数据库平台的数据集成。各个发布端的数据库信息统一为 标准的信息定义描述。信息的综合变成了简单的语法分析过程。用户无 须关心数据库信息来自于哪个数据库平台。 在信息交换系统内可以实现信息定义的个性化定制,用户可以按需 要订阅信息定义,增加了获取信息的及时性。 本章小结 本章首先简单介绍了信息交换系统的技术背景及其软件系统的结 构,接着描述了信息交换系统内的信息发布及加工的工作流程和特点, 为后面介绍消息交换模型做好了铺垫。 第三章消息变换模型和s x m e p 协议 第三章消息交换模型和s x m e p 协议 消息交换模型是该信息交换系统中消息交换设计的主要理论模型。 可扩展的简单x m l 消息交换协议s x m e p ( s i m p l ex m lm e s s a g e e x c h a n g ep r o t o c 0 1 ) ,是信息交换系统内消息交换的基本协议基础。x m l 被用于信息交换系统内的消息交换,提供了一种通用的、统一的描述任 何结构化的数据的方式。信息交换系统中各组成部分问相互通信时都必 须基于s x m e p 协议,并且通过t c p i p 协议交换s x m e p 格式的消息包。 选择x m l 作为系统的通信媒介很大程度上是因为x m l 对于所有同时期 的程序设计语言来说都是容易阅读,并且x m l 具有良好的结构和可扩 展性。 3 1 基于x m l 消息交换的模型 3 1 1x m l 消息交换的模型 消息交换模型是信息交换系统中,各信息节点间,信息节点与服务 器间实现通信的基本模型描述。它的出发点是基于x m l 消息在系统中 各信息节点间,信息节点与服务器间的流动和交换过程。 信息交换系统内包括信息发布者、信息请求者、服务器等基本角色。 作为信息交换的主体,它们分布在交换系统中的各个信息节点上。各信 息节点间,信息节点与服务器问的通信是通过产生x m l 请求消息和接 收x m l 响应消息的形式进行。即在系统内实现交换有两个基本操作; 产生请求:为进一步交换建立通信过程,该过程通过消息模式给 出请求。 响应:返回一个适当的响应的过程,该过程通过消息模式返回相 应的结果给请求来完成。 为了更好的分析和描述该信息交换系统内的基于x m l 消息交换的 通信机制,我们在分析时对实际的交换模型做了如下的简化,假设信息 节点a 处是信息的发布者( 负责信息的加工与发布) ,信息节点b 为信 息的消费者( 即信息请求者,可以获取发布的信息定义) ,服务器包括用 户服务器和信息目录服务器。图3 1 表示的是信息交换系统内消息交换 的简化模型。 第三章消息交换模型和s x m e p 协议 图3 1 信息交换系统内的x m l 消息交换模型 信息节点a ( 信息发布者) 和信息节点b ( 信息请求者) 交换信息 ( 即信息节点b 获取信息节点a 处发布的信息) 的过程如下: 信息节点a 的信息发布者和信息节点b 的信息消费者分别向用户服 务器发送登录请求的x m l 消息,用户服务器接收请求。验证权限并返 回响应x m l 消息。 信息节点a 登录成功后,信息节点a 收集、加工本地或网络上的有 效信息并发送含信息定义的请求x m l 消息到信息目录服务器,目录服 务器对请求消息处理并返回响应x m l 消息,信息定义的注册完成。信 息节点b 与服务器间可以进行交换的请求响应x m l 消息类型有:信息 定义的查询,信息的订阅,取消订阅,信息定义的推送。其中取消订阅 和推送信息定义的消息交换的前提条件是该信息节点需要先订阅信息。 否则只有与目录服务器阆通过信息定义查询的请求,响应x m l 消息交换 后,才能获取需要的信息定义。 信息节点b 在从目录服务获取信息定义后,根据信息定义的i d 直 接向信息节点a 发送信息内容拉取的x m l 请求消息。信息节点a 对请 求做出处理,根据信息的类型通过不同的方式将信息的内容发送给消息 节点b ,并返回x m l 响应消息。 1 6 第三章消息交换模型和s x m e p 协议 3 1 2 系统内消息交换的描述 在信息交换系统内,为了满足信息节点、服务器等之间的通信要求, 主要有以下12 种消息交换的类型,即用户登录、信息定义注册、信息定 义查询、服务器问的同步等消息交换。各种消息交换的类型的描述如下: 1 用户登录 在信息交换系统中,为了提高系统的安全性,用户需要通过客户端 登录界面输入用户名和密码,按消息交换协议将用户的输入封装成x m l 消息送到用户服务器验证,并以x m

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论