




已阅读5页,还剩58页未读, 继续免费阅读
(计算机软件与理论专业论文)基于web技术的数据交换平台的研究与设计.pdf.pdf 免费下载
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
西北工业大学硕士论文摘要 摘要 电子政务是公共行政管理改革和衡量国家竞争力水平的显著标志之一,我国 近些年也非常重视电子政务工程的建设。然而在电子政务建设方面面l 临下列问题 与挑战: 1 各个政府职能业务相对独立,大量的业务应用系统和数据信息分散在各个不 同的政府部门,部门之间缺乏信息共享和互通互联,领导决策缺乏准确、完整、 及时的信息作为支持。 2 电子政务建设中普遍存在着信息资源开发利用共享程度低等问题。 3 “信息孤岛”普遍存在,重复建设较为严重。 所以如何利用现有的网络技术构建一个数据交换平台消除“信息孤岛”,实现政 府部门之间的信息互联互通,提高政府效率成为一个急需解决的问题。 本文首先分析了电子政务建设过程中存在的问题和需求,构建数据交换平台 的意义和现有一些数据交换解决方案的局限性。然后简要介绍了构建数据交换平 台相关的一些基本理论及技术,接着给出了一个基于w e b 技术的数据交换平台的 模型。该模型以x m l 作为异构系统之间数据交换的标准格式,利用基于组件的适 配器对异构数据源封装,通过交换中心的路由服务实现信息的交换与共享。在第 五章给出了系统设计过程中数据映射、模式管理、路由服务、s o a p 消息安全性和 可靠性等关键问题的解决方案。 关键词:数据交换,模式,可扩展标记语言,简单对象访问协议 西北工业大学硕士论文a b s t r a c t a b s t r a c t e g o v e r n m e n ti so n eo ft h eo u t s t a n d i n g r e m a r k a b l es y m b o l sw h i c hm e a s u r eo u r c o u n t r y sp u b l i ca d m i n i s t r a t i o nr e f o r ma n dc o m p e t i t i v ep o w e r o u rn a t i o nh a sp a i d m u c ha t t e n t i o nt oi t sc o n s t r u c t i o ni nr e c e n ty e a r sh o w e v e r , w ea r ec o n f r o n t e dw i t ht h e f o l l o w i n gp r o b l e m sa n dc h a l l e n g e si nt h ec o n s t r u c t i o no f e g o v e r n m e n t ; 1 g o v e r n m e n t d e p a r t m e n t s a r e r e l a t i v e l yi n d e p e n d e n t a n d m a n y b u s i n e s s a p p l i c a t i o ns y s t e m sa n dd a t aa l ed i s t r i b u t e di nd i f f e r e n tg o v e r n m e n td e p a r t m e n t s t h e r e i sl i t t l es h a r eo fi n f o r m a t i o na n di n t e r c o n n e c t i o na m o n gd i f f e r e n td e p a r t m e n t sa n dl i t t l e s u p p o r to fa c c u r a t e ,i n t e g r a t ea n dt i m e l yi n f o r m a t i o nf o rt h ed e c i s i o n m a k i n go ft h e 1 e a d e r s 2 t h ep r o b l e m ss u c ha se x p l o i t a t i o n , u t i l i z a t i o na n ds h a r eo fi n f o r m a t i o ni nal o w d e g r e ew i d e l ye x i s ti nt h ec o n s t r u c t i o no f e g o v e r n m e n t 3 ”i n f o r m a t i o ni s l a n d ”w i d e l ye x i s t sa n dt h ep r o b l e mo fr e p e a t e d r e d u n d a n t c o n s t r u c t i o ni sv e r ys e v e r e t h e r e f o r e ,t h ep r o b l e mo f c o n s t r u c t i n ga ni n f o r m a t i o ne x c h a n g ep l a t f o r mt or e a l i z e t h ei n t e r c o n n e c t i o no fi n f o r m a t i o na m o n gg o v e r n m e n td e p a r t m e n t sa n di m p r o v et h e w o r k i n ge f f i c i e n c yo ft h eg o v e r n m e n tb yu s i n gt h ee x i s t i n gn e t w o r kt e c h n o l o g yi sv e r y u r g e n tf o ru st os o l v e t h ef i r s tp a r to f t h i sp a p e ra n a l y z e st h em e a n i n go fd a t ai n t e r c h a n g ea n dl i m i t si n e x i s t i n gd a t ai n t e g r a t i o ns o l u t i o na n ds u mu pp r o b l e m st ob es o l v e di nan i c e rd a t a i n t e g r a t i o ns o l u t i o n t h en e x tp a r ti n t r o d u c e ss o m et h e o r i e sa n dt e c h n o l o g i e sa st h e f o u n d a t i o no fd a t ai n t e t h e nb ya n a l y s i s i n gt h ec u r r e n td a t ai n t e r c h a n g em o d e lt h e p a p e rp u tf o r w a r da nw e b b a s e dd a t ai n t e r c h a n g ep l a t f o r mm o d e l 。b yu s i n gx i v l la s s t a n d a r da n dc o m p o n e t b a s e da d a p t o rt h em o d e lc a ni m p l e m e n t sd a t ai n t e r c h a n g ea n d s h a r i n gb e t w e e ni s o m e r o u ss y s t e m si nt h ef i f t hc h a p t e rt h ep a p e ra l s og i v es o l u t i o n st o s e v e r a lk e yq u e s t i o no ft h es y s t e ms u c ha sd a t am a p p i n g ,s c h e m am a n a g e m e n t ,r o u t i n g s e r v i e ,t h er e l i a b i l i t ya n ds a f e t yo fs o a pm e s s a g e s k e y w o r d s :d a t ai n t e r c h a n g e ,s c h e m a ,x m l ,s o a p 西北工业大学硕士学位论文绪论 1 。1 选题背景和意义 第1 章绪论 目前,随着信息技术特别是网络技术的迅猛发展,许多政府部门内部都逐步 实现了业务、信息的计算机管理。但是,由于各个职能部门的具体业务和功能的 不同,它们在实现计算机管理的时候,只是根据自身需要建立了许多相互独立的 信息服务和管理系统,从而形成了许多不能互相访问的信息系统。虽然越来越多 的业务系统被开发和应用,人们可获取的信息越来越多,这些数据的价值也越来 越为人们所认识,但是这些资源不能被有效的利用数据以不同的格式分散存 放在不同的数据库、不同的业务系统中,很难把它们集中起来进行分析和展现: 查找和处理数据需花费大量的时间和人力,有效信息的整理和传递工作比以往任 何时候都要困难;系统多样、信息分散等问题也更为突显。这样就形成了众多的 “信息孤岛”【i 】。 正是在这种背景下,“电子政务”的概念应运而生了。电子政务建设是政府在 国民经济和社会信息化的背景下,以提高政府办公效率,改善决策和投资环境为 目标,将政府以及相关职能部门的各类业务工作电子化和网络化的过程。随着电 子政务建设的不断深入和发展,最初的“信息孤岛式”业务系统己不能完全满足 公众的需求,公众需要各级政府机关提供更灵活方便的综合信息服务。同时,政 府部门内部和各部门问也需要加大信息共享力度,减少信息的重复管理,提高工 作效率。 因此,各业务系统间的互联互通,信息共享,业务协同是电子政务深入发展 最迫切需要解决的问题。解决这些问题的关键在于如何在各系统间进行有效的数 据交换和共享。 自1 9 9 9 年起,全国一些主要城市已开始进行企业基础信息交换工作。这些交 换工作主要发生在工商局、地税局、质监局等单位之间,并已在税收征管系统、 企业信用信息系统应用中发挥了重要作用。 但是,这项工作目前却面临着四个主要问题; ( 1 ) 没有统一的交换制度和机制; ( 2 ) 没有统一的数据交换标准( 交换标准包括业务数据标准与技术标准两个 西北工业大学硕士学位论文绪论 方面) ,数据交换后,难以对数据进行比对和整理; ( 3 ) 没有统一的交换系统。目前的交换方式比较繁杂,既有通过计算机网络 完成的交换,也有通过软盘或纸质文档进行的交换,因此数据的准确性和安全性 方面存在很多隐患。 ( 4 ) 缺乏统一管理,跨政府、跨企业的业务复杂、低效。目前的大多数系统 都是根据具体的业务进行设计,很难随着时间的推移优化工作流程,与系统外部 进行沟通,使得跨政府、跨企业的业务复杂、低效。 2 0 0 4 年8 月3 日,电子政务信息共享互联互通平台总体框架技术指南( 试 行) ( 国办秘函【2 0 0 4 】7 9 号) ( 以下简称框架指南) 由国办秘书局正式 下发,它强调指出:“当前电子政务信息共享互联互通的主要任务是:在网络建 设基本完成,应用系统和数据库初具规模的条件下,以信息共享互联互通平台建 设为基础,对不同数据库和应用系统进行集成与整合,形成基于共享的新的应用 体系,提高电子政务信息共享和业务协同的能力及水平。同时,充分利用已有的 信息资源,最大限度地保护政府信息化建设的原有投入,缩短信息化建设周期, 避免重复建设和资源浪费。”框架指南从技术层面详细阐明了支撑信息共享 互联互通平台的“三横两纵”的基础构架、核心内容、关键技术和基本功能等, 并从信息化建设应遵循的一般性原则出发,有针对性地阐明平台实施的基本方法、 关键步骤、运行环境和应用模式等。框架指南的下发更好地指导了全国政府 部门电子政务信息化建设,特别是钳+ 对“信息孤岛”问题的解决、资源共享和互 联互通项目的实施起到规范化的作用。 针对目前电子政务的发展现状与趋势,本论文分析了现有的电子政务系统在 数据交换和信息共享上存在的问题,参照框架指南,结合v 几和w e bs e r v i c e s 技术研究并设计了一个数据交换平台的构架,着重研究整个平台的模型设计和系 统设计中一些关键问题的解决方案。数据交换平台是电子政务建设的基础建设之 一,通过构建数据交换平台可以实现电子政务中业务系统之间的互联互通消除“信 息孤岛”,它为电子政务的上层开发提供了必要的技术支持,具有很强的研究价 值和现实意义。 1 2 国内外发展现状 目前,异构系统之间进行数据源数据交换与共享主要方式有两种,“种是采 用消息中间件,如m s m q 、i b mm q 等或者j a v a 消息服务( j a v am e s s a g es e r v i c e , j m s ) t ”1 来实现在异构系统之问传递数据封装后的消息- ,从而完成异构系统的交换 2 西北工业大学硕士学位论文 绪论 与共享;另一种是采用s o a p 消息机制和w e bs e r v i c e s 技术【6 1 ,利用w e bs e r v i c e s 技术的跨平台特性和s o a p 消息的简单通用、穿透力强的特性,使用s o a p 消息 封装数据,通过调用w e bs e r v i c e s 完成异构系统的数据交换与共享。 国内外有很多数据交换共享类的产品和解决方案,从产品的定位和主要功能 来看,大致可以分为这样几类: ( 1 ) 以企业应用集成为目标设计的产品,在m q 等消息中间件的基础上,使 用对象技术和工作流合成进行业务数据的交换和共享,各系统紧密耦合,如m m i n t e g r a t i o n 产品族。 ( 2 ) 按照传输的数据类型和流量等,定义不同的传输通道,绑定不同的传输 组件。这类产品如s y b a s e d x p ( s y b a s e 电子数据交换平台) ,它根据数据交换技 术对安全性、开放型、灵活性等技术特性的需求,将数据交换平台迸一步细分为: 大量实时数据传输和低带宽定时或批处理方式传输、异构和同构数据交换、企业 间数据交换,并根据不同类型数据交换平台的业务特色和技术特点,量身定制了 相应高效的数据交换解决方案。 ( 3 ) 结构化数据整合,提供统一数据视图。如c e n d p ( 中关智能数据平台) , 它采用元数据管理形成的“虚拟数据库”,为用户屏蔽了下层分散异构的各种数 据。虚拟数据库是物理数据经由元数据定义,映射而成的逻辑数据库。虚拟数据 库技术不需改变原来的数据结构,使得数据整合方案更简单经济:同时获得的是 实时数据,更利于决策支持,但是它的数据交换功能比较弱。 ( 4 ) 以企业和政务应用集成为背景,使用x m l 、w e b 服务消息等中间件技术。 如e s t a r c o n n e c t t t ( 易达讯数据交换平台) ,交换系统采用国际先进的基于j a v a 、 x m l 和w e bs e r v i c e s 技术的多层体系结构,利用统一的服务信息交换软总线、信 息交换流程管理和信息交换规则实现各委办局之间数据交换和业务流程协调。 ( 5 ) 建立在数据的提供者和使用者,对数据的交换的方法和策略形成一种共 识、一种约定或者说契约之上的数据交换和共享。这类方案类似网络上的协议, 是建立在双方形成的共同约定之上,并不一定要有集中式的传输控制。链接契约 式的数据交换与共享平台是一项通用的使用数据共享和协调的新服务,目标是使 数据从任意的数据源都可以被标识、交换、链接和同步到一个机器可读的恤。 文档格式,就像现在看到的,使用h t m l 文档格式的人可识别可读的w e b 可以 链接到任何内容源一样。由于控制所需的协调共享数据的存取和使用可以在每个 链接中正确建立,因此基于链接契约的数据交换的出现为可信数据交换的发展提 供了很大的潜力【1 ”。 这些产品和解决方案各有特色,它们都是面向不同领域、不同应用而开发的, 西北工业大学硕士学位论文绪沦 在实现上也使用了不同的技术。在整个数据交换平台的构架方面,可以从易达讯 的数据交换平台中得到很多启示;在数据整合方面,c e n d p 的元数据数据技术及 元数据的管理给我们提供了很好的参考;在数据交换传输方式上,可以吸取s y b a s e d x p 的有益经验;基于链按契约的数据交换为未来的可信数据交换提供了理想的 解决方案,这些成功案例对于本数据交换平台的设计开发和实现都具有很高的参 考价值。 1 3 课题内容 本课题的主要研究内容涵盖以下几个方面的内容: ( 1 ) 平台模型设计 结合儿和w e bs e r v i c e s 等技术提出了一个数据交换平台的模型。 ( 2 ) 异构数据封装 基于组件技术设计适配器,完成各种异构格式数据源到x m l 格式的双向转化。 ( 3 ) 模式集成 实现从局部模式到全局模式的转化,提供全局的x m l 模式视图。 ( 4 ) 交换中心路由服务的设计 提出了点到点、基于模式的发布订阅交换模型,给出了实现方案。 ( 5 ) s o a p 消息的可靠性与安全性 基于s o a p h e a d e r 的可扩展性,提出了s o a p 消息传输过程中的可靠性和安全 性问题的解决方案。 4 论文章节安排 本论文的共分六章: 第一章绪论介绍了论文的选题背景、研究现状及研究内容。 第二章数据交换平台相关技术介绍了异构数据集成的相关技术,包括x m l 、 模式语言、w e bs e r v i c e s 等,并分析这些技术的特点。 第三章:异构数据交换模式的体系结构结合电子政务工程的需求,确定了数 据交换的模式。 第四章数据交换平台构架列擞据交换平台的整体构架及其各个组成部分 的构成、功能逐一做了概括的介绍。 第五章结束语回顾本论文的研究工作,并给出了进一步的展望。 4 西北工业大学硕士学位论文 数据交换平台相关技术 第2 章数据交换平台相关技术 2 1x m l 技术介绍 x m l ( e x t e n s i b l em a r k u pl a n g u a g e ) 是w 3 c 定义的一个规范,它定义了用于 定义标记语言的语法。x m l 定义了使用标记来组织文档结构的语法,这些标记将文 档分成许多部件并对这些部件加以标识。它也是元标记语言,即定义了用于定义 其他与特定领域有关的、语义的、结构化的标记语言的句法语言。它可以被描述 为标准通用标记语言( s g m ls t a n d a r dg e n e r a l i z e dm a r k u pl a n g u a g e ) 的一个子集, 但是x m l 比s g m l 简单,因此撰写一个x m l 文档变的非常容易。 2 1 1 l 的概念及应用 l ( 可扩展标记语言) 是一种具有数据描述功能、高度结构性及可验证性的 置标语言。x m l 允许用户自定义标记和属性,并可依照所定义的标记与属性的语法 来开发应用程序;x m l 可以通过标记来描述数据,或配合属性来辅助描述数据,宜 作为对象或标准的描述语言;x m l 可以借助验证规则来规范一个x m l 文件的结构和 内容,适合与政府机构之间、政府与企业之间和政府与商业机构之间的数据交换 格式。 s g m l ( 标准通用标记语言) 是第一个标准化的信息结构化技术,1 9 8 6 年成为 i s o 标准。但s g m l 十分庞大,既不容易学,又不容易使用,在计算机上实现也十 分困难。鉴于这些因素,w e b 的发明者欧洲核子物理研究中心的研究人员根据 当时( 1 9 8 9 年) 计算机技术的能力,提出了h t m l 语言。h t m l 只使用s g m l 中很小一 部分标记,而且语法是固定的。正是由于h t m l 的这种简单性,使w e b 技术从计算 机界走向全社会,走向干家万户。但是,随着w e b 的应用越来越广泛和深入,人 们渐渐觉得h t m l 不够用了,h t m l 过于简单的语法严重地阻碍了用它来表现复杂的 形式。在这种形势下,w 3 c 于1 9 9 8 年2 月发布了x m l l 0 规范,它是8 g m l 简化的 子集,集成了s g m l 三个重要特性( 可扩展性、结构化、有效性) ,成为表示结构 化信息的一种标准文本格式。 由于具有可扩展性、结构化和平台无关性,x m l 非常适合网络环境下异构系统 西北工业大学硕士学位论文 数据交换平台相关技术 之间的数据交换,目前在异构数据交换和集成领域得到了广泛的应用,在异构系 统之间使用x l v l l 作为数据交换的标准具有下列优点: ( 1 ) x m l 具有自描述性:x m l 中的语义标识说明了元素的含义,这样在异构数 据源集成中,x m l 数据模型能很方便地描述各种数据源的数据,包括半结构化数据, 而且也允许了各种异构数据并存。对于查询操作来说,由标识就可知内容的含义, 这也使得查询结果更有意义。 ( 2 ) xm l 数据模型的内容具有独立性:x m l 可以脱离具体应用雨自行描述保存 在异构环境中的各种数据,其他系统应用能直接对这些自描述的x m l 数据进行操 作,因此,它能够实现异构数据源集成中数据的互操作性。 ( 3 ) xm l 能描述不同复杂度的数据:x m l 提供了数据的结构化表示,并且易于 操作。不管数据源是简单的普通文档、数据库查询记录或是复杂的对象和图形, x m l 都能轻松描述之。这样,x m l 用一种统的数据模型来描述不同数据源的数据, 可以屏蔽数据源中应用环境和数据结构的异构性。 ( 4 ) x m l 具有可扩展性:x m l 可以在不破坏现有结构和系统的情况下增加新的 元素。这样,如果某个异构数据源的数据模型有了更新和变化,数据集成系统可 以立即对全局视图中的相关部分进行修改,而且此修改操作也很容易,只需改变 数据模型定义,女n d t i ) ( 或x m ls c h e m a ) 等,不需要对具体数据进行一一操作。 总之,x m l 的出现,能够使不同数据源的异构数据很容易地结合在一起,而 且也使搜索多样的不兼容的数据资源能够成为可能,为解决异构数据源之间的数 据交换提供了新的处理方案。鉴于) 【m l 在数据交换领域的诸多优点,本文采用x m l 作为交换数据的公共模型,实现了各异构系统之间的数据交换与共享。 2 。1 2x m ls o h e m a ( 1 ) x m ls c h e m a 概念 x m ls c h e m a 是煳l 的模式定义语言,用以定义x m l 文件的结构。x m ls c h e m a 的前身是d t d ( 文档类型定义) ,使用正式的语法来定义文档的结构。通过创建d t d , 能够正式而精确地定义词拒表,所有词汇表规则都包含在d t d 中。可以使用d t d 对x m l 的文档的合法性进行验证。但是d t d 使用与x m l 不同的语法,需要对d t d 作特别的处理和解析。同时d t b 是一种封闭的结构,很难进行扩展i 另外,d t d 在 数据类型信息方面也存在缺憾,不能将某些值表示为简单类型进行恰当的操作。 x m ls c h e m a 也是x m l 的一种应用,是将d t d 重耨用x m l 语言规范来定义,它 涵盖了d t d 的所有功能,同时与d t d 相比x m ls c h e m a 有下述优点: 西北工业大学硕士学位论文数据交换平台相关技术 1 ) 一致性:s c h e m a 建立在x m l 的基础上,其格式和x m l 相同,使x m l 达到了 从内到外的统一;另一方面,s c h e m a 本身也是一种x m l ,可以被现有的x m l 编辑 器、解析器和应用系统所利用。 2 ) 扩展性:s c h e m a 对d t d 进行了扩充,引入了数据类型,同时也支持对数据 类型的扩展机制使得用户可以定义自己的数据类型,能更好地满足应用的需要。 3 ) 易用性:易于解析处理,许多解析器只是对x m l 文档实例有效,对d t d 则 无能为力。 4 ) 互换性:用户可以根据需要设计s c h e m a ,可以同其他的用户交换s c h e m a : 利用s c h e m a ,能够书写x m l 文档,验证文档的合法性;同时通过映射机制可以将 不同的s c h e m a 进行转换,以实现更高层次的数据交换。 5 ) 原型可以更新:d t d 定义的内容模式是封闭的,而x m ls c h e m a 定义的内 容模式是开放的,可以随时更新。 6 ) 支持命名空间:x m ls c h e m a 提供对名字空间的支持,可以在不同的命名空 间中使用相同的元素表达不同的含义,解决了x m l 元素命名冲突问题。 ( 2 ) x m l 语法介绍 s c h e m a 文档与其它的x m l 文档结构非常相似,根元素为 ,表明文档 类型: e l e m e n t f o r m d e f a u l t 的值q u a l i f i e d 表示来自目标命名空间的元素必须用命 名空间前缀限定。如果值是u n q u a l i f i e d 表示不需要用命名空间前缀限定。x m l n s 指定所属名称空间。第一个x m l n s 指定全文的缺省名称空间,这个是必须的,第 二个x m l n s 为目标名称空间声明前缀p o 。t a r g e t n a m e s p a c e 指定了一个目标名称 空间。 在x m l 中引用s c h e m a 的方法是在x m l 文档的根元素中使用名称空间指明 s c h e m a 文件的u r l 地址,注意在u r l 前加上“x s c h e m a ”前缀: 7 西北工业大学硕士学位论文数据交换平台相关技术 元素用来声明x m l 文档中使用的新元素。 元素是对 声明的元素的内容进行定义,说明在指定 的元素类型中允许使用哪些子元素。 元素中t y p e 属性是必须有的,同 时也必须与 中的n a m e 属性完全一致。 元素是出现在 中,表达元素成组的概念。组里的对象 可以是元素也可以是另一个子组。 元素定义了s c h e m a 中使用的属性类型。根据出现位置不同, 其作用范围也不一样。如果是在 元素中定义,那么所定义的属性类 型就只能作用在该元素类型上;相反如果定义在外部,那么文档中所有的元素类 型就都可以使用该属性。 元素是对 声明的属性进行具体的定义。它的 t y p e 属性唯一指定了引用的属性类型,取值必须与 中的n a m e 属 性完全一致。 和 分别定义了s c h e m a 元素的数据类型和为元素提 供说明资料。 由于x m ls c h e m a 在描述和定义x m l 结构方面的突出优点,在本设计中模式管 理和模式定义都采用基于x m ls c h e m a 的标准。 2 1 3x s l t x s l t ( 可扩展样式语言转换) 是一种用来转换x m l 文档结构的语言,它的主要 功能就是转换,将一个x m l 文档转化为其他的可格式化对象。使用x s l t 可以将x m l 文档转化为另一个逻辑结构的x m l 文档、h t m l 文档、x h t m l 文档等。 使用x s i 。t 进行数据格式转换的重要思想是把x m l 文档视为一种树结构,转换 的过程就是从源树生成结果树的过程。在x s l t 文档中定义了源树和结果树中对应 部分的转换规则,每条规则中包含了一个模板,并对应着一种模式。模板定义了 转换的结果,而模式则规定了需要进行转换的元素或属性对象。 使用x s l t 对x m i 。文档转化,需要定义一个x s l t 文件,在文件中定义与待转 换x m l 文档中各个逻辑成分相匹配的模版及匹配转换方式。支持x s l t 的处理器会 解析源x m l 文档,根据预先定义的x s l t 中的转化规则对源文档解析后生成的原始 树进行排序、复制、过滤、删除、选择、运算等操作后产生另外一个结果树。图2 一l 说明了x s l t 的工作原理: 西北工业大学硕士学位论文 数据交换平台相关技术 x s l t 文档的标准格式如下 图2 1x s l t 的工作原理 x s l 文档本身是格式良好的x m l 文档,所以在书写时要注意标签的匹配问 题。 既是x s l 的声明语句,也是根元素,必须位于文件的首部。 通常也要利用x m l n s 属性指明x s l 的名称空间。样式表中所有的模板规则都由标 签 标明。模板规则可以说明处理的对象( 元素属性) 、处理的方 式或是转换的结果。此时,我们可以把该标签类似地理解为编程语言中函数的概 念。 2 1 4x m l 解析技术 ( 1 ) d o m 西北工业大学硕士学位论文 数据交换平台相关技术 d o m 是煳l 文档的编程接口规范,利用d ( ) m 规范,可以实现在d o m 文档和x m l 之间的相互转化、遍历和操作相应的d o m 文档的内容。 d o m 模型使用结点树的形式表述l 的结构,通过对x m i 文件的解析,x m l 文 档中的元素便转化为d o m 文档中的对象结点。d o m 文档结点有d o c u m e n t 、e l e m e n t 、 c o m m e n t 、t y p e 等。利用d o m 接口将x m l 转化成d o 树后就可以通过对d o m 树的操 作实现对x m l 文件的处理。 d o m 的优点: 1 ) 可以对文档随机存取: d o m 的对象树装载到内存里,又提供了对象的操作方法,程序可以按照需要 访问d o m 树的任何一个对象。 2 ) 编程实现容易 d o m 对象树的设计符合面向对象思想,访问树非常简单。开发人员只需要调用建树 的指令,然后利用n a v i g a t i o na p i s 访问所需的树节点来完成任务。可以很容易 的添加和修改树中的元素。 d o m 的缺点: 1 ) 对性能和内存的要求比较高。由于使用d o m 解析器的时候需要装载整个 x m l 文档,尤其是遇到很大的x m l 文档的时候,要占用较大的内存。 2 ) 创建一棵d o m 树可能是一个缓慢的过程。对于不处理整个文档的应用最 好不要用这种方法。 ( 2 ) s a x s a x 的全称是s i m p l ea p i s f o rx m l ,即x m l 简单应用程序接口。与d o m 相比,s a x 是一种轻量级的方法。在处理d o m 的时候需要读入整个的x m l 文档,然后再内存 中创建d o m 树,当文档较大时,处理d o m 就会变得相当费时。在某些场合使用d o m 很不合适,一个较好的解决方案就是s a x 。 s a x 在概念上与d o m 完全不同,是基于事件驱动的,在利用s a x 处理x m l 文档 的时候并不需要读入整个文档,而读入文档的过程就是s a x 解析的过程。在s a x 处理文档的过程中,s a x 解析器感知事件,回调应用程序实现的函数,实现对文档 的处理。 s a x 的优点: 1 ) 可以解析任意大小的文件。因为sax 不需要把整个文件加载到内存,所 以对内存的占用一般比d o m 小得多,而且不会随着文件大小的增加而增加。 2 ) 适合读取特定的数据。 西北工业大学硕士学位论文 数据交换平台相关技术 3 ) 简单、快速。s a x 非常易于使用,如果可以从经由文档的简单序列中获取 你需要的信息,s a x 几乎一定是最快的方法。 s a x 的缺点: 1 ) 不能对文档做随机存取。因为文档并不加载到内存,所以必须按照数据提 交的次序进行处理。对于文档中包含许多内部交叉引用如使用l d 和i d r e f 属性的 情况,s a x 使用起来会困难一些。 2 ) 难以实现复杂的查询。复杂的查询对程序而言必须自己维护含有你所需要 保留信息的数据结构,如当前元素祖先的属性。在s a x 中做到这点是非常困难 的。 2 2 数字签名技术 数字签名技术是公开密钥加密技术( 如r s a 算法) 与报文分解函数( 如m d 5 ) 相结合的产物。与加密不同,数字签名的目的是为了保证信息的完整性和真实性。 与传统手签字和印章一样,数字签名保证以下两点: ( 1 ) 文件内容在传输过程中没有被改动。 ( 2 ) 文件出自签字人之手。 2 2 1 公开密钥加密加密算法 公开密钥加密技术是建立在密钥对的基础之上的,它使用两把相关联的钥匙 对:一把公开密钥用于发件人加密报文,另一把私有密钥由收件人保存,用来解 开经第一把钥匙加密的通信信息。可以有两种不同的方式使用密钥:第一种方式, 发送者使用接受者的公开密钥来加密信息,这时只有接受者使用自己的私有密钥 才能解开信息,这样可以保证信息传递的机密性;第二种方式,发送者使用自己 的私有密钥对信息进行加密,接受者可以用发送者的公开密钥进行解密,因为私 有密钥只有发送者才会有,任何使用发送者的公开密钥对信息解密的人,都可以 确定信息是从哪位发送者而来,这样可以确定发信人身份的真实性。 r s a 算法属于公开密钥加密算法,是由m i t 在1 9 7 6 年提出的。该算法利用了 数论领域的一个事实,即“虽然把两个大素数相乘生成一个合数是件很容易的事 情,但是要把一个合数分解为两个素数却十分困难”。合数分解目前仍是数学领域 未解决的一大难题,没有任何有效的方法。该算法无须收发双方同时参与加密过 程,因此非常适合于电子邮件系统。 西北工业大学硕士学位论文 数据交换平台相关技术 2 2 2 数字签名原理 报文分解函数( m d f ) 是适应数字签名技术的需要而产生的一种信息摘要技 术,也称杂凑算法。m d f 是一个单向哈希函数,能从任意长度的输入信息中通过 提炼、概括,最后产生一个1 2 8 位的哈希值,而且这几乎是唯一的。m d 5 是其中 很有代表性的一种算法。 数字签名首先用报文分解函数,把要签署的文件内容提炼为一个很长的数字, 称为报文分解函数值。签字人用公开密钥加密系统中的私有密钥加密这个报文分 解函数值,生成所谓的“数字签名”。收件人在收到数字签名的文件后,对此数字 签名进行鉴定。用签字人的公开密钥来解开“数字签名”,获得报文分解函数值: 然后重新计算文件的报文分解函数值,比较其结果。如果完全相符,则文件内容 的完整性、正确性和签字的真实性都得到了保障。因为如果文件被改动,或者有 人在没有私有密钥的情况下冒充签字,都将使数字签名中的鉴定过程失败。 2 2 3x m l 签名 在x n l 签名出现以前,最常用的数字签名技术是p k c s # 7 签名。公钥加密标准 ( p u b l 、i ck e yc r y p t o g r a p h ys t a n d a r d s ,简称p k c s ) 是由r s ad a t as e c u r i t y 和 其他信息安全行业组织自发创建的标准。 在x m l 签名出现之前,使用p k c s # 7 签名来数字签名一个x m l 文档( 只是将它 看作是任何一个数字文档) 是有可能的。但是,不可能用标准的x m l 格式表示签 名。同样,不可能只签名x m l 文档的一部分。而不签名该文档的其他部分。 从加密角度看,数字签名是相同的。按照安全的高层原则,p k c s # 7 和g t l 签 名的效果是等同的。独立使用他们都可以提供数据的完整性,并且当把签名者的 身份和签名链接时( 通过x 。5 0 9 证书) ,他们还提供了不可否认性j 在正确的环境 里,数字签名还可以用于身份验证。但是相对于p k c s # 7 ,x s i l 签名的各种组件更 加明显,可读性更好。 2 3w e bs e r v j c e 技术 2 3 1w e bs e r v i c e s 的概念 w e bs e r v i c e 是一种部署在网络上的对象,它可以在网络上通过消息传递机制 】2 西北工业大学硕士学位论文数据交换平台相关技术 动态地被发现、组织和重用。w e bs e r v i c e 对外封装成由w s d l 描述的服务,屏 蔽了业务逻辑的复杂性、实现技术的多样性和开发平台的异构性。只要得到w e b s e r v i c e s 的w s d l 文件就可以对它进行调用而不用考虑其运行的平台和实现技术, 使得应用系统之间可以以松耦台的方式进行交互。即使w e bs e r v i c e s 实现发生了 变化,只要它对外部的接口保持不变,则这种变化对客户端而言都是透明的。由 于采用了面向服务的概念,具有以下优点: ( 1 ) 完好的封装性:w e b 服务既然是一种部署在w e b 上的对象,自然具备对 象的良好封装性,对于使用者而言,他能且仅能看到该对象提供的功能列表。 ( 2 ) 松散耦合:这一特征也是源于对象组件技术,当一个w e b 服务的实现发 生变更的时候,调用者是不会感到这一点的,对于调用者来说,只要w e b 服务的 调用界面不变,w e b 服务的实现任何变更对他们来说都是透明的,甚至是当w e b 服务的实现平台从j 2 e e 迁移到了n e t 或者是相反的迁移流程,用户部可以对此 一无所知。对于松散耦合而言,尤其是在i n t e r n e t 环境下的w e b 服务而言,需要有 一种适合i n t e r n e t 环境的消息交换协议。而s 0 a p 正是目前最为适合的消息 交换协议。 ( 3 ) 使用协约的规范性:这一特征从对象而来,但相比一般对象其界面规范 更加规范化和易于机器理解。首先,作为w e b 服务,对象界面所提供的功能应当 使用标准的描述语言来描述( 比如w s d l ) ;其次,由标准描述语言描述的服务界面 应当是能够被发现的,因此这一描述文档需要被存储在私有的或公共的注册库里 面。同时,使用标准描述语言描述的使用协约将不仅仅是服务界面,它将被延伸 到w e b 服务的聚合、跨w e b 服务的事务、工作流等,而这些又都需要服务质量( q o s ) 的保障。其次,我们知道安全机制对于松散耦合的对象环境的重要性,因此我们 需要对诸如授权认证、数据完整性( 比如签名机制) 、消息源认证以及事务的不可否 认性等运用规范的方法来描述、传输和交换。最后,在所有层次的处理都应当是 可管理的,因此需要对管理协约运用同样的机制。 ( 4 ) 使用标准协议规范:作为w e b 服务,其所有公共的协约完全需要使用开 放的标准协议进行描述、传输和交换。这些标准防议具有完全免的规范,以便由 任意方进行实现。一般而言,绝大多数规范将最终有w 3 c 或o a s i s 作为最终版 本的发布方和维护方。 ( 5 ) 高度可集成能力:由于w e b 服务采取简单的、易理解的标准w e b 协议作 为组件界面描述和协同描述规范,完全屏蔽了不同软件平台的差异,无沦是 c o r b a 、d c o m 还是e j b 都可以通过这一种标准的协议进行互操作,实现了莅当 前环境下最高的可集成性。 西北工业大学硕士学位论文数据交换平台相关技术 w e bs e r v i c e s 消除了应用协议之间的差别,大大增强了在不同平台上用不同语 言开发的应用程序之间互操作能力,所以在本文所提出的交换平台模型中采用w e b s e r v i c e s 作为系统不同部分交换的方式。通过使用这种技术构建的交换系统具有很 好的可扩展性和可维护性,能够很好地满足实际应用的需要。 2 3 。2s o a p 技术 s o a p ( s i m p l eo b j e c ta c c e s sp r o t o c 0 1 ) 简单对象访阀协议是在分散或分布 式的环境中交换信息的简单协议,是一个基于x m l 的协议。它包括四个部分:s o a p 封装( e n v e l o p e ) ,封装定义了一个描述消息中的内容是什么,是谁发送的,谁应 当接受并处理它,以及如何处理它们的框架;s o a p 编码规则( e n c o d i n gr u l e s ) , 用于表示应用程序需要使用的数据类型的实例;s o a pr p c 表示( r p c r e p r e s e n t a t i o n ) ,表示远程过程调用和应答的协定:s o a p 绑定( b i n d i n g ) ,使用 底层协议交换信息。 s o a p 消息结构是由一个信封构成的,它包含一个可选的s o a ph e a d e r 以及必 须的s o a pb o d y ,s o a pb o d y 本身包含了消息载荷( 所需发送的数据本身) 和或 者错误信息。s o a p 的体系结构非常灵活,它提供了一个可伸缩的机制:用户可以 自行定义一定数量的s o a ph e a d e r 条目来表达一些控制信息,以满足某些特定的 需要。典型的扩展例子可以是实现一些诸如用户认证、事务管理以及在线支付的 h e a d e r 条目。 s o a p 提供了调用w e b 服务基本的功能,可以作为w e bs e r v i c e s 的消息协议。 它使用蹦l 来表达客户端和w e bs e r v i c e s 之间的消息,客户端可以构造s o a p 请 求消息并嵌入在h t t p 请求中,发送到w e b 服务器。w e b 服务器再把请求转发给运 行在w e b 服务器上的请求处理器就可以实现对w e b 服务的调用并返回处理结果。 西北工业大学硕士学位论文 数据交换模式体系结构 第3 章数据交换模式体系结构 目前异构数据源之间数据交换的体系结构有两种:集中式交换和分布式交换。 这两种交换方式的主要区别在于参与交换的交换节点的共享数据是否在交换中心 集中存储,在比较这两种方法前先介绍这两种方法。 3 1 集中式交换 集中式交换需要设置一个交换中心,该交换中心的共享数据库存放各个交换 节点提供的共享数据
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年贵州省存量房买卖合同
- 2025标准办公楼租赁合同范本模板
- 2025商场物业管理合同示范文本
- 2025标准工业厂房租赁合同模板
- 2025茶叶店装修设计合同协议书范本
- 2025营养品代理合同书
- (三模)2025年5月潍坊市高三高考模拟考试语文试卷(含答案)
- 静脉输液避光护理安全操作规范
- 护理基础护理知识
- 断指康复护理
- 2025-2030年中国煤电行业市场深度发展趋势与前景展望战略研究报告
- 2025年医院感染控制试题及答案
- 2025年黄山市祁门文化旅游发展集团有限公司招聘5人笔试参考题库附带答案详解
- 2025-2030中国植物蛋白行业市场发展趋势与前景展望战略研究报告
- 环境保护项目进度安排与保障措施
- 2025年内蒙古自治区赤峰市通辽市中考二模历史试题(含答案)
- 马工程西方经济学(精要本第三版)教案
- 公路工程标准施工招标文件(2018年版)
- (正式版)SH∕T 3548-2024 石油化工涂料防腐蚀工程施工及验收规范
- 波纹管压浆料计算公式表
- 《质量管理体系文件》成品检验报告(COA)
评论
0/150
提交评论