(计算机应用技术专业论文)多应用数据共享交换原型系统的设计与实现.pdf_第1页
(计算机应用技术专业论文)多应用数据共享交换原型系统的设计与实现.pdf_第2页
(计算机应用技术专业论文)多应用数据共享交换原型系统的设计与实现.pdf_第3页
(计算机应用技术专业论文)多应用数据共享交换原型系统的设计与实现.pdf_第4页
(计算机应用技术专业论文)多应用数据共享交换原型系统的设计与实现.pdf_第5页
已阅读5页,还剩60页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

摘要 电子政务需要实现政府各部门问高效、可互操作的信息交换和信息共享。这 必然要求数据的格式交换和处理符合开放的标准、要求提供电子政务的信息交换 规范。本文主要是针对北京市民卡系统构建过程中出现的数据交换与共享问题, 为了实现数据共享与交换的目的,制定了基于x m l 的电子政务数据交换标推 c i x m l ,其目的是提供以c i x m l 为基础的数据交换标准,从而规范政府各业务部 门的应用开发、统一网络的数据交换格式、实现异构或同构的政府各业务系统之 间的数据交换。同时,为了解决此分布式系统( 原型系统) 的通信问题,本系统 采用面向消息的中间件作为数据的交换中心,也因此解决了本系统中的系统集成 问题。 本文首先介绍了国内外数据交换技术的发展,接着论述了x m l ( 可扩展标记 语言) 相关技术及其在数据交换中的作用,然后详述了数据交换标准c i x m l 规范 的设计定义。c i x m l 规范主要采用s c h e m a l 0 技术规范来实现,支持w 3 cx m l i 0 技术标准。最后论文设计了一个本系统的解决方案基于星型架构模式的解决 方案,并在论文末尾剖析了基于c i x m l 规范的实现案例。从网络架构角度看,这 是一个基于以消息中间件平台作为数据交换中心的星型架构模式,主要由各相关 的政府业务部门和一个数据共享交换中心组成。整个案例系统采用c i x m l 作为数 据交换标准,能够实现政府各业务部门间的数据交换与共享。 关键词x m l ;电子政务;数据交换 北京工业大学工学硕士学位论文 a b s t r a c t e - g o v e r n m e n tm u s tr e a l i z ei n f o r m a t i o ne x c h a n g ea n di n f o r m a t i o ns h a r e a m o n gt h ed i f f e r e n tg o v e r n m e n td e p a g t m e n t se f f i c i e n t l y ,w h i c hn e e d sd a t a f o r m a tc o n v e r s i o na n dd a t ap r o c e s s i n ga c c e r d i n gt ot h eo p e ns t a n d a r da n d c a l l sf o rp r o v i d i n g s p e c i f i c a t i o n s o fi n f o r m a t i o n e x c h a n g e f o r eg o v e r n m e n t 。i nt h et h e s i s ,ic o n s t i t u t ea nx m l - b a s e ds p e c i f i c a t i o no f d a t ae x c h a n g et os o l v et h ep r o b l e m ss u c ha sd a t ai n c o n v e r t i b i l i t y 、a b s e n c e o fi n f o r m a t i o ns h a r ei nt h ep r o j e c to fb e i j i n gc i v i1c a r d 。i no r d e rt o r e a l i z et h ei n f o r m a t i o n s h a r e ,t h ep r o j e c tp r o v i d e s a nx m l b a s e d s t a n d a r d so fd a t a e x c h a n g e ,w h i c h i su s e dt o s p e c i f ya p p l i c a t i o n d e v e l o p m e n to ft h eg o v e r n m e n td e p a r t m e n t s ,u n i f yd a t af o r m a tc o n v e r s i o n a n dr e a i z ed a t ae x c h a n g ea m o n gt h ed i f f e r e n tg o v e r n m e n td e p a r t m e n t s w h i c hh a v eh o m o g e n e o u so rh e t e r o g e n e o u sa r c h i t e c t u r e s a tt h es a m et i m e , 1 a d o p tm e s s a g e o r i e n t e dm i d d l e w a r e ,w h i c hc a ns o l v et h ec o m m u n i c a t i o n s o f 。d i s t r i b u t e ds y s t e m ,t oc o n s t r u c tt h ee x c h a n g ec e n t e r ,a n ds ot h es y s t e m j n t e g r a t i o ni s o v e r c o m eb yt h i sm i d d l e w a r e f i r s t l y ,t h e t h e s i si n t r o d u c e st h e d e v e l o p m e n t o f d a t a e x c h a n g e t e c h n o l o g y ;s e c o n d l yp r e s e n t s x m l ( e x t e n s i b l e m a r k u pl a n g u a g e ) a n d r e l a t i v et e c h n o l o g i e sa n dit sf u n c t i o n si nt h ef i e l do fd a t ae x c h a n g e : t h e nd i s c u s s e st h e d e s i g n a n dd e f i n i t i o no fd a t a e x c h a n g e s p e c i f i c a t i o n ( c i x m l ) w h i c hi sb a s e do nt h es c h e m a1 0s p e c i f i c a t i o nt h a t i sf o r m u l a t e da n dr e f e r e n c e d b yw 3 c 。l a s t l y ,t h et h e s i sp u t sf o r w a r d as o l u t i o nf o rt h i ss y s t e mt h a ti sb a s e do na s t r o i ds t r u c t u r e 。a tt h ee n d o fi t ,t h et h e s isa n a l y s e sac a s eb a s e do nm e s s a g e o r i e n t e dm i d d l e w a r e a st h ee x c h a n g ec e n t e r ,w h i c hi saa s t r o i ds t r u c t u r e r o mt h ev i e w p o i n t 0 fn e t w o r ka r c h i t e c t u r e t h i se a s em a i n l vc o n s i s t so ft e l a t i v e g o v e r n m e n td e p a r t m e n t sa n d ac e n t e ro fd a t a e x c h a n g e a n ds h a r e 。t h e e x c h a n g ei sb a s e do nc i x m li nt h i sc a s e ,w h i c hf u l f i l l st h ed a t ae x c h a n g e a n da t t a i n si n f o r m a t j o ns h a r es u c c e s s f u l l y 。 k e y w o r d sx m l :e - g o v e r n m e n t :d a t ae x c h a n g e 独创性声明 本人声明所呈交的论文是我个人在导师指导下进行的研究工作及取得 的研究成果。尽我所知,除了文中特别加以标注和致谢的地方外,论文中 不包含其他人已经发表或撰写过的研究成果,也不包含为获得北京工业大 学或其它教育机构的学位或证书而使用过的材料。与我一同工作的同志对 本研究所做的任何贡献均已在论文中作了明确的说明并表示了谢意。 虢骐魄盟垃 关于论文使用授权的说明 本人完全了解北京工业大学有关保留、使用学位论文的规定,即:学 校有权保留送交论文的复印件,允许论文被查阅和借阅:学校可以公布论 文的全部或部分内容,可以采用影印、缩印或其他复制手段保存论文。 ( 保密的论文在解密后应遵守此规定) 签名: 芬弭导师签名:鳞日期: 第1 章绪论 1 1 课题来源及背景 本课题来源于北京市民卡系统的建设。 + 北京市民卡系统是北京市实施政府信息化工程( 电子政务工程) 的一个重 要组成部分。北京市承担社会保障和市民服务职能的政府部门从各自主管业务 出发,普遍建立了信息化系统。主要业务工作均实现了数字化、信息化。这不 仅提高了职能管理部门工作效率,也方便了广大市民办理相关业务。但由于目 前市政府各职能部门业务呈现部门化、条块化分布,同时各业务信息系统采用 的指标体系代码标准、应用系统、数据库与操作系统各异,对信息互联互通、 实现数据的共享和交换造成很大困难,主要表现在: ( 1 ) 信息孤岛闯题“3 。政府各部门同构或异构平台之闻的数据没有较好地进 行统一管理和集中,不能有效地服务于广大企业和公众。 ( 2 ) 没有统的数据传输格式。各个应用系统在互相交换数据时,不同 的系统数据的表示格式千差万别,使得应用系统在分布式的网络环境中进 行数据交换十分困难。 本课题依托于北京市民卡工程,通过指定数据存储标准及数据交换标准, 建立市民卡数据共享中心的数据交换系统,实现医保、公安、住房管理等政府 各业务部门之间信息的互联互通,为其提供安全、可靠、高效的数据交换和数 据共享平台。这样,可以优化整个社会的信息资源,总体上提高政府部门的工 作效率,同时,基于以人为本的工作思路,通过发行以市民卡工程多应用系统 为支撑的市民卡,切实体现服务于民的宗旨,从繁体上促进社会的进步与发展。 1 2 国内外相关研究现状及其分析 电子政务工程近些年来是我国信息化建设的热点,也是世界各国政府信息 化建设的主流。信息技术的迅猛发展,特别是互联网技术的普及应用,使电子 政务的发展成为当代信息化最重要的领域之一。在世界各国积极提倡的“信息 高速公路”几个应用领域( 电子政务、电子商务、远程教育、远程医疗、电子 北京工业大学工学硕士学位论文 娱乐) 中,电子政务列为第一位”3 。从世界范围来看,推进政府部门办公自动 化、网络化、电子化已是大势所趋。 但是在电子政务的发展过程中,所有的国家都面临一个共同的问题如 何实现不同政府部门问甚至是同一政府部门内的数据交换与共享。于是对数据 交换技术的研究便成为国内外的热门领域。 在国外用于数据交换的最早的技术是传统的电子数据交换( e d i ) ,也称无纸 贸易0 1 。它是一种在异构的、分布式的应用或平台问进行电子格式数据交换的技 术。这一概念在2 0 世纪6 0 年代提出,8 0 年代其标准得以完善。传统的电子数 据交换技术按某一标准、协议将数据进行趣范化和格式化,通过电子数据网络, 在不同组织的计算机系统之间进行数据交换和处理。由于e d i 将企业间的商业往 来文件,以标准化、规范化的文件格式,采用电子化的方式,通过网络在计算机 应用系统间,直接的进行信息业务的交换与处理。整个过程无需大量的人力介入, 无需纸张文件。相对于传统的手工方式,具有极大的有势。e d i 也因此具有广泛 的应用领域,从商业、零售业到制造如工业再到政府部门和公共事业等。应当说, 电子数据交换技术的大范围使用是可以降低数据处理费用和数据重复录入费用, 从而提高经济效益的。但实际上,普及程度却与期望值相去甚远,究其原因主要 是由于构建e d i 需要同其商业伙伴达成一致协议,然后改造现有的系统,自行开 发或购买转换软件,购买v a n ( v a l u ea d d e dn e t w o r k ,增值网络) ,这些对于中 小企业或组织来讲,难以承担,实现起来困难。其次,在实现e d i 时,不同的业 务系统会根据它在贸易中所扮演的角色不同,对标准有选择地进行删减,从而构 成了独有的标准版本,不同版本之间的e d i 消息却根本不能互相处理。这使得传 统的e d i 很难成为通用的解决方案实现不同应用系统之间的数据交换。 随着互联网的发展和x m l 技术的出现,提供了解决这一闯题的基础。x m l 是 一种可扩展的标记语言,它作为一种可以用来定义特定应用的源语言,允许各行 业根据自己的独特需求制定相应的一套标记,来作为数据交换的标准。同时 i n t e r n e t 的灵活的按入方式,消除了e d i 通信的壁垒。目前国际上基于x m l 制 定的用于电子商务方面的交换标准有c x m l 、e b x m l 等。在数据交换层上,只要使 用基于x m l 的标准数据格式,基本上就可以实现无障碍通信。而对于那些历史的、 非x 札格式的数据,则必须实现x m l 数据格式转换。 在国内,x m l 的应用也很流行,已经被广泛的应用于电子商务和电子政务。 2 第1 章绪论 国内目前有许多公司正致力于电子政务的研究与开发工作,其中数据交换是它 们研究的重点。比如,中科院软件研究所制定的中国电子商务的标准与规范“3 c n x m l 标准。 总之,x m l 是信息标准化进程的有力工具,按照目前发展趋势来看,基于 x m l 的标准将成为以后主流的信息标准。 1 3 论文研究内容 本论文的主要研究内容为: ( 1 ) 实现跨平台的信息交换。交换原型系统运用x m l 技术实现不同系统间信 息的统一媒介,在对业务模式的归纳和抽象的基础上制定数据交换规范与标准。 ( 2 ) 多应用数据交换的技术支撑。实现核心及相关业务信息系统的快速集成, 迁移和伸缩性,实现多种应用业务信息系统无缝集成。设计先进的系统架构,使 系统不仅功能强大和可靠,而且还有高的灵活性和可扩展性。采用软总线技术, 以保证多技术体系、多业务职能、多接入系统和多接入方式的方便、灵活的接入 实现和系统的可扩展性。 本课题是从此研究内容出发,重点放在制定基于x m l 的电子数据交换标准 c i x m l ,并提出了基于消息中问件的数据共享与交换的系统解决方案。最后论文 给出了一个具体的本课题己实现的基于消息中问件的数据共享与交换的系统案 例。 1 4 论文组织结构 第一章明确本论文的研究背景及研究内容,最后概述本论文所作的工作。 第二章介绍x m l 的相关技术的概念和其在数据交换领域中的应用,重点放 在本论文中使用的x m l 相关技术。 第三章详细阐述本论文的重点之一基于x m l 的电子数据交换标准c i x m l 的 制定。介绍c i x m l 的设计原则、思想,并具体实现了电子数据交换标准s c h e m a 的完整定义。 第四章主要是提出了本系统的解决方案,但重点讨论了本系统总体架构设 计和框架采用的技术和思想;以及本系统数据传输的实现方式:最后简单介绍 了几种数据交换实现方式。 北京工业大学工学硕士学位论文 论。 第五章是系统实现案例并对系统中c i x m l 数据交换标准的具体应用作了讨 结论评价了本系统的研究成果并对本课题的发展前景作了展望。 第2 章x m l 及其在数据交换中的作用 2 1x m l 及其产生背景 x m l ( e x t e n s i b l em a r k u pl a n g u a g e ) 即可扩展标记语言它是1 9 9 8 年w 3 c ( w o r l dw i d ew e bc o n s o r t i u m ) 组织创建的一种针对网络应用的可扩展的标 记语言。同时,也是一种已被各界人士广泛接受的、正在发展中的开放式标准。 2 1 1 可标记语言的产生背景 2 0 世纪后期,i b m 的研究员g o l d f a r d 在构建一个用于存储、查找、管理和 发布法律文档时,发现i b m 的很多系统之间无法进行通信”。它们不能交换信息! g o l d f a r d 为了解决这一问题,与另外的两名研究员一起开发了一种标记语言, 用此标记语言可以在许多不同的操作系统上集成多个应用程序的复杂健壮的系 统。他们将此标记语言称为通用标记语言( g m l ) ,1 9 8 6 年g m l 发展成为健壮的 国际标准。l 一标准通用标记语言( s g m l ) 。此时s g m l 已经变得不仅庞大复杂, 而且功能强大,它不但是国际标准,而且是大型复杂文档交换的事实标准,被广 泛应用于诸如程序语言设计和机场信息维护之类的多样化领域。 2 1 2s g m l 和x m l ( 1 ) s g m l ( s t a n d a r dg e n e r a l i z e dm a r k u pl a n g u a g e ) ,标准通用标识语言。 在x m l 语言之前已经有一种用来描述数据的标记语言_ s g m l 。它是用来描述电 子文件结构与内容的标记语言,是一种国际标准。它能够对各种类型的数据进行 描述。s g m l 被广泛用于美国政府大型制造公司和科技信息出版商,但8 g m l 过于 复杂且实现成本较高,只能被应用于大中型企业、小型企业,个人难以使用。因 此,这种标记语言很难在网上流行起来。 ( 2 ) x m l ( e x t e n s i b l em a r k u pl a n g u a g e ) ,可扩展标记语言。随着w e b 的互 操作性和多样性受到专用格式标记的日益威胁。w 3 c 为了解决这一问题,吸收了 s g m l 的第三个思想定义文档类型。这样才可以根据它们进行文档的有效性 检查”! 。最终w 3 c 开发了一个s g m l 的子集,该子集即保留了s g m l 的主要的实用 功能”1 ,并坚持w e b 尽量简单的宗旨。这种新的语言便是x m l 。同时还为高级超 北京工业大学工学硕士学位论文 链接和样式单制定了相关的标准可扩展链接语言和扩展样式语言。确切地 讲,x m l 本身并不是一个单独地标记语言,它是一种元语言( m e t a l a n g u a g e ) , 是一种能够创建标记语言的语言。标记语言将标记直接插入到文本中来描述文档 的各部分。x m l 能够运行在任何平台和操作系统上,它的可扩展性表现在它并不 像h t m l 那样有固定的格式。可以说x m l 是在复杂的s g m l 和“僵化”的h t m l 之 间作了折中。1 。它提供了一种比s g m l 简单,比h t m l 更广泛的方法来描述文档内 容,使得网上信息的利用达到更高的水平。 2 2 x m l 的文档构成 2 2 1 文档类型定义d t d ( d o c u m e n tt y p ed e f in i t i o n ) x m l 语言有其严格的规范,以适应广泛的应用。x m l 文档必须符合x m l 的语 法。d t d ( 3 c 档类型定义) 提供了定义文档规范的一种方法。它不像h t m l 一样 用有一个通用的d t d ,想使用x m l 进行数据交换的组织可以定义它们自己的d t d 。 d t d 以如下方式定义文档类型。1 : ( 1 ) 声明了一个允许的元素集,该集合称为“词汇表”。 ( 2 ) 每个元素定义了一个内容模型。此内容模型是一种模式,规定了在一个 元素中可以有哪些元素或数据、以何种顺序排列、数目是多少,以及它们是必 需的还是可选的。上述规定被称之为x m l 的“语法”。 ( 3 ) 定义哪些元素允许的属性集。 ( 4 ) 它提供了大量的不同的机制来使模型更易于管理,如参数实体的使用。 2 2 2 x m l 模式( x m ls c h e m a ) x m ls c h e m a 是用来描述x m l 元素和属性的,它基本上包括属性和元素类型 说明,可以为x m l 元素和属性提供内容模块。s c h e m a 相对于d t d 的明显不同是 x m ls c h e m a 文档本身也是x m l 文档,而不像d t d 一样使用特殊格式。s c h e m a 的优点综述如下: ( 1 ) x m ls c h e m a 有名称空间的意识。它完全支持名称空问,允许文档的特 殊节点与s c h e m a 中的类型说明联系起来。联系x m l 节点和d t d 的唯一方法是通 过d o c t y p e 说明,这是有限的,因为每个文档实例只能用一个d t d 。多个s c h e m a 第2 章x 眦及其在数据交换中的作用 可以用来描述一个x m l 文档,因为) 【m ls c h e m a 自身不描述x m l 文档,它描述的 是x m l 元素。 ( 2 ) x m ls c h e m a 使用x m l 语法,因此也可以扩展。d t d 本身是不可扩展的。 在s c h e m a 中支持从已有的数据类型出发定制自己的新数据类型的能力以及在 一个文档实例中引用多个模式的能力。 ( 3 ) x m ls c h e m a 定义的数据类型要比d t d 全面。d t d 值允许把内容类型定义 为一个字符串,而x m ls c h e m a 则允许把内容类型定义为整型、浮点型、数据型、 布尔型或许多其它的简单数据类型。而且还允许复杂的数据类型,其中包括用 户自定义数据类型。 ( 4 ) x m ls c h e m a 支持复杂的内容模型,进而允许开发人员更精确地控制内容 模型行为。 s c h e m a 的优势以及它的可扩展性使得它成为描述数据的最佳的选择之一。 2 2 3d t d 与s c h e m a 的选择 d t d 不太适合于以数据为中心的文档,它不允许有复杂的内容类型或数据类 型,因此不提供对数据完整性的支持。在这种情况下,x 札s h e m a 是最佳选择。 相反,如果开发人员正在处理以文档为中心的文档,比如在线图书出版,则d t d 可能会做得更好“。 2 2 4x m l 名称空间 在x m l 的应用中使用名称空间,主要是用来避免不同的元素或属性被命名 为相同的名称,这样可以保证在x m l 文件中使用的名称是唯一的,即名称空间 为x m l 中使用的名称提供了一个容器“。有时候相同名称在不同的应用领域具 有不同的含义的,而且x m l 很注重文字语义,并且希望用户能够直接通过名称 即能了解其中的信息的含义,所以当不同的领域用到了相同的名称,就会造成 程序读解的错误。名称空闯的名称是统一资源标识符“,一段情况下以h t t pu r l 的形式书写的。 可以声明一个元素存在于某一特定的名称空间内,而且它应当通过名称空 间的有效性验证。通过将名称空问前缀附加到元素或属性的前面来告诉解析器 它来自哪个名称空间。 北京工业大学工学硕士学位论文 2 3 x m l 编程模型 黼l 编程模型主要有两种:对象模型类的d o m 和事件驱动类的s a x “2 ”。 2 3 1 文档对象模型d o m ( d o c u m e n to b j e c tm o d e1 ) 文档对象模型d o m 是公认的w 3 c 标准提供的一套应用程序接口a p i ,为创 建、处理和操作x m l 文档内容结构和样式提供了灵活而有效的方法。对于x m l 应用开发来说,d o m 就是一个对象化的x m l 数据接口,是组对象的集合,通 过操纵这些对象,我们就能操纵j ( m l 数据。 w 3 cd o m 是一个与平台和语言无关的接口“,应用通过这个接1 3 和x m l 或 h t y l 的数据打交道。这种对象模型实现的基本功能包括: ( 1 ) 表述文档表示和操作的接口。 ( 2 ) 接口的行为和属性。 ( 3 ) 接口之间的关系以及互操作。 d o m 文档是以层次结构组织的节点或信息片断的集合。这个层次结构允许 开发人员在树中导航寻找特定信息。分析该结构通常需要加载整个文档和构造 层次结构到内存中,然后才能做任何工作。由于它是基于信息层次的,因而d o m 被认为是基于树或基于对象的。以树为基础的d o ma p i 会把捌l 的文件转换成 一个定制的树状结构,所有后续操作都是在这个“树化”后的x m l 文件中执行 的1 ”。 d o m 以及广义的基于树的处理具有几个优点。首先,由于树在内存中是持 久的,因此可以修改它以便应用程序能对数据和结构作出更改。它还可以在任 何时候在树中上下导航,而不是像s a x 那样是一次性的处理,d o m 使用起来也 要简单得多。另一方面,在内存中构造这样的树涉及大量的开销,大型文件完 全占用系统内存容量的情况并不鲜见。此外,创建一棵d o m 树可能是一个缓慢 的过程, 2 3 ,2s a x ( s i m d l ea p if o rx m l ) 用于读取和操作l y l 文传的标准是文档对象模型。遗憾的是d o m 方法涉及 读取整个文件并将该文件存储在一个树结构中,而这样可能是低效的、缓慢的, 第2 章x , l i l 及其在数据交挠中的作用 并且很消耗资源,一种替代技术就是5 a x 。8 a x 允许在读取文档时处理它,从 而不必等待整个文档被存储之后才采取操作。基于事件的s a x 解析器向一个事 件处理程序发送事件“”,比如元素开始和元素结束,而事件处理器则处理该信 息,然后应用程序本身就能够处理该数据。原始的文档仍然保留完好无损,但 是s i x 提供了操作数据的手段,而后数据可以引入另一个进程或文档。 s a x 处理的优点非常类似于流媒体的优点。分析能够立即开始,而不是等 待所有的数据被处理完。而且,由于应用程序只是在读取数据时检查数据,因 此不需要将数据存储在内存中,遮对于大型文档来说是个巨大的优点。事实上, 应用程序甚至不必解析整个文档;它可以在某个条件得到满足时停止解析。一 般来说,s a x 还比i ) o m 快许多。另一方面,由于应用程序没有阻任何方式存储 数据,使用s a x 来更改数据或在数据流中往后移是不可能的。 2 3 3d o i d 与$ a x 的选择 d o m 和s a x 主要的不同之处在于访问文档的力式,d o m 用于随机访闷y 0 4 l 文档的各个部分,s a x 用于顺序访问。应用是选择d o m 还是s a x ,主要取决于以 下几个因素: ( 1 ) 应用程序的目的。如果打算对数据作出更改并将它输出为x m l 那么在 大多数情况下,d o m 是适当的选择。这并不是说使用s a x 就不能更改数据,但 是该过程要复杂得多,因为这需要对数据的一份拷贝而不是对数据本身作出更 改。 ( 2 ) 数据容量。对于大型文件,s a x 是更好的选择。 ( 3 ) 数据将如何使用。如果只有数据中的少量部分会被使用,那么使用s a x 来将该部分数据提取到应用程序中可能更好,因为s a x 特别适合“局部”处理”。 另一方面,如果需要以后回头引用已处理过的大量信息那么d o m 也许是恰当 的选择。 ( 4 ) 对速度的需要。s a x 实现通常要比d o m 实现更快。 s a x 和d o m 不是相互排斥的,可咀使用d o m 来创建s a x 事件流,也可咀 使用s a x 束创建d o m 树。事实上,用于创建d o m 树的大多数解析器实际上都 使用s a x 柬完成这个任务! 在本沱立中,系统解决方案中采用d o m 来解析x m l 文档,选择1 ) o m 的原因 9 北京工业大学工学硕士竿位论文 有两点: ( 1 ) d o m 是w 3 c 制定的标准电子政务解决方案,力求建立在开放通用的标准 之上。 ( 2 ) 电子政务数据文档通常数据量不很大。 2 4 基于x m l 的数据交换技术 z 4 1 电子数据交换技术 电子数据交换又称e d i ( e l e c t r o n i cd a t ai n t e r c h a n g e ) ,它的价值在于 在各个相关业务系统之间自动实现数据交换,是一种在异构的、分布式的应用 或平台间进行电子格式交换数据的过程,它将信息孤岛有效的连接起来,尽可 能的增加数据的使用效率和价值。e d i 并非简单地把数据从一个系统输出到另 一个系统,而是在系统间进行真正的交互操作。e d i 的实施不仅要克服各个相 关业务系统之间计算平台的异构,更困难的是,还要克服各个相关业务系统之 间的事务集合和业务规则的“异构”。 e d i 的发展e d i 是出现在2 0 世纪7 0 年代的一项信息技术,它试图通过计 算机网络将不同的计算机系统联系起来,将信息按照协议标准制作成统一格式 的文件发送给对方,接收方按照统一语法格式解读文件,然后通过计算机实现 自动化处理。应当说,e d i 的大范围使用是可以降低数据处理费用和数据重复 录入费用,从而提高经济效益的,但它的一些致命缺陷限制了它的普及应用。 首先是生产成本太高。传统的e d i 需要购买或开发专用的数据格式转换软 件,需要架设商业服务器控制数据流,并且传统的e d i 工作在增值网络上“”, 所以还要购买v a n ( v a l u ea d d e dn e t w o r k ,增值网络) 来确保发送和接收的商 业信息的安全和机密。除了少数大业务系统有能力外,昂贵的费用使大多数中 小企业只能是望而生畏“。这使得e d i 很难规模化、普及化,即使在美国,不 到5 的商业交易采用e d i 的方式交换商业数据m 1 。 其次,在实现e d i 时,不同的业务系统会根据它在贸易中所扮演的角色不 同,对标准有选择地进行删减,从而构成了独有的标准版本,不同版本之间的 e d i 消息却根本不能互相处理。 但网络和x m l 等技术的蓬勃发展赋予了e d i 新的生机。我们已经看到,高 第2 苹捌l 及其在数据交换中的作用 性能的硬件设备、宽流量的网络通讯使得数据处理、数据传输更为快速;数据 库的强大功能使得数据分布式、海量存储成为可能:面向对象语言、中间件的 发展使得软件开发、软件维护的成本降低。x m l 国际化发展,x m l 是一种能够 以统一的格式描述信息的文本语言,具有可扩展性和自我描述性的特点,它能 将不同系统来源的信息按照统一的格式显示,也能够进行不同格式之间的相互 转化,所以是信息标准化进程的有力工具。 2 4 2x m l 与异构数据集成 x m l 不依赖于平台和某应用程序,因此可以被应用于异构平台和不同应用程 序间的数据交换和集成。允许异构数据系统之间交换数据的一种办法是为所有的 输入输出系统分别制定统一的交换格式。这实际上就是s g m l 最初的设计目标, x m l 继承了这个理念。其中最关键的就是x m l 能够根据特定的应用定义自己的标 签,也可以说这是x m l 最重要的功能。x m l 的目标是提供一个与系统、厂商无关 的统一解决方案,电子商务属于这类应用,尤其是以用于公司之间单据交换的 e d i 为基础的电子商务。x m l 丰富的格式语言可以用来描述不同类型的单据,例 如信用卡、保险单和各种发票等。 x m l 为异构数据系统的信息交换提供了标准格式,为异构数据的互操作提供 了一种方法。通常系统采用x m l 作为数据集成的互操语言,采用j a v a 技术作为 编程语言,来实现异构的集成。j a v a 解决了许多平台异构问题,包括硬件和操 作系统的异构。x m l 本身作为异构系统的信息交换标准,利用d t d 或s c h e m a 描 述标准格式。x s l 和x s l t 技术增强了数据转换能力,d o m 和s a x 提供了开放的编 程接口,这些特性表明了x m l 技术可以作为异构数据集成的可行方案。 2 4 3x m l 作为数据交换标准的优势 不同的应用系统可能会由不同的开发商采用不同的技术在不同的平台上开 发出来,如果不能提供一个标准的数据交换格式,不同应用系统问的数据交换 将难以进行,而x m l 是数据交换标准化的有力工具。统一数据格式将有助于实 现不同应用系统间的数据共享和集成,实现大量信息的实时共享和双向交流。 煳l 最突出的应用就在于作为信息交换的数据格式技术标准,它本身具有可扩 展性、可移植性和结构性的特点。基于x m l 的数据描述格式,它的扩展性和灵 北京工业大学工学硕士学位论文 活性允许它描述不同种类应用软件中的数据。 x m l 最大的特点是以一种开放的自我描述方式定义了数据结构,并在描 述数据内容的同时能突出对结构的描述,从而体现出数据之间的关系。这种特 点使得x m l 在电子商务的应用上具有广泛的前景,并在一定程度上推动了分布 式商务处理的发展。在业务系统内部集成分布式商务处理是一项艰巨的工作, 而在业务系统之间进行集成则具有非常高的成本。若要在本质上简化部门内部 和部门之间协调商务处理,还需要进行大量的工作。 基于x m l 的标准的出现,其目的是便于协调商务处理,并且不依赖于操作 系统、编程模式或编程语言。丽基于这种标准的全面的集成化环境,不仅为业 务系统内部,更为使用互联网的业务系统之间提供了一种协调商务处理的迅速、 简单、性价比很好的解决方案。 2 5 本章小结 x m l 是本论文的技术重点,鉴于本论文中将深入涉及到x m l 技术的方方面面, 因此本章对论文中所涉及到的x m l 相关技术做了一些阐述。包括可标记语言的发 展、s g m l 、h t m l 莽i x m l 的之间的关系及其差别,x m l 的设计目标,文档定义类型, x m ls c h e m a ,创建处理和操作x m l 文档的d o m 和s a x ,最后总结了x m l 在异构数据集 成中应用的可行性。 第3 章数据交换标准c ix m l 的制定 北京市民卡系统是一个政府服务系统。它提供政府与各职能部门问、与企 事业间、与社会公众间的业务处理。该系统提出了以下需求: ( 1 ) 建立在开放的通用的标准之上。 , ( 2 ) 能够方便地满足各部门之间信息资源共享。 ( 3 ) 满足政府各部门间的业务整合和数据的交流。 ( 4 ) 能够能动地适应政务流程的变化,灵活地集成政府企事业和个人的应 用。 以上是本系统的实现在技术上提出的新的要求。而在当前的大部分部门系 统是一种孤岛式计算机系统,系统之间的信息没有较好地进行统一管理和集中, 不能有效地服务于广大企业和公众。 虽然x m l 具有如此众多的优势,但是x m l 本身并不能解决数据交换中的问题。 这就要求数据格式标准,包括标记和数据层次,必须在发送方和接收方之间保持 可协商性。即对于数据交换来说,最重要的是进行数据交换的双方要对数据的格 式达成统一的认识,只有采用统一的数据格式,才能卖现数据的自动流转、处理 等功能“。在实际使用x m l 时,惟一必须遵从的问题就是x m l 文档的数据项名称 ( 标记名) 和逻辑结构。数据交换基于x m l 技术,是指用x m l 定义应用系统问传 递数据的结构,预先制订底层数据交换的规范,然后在此基础上开发整个系统的 各个模块,各模块之间传输的数据将是规范的严格遵循语法规则的数据。这也是 本章的目的,本章主要阐述c i x m l 数据交换规范的设计思想、设计原则和s c h e m a 规范的实现。 3 1 数据交换标准ci x m l 的设计原则 c i x m l 数据交换规范是建立在基于w 3 c 的x m l 相关技术标准基础之上。参 考n 3 c 对x m l 的设计目标;使用通用的国际标准和中国国家标准:采用模块结 构,模块相互之间可通过嵌套调用,使用灵活方便;以电子政务为核心,面向 涉及的相关领域,跨越不同应用范围,实现高度通用性;依据电子政务的复杂 程度,为了包容所有相关内容,应充分考虑可扩展性;结合我国电子政务的特 北京工业大学工学硕士学位论文 点和本课题具体的实际应用情况,拟定c i x m l 的具体设计原则如下: ( 1 ) 遵守国家和北京市的相关标准。由于本课题依托北京市民卡的建设项 目,c i x ) a l 的制定是基于北京市市民基础信息数据标准。c i x m l 标准中交换 数据为市民基础信息数据标准中定义的数据项。市民基础信息数据交换方 式、交换流程以及交换的安全保证体系等仅适用于北京市市民基础信息系统。 ( 2 ) 基于x m l 符合x m l 系列标准的要求。c i x m l 文档遵循x m l 系列标准的 要求,包括:x m l 文档的语法结构,相关s c h e m a 文档符合x i d l 标准等。 ( 3 ) 具有可扩展性,能够适应于不同情况。c i x m l 提供政府各业务部门之 间处理信息时所需要交流的文档规范,这些规范可根据应用需要进行灵活扩展。 ( 4 ) 支持中文标记和英文标记。 ( 5 ) 保证高度的安全性。政府部门传输的数据往往需要保证高度的安全性。 在c i x m l 规范的设计上,遵循不将传输的信息与某种固定的传输模式进行捆绑 的原则,即c i x j i l l 的数据不局限于h t t p 或某种特定的传输方式,同时支持客户 的认证与授权机制、数据完整性、传输的安全性、安全等级划分等。 3 2 数据交换标准c i x m l 的设计目标 本规范应立足于本系统的客观需求,着眼于我国电子政务未来发展趋势, 提供以x m l 为基础的数据交换标准格式,规范行业和政府的应用开发,统一网 络的数据交换格式。就目前来说,c i x m l 规范力求基于) q d l 技术建立一个符合 北京市市民基础信息交换系统要求的语言规范。它能够提供一套统一、灵活、 开放和可扩充的政务规范语言。接口规范应易于实现,并应充分考虑目前北京 市劳社局、民政局、公安局等政府业务系统接口现状及其接入方式的可行性。 3 3c i x m l 的设计需求 c i x m l 是北京市政府各业务部门用于进行相互通信的数据交换标准。通过它 能使各业务部门的信息进行交换,从而达到各部门数据共享的目的,并能实现核 心及相关业务信息系统的快速集成、迁移和伸缩性,实现多种应用业务信息系统 的无缝集成。具体来说c i ) n l 的需求如下: ( 1 ) 在对业务模式的归纳和抽象的基础上制定数据交换规范与标准,使其能 对各业务部门的共享数据进行有效的表示和存储,即能够有效的表示和存储各业 第3 荤数据变抉标准c i 瑚l 的制定 务部门间共享数据的结构内容、关系语义、授权操纵以及维护数据的建立、修改 和删除。 ( 2 ) 每一种类型数据交换的数据格式均要符合特定的统一的格式。如订阅请 求、订阅应答、订阅发布等均有其特定的统一的格式。这样可以利用计算机进行 有效和准确的处理。 ( 3 ) 不同的用户终端可能需要数据的不同样式的显示。对于普通公众可能希 望看到更友好的数据表示界面。 ( 4 ) 制定的数据交换标准不能局限于某一交换协议,而能够支持h t t p 或某种 特定的传输协议。即它既可以在各种分布式协议进行上传输,也不局限于所采用 的平台架构方式。 ( 5 ) c i x m l 要具有良好的扩展性。易于业务的扩展需求。 x m l 及其相关标准的设计特点能够保证基于x m l 格式的c i x m l 交换标准可 以很好的满足上述需求。x m l 文档的s c h e m a 能够保证数据交换符合特定的格式; x s l t 能够进行文档问方便的转换;x m l 能跨平台和不基于任何某一特定的协议 进行传输。 3 4c i x m l 的设计实现 本标准从实用性、系统性和开放性角度出发,充分考虑北京市各政府职能 部门现有业务管理信息系统特点,结合业务需要以及信息化发展趋势,采用国 际先进的描述体系x m l ,制定了市民基础信息数据交换标准。 在此过程中通常根据电子政务主体的规模、部门的特殊性、涉及业务的范 围、设计的目标以及后备技术支持的程度,以决定在多大程度和哪个层次上完 善将要制定的x m l 规范。通常,最起码的要求是设计的s c h e m a 规范集能保证项 目中确定部分信息流的有效性,不过这仅仅满足了系统基本的功能性要求,在 此基础上我们还要求s c h e m a 规范集能具有简洁性、合理性、开放性、兼容性, 尤其是最后一项。这是因为在项目运行前不一定能制定出一个完美的s c h e m a 规范集,以及x m l 标记本身具有易于扩展的特点。所以,我们应该在设计之初 便为系统将来运行中x m l 规范的升级留出足够空间。文档类型定义的向后兼容 性很大程度上决定了整个系统未来的可扩展性。 c i 瑚l 规范文档采取统一的大小写和命名习惯。中文版本文档中,元素和 北京工业大学工学碗士学位论文 属性根据标识对象的内容由一至十五个汉字组成,不包括任何标点符号。英文 版本文档中,按国际通用惯例采用两种对大小写敏感的风格。对于元素,每个 组成单词首宇母大写;对于属性,首字母小写,其余每个组成单词首字母大写。 3 4 1 命名空间 市民基础信息数据交换x m l 描述采用命名空间为“h t t p :w w w b e i j i n g c a r d g o v c n c i x m l ”。 3

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论