




已阅读5页,还剩81页未读, 继续免费阅读
(计算机应用技术专业论文)基于xml的异构数据交换系统的研究与实现.pdf.pdf 免费下载
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
西南交通大学硕士研究生学位论文第】页 摘要 数据交换是影响企业信息化管理发展的主要因素之一。它的目标是在异 构环境( 松散耦合、数据格式不同、跨平台、跨地域的分布环境) 中实现数 据的共享,从而有效地利用资源,提高整个信息系统的性能,加快信息系统 之间的数据流通,实现数据的共享和集成。但当前各种数据交换技术运用于 异构环境均存在很多问题,共有的问题主要包括耦合度大、成本高、实施复 杂等。x m l 和w e b 服务技术的出现给数据交换带来了新的实现方法。本论文 以实现异构环境中数据交换为目标,使用x m l 和w e b 服务技术设计和实现了 一个通用的异构数据交换系统。 本文首先分析、比较了当前各种数据交换技术,并针对原有技术缺乏统 一标准,平台依赖性强,系统间耦合度大等缺陷,提出采用l 和w e b 服务 实现异构环境下的数据交换。 本文进一步对x m l 、w e b 服务等相关技术进行了深入的研究,通过对常见 的数据交换模式和拓拎结构的分析,设计了一个基于勰l 、w e b 服务的异构数 据交换框架,介绍了该框架的体系结构、工作流程和各模块的功能等重点问 题,并详细阐述了x m l 文档和数据库信息之间的映射、x m ls c h e m a s 的提取、 x m l 文档的发送与接收、x m l 文档间的映射和x m l 文档属性封装和解析等关键 模块的设计和实现,介绍了数据交换系统如何与其它系统进行集成,并分析 了系统的安全问题及可能的解决方案。 最后介绍了基于x m l 技术的异构数据交换系统在企业中的实际应用。从 实践角度证明系统框架的可行性,同时指出了系统的不足和有待提高的方面。 关键词:数据交换:x 札:w e b 服务;s o a p 西南交通大学硕士研究生学位论文第】l 页 a b s t r a c t d a t ae x c h a n g ei so n eo ft h em a i ni n f l u e n c i n gf a c t o r so fd e v e l o p m e n to f e n t e r p r i s e si n f o r m a t i o n i t sg o a li s t or e a l i z et h e s h a r i n g o ft h ed a t ai nt h e h e t e r o g e n e o u se n v i r o n m e n t ( 1 0 0 s ec o u p l i n g ,d i f f e r e n td a t af o r m a t ,h e t e r o g e n e o u s p l a t f o r m ,h e t e r o g e n e o u sa r e a ,a n ds oo n ) ,t h u s u t i l i z e sr e s o u r c e s e f f e c t i v e l y , i m p r o v e st h ep e r f o r m a n c eo ft h ew h o l ea p p l i c a t i o ns y s t e m ,a c c e l e r a t e sd a t a c i r c u l a t i o no fi n f o r m a t i o ns y s t e m ,a n dr e a l i z e st h es h a r i n ga n di n t e g r a t i o no ft h e d a t a b u tv a r i o u se x c h a n g et e c h n o l o g i e sh a v em a n yp r o b l e m sw h e na p p l yt o h e t e r o g e n e o u se n v i r o n m e n t s t h ec o m m o nq u e s t i o ni n c l u d e sh e a v yc o u p l i n g , h i 曲c o s t sa n dc o m p l i c a t e di m p l e m e n t i n g t h ee m e r g e n c eo fx m la n dw e b s e r v i c e s t e c h n o l o g yh a sb r o u g h tt h ei l e wi m p l e m e n t a t i o nm e t h o d t h i sp a p e r t a r g e t s a sd a t a e x c h a n g eb a s e dh e t e r o g e n e o u se n v i r o n m e n ta n do n eg e n e r a l h e t e r o g e n e o u s d a t a e x c h a n g es y s t e m i s d e s i g n e d a n d i m p l e m e n t e db y t h e t e c h n o l o g y o fx m la n dw e bs e r v i c e s f i r s t ,v a r i o u sc u r r e n td a t ae x c h a n g et e c h n o l o g i e sa r ec o m p a r e d ,a c c o r d i n gt o t h eo l dt e c h n o l o g i e s s h o r t c o m i n go fl a c k i n gu n i f o r ms t a n d a r d ,h i 曲p l a t f o r m d e p e n d e n c ea n dh e a v ys y s t e mc o u p l i n g , t h ea d o p o o no fx m l a n dw e bs e r v i c e t e c h n o l o g yt or e a l i z e t h ed a t ae x c h a n g ei n h e t e r o g e n e o u se n v i r o n m e n ta r ep u t f o r w a r d f u r t h e r m o r e ,x m l a n dw e bs e r v i c ea n dr e l a t e d t e c h n o l o g i e sa r e r e s e a r c h e d i nd e p t h ,b a s e do nt h ea n a l y s i so fc o m m o nd a t ae x c h a n g em o d ea n dt o p o l o g y , f l x m l , w e bs e r v i c e - b a s e dh e t e r o g e n e o u sd a t ae x c h a n g ef r a m e w o r ki sd e s i g n e d a r c h e t e c t u r e ,w o r k i n gp r o c e s s a n dm o d u l ef u n c t i o no ft h ef r a m e w o r ka r e i n t r o d u c e d ,t h ed e s i g na n dr e a l i z a t i o no fk e ym o d u l e ,s u c ha s m a po fx m l d o c u m e n ta n dd a t a b a s e i n f o r m a t i o n ,t h e e x t r a c t i o no fx m ls c h e m a s , t r a n s m i s s i o na n dr e c e p t i o no fx m l d o c u m e n t ,e n c a p s u l a t i o n a n dp a r s i n go f i n t e r - x m ld o c u m e n tm a pa n dx m ld o c u m e n ta t t r i b u t e ,a n dt h ei n t e g r a t i o no f d a t ae x c h a n g es y s t e mw i t ho t h e rs y s t e m s ,s e c u r i t yp r o b l e mo ft h es y s t e m sa n d t h ep o s s i b l es o l u t i o na r e a n a l y z e d f i n a l l np r a c t i c a la p p l i c a t i o no fx m l - b a s e dh e t e r o g e n e o u sd a t ae x c h a n g e s y s t e m i n e n t e r p r i s e s i si n t r o d u c e d t h e f e a s i b i l i t y o fs y s t e mf r a m e w o r ki s c e r t i f i e di np r a c t i c e ,a n dt h ed e f e c t sa n df u r t h e ri m p r o v e m e n to ft h es y s t e ma r e p o i n t e d o u t k e yw o r d s :d a t ae x c h a n g e ;x ml ,w e bs e r v i c e s ;s o a p 西南交通大拳硕士磅究生学位论文箦j 页 1 1 引言 第1 章绪论 企业内部与外部联系逐渐紧密,甚至融为一体,这种变化深刻影响着企 业的组织结构,不仅反映在企业内部的业务流程中,而且影响着企业如何与 客户、合作伙伴、供应商、分销商等进行的商务活动。业务信息在比以前广 泛得多的范围内流动。 面对快速变化的市场条件,当今的商务活动必须以速度、效率与灵活性 作为应对策略,这需要企业内部、企业间、扩展企业网络间各个应用系统之 间相互协作,交换数据,实现业务流程的协同和业务信息的共享。 如果我们单纯从具体的解决技术来看,电子数据交换是解决上述问题的 一个简单可行并且适应性广的方式,通过在不同的系统之间传递数据,实现 不同应用系统以及不同企业之间的数据共享,以此减少手工的重复操作,提 高信息传递的速度和信息处理效率,减少业务处理的差错,降低企业的运行 成本。 但当前各种数据交换技术运用于异构环境( 松散耦合、数据格式不同、 跨平台、跨地域的分布环境) 均存在很多问题,共有的问题主要包括耦合度 大、成本高、实施复杂等。如何有效解决这些问题是数据交换面临的一大挑 战。 1 2 数据交换的分类及解决方案 数据在不同的信息实体之间交互的过程称为数据交换。企业数据交换由 于其能够加快业务流程、提高业务的效率、降低人力、物力、成本等诸多优 点,越来越受到人们的关注。当前的企业数据交换,根据其应用范围和特点 大致可以分为企业内部交换和企业之间的数据交换( 图卜1 ) 。企业内部交换 的数据格式比较单一,业务流程固定,数据交换的构架相对紧凑,有较高的 耦合度和数据交换效率,企业之间的数据交换和数据格式烦杂,数据交据的 西南交通大学碾士研究生学位论文第2 页 构架相对松散,耦合度低,数据交换效率也相对较低。f 1 ,一一一。一 、 , 企业数抛交换 一一,。 图1 - 1 企业数据交换分类 1 2 1 企业内部数据交换 一个企业内部的信息系统构成是根据自己的企业的业务特点和需求构建 起来的。如果业务和功能结构比较单一,企业往往使用单一的信息系统来完 成所有的工作,这样做的好处是信息系统相对封闭,即使需要和其它信息系 统进行数据交互,其交换格式也比较简单统一,效率高,一般可以实时的完 成各种业务,但是单一系统不易扩展,当出现涉及到与系统外信息实体数据 交互时,往往需要手工完成。如一些中小型的进销存系统,商品的订货仍需 通过电话或传真交换数据然后用手工录入到计算机系统中。 一些中、大型企业的信息系统多由多个信息系统构成,如大型商业企业 的财务、进销存、统计、客户管理等等往往都是独立的系统,并且很可能这 些系统由不同的软件开发商提供,这一类系统的功能高难度内聚,使各个系 统成为信息孤岛。为了实现企业内部不同系统之间的交互,在2 0 世纪9 0 年 代以后,逐渐形成了队i ( e n t e r p r i s ea p p l i c a t i o ni n t e g r a t i o n ,企业应 用集成) 的概念。 系统内的数据交换通常是因为整个系统由分布在不同地理位置的子系统 构成,各个子系统之间要按照企业内部数据交换规范和业务流程进行数据交 换,在实际应用中,往往采用应用层的数据交换。应用层交换数据将数据从 数据源实体中提取出来,规范化成为统一的格式,比较典型的有分布式对象 技术“”和多自主体系统技术( m u l t i a g e n t ) 【1 2 】,分布式对象技术的主要思想 是:在分布式系统中引入一种可分布的,可互操作的对象机制。把分布于网 络上可用的所有资源封装成一个个可公共存取的对象集合,采用客户朋务器 、心、讲。 翻螨孥( 纛零一 一雌姓 ;、 氲掣o 酉南交通大学硕士研究生学位论文第3 页 ( c s ) 或测览器服务器( b s ) 的结构和模式实现对象的管理和交互,使得 l i j 一_ t _ 、i 、 为了更高的数据交换效率,系统内部也常使用底层数据交换。即用于交 换的数据格式并不具有实际可理解的意义,仅仅在数据交换的系统双方可以 处理。该类交换比较典型的例子就是分布式数据系统。一般大型数据库系统, 如o r a c l e 本身就提供了较好的分布式应用【1 3 1 ,用来保证分布式数据库之间 的数据一致性和完整性。这类分布式数据库系统均使用同构的数据库系统。 分布式数据库对应用系统提供整体的数据视图,使具体的物理视图对上层应 用系统完全透明。当分布式数据库系统是异构时,则需要新的技术和解决。 流行的解决方案往往采用代理的方法【1 4 】【1 5 】,为每种数据源( o r a c l e 、 s y b a s e 、a c c e s s 、s q ls e r v e r ) 建立一种对象,然后通过代理来访问,而x m l 语言往往用来作为异构数据库交互的中间数据表示格式。当然,也可以使用 各种大型数据库提供的数据网关技术1 1 3 】和s y b a s e 公司的数据管道技术 【1 6 【1 7 。 e a i 将进程、软件、标准和硬件联合起来,在两个或更多的系统之间实 现无缝集成,使它们就像一个整体一样。传统的e a i 方法是在任何两个系统 之间构建一个适配器【笠】( 见图卜2 ) 这样的方法实现简单,但是需要开发大 量的应用系统适配器。同时,当企业内有n 个独立系统时,如果一个系统出 现了扩展或者更新,那么相应需要改动的适配器则有n 一1 个。可见适配器方 法只适合独立系统少( 一般少于三) 的应用系统集成。 公共应用网关是一种较好的e a i 解决方案( 图卜3 ) 。该方案在原有企业 系统之间增加一个应用网关和一种统一交换的数据格式,所有参与交换的独 立系统都要使用这个统一的数据格式与应用网关交互,然后由应用网关完 成数据的转发。这种e a i 解决方案中,独立系统仍然需要适配器将数据转化 为统一格式和应用网关数据交互。但是适配器的数量将大为减少,同时,某 一系统的更新只对该系统的适配器产生影响。统一交换的数据格式是应用网 关解决问题的关键,定义的统一数据格式要兼顾到兼容性,扩展性以及可读 性诸多因素。当前大多数此类系统倾向使用) ( m l 作为中间数据格式的表示方 诬南交通大学硕士研究生学位论文第4 页 图卜2e a i 传统解决方案图卜3e a i 公共应用网关解决方案 在代理( a g e n t ) 技术出现之后,基于代理的e a i 解决方案【2 5 l ( 图卜4 ) 也成为一个新的发展方向,该类解决方案将每个独立系统都看成是一个企业 的实体( o n t o l o g y ) 的集合以及在这些实体上面约束的集合,抽象出这些实 体和实体之间的关系以及相应的约束,就可以构成一个通用的企业业务对象 字典,而每个独立的应用系统都有装配一个a g e n t ,用于将交换数据翻译成 企业内a g e n t 都能处理的基于数据字典的统一语言,然后在一条数据总线 ( b u s ) 上进行交互。企业对象实体、实体问关系以及约束的抽取是实现该种 方案的关键。由于同行业的相似性,可以定义一个用于共享的行业数据字典, 这样可简化具体的企业数据字典的实现。无疑,该种解决方案可扩展性是最 好的,同时实现时重用程度较高,可以有效的降低e a i 的成本。 图卜4 基于代理的e a i 解决方案 1 2 2 企业之间的数据交换 企业之间的数据交换在某些方面类似于e a i ,例如目前b 2 b 数据交换多 是即存系统之间的数据交换,交换方式也可以采用类似于b a i 的技术来完成, 但是在逻辑上b 2 b 的数据交换和e a i 却有很大的不同。参与e a i 集成的各个 州 ,、 法 西南交通大学硕士研究生学位论文第5 页 独立系统的逻辑上都属于同一企业内的不同功能子集,因此e a i 中各个子系 统交换的数据都遵循统一的数据规范( 企业或行业数据字典) 如业务流程, 而参与b 2 b 的数据交换的企业大多数并不在同一类行业以内,如供应链是的 通常各类b 2 b 数据交换都要将应用层的数据表示和底层数据传输方式隔 离开。由于其开放性,b 2 b 的数据交换所涉及的数据格式纷繁复杂,业务流 程也多种多样,为了规范化企业之间的数据交换,降低b 2 b 数据交互的成本, b 2 b 数据交换大多有一个一致的数据表示框架【2 ,而且,某些b 2 b 交换平台 ( 如e b x m l 、r o s e t t a n e t 等) ,在框架的基础之上详细定义了参加b 2 b 数据交 换的企业所遵循的商用数据字典【2 7 】,该字典可以理解为企业数据字典的超 集。内容仍然包括商业实体、商业属性、商业实体间关系和约束等等。不管 是公共的数据字典还是数据表示框架,都需要建立标准。当前b 2 b 数据交换 的数据标准主要有e d i 、r o s e t t a n e t 、e n x m l 、b i z t a l k 等。下面将做一个简 要的介绍的比较。 e d i 2 8 】:e d i 是e l e c t r o n i cd a t ai n t e r c h a n g e r 的缩写。e d i 数据标准 是格式化的,通常同时包含公共文件规范( 业务逻辑) 、通信协议( 通信协议) 、 计算机语言。e d i 数据标准的使用必然受到具体e d i 系统的软件以及硬件的 限制。通常驻情况下,具有贸易伙伴关系的多个企业使用同一个e d i 系统, 只有这样才能进行业务数据交换,格式化的e d i 报文是不可读的机器码,只 能由计算机进行解读。 r o s e t t a n e t 【2 9 】:这是由名为r o s e t t a n e t 的非赢利性论坛在1 9 8 8 年发起 的针对整个商务供应链而制定的一个基于x m l 的框架标准。r o s e t t a n e t 分三 层,如图卜5 。顶层p i p ( p a r t n e ri n t e r f a c ep r o c e s s ) 定义了供应链中业 务流程中可能发生的每一个步骤,r n i p ( r o s e t t e n e ti m p l e m e n t a t i o n f r a m e w o r k ) 定义了供应链流程的标准构架,d i c t i o n a r y 定义了一个包含技 术属性的商业对象( 商业伙伴、物流、商品目录) 属性的数据字典。整个标 准由x m l 语言标识。r o s e t t e n e t 是一个规范一致的商务标准。该标准已经在 西南交通大学硕士研究生学位论文第6 页 欧美及台湾等地的i t 行业供应链中广泛采用。 e b x m l 注册中心w e b 服务提供者 w e b 服务请求看 图1 6e b x m l 商务过程 c n x m l :c n l m l ”】于1 9 9 9 年由中国软件所电子商务研究中心开始制定, 旨在构建根据中国电子商务特有的商业规则和商业习惯建立起一套统一的规 范和框架。c n x m l 在数据结构上首次提出了中英双语标准的概念,不仅支持 英文标签,还全面支持中文标签。c n x m l 在文件的网上传输上采用多协议支 持,遵循消息和传输方式分离的原则:支持多种通信方式。包括请求回应、 单向发送、多点发送等。在商业流程上,c n x m l 支持0 b i 协会提出的0 b i ”j ( o p e nb u y i n go nt h ei n t e r n e t ) 模型,可以使用o b i 模开型来驱动订单流 程。c n x m l 对文件的表达采用了三段一体,既信头、内容和附件。同时,c n x m l 具有良好的模块结构,一个消息可以包括多个c n x m l 文件、一个删l 文档或 其它数据对象,具有广泛性、灵活性和可扩展性。 西南交通大学硕士研究生学位论文第7 页 b i z t a l k :b i z t a l k 酬是m i c r o s o f t 提出的用于电子商务和应用集成的框 架,它本身并不是标准而是一个x m l 数据的s c h e m a 库,每个商家用x d r ( 微 软定义的用于定义s c h e m a 的语言) 自己定义自己的s c h e m a ,然后到 b i z t a l k o r g 注册。当商家在电子数据交换中遇到的消息不在己知的s c h e m a 范围中,商家可以到b i z t a l k o r g 查找这个消息的s c h e m a 。b i z t a l k 消息通 过b f cs e r v e r ( b i z t a l kf r a m e w o r kc o m p l i a n ts e r v e r ) 来进行异步传输和处 理,并由它屏蔽了底层的通信协议。b i z t a l k 的优点是它将定义具体商业标 准的任务交给商家来完成,b i z t a l k 本身只提供注册与交互的框架,这样商 业伙伴在交互过程中十分灵活。 表卜1 数据交换标准的比较 e d ir o s e t t e n e te b x m lc n x m lb i z t a l k 商务数据字典没有有有有没有 商务流程定义没有严格定义明确定义定义没有 贸易伙伴关系严格定未明确定义明确定义未明确未明确 义定义定义 通信协议固定不依赖不依赖不依赖不依赖 基于) ( m l否是是是是 表卜1 是几种数据交换标准的比较,从表中来看,根据对商业实体的定 义和对商业流程定义的严格性,将上述商业标准分成两类:第一类是有严格 定义的,包括e d i ,r o s e t t e n e t :第二类是未定义的,这包括b i z t a l m 而 e b x m l 和c n x m l 虽然有定义,但是他们所提供的传输和商业信息实体分离的 机制并不要求商业伙伴严格按照定义来执行,可以说是介于两者之间。第一 类由于其规范性,参与者之间交互的成本大大降低,但是使现有系统与之兼 容需要的额外开发成本较高,如果n 个企业之间建立完成的数据交换网络, 那么需要定义n 种翻译器;第二类的灵活性是显而易见的,但是这往往要求 有个公共注册机构,而且商家两两之间的交易模式和数据格式的转换都需 要自行定义,如果在个企业之间建立完整的数据交换网络,那么需要定义g 2 种翻译器。 西南交通大学硕士研究生学位论文第8 页 1 3 论文研究的意义 1 3 1 数据交换技术的应用 在当前的信息时代,企业在如下方面有大量的需求: 1 ) 与合作伙伴的企业信息系统的集成,使得合作的响应度得以提升,协 同成本降低,例如供应链方面,使上下游企业之间可以进行及时的信息交互 与资源共享; 2 ) 企业内部系统的集成,使得内部的协同工作真正实现; 3 ) 大型客户与企业客户系统的对接,提高大型客户的满意度,降低服务 成本。 数据交换是满足上述需求,实现企业内部不同的应用系统之间的集成以 及企业之间的电子商务活动的一种简单可行的方案。 数据交换系统的主要应用范围为: 1 ) 企业内部的信息系统集成:用以实现企业内不同应用软件,不同部门 之间的电子数据交换。把企业内以部门、业务为核心的闭环信息系统联系起 来,形成更大更有效率的有机整体。提高数据的时效性、真实性、广泛性和 使用效率。从而提升企业信息、系统的效益。应用软件开发商和系统集成商 将不必过多的考虑软件之间的数据交换问题,可以专注于商业逻辑的开发。 2 ) 建立企业电子数据港( 数据交换中心) :用通用数据交换技术构建企 业的电子数据港,就如同建立了企业自己的数据交换中心。直接对外发布和 接收电子数据,使企业大大提高与商业伙伴之间的数据沟通能力和内部运作 效率。 3 ) 远程数据各份和数据同步:使用通用数据交换技术可以实现异地数据 备份或数据同步,而不必顾忌数据来自什么地方,使用什么计算机系统,来 源于何种数据库。 4 ) 企业b 2 b 应用集成:使用通用数据交换技术可以使企业迅速实现b 2 b 应用集成。加快商务流程的速度,拓宽商业覆盖面,加强和上下游供应商和 经销商的合作和交流,更好的进行客户关系管理。 西南交通大学硕士研究生学位论文第9 页 1 3 2 数据交换面临的问题 如前所述,目前已知的数据交换方案大都存在一定的缺陷: 1 ) 平台的兼容性:目前大多数解决方案的实现多依赖于某一单一平台, 他们或需要”v e 的运行环境,或需要w i n d o w s 系统的支持,当然,也有很多 能实现跨平台交互的方案,但他们为屏蔽网络硬件平台的差异性和操作系统 与网络协议的异构性,对参与交换的双方在实施上都采取了一定的限制。这 些方案包括中间件技术、分布对象技术等,这些方案在实现上有大难度,对 程序设计者、系统的软硬件条件、交换双方的数据结构有较高的要求。 2 ) 数据格式的一致性:很多解决方案对交互的参与者的数据格式都有严 格的要求,这样虽然使交互的成本大大降低,但也降低了通用性,使用户为 满足规定的数据格式而不得不改变自己的企业内部数据规范,从而造成企业 相关业务的修改;那些没有严格要求数据格式的解决方案也多要求用户在交 互时将所用数据格式向服务中心注册,然后由交互的双方彼此发现并互相彼 配,当其中一方的数据格式发生变化时又会再次进行上述发现和彼配过程, 这些重复的操作降低了企业间信息沟通的灵活性。 3 ) 数据交换类型的多样性:目前大多数据交换方案都是针对某一具体应 用来实现,它们只能满足企业在某一种或某一类数据上的交换,而当企业想 在其它方面交互的时候,必须为它专门做新的设计。数据交换的灵活性和通 用性很低。 4 ) 内部业务逻辑改变后的适应性:随着企业信息化、国际化的深入,企 业的业务逻辑也在不断发生变化,很多企业在设计内部管理系统时要求能根 据工作流程的改变而动态改变系统的实现逻辑,比如说引入工作流技术来实 现业务流程的动态重组,对于数据交换,业务流程的变化,意味着数据交换 的内容、格式、对象以及数据交换接口的改变,这些改变对很多数据交换解 决方案来说,需要变更对应的实现逻辑,包括其对应的接口实现、数据格式 定义、数据转换的方法以及其它有关的逻辑功能,很少有解决方案做到对企 业业务逻辑的动态自动适应。 5 ) 跨越企业防火墙的方便性:现在大多数企业为保护企业内部系统的安 全性,都使用了防火墙来防止有敌意的外部数据进入。企业之间要进行数据 交换,如何通过防火墙而不更改企业的安全措施是一个难题,大多数数据传 西南交通大学硕士研究生学位论文第1 0 页 输方案都要求对防火墙做一定的配置( 如开放特定的端口) 以允许数据的进 入,而这样也同时降低了企业的安全性。 6 ) 参与交换的成本:目前大多数交换方案的实现成本都很高,他们或者 要求程序员有较高的编程能力,或者要求企业的业务逻辑必须满足一定条件, 或者要求企业向实现交换的服务提供商缴纳较高的费用。 综上所述,目前的数据交换方案其灵活性、通用性都很低,而且刘参与 者都有或多或少的限制。理想的交换方案应该是与平台无关、对企业的数据 格式没有限制、能动态识别企业数据格式的改变、不降低企业的安全措施、 并且是一个开放的、低成本的解决方案。 1 4 本论文研究的主要内容 本论文针对目前企业数据交换的现状和需求,在国家8 6 3 计划项目“区 域协同电子商务”( 2 0 0 2 a a 4 1 3 6 2 0 ) 的资助下,研究并设计一个通用的异构数 据交换系统,该系统应满足如下要求: 1 ) 与平台无关,能兼容企业所用的大多数软硬件平台,以及各种数据库 平台,屏蔽网络、操作系统、数据库、应用系统等软硬平台的差异,使企业 通过异构数据交换系统实现无缝的、透明的交换数据; 2 ) 对企业的数据格式无限制,企业可以根据自己需要灵活的选择数据格 式,企业不需要注册自己的数据格式和识别合作方的数据格式,所有任务包 括格式识别、格式转换和交换双方的通道建立由异构数据交换系统自身完成: 3 ) 动态适应企业的数据格式和数据类型的改变,为交换双方自动建立适 配系统并建立交互通道,当企业改变数据格式和增加新的数据类型时,异构 数据交换系统自动识别这种改变并自动修改相应的实现逻辑,一方数据格式 和数据类型的改变不会对参与交换的另一方( 或几方) 产生任何改变,所有 的差异都由异构数据交换系统来消除; 4 ) 方便的通过企业防火墙而不改变企业的安全策略,理想的情况是通过 一些公共的传输通道或端口来传输数据,如h t t p :8 0 等一般防火墙不会阻止 的信道,当然在这些公用通道上传输数据时要考虑资源的占用和传输的安全 性; 5 ) 足够的安全性:包括数据传输的安全、数据存储的安全以及良好数据 西南交通大学硕士研究生学位论文第1 1 页 备份和恢复策略: 6 ) 对企业的软硬件环境没有太高的要求。 本论文的研究内容主要有: 1 ) 深入研究目前学术界和工业界就异构数据交换这一课题己有的成果; 2 ) 从理论的角度,分析比较各种交换技术以及可用于数据交换的技术的 优势和不足,提出一个具有充分通用性、灵活性的数据交换解决方案,并分 析和设计其系统框架; 3 ) 论证基于微软的n e t 框架开发该数据交换系统的可行性,以及与其 它相关技术相比,采用n e t 框架技术的优越性以及其存在的缺点和可行的 解决方案。 4 ) 根据提出的数据交换框架,分析、设计并实现一个通用的数据交换系 统。 本论文拟解决的关键技术问题有: 1 ) 如何屏蔽各种异构数据源的差异,保证数据具有统一的格式; 2 ) 如何正确识别采用各种格式封装的数据,并且把这些数据正确的转换 为标准的格式; 3 ) 如何动态识别数据格式的改变,并修改其对应的交换逻辑; 4 ) 如何封装数据以及通过网络正确的发送,如何实时在发送方和接收方 之间交互信息; 5 ) 如何对进行身份验证以及如何确保数据传输的安全性; 1 5 小结 本章首先介绍了目前企业对数据交换的需求以及数据交换的现状,分析 了现在数据交换技术的特点和分类,接着介绍了数据交换技术在企业中的应 用以及数据交换所面临的问题,它们存在的缺点,并提出了论文所研究的数 据交换解决方案应该俱各的特点,最后简要讨论了论文要进行的主要工作。 西南交通大学硕士研究生学位论文鼙1 2 页 第2 章数据交换相关技术 本章讨论x m l 、w e b 服务等相关技术,为设计和实现通用数据交换系统做 好理论铺垫。 2 1 x m l 及相关技术 x m l ( e x t e n s i b l e m a r k u pl a n g u a g e ) 是目前全球范围内描述数据和交换 数据的一种标准的方式。其应用范围从早先的w e b 信息描述,发展到后来的 数据交换的开发标准,乃至目前的服务集成和服务交互的开发技术。 x m l ”j 是e x t e n s i b l em a r k u pl a n g u a g e ( 可扩展标的置标语言) 的缩写, 是w 3 c 组织于1 9 9 8 年2 月发布的标准。w 3 c 组织制定x m l 标准的初衷是,定 义一种互联网上数据交换的标准。w 3 c 采取了简化s g m l 的策略,在s g m l 基 础上,去掉语法定义部分,适当简化d t d 部分,并增加了部分互联网的特殊 部分。因此,删l 也是一种置标语言,基本上是s g m l 的一个子集。因为x m l 是一种树状结构,可以把形式与内容彻底分离,正是基于这个原因,可以使 用x m l 将不同数据格式的数据进行转换,从而达到数据交换的目的。 2 1 1 x m l 产生的背景 x m l 同h t m l 一样,都来自s t a n d a r dg e n e r a l i z e dm a r k u pl a n g u a g e ,即 标准通用标记语言,简称s g m l ,它包含了一系列的文档类型定义( 简称d t d ) , 因而s g m l 语法是可扩展的。s g m l 十分庞大,既不容易学,又不容易用,在 计算机上实现也十分困难。鉴于此,w e b 的发明者提出了x m l 语言。 x m l 和h t m l 有着本质的区别。具体的说,就是x m l 比h t m l 提供了更多 的对于内容和结构的说明和限制机制,使得存储、查询、管理x m l 文档相对 而言更容易。) i 3 v l l 提供了一个简单又灵活的标准格式,为基于w e b 的应用程 序提供了一个描述数据和交换数据的有效手段。i i t m l 描述了显示全球数据的 通用方法,而x m l 提供了直接描述处理全球数据的通用方法。 西南交通大学硕士研究生学位论交雾1 3 页 2 ,1 2 x m l 的优势 1 x m l 的特点 i ) 跨平台性:x m l 是经过检验的国际标准,使用文本来保存数据,而不 是使用二进锦4 格式,匿此对应跨平台的交换数据是十分方便的。 2 ) 自描述性:这个特性使差异性可以存在,使计算机可以在没有人为 干涉的情况下,理解数据的含义。 3 ) 可扩展性:文档通过d t d 或s c h e m a 来定义文档结构,使其他信息系 统自动了解文档的内容。 4 ) 可效验性:用户可以通过d t d 或s c h e m a 来效验x m l 文档的格式是否 满足d t d 或s c h e m a 的约束。 5 ) 层次结构:能够保证信息的层次性描述。 6 ) 电子商务应用:在这个领域中,x m l 一般承担了以往e d i 所承担的角 色,人们依靠x m l 来描述交换商务事务信息,实现分布式的电子商务应用的 交互。 7 ) 数据层集成:对于当代电子商务而言,商务数据的交换是应用的关 键环节,随着在电子商务应用中商务信息交换的应用模式不断为主流应用开 发所接受,面向通用领域的数据集成数据交换应用也成为了一个重要的x m l 应用领域。 8 ) 应用层集成:当x m l 在经历了电子商务应用的经验之后,人们逐渐 地不仅在数据层上完成应用系统的连接,同时希望能在业务层或者函数层上 完成系统的互联,这也就是人们常说的i n t e r n e t 环境的应用的广泛互联,这 方面的技术主要是以x m l 为技术基础的w e bs e r v i c e s 系列技术。 2 x m l 应用于数据交换的优点 1 ) x m l 具有内容和形式分离,良好的可扩展性,良好的跨平台移植性和 良好的自描述性等优点,它适合动态电子商务系统发展的需求。 2 ) 对结构良好的表示能力:在进行数据交换时,由于源数据和目标数 据在结构上可能存在差异,并且如果具有多个数据来源时,不同的数据源可 能是由不同的数据模式构成。如关系型、对象型、文本文件、w e b 页面,以 及一些遗留系统中的数据等,不同数据的表现形式不一样。即使对同种模式 的数据来说,也存在数据结构和表现形式上的差异。如,源数据由多个关系 西南交通大学硕士研究生学位论文第1 4 页 型数据库构成。对同一现实世界对象来说,在不同数据库中的概念模式不 样。例如,职工的基本信息在一个数据库中用一个实体表示,但在另一个数 据库中可能用多个实体表示。这些结构上的差异也会导致数据交换中的困难。 因而,在实际交换过程中,首先必须将数据模式进行统一,将异构的数据模 式统一为一个公共的、一致的数据模式。x g l 具有灵活的数据结构的表示能 力。利用x m l 建立一个异构数据的统一模式,使得用户在进行数据交换时, 只需要将一个由脚l 描述的模式转换成目标模式即可。这样,利用x m l 作为 中间模式,就减少了不同模式之间进行转换的工作量。通常,可以用d t d 或 x m ls c h e m a 来定义x m l 文档的结构。 3 ) 对数据的表示能力:x m l 文档从本质上来讲是一种树形结构。x m l 由 嵌套的带有标记的元素构成。每个元素实际上为树中的一个结点。对x m l 文 档中的某个元素来说,可以存在若干属性,属性可以用来描述元素的相关信 息。可以通过对树的遍历来获取整个x m l 文档所包含的数据,也可方便的查 找某一个或几个指定节点。 4 ) 对语义的表示能力:对一种数据类型,可以用属性对其进行多方面 的描述。如名称、数据类型、单位、格式等,所以x ! 1 4 l 可通过增亩日元素的属 性来加强数据的语义表示能力。 5 ) 异构应用间的数据共享:x m l 的灵活,扩展性以及自我描述等特性, 使异构应用间的数据共享成为可能。 6 ) 不同来源数据集成:x m l 能够将不同来源的结构化数据结合在一起, 通过在中间层的服务器上对从后端数据库和其他应用程序处来的数据进行集 成。 2 1 3x m l 相关技术 1 数据结构的表示 d t d :文档类型定义( d o c u m e n tt y p ed e f i n i t i o n ) 定义了带有有效 元素列表的x m l 文档结构。它可以在x m l 文档内部声明,也可以作为外部引 用。它定义了能够在x m l 文档中的元素和属性,但它不能定义关于数据类型 的差别,例如,d t d 不能声明元素必须包含一个有效的数据、数字类型或有 效的u r l 字段,它只能声明元素必须包含文本,但不能控制文本类型。而且, 它使用与x m l 不同的语法描述,这是因为d t d 是在x m l 出现前首先从s g m l 西南交通大学硕士研究生学位论文第1 5 页 中发展而来的。 2 x m l 文档的处理 d o m :文档对象模型( d o m ,d o c u m e n to b j e c tm o d e l ) 是h t m l 和x m l 文档的编程接口规范,它与平台和语言无关的,因此可以用各种语言在各种 平台上实现。利用d o m 规范,可以实现d o m 文档和x m l 之间的相互转换,遍 历、操纵相应的d o m 文档的内容,d o m 文档中的逻辑结构可以用节点树的形 式进行表述。 s a x :用于x m l 的简单的a p i ( s i m p l ea p if o rx m l ) ,它并不是由w 3 c 官方所提出的标准,可以说是社区性质的讨论产物。但几乎所有的解析器都 支持它,几乎所有的d o m 解析器都是在s a x 解析器的基础上构建起来的。与 d o m 比较而言,s a x 是一种轻量型的方法,s a x 在概念上与d o m 完全不同。它 不同于d o m 的文档驱动,它是事件驱动的,它并不需要读入整个文档。所谓 的事件驱动,是指一种基于回调( c a l i b a c k ) 机制的程序运行方法。 3 ) m l 的转换和定位技术 x s l t :可扩展样式语言转换( e x t e n s i b l es t y l e s h e e tl a n g u a g e t r a n s f o r m a t i o n s ) ,x s l t 是一种声明性编程语言,它最初起源于x s l ( e x t e n s i b l es t y l e s h e e tl a n g u a g e ) ,它基于x m l 的语言,用于把x m l 文档 转换成其它格式,如用于w e b 显示的h t 札、用于在w a p 设备上显示的w 札、 另一种x m l 文档以及标准语言或纯文本。 x p a t h :x p a t h 用于遍历x m l 树结构,其名称源于它被用作在x m l 文 档能表达为节点组成的树,所以x p a t h 允许使用紧凑的、非x m l 的语法来选 择一个或一组节点,它为x s l t 和) ( p o i n t e r 中的功能提供了一种通用语法和 语义,是一种重要的) ( m l 技术。x p a t h 操作于x m l 文档的层次树形结构之上, 而不是它的基于标记的语法,它有能区别不同类型的节点,包括元素节点、 属性节点和文本节点。 x q u e r y :x q u e r y ( x m l 查询语言) 是用于定位和过滤x m l 文档中元素 和文本的查询语言。它是x s l 模式语法的自然扩展,为指向特定的元素或查 找具有指定特征的节点提供了简明
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年高端咖啡馆全国分店经营管理合作协议
- 2025年养老机构垃圾分类及环保设施采购与施工综合服务合同
- 2025年度高端家政服务及育儿指导合同范本
- 2025年企业速记服务保密协议范本
- 2025年度高端医疗设施深度清洁消毒及保养服务合同
- 2025年环保指标达标绿色建筑材料采购合同与责任规定
- 2025年大型购物中心内部装修改造工程合同规范
- 2025年生态农业产业链鸡舍管理员综合能力培养协议
- 海上日出课件淘宝
- 2025年国际物流运输行政协调与保障服务协议
- 2025年秋季新学期教学工作会议上校长讲话:扎根课堂、走近学生、做实教学-每一节课都值得全力以赴
- 2025年度船舶抵押贷款合同范本:航运融资与风险规避手册
- 2025年新人教版小升初分班考试数学试卷
- 2025劳动合同范本【模板下载】
- 以课程标准为导向:上海市初中信息科技教学设计的探索与实践
- 2025年公共基础知识考试试题(附完整答案)
- 北川羌族自治县农业农村局北川羌族自治县测雨雷达建设项目环评报告
- 2025社区工作者必考试题库(含答案)
- 友邦资讯面试题目及答案
- 2025年山东青岛海关缉私局辅警招聘考试笔试试卷【附答案】
- 飞灰处置再生资源化利用项目可行性研究报告模板-立项备案
评论
0/150
提交评论