




已阅读5页,还剩62页未读, 继续免费阅读
(计算机应用技术专业论文)基于xml数据安全交换研究及实现.pdf.pdf 免费下载
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
摘要 摘要 随着世界经济全球化和一体化的发展,电子数据交换已成为企业参与贸易竞 争的重要手段。传统的e d i 交换方式的技术复杂及费用要求过高等诸多不利因素, 使得在中小企业中实施起来比较困难。x m l 以其高度结构化和跨平台等诸多优势, 解决了以前数据交换中许多棘手的问题。做为一种好的数据交换中介格式,x m l 正成为企业内部或企业间交换数据的首选。不过由于x m l 是纯文本文件,且文件 本身也过于臃肿使得x m l 文件在传输过程中的安全性和传输效率方面值得重点 关注。在目前国内x m l 应用正在兴起,数据交换标准不统一的条件下,本系统对 于企业内部或企业间方便、安全、高效地交换数据提供了一定的理论依据和现实 意义。 本文首先对数据交换的发展进行了讨论,并分析了l 的安全性问题。接着 简述了x m l 语言本身,论述了x m l 安全的基本原理,包括x m l 加密和签名。 然后通过x m l 与关系数据库之间的关系,解决了) 湖l 数据交换前后x m l 与数 据库之间相互转换问题。然后,设计出基于x m l 的数据安全交换系统,包括系统 公共模块设计、数据发送方设计和数据接收方设计等;研究和提出了从数据发送到 数据接收、保存和应用等整个交换过程中的需要各种安全措施,确保x m l 数据传 输的绝对安全,并以n e t 这一核心技术对交换系统中的关键部分应用进行实现。 最后对本系统进行了总结,并提出了在今后一段的时间内,所需进一步研究的工 作和方向。 关键字:数据交换安全性x m l 加密x m l 数字签名 a b s t r a c t a b s t r a c t w i t ht h ed e v e l o p m e n to fe c o n o m i cg i o b a l i z a t i o 玛e l e d t o n i cd a t ae x c h a n g eh 雏b e c o m e m o r ea n dm o r ei i n p o r t a n ta sap a no f t h et r a d ec o m p e t i t i o n h o w e v e r ,b o t ht r a d i t i o n a l e d it e c h n j q u ew a sm o r ec o m p l i c a t e da i l dj t sc o s tw a s m o r ee x p e n s i v e ,“w a sh a r d e rt o n l ni n t om e d i 岫一s i z e da n ds m a u s c a l ee n t e r p f i s e a c r d i n gt 0a d v a n t a g e s o f c r o s s p l a t f o 咖a n dm o r cs t m c t u r e d ,x m ls o l v e dp r e v i o u s l yd i f f i c t l l tp r o b l 锄i nd a t a c x c h 柚g e a sag o o df o 册a to fd a t ae x c h a n g e ,x m lh 勰b e e nt h ef i r s ti nd a t ae x c h a l l g c b u t ,d u et ox m l i saf i l eo fp l a i nt e x ta i l do v e r b u l k y j ta 恐c t ss a f e t ya n de f ! e i c i e n c y0 f m m s f e r s 勰p e dd u 血gt h et r a n s f c rp e r i o d i t sw o r t h yt 0b e n c c m e d hc u e n ty e a r s , “li sc o m 抽go nt o 印p l yi nc h j n a u n d c rt h ed i 尬r c n ts t a l l d a r d so fd a t ae x c h 卸g e , t b es y s t e mp r o v i d e sd e f i n e p r i n c i p l e s i n p r a c t i c ew h 即d a t a 眈c h a n g ci ss a f e t y c o n v e n i e n ta i l de 缅d e n ti n 锄e n t e r p r i s eo r 锄o n gm o r ce n t e i p r i s 器 f i r s “y ,w ed i s c i l s s e dt l l ed c v e l o p m e to fd a t ae x c h a j l g e 柚d 觚a l y z c ds c c i l r i t yp r o b l e m o fx m ls e n d ly w ei n t r o d u c e dx m ll a n g i l a g c 如dd i s c u s s e dt h eb a s i cp 血c i p l c so f s e c i l r i t yo fx m l n e p r i n c j p l e si n d u d et h a tx m le n 哪t j o na n ds i 印a t u r c 皿i r d ly v i at h er ;e l a t i o n s h i pb c t 、v e c nx m la n dr e l c v a n td a t a b a ( r d b ) ,、es o l v e dt h e c o n v c r s i p - 0 b l c mb e 晰c e nx m l 锄dr d b f 0 u r t l l l y ,w ed e s i 印e da s e c u r es y s t e mo f d a t ae x c b 粕g eb a s eo nx m lt h es y s t e mi n d u d e sp u b l i cm o d u l e s ,s c n d i n gm o d u l e s 卸d r c c e i v i n gm o d u l e s w er e s e a r c h e d 卸dp r o “d e dv a r i o u s l y 鼢f 文ys 0 l u t i o n sf b r t h ew h o l e d a t ec x c h 柚g cp r o c e s s 加di n s u r e dx m l 胁s f e rw l l i c hi sa b s o l u t es c c u r i t y 卸d t a l ( i n g n e tt e 吐m i q u et 0a c h j e v ca p p l i c a t i o ni n t h ek e yp a n0 fe x c h 卸g cs y s t e m f i i l a l l y t b et l l e s i ss u m m a r i z e dt h i ss y s t e m 卸di d i c a t e dt h er e s e a r c hd i r e d j o n s 柚d p r o b l e m sd u r i n gt h ef i l t u r ew o r l 【s k e y w o r d :d a t ae x c h a n g e s e c u r i t y x m l e n c r ”t j o n x m l d i g i t a ls j 印a t u r c 独创性( 或创新性) 声明 本人声明所呈交的论文是我个人在导师的指导下进行的研究工作及所取得的 研究成果。尽我所知,除了文中特别加以标注和致谢中所罗列的内容以外,论文 中不包含其它人已发表或撰写过的研究成果;也不包含为获得西安电子科技大学 或其它教育机构的学位或证书而使用过的材料。与我一同工作的同志为本研究所 做的任何贡献均己在论文中做了明确的说明并表示了谢意。 申请学位论文与资料若有不实之处,本人承担一切相关责任。 本人签名选迦日期 口7 歹;口 关于论文使用授权的说明 本人完全了解西安电子科技大学有关保留和使用学位论文的规定,即:研究生 在校攻读学位论文期间论文工作的知识产权单位属西安电子科技大学。本人保证 毕业离校后,发表论文或使用论文工作成果时署名单位仍然为西安电子科技大学。 学校有权保留送交论文的复印件,允许查阅和借阅论文;学校可以公布论文的全 部或部分内容,可以允许采用影印、缩印、或其它复制手段保存论文。( 保密的论 文在解密后遵守此规定) 。 日期:里2 :! :! ! 醐:导也 鹂瓯 锑珥 徘獬枞翩 绪论 第一章绪论 1 1 研究背景 随着i n t e r n e t 技术的出现和发展,信息化建设在我国大力发展。目前,电子政务经常 面临信息孤岛问题,各业务系统间的互联互通,信息共享,业务协同是电子政务深入发展 最迫切需要解决的问题。解决这些问题的关键在于如何在各系统问进行有效安全的数据交 换。 在数据交换领域中,没有标准的部落式交换的代价是高昂的,相同的数据分析处理模 块在很多应用中被重复地撰写,可能只是为了将某数据源的数据转换槲不同的目标 数据源中去。 由于没有中间标准,各个系统的实现 员也几乎没有可能将代码重用,昂贵的数据交 换代价使得数据源只能散乱孤立地存在。前面描述的这状况在) 函j 出现之前,在绝大多 数的应用领域里都是如此,即使在某些局部领域,如传统的电子商务领域,有即i 这么一 种商务信息的交换标准,可是在更广泛一点的领域,仍然没有个全域统一的交换体系。 而) m 几作为种数据格式描述的元语言标准,从出现以后,就不断地被应用至恪种不同的 数据交换领域中去。然而,基于札的数据交换更需要种健壮的安全机制来保障。 1 传统即i 传统的团i 佃。c n o n i cd a t am 【e i c h a l l j 耐( 对应于个公司与其多家子公司、或一个公 司与国内外其它公司、或行业内外) :采用一对一的数据接口定制机制。般是通过专用网 络或增值网络( 实现的,并且需要同商业伙伴达成致意见,然后改造现有的系统,购 买或开发相应的转换软件,需要较为昂贵的费用,因此直难以广泛普及。其面l 临的另一 个问题是:它基于严格的事务处理的标准集,这些事务标准集不仅描述了商务数据的表示 形式,而且也规定了数据的处理方式,而缺乏必要的灵活性,很难满足各个企i k 内部独特 的数据处理方式的需要。传统回i 诞生在七十年代,是与当时那种大型机的集中事务处理 的环境相适应的,随着时间的发展和环境的变化,已经越来越不能适应现代商务发展的需 要,因i 比也就! 燃会逐渐被新型e d i 所取代。 图卜1 展示了个典型传统交换网络的拓扑结构,中继节点完成数据的传输交换,由 它们组成的通信网络是数据网络的基本通信设施,为用户节点进行业务处理所需要的各种 数扼提供了交互基础。 基于x m l 的数据安全交换研究与实现 图卜1 传统田i 的结构 2 霄e be d i 随着互联网的迅速普及,出现了利用廉价的互联网代替昂贵的专用网络进行电子数据 传输的新型e d i 方式一w e b 四i 。在w e b 即i 中,e b 是田i 消息的接口。典型情况下,由 较大的公司针对每个即i 信息开发或购买相应的w e b 表单,然后把他们放在w e b 站点上, 此时,表单就成为了印i 系统的接口。较大公司的合作伙伴( 般为较小的公司) ,登陆到 w e b 站点上,选择f 电1 | 、 所感兴趣的表单,填写后并提交给w 曲服务器,服务器端程序将把 这些表单变成通常的团i 消息,此后消息的处理就与传统的皿i 消息处理样了。很明显, 这种解决方案对中小企业来说是负担得起的,只需要个浏览器和i n t e n e t 连接就可完 成,皿i 软件和映射的费用则花在服务器端。但是这种即i 交换是不对称的:大公司方承 担所有实现印i 的费用,于是,它可以享受团i 带来的全部好处;而另方中小企业,w e b 即1 只能让他们负担得起匕印i 的费用,只是参与了交换,与实现印i 方( 较大的公司) 是不对 等的关系。并且由于数据的传输路径是w e b 服务器一浏览器或者浏览器一w e b 服务器浏 览器,数据是最后发布在浏览器上,供人们阅读和理解,侧重于信息对人的可理解性,因 此数据表现被提到一个重要的地位,数据的结构化显得较为次要一些,数据显示的载体 h 1 讥语言是种固定格式的语言,难以扩展,不能满足电子商务内容和活动发展而带来的 多类型数据处理的需要。 3 基于几的i n t e r n e t 四i 可扩展标记语言儿的产生引发了互联网的一次革命,在印i 领域则出现了基于) 函几 绪论 的i n t e r n e te d i 。与w e b 吨d i 则不同,) a 皿j e d i 能让所有的参与者都能从印i 中得到好处。 ) 叫。是可扩展的的标记语言,它提供了一个标准,利用这个标准,人们可以根据商务活动 的需要用几来描述类型多样而数据种类复杂的商业信息并交换,对基于i n t e r n e t 的商业 数据交换具有更强的实用意义。当今的计算机世界中,不同企业、不同的数据库软件之间 传输信息,不得不使用些特殊的软件,非常不便。) 叫。便于不同系统之间信息的传输, 不但简单易读,而且可以标注各种文字、图像甚至二进制文件,只要有) n 儿处理工具,就 可以轻松地读取并利用这些数据。因此) o 几e d i 成为新型的数据交换模式。删聊能 让所有的参与者都能从e d i 中得到好处,它是对称的倒。如下图示: = 一 啊 岜蕊哆 l 图ll 图1l 图l l 型丛i f 企业旦一ji 垂业e 图l - 2 基于瑚。的i n t e 玎l e t 印i 结构 通过联合x m l 。i n t e r n e t 和基于i n t e r n e t 的安全服务就可以拥有个完整的新型e d i 解决方案:) 衄。提供了灵活性、可扩展性和结构化的消息格式,i n t e r n e t 提供了低价普遍 的传输方式,i n t e r t l e t 安全眼务提供了私密性、完整性、身份验证等功能,所有这些结合 起来导致了皿i 的场革命。不是强迫公司的系统和业务处理去适应四i 数据,相反数据 可以动态地适应公司己有的系统。印i 将不再限于某些行业和大型企业了,它将和电子邮 件样普遍,中小企业也可以轻易享受印i 的好处。 1 1 2 x m l 的安全问题 儿带给人们更加方便显示、交换和存储数据的同时,自身也存在着很大的安全隐患, 在执行数据交换时它时是种相当不安全的技术。) 0 几文件是一种文本文件,为了确保数 据能眵安全的网络上传输,全部数据对象以及通信翎舌本身都要保证安全。企业之间要进 行安全的数据交换必须满足下面n 个条件“: ( 1 ) 企业交换数据的双方必修确定对方的真实身份,即不可否认性; ( 2 ) 企业之间相互交换的数据不能被第三方所看到,既保密性; 4 基于x m l 的数据安全交换研究与实现 ( 3 ) 企业之问交换的数据必须证实没有被修改过,既完整性。 在目前可行的密码技术保障体系中,有两种可行的解决方案来实现企业之问的数据交 换。种是利用内置在传输格式中的自动加密技术,如s s l ( 安全套接层) 、t l s 和i p s e c 。 基于h 丌p 的s s l 是其中较流行的技术方案。s s l 协议位于亿p 层和应用层之间,它能对各 种文档进行加密,但是胛t p s 仅能对整条消息进行加密,对于企业间灵活的、有选择的加 密所交换的数据来说,就显的不够灵活和浪费。而目还有一个缺点就是在传输过程中每一 个目的地时,它都会重新解密,在重新加密传输之前可能会受到威胁,且提供的加密紧紧 在传输过程中存在,不能长时间保存。在通信的服务端经常也要利用硬件加速器,来加快 s s l 的请求响应,也就对硬件提出了更高的要求。另种方案就是在企业交换的数据在传 输前,经i 丑= 应用层的加密处理,其有点是可以灵活有选择的对数据加密,对硬件的要求也 比较低。其缺点是用户可能忽视某些机密数据的加密,且对于某些攻击不能有效的进行保 护。所以,针对以) 弧。为传输媒介的安全问题,w 3 c 组织特别制定了儿数字签名推荐标 准和也加密草案。具体内容将在第三章中详细介绍。 ) 珊儿技术所具有的可以集成不同的数据源、数据的多样显示、数据的本地计算和处理、 数据的粒状更新和数据与表现形式的分离等众多有点使它得到了广泛的应用。目前,在信 息交换过程中,主要有四种攻击方式“,信息拦截( h i 胁u p d ) 、信息截获( b t c r 叫) 、 信息修改( m 0 d i 6 c 撕0 n ) 、信息伪造( f 曲d 曲n ) 等四种方式。而传输县安全性( t b r 娜叫 l a y c r s c a l 衄( 1 1 5 ) ) 是因特网上安全通信的事实标准,它是个非常安全可靠的协议, 它提供了通信双方之间端到端的安全l 生翎舌,但是它在加密交换数据的部分和多方之间 的安全翎舌方面有着明显的不足,沮。加密的出现弥补了这一重要领域。使用皿,加密, 每方都可以保持与任何通信方的安全或非安全状态,也就是说可以在同文档中交换安 全的和非安全的数据。使用) 珊几加密,可以对整个文肖进行加密、可以对儿文件中元 素进行加密和) 儿文件中元素内容进行加密,这样使基于) m 几文件传输的数据中有着 更灵活的安全机制。另种保障) 帆。文件安全性的方法就是捌l 数字签名( d i 酬啦脚) , ) 函几数字签名是对现有的数字签名的扩展,是在它的周围建立些结构,使其用咀。进 行签名,也可以对相同的几文档的不同部分使用多于种的数字签名。这样就可以使信 息在交换过程中保证数据的保密性、真实性、完整性和不可否认性,从而使通信双方都能 顺利进行。 绪论 1 2 研究内容及意义 本文将重点研究和探讨以下几方面的内容: ( 1 ) ) 帆。文档的数据交换 当今,两个企业或实体间不可避免要相互交换数据,这可能要涉及到不同数据源之间 的相互转换,不同的数据源之间存在很大的差异,这在以前,是很复杂困难的。) 叽。的出 现解决了这一难题,企业内或企业间通过标准的约定,通信双方之间交换数据,通过对) 帆。 文档进行压缩,提高网络传输效率。 ( 2 ) 也文档的安全性 在这个开放的互联网上,各种安全漏洞,病毒、黑客的威胁,使的通过网络传输的数 据都要保证其安全。札是文本文件,更易受至蜉0 击,目前对于瑚。文档来说,可以通过 w 3 c 推出的儿加密和) 函l 签名来确保我们收到的瑚。文件的真实性、机密性、完整性和 不可否认性。通过实例来说明和探讨整个数据交换过程中的一些安全问题,如身份验证、 加密、签名和保存等过程。 本文通过】伽。文件在传输过程中安全性( ) 叽,加密和数字签名) 等重要属性的研究,使 得在企业内部,可以定义统一的数据交换标准,实现企业各部门或应用系统之间的数据交 换:在企业之间,可以定义种简单对等的体系结构,交换数据的双方把数据交换的具体 工作交由双方的数据交决系统来完成,构造种简单、安全、易扩展和易维护的安全交换 系统,使) 函几在数据交换中得到更广泛的应用。 数据交换的理论分析 7 第二章数据交换的理论分析 本章重点讨论数据交换的相关理论,给出企业内部和企业之间的数据交换的概 念和体系结构。 2 1 数据交换的概念 数据在不同的信息实体之间交互的过程称为数据交换。根据参与交换的信息 实体不同,数据交换可以分为个人数据交换,企业数据交换和政府( 组织) 数据交 换。不管是哪一类数据交换,信息实体之间的信息交互过程都无一例外的划分为 三个阶段,即数据生成、数据传输和数据处理。不同之处在于,各种信息实体在 每个阶段有各自的需求和规范,因而具体使用的技术和工作流程有很大差别。总 的来说,个人数据交换的灵活性最高而可靠性最低,而政府数据交换和企业数据 交换则需要可靠性高而灵活性相对较低。 具体来说企业数据交换的数据内容以及格式相对固定,数据交换的业务流程 比较规范。同时企业数据交换对数据交换过程的可靠性与安全性要求较高。 当前的企业数据交换,根据其应用范围和特点大致可分为企业内部数据交换 和企业之间的数据交换。企业内部数据交换的数据格式比较单一,业务流程固定, 数据交换的架构相对紧凑,有较高的祸合度和数据交换效率。企业之间数据交换 的数据格式繁杂,数据交换的架构相对松散,耦合度低,数据交换效率也相对较 低”。 2 1 1 企业内部数据交换 一个企业内部的信息系统构成是根据自己企业的业务特点和需求构建起来 的,如果业务和功能结构比较单一,企业往往使用单一的信息系统来完成所有的 工作,这样做的好处是信息系统完全自包,即无需和其他信息系统进行数据交互。 因此内部数据的交换格式简单统一,数据交换效率非常高,一般可以实时完成各 科业务。但是单一系统不易扩展,当出现涉及到与系统外信息实体数据交互时, 往往需要手工完成。如中小型商业的进销存系统,商品的订货仍需要通过电话或 传真交换数据以后手工录入到计算机系统中。 中型或大型的企业的信息系统多由多个信息系统构成,如大型商业企业的财 务、进销存、统计、客户管理等等往往都是独立的系统,并且很有可能这些系统 由不同的软件开发商提供。这一类系统各个独立的系统功能高度内聚,以至于各 8 基于x m l 的数据安全交换研究与实现 个系统成为信息孤岛,为了实现企业内部不同系统之间的交互,2 0 世纪9 0 年代以 后逐渐形成了e a i ( 企业应用集成) 的概念。 整体系统内的数据交换通常是因为整个系统由分布在不同地理位置的子系统 构成,各个子系统之间要遵照企业内部数据规范和业务流程进行数据交换。在实 际的应用中,往往采用应用层数据交换。应用层交换将数据从数据源实体中提取 出来,规范化成为统一格式的数据用于交换和处理。比较典型的由分布式对象技 术和多自主体技术( m u l t i _ a g e n t ) 。1 。分布式对象技术的其主要思想是,在分布式 系统中引入一种可分布的、可互操作的对象机制,把分布于网络上可用的所有资 源封装成各个公共可存取的对象集合,采用客户服务器( c s ) 结构和模式实现对 对象的管理和交互,使得不同的面向对象和非面向对象的应用可以集成在一起。 而多自主体系统技术则将企业中的每一个子任务、功能、问题或单元设备等都用 单个a g e n t 或组织良好的a g e n t 群来代理或实现,并通过它们的交互和相互协商、 协调与合作,来共同完成制造任务。将企业模拟成多自主体系统可以使系统易于 设计、实现与维护,降低系统的复杂性,增强系统的可重用性、可扩展性和可靠 性,以及提高系统的柔性、适应性和敏捷性等。 为了更高的数据交换效率,系统内部也常使用底层的数据交换,即用于交换 的数据格式并不具有实际可理解的意义,仅仅在数据交换的系统双方可以理解。 该类交换比较典型的例子就是分布式数据库系统。一般大型的数据库系统,如 o r a c l e 本身就提供了较好的分布式应用,用来保证分布式数据库之间的数据一致 性和完整性。这类分布式数据库系统均使用同构的数据库系统,分布式数据库对 应用系统提供整体的数据视图,使具体的物理视图对上层应用系统完全透明。当 分布式数据库系统是异构的时候,则需要新的技术来解决。流行的解决方案往往 采用代理的办法,为每种数据源( o r a c l e 、s y b a s e 、a c c e s s 、平面文件) 建立一种 对象,然后通过代理来访问。而删l 语言往往用来作为异构数据库交互的中间数 据表示格式”1 。当然,各种大型数据库提供的数据网关技术和s 曲a s e 公司的数据 管道技术也不失为好的办法。 e a i ( 企业应用集成) 的全称是e n t e r p r i s ea p p l i c a t i o ni n t e g r a t i o n 。它将进 程、软件、标准和硬件联合起来,在两个或更多的系统之间实现无缝集成,使它 们就像一个整体一样。传统的e a i 方法是在任何两个既存系统之间构建一个适配 器,这种做法实现简单,但是需要开发大量的应用系统适配器。同时,当企业内 有n 个独立系统时,如果一个系统出现了扩展或者更新,那么相应需要改动的适 配器则有n 一1 个。可见适配器方法只适合独立系统少( 一般少于三个) 的应用系统 集成。 公共应用网关是一种较好的e a i 解决方案。这种方案在原有企业系统之间增 加了一个应用网关和一种统一交换的数据格式,所有参与交换的独立系统都用使 数据交换的理论分析 9 用该统一的数据格式与应用网关交互,然后由应用网关完成数据的转发。该种解 决方案种,独立系统仍然需要适配器将数据转化为统一格式和应用网关数据交互。 但是适配器的数量将大为减少,同时独立系统的更新将只对该系统的适配器产生 影响。统一交换的数据格式是应用网关解决方案的关键,定义的统一的数据格式 要兼顾到兼容性、扩展性以及可读性诸多因素。当前大多数此类系统倾向使用】( m l 作为中间数据格式的表示方法。 在代理( a g e n t ) 技术出现以后,基于代理的e a i 解决方案也成为了一个新的发 展方向。该类解决方案将每个独立系统都看成是一个企业的实体( o n t o l o g y ) 的集 合以及在这些实体上面约束的集合。抽象出这些实体和实体之间的关系以及相应 的约束,就可以构成一个通用的企业业务对象字典,而每个独立的应用系统都装 配一个a g e n t ,用于将交换数据翻译成企业内a g e n t 都能处理的基于数据字典的统 一语言,然后在一条数据总线( b u s ) 上进行交互。企业对象实体、实体间关系以及 约束的抽取是实现该种方案的关键。由于同行业的相似性,可以定义一个用于共 享的行业数据字典,这样可简化具体的企业数据字典的实现。无疑,该种解决方 案的可扩展性是最好的,同时实现时重用程度较高,可以有效的降低e a i 的成本。 2 1 2 企业之间( b 2 b ) 数据交换 与企业内部数据交换相比较,与外部的数据交换存在着更多的不稳定性和更频 繁的数据格式的变化。即使企业具有完善的内部管理信息系统,如果不能妥善地 解决与其它企业的数据交换问题,就会产生对外数据交流的瓶颈而导致影响企业 的整体效率。传统上那种针对某一特定的数据交换模式进行一项特定的软件开发 工程的方法,可能不再适应现在互连网普遍应用的形势和激烈的商业竞争环境。 因为与企业打交道的潜在对象将会越来越多,需要交换的数据格式各不相同。也 就是说,企业需要的数据交换摸式是不可枚举的。 企业之间的数据交换在某些方面类似于e a i ,例如目前b 2 b 数据交换多是既存 系统之间的数据交换,交换方式也可以采用类似于e a i 的技术来完成。但是在逻 辑上b 2 b 的数据交换和e a i 却有很大的不同。参与e a i 集成的各个独立系统在逻 辑上都属于同一企业内的不同功能子集,因此e a i 中各个子系统交换的数据都遵 循统一的数据规范( 企业或行业数据字典) 和业务流程。而参与b 2 b 的数据交换的 企业大多数并不在同一类行业以内,如供应链中的原料供应商、制造商、批发商 以及零售商等等,彼此之间都要进行数据交互,但是这些企业本身并不在同一个 行业内。这样一来,己经建立的行业数掘字典无法在b 2 b 数据交互中重用,因此 在各个企业系统能够必须通过某些办法理解其他系统数据的格式和意义。同时企 业在交互数据之前,往往有一个协商的过程,这意味着企业之间数据交换的业务 1 0 基于x m l 的数据安全交换研究与实现 流程也不是企业内部定义的,而是遵照商业习惯。 通常各类b 2 b 数据交换都要将应用层的数据表示和底层数据传输方式隔离开。 由于其开放性,b 2 b 的数据交换所涉及的数据格式纷繁复杂。业务流程也多种多样。 为了规范化企业之间的数据交换,降低b 2 b 数据交互的成本,b 2 b 数据交换大多有 一个一致的数据表示框架”1 。而且,某些b 2 b 交换平台( 如e b ) 【m l ,r o s e t t a n e t 等) , 在框架的基础之上详细定义t 参加b 2 b 数据交换的企业所遵照的商用数据字典。1 , 该字典可以理解为企业数据字典的超级。内容仍然包括商业实体、商业属性、商 业实体间关系和约束等等。不管是公共的数据字典还是数据表示框架,都需要符 合标准。当前b 2 b 数据交换的数据标准主要有e d i ,r o s e t t a n e t ,e b 】( m l ,c n x m l , b i z t a l k 等。 2 2 数据交换系统的体系结构 数据交换系统的建立必须以满足企业需求为前提。数据交换系统是一个复杂 的系统,牵涉到各种各样不同的技术,如数据库技术、网络通讯、硬件环境、数 据格式的转换等等。在搭建该系统时,必须考虑各方面的综合因素。当前有一些 相关的研究成果,其解决方法也是多种多样的。根据以上对企业需求的分析,我 们从以下几个方面来论述本系统的体系结构。 2 2 1 企业内部的体系结构 企业应用集成的困难来自大量的商业需求和技术的变化,快速的业务变化和发 展需要应用系统能更快地发布和使用,而且,业务上的需求需要更多的、高度的 应用集成。因此为了使系统获得了更好的灵活性,提高了业务的敏捷性。可将应 用程序的交互逻辑封装起来,然后从应用程序中剥离出来,加以集成,实现企业 内部各个部门的协 图2 1 企业内部集成应用 下图所示: 数据交换的理论分析 该结构包含一个集成媒介器和多个与其交互信息的子系统。集成媒介器包含的 是系统的交互逻辑,参与的应用子系统直接和集成媒介器进行交互,而不是和其 他子系统进行交互。这种方案的优点在于:将应用程序之间的依赖性以及对现有的 应用程序的影响最小化:由于应用程序的交互逻辑不是分布在应用程序中,而是集 中起来,这样维护的工作量将达到最小,提高系统的重用性和灵活性,降低e a i 集成的复杂性和e a i 实施可能存在的风险。 2 2 2 企业间的体系结构 由于企业和企业之间是一种分布式的结构,各个企业分部在不同的位置,分别 处理本企业内部的事务,在需要与别的企业进行数据交换时,可以通过数据交换 系统进行,数据交换系统主要负责在一个具体的数据交换任务中动态的数据生成、 传输、转换、写入等。通过数据交换平台的一个好处是可以进行一对多的交换。 其结构见图:2 2 。 企业b 一 ”“, 。 翼“孽 : 应用a + + i n t c m c t 数据交换平台冀+ i n 佗m e th 应用b 藏? 。i 二一一二囊 2 3 l ”鸯 鬟一。罄 * ! = ”3 ;i 呻。i ;加4 图2 2 架构在数据交换平台的企业间数据交换 基于x m l 的w e b 服务将为企业对企业( b 2 b ) 的数据交互带来巨大的商机。企业 的应用程序可以使用w e b 服务的技术把它们封装成自描述的、自包含的模块应用。 这样企业对企业( b 2 b ) 的应用能够使用开放标准协议来集成和交换信息。由于企业 的应用程序被封装成w e b 服务,它们成为模块应用。只要通过制定的w e b 服务接 口,其他系统可随时与这些w e b 服务连接,完成企业对企业( b 2 b ) 的应用集成。 x m l 技术与其安全性 第三章l 技术与其安全性 x m u e x t c n s i b l em a r k u pl a n g i l a g e ) 是目前全球范围内描述数据和交换数据的 一种标准的方式。其应用范围从早先的w 曲信息描述,发展到后来的数据交换的 开发标准,乃至目前的服务集成和服务交互的开发技术。本章讨论) ( m l 技术与其 安全性,为设计和实现数据安全交换系统做好理论铺垫。 3 1 ) 蹦l 技术 3 1 1x m l 的特点和优势 1 x m l 的特点0 1 x m l 一推出就被广泛地采用,并且得到越来越多的数据库、b t e m e t 软件厂商 的支持。从总体来讲,x m l 具有以下的特点: 自描述性:x m l 允许自定义标签( t a g ) ,并且这些标签可以说明数据的语 义,而不是h t m l 中的格式说明。 独立于平台和应用:煳l 的文档内容是基于u n 工c o d e 的文本,适于网络 的传输。 半结构化:不同于纯文本中的数据,x m l 数据可以用d t d 或者s c h e n l a 来 规范;但同时瑚l 表示的是一种层次型的数据,因此比传统的数据库更适 合描述现实中的信息( 数据) 。 机器可处理的( m a c b j n ep r o c e s s a b l e ) :相对于完全无规则的文本,计算机 很容易处理) ( 1 i l 文档,同时相对于无法表示语义的h t m l 文档,计算机很 容易理解煳l 文档的语义,并且这种可读性对人同样适用。 可扩展性:x m l 是一种元标记语言,可用来定义各种实例标一记语言标准, 用户可以为数据定义它们自己的词汇表,从而定义数据的处理方式。 广泛的支持:x m l 得到众多的软件厂商比如m i c r o s o n ,m m ,s u n ,o r a c l e 等几乎所有大公司的支持。 2 x 札的优点 x m l 具有内容和形式分离,良好的可扩展性,良好的跨平台移植性和良好的自 描述性等优点,它适合动态电子商务系统发展的需求: 1 4 基于x m l 的数据安全交换研究与实现 令异构应用间的数据共享:) ( m l 的灵活,扩展性己经自我描述等特性,使 异构应用问的数据共享成为可能。 不同来源数据集成:x m l 能够将不同来源的结构化数据结合在一起,通过 在中间层的服务器上对从后端数据库和其他应用处来的数据进行集成。 数据长久保存:) ( m l 基于开发的技术和行业标准,摆脱了s g m l 的过分复 杂,却继承了它的保值特性。采用x m l 作为资料数据的长久保存格式,其 意义非常重大。 3 1 2 x m l 相关技术 1 d ( 瑚 文档对象模型( d o m ,d o 咖e n io b j e c tm 0 d e l ) 是h t m l 和) ( m l 文档的编程接口 规范,它与平台和语言无关的,因此可以用各种语言在各种平台上实现。利用d o m 规范,可以实现d o m 文档和) ( m l 之间的相互转换,遍历、操纵相应的d o m 文档的 内容,d o m 文档中的逻辑结构可以用节点树的形式进行表述“”。 x m l 解析器能够读入一串x m l 数据,经过处理,产生一棵结构树,并且使 用d o m ( 文档对象模型) 把所有数据元素作为对象进行进一步的处理,或者把数据 移交给另外的应用软件或对象进行相关的处理。d o m 用扩展方式支持名称空间、 数据类型、查询和x s l 转化。 d o m 实际上是一个应用编程接口( a p i ) ,定义了一种访问数据的标准方法。 通过这种方法,开发人员能够处理x m l 结构树的元素。使用者通过对象模式使用 x m l 结构树,并且把所有树中的元素作为对象显示出来。 2 s a x s a x 是s i m p l ea p if o r ) ( m l 的缩写,它并不是由w 3 c 官方所提出的标准,可 以说是社区性质的讨论产物。但几乎所有的解析器都支持它,几乎所有的d o m 解 析器都是在s a x 解析器的基础上构建起来的。 与d 叫比较而言,s a ) ( 是一种轻量型的方法,s a x 在概念上与d o m 完全不同。 它不同于d o m 的文档驱动,它是事件驱动的,它并不需要读入整个文档。所谓的 事件驱动,是指一种基于回调( c a l l b a c k ) 机制的程序运行方法。 3 x s l x s l t x p a t h x s l 是e x t e n s i b l es t y l e s b e e tl a n g u a g e 的缩写,是一种样式语言,为】【m l 服务。 然而,x s l 不仅仅是一个样式表,事实上,x s l 包括了三部分: 一个转换x m l 文档的方法; 一个在l 源文档中查找定位数据的方法; 一个格式化) ( i l 文档的方法。 x m l 技术与其安全性 x s l 实际上包含三种语言,具体如下 x s l t ( x s lt r a n s f o 咖a t i o n s ) :用于将x m l 文档转换成其他类型文档或其他 ) ( m l 文档的语言: x p a t h ( x m lp a t hl a n g u a g e ) :用于定义如何在x m l 文档中查找定位数据的 语言; x s l f 0 ( x s lf o 皿a t t i l l g0 b j e c t s ) :用于定义) 【m l 文档的可视化表现方式的 语言。 x s l t 是x s l 标准中最重要的部分,它用于将一个瑚l 文档转换成另一个m l 文档或另一种类型的文档,也就是将一个) ( i f l 文档转换成指定应用所能识别的一 种格式。x s u l 的工作流程见图3 1 : + ) 呲文档 x s l 样式 t 一1 f l + ;其他应用程序 敷据库 。l 图3 1 x s u l 的工作流程 x s u 转换必须由专门的、称为x s l 处理器的软件来进行。任何x m l 文件必 须先经过解析器的解析和整理,以便进一步利用。x s l 样式表和所要转换的x m l 源代码都属于x m l 文件,也都需要解析。因此,x s l 处理器在工作之前,须先通 过x m l 解析器将x s l 样式表和x m l 文件的结构分析清楚。转换前的x m l 文件 的结构称为源树( s o u r c et r c e ) ,转换后的x m l 文件的结构称为结果树( r e s u l tt r e e ) 。 x s l 处理器在x m l 解析器对x s l 样式表和要转换的x m l 文件解析完成之后, 就依照样式表的结构逻辑指示,对派树的各结点进行追历,生成结果树,并由浏 基于x m l 的数据安全交换研究与实现 览器在屏幕上显示,或输出到文件进行储存“。 4 x l i n k x p o i n t e r x l i n k 可以声明多个资源之间的关系。资源这个概念对应w 3 c 来说具有普遍意 义,资源可以是任何信息或服务的可定位的单元,具体的资源例子有文件、图像、 文档、程序和查询结果。所以,定位一个资源是非常重要的一个环节,一般我们 用x p o i n t e r 进行资源的定位。 5 x q u e r y x q u e r y ( 煳l 查询语言) 是用于定位和过滤j ( j l 文档中元素和文本的查询语言。 它是x s l 模式语法的自然扩展,为指向特定的元素或查找具有指定特征的节点提 供了简明的可以理解的符号。x s l 模式语言提供了一种描述一类需要被处理的节点 的好方法,实际上是通过x p a t h 来实现的,x s l 是说明性的,而非过程性的。但 x s l 有许多不足之处,如不支持表达式,不能在节点间进行等值连接,对多个分散 的x s l 文档没有一个形式化的查询机制,没有支持聚集操作等。而x q u e r y 则在x s l 基础上提供了筛选操作、布尔操作,对节点集进行索引,并为查询、定位等提供 了单一的语法形式。一定意义上,我们可将x q u e r y 看做是x s l 的超集o ”。 3 1 3 x m l s c h e m a 规范 s c h e j l l a 是伴随着) ( m l l 0 规范的制订而推出的,2 0 0 1 年5 月2 日,在香港召 开的w 啊1 0 会议上,w 3 c ) ( i i ls c h e 尬( p a r t0 ,1 和2 ) 成为w 3 c 的正式标准。在s c h e 眦 标准提出到成为正式标准的两年中,几经修改,终于形成了目前稳定的规范。) 【m l s c h e m a 是d t d ( 文件类型定义) 之后第二代用来描述x m l 文件的标准。是用来对x m l 进行文档的类型定义的语言,用来规定) 【h i l 文档的数据类型及组织方式,同时还 是丰富的元数据资源。 ) ( m ls c h e 髓是一种定义文件的方式,拥有许多类似d t d 的准则,但又要比d t d 更为强大一些。w 3 c 协会宣称,与d t d 相比) ( m l s c h e 眦拥有许多优势。 ) ( m ls c h e i l l a 可使) ( m l 和】( m l 软件包对数据类型进行描述,使用x f l 命名空间, 允许开发者充分利用继承性,和d t d 不同,它是真正的) ( h i l 文件。 ) ( m ls c h e i i l a 的优点如下: ( 1 ) 丰富的数据类型。这些数据类型包括:布尔型、数字、日期时间、时间间隔 等等多达四十多种的数据类型,相对于d t d 的十种数据类型要多出许多。而且x m l s c h e m a 还支持由这些简单的类型派生出的复杂类型。 ( 2 ) 与) ( m l 文档保持一致。) 【m ls c h e m a s 是x 儿文档,而d t d 有自己的特殊语 法和格式。s c h e m a 使得对x m l 的定义不必再利用一种特定的形式化的语言,而是 直接借助x m l 自身的特性,利用) 【m l 的基本语法规则来定义x m l 文档的结构,使 x m l 技术与其安全性 1 7 得x m l 达到了从内到外的完美统一,也为x m l 的进一步发展奠定了坚实的基础。 ( 3 ) 可以对数据类型进行扩展和限制,具有极其
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 电池及电池系统维修保养师操作安全测试考核试卷含答案
- 小型家用电器制造工安全知识模拟考核试卷含答案
- 超重型汽车列车挂车工岗前核心实操考核试卷含答案
- 一种前臂式越障机器人的研究
- 陶瓷彩绘工创新思维能力考核试卷含答案
- 第11课 清理草坪我能行教学设计小学劳动鄂教版二年级上册-鄂教版
- 2025年无机基础化学原料合作协议书
- 泥釉浆料制备输送工安全生产基础知识模拟考核试卷含答案
- 热风炉工岗前班组评比考核试卷含答案
- 城镇污水处理工安全实践评优考核试卷含答案
- IP语音电话系统方案
- 人教部编版六年级语文上册郝晓怡《盼》名师教学课件
- 【义乌小商品市场出口贸易的现状与对策探析8100字(论文)】
- 义务教育劳动课程标准2022年版考试题库及答案5
- 心速宁胶囊的抗心肌纤维化
- 沟通的艺术智慧树知到期末考试答案章节答案2024年湖南师范大学
- DB32-T 4757-2024 连栋塑料薄膜温室建造技术规范
- 实验室安全与防护智慧树知到期末考试答案2024年
- EPC工程总承包项目项目管理要点
- 智慧河道管理平台整体解决方案
- 水利机械电器检测培训课件
评论
0/150
提交评论