(计算机应用技术专业论文)基于智能文档的异构数据交换模型的研究与应用.pdf_第1页
(计算机应用技术专业论文)基于智能文档的异构数据交换模型的研究与应用.pdf_第2页
(计算机应用技术专业论文)基于智能文档的异构数据交换模型的研究与应用.pdf_第3页
(计算机应用技术专业论文)基于智能文档的异构数据交换模型的研究与应用.pdf_第4页
(计算机应用技术专业论文)基于智能文档的异构数据交换模型的研究与应用.pdf_第5页
已阅读5页,还剩57页未读 继续免费阅读

(计算机应用技术专业论文)基于智能文档的异构数据交换模型的研究与应用.pdf.pdf 免费下载

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

基于智能文档的异构数据交换模型的研究与应用摘要 论文题目:基于智能文档的异构数据交换模型的研究与应用 专业:计算机应用技术 硕士生:张义 指导教师:罗笑南教授 摘要 随着政府对信息化建设工作的正确引导以及投入的加大,我国在信息化建设 各方面都取得了定的成绩,信息化建设也向更深层次发展。同时,由于过去信 息化建设一直是在分散体制下的投入,造成了现有的信息系统相对分散、异构和 封闭,没有统一的体制和架构,相互之间不能互动,信息资源无法实现共享,利 用率不高,存在资源重复建设与浪费的问题。因此,各个部门之间的数据互联互 通,协同工作成为整个区域性信息化工作的瓶颈,而对各种异构系统进行应用整 合、集成以实现协同也成为了信息化工作的当中之重。 基于智能文档的异构数据交换模型的研究与应用来源于广东省关键领域重 点突破项目( ( l i n u x 操作系统及应用子项目三基于l i n u x 的数据交换和应 用支撑中间件( 项目编号:t c 0 5 8 3 9 3 2 ) 。本文以该项目为项目背景,围绕分布 式异构系统的整合、集成和协同难度较大的现象,针对传统的采用三层,或多层 应用架构的数据交换平台不能较好解决如何把各种应用集成为一体,实现部门与 部门以及企业与企业的协同和自动化的问题进行研究,目标是提出一个以智能文 档作为统一的数据封装载体的具有柔性架构的数据交换模型,实现异构系统间集 成与整合。本文提出通过对智能文档的客户端渲染等主要技术的研究,提出了基 于智能文档的面向服务的柔性的分布式异构数据交换模型架构,并对智能文档的 自适应动态路由技术研究;提出该模型的数据适配器的设计思路,完成流程设计, 并部分实现该适配器的功能。文章最后给出了课题的项目应用情况,通过传输实 例的演示来说明基于智能文档的异构数据模型的优越性。本课题基于w p s 智能 文档数据交换中间件平台项目,本文将随着智能文档革命以及国产软件w p s 数 据中间件的广泛使用,将有良好的应用前景。 关键词:智能文档,异构数据,数据交换,交换模型,面向服务架构 基于智能文档的异构数据交换模型的研究与应用 a b s t r a c t t i t l e :t h er e s e a r c ha n da p p l i c a t i o no fh e t e r o g e n e o u sd a t ae x c h a n g em o d e lb a s e do i l s m a r td o c u m e n t m a j o r :a p p l i e dc o m p u t e rt e c h n o l o g y n a m e :y iz h a n g s u p e r v i s o r :p r o f e s s o rx i a o n a n l u o a b s t r a c t a st h ec o r r e c tg u i d a n c ea n di n c r e a s i n g l yp o u r e di n t oo fg o v e r n m e n t ,i n f o r m a t i o n i z a t i o n c o n s t r u c t i o nh a sg o tc e r t a i na c h i e v e m e n ti na l ll e v e l s ,a n dd e v e l o p si nd e p t h m e a n w h i l e ,t h e d e c e n t r a l i z e dd e v o t i o ni nt h ep a s tr e s u l t e di nr e l a t i v ed i s t r i b u t e d ,h e t e r o g e n e o u sa n do b t u r a t e d , w i t h o u tu n i f i e ds y s t e ma n ds t r u c t u r ei nt h ec u r r e n ti n f o r m a t i o ns y s t e m ;t h e r ec o u l dn o t i n t e r a c to ne a c ho t h e r , s h a r eo fi n f o r m a t i o nr e s o u r c e s ;a n dh a dd u p l i c a t i o nc o n s t r u c t i o n , w a s t e f u lo fr e s o u r c e sa n dl o wu t i l i z a t i o nr a t e t h u s ,d a t ae x c h a n g e sb e t w e e nd i f f e r e n t d e p a r t m e n t sa n dt e a mw o r kb e c o m ec h o k e i m p o r t a n tt oi n t e g r a t ea n da c h i e v es y n e r g y c o n s t r u c t i o n p o i n to fr e g i o n a li n f o r m a t i o n i ti st h em o s t h e t e r o g e n e o u ss y s t e mf o ri n f o r m a t i o n i z a t i o n t h i st o p i ct h a tt h er e s e a r c ha n d a p p l i c a t i o no fh e t e r o g e n e o u sd a t ae x c h a n g em o d e l b a s e do ns m a r td o c u m e n to r i g i n a t e sf r o mk e yb r e a k t h r o u g hp r o j e c t 。l i n u xo p e r a t i n g s y s t e ma n da p p l i c a t i o n ”,t h es u b p r o j e c tt h r e e t h em i d d l e w a r eo fd a t ae x c h a n g ea n d a p p l i c a t i o np l a t f o r mb a s e do nl i n u x ( t h es e r i a ln u m b e r :t c 0 5 8 3 9 3 - 2 ) o f t h ee s s e n t i a la r e ai n g u a n g d o n gp r o v i n c e t h i sa r t i c l et o o kt h i sp r o j e , c ta st h eb a c k g r o u n dw h i c hr e v o l v e st h e c o n f o r m i t y , i n t e g r a t i o na n dd i f f i c u l tc o o p e r a t i o ni nd i s t r i b u t i o n a lh e t e r o g e n e o u ss y s t e m ,i n v i e wo ft r a d i t i o n a ld a t ae x c h a n g ep l a t f o r mu s i n gt h r e eo rm u l t i l a y e rc o u l dn o ts o l v ep r o b l e m b e t t e r , a n dm a k ea nr e s e a r c ho nh o wt oi n t e g r a t ek i n d so fa p p l i c a t i o n sa saw h o l e ,a n dh o wt o r e a l i z ec o o r d i n a t i o na n da u t o m a t i z a t i o nb e t w e e nd e p a r t m e n t sa sw e l la st h ee n t e r p r i s e s ;t h e a i mi sp r o p o s e dt h ed a t ae x c h a n g em o d e lb a s e do nt h es m a r td o c u m e n ta su n i f i e dd a t as e a l c a r r i e rw i t hf l e x i b l ec o n s t r u c t i o n ,t or e a l i z ei n t e g r a t i o na n dt h ec o n f o r m i t yo fh e t e r o g e n e o u s s y s t e m t h ea r t i c l ep r o p o u n d sac o n s t r u c t i o no ft h ed i s t r i b u t e da n dh e t e r o g e n e o u sd a t a e x c h a n g em o d e lw h i c hi so r i e n t e ds e r v i c ea n df l e x i b l ea n db a s e do ns m a r td o c u m e n tt h r o u 曲 l i 基于智能文档的异构数据交换模型的研究与应用a b s t r a c t t h em a i nt e c h n o l o g yr e s e a r c hl i k ea ss m a r td o c u m e n tc l i e n tr e n d e r i n g a n dr e s e a r c ho n a u t o - a d a p t e dd y n a m i cr o u t ee n g i n e e r i n go fs m a r td o c u m e n t a n db r o u 曲tu pt h em o d e ld a t a a d a p t e rd e s i g ni d e aa n dc o m p l e t e dt h ef l o wd e s i g n ,p a r t i a l l yr e a l i z e st h i sa d a p t e rf u n c t i o n t h e r eh a sat r a n s m i s s i o nd e m o n s t r a t i o nt os h o wt h es u p e r i o r i t yo fh e t e r o g e n e o u sd a t a e x c h a n g em o d e lb a s e ds m a r td o c u m e n ti nt h ee n d t h i st o p i cb a s e d0 1 1t h em i d d l e w a r eo fd a t a e x c h a n g ea b o u tw p ss m a r td o c u m e n t ,a n dw i l lh a v et h eg o o da p p l i c a t i o np r o s p e c ta l o n gw i t h s m a r td o c u m e n tr e v o l u t i o na n dt h ed a t am i d d l e w a r ew i d e s p r e a du s e k e y w o r d s :s m a r td o c u m e n t ,h e t e r o g e n e o u sd a t a ,d a t ae x c h a n g e ,e x c h a n g e m o d e i ,s e r v i c eo r i e l a t e da r c h i t e c t u r e i i i 基于智能文档的异构数据交换模型的研究与应用前言 - j 刖吾 基于智能文档的异构数据交换模型的研究与应用来源于广东省关键领域重 点突破项目( l i n u x 操作系统及应用子项目三基于l i n u x 的数据交换和应 用支撑中间件( 项目编号:t c 0 5 8 3 9 3 2 ) 。该项目拟从系统柔性架构、智能文档 数据封装、动态路由引擎、自适应数据交换代理等技术出发,对以w p s 智能文 档作为数据传输载体的数据交换中间件平台进行研究开发,实现异源数据整合、 异构系统数据交换、应用集成等当前数据交换技术领域的三大瓶颈问题的突破。 本文将以该项目为应用背景,重点研究智能文档的封装等核心技术,并设计完成 智能文档应用于基于统一平台的数据交换的模型。 随着国家对信息化工作的重视以及投入的加大,政府和企业的信息化都取得 了喜人的成绩,各业务系统初具规模。但是,目前在电子政务和企业信息化建设 过程中,却同时也存在应用分离、“信息孤岛”的现象,这在很大程度上制约了 信息化战略所带来的效用。因此,各个部门之间的数据互联互通、协同工作即成 为整个区域性信息化工作的瓶颈,对各种异构系统进行应用整合、集成以实现协 同也成为了信息化工作的当中之重。 信息化的发展越来越需要各信息系统间的协同服务,需要互联互通的信息也 越来越复杂,信息交换的方式已不仅仅满足于通过简单的文本方式进行。泾渭分 明的非结构化的文档信息和结构化的数据信息间的连接通常依靠大量的人工操 作完成。这就造成了信息化过程中最大的两个孤岛:办公软件与企业管理信息系 统的脱节。基于此,打破这种割裂,实现结构化数据与非结构化数据的融合将成 为解决这种问题的根本途径。而随着基于x m l 和w e bs e r v i c e 技术的智能文档 的出现以及迅速发展,则能较好的解决上述问题。以智能文档作为统一的数据封 装载体,来实现异构系统间集成与整合的思路。 另外,传统的数据交换平台由于采用三层,或多层的应用架构,保证了系统 的异构性、扩展性和分布运行的可行性。但它们所解决的问题还是具体应用的实 基于智能文档的异构数据交换模型的研究与应用 前言 现,解决不了如何把各种应用集成为一体,实现部门与部门以及企业与企业的协 同和自动化问题。例如行政许可并联审批系统建设,普遍就没有解决好数据集成 和应用集成问题。其关键是没有取得面向应用集成的数据交换技术的突破。 因此,研究基于智能文档异构数据交换平台,不仅具有广阔的市场需求,且 更加贴近和切合市场需求,其构件化和面向集成的特点,可以被各类系统快速引 用和部署。因此,本课题研究的基于智能文档数据交换平台,对于解决信息化过 程中的异构数据交换有着十分重要的意义。 本文将围绕分布式异构系统的整合、集成和协同难度大的现象,以w p s 智 能文档数据交换中间件平台项目为依托,针对基于智能文档的异构数据交换模 型,对智能文档的客户端渲染、动态路由技术以及数据适配器系统进行研究设计, 目的是提出一个以智能文档作为统一的数据封装载体的具有柔性架构的数据交 换平台,实现异构系统间集成与整合。 2 基于智能文档的异构数据交换模型的研究与应用第1 章综述 第1 章综述 本章节是全文的背景资料介绍与分析,从课题的选题背景,异构数据交换以 及异构数据传输协议等方面内容出发,着重介绍本课题研究存在的意义与研究 点,并对当前本课题研究领域的主要研究技术做一概念性介绍。 1 1 研究背景 本节主要介绍课题的选题背景及其意义,着重介绍异构数据交换的一些概念 以及已有应用的异构数据传输协议的概述。 1 1 1 课题背景 随着信息技术的迅猛发展,社会生活信息化、网络化的到来,使信息技术向 当今社会全面渗透。推进政府部门办公自动化、网络化、电子化及全面信息共享 是大势所趋,电子政务的发展正在成为当今信息化建设的最重要的领域之一。电 子政务是以电子技术为基础、以计算机网络为平台而进行的政务活动,即政务活 动电子化、网络化。电子政务包括内部办公管理、社会管理和社会服务等3 方面 的网络化n 近年来,我国信息化步伐加大,政府和企业信息化进展迅速,城市的信息化 建设取得了显著的成绩,但同时发展中也存在一定的问题,在整体规划,建设目 标,项目优先级确定以及协调力度方面都有需要改进的地方。例如,一些地方信 息化建设缺少总体规划,或者是规划的科学性不够,一提电子政务、信息化建设, 就是系统、专网、数据库等的建设,各个项目间缺乏必要的关联;而且在信息化 工程中重新建、轻整合,重建设、轻应用,这势必造成资源的重复建设阻及利用 率低,影响项目建设目标的实现和效益的发挥。 由于过去对信息化建设一直是在分散体制下的投入,造成了现有的信息系统 相对的分散、异构和封闭,没有统一的体制和架构,相互之间不能互动,存在着 基于智能文档的异构数据交换模型的研究与应用 第1 章综述 应用分离、信息孤岛的现象,难以充分发挥信息资源的效益,这在很大程度上制 约了信息化战略所带来的效用。随着信息化程度的提高,各个部门之间的数据互 联互通,协同工作成为整个区域性信息化工作的瓶颈,对各种异构系统进行应用 整合、集成以实现协同成为了实际工作中提高工作效率的迫切需要。 如何在现有的基础上建立统一的电子政务信息架构,对现有信息系统进行整 合、集成,使信息资源得到有效的管理和共享,成为了目前信息化建设需要解决 的重要问题之一。解决这一问题的核心就是如何解决各职能政府间分布的且异构 的数据库之间的数据交换问题。该问题的解决对于推进电子政务在我国的实际应 用有着重大的意义。 近年来,基于x m l 和w e bs e r v i c e 技术的发展,全球掀起了一股新的信息 技术变革浪潮,其主体是智能文档。智能文档是一种x m l 文档,除了具备纸张 所有的特性外,还包含有高度结构化的x m l 信息、程序以及可执行的动作,这 种文档在其内容组织、表现和交互上变得更具柔性,基本上将传统的电子文档与 信息系统融合了起来。智能文档的出现,完全将信息系统的控制权交还给了用户, 使得信息系统的建设逐步回归,更多的强调以人为中心。 智能文档一个很重要的特性,就是可以将相关电子信息在其整个生命周期的 表现形态进行归一化,统- n 更加符合人们使用习惯的文档上来,而不再是 w o r d 、e x c e l 、p d f 、h t m l 、定制化的界面等等多样化的信息表现形态。智能 文档从信息生成、修改、输入、发布、流转、处理、审批、盖章、归档、检索到 随时的打印输出等整个过程,都具备纸张的所有特性,所见即所得,所有过程中 都能保持原版原貌,并可以实现随时的仿真打印输出,还可以进行完整的归档与 检索。由于智能文档只是将各种信息资源进行了文档化的整合,使之更加符合人 们对于文档的操作习惯,并不影响现有的各种业务流程,还极大的减少了相关人 员的工作负荷。 异构数据交换的解决首先要确定数据的表示形式( 交换标准) 。智能文档是 一种x m l 文档。其一是标准化:智能文档将相关电子信息在其整个生命周期的 表现形态进行归一化,归一到x m l 的国际标准上来,使得不同的信息系统和数 基于智能文档的异构数据交换模型的研究与应用第1 章综述 据库都可以兼容、抽取、利用这些信息。其二是协同性:智能文档可以支持多个 部门同时对同一文档进行处理,并具备自动的提示和帮助信息,可以执行自动校 验和计算,支持一次生成,多次复用。其三是安全性:智能文档具备痕迹保留与 跟踪功能,支持数据加密以及电子印章和数字签名。因此,智能文档是数据交换 最理想的基础技术。本文以w p s 智能文档数据交换中间件平台项目为背景依托, 针对目前信息化建设中面临的各信息资源共享问题,提出一种基智能文档作为统 一数据封装载体的数据封装、交互机制,具有柔性架构的异构数据交换模型、分 布式异构的数据适配器,以实现异构环境下的数据交换。 1 1 2 异构数据交换 数据的异构性导致了应用对于数据交换的需求。异构数据是一个含义丰富的 概念,它是指涉及同一类型但在处理方法上存在各种差异的数据,在内容上不仅 可以指不同的数据库系统之间的数据是异构的( 如o r a c l e 和s q l s e r v e r 数据 库中的数据) ;而且可以指不同结构的数据之间的异构,( 如结构化的s q l s e r v e r 数据库数据和半结构化的x m l 数据) 【2 1 。总的来说,数据的异构性包括:系统 异构、语义异构等。系统异构是指原有资源数据库所依托的系统平台和采用的应 用平台不同。异构数据库各个组成部分局有自身的自治性,实现数据共享的同时, 每个数据库系统仍保有自己的应用特性、完整性控制和安全控制。语义异构主要 指原有的资源数据库的数据涉及不同的应用领域,具有各自的语义范畴,不同的 数据源内部定义了不同的规则和约束来表述数据本身和数据间的语义。 异构数据库系统是分布式数据库系统的继承和发展,其主要特征可以从以下 三方面说明p 4 】: f 1 1分步性:异构数据库系统得各个组成部分是分布在不同位置的各种数 据库系统,系统通过通讯网络建立各个部分之间的连接。系统的数据保存在分布 的数据库系统中,这些数据可以以各不相同的方式保存,没有严格的逻辑要求。 ( 2 )异构性:排出数据库宿主系统的异构性,异构数据库系统的异构性主 要由数据库管理系统( d b m s ) 的异构和语义的异构构成。 ( 3 )自主性:构成异构数据库系统的各个子系统具有各自的自主性,这些 基于智能文档的异构数据交换模型的研究与应用 第1 章综述 自主性体现在它们拥有对自身系统内各种资源的使用权利,包括设计、执行等, 同时拥有与其它系统的交互的权利,有权接受外来的服务请求,也有权利拒绝或 者请求服务的权利。 异构数据交换是指异构数据处理环境下( 包括计算机体系架构的异构、操作 系统的异构、数据库管理系统的异构和应用系统软件的异构等) 不同数据源之间 的互操作。异构数据交换的目的是为了更好的为政府和企业的应用系统提供安全 的、快捷的信息查询、数据挖掘和决策支持服务。随着 n t e m e t 和电子商务的发 挥咱,企业之间按得联系日趋密切,不同系统之间的信息交流日益增多,异构数 据交换技术的应用日益广泛【5 o 目前,常见的异构数据交换方法主要有以下几种【6 : ( 1 ) 编制专有的应用系统:为解决异地数据交换的问题,最简单,最直接 的方法就是建立专有系统和专用网络,用定制数据格式消灭数据的异构问题,用 专有系统、专有链路来解决数据的传输问题。这种方法能够建立非常有效的交换 系统,其传输的效率,系统地稳定性和数据一致性较高,特别是对于保密性强, 运行环境封闭、效率要求高的系统而言又是巨大。但是这类系统建设、运营成本 高,开发周期长等不足。 ( 2 ) 采用中介数据库格式,编制专有传输方式:这种方式的核心是将中介 数据库格式作为数据交换格式,通常采用的是较为简单的数据库格式,如a c c e s s 、 d b a s e 等,传输采用f t p ,e m a i l 等方式,使用公共网络传输,或者基于公共网 络的专用线路。其中传输部分由于采用不同的较低层传输协议,需要开发者自行 处理连接中的多数问题,如连接的确认等大量传输细节处理问题,如在需要解决 跨平台问题,还需要考虑跨平台的细节 7 1 。采用中介数据库格式在绝大多数情况 下能够解决一般数据的转化问题,一旦出现异构数据超越数据库格式固有表示范 围,就难以解决转化的问题。由于这种方式数据交换和传输是分为转化和传输完 成两个过程,导致了在如何实现系统间自动以后数据交换上没有统一的标准,不 具通用性。 ( 3 ) 采用分布式系统d c o m e j b :目前,具有代表性的比较成熟的分布式 组件模型有s u n 的f a b 和微软的c o m d c o m c o m + 8 1 。在分布式系统中,对 基于智能文档的异构数据交换模型的研究与应用第1 章综述 象被用来表示分布的、可移动的、可通信的实体;构件化的软件开发方法使对象 被加在网络上,达到跨平台的互操作和高的可伸缩性。e j b 和d c o m 虽然实现 和部署上有差别,但本质上为开发者提供的一套完整的分布式开发标准,将开发 者从网络传输协议的底层处理中解放出来,从而可以将绝大多数的经历投入到业 务逻辑的开发中。 ( 4 ) c o r b a 方式:c o r b a 是一种完整的异构数据即成规范,其特点是大 而全、互操作性和开放性非常好。缺点是庞大而复杂,并且技术和标准的更新相 对较慢。c o r b a 是一种集成技术,它提供了对各种功能模块进行构件化处理并 将他们捆绑在一起的粘合剂,它与e j b 以及d c o m 在很大程度上是可以看作是 互补的关系。 ( 5 ) w e bs e r v i c e s 、x m l 交换:x m l 使用纯文本形式表示数据,它的自定 义性及可扩展性足以表达各种类型的数据,作为独立于平台和设备的接过话数据 表达方式,特别是w e bs e r v i c e s 的出现,使得x m l 成为实现了跨网络系统通讯 的有效手段。w e b 服务可以和业务处理系统分离,特别是在不该改变、影响原有 业务处理的情况下,建立新的基于w e b 服务的交换模块通过松散的应用集成实 现异构数据交换功能,来实现原有系统间的协同与耦合。w e b 服务以一种松散的 服务捆绑集合方式,能快速、低代价地开发、发布、发现和动态绑定应用。就当 代w e b 服务的技术发展水平来看,w e b 服务可以实现应用程序之间的函数或方 法级的集成 9 。 目前,在异构数据交换的研究方面,研究点主要侧重于异构库集成的中间件 技术,x m l 数据映射技术和交换的安全保障机制,一般的基于x m l 的方案都 是这些技术根据应用需要的独立实现或者组创1 0 n _ 1 2 1 1 3 1 。 1 1 3 异构数据传输协议 为了在数据的发送方和接受方之间建立一个通道,实现应用系统之间的交 互,需要有一种能够跨平台、跨语言、跨协议的协议或组件,以解决多种不同平 台在存取信息上不兼容的问题,使得各种平台的数据和对象都能进行传输。 传统的实现分布式环境下应用系统之间的交互是是在分布式对象比如: 基于智能文档的异构数据交换模型的研究与应用 第1 章综述 d c o mc o r b a 之间进行相互的远程过程调用,但在这种场合下h t r p 协议毫无 用武之地,因此在i n t e r n e t 环境下实现远程过程调用较难,而且还存在安全的问 题,防火墙和代理服务器很有可能阻塞这种类型的数据传输。而由于h t r p 协议 得到了所有的浏览器和服务器的支持,使用h t r p 协议能够较好的解决这类问 题。而s o a p 协议是一个在松散的、分布的环境下使用x m l 对等地交换结构化 和类型化信息的轻量级机制,其宗旨在于发挥h 1 t r p 和x m l 优点,从而完成在 应用之间的交互。s o a p 本身只是定义了一种简单的机制,通过一个模块化的包 装模型和对等模块中特定格式编码的数据的重编码机制来表示应用语义【1 4 】。 ( 1 ) h r r p 协议 超文本传输协议( h t r p ) 是应用层协议,由于其简捷、快速的方式,适用 于分布是和合作式超媒体信息系统。自1 9 9 0 年起,m t l l p 就已经被应用于3 w 全 球信息服务系统。 h t r p 是一种请求响应式的协议。一个客户机与服务器建立连接后,发送一 个请求给服务器,请求方式的格式是:同一资源标识符( u r i ) 、协议版本号, 再紧接是m i m e 信息,包括请求修饰符、客户机信息和可能的内容。h t t p 服务 器通过监听特殊端口等待客户端发送一个请求序列,接到请求后,给予响应的响 应信息。h r r p 协议是一个用于在客户端和服务器间请求和应答的协议。 ( 2 ) s o a p 协议 s o a p 是在x m l 基础上定义的,完全继承了x m l 的开放性和描述可扩展 性。它使用现有基于t c p 口的应用层协议h 1 t r p 、m t p 、p o p 3 等,可以获得与 现有通信技术最大程度的兼容。 s o a p 是在分散或分布式的环境中交换信息的简单的协议,是一个基于x m l 的协议,它主要包括四个部分 1 5 】: a s o a p 信封( e n v e l o p ) ,定义了个一整体的s o a p 消息表示框架,可用于描 述消息中的内容是什么,是谁发送的,谁应当接受并处理它,以及如何 基于智能文档的异构数据交换模型的研究与应用第l 章综述 处理它们的框架; b s o a p 编码规则( e n c o d i n gr u l e s ) ,定义了一个数据的编码机制,通过这 个编码机制来定义应用程序中需要使用的数据类型,并用于表示应用程 序需要使用的数据类型的实例; e s o a pr p c 表示( r p cr e p r e s e n t a t i o n ) ,定义了一个表示远程过程调用和响 应的约定; d s o a p 绑定( b i n d i n g ) ,定义一个使用底层传输协议来完成在节点交换信 息的约定。 由于s o a p 采用了已经广泛使用的两个协议:h t i p 和x m l 。其中h r r p 用于实现s o a p 的r p c 风格的传输,而x m l 是它的编码模式,一个s o a p 请 求实际上就是一个h 兀甲p o s t 请求。因此s o a p 消息必须用封装起来,包含一 个b o d y 部分,还可以包含一个或者多个h e a d e r ,封装结构如下图: a e n v e l o p e 是表示该消息的x m l 文档的根元素: b h e a d e r 则是为了支持在松散或是分散环境下的通讯方之间尚未预达成一 致的情况下为s o a p 消息增加特定的通用机制。 c b o d y 为该消息的最终接收者所想要得到的那些必须处理的信息提供一个 容器。此外,s o a p 定义了b o d y 的一个子元素f a u l t 用于报告错误。 图1 - 1s o a p 消息封装图。 。图来源于h ! 啦;岱啦鲣j 也q 盟:鲤婴丛韭i ! 红! q ! 廛地q 塑世2 :b ! 趔( 谴目墨q 靶消息翊且壁bs i 型i 盟0 9 - 基于智能文档的异构数据交换模型的研究与应用第1 章综述 s o a p 是建立在h 1 t r p 基础之上的,这意味着s o a p 消息可以作为h t r p 请 求响应的一部分传递。由于h t r p 是一个广泛接受的协议,几乎所有的防火墙 都允许通过8 0 端口,因此通过h 1 t r p ,s o a p 可以穿越防火墙的限制达到请求端。 s o a p 利用h t r 的请求用自应模型,将s o a p 请求的参数置于h t r p 请求中, 当客户端发送请求时,不论客户端使用的是哪种平台,何种编程语言,首先都把 请求转换成基于x m l 形式的s o a p 信封,然后通过底层协议h 1 t r p 传送给服务 器。服务器再返回h t r p 响应信息给客户端。 图1 - 2s o a p 请求响应机制1 6 1 1 2 当前的研究重点 目前,在数据交换技术的研究中,主要集中在基于w e b s e r v i c e s 技术。另一 方面,基于x m l 和w e bs e r v i c e s 技术的发展,近年来,全球掀起了一股新的信 息技术变革浪潮,其主体便是智能文档。由于数据交换首先要确定的是数据的表 现形式( 交换标准) ,智能文档是一种x m l 文档,它的标准化、协同性、安全 性等特性使得智能文档是数据交换最理想的基础技术。而在模型结构设计以及系 统整合、集成等方面,面向服务的体系架构( s o a ,s e r v i c eo r i e n t e da r c h i t e c t u r e ) 和企业服务总线技术f e s b ,e n t e r p r i s es e r v i c eb u s ) 成为目前热门的技术。 基于智能文档的异构数据交换模型的研究与应用第1 章综述 1 2 1w e bs e r v i c e s 技术 w e bs e r v i c e s 是一个或者一组应用程序,向外界提供一个能够通过w e b 进行 调用的a p i ,通过w e b 进行消息传送,提供一个松散耦合的分布式计算环境, 形成一个模块化的组件模型。其主要目标是在现有的各种异构平台的基础上构筑 一个通用的与平台无关、语言无关的技术层,多种不同平台上的应用依靠这个技 术层来实施彼此的连接和集成。 图1 - 3w e b 服务体系架构模型【1 1 在该框架模型下的s o a p 协议即简单对象访问协议( s i m p l eo b j e c ta c c e s s p r o t o c 0 1 ) 是一种基于x m l 标准的在分散或分布式的环境下,对消息进行封装的 一个简单的轻量级机制,具有互访性、网络的适应性、安全性等特点。 1 2 2s o a 与e s b 技术 随着政府和企业应用系统建设的逐渐完善,对各种异构系统进行应用整合、 集成以实现协同越来越成为信息化工作的重点之一。目前,面向服务的体系架构 ( s o a ,s e r v i c eo r i e n c e da r c h i t e c t u r e l 和企业服务总线技术( e s b ,e n t e r p r i s es e r v i c e b u s l 成为目前热门的技术【切。 s o a 是一个组件模型,它将应用系统的不同功能单元( 称为服务,对应到 业务部门是各种业务应用) 通过这些服务之间定义良好的接口和契约联系起来。 接口是采用中立的方式进行定义的,它应该独立于实现服务的硬件平台、操作系 统和编程语言。这使得构建在各种这样的系统中的服务可以以一种统一和通用的 基于智能文档的异构数据交换模型的研究与应用第1 章综述 方式进行交互。这种具有中立的接口定义( 没有强制绑定到特定的实现上) 的特 征称为服务之间的松耦合。松耦合系统的好处有两点,一点是它的灵活性,另一 点是当组成整个应用系统的每个服务的内部结构和实现逐渐地发生改变时,它能 够继续存在。而另一方面,紧耦合意味着应用程序的不同组件之间的接口与其功 能和结构是紧密相连的,因而当需要对部分或整个应用程序进行某种形式的更改 时,它们就显得非常脆弱。对松耦合的系统的需要来源于业务应用程序需要根据 业务的需要变得更加灵活,以适应不断变化的环境。s o a 依赖于用x m l 和w e b 服务实现并以软件的形式存在的更加具体的观念和技术。此外,它还需要安全性、 策略管理、可靠消息传递以及会计系统的支持,从而有效地工作。 蚓1 - 4面向服务体系架构( s o a ) 示意图 1 8 】 e s b 是在s o a 的基础上提出的构建面向对象服务体系架构解决方案时所使 用基础架构的关键部分,提供了联系单位内部以及跨部门问新的和现有系统的功 能,以一组丰富的功能启用管理和监控应用程序间的交互。e s b 提供了事件驱动 和文档导向处理模式以及分布式的运行管理机制,支持基于内容的路由和过滤, 具备复杂数据的传输能力,并提供一系列的标准接口,可消除不同应用见的技术 差异,实现不同服务间的通信与整合。e s b 、s o a 以及数据交换的关系如下图所 示【1 8 】: 图1 5s o a 、e s b 及数据交换关系示意图 基于智能文档的异构数据交换模型的研究与应用 第1 章综述 1 2 3 智能文档技术 目前,随着智能文档技术的发展,其已经成为被全球软件业关注的一个焦点。 智能文档是一种x m l 文档,是基于x m l 和w e bs e r v i c e 技术的发展而逐渐发展 起来的。她除了具备纸张所有的特性外,还包含有高度结构化的x m l 信息、程 序以及可执行的动作,这种文档在其内容组织、表现和交互方面变得更具柔性, 基本上将传统的电子文档与信息系统融合了起来。她的出现,完全将信息系统的 控制权交还给了用户,使得信息系统的建设逐步回归,更多的强调以人为中心。 由于智能文档的标准性、协同性、安全性等使得智能文档是数据交换最理想的基 础技术。智能文档的技术主要包括:客户端渲染、内容解析、安全体系等。 1 3 论文的结构 本文的章节结构如下 第1 章介绍本课题的研究背景、异构数据、数据交换和智能文档的相关概 念,并简略介绍本文的研究重点; 第2 章分析模型目标和问题,提出数据交换适合的交换模式以及研究设计 具有柔性架构的面向服务的数据交换模型: 第3 章研究智能文档的客户端渲染等技术,并对基于智能文档的异构数据 交换模型的架构,动态路由技术和数据适配器进行设计和研究; 第4 章介绍课题的应用背景项目,并列举示例演示数据传输的使用情况: 第5 章总结本文的工作,提出对未来的展望。 基于智能文档的异构数据交换模型的研究与应用第2 章基于s o a 的异构数据交换模型的设计 第2 章基于s o a 的异构数据交换模型的设 计 本章节针对目前异构数据交换存在的一些问题,基于s o a ,e s b 等技术, 提出一种基于s o a 和e s b 的数据交换模型架构。文章首先从异构数据交换的问 题着手,提出模型的设计目标,再进而提出异构数据交换适用的交换模式以及基 于面向服务架构的数据交换模型。 2 1 模型的问题分析与设计目标 目前,信息化异构数据资源交换的问题可以从信息的统一表示、数据交换载 体和数据传输的安全等三个方面进行探讨。一般情况下,只需对异构数据资源信 息的描述定义统一的标准,形成可供全局交换的数据模式,并且通过加密措施等 保证数据安全,即可完成异构数据库间的简单交换。进行业务层次的数据交换是 电子政务交换平台建设的最终目标,也是目前多数数据交换平台还需进一步解决 的问题。数据交换载体是解决异构数据库结构化信息与非结构化信息相互交换的 途径之一,它将使数据交换的层次得到深入,实现业务工作在异构系统间自动流 转。 2 1 1 异构信息的统一表示 要实现信息共享,实现异构系统之间的互联互通,不同结构的信息的统一表 示是关键,这是实现数据交换的首要步骤。通常认为,数据库的异构问题主要体 现在系统异构和语义异构等两方面。由于异构性的存在,需要将各个参与交换系 统的变化数据提取出来,经过统一的数据格式的定义,才能进行数据的交换。 x m l 由于具有可扩展性,允许根据需要参数化和语义化相应的数据,可以 将资料的内容和其表现形式合理的隔开,挺高了x m l 资料的可理解性、可交换 性与可重用性。因此,运用x m l 可有效地解决不用应用系统或不同数据源间的 基于智能文档的异构数据交换模型的研究与应用 第2 章基于s o a 的异构数据交换模型的设计 数据交换和共享问题,给予x m l 的数据交换技术成为今后数据库交换研究的主 要方向。基于x m l 的对数据库关系模式的转换的算法也是目前数据交换技术中 研究的重点之一。现有用x m l 文档来表示关系数据的方法的基本思想都是用 x m l 层次结构来描述关系模式的有向图结构【1 9 1 ,也有研究使用面向对象的思想 实现复杂关系模式之间的转换【捌,而使用无模式的算法在关系数据库中存储 x m l 数据也可以实现映射,并且具有很好的灵活性【2 1 】。而针对业务数据描述, 仅仅解决x m l 模式到关系模式的转化是不够的,因为要实现办公系统到办公系 统的业务转换,实际上就是完成一个关系模式到另一个关系模式的映射,x m l 文件只是起到中介的作用,具体实现的方法还有待进一步的研究。本文以w p s 智能文档数据交换中间件平台研究为依托,研究基于x m l 的w p s 智能文档技 术,把一项业务数据提取出来用智能文档来表示,并作为该数据的唯一表示在平 台上进行交换、传输,提高数据交换的效能。而且通过对标准化的数据解析,使 程序与内容分离,具有更好的通用性和扩展性。 2 1 2 数据交换的载体 系统应用集成的最终目的是实现业务处理的协同化,这种业务处理协同化的 需求将逐步涵盖政府部门的大部分业务处理范围。所以信息化建设中的数据交 换,应该是以部门单位的业务处理流程为中心来构建。业务在不同办公系统间的 交换流转才是关键,而其它诸如商业系统中采用异构数据交换则多用于信息的共 享与发布 2 2 1 。 对于使用不同业务系统的工作人员来讲,他们关心的是异构系统间的业务自 动流转以及业务的协同工作。这一点在目前的研究中是一研究热点。目前的办公 数据还是存在非结构化的文档信息和结构化的数据信息,两者之间的“泾渭分明” 使得办公软件与应用信息系统脱节,数据交换存在壁垒。而所有问题的产生都源 于结构化数据与非结构化文档信息的割裂。打破这种割裂,实现结构化数据与非 结构化数据的融合将成为解决这种问题的根本途径。正是在这种背景下,智能文 档发起了一场对传统文档和信息系统的革命。本文将对数据交换平台中的数据统 一封装载体智能文档进行研究,对其打破结构化数据与非结构化数据的壁 基于智能文档的异构数据交换模型的研究与应用 第2 章基于s o a 的异构数据交换模型的设计 垒,使得异构数据库实现真实意义的数据交换。 2 1 3 安全的数据传输 理想的分布式计算技术需独立于厂商、平台和语言;需有更好的互操作性; 且易于开发、部署和使用。而目前广泛使用的各种分布式计算解决方案是基于紧 耦合的模型( 如d c o m 、c o r b a ) ,这不利于业务工作的调整和再造,缺乏可 扩展性。而w e bs e r v i c e 的出现完全满足了以上需求,并避免

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论