




已阅读5页,还剩52页未读, 继续免费阅读
(计算机软件与理论专业论文)基于soa的电子政务信息集成研究.pdf.pdf 免费下载
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
哈尔滨工程大学硕十学位论文 摘要 近年来,我国对电子政务建设投入了极大的热情和力量。但是,由于缺 乏统一的规划和规范,重复建设、“信息孤岛 等一系列问题,已经成为阻碍 我国电子政务发展的瓶颈。随着电子政务的发展,政务系统之间信息交互的 需求越来越大,信息集成是电子政务的必经之路。 传统的信息集成主要采用数据复制和模式集成两种方法,如现在广泛应 用的采用数据复制方法的多数据库系统,采用模式集成方法的联邦数据库系 统和中间件包装器系统等。然而这些传统的集成系统存在着数据冗余度高、 一致性维护困难、全局模式的构建和维护代价高、扩展困难等不同缺陷。电 子政务中,信息多为文本和图表等非结构化信息。随着政务系统的进一步建 设,信息源数量和种类不断丰富,迫切需要一种灵活、扩展的信息集成系统。 s o a 带来了“松散耦合 的应用程序组件,将业务抽象为可重用的服 务,极大的提高了系统的可重用性和扩展性,成为当今系统集成和企业信息 集成中研究的热点。本文研究基于s o a 的电子政务信息集成。在对电子政务 信息集成需求详细分析的基础上,打破传统信息集成的局限,提出基于s o a 的电子政务信息集成模型;该模型自顶向下包括应用接口层、服务层和数据 层三个层次,对每层进行详细分析;重点研究数据层的集成,给出数据层集 成模型;研究分布式事务处理和基于x m l 的数据模式提取和数据迁移;最 后,对进口废物原料装运前检验电子管理系统中的数据迁移进行分析和实现, 并根据数据层集成模型给出改进。 关键词:电子政务:信息集成:s o a ;数据迁移 哈尔滨工程大学硕士学位论文 a b s t r a c t i nr e c e n t y e a r s ,g r e a te n t h u s i a s m a n ds t r e n g t hh a v eb e e ni n v e s t e d i n e - g o v e r n m e n tb u i l d i n g h o w e v e r ,b e c a u s eo fal a c ko fu n i f i e dp l a n n i n ga n d s t a n d a r d i z e d ,r e d u n d a n tc o n s t r u c t i o n , ”i s o l a t e di n f o r m a t i o ni s l a n d s ”a n das e r i e s o f p r o b l e m s h a v eb e c o m eb o t t l e n e c k st h a th i n d e rt h e d e v e l o p m e n t o f e - g o v e r n m e n t a l o n gw i t ht h ed e v e l o p m e n to fe - g o v e r n m e n lt h ed e m a n do f i n f o r m a t i o ni n t e r a c t i o nb e t w e e nc h i e f s y s t e m s i s i n c r e a s i n g i n f o r m a t i o n i n t e g r a t i o nh a sb e c o m et h eo n l yw a yf o re - g o v e m m e n t t r a d i t i o n a li n f o r m a t i o ni n t e g r a t i o nm a i n l yu s e sd a t ar e p l i c a t i o na p p r o a c ha n d i n t e g r a t e dm o d ea p p r o a c h , s u c ha sm u l t i - d a t a b a s es y s t e m su s i n gd a t ar e p l i c a t i o n a p p r o a c h , f e d e r a l d a t a b a s es y s t e ma n dm i d d l e w a r e w r a p p e rs y s t e mu s i n g i n t e g r a t e dm o d ea p p r o a c h h o w e v e r , t h e r ea r es o m ed i f f e r e n td e f e c t si nt h e s e s y s t e m s ,s u c ha sah i 曲d e g r e eo fd a t ar e d u n d a n c y , c o n s i s t e n c ym a i n t e n a n c e d i f f i c u l t y , c o n s t r u c t i o na n dm a i n t e n a n c eo ft h eo v e r a l lp a r e mc o s th i g h , e x p a n s i o n sd i f f i c u l t y a n ds oo n i n e - g o v e r n m e n t ,m o s t i n f o r m a t i o ni s u n s t r u c t u r e di n f o r m a t i o n , l i k et e x ta n dg r a p h i c s w i t l lt h ef u r t h e rc o n s t r u c t i o no f t h eg o v e r n m e n ts y s t e m ,t h en u m b e ra n dv a r i e t yo fi n f o r m a t i o ns o u r c e sc o n t i n u et o e x p a n d ,t h i sl e a d i n ga nu r g e n tn e e d f o raf l e x i b l ea n ds c a l a b l ei n t e g r a t e d i n f o r m a t i o ns y s t e m s o a b r o u g h t ”l o o s e l yc o u p l e d ”a p p l i c a t i o nc o m p o n e n t s ,a b s t r a c t e db u s i n e s s t or e u s a b l es e r v i c e s ,g r e a t l ye n h a n c e dt h es y s t e m sr e u s a b i l i t ya n de x t e n s i b i l i t y , a n db e c a m ei n t e g r a t e di nt h er e s e a r c ho fs y s t e ma n de n t e r p r i s ei n f o r m a t i o n i n t e g r a t i o n i nt h i st h e s i s ,e - g o v e r n m e n ti n f o r m a t i o ni n t e g r a t i o nb a s e do ns o a w a sr e s e a r c h e d o nt h eb a s i so fad e t a i l e da n a l y s i so nn e e d s o fe - g o v e r n m e n t i n f o r m a t i o ni n t e g r a t i o n ,t h el i m i t a t i o n so ft r a d i t i o n a li n f o r m a t i o ni n t e g r a t i o nw a s b r o k e na n dae - g o v e r n m e n ti n f o r m a t i o ni n t e g r a t i o nm o d e lb a s e do ns o aw a s p r o p o s e d ;t h e r ea r et h r e el e v e l si nt h em o d e l ,i n c l u d i n ga p p l i c a t i o ni n t e r f a c el e v e l , 哈尔滨工程大学硕十学位论文 s e r v i c el e v e la n dd a t al e v e l a n dad e t a i l e da n a l y s i so fe a c hl e v e lw a sg i v e n ; f o c u so nd a t ai n t e g r a t i o nl a y e ra n dd a t ai n t e g r a t i o nm o d e lw a sp r o p o s e d ; d i s t r i b u t e dt r a n s a c t i o np r o c e s s i n ga n dx m l b a s e dd a t ae x t r a c t i o np a t t e r n sa n d m i g r a t i o nw e r er e s e a r c h e d ;f i n a l l y , t h ed a t am i g r a t i o no fe l e c t r o n i em a n a g e m e n t s y s t e mf o rp r e s h i p m e n ti n s p e c t i o no fr e e y c l i n gs c r a p st oc h i n aw a sa n a l y z e d , r e a l i z e da n di m p r o v e d k e y w o r d s :e - g o v e r n m e n t ;i n f o r m a t i o ni n t e g r a t i o n ;s o a ;d a t am i g r a t i o n 哈尔滨工程大学 学位论文原创性声明 本人郑重声明:本论文的所有工作,是在导师的 指导下,由作者本人独立完成的。有关观点、方法、 数据和文献的引用己在文中指出,并与参考文献相对 应。除文中已注明引用的内容外,本论文不包含任何 其他个人或集体已经公开发表的作品成果。对本文的 研究做出重要贡献的个人和集体,均已在文中以明确 方式标明。本人完全意识到本声明的法律结果由本人 承担。 作者( 签字) :垄整 日期:跏留年0 月以e l 哈尔滨工程大学硕士学位论文 1 1 课题目的和意义 第1 章绪论 电子政务是政府机构应用现代信息和通信技术,将管理和服务通过网络 技术进行集成,在互联网上实现政府组织机构和工作流程的优化重组,超越 时间和空间及部门之间的分隔限制,向社会提供优质和全方位的、规范而透 明的、符合国际水准的管理和服务i ”。 政府机构的信息化应用水平在相当程度上影响着社会经济发展和社会信 息化进程r z ,。近年来,我国投入了大量的人力、物力进行电子政务建设,取得 丰硕的成果。随着技术的发展和管理思想的不断演进,新的需求不断出现, 电子政务的建设逐渐从单向信息发布向政府部门与公众双向互动、集成办公 发展。政府各部门在建设电子政务时,都形成自己的内部办公系统,但由于 缺乏统一的战略规划,系统的建设时间不同、厂商不同、技术设备不同、数 据库格式不同、操作系统不同、乃至应用软件和用户界面都不同。这些独立 异构的,封闭的系统使得系统间的信息共享和业务处理无法进行,形成了众 多的“信息孤岛 ,电子政务不仅仅是需要访问本部门内部的资源,还需要与 其它部门的系统交互,以提高政务效率。要放弃这些投入大量资源开发、运 行良好的应用软件是不现实的,因此,保护现有资源,让新的系统能够和现 有的系统应用交互整合,提高互连互通政务效率,避免资源浪费,实现这些 系统之间的集成是目前电子政务的必走之路。 1 2 国内外电子政务发展状况 1 2 1 国外电子政务发展 将现代信息技术应用于政府的各项业务,实现政府业务流的计算机化, 在发达国家已经有了近5 0 年的历史。其特点在于改善对企业和公众的服务; 紧密结合政府改革;遵循“长远规划、由易到难、分阶段实施 的建设原则: 哈尔滨工程大学硕士学位论文 制定统一的规划和技术标准,规划电子政务的发展:利用互联网络实现资源 共享和集成。其中,以美国、日本等国的电子政务建设最具代表性。 美国的电子化政府建设是与美国的行政改革紧密联系在一起的。这场改 革始于2 0 世纪8 0 年代初,当时美国提出了“重塑政府 的口号。美国于1 9 9 4 年制定了政府资讯科技服务的远景计划,从而推动了电子化政府的建设。 日本政府于2 0 0 1 年初制订了“电子日本战略 ,准备在五年内把日本建 成世界最先进的i t 国家。为此日本成立了由首相和所有内阁大臣及部分民间 人士参加的i t 战略委员会,负责“电子日本计划的实施。电子日本的四大 目标是:建设世界最先进的信息技术基础设施,到2 0 0 5 年至少让3 0 0 0 万家 庭用上高速宽带网络,另外1 0 0 0 万家庭使用超高速光纤网:鼓励和促进电子 商务发展,到2 0 0 3 年使电子商务贸易额达到1 9 9 8 年的1 0 倍,约7 3 万亿日 元;建设电子政府,提高政府办公效率,使任何企业和个人能在任何时候连 通政府网络,办理有关行政手续;培养面向信息时代人才等。 1 2 2 我国电子政务发展 我国信息化基本上正式起步于1 9 9 3 年,党和国家领导人相继提出了信息 化建设的任务,启动了以“金卡 、“金桥 、“金关”等为代表的“十二 金工程,拉开了国民经济信息化的序幕。 我国的电子政务发展共经历了四个大阶段: 1 信息发布阶段 主要有经常说的政府上网和各种内部应用的建设,包括部门管理信息系 统、o a 这些系统的建设以及网络平台、基础平台的建设。但当时的电子政 务仅限于初级网站的建设,即政府建立网站发布相关规定、条文、政策等信 息供公众查阅。 2 交互阶段 这一阶段可细化为两个阶段,单向互动和双向互动。单项互动阶段进一 步丰富网站内容,吸引公众兴趣,并提供电子表格和文件等供用户下载。在 单向互动的基础上,实现政府与公众之间的双向信息流,如网上审批系统和 其它一些政府网上服务系统。 2 哈尔滨工程大学硕士学位论文 3 整合阶段 建立政府门户网站,提供“一站式 服务,多电子政务系统间的协同办 公。比如网上联合办公、网上联合审批等内部政务协同,以及目前国家提出 来的建设信息资源库问题等。 4 转化阶段 通过系统应用带动政府部门流程的改造,更大程度地发挥电子政务的优 势和作用,提供个性化的网上服务和全面的政务信息。 1 2 3 我国电子政务中存在的问题及解决方法 我国的电子政务正在从第二阶段逐步转化到第三阶段。需要实现跨地区, 跨部门的网上联合办公、网上联合审批等政务协同。这就需要实现在一个异 构环境下,用一种统一的方式组织来自不同系统的数据,实现相互的数据交 流和资源共享。在我国电子政务建设过程中,由于缺少统一规划,各地区电 子政务发展不平衡,不同的单位建设的业务系统采用不同的开发平台、不同 的运行环境,导致业务流、信息流不统一、各系统间通讯困难、部门之间信 息不能共享,形成各自互不相通的“信息孤岛,严重影响着政务信息的共享 和利用,构成了我国电子政务发展过程中的一个关键性的瓶颈制约因素。现 阶段,电子政务建设中存在着如下一些问题: 1 缺乏统一的规划 目前,我国电子政务的发展缺乏宏观规划,没有提出明确的发展目标。 同时,条块分割的管理体制与电子政务的统一性、开放性、交互性和规模经 济等自然特性产生严重冲突,各级地方政府和部门在电子政务的建设中往往 各自为政,采用的标准也各不相同,业务内容单调重复,造成新的重复建设。 同时,缺乏规范和标准也使得信息流通不畅,标准的出台速度跟不上电子政 务的建设步伐,造成资源无法共享和信息孤岛,影响了跨部门、跨区域共性 业务的处理和政府的有效监管。 2 政府各部门间信息资源缺乏有效共建共享机制 政府信息资源是政府投资建设的信息资源或者是由政府直接管理的信息 资源,它是国家的重要资源,是政府行政管理的基础,是科学决策的依据, 哈尔滨工程大学硕士学位论文 是联系公众的纽带。但是,当前我国政府部门在信息资源的开发和利用上仍 然是一个相对薄弱的环节,特别是缺乏政府部门间信息资源的有效共享。 在跨部门基础信息资源共建上,虽然我国已经开始启动四大基础数据库 的建设工作,但是推进效果不够理想。我国基础信息资源开发与利用的缺乏 已经成为信息化发展的主要瓶颈。例如,缺乏法人单位信息和人口信息的支 撑,社会信用体系很难建立,制约了电子政务、电子商务、电子社区等主要 应用的深入发展。在跨部门信息共享上,仅在工商与税务企业基础信息交换、 进出口领域企业基础信息交换等方面进行试点尝试。尚有很多跨部门的关键 业务没有理顺信息流程,信息共享程度低,并且对信息资源的核心价值和重 要地位尚未认识清楚,“重开发,轻利用”的现象比较严重。 3 缺乏统一平台和技术规范 各地区,部门之间的电子政务发展水平存在差异,各电子政务系统的开 发平台和应用环境,网络环境存在很大差异。在很多地方的电子政务建设过 程中并未考虑政务平台软件的开发,而是直接开发业务系统,网络硬件只解 决系统间的物理连接,但由于缺乏集成平台软件的支持,各业务系统不能有 效的数据共享,互联互通。 相关技术标准的缺乏是导致信息孤岛形成的一个重要因素。国外电子政 务建设的经验表明,在信息资源的开发建设中,只有依据标准建设的数据源, 才能够无障碍、不失真地进行流通、交换并跨系统共享数据。而为了进行网 络环境下的信息资源交换与共享,就必须要有一大批技术标准来指导信息系 统的建设,以确保其技术上的协调一致和整体效能的实现。 4 电子政务管理机制存在障碍 目前,我国政府行政管理体制是从计划经济体制下继承而来的,虽然经 过了2 0 多年的行政体制改革,政府职能正由管理型向服务型转变,取得了可 喜的成绩,但是,一些深层次的问题仍然没有得到根本解决。如结构设置不 合理,政府各部门职能交叉、重叠,行政流程不合理,行政效率有待提高, 透明度较低,等等。这些都是电子政务发展的重要障碍。特别是现有的部门 之间利益分配机制不能适应信息时代的要求,造成跨部门的业务协同困难, “信息孤岛 现象大量存在,信息资源在部门之间不能得到有效的共享,信 息流不顺畅,不能发挥出应用的效益。 4 哈尔滨工程大学硕士学位论文 由以上分析可见,我国的电子政务中存在的问题,可从管理和技术两个 角度来划分。管理上,需要采取加强对电子政务的宣传力度,使各级领导树 立正确观念;加强相关法律法规的限制,改进政府管理模式,优化工作流程 等方法。技术上,必须打破各级政府和部门间的信息封闭,整合政务信息资 源,重视对信息资源的不断开发、更新和维护,对电子政务系统和信息进行 有效集成,快速提供业务结果,使用户能够方便访问种类繁多的数据源,围 绕技术限制制订计划及适应不断变化着的环境。 本文意在从信息集成的技术角度,解决电子政务中的“信息孤岛”和协 同办公等问题。 1 3 信息集成的研究现状 1 3 1 信息集成内涵 早期的计算机应用系统采用文件系统来存储数据。随着数据量的增加和 文件结构多样化的发展,管理大量异构文件变得异常复杂。为了解决这个问 题,2 0 世纪7 0 年代,文件系统被集中式的数据库系统所取代。由于数据库 系统提供的数据管理和维护等性能,大大降低了文件管理的复杂性。但是, 随着数据库系统的增加,尤其是异构数据库系统的增加以及系统间数据共享 和交换需求的增加,新的问题出现了:各数据库被独立地创建和管理,每个 独立的数据库有自身的模式、数据模型和数据操纵语言,在物理上和逻辑上 都存在异构,难于交互。 另外,近十几年来,由于i n t e m e t 的迅速发展和应用的普及,信息量大 大增加,信息的种类和结构也越来越多样,从传统的结构化信息,到w e b 上 的大量半结构化信息以及非结构化信息。 为了更有效地组织和管理自身的活动,信息使用者往往需要综合利用来 自大量分布异构信息源上的信息。这些信息分部在早期建设的不同信息系统 中,如何把各种不同的数据源统一在一个信息集成平台上,建立一个集成化 信息系统,统一管理分布异构信息,允许多数据库间的信息自动交换与共享, 使用户能够高效地、透明地操作各类信息,成为一个重要的课题。 信息集成是将数据库管理系统、内容管理系统、数据仓库和其他应用程 哈尔滨下程大学硕士学位论文 序的核心功能集成到一个通用平台上的一项技术,就是要为全局应用建立一 个统一的、透明的方法,来访问一组已经存在的自治的、分布的、异构数据 源或应用程序n ,。信息集成屏蔽了各种异构数据源之间的差异,通过集成系统 提供的接口对数据进行统一操作,集成后的信息对用户来说是统一的、无差 异的h , 信息集成的主要内容是基于分布式网络的由不同硬件、操作系统、数据 库管理系统( d b m s ) 和不同的应用软件组成的异构数据处理环境下的数据 模型、数据库模式、查询语言、事务处理、并发性控制与数据库完整性维护 等一系列问题的集成。信息集成的目标是将分布在企事业信息系统环境中自 治和异构的多处局部数据源中的信息有效地集成,实现各信息子系统间的信 息共享。 目前国内外对信息集成的主要研究集中在基于数据的管理和处理上,因 此,通常将信息集成与数据集成等义。 1 3 2 信息集成的主要方法 信息集成自被提出以来就引起了国内外众多科研人员的关注,已成为当 前信息处理领域中的重要研究方向”。 信息集成的研究方法主要有两类,物化方法和虚拟方法。 物化方法的实质是数据复制,最常见的数据复制方法就是数据仓库m 1 。在 客户端与数据源( 服务器) 之间增加一层数据仓库,将各数据源的数据 统一复制到数据仓库中,用户直接访问数据仓库获得数据。这种方法的优点 是单点控制,便于管理,支持决策支持查询。但数据仓库增加了系统的复杂 性,降低了系统的可靠性,数据的一致性维护困难,冗余存储,而且大批量 的数据复制耗费了大量的时间和空间。 数据复制通常采用端到端的方式,也有使用数据平台实现数据周转。即 各数据源将数据发送到数据平台,数据平台负责处理网络负担和并发控制, 并将数据发送给订阅者。 虚拟方法又称模式集成方法。其基本思想是数据保存在自己的数据源上, 各数据源发布自己的共享视图,集成系统将这些共享视图集成为全局模式, 6 哈尔滨工程大学硕士学何论文 并提供相应的查询处理机制,供用户按照全局模式透明地访问。 模式集成方法需要解决两个问题,即如何构建全局模式与数据源共享数 据视图间的映射关系和如何处理用户在全局模式上的查询请求。 全局模式与数据源数据视图间映射的构建方法有两种m :全局视 图法( g l o b a l a s v i e w , g a v ) 【1 和局部视图法( l o c a l a s v i e w , l a v ) 憎1 。 全局视图法中的全局模式是在数据源数据视图基础上建立的,它由一系列元 素组成,每个元素对应数据源的一个查询,表示相应数据源的数据结构和操 作;局部视图法先构建全局模式,数据源的数据视图则是在全局模式基础上 定义,由全局模式按一定的规则推理得到。 用户在全局模式上的查询请求需要被映射为各数据源能够识别的请求。 这一过程有好多实现算法。 主要的模式集成方法有三种: 1 联邦数据库方法 联邦数据库的基本思想是:数据源之间共享自己的一部分数据模式,形 成一个互相关联的联邦模式。 联邦数据库分为紧密耦合的联邦数据库和松散耦合的联邦数据库。紧密 耦合的联邦数据库采用统一的全局模式。其优点是集成度高,用户参与少; 缺点是需要复杂的算法支持,全局模式维护困难,由于采用全局模式,扩展 性差。松散耦合的联邦数据库没有全局模式,采用联邦模式。其优点是各数 据源的自治性强,动态性能好,无需维护全局模式;缺点是数据的集成度不 高,许多异构性问题需要用户自己解决。 2 中间件集成方法 联邦数据库适合集成结构化的数据信息。另一种典型的数据集成方法, 中间件集成方法,可以集成结构化,半结构化和非结构化的信息。它同样采 用全局模式,用户在全局模式上查询,全局模式通过中间件,将查询优化, 分解成若干基于数据源的子查询。每个数据源对应一个包装器,包装器将数 据源封装成统一的通用模型,与中间件交互,具体过程如图1 1 所示。 哈尔滨工程大学硕士学位论文 用 lr 户 查 询 全局模式 结一 l用 一 果 户 查 集 询1r 中间件 一 蓁h 蓁。l 蚕j 蓁h 包装器 包装器 包装器 同翮 画 l 模型 il 模型 i 闻 嚣、f 龠龠 i 源1 i l 源2 j 、一 图1 1 中同件集成 这种方法的优点是能处理非数据形式的数据源,中间层不备份任何数据 实例。只作为用户和信息源之间的接口,通过查询规划将全局查询转换成信 息源上的查询命令,数据源的自治性强。缺点是在处理查询时,由于需要访 问数据源,所以响应查询一般比较费时,查询代价较高。 3 端对端集成方法 端对端集成将参与集成的各节点分别视作一端,每个节点将自己的一部 分数据模式映射成为端共享模式,向其他节点共享自己的数据。 1 3 3 现有的信息集成系统 目前,对于信息源的集成和交互有多种解决方案,从简单的结构化信息 的关系数据库集成系统,发展到结构化数据、半结构化数据、非结构化数据 和w e b 信息的综合集成系统。 1 多数据库系统 多数据库系统主要是指异构多数据库之间的集成,有两种集成方式: 哈尔溟工程大学硕十学位论文 -i fi | ( 1 ) 多数据库语言系统,提供统一的多数据库操作语言和公共接口以访 问成员数据库。 ( 2 ) 模式集成系统,提供一个全局模式,使用户可以透明访问各成员数 据库。 许多对关系型数据库的集成,都采用这种多数据库系统的设计模式。华 中科技大学研制的基于c o r b a x m l 的多数据库原型系统p a n o r a m a 就 是其一。该系统可有效集成o r a c l e ,s y b a s e 和d m z 等数据库。 这两种集成方式中,成员数据库都有较高的自治性,但多数据库语言系 统中,用户需要指明访问的数据库、数据库之间的约束和依赖关系,适合少 量数据库的集成。而模式集成则适合大量数据库集成或存取透明度要求高的 集成。 2 联邦数据库系统 联邦数据库的体系结构由在不同节点上松散藕合分布的异构成员数据库 构成,没有全局模式,成员数据库可自由地加入或退出联邦,单个成员节点 有权拒绝或允许其它成员节点对它的访问。联邦数据模式由本地数据库模式 和异地数据模式组成,系统支持基于联邦模式的多数据库查询。 联邦数据库系统在每两个数据库之间建立连接,允许数据库成员之间的 相互访问,实现起来较为简单,缺点是随着成员库的增加,连接数较多 ( n 牛( n - 1 ) ) 。 3 中间件包装器集成系统 中间件包装器集成系统基于m q s ( m e d i a t o rq u e r ys y s t e m ) 体系结构。 它将异构信息源封装,通过在中间件和包装器之间分割任务,提高查询处理 的并发性,减少响应时间。 包装器对数据源进行封装,将其数据模型转换称为系统采用的公共模型, 作为其输出模式,并提供一致的物理访问机制。中间件负责全局查询处理、 分解和优化,它通过调用包装器或其它中介来集成数据源中的信息,解决数 据冗余和不一致性,提供一致协调的视图和统一的查询语言。 在中间件包装器集成系统中,中间件不直接与数据源进行通讯,而是通 过包装器向数据源发出查询请求。每个数据源的查询处理能力不同,因此包 装器支持的访问模式也是不同的。用户不是在数据源的局部数据模式上提交 9 哈尔滨工程大学硕士学位论文 j _ t i 嗣 查询请求,而是在中间件上提交请求。因此中间件必须将用户的查询分解成 对多个数据源的查询语句,并整合每个数据源返回的查询结果,返回给用户。 为了进行查询分解,中介层必须包含一组信息源模型,每个信息源模型描述 了该信息源的内容、属性、内容约束完备性、可信度以及查询处理能力。 目前的大多数w e b 信息集成系统均采用了中间件包装器体系结构,如 斯坦福大学开发的t s i m m i s 系统和i n f o m a s t e r 系统,东南大学研制的 v e r s a t i l e 系统以及g a l a x y 系统等。 与前两种系统相比,中间件包装器集成系统不单支持结构化信息的集 成,还支持半结构化信息和非结构化信息的集成;该系统的数据源广泛分布 在网络上,具有高度的自治性和动态性,因而一般只定义查询操作;系统可 以在中间层生成多个中间模式,供不同用户使用;另外,系统的可扩展性高, 利于新数据源的加入和与人工智能、机器学习等技术的结合。 4 数据仓库 基于数据仓库的信息集成方法是从各个异构数据源中抽取数据,按照一 个集中、统一的视图要求,进行预处理、转换( 如对数据进行一致性处理, 将同义的数据元素的名称、类型、尺寸等进行统一的规范,将经过集成处理 的数据打上时间戳等) ,以符合数据仓库的模式,并存储到数据仓库中,然后 提供对这个数据仓库的访问机制,当原信息源的数据发生变化时,存储在数 据仓库中的数据也要作相应的修改。它的优点是便于进行联机分析和数据挖 掘,为进行全局范围的决策行为和趋势预测提供有效的支持:缺点是数据重复 存储、难以及时更新,实际事务处理能力有待改进“川。 1 4 论文组织结构 随着电子政务中“一站式 服务的提出以及政务系统的协同办公,信息 资源共享等需求的出现,如何打破一个个孤立系统中的“信息孤岛,建立互 联互通、透明访问的信息集成平台成为当今电子政务发展的必经之路。本文 围绕这个主题,对电子政务中的信息集成进行研究,总结了电子政务中信息 集成的需求,将s o a ( s e r v i c eo r i e n t e d a r c h i t e c t u r e ,面向服务的体系结构) 应用到信息集成中来,提出了一个电子政务信息集成模型,希望能够为电子 1 0 哈尔滨工程大学硕士学位论文 政务的信息集成提供理论与方法的借鉴。 第1 章介绍国内外国电子政务发展状况,总结我国电子政务中存在的问 题,深入研究信息集成基本理论和现有信息集成系统,并对各系统进行了比 较。 第2 章研究s o a 架构及s o a 在信息集成方面的应用,对w e bs e r v i c e 技术进行深入研究。 第3 章分析电子政务信息集成需求,设计电子政务信息集成系统模型, 该结构分三个层次,每层依据s o a 的架构设计,并对各层次进行详细分析。 第4 章着重研究信息集成模型的数据层,提出基于s o a 的数据层模型, 并对分布式事务处理做详细研究,给出电子政务信息集成模型中分布式事务 处理解决方案。 第5 章研究数据模式和数据迁移。分别列举基于x m l ( e x t e n s i b l em a r k u p l a n g u a g e ,可扩展标记语言) 的结构化数据、非结构化数据和w e b 数据的数 据模式提取方式,总结数据迁移的两种形式及其在电子政务数据集成系统中 的应用。分析进口废物原料装运前检验电子管理系统( p s i ) 数据迁移及其实 现,并根据数据层模型对其进行改进。 最后给出全文总结,指出信息集成模型的扩展和改进方向。 哈尔滨工程大学硕士学位论文 第2 章基于s o a 的信息集成研究 2 1 $ 0 a 架构 面向服务的体系结构,是一种i t 体系结构样式,支持将业务作为链接 服务或可重复业务任务进行集成,可在需要时通过网络访问这些服务和任务。 这些服务是自包含的,具有定义良好的接口,允许这些服务的用户了解如何 与其进行交互。 从技术角度而言,s o a 带来了“松散耦合 的应用程序组件,在此类组 件中,代码不一定绑定到某个特定的数据库( 甚至不一定绑定到特定的基础 设施) 。正是得益于这个松散耦合特性,才使得能够将服务组合为各种应用程 序。这样还大幅度提高了代码重用率,可以在增加功能的同时减少工作量。 由于服务和访问服务的客户机并未彼此绑定,因此可以完全替换用于处理签 发的服务,等待签发的客户机一服务将永远不会知道这个更改。所有交互都是 基于“服务契约 进行的:服务契约用于定义服务提供者和客户机之间的交 互。通常通过创建“基于消息一的系统来实现此目标。 2 1 1s o a 的三个重要角色 s o a 中共有三种角色“2 1 :服务提供者( s e r v i c ep r o v i d e r ) 、服务请求者 ( s e r v i c er e q u e s t e r ) 和服务注册中心( s e r v i c eb r o k e r ) 。s o a 体系结构中的组 件必须具有上述一种或多种角色。图2 1 表示了它们之间的交互关系。 服务提供者创建服务,发布自己的服务,并且对使用自身服务的请求进 行响应。服务提供者必须决定公开哪些服务和如何公开它们,这通常要通过 相关技术,处理安全性和互用性的平衡。服务提供者首先要将待发布的服务 分类,根据分类选取一个服务注册中心注册。 1 2 哈尔滨工程大学硕士学位论文 图2 1s o a 的三个角色 服务注册中心注册已经发布的服务提供者,对其进行分类,并提供搜索 服务。服务注册中心要提供一个注册和发现服务的机制。服务注册中心分为 公有和私有。私有代理只能供一部分用户使用,公有代理可供所有潜在用户 使用。存在于服务注册中心中的信息类型和格式,以及访问机制依赖于具体 实现。 服务请求者利用服务注册中心查找所需的服务,然后使用该服务。服务 请求者采用服务提供者提供的服务。通过服务注册中心或其他途径,服务请 求者能够请求和发现被请求服务的请求信息。当这些信息完备的时候,服务 请求者就可以绑定或者链接到请求的服务并且在其上进行操作。 在这些角色之间使用了三种操作: ( 1 ) 注册操作:使服务提供者可以向服务注册中心注册自己的功能及访 问接口。 ( 2 ) 查找操作:使服务请求者可以通过服务注册中心查找特定种类的服 务。 ( 3 ) 绑定操作:使服务请求者能够真正使用服务提供者提供的服务。 为支持这三种操作,s o a 需要对服务进行一定的描述“”埘,这种服务描述 应具有下面几个重要特点:首先,它要声明服务提供者的语义特征。服务注 册中心使用语义特征将服务提供者提供的服务进行分类,以帮助具体服务的 查找。服务请求者根据语义特征来匹配那些满足要求的服务。其次,服务描 述应该声明接口特征,以便访问特定的服务。最后,服务描述还应声明各种 非功能特征,如安全要求,事务要求,使用服务所需的要求等等。接口特征 和非功能特征也可以用来帮助服务请求者对服务的查找。 哈尔滨工程大学硕十学位论文 置i i i i i i i i i i 宣i i i i i i i i 1 - i = it i i i i i i i i i 宣 2 1 2s o a 的体系结构 s o a 的体系结构可以分为两大部分,功能和服务质量,如图2 2 所示。 图2 2s o a 的体系结构 功能部分负责业务的实现,包括: ( 1 ) 服务注册中心:服务和数据描述的存储库。服务提供者可以通过服 务注册中心发布它们的服务,而服务使用者可以通过服务注册中心发现或查 找可用的服务。服务注册中心为服务提供者和服务请求者提供注册和查找的 服务。 ( 2 ) 业务流程:服务的集合。将服务按照特定的顺序并使用一组特定的 规则进行调用,以满足业务要求。业务流程可以由不同粒度的服务组成,可 以将业务流程本身看作是一个服务。 ( 3 ) 服务:一个功能体,一个功能的具体实现。根据用户需要,服务可 分为有粗粒度和细粒度。 ( 4 ) 服务描述:用于描述服务是什么,如何调用以及调用参数,不描述 服务的具体实现。 ( 5 ) 服务通信协议:一种经过协商的机制。通过这种机制,服务提供者 和服务使用者可以就将要请求的内容和将要返回的内容进行沟通。 ( 6 ) 消息传输:用于将来自服务使用者的服务请求传送给服务提供者, 并且将来自服务提供者的响应传送给服务使用者。 服务质量部分确保功能部分的正确实施,包括: ( 1 ) 策略:一组条件和规则。在这些条件和规则之下,服务提供者可以 1 4 哈尔滨工程大学硕士学位论文 使服务可用于使用者。策略既有功能性方面,也有与服务质量有关的方面。 ( 2 ) 安全:包括身份验证、授权和访问控制等管理。 ( 3 ) 事务:保证信息和业务的完整性,一致性。项业务功能可能需要 一组服务来共同完成,事务负责协调各服务的工作,即保证一项业务中调用 的所有服务要么都完成,要么都不完成。 ( 4 ) 管理:属性集。可以应用于管理提供的服务或使用的服务。 2 1 3s o a 的实现技术 s o a 可以由多种技术实现“订:c o r b a 、c o m 、e j b 、n e tr e m o t i n g 等等。 但是这些传统的s o a 存在着许多缺陷。 ( 1 ) 缺乏统一的描述语言,导致异构平台的软件复用和通信困难; ( 2 ) 采用c s 结构,需要服务器的支持,当服务器本身出现问题的时候, 在该服务器上运行的其他应用服务就会受到影响; ( 3 ) 无法跨语言和平台; ( 4 ) 服务的调用采用的是紧耦合方式,异构平台复用困难。 w e bs e r v i c e 以其自身的特点,克服了以上缺陷,目前大多采用w e b s e r v i c e 技术实现s o ”。 2 2w e bs e r vic e 技术 2 2 1w e bs e r vic e 概念 w e bs e r v i c e 是i n t e m e t 以及相关技术发展到一定阶段的产物。w e b s e r v i c e 具有在完全不同平台之间的互操作性,其目的是通过使用w e b 标准 达到应用程序间的互操作。不同的组织从不同的角度对w e b 服务有着不同 的定义啪“: ( 1 ) w e bs e r v i c e 是自包含的、模块化的应用程序,它可以在网络( 通常 为w 曲) 中被描述、发布、查找以及调用。 哈尔滨工程大学硕士学位论文 it i i ll i _ i i i i i i i ( 2 ) w e bs e r v i c e 是基于网络的、分布式的模块化组件,它执行特定的任 务,遵守具体的技术规范,这些规范使得w e bs e r v i c e 能与其它兼容的组件进 行互操作。 ( 3 ) w 曲s e r v i c e ,它是指企业发布的完成其特别商务需求的在线应用服 务,其它公司或应用软件能够通过i n t e m e t 来访问并使用这项应用服务。 虽然文字上的表述不同,但是可以看到一个共同的含义:w e bs e r v i c e 是 指封装成单个实体并发布到网络上的功能集合体。简单地说,w e bs e r v i c e 是 一个u r l ( u n i f o r mr e s o u r c el o c a t o r ,统一资源定位符) 资源,客户端可以 通过请求方式得到它的服务,而不需要知道所请求的服务是怎样实现的,这 一点与传统的分布式组件对象模型不同。 w e bs e r v i c e 是基于网络的、分布式的模块化组件,它执行特定的任务, 遵守具体的技术规范,这些规范使得w e bs e r v i c e 能与其他兼容的组件进行互 操作。w e bs e r v i c e 是用标准的、规范的x m l 概念描述的,成为w e bs e r v i c e 的服务描述。这一描述囊括了与服务交换需要的全部细节,包括消息格式, 传输协议和位置。w e bs e r v i c e 隐藏了服务的细节,允许跨平台、跨编程语言 的调用。 2 2 2w e bs or vic e 构件 ( 1 ) 服务。在这里,w e b 服务是一个由服务描述来描述的接口,服务描 述的实现就是该服务。服务是一个软件模块,它部署在由服务提供者提供的 可以通过网络访问的平台上。服务存在就是要被服务请求者调用或者同服务 请求者交互。当服务的实现中利用到其它的w e b 服务时,它也可以作为请 求者。 ( 2 ) 服务描述。服务描述包含服务的接口和实现的细节。其中包括服 务的数据类型、操作、绑定信息和网络位置。还可能包括可以方便服务请求 者发现和利用的分类及其它元数据。服务描述可以被发布给服务请求者或服 务注册中心。 1 6 哈尔滨工程大学硕士学位论文 2 2 3w e bs e r v i c e 关键技术 w 曲s e r v i c e 使用的关键技术包括x m l 、s o a p 、w s d l 和u d d i 。 1 x m l 龇是一种面向i n t e m e t 应用的标记语言啪,它是由w 3 c ( w b r l dw i d e w e bc o n s o r t i u m ) 组织于1 9 9 8 年2 月制定的一种通用语言规范。x m l 语言 可以将不同形式的内容转化为同一结构,为w e bs e r v i c e 提供了统一的数据 格式。消息、服务描述以及工作流的描述等不同层次的协议,都采用x m l 作为定义语言。 x m l 是一种元标记语言,使用者可根据需要,自行定义标记及属性名, 也可以包含描述法,使x m l 文件的结构可以复杂到任意程度,还可以按照 一定的规则构造描述各专业信息所需的特定标记,从而获得更大的灵活性和 更强的功能,使不同领域的人们可以方便、高效地交换信息。x
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 可选择性捕捞技术创新创业项目商业计划书
- 农产品智慧物流系统集成创新创业项目商业计划书
- 2025年高邮市市级机关公开遴选考试笔试试题(含答案)
- 自动驾驶路线与导航创新创业项目商业计划书
- 输变电设备基础知识培训课件
- 2025年文化旅游演艺项目策划运营中的跨界合作模式创新报告
- 2025年社区心理健康服务人才培训与推广路径研究报告
- 现代教育学原理课件
- 教师资格证考试(中学科目二)教育知识与能力2025年冲刺专项训练试卷
- 2025年Python二级考试考前冲刺试卷 知识点押题实战
- 四年级心理健康上册全册教案
- 印尼劳动法中文版
- 石油钻采设备与工具专业标准分类
- 中式烹调师高级技师试题与答案
- GB/T 3622-1999钛及钛合金带、箔材
- GB/T 20160-2006旋转电机绝缘电阻测试
- FZ/T 73044-2012针织配饰品
- 组织工程及再生医学基本课件
- 智慧矿山为未来煤矿发展赋能课件
- 旅游相册:宁夏旅游课件
- 药物化学(全套课件)
评论
0/150
提交评论