




已阅读5页,还剩67页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
独创性声明 莨 7 6 5 6 3 6 本人声明所呈交的学位论文是本人在导师指导下进行的研究工作及取得的 研究成果。据我所知,除了文中特别加以标注和致谢的地方外,论文中不包含其 他人已经发表或撰写过的研究成果,也不包含为获镦荟俄其他教育机构 的学位或证书而使用过的材料。与我一同工作的同志对本研究所做的任何贯献均 已在论文中作了明确的说明并表示谢意。 学位论文作者签名:7 兹坦 签字日期:庐岁年,月。日 学位论文版权使用授权书 、 本学位论文作者完全了解乞秀老拉多有关保留、使用学位论文的规定 有权保留并向国家有关部门或机构送交论文的复印件和磁盘,允许论文被查阅和 借阅。本人授妨珞尺药以将学位论文的全部或部分内容编入有关数据库进行 检索,可以采用影印、缩印或扫描等复制手段保存、汇编学位论文。 ( 保密的学位论文在解密后适用本授权书) 学位论文作者签名 磁艘 导师签名 锯鳓鲁 签字目期:沙巧年j 月。日 签字日期: 莎多年j 月。日 学位论文作者毕业去向 工作单位: 通讯地址: 电话 邮编 摘要 数据库系统己经成为现代人们进行信息管理最常用的手段。作为计算机科 学技术中发展最快,应用最广泛的重要分支之一,数据库己成为计算机信息系 统和计算机应用系统的重要技术基础和支柱。随着数据库技术的发展,异构数 据库系统的研究已经逐渐成为该领域研究的一个热点。 目前大多数城市的信息化建设中,都面临着政府职能部门之间的数据共享 问题,随着信息化程度的不断提高,部门与部门之间的数据共享需求愈来愈突 出,逐渐成为政府提高实际工作效率的一个瓶颈。 本论文从实际项目的应用出发,分析了在实际项目中实现政务网络系统异构 数据库之间信息共享的局限性:项目投资过高、查询信息不能与实际数据保持实 时一致、重复投资与开发等。根据当前网络数据库技术的发展趋势,本文提出 了基于x m l 的、b s 三层架构的政务网络系统异构数据库之间数据共享的实 施方案。介绍了该方案的整体设计以及几个关键问题的解决方法,包括: 根据各异构数据库共享信息动态生成信息资源目录( 口文d ) ; w 曲方式的中间层数据库设计和管理; 根据共享信息的表及字段动态生成异构数据库s q l 查询语句实现局部数 据查询; 根据数据库结构特征和) 洲l 数据模型特点,设计表结构字段名称与 订l 文档标签之间的对应关系,实现关系数据库数据向标准x m l 文档 的转化。 通过b s 三层架构实现政务网络异构数据库之间数据共享,有投资低,易 管理,效率高等特点,易于在城市信息化建设中推广普及。 关键词: 异构数据库,局部数据集成,信息资源目录,m 。数据模型 基于x m l 的异构数据库数据共享系统的设计 a b s t r a c t a tp r e s e n t ,d a t a b a s es y s t e mh a v eb e c a m et h em o s tu s e dm e t h o di nt h e i n f o r m a t i o nm a n a g e m e n t a st h ef a s td e v e i o p i n ga n dm o s tc o m p r e h e n s i v e i n c o m p u t e rs c i e n c et e c h n o l o g y ,d a t a b a s eh a v ea l r e a d yb e c a m et h e i l p o r t a n tt e c h n o l o g ya n ds u p p o r ti nc o m p u t e ri n f o r i n a t i o ns y s t e ma n d c o m p u t e ra p p l i c a t i o n s y s t e w i t h t h e d a t a b a s e s y s t e m s d e v e l o p i n g ,h e t e r o g e n e o u sd a t a b a s es y s t e mr e s e a r c h i n gi sb e c o i n gt h e h o t s p o t n o w ,i n a n yc i t i e s i n f o r m a t i o nc o n s t r u c t i o n ,t h e r ei sad a t as h a r i n g p r o b l 鲫硼o n gt h eg o v e r n l n e n tf u n c t i o n a ld e p a r t l e n t s 工nc o m p a n yw i t ht h e i i n p r o v i n g o fi n f o r m a t i o n ,t h ep r o b l e mo f d a t a s h a r i n ga m o n g t h e f u n c t i o n a ld e p a r t m e n t si sb e c o m i n gab o t t l e n e c ko nt h ea d v a n c i n go f g o v e r n m e n tw o r ke f f i c i e n c y d e p e n do nt h ep r a c t i c a li t e ma p p l l c a t l o ,t h i sp a p e ra n a l y s e st h e 1 i m i t a t i o ni nt h eg o v e r n f l l e n tn e t w o r ks y s t e 巾h e t e r o g e n e o u sd a t a b a s e s i n f o r a t i o n s h a r i n g s u c ha si n v e s t m e n tt o oh i g h ,s e a r c h i n gi n f o r m a t i o n c a n tk e e pc o n s i s t e n tw i t ht h er e a ld a t a , o v e r l a p p i n gi n v e s t m e n ta n d o v e r l a p p i n gd e v e l o p i n g ,e c t f h s e do nc u r r e n tt r e n do fn e t o r kd a t a b a s e t e c h n o l o g y ,t h i sp a p e rb r i n gu pa ne x e c u t i v e p l a n :”b a s i n go nx m l ,b st h r e e p l ys t r u c t u r eg o v e r n m e n tn e t w o r ks y s t e mh e t e r o g e n e o u sd a t a b a s e s i n f o r a t i o n s h a r i n 9 4 ,a n di n t r o d u c e s t h ep l a n si n t e g r a t e dd e s i g na s w e l la ss e v e r a ls i x t y f o u r d o l l a rq u e s t i o n s s o l u t i o n s t h o s eq u e s t i o n s i n c l u d ea sw e l l :d y n 锄i cc r e a t i n g 工r d ( i n f o r m a t i o nr e c o u r s ed i r e c t o r y ) b a s e do ns h a ? i n gi n f o r m a t i o no fh e t e r o g e n e o u sd a t a b a s e s ,w e bl a y e r d a t a b a s e sd e s i g na n dm a n a g e ,d y n a m i cc r e a t i n gs q lq u e r ys t a t e m e n tt o r e a l i z eh e t e r o g e n e o u sd a t a b a s e s1 0 c a ld a t aq u e r y i n gt h et r a n s l a t i o n f r o m 口u e r yr e s u l tt o :煳ld o c u m e n t t h r o u g ht h em e d i u mo fb st h r e e p l ys t r u c t u r e ,t h em e t h o do fr e a liz e g o v e r n m e n tn e t w o r ks y s t e mh e t e r o g e n e o u sd a t a b a s e sd a t a s h a r i n g ,h a sg o t s e v e r a lm e r i t ss u c ha s :1 0 w i n v e s t 【n e n t ,m a n a g e a b l e n e s s ,h i g h e f f i c i e n c y e t c a n d ,i ti st o oa p tt og e n e r a l i z ea tc i t yi n f o r m a t i o nc o n 言t r u c t i o n k e y w o r d s h e t e r o g e n e o u sd a t a b a s e , l o c a ld a t aq u e r y i n g ,i n f o r m a tio n r e s o u r c ed i r e c t o r y ,x m ld a t am o d e l 2 基于x m l 的异构数据库数据共享系统的设计 第一章绪论 1 。1 本论文研究背景 社会生活信息化、网络化的到来,使信息技术向当今社会全面渗透。推进政 府部门办公自动化、网络化、电子化及全面信息共享已经是大势所趋。 近年来,我国各省市政府部门的办公信息化进度十分迅速,各级政府职能 机关几乎都已经开发或者正在开发自己的办公网络信息系统,但由于各政府职 能部门工作侧重面的差异以及构建自身信息系统的时间、规模等多方面的不同, 这些办公网络信息系统大都采用不同的数据库系统产品,如早期的d b a s e 、 f o x b a s e + 、f o x p r o 等,随着各种大型数据库系统产品的出现,o r a c l e 、h l f b 衄i x 、 s y b a s e 、m ss q ls e r v e r 等各种数据库产品逐渐普及。各种数据库管理系统产品或 者采用不同的数据模型( 如关系模型、面向对象模型) ,或者虽采用相同的数据 模型,却各有各的实现特色,存在明显差别。即使选用同一种数据库管理系统 产品,由于经营方式的差异和设计方法的区别,各部门建立的数据库也往往存 在巨大差异。另方面,大部分数据库系统都是相互独立的实体,他们不希望 外来用户随意操作或控制自己的数据库,要求保持对本地数据库的控制权。但 随着政府部门工作管理力度的不断深入和服务质量需求的不断提高,以及信息 技术的进步,这些由不同核心技术构建的信息系统就像一个个“信息孤岛”,各 自有着不同的处理对象、操作方法和专用客户端,在各个环节之间存在着数据 交流和部门协同的问题,因此,各职能部门之间的信息共享和数据交换逐渐成为 当前实际工作中的迫切需求。 电子政务系统开发中存在的问题是:各政府职能部一般都有各自成熟的网 络信息系统,各部门针对人口的管理与服务基本上都实现了信息化,随着信息 化程度的提高,各部门之间的信息资源共享成为实际工作中提高工作效率的迫 切需要,但是,由于各政府职能部门采用的数据库系统产品的差异,使得它们 基于盖m l 的异构数据库数据共享系统的设计 之间不能够直接互相访问对方的数据资源,“互连共享系统”的研发目的就是为 了将各个政府职能部门的网络信息系统数据库连接起来,形成一个大的政务网 络,从而达到各部门数据资源的共享。 但由于各部门的数据信息根据工作性质的不同而存在不同的侧重,信息侧重 面存在较大的差异,比如公安系统侧重人口户口信息,民政系统侧重人口婚姻 状况信息等。不同部门之间存在的共享需求往往是些基础信息,各部门本身特 殊的工作业务信息不需要或者不适宜在社会上公开。同时,许多单位鉴于本部 门系统安全性考虑不愿让过多的其他部门用户直接操纵本地数据库。典型的解 决方案是:采取局部数据集成技术在网络信息中心构建互连通讯平台来解决多 数据源的连接问题。在网络信息中心为每一个部门建立一个共享数据库服务器, 各部门在属于自己的数据库服务器上建立自己数据库系统,该数据库系统结构 为自身部门系统数据库可以对社会公开的信息结构,也就是说,各部门把自己 能够对社会公开的数据信息( 自身数据库系统的部分数据) 以及这些数据的组 织结构放在网络信息中心的共享数据库服务器上,各部门通过与网络信息中心 各共享数据库的连接,来查询其他部门的共享数据。 各部门根据网络信息中心提供的各服务器连接参数,开发自身的互连共享 系统,该系统要求对其他部门服务器的数据只能进行查询,不能做更改,同时 要对网络信息中心自身部门的共享服务器有相关数据管理功能,比如:从本部 门网络信息数据库中提取收集其他部门需求的信息,发送到网络信息中心本部 门共享数据库,实现本部门数据的对外共享:对网络信息中心本部门共享数据 的删除、更新管理等等。 这种解决方案的系统结构框架图如图卜l 所示: 6 基于x m l 的异构数据库数据共享系统的设计 图l 一1 系统结构框架图 这种模式适用于在城市建设中信息化、网络化的程度比较高,也有较充足的 项目资金来建设高标准的网络通讯设施。在该项目的设计中,为了维护各政府 职能部门数据库的独立性、自主性,而在网络信息中心新组建了各部门的数据 库服务器组,来模拟各部门的系统数据库对外实现各部门信息共享,依次来保 证各部门本身系统数据库的安全,但同时它也存在几个明显的局限性: 一是组建数据库服务器组资金投资比较大,对于资金相对匮乏的城市,专门 建立网络信息中心,建立共享服务器组,搭建共享通讯网络,都是勉为其难的; 二是各部门本身的系统数据库与网络信息中心的共享数据库不能保持实时数据 一致,要通过人为地频繁的收集本部门系统数据库数据来对网络信息中心的共 享数据进行更新,以达到对其他部门进行正确的信息引导:三是网络中心只是 提供了多个部门的数据库数据,对于共享需求来说,只是提供了多个数据源, 尽管对多个数据源的连接和查询都不是十分复杂的工作,但仍需要各个部门自 己去开发实现,在一定程度上造成了重复投资和重复开发。针对这些问题,本 人查阅了大量相关书籍资料,提出了一套基于讧l 的、b s 三层结构的异构数 据库解决方案。 基于x m l 的异构数据库数据共享系统的设计 1 2 本论文研究目的及意义 在目前大多数城市的信息化建设中,都同样面临着各政府职能部门之间的信 息资源共享问题,随着各部门的信息化程度的不断提高,部门与部门之间的信 息资源共享需求愈来愈突出,逐渐成为政府实际工作中提高工作效率的一个瓶 颈。面对不同的城市建设环境,采取一种利用现有网络资源,低投资建设的信 息共享实施方案是相对切合实际的。 本论文提出的基于x m l 的、b s 三层架构的政务网络系统间异构数据库数 据、资源共享的实施方案,不需要过多的项目投资,并且能够根据x m l 的特性 实现实时数据查询,比较好的实现了政务网络系统之间的数据、资源共享,在 城市信息化建设中有一定的实用推广意义。 1 3 本论文的组织结构 本论文共分为八章: 第一章为绪论部分,介绍了本论文的研究背景、研究目的及意义、组织结 构以及主要研究内容。 第二章为异构数据库的发展及现状。介绍了异构数据库问题的产生、异构 数据库的特征、要求、分类以及异构数据库的发展现状。 第三章为x m l 语言的发展及其应用,介绍了标记语言的发展,m 。的组 成、特点,以及,匝与数据库技术、数据交换技术在当前的一切应用。 第四章为基于皿。的异构数据库共享系统设计,从整体上介绍了本文要讨 论的方案的整体设计以及在整个方案中几个关键点的设计说明。 第五章为异构数据库的局部数据集成,本章详细讨论了针对异构数据源, 实现有限制的局部数据查询的实现技术:采用w 曲中间层数据库保存异构数据 源的共享数据结构信息以及数据库的连接参数信息,以此来实现信息资源目录 基于x m l 的异构数据库数据共享系统的设计 的动态生成,阻及异构数据库的连接和动态s q l 查询语句的生成。w 曲中间层 数据库中的信息由各异构数据库的管理员通过w 曲管理共同来维护。 第六章为基于b s 架构数据查询的标准数据模型订l 数据模型,介绍了 半结构化数据模型的特点,l 数据模型的定义以及) 洲l 模型图向) 洲l 文 档映射的方法。 第七章为关系数据库数据向叽格式数据的转化,介绍了从异构数据库中 查询得到的关系型数据结果通过a s p 转化为标准的v i i 。模型数据的方法,以 及转化后的皿文档怎样在客户端正确的显示。 第八章为总结与进一步的工作,从总体上总结了本文所研究的内容及其主 要问题的解决方法,讨论了该方案需要进一步完善的地方以及在实际中下一步 该做的工作。 1 4 本论文主要研究内容 本论文提出的采用b s 三层架构模式,基于x m l 的异构数据库信息共享方 案,用户在客户端只需要w 曲应用程序( w 曲浏览器) 就可以实现异构数据库 的访问查询,也就是说,用户的查询请求在w 曲服务器上经过处理来实现异构 数据库的查询,那么整个查询的过程中,主要的问题有: 1 形成一个全局数据库的资源信息目录 w 曲中间层服务器要把各异构数据源的共享信息形成统一的资源信息目 录提供给用户,在用户面前呈现的是一个透明的全局数据库概念。 2 异构数据源的局部数据查询 由于每个部门都有各自特有的业务信息不适应公开,那么在连接到本 部门数据库的时候,要采取一定措施限制用户的查询范围,以保护本部门业务 数据的安全。 3 各异构数据源共享数据的管理 各异构数据源( 部门) 有范围的共享本部门的数据,本部门共享信息的 基于 【m l 的异构数据库数据共享系统的设计 范围、结构要实现动态管理,可以随时迸行设定或者更新。 4 异构数据库查询结果转化为统一数据格式一x m l 数据模型 由于不同的异构数据源数据库结构存在较大的差别,同时为了进一步的w 曲数 据查询,要把不同的关系型数据转化为半结构化模型的数据,以统一的数据格 式返回给用户。 本论文的主要研究内容就是针对上述几个问题,提出了异构数据库数据共 享的系统设计,并且具体介绍了关键问题的解决方案和相关技术实现。 基于x m l 的异构数据库数据共享系统的设计 第二章异构数据库问题的产生、发展及现状 异构数据库系统( h e t e r o g e n e o n sd a t a b a s es y s t e 珊) 又称为联邦数据库 ( f e d e r a t e dd a t 曲a s e s ) 系统或异构多数据库( h e t e r o g e n e o u sm u l t i d a t a b a s e ) 系统。它既是数据库技术自身发展过程中必然出现的结果,也是新计算机学科 发展的要求。本章将对异构数据库系统的产生背景进行介绍,分析异构数据库 系统对信息管理技术和分布式问题解决研究的支持,介绍了国内外目前在本领 域的研究进展。 2 1 数据库的发展和异构数据库问题的产生 数据库系统的出现,为人们进行信息管理带来了新的手段。作为计算机科学 技术中发展最快,应用最广泛的重要分支之一,数据库己成为计算机信息系统 和计算机应用系统的重要技术基础和支柱。数据库技术的发展过程大致经历了 三个相对阶段:【l 】 2 j 第一个阶段为二十世纪六十年代: 在这一时期,数据库技术及其应用系统开始出现,他们主要应用于商业数 据管理,由于这些应用对象及其要求的限制,当时的数据库系统大多基于层次 数据模型( 以i b m 的树状存储结构的i m s :i n f 0 i m a t i o nm a n a g e m e n ts y s t e m 为代 表) 或网状数据模型( 以图状存储结构的c 0 d a s y l 标准:c o n f e r e n c eo nd a t a s y s t e m sl a i l g u a g e 为代表) 。 第二阶段开始于二十世纪七十年代 1 9 7 0 年至1 9 7 2 年间,e f c o d e 提出了关系数据模型。在此基础上,众多研 究人员对关系数据库模型进行了不断的完善,形成了一套完整的关系数据库理 论。从此宣布了关系数据库时代的开始,数据库从一种实用技术上升到理论。 伴随着关系数据库系统的繁荣以及数据库应用的普及,新的问题开始产生。 对于大型机构而言,由于分支机构的不断产生,需要为其配备相应的数据库应 用系统,原有的集中式应用模型因其功能、速度、安全性以及造价等原因已不 能充分适应新的环境。于是,分布式数据库( d i s m b u t e dd a t a b s e s ) 开始成为数 据库研究的主要方向之一。 基于x h l l 的异构数据库数据共享系统的设计 分布式数据库由多个分布在不同节点( 物理的、逻辑的) 的数据库系统构 成,系统对所有数据库采用统管理,通过提供一种全局的数据库管理系统来 提供相对地域透明的操作环境。分布式数据库系统基本解决了集中式数据库系 统的弊端,但对于那些不断发展的大型机构而言,仍然存在问题:由于不同发 展阶段、不同应用目的而产生的不同数据系统,需要有机的结合在一起共同工 作,这便首次产生了异构数据库系统的研究要求。 第三个阶段是从二十世纪九十年代开始 九十年代数据库面临着新的挑战,在w 曲、新的应用要求以及硬件技术的 若同推动下,数据库不断向更大、功能更强、种类更多的方向发展,由此而产 生的研究方向有:v l d b 、可嵌入的数据库系统、联邦数据库系统( 异构数据库 系统) 、智能一数据研究以及扩充数据类型的研究等 3 】 4 】。 应当说,w 曲的发展促进了异构数据库系统理论的研究。w 曲本身就是一 个大的异构联邦系统,任何想在w 曲上进行信息管理的系统,都必须采用或者 以异构数据库技术为基础( 此处的数据库应当理解为数据源) 。这就要求建立一 个易于数据集成,易于扩展的异构数据库系统( 联邦数据库系统) 。 与此同时,随着网络和分布式研究的发展而出现的一些新的学科,也对异 构数据库提出了研究要求。其中一个重要的学科就是协同问题解决( c o o 口e r a t i v e p r o b l e ms o l v i l l g ) 5 】。 协同问题解决是研究通过主动a g e n t 之间的协调以及动态交互而解决问题 的一门学科。它包括:计算机支持的协同工作( c s c w ) 、智能办公自动化( o a ) 、 分布式入工智能( d 灿) 以及w 曲信息查询与检索等。这些领域共同的特点就是 不再强调问题的集中控制,更注重协同与协作,把问题分解成为多个小问题, 通过一个分布式松散整体内的不同子系统的共同工作来完成任务。因此,它们 对信息支撑环境的要求也与传统的数据库要求有所不同,他们更注重数据库系 统的以下方面: 对分布式的支持 对异构环境的支持 对系统动态性的支持 对信息、知识共享的支持 基于x m l 的异构数据库数据共享系统的设计 对协同的支持 传统数据库用来保存由系统管理和维护的数据的静态描述 数据库内的事务模型是基于“资源竞争”而不是基于“协作” 数据库系统内部的协同是固定的,无法随外部环境变化 这些问题和要求的提出,促使异构数据库的研究必须进一步深入和扩大 同时,也应对其原有的研究方法进行改变。 2 2 异构数据库系统的特征、要求及分类 2 2 1 异构数据库的特征 异构数据库系统是对分布式数据库系统的继承和发展,二者既有相同之处 又有区别。分布式数据库系统与异构数据库系统最根本的区别在于:分布式数 据库系统拥有单一的逻辑数据库,这个数据库可以在物理上分布,但只有一个 d b m s 为其服务,提供一致的查询与更新,严格的说,各个分布子系统必须是 同构的。而异构数据库系统则是有多个异构的、自主的数据库系统为基础,通 过一定程度的集成而构成的一个分布式的数据库系统。 异构数据库的特征则可以从三个方面说明【6 【7 】: 分布性 异构数据库系统的各个组成部分是分布在不同位置的各种数据库系统, 系统通过通讯网络建立各个部分之间的连接。系统的数据保存在分布的 数据库系统中,这些数据可以以各不相同的方式保存,没有严格的逻辑 要求。 异构性 排除数据库宿主系统的异构性,异构数据库系统的异构性主要有两方面 构成: a 数据库管理系统( d b m s ) 的异构 由于组成系统的各个数据库系统可以不同,因此形成了d b m s 的异构, 这种异构实质上可以分为以下三个方面: 1 ) 结构的区别:根据不同的方法沦,d b m s 采用不同的数据模型和 基于捌l 的异构数据库数据共享系统的设计 数据结构,反映在物理上的存储方法也可能不同。 2 ) 查询规则的不同:不同的数据模型造成了不同的规则,不同的规则 又直接影响数据库功能的实现。一个d b m s 因此可以是适应型的 或是被动型的。 3 ) 查询语言的不同:不同的数据模型,必然要造成不同的数据类 型,所采用的数据操作机制也不同,即使支持相同的标准,但 不同d b m s 采用的查询语言也有所区别。 b 语义的异构 与d b m s 的异构不同,语义的异构是由于数据库的使用人员对数据的 定义、作用以及描述的二义理解造成的。由此可能造成的异构情况 有: 1 ) 命名的异构:由于不同应用需求及方法论,对相同的现实世界实 体及其属性采用不同的命名方法,造成命名的冲突: 2 ) 数据存储种类的异构:相同或相似的现实世界数据,存在着表达 的多样性,因此表现在不同数据库系统中存储方式也不同,这些 不同可以是数据类型、范围、精度以及组成部分的异构。因此, 在一个数据库中可以采用整型表达的数据,很可能在另外一个数 据库中采用字符串表示,而在第三种数据库中则变为某种对象的 一个属性: 3 ) 关系表达的异构:因为不同环境及需求,先是世界中两个事务之 间的关系可以从多方面理解,由此而造成在数据库中关系户表达 的异构,这种异构与该数据库系统采用的数据模型也密不可分, 最可能出现的情况就是数据的分割和组合以及关系连接的不同; 4 ) 数据遗漏及冲突:不同的应用对数据对象的不同侧面要求不同, 很可能在某个领域内非常必需的数据在另外一个环境中却可以忽 略,或者实际上是另外一种数据,所以数据的遗漏和冲突在所难 免。 自主性: 1 4 基于】( i l 的异构数据库数据共享系统的设计 构成异构数据库系统的各个予系统具有各自的自主性,这些自主性体现 在它们拥有对自身系统内各种资源的使用权利,包恬设计、执行、修改 等,同时,它们拥有与其它系统的交互的权利,包括加入、退出、通讯、 提供服务等。它们有权利接受外来的服务请求,也有权利拒绝或者请求 服务的权利。但是,在这些权利与承诺的系统义务之间,必须有一个有 机结合。 2 2 2 对异构数据库的要求 根据异构数据库的特征,在其构造过程中必须满足一系列要求: f 1 1 全局数据模型 负责在用户与异构数据源之间提供一个中间部,实现数据操作的地域透明 性。目标是建立一个对用户而言统一、一致的数据源,它对各个子数据库系统 而言是一对多的映射模型。其中最重要的工作是建立全局数据字典,它负责对 网络数据库中所有数据的定义及分布进行描述,并对全局用户的设计进行局部 转换,完成“透明部分”的初步工作。 f 2 ) 全局定位功能 在系统处于动态环境的情况下,必须有一种机制负责提供系统内各种数据 库( 或信息源) 的名字与位置的定位服务,负责记录系统成员的注册与撤销,满足 系统各部分之间必须的可知性要求。 ( 3 ) 不完整和不一致处理 由于语义异构的存在,必须提供一种更为全面的语义信息服务,补充全局 信息描述和定义,避免数据操作时产生数据信息的混乱和丢失。 h ) 多数据库查询语言 由于各个d b m s 的异构,所以不能采用其中某一d b m s 的数据操作语言作 为全局范围工作的语言,必须设计一种能够承担全局数据表达,同时又易于进 行全局到局部转换的多数据库操作语言,使全局任务转化为全局结果的一部分 基于x h i l 的异构数据库数据共享系统的设计 时保持信息的一致性和可理解性。 ( 5 ) 安全管理 由于不同数据库系统的加入,必须对用户授权进行灵活而严格的管理,不 同子系统的用户在操作其它系统时应当考虑对其的授权。系统必须避免为恶意 用户提供服务承诺。同时,分布式的系统环境促使在进行不同孑系统间的数据 传输时,应当充分考虑信息的安全性。 ( 6 ) 扩容能力 随着基于网络的数据库的增加,联邦系统的规模必然将不断发生变化,由 于系统处于一个动态的环境,因此必须考虑系统扩容的方式及安全性。 同时,随着系统容量的增加,传统的查寻方法和工作流程己经不再适用, 必须考虑新的查询优化算法以及数据复制机制。 ( 7 ) 数据浏览能力 随着w 曲及多媒体技术的发展,数据库保存的信息种类也发生了巨大变化。 在已经获得结果数据的情况下,如何与数据来源进行交互。获得结果信息的处 理方式,将直接影响系统对用户提供的服务。 ( 8 ) 事务处理功能 由于不同的数据库系统采用的事务管理方式不尽相同,以及各个组成数据 的自主性,全局事务管理无法控制局部事务管理,因此很难实现全局数据的一 致性,同时,并发控制和数据恢复工作也因此而变得难以实现。如何将局部事 务处理与全局事务处理结合起来,一直是一个复杂的课题。 2 2 3 异构数据库的分类 异构数据库系统,又可以称异构多数据库系统。他是多个分布在不同地域 的异构数据库按照一定规则集成的一个松散系统,它可阻向用户提供地域通明 的全局数据服务。根据数据库间的结合程度以及全局数据服务的类型,可以对 其进行分类【8 9 。 首先,按照各个局部数据库的自主性可以分为非联邦数据库和联邦数据库 基于) 【m l 的异构数据库数据共享系统的设计 系统。非联邦数据库系统的各个局部数据库不再有自主性,通过实现它们的内 部功能函数,系统将它们紧密结合,构成一个单一的全局表空间,并提供统一 的操作接口,所有用户不再区分局部用户还是全局用户,从逻辑上看类似分布 式数据库。联邦数据库系统是由一些自主的局部数据库构成,这些数据库允许 部分地、有控制地共享它们的数据,但是对本地数据的管理权归它们自身所有。 联邦系统没有集中控制机制,各个局部数据库通过协作实现不同程度的集成, 系统通过用户接口与这些局部数据库进行操作,因此在局部数据库d b a 看来, 全局用户的操作和局部用户的操作没有什么区别。联邦数据库同样向用户提供 一种全局服务,但是这种服务只对全局用户开放,局部用户不能获得。 其次,根据对联邦数据库的控制及操作方式,可以将联邦数据库分为松散 型联邦数据库和紧密型联邦数据库。松散型联邦数据库没有全局数据管理存在, 用户必须通过特定的多数据库操作语言及自己对联邦的定义、维护来实现数据 运营。紧密型联邦数据库拥有全局数据表( 又称联邦表) 和全局数据库管理员, 由管理员负责创建和维护全局表,并向用户提供统一的数据操纵接口。 最后,根据全局表( 联邦表) 的数量来可以将紧密型联邦数据库分为单联 邦数据库和多联邦数据库。单联邦数据库只有一个联邦表存在,而多联邦数据 库则可以为不同用户群建立多个联邦表。 以上是对异构数据库系统的分类,由于本文的工作是在b s 三层结构上实 现异构数据库的信息共享,在中间层建立有全局数据表和全局数据库管理员来 对用户提供地域透明操作的具有全局管理功能异构数据库联合使用系统,所以, 本文的系统应当属于紧密型多联邦数据库系统。在以后的内容里,如果没有特 殊说明,异构数据库默认为紧密型多联邦数据库。 2 3 异构数据库的研究现状 对信息支持的要求推动着异构数据库技术的研究发展。从二十世纪八十年 代后期开始,国内外大量的大学、公司、机构都在进行异构数据库的研究,相 继有许多科研成果开始出现。进入九十年代后期,随着新的设计思路的出现, 异构数据库的设计方法也开始有了新的发展,一些数据库公司开始将其成果转 1 7 基于x m l 的异构数据库数据共享系统的设计 换为产品,但这些产品功能尚不完备,或者只能使用与某些特定的数据库连接, 总体来说,不尽人意,以至于在市场上难以顺利的推广普及。 ( 1 ) i b m 的d b 2d a t a j o i n e r d b 2d a t a j o i n e r 是i b m 公司生产的一种中间件产品。该中间件可以提供对 异构数据源的透明s q l 访问,并可以进行连接操作、同时,该中间件还拥有以 下功能:企业数据复制、管理空间( s p a t i a l ) 和多媒体数据、全局查询优化重写 能力、提供基于j a v a 的w e b 连接等。 d b 2d a t a j o i n e r 提供了以下具有全局概念的功能:全透明d b 2s q l 、全局 两段提交、全局存储进程、全局数据定义语言、全局递归s q l 、全局解释以及本 地数据存储等功能。d b 2d a t a j o i n e r 支持i b ma 工x 、s u no s 、h p u x 以及w i n d o w n t 等操作系统,通过i b md b 2c l i e n ta p p l i c a t i o ne n a b l e r ( c a e ) 可以从其它系 统平台上对其进行访问,它所支持的标准有:o d b c 、j d b c 、x o p e nc l i 和】( a 事 务,同时d a t a j o i n e r 支持当前流行的大多数数据库前端开发工具和编程语言。 应当说,d a t a j o i n e r 并不是一种异构数据库系统,而是一种能够实现异构数据 库联合使用的数据存取中间件,i b m 推出它的目的是为了帮助其电子商务方案的 推行。 ( 2 ) s y b a s e 的e n t e r p r i s ec o n n e c t 与i b m 的产品类似,e n t e r p r i s e c o n n e c t 也是一种中间件产品,e n t e r p r i s e c o n n e c t 声称可以在不改变应用程序的情况下实现信息的合并与分散,能够实现 异构数据的集成与复制,同时,他支持多达2 5 种企业数据库,并提供简单易用 的用户界面。e n t e r p r i s ec o n n e c t 构成的是一种三层模式的应用,提供客户端 程序以及用户a p i ,以方便二次开发。 ( 3 ) d h a r m as y s t e m 公司的e u n i f y e u n i f y 是d h a r m as y s t e m 公司的一套异构信息联合使用解决方案。该方案 包括一系列产品。e u n i f y 的目的是提供一套具有全局统一观点的应用服务器产 品,构造一个三层结构的应用。e u n i f y 的关键产品是d h a r m ai n t e g r a t o r ,它 负责提供所有信息源的统一视图( u n i f i e dv i e w ) ,然后通过工业标准接口与通 常的应用服务器连接,而在d h a r m ai n t e g r a t o r 内部,则有一系列软件用于连 接不同类型的异构信息源,如: 基于x m l 的异构数据库数据共享系统的设计 d h a r m aa p p l i n k 连接如s a p 、a s 4 0 0 等用户应用系统; d h a r m al e g a c y l i n k 连接继承数据库如v s a m 、i s a m 等; d h a r i ar e l a t i o n a l l i n k 连接现有的各种关系数据库: d h a r m ad a t a l i n k 连接客户私有数据源。 d h a r m ai n t e g r a t o r 可以实现统一视图范围内所包含数据的各种复杂操作, 能够制定信息源与应用之间的信息传送规则,具有基于内容的路由功能,另外 还可以提供逻辑统一视图等一些全局操作必要的功能。 ( 4 ) w a s h i n g t o n 大学研制的t u k w i l a 数据集成系统。 t u k w i l a 系统的设计目的是实现i n t e r n e t i n t r a n e t 环境中异构数据库联合 查询的功能。它由五部分构成:用户接口、查询再处理部件、支持信息库、优 化规划部件、执行引擎和信息、包装器构成。系统向用户提供一个m e d i a t e d s c h e m a ,其中包括各种特殊领域以及该领域内的不同数据源,系统将用户对 m e d i a t e ds c h e m a 的查询转化成对相应数据源的查询,并将结果采用“流”的方 式返还给用户。 t u k w i l a 系统核心采用两叉计划执行方案以提高其适应能力,交叉计划和局 部优化执行能够使它很快从错误估计目标中恢复,增强了对动态环境的适应性。 t u k w i l a 系统能够支持x m l 对象操作。 ( 5 ) u n i s y s 的m e r i i l a i d m e r m a i d 的开发工作是从d a t ai n t e r a t l 0 n 公司开始的。其目标是为d o d 提 供一种实现自主数据库之间数据集成和操作方法。系统使用s q l 语言访问和集 成来自不同数据库的数据。系统可以对多个数据库进行联合检索,但事务处理 只能对准单数据库。 m e r m a i d 由四部分组成:用户接口、服务器、数据字典目录( d d d ) 以及 d 酬s 接口。全部部件采用r p c 方式相互访问,系统基于t c p i p 协议网络,由 于采用模块化结构,系统有很大的灵活性。m e r l i l a i d 采用动态查询优化,全局数 据模型采用关系型数据方式。 ( 6 ) 瑞土s f i t 的f e m u s 系统 f e 删s 系统的目的是建立一个可以提供多语言接口联邦数据库系统。它由6 层s c h e m a 机构和一个联邦服务器( f e d e r a t i o ns e r v e r ) 构成。其中,联邦服务 基于删l 的异构数据库数据共享系统的设计 器是整个系统的核心,它负责提供联邦内复杂的目录服务,存储和管理输出表 的服务,对联邦内可用的表生成工具的定位服务等。联邦内的各个组成部分都 包含以下类型的表:本地概念表、系统组成部分表、输出表、输入表和本地联 邦表。后面四种表构成了一个联邦部件的联邦接口。 ( 7 ) 东大阿尔派的r d b m so p e n b a s e 1 6 该系统基于c l i e n t s e r v e r 架构,支持0 d b c 标准,提供w e b 连接方案。 是国内目前唯一商业化的软件。 ( 8 ) 东南大学的联邦数据库管理系统 采用紧凑的联邦数据库模型,实现了不同数据库的接口问题,并在分布式 查询优化方面做出了很多工作。 2 0 基于x m l 的异构数据库数据共享系统的设计 第三章x m l 语言的发展及其研究应用 3 1 标记语言发展 1 s g m l 的发展 1 7 在计算机发展的早期,在电子文档中含有一些控制代码或宏来使文档按某 种特定的方式格式化,这被称为特殊编码。而6 0 年代末期出现的通用编码则使 用描述性的标签,如用h e a d i n g 表示标题等来描述文档的格式。1 9 6 9 年,i b m 公司的技术人员c h a r l e sg o l d f a r b 和e d w a r dm o s h e r 、r a v l n o n dl o r i e 一起发 明了通用标记语言g m l ( g e n e r a l i z e dm g r k u pl a n g u a g e ) 。它在各文档之间共享 一些相似的属性,诸如字体大小和版面等,来允许文本编辑、格式化和信息检 索等子系统共享文档。g m l 的大部分内容被i b m 和其他公司实现在主机时代的出 版系统中,获得了工业界的接受。而i b m 自己作为世界第二大出版商,现在仍 在9 0 以上的文档中采用g m l 。1 9 7 8 年,a n s i 成立了文本处理计算机语言委员 会,它和g c a 的g e n c o d e 委员会起于1 9 8 0 年在g m l 的基础上制定了 s g m l ( s t a n d a r dg e n e r a lm a r k u pl a n g u a g e ) 的第一份工作草案。s g m l 是一种元 标记语言,实际上它是易用通用的文档结构描述标记语言,主要用来定义文档 模型的逻辑结构和物理结构。在1 9 8 6 年,标准通用标记语言s g m l 。成了国际标 准( i s 0 8 8 7 9 ) 。 一个s g m l 文档由三部分组成: 1 ) 语法定义语法定义规定了文档类型定义和文档实例所必须遵循的语法 结构。 2 ) 文档类型定义( d t d ) 文档类型定义规定了文档实例的结构和组成结构 的元素类型。 3 ) 文档实例文档实例是s
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 宫腔镜手术管理制度
- 家庭式公司管理制度
- 应急供水点管理制度
- 录播室控制管理制度
- 影楼摄影部管理制度
- 微生物菌种管理制度
- 心理能力与管理制度
- 快递分拣仓管理制度
- 怎样做人员管理制度
- 总成修理间管理制度
- 2025浙江中考:政治必背知识点
- 2025江西中考:历史高频考点
- 品控考试题及答案
- 急性心肌梗死诊断分型及再灌注治疗策略李轶课件
- 船舶消防知识试题及答案
- 《建党伟业》观后感课件
- 专题08 文学作品阅读(必考题型梳理)60题(原卷版)-2023-2024学年八年级语文下学期期中专题复习(浙江专用)
- 2025年安全生产月主题宣贯课件
- 微生物检验数据记录与管理试题及答案
- 广东省美术试题及答案
- 数学建模思想在中小学数学课堂教学中的应用研究
评论
0/150
提交评论