(电路与系统专业论文)web分布式数据库系统研究与实现.pdf_第1页
(电路与系统专业论文)web分布式数据库系统研究与实现.pdf_第2页
(电路与系统专业论文)web分布式数据库系统研究与实现.pdf_第3页
(电路与系统专业论文)web分布式数据库系统研究与实现.pdf_第4页
(电路与系统专业论文)web分布式数据库系统研究与实现.pdf_第5页
已阅读5页,还剩107页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

if石 页 士学位论文u % s t e r s t h e s i s明查询。 在这个应用系统中, 各个分公司场地上数据的透明查询,都将总公司做为一个应用服务器。 分布数据的透明查询的具体实现是: 首先, 某一个分公司给出需要查询的数据, 通过该分公司与总公司事先定义的连接, 在总公司的数据库中进行查找, 如果没有找到, 在总公司场地上,分门 别类地到相应的分公司的数据库中查找,如果找到, 就将查找结果返回给请求查找的场地, 如果没找到,则将没有找到信息返回给请求查找的场地。 在总公司场地上不但可以接收各个分公司场地上传来的数据,而且能以w e b 技术发布到i n t e r n e t网上。 关键词: 分布式数据库管理系统,数据管道,数据传输, 全局数据库, 局部数据库第 1 1页 共v页a b s t r a p 二t i n f o r ma t i o nl o c a t i o n - d i s t r i b u t e dm i g h t b es t o r e dmh e t e rmd i s t r i b u t e dlg e n e o u sd a t a b a s es y s t e m e n v i r o n m e n t s . h o w t o s e l e c t a n d r e n e w d a t ad i s t r i b u t e d i n d i s t r ib u t e d d a t a b a s e s y s t e m i n g l o b a llo g i c i s p r o b l e m s w h i c h d i s t r i b u t e d d a t a b a s et e c h n o l o g i e s m a i n l y s o l v e . d i s t r i b u t e d d a t a b as et e c h n o l o g i e s a r e c o m b i n e d w i t h d a t a b ase t e c h n o lo g i e sa n d c o m p u t e r n e t w o r k t e c h n o l o g i e s . b e s i d e s t h ec h a r a c t e r s o f c e n t r a l d a t a b ase , i t h a s i t s o w ns p e c i a l it i e s :i t n o t o n l y t h i n k s o f t h e a u t o n o m y o f l o c a l n o d e ,b u tf o c u s e s o n s o l v i n g t h e l o g i c a l i n t e g r i t y o f g l o b a l d a t a b a s e ;e x c e p t t h a t i t p o s s e s s e s l o g i c a l i n d e p e n d e n c y a n d p h y s ic a li n d e p e n d e n c y t h a t c e n t r a l d a t a b a s e h a s , i t h as d a t a d i s t r i b u t i o ni n d e p e n d e n c y t h a t i n c l u d e s t h r e e l a y e r s o f m e a n i n g s w h i c h ,f r o m t h e t o p t o t h e b o tt o m ,i n t u r n a r e : s l i c i n g t r a n s p a r e n c y、a l l o c a t i o n t r a n s p a r e n c y 、d a t a t y p e t r a n s p a r e n c y o nl o c a l n o d e. i n a d d i t i o n , i n q u e ry c o n d u c t、 t r a n s a c t i o nm a n a g e m e n t 、c o n c u r r e n c e c o n t r o l、d a t a i n t e g r i t y a n ds e c u r i t y a n d s o o n, d i s t r i b u t e d d a t a b a s e s y s t e m h a s m o r ec o m p l e x a n d r i c h e r c o n t e n t . t h e d i s s e r t a t i o n s i m p l y i n t r o d u c e s s o m e k n o w l e d g eo f c e n t r a l d a t a b a s e a t f i r s t , t h e n m a i n l y i n t r o d u c e ss o m e k n o w l e d g e o f d i s t r i b u t e d d a t a b a s e i n c l u d i n gt h e s y s t e m s t r u c t u r e o f d i s t r i b u t e d d a t a b a s e s y s t e m 、d a t a s l i c i n g a n d d a t a a l l o c a t i o n 、d i s t r i b u t e d q u e ryc o n d u c t、 d i s t r i b u t e d t r a n s a c t i o n m a n a g e m e n td i s t r i b u t e d c o n c u r r e n c e c o n t r o l 、 d i s t r i b u t e d d a t a b a s ei n t e g r it y a n d s e c u r i t y a n d d i s t r i b u t e d d a t a b a s es y s t e m d e v e l o p m e n t , a t l a s t g i v e a t a n g i b l ea p p l i c a t i o n e x a m p le o f d i s t r i b u t e d d a t a b as e s y s t e m . t h e e x a m p l e i s t h a t e a c h s u b - c o m p a n y i n ag e n e r a l c o m p a n y t r a n s f e r t h e d a t a i n i t s o w nd a t a b a s e i n t o t h e d a t a b a s e s e r v e r o f t h e g e n e r a lc o m p a n y s o t h a t t h e g e n e r a l m a n a g e r a n a i y s e s a n d第 i i i 页 共v页一导硕士学位论又 i a 51 f k 、t f i p v e v a l u t e s t h e p r o d c t i o n a n d m a n a g e m e n t o f e a c hs u b - c o m p a n y t h r o u g h w h i c h t h e m a n a g e r m a k e sg e n e r a l d e c i s i o n s . t o r e a l i z e t h i s t a r g e t,d a t a b a s e so f e a c h s u b - c o m p a n y a n d t h e g e n e r a l c o m p a n y a r ei n d i s p e n s i b l e , in a d d i t i o n , d a t a m u s t b e t r a n s f e r r e db e t w e e n e a c h s u b - c o m p a n y a n d t h e g e n e r a lc o m p a n y t h r o u g h t h e l o c a l a r e a n e t w o r k o r w i d ea r e a n e t w o r k . d a t a t r a n s f e r i s r e a l i z e d b yp o w e r b u i l d e r p i p e l in e . i n a p p l i c a t i o n p r o g r a m m e ,a l s o g i v e t a n g i b l e r e a l i z a t i o n o f s e c u r it y o f t h ed i s t r i b u t e d s y s t e m a n d t h e m a n a g e m e n t o fd i s t r i b u t e d d a t a a n d t h e t r a n s p a r e n t q u e r y o f d i s t r i b u t e d d a t a .t h e m a n a g e m e n t o f d i s t r i b u t e d d a t a i n c a m a t e s l o c a ld a t a s i n d e p e n d e n c e g l o b a l d a t a s i n t e g r i t y a n d t h er e l a t i o n o f l o c a l d a t a a n d g l o b a l d a t a t h r o u g hd a t a t r a n s f e r . t h r o u g h t h e s e c u r i t y p r o t o c o l , t h es e c u r i t y o f d a t a t r a n s f e r c a n b e e n s u r e d .a p p l i c a t i o ns y s t e m s s i m i l a r t o t h e a p p l i c a t i o n s y s t e m u s u a l l y a d o p t t w ol a y e r s t r u c t u r e o f c l i e n t / s e r v e r .t h e a p p l i c a t i o n s y s t e m a d o p tt h r e e l a y e r s t r u c t u r e , w h i c h e x t e n d s a p p l i c a t i o n s c o p e o f t h ea p p l i c a t i o n s y s t e m . . o n e v e r y s u b - c o m p a n y n o d e , n o t o n l yt r a n s f e r d a t a i n t o t h e d a t a b a s e o f t h e g e n e r a l c o m p a n y ,b u t a l s oa m o n g s u b - c o m p a n y n o d e r e a l i z e t h e t r a n s p a r e n t q u e r y o fd i s t r i b u t e d d a t a. i n t h i s i m p l i c a t i o n s y s t e m , t h e t r a n s p a r e n tq u e r y o f d i s t r i b u t e d d a t a o n e v e ry s u b - c o m p a n y n o d e a l lr e g a r d s t h e g e n e r a l c o m p a n y n o d e a s i m p l i c a t i o n s e r v e r . t h e r e a l r e a l i z a t i o n o f t h e t r a n s p a r e n t q u e r y o f d i s t r i b u t e dd a t a i s :a t f i r s t , i f s o m e s u b - c o m p a n y w a n t s t o q u e ry d a t a , t h es y s t e m f i r s t q u e ry d a t a i n t h e d a t a b a s e o f t h e g e n e r a l c o m p a n yt h r o u g h t h e l i n k b u i lt p r e v i o u s l y b e t w n n e t h e s u b - c o m p a n y a n dt h e g e n e r a l c o m p a n y , i f n o t f i n d ,t h e n o n t h e g e n e r a l c o m p a n yn o d e , q u e ry d a t a b y s o rt o f d a t a i n t h e d a t a b a s e o f a p p r o p r i a t es u b - c o m p a n y n o d e s , i f f i n d , t h e n r e t u r n t h e r e s u l t o f q u e ry t o t h en o d e t h a t a s k s f o r q u e ry q u e s t ; i f n o t f i n d ,t h e n r e t u rn t h ei n f o r m a t i o n o f n o f i n d i n g . o n t h e g e n e r a l c o m p a n y n o d e ,n o t o n ly r e c e i v e t h e d a t a第 i v 页 共v页硕士学位论文m a s t e r s t h e s i st h a t s u b - c o m p a n y t r a n s f e r ,b u t a l s o p u b l i s h i n f o r m a t i o n t h r o u g hwe b t e c h n o l o g y o n i n t e r n e t . k e y w o r d s :s y s t e m , p i p e l i n e ,l o c a l da t a b a s edi s t r i b u t e d da t a d a t a t r a n s f e rb a s e ma n a g e me n tg l o b a l d a t a b a s e ,第 v 页 共v页爵b ji 士学位 论文1 1 1 5 丁 f h 、t h e si s食 - - - - .% 良 - 4 -刁 丁二 干,j . 匀1 ., 引言 数据库系统, 尤其是关系数据库系统的 进展, 使得计算机领域发生了急剧变化,在当今社会中,任何信息处理系统都离不开它。与此同时,另一技术领域 一计算机网络,以其技术的不断创新,不断为适应更多的应用也取得了可喜的成就。特别是数据库技术和计算机网络技术的结合,形成了又一新领域一分布式数据库系统。实现和建立分布式数据库系统绝不是将数据库技术和网 络技术的简单结合,而是两种技术的互为渗透与融合。它要管理的不是单个数据库系统,而是分布于许多不同地域 ( 或场地)上的多个数据库系统。 分布式数据库系统虽然是基于集中式数据库统, 但它有其自身的 特色和自 成系统的理论基础。由于它的分布环境及固有的难度,至今其商用系统并不多,但其研究并没有停止,而是和计算机技术的其它领域互相推动, 特别是信息高速公路的发展,使得分布式数据库的研究更加活跃。分布式数据库技术的一些技术将是今后研究数据库技术新进展的一个基础。在本篇文章里将研究以 下内容:第一章介绍数据库的有关概念及基本知识;第二章介绍分布式数据库系统体系结构; 第三章介绍数据分布;第四章介绍分布式查询处理;第五章介绍分布式事务管理;第六章介绍分布式数据库的完整性与安全性;第七章介绍分布式并发控制;第八章介绍分布式数据库设计;第九章介绍一个分布式信息管理系统实例.第 i页 共 1 0 7 页困b l - .iiaster , i 派1 . 2 集中式数据库系统简介1 . 2 . 1 集中式数据库系统的特点 数据库系统是针对文件系统的缺点而提出的, 以最大限度地 减少数据冗余和提供数据共享。一般来说,它有以下特点: ( 1 )面向全组织的复杂的数据结构。 具有较高的数据和程序独立性。 ( 4 )统一的数据控制功能。数据库是系统中各用户共享的资源,计算机的共享一般是并发的,即许多用户同时使用数据库。因此系统必须提供三个方面的数据控制功能:数据的安全性控制;数据的完整性控制;并发控制。 5 )数据的最小存取单位是数据项,既可以 存取数据库中某一个数据项或一组数据项,也可以存取一个记录或一组记录。1 . 2 . 2数据模型 在数据库中,用数据模型来对现实世界进行抽象的,数据模型是数据库系统中用于提供信息表示和操作手段的形式构架。数据模型通常由 三部分组成: 数据结构、数据操作和完整性约束。 ( 1 ) 数据结构 数据结构是所研究的对象类型的集合。这些对象是数据库的组成的部分,一般可分为两类:一类是与数据类型、内容、性质有关的对象;一类是与数据之间联系有关的对象。 c a ) 数据操作 数据操作是指对数据库中的各种对象的实例允许进行的操作的集合,包括操作及有关的操作规则。数据库中主要有检索和更新 ( 包括插入、删除、修改)两大类操作。数据模型要定义这些操作的确切含义,操作符号,操作规则以及实现操作的语言。第 2页 共 1 0 7 页硕士学位论文k 1 1 s i e r s 1 h e s i s ( 3 ) 数 据的 约束 条 件 数据的约束条件是完整性规则的集合,完整性规则是给定的数据模型中数据及其联系所具有的制约和依存规则,用以限定符合数据模型的数据库状态以 及状态的变化以保证数据的正确、有效和相容。数据模型应该反映和规定这种数据模型所必须遵守的基本的通用的完整性约束条件。此外,数据模型还应该提供定义完整性约束条件的机制以反映某一部门的应用所涉及的数据必须遵守的特定的语义约束条件。1 . 2 . 3 三种主要的数据模型 当前,实际数据库系统中主要支持数据模型是: 层次数据模型 网状数据模型 关系数据模型 下面一一简单介绍。( 1 )层次数据模型 两个记录型及它们之间的一对多 ( 包括一对一)的联系称为基本层次联系如图1 . 1 . r ; 图1 . 1 .基本层次联系 图1 . 1 . 中 , r , 位 于l ;j 的 结 点 , 称为 双 亲 记 录 , 玛 位 于l ;j 的终点,称为子记录。在数据库中,定义满足下面两个条件的 “ 基本层次联系”的集合为层次关系:有且仅有一个结点无双亲,其它结点有且仅有一个双亲这个结点称为根结点。 在层次模型中,同一个双亲的子女结点称为兄弟结点。没有子结点的结点称为叶结点。在层次模型中,每个记录只有一个双亲结点,即从一个结点到其双亲结点的映象是唯一的, 所以 对于每个记录 ( 除根结点)只需要指出它的双亲记录,就可以表示出第 3页 共 1 0 7 页及卜纂夕 一二点字位;兰层次模型的整体结构。由上面的讨论可知, 层次模型就是一棵树。( 2 )网状数据模型在网状数据模型中,允许:有一个以上的结点没有双亲。结点可以有多于一个的双亲。 从上面讨论可知, 层次数据模型与网状数据模型不同有二点: 层次数据模型中从子女到双亲的联系是唯一的, 而网状数据模型可以不唯一,因此在网状数据模型中不能只用双亲记录来描述记录之间的联系,而必须同时指出双亲记录和子女记录,并且给每一种联系命名。 网状数据模型中允许复合链, 层次数据模型则不允许。即两个记录之间可以有两种以上的联系, 这在网状数据模型中允许,而在层次数据模型则不允许。( 3 ) 关系数据模型 在关系数据模型中, 数据在用户观点下的逻辑结构是一张二维表。在关系数据模型中,有以下重要概念: 关系对应一张二维表。 元组表中的一行称为一个元组。 属性表中的一列称为属性。 主码表中的某个属性组, 它们的值唯一的标识一个元组。 域属性的取值范围。 分量元组中的一个属性值。 关系模式对关系的描述, 用关系名 ( 属性名 1 ,属性名2 , . . . , 属性名n )来表示。 关系数据模型具有如下特点:关系数据模型的概念单一。无论是实体还是实体之间的联系都用关系来表示。 关系必须是规范化的关系。 规范化是指在关系数据模型中,每一个关系模式要满足一定的要求或者称为规范条件。最基本的一个规范条件是每一个分量是一个不可分的数据项,亦即不允许表中有表。 在关系数据模型中, 用户对数据的检索操作不过是从原来的表中得到一张新表。这说明:在用户的眼里,无论是原始数据还是结果数据都是同一数据结构一二维表;关系数据模型的操作都是集合操作,即操作对象和结果是元组集合,而不是单记录的操第 4页 共 1 0 7 页硕士学位论文4 1 1 sf f r s t h 6 s i 5作方式;关系数据模型把存取路径向 用户隐藏起来,用户只要指出“ 干什么” 或“ 找什么” , 不必详细说明“ 怎么干” 或“ 怎么找” ,这大大提高了数据的独立性。1 . 2 . 4 数据库系统三级模式结构大多数数据库系统在总的体系结构上具有三级模式的结构特征,即外模式、 模式 、内模式,如图i . 2 .数据库图1 . 2 . 数据库系统三级模式 ( 1 ) 模式 亦称逻辑模式,是库中全体数据的逻辑结构和特性的描述,是所有用户的公共数据视图。 它不涉及数据物理存储细节和硬件环境,也与具体的应用程序及使用的高级程序设计语言无关。模式不仅仅是数据的逻辑结构的定义,而且要定义与有关的安全性、完整性要第 5页 共 1 0 7 页爵a ,6 士学位论文% i a s i e r s t i i e s i 二气二 一_ _ 一_求。 不仅要定义记录内部的结构, 而且要这些数据项之间的 联系,进一步地要表示不同记录之间的联系。数据库系统提供模式描述语言 ( 模式d d l )来严格地表示这些内容。用模式d d l写出的一个数据库逻辑定义的全部语句,称为一个数据库的模式。模式是对数据库结构的一种描述,而不是数据库本身,它是装配数据的一个框架。 ( 2 )外模式 亦称用户模式或子模式,是数据库用户看到的数据视图。不同的用户的外模式可以相互覆盖。同一外模式可以为某一用户的任意多个应用所启用。一个应用只能启用一个外模式。外模式通常是模式的子集,它是各个用户的数据视图,而不同的用户其需求不同,看待数据的方式可以不同,使用的程序设计语言可以不同。因此不同用户的外模式描述不同。即使对模式中同一数据,在外模式中的结构、类型、长度、保密级别都可以不同。数据库系统提供外模式描述语言 ( 外模式 d d l )描述用户数据视图。用外模式d d l写出的一个用户数据视图的逻辑定义的全部语句称为此用户的外模式。外模式d d l 具有用户选用的程序设计语言具有相容的语法。( 3 ) 内模式 内模式是全体数据库数据的内 部表示,用来定义数据的存储方式和物理结构。内 模式通常 用内 模式数据描述语言 ( 内 模式d d l )来描述。( 4 ) 二级映象 对应于同一个模式可以有任意多个外模式。 外模式/ 模式映象定义某一个外模式和模式之间的对应关系这些映象通常定义包含在各自 的外模式。当模式改变时, 外模式/ 模式映象要作相应的以 保证外模式保持不变,这就是数据逻辑独立性。 模式/内模式映象定义数据逻辑结构和存储结构之间的对应关系。当数据库的存储结构改变时,模式/内模式映象要作相应的改变,以 保证模式保持不变,这就是数据物理独立性。正是由于这二级映象功能,使得数据库中的数据具有较高的逻辑独立性和物理独立性。第 6页 共 1 0 7 页肇硕士学位论又% us i e r s h l . si s_ _ 一一- - 一1 . 3 分布式数据库系统定义 分 布式 数 据 库系 统( d is t ri b u t e d d a t a b a s e s y s t e m , 缩写d d b s )是面向地理上分散,而管理上需要不同程度集中管理的企、事业单位提供数据管理的信息管理系统, 可以 把分布式数据库系统看成是:数据库系统+ 计算机网络,但是它不是这二者的简单结合。因为: a如果在计算机网络中,每个节点都装有数据库系统,但却没有统一的管理,这样当用户使用外场地数据时必需指明场地位置,达不到场地透明性。 b如果只在计算机网络中某一场地设置数据库系统,其它场地不设,这样达不到数据分散存储的目 标。 因此严格的定义分布式数据库系统如下: 分布式数据库系统是一组数据集,逻辑上它们属于同一系统,而物理上它们分散在用计算机网络连接的多个场地上,并统一由一个分布式数据库系统管理。 分布式数据库系统包括分布式数据库和分布式数据库管理系统两个部分。 1 .分布式数据库 ( d i s t ri b u t e d d a t a b a s e , d d b ) 分布式数据库是一组数据的集合,这组数据分布在计算机网络的不同计算机上。网络中每个结点具有独立处理的能力 ( 称为场地自 治) , 可以执行局部应用, 每个结点也能通过通信子系统执行全局应用。这个定义强调场地自治性以及自治场地之间的协作性。即每个场地是独立的数据库系统: 它有自己的数据库,自己的一组终端,自己的中央处理器,运行它自己的局部 d b ms ,执行局部应用,具有高度的自 治性。同时又相互协作组成一个整体。在分布式数据库中,虽然各个局部数据库 ( l o c a l d b , l d b )分布在网络的各个结点/ 场地上, 但对执行全局应用的用户来说, 就如同是操作集中数据库。 实际上, 分布式数据库是虚拟的、 逻辑的,即是由 许多l d b 逻辑组织而成的,它是针对全体用户的全局的数据库。因此,又称分布式数据库为全局数据库 ( g l o b a l d b , g d b ) ,只有局部数据库 ( l d b ) 才是物理的数据库。2 .分布式数 据库系统管理 ( d i s t ri b u t e d d a t a b a s e ma n a g e m e n ts y s t e m, d d b ms )第 7页 共 1 0 7 页肇a e,i 士学位论丈 l 4 si f r s i i i e i 、 分布式数据库管理系统和集中式数据库系统一样,是分布式数据库系统中的一组软件。 负则管理分部环境下逻辑集成数据的存取、一致性、有效性、完整性等.同时,由于分布性,在管理机制上还必须具有计算机网络通信协议上的分布管理特性。1 . 4分布式数据库系统的特点 分布式数据库系统是在集中式数据库系统的基础上发展起来的,因此它具有集中式数据库系统的特点。同时,由于分布性又使这些特点具有不同的含义。分布式数据库系统具有如下特点 1 .集中与自治相结合的控制机制 在分布式数据库系统中, 数据的共享有两个层次: 一是局部共享,即在局部数据库中存储局部场地上各用户的共享数据。这些数据是本场地用户常用的。二是全局共享,即在局部数据库的各个场地也存储可供网中其他场地的用户共享的数据,支持系统的全局应用。因此,相应的控制也具有两个层次:集中与自治。分布式数据库系统常常采用集中与自治相结合的控制机制。 各局部的d b ms 可以独立管理局部数据库, 具有自 治的功能,同时, 系统又设有集中控制,协调各局部d b ms的工作, 执行全局应用。不同的系统, 集中与自治的程度不尽相同。2 .适当增加数据冗余度 在集中式数据库中,尽量减少冗余度是系统的目 标。而在分布式数据库中却希望增加冗余数据,这是因为: ( 1 ) 提高系统的可靠性、可用性 当某一场地出现故障时,系统可以对另一场地上的相同副本进行操作,不会因一处故障而造成整个系统的瘫痪。 ( 2 ) 提高系统性能 系统可以根据距离远近选择数据副本进行操作,以减少通信代价, 改善整个系统的性能。 但是冗余副本容易带来数据的不一致性。冗余副本之间的不一致性问题是分布式数据库系统必须着力解决的。3 .事务管理的分布性 分布式数据库系统的事务管理,由于数据分布必使得事务也具有了分布性,即一个全局事务的执行将划分成许多场地上的局部事第 8页 共 1 0 7 页、 爵b it 士学位论又ia 5c e h 、 到 ! s i s务,局部事务的执行结果合并而成全局事务的执行结果,这样的事务即为分布事务。分布式的事务处理比 集中式更加复杂,管理也更加困难,这是因为: ( 1 ) 由于结构的变化, 数据己经从逻辑结构和物理结构的组织方式扩展为全局逻辑结构、局部逻辑结构和局部物理结构的组织方式。 ( 2 ) 分布事务管理是针对全局数据的事务管理,它与集中式数据库的事务管理在处理策略上有本质的区别。 ( 3 ) 分布事务具有由局部事务合成全局事务而不 “ 失真”的特性。因此局部事务在本场地必需是可串 行化的,同时,全局事务对系统而言是可串 行化的。这样才能保证事务的可恢复性。 ( 4 ) 分布事务的可恢复性由于系统分布性变得复杂,这不仅由于场地计算机可能引出恢复问题,还可能由于计算机网络故障引出恢复问题。4 .存取效率 在分布式数据库系统中,全局查询被分成等效的子查询。它是通过系统的全局优化策略产生的,而子查询计划又是在各场地分布执行的。因而, 分布式数据库系统中全局优化以两级进行:全局优化和局部优化。 全局优化主要决定在多副本中选取适合的副本, 使得场地间数据传输量以及次数最少,从而使系统通信开销少。 局部优化与集中式数据库优化方式相同:在集中式数据库中,层次方法和网络方法是以导航方式处理查询请求,因此,其效率由于查询语言的过程性,有时要靠用户的程序优化加以保证。关系方法由于非过程性查询语言,则是以合理的存储方式以及查询的 “ 优化 “ 处理部件解决存取效率的。5 .模型数据 在分布式数据库系统中, d d b是一个逻辑的、 虚拟的数据库( 被称为全局数据库系统,g d b)和实际分布在各场地的局部数据库 ( l d b )这样两级数据库组成。全局数据模式描述全局数据库。局部数据模式描述局部数据库。 系统将数据库划分为四层: 全局外层、全局概念、局部概念和局部内层。6 .数据独立性 ( 1 )系统透明性 在分布式数据库系统中, 全局用户看到的是全局数据模型描述,第 9页 共 1 0 7 页髻预士学位论文 i i .: 4 、 i h 卜 狡 ! 卜对各场地的局部数据模型描述不必关心。这种实际的模型转换是由系统自 动完成。 ( 2 )位置透明性 用户对所需要的数据的存放位置不必关心。用户可以像使用集中式数据库一样,认为他所使用的数据就存放在本地。而实际的物理位置由g d b a在系统设计时决定, 并在数据字典目 录中登录在存放位置的对照表中,当用户使用非本地数据时,由系统自 动调用该表并查出所需数据的物理位置,这将使用户在写程序时不必考虑数据的存放位置而只要了解数据确实存在即可。因此,不论是应用的改变或是实际数据驻留场地的变化,由于位置透明性,用户都不需改写程序,这就是分布式数据库系统的位置透明性。而位置透明性正是物理数据独立性的一种扩充。 ( 3 ) 分片透明性 以关系模型为例。可以使用选择和投影操作将关系划分成许多子关系,而使用联接操作则可使这些子关系合成为原关系。这种关系的划分原则正好是某些应用所需要的,每个子关系就是原关系的一个分片。 若所有的应用都不必关心分片的任何细节, 对d d b的操作只针对用户关心的视图,而视图可能是若干子关系 ( 即分片)组成的,其合成也是由系统完成的。这即是分片透明性。 ( 4 ) 重复副本透明性 既然d d b支持重复副本, 则应支持重复副本透明性。 重复副本的最小单位应是分片的片段 ( 即子关系) ,因此用户在使用时不必关心有多少个副本,只需指明数据即可。 如果在分布式数据库系统中全部实现了上述各种透明性,用户使用分布式数据库系统就完全使用集中式数据库一样了。然而提供系统的完全分布透明性是很困难的,因此, 建立何种程度的透明性,可在设计时决定。1 . 5 分布式数据库系统环境 分布式数据库系统环境应是一个分布环境,即由多个计算机设备彼此用通讯设备连接而成的计算机网络,并且把数据库的内容渗透到网络环境中。它的主要组成是节点/ 场地和通讯设备,以 及支持节点/ 场地通讯的网络通讯软件。第 1 0页 共 1 0 7 页图 0 f r* 4 r tiisier s thhsis1 .节点/ 场地 节点,是指具有主动处理能力的单一计算机 ( 包括那些有多个终端机或远程终端机)的部分;而场地是多台计算机组成的节点。 节点应包括一定的软、硬件成分。硬件成分主要是计算机处理设备及网络接口设备,其计算机可以是大、中、小、微型机 ( 工作站) ,有一定的处理能力, 配置可根据应用的需要而定。 根据节点能力的大小,相应的软件配置亦有不同。 节点在正常情况下应是联网状态,即正常工作、发送命令、完成某种调度。也可能是非联网状态,处于故障离网或维修中离网。联网或离网对于节点来说一般是是动态的。z .通讯设备 通讯设备包括连接节点的物理链路和一组通讯协议。通讯设备应该知道每个节点状态,每个节点状态连接的多种物理路径,以及节点发送报文的协议。通讯设备的基本功能是在任何一个节点上运行一个进程,可以向在此网络中任何其它上运行的另一个进程发送消息或报文。进程发送或接收报文的方式点到点的,或是广播式。 网络的几个特性如下: ( 1 ) 网络开销,即传送报文和数据的代价。 ( 2 ) 网络延迟,即报文提交后直致目的地收到的时间。 这与网络的组成部分的性能有关。一般情况下,网络延迟认为是固定的。 ( 3 )网络可靠性。网络可靠的运行是网络系统与分布式数据库正常工作的基础。网络可靠性包括发送报文后在一定的时间延迟内正确地送到目的地回答的概率。3 . 网络通讯协议 网络中任何两个结点要交换报文, 这两个结点的进程必需遵守某些规则才能得以实现。 网络报文发送接收规则称为网络通讯协议。协议规定两个结点的通讯只能在同层上进行逻辑对话。第 1 1页 共 1 0 7 页b , 士学位论文 l a i i f r s r ll c 5 i s1 . 6 分布式数据库系统面临的问题1 . 6 . 1 异构分布式数据库系统的问题 因为异构分布式数据库系统是一个分布式数据库系统, 所以必需满足布式数据库系统的基本特征。又因为数据模型和语言的不同,最简单的办法是将其统一成一个公共模型和公共语言,这样每个局部数据库数据模型和 d ml都映射公共数据模型和语言的等效表示和原语。 在模示转换上或等效性上包括语义的等效性和实例的相等性两个性质: 1 .型转换语义的等效性, 即转换前模型的语义内容全部不多不少地映射公共数据模型上,反之亦如此; 2 .实例的相等性,即二者所指的事实 ( 或对象)完全是同一事实 ( 或对象)而不是其它。 3 .程序转换等效性, 即对任何输入而言只能有唯一的等效输 出。1 . 6 . 2 同构分布式数据库系统的问题 与异构分布式数据库比较, 同构分布式数据库需要处理的问题较少,特别对同构同质分布式数据库更是如此。同构异质分布式数据库的问题与异构分布式数据库比较大同小异,只不过程度有别。因此此问题的解决就相对容易些,解决方式也有许多相似之处 。6 . 3语言转换即使每个数据库语言都是完备的,它们所表达信息的方式不存在许多差异,如查询策略不同,查询路径的确定方式也不l同第 1 2页 共 1 0 7 页硕士学位论又 1 k s i e 尺 i i i i f s i s同,有些是过程性语言,而有些则是描述性语言,查询经过某种转换后查询的响应也会有所不同。因此,一个查询语句的转换成功有较好的效率,并不能真正说明所有转换都如此。因此,语言的转换除了正确性方面的要求一定予以满足之外,还必须考虑效率的因素。1 . 7 分布数据库的分类 分布数据库的分类有许多方法, 可以从数据冗余、 全局数据库构成和本地数据库的配置方式三个方面来分类。1 .按数据冗余分类 ( 1 ) 完全复制型。每个本地数据库都是全局逻辑数据库的一个副本。该类型适合于非常稳定且每个结点都要频繁访问全局数据库中的数据的情况。 ( 2 ) 子集复制型。全局数据库所有数据存放在网络的某个结点,使该结点成为全局逻辑数据库的一个副本,其它结点存放全局数据库数据的某些子集。该类型常出现在一个大的中心计算机系统 ( 存放全局数据库的副本)连接若干小型机系统 ( 存放全局数据库数据的某些子集)的网络中。 ( 3 ) 子集分布型。没有存放全局数据库的副本的结点,每个结点只存放全局数据库数据的某些子集。 ( 4 ) 完全分割型。每个结点的本地数据库互不冗余,它们都是全局数据库数据的子集,共同组成全局数据库的物理数据库。该类型的优点是查入、 删除、修改操作只需在本地数据库上进行。2 .按全局数据库构成分类 ( 1 )同构分布式数据库 这类分布数据库各结点的本地数据库系统的 d b ms完全相同,其操作方式完全相同,转换方便,实现简单,当前分布数据库一般采取这种类型。 ( 2 ) 异构分布式数据库 这类分布数据库各结点的本地数据库系统的d b ms不完全相同,当然它们相异的程度可能不一。这种系统往往是连接现有数据库系统的结果, 各地数据库操作之间的转换是复杂的。3 .按本地数据库的配置方式分类第 1 3页 共 1 0 7 页髯石 万 士学位论文% i k s i e r s t h e s i s ( 1 )可分布访问的集中数据库 对这类数据库网络中只有一个本地数据库, 网络中所有结点都能访问它,共享网络中心数据库就是这种情况。 ( 2 )中心数据库加专用数据库 网络中除了有一个都能访问的中心数据库外, 某些结点还有自身的专用数据库,它们不是所有用户、任何时间都能访问的。 ( 3 )多级分布数据库 网络中各结点在相互访问本地数据库的关系上形成树结构。 任何结点只能访问它自身和它的子孙结点的本地数据库。 ( 4 )水平分布数据库 网络中各结点都可访问任一结点的本地数据库,即各结点是平等的。第 1 4页 共 1 0 7 页硕士学位论文m a s t e r s t h e s i s第二章分布式数据库系统结构2 ., 分布式数据库系统模式结构全局外模式全局外模式全局外模式映象 1全局概念模式 ( g lo b a l c o n c e p t u a l s c h e m a )一 须豪 万分片模式f r a g m e n t a t io n s c h e m a )映象 3分布模式a l l o c a t i o n s c h e m a )局部概念模式l o c a l c o n c e p t u a l s c h e ma )映象 4局部概念模式局部内模式局部内模式局部内模式局部数据库局部数据库局部数据库图2 . 1 . 分布式数据库系统模式结构第 i s页 共 1 0 7 页一髯硕士学位论文m a s t e r s t h e s 干 图2 . 1 . 是分布式系统一种模式结构的示意图,实际的系统并非都具有这种结构,因为对系统的数据独立性的不同要求,有不同的抽象层次。 图2 . 1 .模式结构从整体来看,映象4 所在的层下面的是集中式数据库的模式结构,代表了各局部场地上的局部数据库系统的结构映象4 所在的层上面的是分布式数据库系统增加的模式级别,下面仅就分布式数据库系统增加的模式级别作一简单的介绍。( 1 )全局外模式 它们是全局应用的用户视图,是全局概念模式的子集。( 2 ) 全局概念模式 它定义分布式数据库中数据的整体逻辑结构。 全局概念模式中所用的数据模型应该易于向其它层次的模式映象。通常采用关系模型。( 3 ) 分片模式 每一个全局关系可以分为若干不相交的部分, 每一个部分称为一个片段。分片模式定义片段及全局关系到片段的映象。这一映象是一对多的,因为一个片段来自一个全局关系,而一个全局关系对应多个片段。( 4 )分布模式 片段是全局关系的逻辑部分,一个片段在物理上可以分配到网络的不同结点上。分布模式定义片段存放位置。分布模式的映象类型确定了分布式数据库是冗余的还是非冗余。若映象是一对多的,即一个片段分配到多个结点存放,则是冗余分布式数据库。若映象是一对一的,则是非冗余的分布式数据库。根据分布模式提供的信息,一个全局查询分为若干子查询,每一子查询所要访问的数据属于同一场地的局部数据库。由分布模式到各局部数据库的映象把存储在局部场地的全局关系或全局关系的片段映象为各局部概念模式。局部概念模式采用局部场地的d b ms 支持的数据模型。 分片模式和分布模式及其对应的映象使分布式数据库系统具有了分布透明性。第 1 6页 共 1 0 7 页圣肇硕士学位论文k l i st e r s t hf s ,2 . 2 分布式数据库 分布式数据库是一组用网络联结的局部数据库的逻辑集合,它具

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论