数据库的发展方向10.ppt_第1页
数据库的发展方向10.ppt_第2页
数据库的发展方向10.ppt_第3页
数据库的发展方向10.ppt_第4页
数据库的发展方向10.ppt_第5页
已阅读5页,还剩24页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第九章:数据库的发展方向 第一节 分布式数据库系统 第二节 并行数据库系统,第一节:分布式数据库系统,一、 分布式数据库系统的定义 分布式数据库是由一组数据组成的,这组数据分布在计算机网络的不同计算机上,网络中的每个结点具有独立的数据库系统,它有自己的数据库,自己的用户,自己的CPU,运行自己的DBMS,执行局部应用,具有独立处理的能力。同时,每个结点也能通过网络执行全局应用。每个场地是具有高度的自治性,同时又相互协作组成一个整体。,分布式数据库主要强调分布性和逻辑整体性 分布性是指数据库的数据不存储在同一计算机的存储设备上,这与集中式数据库有区别。 逻辑整体性是指这些数据逻辑上是互相联系的一

2、个整体,即逻辑上与集中式数据库相同。,二、分布式数据库系统的特点 1、数据独立性 数据的逻辑独立性、物理独立性、数据的分布独立性 (分布透明性 ) 分布透明性指用户不必关心数据的逻辑分片,不必关心数据物理位置分布的细节,也不必关心重复副本(冗余数据)一致性问题,同时也不必关心局部场地上数据库支持哪种数据模型。,2、集中与自治共享结合的控制结构 数据的共享有两个层面:一是局部共享,即在局部数据库中存储供本地多用户共享的数据。二是全局共享,即在分布式数据库的各个场地同时存储供其他场地的用户共享的数据,支持系统的全局应用。 相应的控制机构也有两个层面:集中和自治。各局部的DBMS可以独立地管理局部数

3、据库,具有自治的功能。同时,系统又设有集中控制机制,协调各个局部DBMS的工作,执行全局应用。,3、适当增加数据冗余度 (1)为了提高系统的可靠性,可用性:当某一场地出现故障时,系统可以对另一场地上的相同副本进行操作,不会因一处故障而造成整个系统的瘫痪。 (2)为了提高系统性能:系统可以根据距离选择用户最近的数据副本进行操作,减少通信代价,改善整个系统的性能。 所以在分布式数据库中增加冗余数据,在不同的场地存储同一数据的不同副本。 冗余副本之间数据不一致性的问题是分布式数据库必须着力解决的问题。,4、全局的一致性、可恢复性和并发操作的可串行性 应保证数据库的全局一致性,全局并发操作的可串行化和

4、系统的全局可恢复性。因为全局应用要涉及两个以上结点的数据,所以分布式数据库系统中一个事务可能由不同结点的多个操作组成。当其中某一个结点出现故障操作失败后如何使另一个结点撤消已执行操作?这些技术要比集中式数据库复杂和困难的多,分布式数据库系统必须解决这些问题。,三、分布式数据库的系统结构,1四级模式 全局外模式。它们是全局应用的用户视图,是全局概念模式的子集。 全局概念模式。它定义分布式数据库中数据的整体逻辑结构,全局概念模式定义了一组全局关系。 分片模式。每一个全局关系可以分为若干个不相交的部分,每一部分称为一个片段。分片模式定义了全局关系到片段的映像,而一个全局关系可以对应多个片段。 分布模

5、式。片段是全局关系的逻辑部分,一个片段在物理上可以分布到网络的不同结点上。分布模式定义了片段存放结点的映像,根据分布模式提供的信息,一个全局查询可以分解为多个子查询,每一个子查询要访问的数据属于同一结点的局部数据库,通过分布模式到各局部数据库的映像把存储在局部场地的全局关系的片段转换成局部场地的DBMS所支持的数据模型。 分片模式和分布模式均是全局的,分布式数据库系统中增加的这些模式和相应的映像使分布式数据库系统具有了分布透明性。,2 数据分片 分片的方式有:水平分片和垂直分片 水平分片:是指按一定的条件将关系按行(水平方向)分为若干个子集,每个子集为关系的一个片段。 垂直分片:是指将关系按列

6、(垂直方向)分为若干个子集。垂直分片的片段必须能够重构原来的全局关系,即用连接的方法可恢复关系,因此垂直分片的诸片段通常都包含关系的码。,3、分布透明性 (包括) (1)分片透明性:指用户或应用程序只对全局关系进行操作而不必考虑关系的分片。当分片模式改变时,只需要修改全局模式到分片模式的映像,而全局关系和应用程序都不必修改,这就是分片透明性。 (2) 位置透明性:指用户或应用程序不必了解片段的存储场地。当存储场地改变了,只需要修改分片模式到分布模式的映像,应用程序不必修改。 (3)局部数据模型透明性:指用户或用户程序不必了解局部结点上使用的是那种数据模型,模型的转换以及语言的转换均由分布模式到

7、各局部数据库的映像完成。,四、分布式数据库管理系统D-DBMS 1、D-DBMS的组成和功能 D-DBMS由4个组成部分: (1)LDBMS:局部结点上的数据库管理系统。其功能是建立和管理局部数据库,提供结点自治能力。执行局部应用及全局查询的子查询。 (2)GDBMS:全局数据库管理系统(GlobalDBMS)。主要功能是提供分布透明性,协调全局事务的执行,协调各局部DBMS以便完成全局应用,保证数据库的全局一致性,执行并发控制,实现更新同步,提供全局恢复功能。,(3)GDD:全局数据字典(Global Data Directory)。主要功能与集中式数据库的数据字典类似,存放全局概念模式,分

8、片模式,分布模式的定义以及各模式之间映像的定义,存放用户存取权限的定义,存放完整性约束条件的定义,保证数据库的安全性和完整性。 (4)CM:通信管理系统(communication management)。主要功能是在分布式数据库各结点之间传送消息和数据,完成通信功能。,分布式数据库管理系统的结构,2、D-DBMS的各种体系结构 D-DBMS功能的分割和不同的配置策略导致了D-DBMS的各种体系结构。 (1)根据GDBMS分布的结点数划分D-DBMS的各种体系结构 根据GDBMS分布在一个结点还是在多个结点,D-DBMS的体系结构可分为 全局控制集中的D-DBMS 全局控制分散的D-DBMS

9、全局控制部分分散的D-DBMS, 全局控制集中的D-DBMS 这种结构的特点是全局控制成分GDBMS集中在某一结点上,由该结点完成全局事务的协调和局部数据库转换等一切控制功能。全局数据字典只有一个,也存放在该结点上,它是GDBMS执行控制的依据。 优点是控制简单,易实现更新一致性。但由于控制集中在某一特定的结点上,不仅容易形成颈瓶而且系统较脆弱,一旦该结点出现故障,整个系统就将瘫痪。, 全局控制分散的D-DBMS 这种结构的特点是全局控制成分GDBMS分散在网络的每一个结点上,全局数据字典也在每个结点上有一份,每个结点都能完成全局事务的协调和局部数据库转换,每个结点既是全局事务的参与者又是协调

10、者。一般称这类数据库为完全分布式的D-DBMS。 优点是结点独立,自治性强,单个结点退出或进入系统均不会影响整个系统的运行。但是全局控制的协调机制和一致性的维护都比较复杂。, 全局控制部分分散的D-DBMS 这种结构是根据应用的需要将GDBMS和全局数据字典分散在某些结点上,是介于前两者之间的体系结构。 2根据局部数据库的DBMS是否相同划分D-DBMS的各种体系结构 根据局部数据库的DBMS是否相同,D-DBMS的体系结构又可分为 同构型D-DBMS 异构型D-DBMS,同构型D-DBMS:每个结点的局部数据库具有相同的DBMS,即使操作系统和计算机硬件不同。在设计和研制D-DBMS时,若并

11、不存在已运行的局部数据库,则采用同构型的结构比较方便。 异构型D-DBMS:各结点的局部数据库具有不同的DBMS。在设计和研制D-DBMS时,若已存在局部数据库,而这些数据库可能采用不同的数据模型,或者不同厂商的DBMS, 这就必须开发异构型的D-DBMS。,第二节:并行数据库系统 一、并行数据库系统的概述 并行数据库系统是在并行机上运行的具有并行处理能力的数据库系统。并行数据库系统是数据库技术与并行计算技术相结合的产物。 随着计算机多处理器结构和磁盘阵列技术的进步,并行计算机系统的发展十分迅速,出现了商品化的并行计算机系统。 通过将数据库的数据在磁盘陈列上分布存储,利用多个处理器对磁盘数据进

12、行并行处理。缓解磁盘I/O瓶颈问题,提高查询效率,解决主存访问瓶颈问题。,二、并行数据库系统的功能 功能一般包括:会话管理子系统、请求管理子系统、数据管理子系统。 (1)会话管理子系统:提供对客户机与服务器之间交互能力的支持。 (2)请求管理子系统:负责接收有关查询编译和执行的客户请求,触发相应操作并监管事务的执行与提交。 (3)数据管理子系统:提供并行编译后查询所需的所有底层功能,例如并行事务支持,高速缓冲区管理等。,三、并行数据库的体系结构 根据处理器与磁盘及内存的相互关系可以将并行计算机体系结构划分为三种基本的类型:共享内存、共享磁盘、分布内存。 1Shared-Disk(共享磁盘)结构

13、 各处理器拥有各自的内存,但共享共同的磁盘,每一处理起都可以访问共享磁盘上的数据库页,并将其拷贝到各自的高速缓冲区中,为避免对同一磁盘页的访问冲突,应通过全局锁和协议来保持高速缓冲区的数据一致性。,2Shared-Nothing(分布内存)结构 每一处理器都拥有各自的内存和磁盘。由于每一结点可视为分布式数据库系统中的局部场地(拥有自己的数据库软件。 3、Shared-Memory(共享内存)结构 所有内存与磁盘为所有处理器共享,四、并行数据库的并行处理技术,1、并行查询的基本概念 并行化过程涉及到下列基本概念: 并行粒度、并行化形式。 (1)并行粒度 并行粒度指的是查询执行的并行程度。并行粒度

14、从粗到细可分为如下四种:事务间并行性、查询间并行性、操作间并行性、操作内并行性。 (2)并行化形式 并行化可分为水平并行化(Independent Parallenlism)和垂直并行化(Pipelining Parallenlism)两种形式,2、并行查询优化 由于并行数据库中存在多个处理器,并行查询优化应使每个操作并行处理,充分利用系统资源提高并行度提高系统性能。 并行查询优化面临的两大困难在于: (1)执行计划搜索空间的庞大 并行查询优化应该可以提取某种启发式的方法对并行执行计划空间做裁减以减少搜索空间的代价。为此不少学者相继提出了基于左线形树的查询优化算法,基于右线形树的查询优化算法,基于片段式右线形树的查询优化算法,基于浓密数的查询优化算法,基于操作森林的查询优化算法。,(2)某些系统参数在优化时未知 在多用户环境下,系统参数譬如CPU数目、内存大小只能到计划执行时才能确定。因此提出了两阶段优化的思想,将查询处理分为静态顺序优化和动态并行化两个阶段进行: 阶段1:在编译阶段,假设

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论