




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
--------分布式数据库系统概论分布式数据库系统概论1.分布式数据库系统的起源和发展2.分布式数据库系统的定义和分类3.分布式数据库系统的体系结构4.分布式数据库系统与C/S模式5.分布式数据库管理系统6.其他非集中式数据库系统7.分布式数据库目录系统的主要内容8.分布式数据库系统的主要技术9.分布式数据库的主要应用10.分布式数据库系统的优点和存在的技术问题1.分布式数据库系统的起源和发展1.1分布式数据库的起源促使分布式数据库的研究提上日程的因素:
*技术因素----计算机相关的各种技术飞速发展(计网和数字通信)
技术发展方向:*卫星系统*Internet/Intranet*移动通信/蜂窝通信
*局域网/广域网*······*客观因素----数据库应用需求的拓展
*地理上分散,管理上集中的企业越来越多
*既要实现本地数据管理,也要存取异地的数据
*既有各部门的局部控制和分散管理,也有整个组织的全局控制和高层次的协同管理
1.分布式数据库系统的起源和发展面对DDBS的产生提出一个问题------为什么以前的DBS不能满足当今应用系统的要求呢?集中式数据库系统
分布式数据库系统1.分布式数据库系统的起源和发展集中式数据库系统
*优点:费用低,不易感染病毒数据处理*缺点:处理速度慢,客户的不同需要
数据传输
(不做任何处理)大型中央系统
客户机
客户机
客户机
数据库
ATM1.分布式数据库系统的起源和发展1.2分布式数据库系统的发展
*分布式数据库的发展阶段
*20世纪70年代末期-----产生*20世纪80年代-----成长阶段
*20世纪90年代-----------商品化应用阶段*21世纪--------------------大规模应用阶段
*分布式数据库系统的12条规则:
*本地自治*不依赖于中心站点
*可连续操作性*数据位置透明性和独立性
*数据分片独立性*数据复制独立性
*分布式查询处理*分布式事务管理
*硬件独立性*操作系统独立性
*网络独立性*数据库管理系统独立性
1.分布式数据库系统的起源和发展12条规则:*不是相互独立,也不是同等重要,完全实现的难度很大
*帮助理解DDBS,帮助规划一个DDBS的功能,区分一个真正的、普遍意义上的DDBS与一个只能提供远程数据存取的系统一个只能提供远程数据存取的系统:*用户可以操作远程站点上的数据,甚至可以同时操作多个远程站点上的数据,但远程与本地不是无缝连接的。如,客户机/服务器模式,浏览器/Web服务器/数据库服务器三层模式的数据库系统。
2.分布式数据库系统的定义与分类分布式数据库:分布式数据库是一个数据集合,这些数据分布在由计算机网络连接起来的若干节点上,每个节点可以管理本地的数据应用,也可以参与全局数据应用。同时这些数据在逻辑上形成一个整体,由统一的数据库管理系统进行管理。站点:被计算机网络连接的每个逻辑单位是能够独立工作的计算机,这些计算机成为站点或节点。本地用户/应用:一个用户/应用只访问他所注册的那个站点。全局用户/应用:一个用户访问涉及两个或两个以上的站点中的数据。全局数据库,局部数据库:从全局的角度和各个场地的角度
2.分布式数据库系统的定义与分类分布式数据库系统的定义:物理上分散而逻辑上集中的系统,它使用计算机网络将地理位置分散而管理和控制有需要不同程度集中地多个逻辑单位(通常是集中式数据库系统)连接起来,共同组成一个统一的数据库系统。每一个站点都具有自治能力,每一个站点都至少参与一个全局应用。可以看成是计算机网络和数据库系统的有机结合。分布式数据库系统包括:分布式数据库+分布式数据库管理系统2.分布式数据库系统的定义与分类分布式数据库系统的特点:*物理分布性:数据不是存储在一个站点上,而是存储在计算机网络的多个站点上。*逻辑整体性:数据物理分布在各个站点,但逻辑上是一个整体,它们被所有用户(全局用户)共享,并由一个DDBMS统一管理。*站点自治性:各站点上的数据由本地的DBMS管理,具有自治处理能力,完成本场地的应用(局部应用)。2.分布式数据库系统的定义与分类其他特点:*数据分布透明性:数据的逻辑分片、数据的物理位置分布、数据的复制,对用户透明。用户也不必关心局部站点数据库的数据模型。*集中与自治相结合的控制机制:数据共享的两个层次--局部共享(本站点数据)、全局共享(各个站点数据)。相应的控制机构有两个层--集中和自治。*存在适当的数据冗余度:利用数据冗余提高系统可靠性、可用性和系统性能*事务管理的分布性:一个全局事务可以分解为若干个站点上的子事务来分别执行,以并行的方式来实现网间查询和网内查询,使执行性能得以改进。2.分布式数据库系统的定义与分类2.分布式数据库系统的定义与分类分布式数据库系统的分类:
按LDBMS的同构同质型DDBS(同DM&同DBMS)数据模型同构异质型DDBS(同DM&异DBMS)
异构型DDBS(异DM)全控集中型(全控&GDD位于一个中心S)按全局控制系统全控分散型(全控&GDD分散各个站点)类型全控可变型(根据需要,分为两组站点)3.分布式数据库系统的体系结构3.1基于三层模式的DDBS的体系结构六层模式结构
5级映像三级独立性
3.分布式数据库系统的体系结构数据库的组成:数据和数据目录数据:全局数据,局部数据数据目录:全局数据目录,局部数据目录数据存储:先数据分片,再数据分配数据分片:对全局数据进行逻辑划分。DDBS中的数据可以被分割和复制到网络场地的各个物理数据库中。数据存放的单位不是关系而是片段,一个片段是逻辑数据库中某个全局关系的一部分。数据分配:根据选定的分配策略,对各个数据片段的物理存放站点进行分配。即定义片段映像的类型。3.分布式数据库系统的体系结构全局外模式:全局应用的用户视图。全局概念模式:描述全局数据的逻辑结构和数据特性。分片模式:描述全局数据的逻辑划分。定义全局关系与片段之间的映像。一对多,一个全局关系可对应多个片段。分配模式:定义各个片段的物理存放站点,定义片段映像的类型。确定分布式数据库是冗余的还是非冗余的,以及冗余程度。如果一个片段分配在多个站点上,则此映像是一对多的,也就是冗余的,有副本。局部概念模式:所有全局关系在该站点上的物理映像集合局部内模式:关于物理数据库的描述3.分布式数据库系统的体系结构3.分布式数据库系统的体系结构例:全局关系R的分片与分配情况:R划分成四个逻辑片R1,R2,R3,R4,并以冗余方式将这些片段分配到网络的三个场地上生成了三个物理映象:S1,S2,S3。
R1在站点1和2上重复存储:得到映像R11,R12R2在站点1,2,3上重复存储:得到映像R21,R22,R23R3在站点3得到映像R33R4在站点3得到映像R34
是否存在副本3.分布式数据库系统的体系结构三级独立性*映象1和映象5是类似于集中式数据库的逻辑独立性和物理独立性。*分布独立(透明)性:位于中间三个级别的映象体现的独立性分别称为分片透明性、位置透明性和局部透明性。这三个透明性合起来统称为“分布透明性”。使用户或应用程序不必关心数据的逻辑分片,不必关心数据物理位置分配的细节,也不必关心各个场地上数据库的数据模型是哪种类型,可以像集中式数据库一样来操作物理上分布的数据库。3.分布式数据库系统的体系结构5级映像和3级独立3.分布式数据库系统的体系结构3.2基于组件模式的DDBS体系结构
应用处理器(AP)
数据处理器(DP)通信管理器(CM)3.分布式数据库系统的体系结构组件结构:
4.分布式数据库系统与C/S模式客户机/服务器模式:*某些站点是客户机站点而另一些站点是服务器站点*所有的数据都驻留在服务器站点*所有的应用都在客户机站点进行*应用请求是通过客户机请求和服务器响应的协作方式来完成的*一般不提供完全的位置透明性,即“存在接缝”
4.分布式数据库系统与C/S模式*集中式客户机/服务器模式:只有一个服务器和一个应用,即只有一个应用处理器和数据处理器。*多客户机/单服务器模式:多个应用处理器和一个数据处理器,减少了应用处理器的负载,不同用户可以在同一时间完成其所要完成的工作。*多客户机/多服务器模式:多个应用处理器和多个数据处理器,提高了系统的吞吐率,减少了数据处理器的负载。*服务器/服务器模式:多个应用处理器和多个数据处理器,增加了数据处理器之间的交互,是查询处理工作更加灵活。*对等客户机/服务器系统:C/S系统的最终归宿,分布式处理的极限,网络上每个站点既是服务器也是客户机。P175.分布式数据库管理系统定义:分布式数据库系统的核心,负责实现分布式数据库的建立、查询、更新、复制和维护等功能,同时还包括提供透明性,查询优化、协调全局事务的执行,协调各局部DBMS共同完成全局应用,保证数据库的全局一致性,执行并发控制,实现更新同步和全局恢复等功能。与集中式数据库管理系统不同的功能:*数据跟踪:能够通过扩展DDBMS日志来记录数据分布、分片和复制*分布式查询处理:能够通过通信网络存取远程站点的数据,以及在不同站点间传输请求和数据*分布式事务管理:能够为需要从多个站点存取数据的查询和事务设计执行策略,将分布式数据的存取和整个数据库完备性的维持保持同步*复制数据的管理:能够把数据库从单个站点故障和新类型故障中恢复*安全性:数据安全管理以及用户授权/存取权限的安全管理*分布式目录管理:包含了数据库中有关数据的信息5.分布式数据库管理系统分布式数据库的组成5.分布式数据库管理系统DDBMS的四个基本功能模块:*查询处理模块:包括查询分析和优化处理两部分。*完整性处理模块:负责维护数据库的完整性和一致性,检查完整性规则,处理多副本数据的同步更新等。与查询处理模块一起制定查询处理策略。*调度处理模块:进行一些局部处理和数据传输时向有关的站点发出命令,使各站点的通信管理软件相互配合,完成查询并把结果传回发出该查询的站点。*可靠性处理模块:负责不断地监视系统的各个部分是否有故障出现,当故障修复后,负责将该部分重新写入系统,保持数据库一致5.分布式数据库管理系统分布式数据库管理系统的结构6.分布式数据库目录系统定义:存放与分布式数据库系统有关的对象和各种控制信息的场所,包括:
*全局模式描述:数据库逻辑结构,即所有的全局关系及其属性描述
*分片模式描述:对全局关系的逻辑分片方法,片段定义的描述*分布模式描述:建立逻辑片段和物理映像之间的对应,即定义片段的物理存放站点
*局部名映射:映射到本地站点的数据名,即把物理映像名与站点上的数据名联系起来
*存取方法描述:给出每一站点上可使用的存取方法,如关系数据库中索引结构、数目和类型
*数据库的统计信息:记录着有关数据库的特征参数,如关系的记录个数等*一致性约束:用户存取数据的权限和权限转移,以及数据的完整性约束
*状态信息:记录站点及事物的运动状态,为死锁检测和预防及恢复提供信息*数据表示:提供异种语言、协议或命令的格式转换信息
*数据命令:定义数据命令格式,是指规范化
*系统描述:提供各站点的软、硬件配置及处理能力等信息6.分布式数据库目录系统分布式数据库目录系统的主要用途:
*设计应用:系统设计人员根据目录系统中提供的系统需求信息、站点配置信息和数据库统计信息来定义各级模式、导出数据分布、数据处理的来源和去向,以及设计评价。
*翻译应用:存取映射,将用户的数据请求按不同的透明度映射为单一的物理数据。
*优化处理:为产生一个优化的访问策略,需要知道数据分片、分布、存取路径与访问方法等提供可用信息或统计数据。
*运行监督:提供分布式事务分析、分解、处理所需要的必要信息,并为检查各种程序存取数据的合法性、有效性和权限提供必要的信息。
*系统维护:记录和统计系统运行时的各种性能因素,为维护和调整系统各种参数,提高系统运行效率提供有关信息。6.分布式数据库目录系统分布式数据库目录系统的组织方式:*独立式:利用操作系统提供的文件管理功能来建立和维护目录信息,这时目录系统具有独立的数据定义、装入、查询、修改和报告生成功能。*分离式:利用DBMS建立和维护目录信息,但它的用户界面与功能均独立于DBMS。
*嵌入式:DBMS与目录一体化,即目录系统作为DBMS的子集而存在,在分布式数据库系统中通常采用这种方法。
6.分布式数据库目录系统分布式数据库目录系统的逻辑结构
网络目录全局外模式目录局部外模式目录全局概念模式目录局部概念模式目录内模式目录局部数据库6.分布式数据库目录系统*网络目录:含有运行、优化分布式数据库信息,包括线路的有关参数、各站点CPU的工作负载、磁盘空间占有状态、语言配置和处理功能等*全局外模式目录:存取全局外模式有关信息,包括数据结构、存储位置、划分准则、数据完整性、安全性控制、数据映像及存取路径和各站点软硬件特征等。*全局概念模式目录:提供全局数据关系、公共过程等信息,以反映分布式数据库的整体观念,提供唯一的系统映像。*局部外模式目录与局部概念模式目录:包含的信息仅涉及各自站点的处理对象,与其他站点无关,与集中式系统的目录基本相同*内模式目录:是DDBS的局部数据库存储描述,与集中式系统完全相同。目的在于合理地进行物理数据库组织,以便提高运行效率。6.分布式数据库目录系统目录系统的功能模块:
*目录定义:描述目录信息的逻辑结构和模式
*目录装入:负责目录信息的装入和存储
*目录查询:负责解释用户对目录信息的查询请求,处理各种查询要求
*目录更新:用于更新目录信息
*目录维护:用于在不破坏目录模式定义的前提下,对目录信息进行分类、归并、重构与链接
*报告生成:将目录信息以文本格式输出6.分布式数据库目录系统分布式数据库系统中,目录的分布方式:
1.集中式目录(全局系统目录)
(1)单一主目录方式:系统将全局系统目录只存放在某一个站点上。缺点是系统过分依赖存放主目录的站点,容易形成瓶颈。
(2)分组主目录方式:将系统站点分为若干组,每一组称为一个聚簇,在每一个聚簇中设置一个主目录。
2.全复制式目录:每个站点上存放一个完整的全局目录,但目录的更新必须传播到每一个站点。不存在目录查询的通信开销,查询的响应速度最高,但目录冗余太多,目录更新开销大。
3.局部式目录:每个站点只为存放在本站点的数据保留一份目录,系统的整体目录是所有这些不相交的局部目录的集合,有利于自治,容易更新,较高的通信代价和较长的目录查询响应时间6.分布式数据库目录系统4.混合式目录
(1)集中式目录与局部式目录相混合(2)全复制式目录与局部式目录相混合关键在于目录的划分,对查询机率高而更新几率低的目录按全复制式存放,对更新几率高而查询几率低的目录则要适当地分布到更新请求高的站点。
5.目录的高速缓存:当目录信息分布在不同站点上时,各站点常常要访问其他站点上的目录内容。这种远程目录访问开销很大,一些分布式系统中采用对非局部的目录信息进行周期性缓存的办法来减少访问远程目录次数。
7.其他非集中式数据库系统对等数据库系统(P2P):网络中的各个计算机之间通过直接交换信息共享计算机资源和服务。每个对等计算机地位相同,可直接互连实现各种资源共享,不需要依赖集中式服务器的支持。P2P的主要特点:
*每个节点均可贡献数据,系统资源具有丰富性、多样性
*可直接访问数据源中的数据资源,即时得到最新鲜的数据
*采用自组织原则,具有健壮性
*每个节点可随时加入和退出,系统具有分散性和可扩展性
*通常以Web上的资源为节点,系统部署简单,不需要复杂的框架部署实现7.其他非集中式数据库系统实现P2P需要考虑的主要问题:
*P2P应用是针对互联网上众多计算机的,所以要考虑哪些低端的不具备服务器强大联网能力的普通的个人电脑
*在P2P技术中需要关于数据描述和交换的协议
*构造一个合适的网络拓扑结构能快速准确地发现对等点
*数据库的管理机制、数据库的安全性等问题7.其他非集中式数据库系统P2P数据库系统与DDBS的典型区别:*DDBS中,节点通常比较稳定,以受控的方式加入和退出网络;而在P2P系统中,节点随时可以加入和离开。*DDBS中,节点通常知道一个共享的全局模式;而在P2P系统中,节点间通常没有预定的全局模式。*DDBS中,可检索到满足查询的全部回答;而在P2P系统中,可能脱机,通常不能检索到满足
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 《2025合同工教师工作期满:我的教育历程与反思》
- 2025科技、创新行业劳动合同书
- 2025-2030年新能源汽车电池回收与电池回收企业可持续发展策略报告
- 2025设备租赁合同的范本
- 酒店人员安全培训内容课件
- 鸟类生态安全知识培训课件
- 考研学长资料库(3篇)
- 电子玻璃制品加工工三级安全教育(车间级)考核试卷及答案
- 消防员安全管理知识题库及答案解析
- 北京市海淀区2024-2025学年高三上学期10月考试地理试卷(解析版)
- 供应链管理综合实验实验报告
- (正式版)JBT 5300-2024 工业用阀门材料 选用指南
- 2024量子人工智能技术白皮书-量子信息网络产业联盟-2024.1
- 公务员考试培训-判断推理通关秘籍
- 第13课《警惕可怕的狂犬病》 课件
- 《C++语言基础》全套课件(完整版)
- 《社会工作伦理案例分析》课件 儿童和青少年社会工作伦理
- HSK标准教程5下-课件-L2
- 艺人明星形象代言肖像权使用合同模板
- 毕业设计论文-计算机类
- 工作单位接收函
评论
0/150
提交评论