村上岗-第1讲分布式数据库系统概论_第1页
村上岗-第1讲分布式数据库系统概论_第2页
村上岗-第1讲分布式数据库系统概论_第3页
村上岗-第1讲分布式数据库系统概论_第4页
村上岗-第1讲分布式数据库系统概论_第5页
已阅读5页,还剩49页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第一讲 分布式数据库系统概论11 什么是分布式数据库系统?2 课程教学思路3 课程考核方法第2页,共73页内容提要21.1 分布式数据库系统的产生1.2 分布式数据库系统的定义1.3 分布式数据库系统的发展及研究热点1.4 分布式数据库系统发展趋势 第3页,共73页1 什么是分布式数据库系统?31.1 分布式数据库系统的产生分布式数据库系统的产生是随着各大网站的信息访问量激增而产生及不断发展的。传统的集中式数据库存储与管理模式已经不能应对新的数据存储与访问需求。1PB=1024TB 1TB=1024GB分布式数据库系统基本构型:C/S与B/S分布式数据库不是单独存在的,它对需求非满足是成体系存

2、在的。4第5页,共73页集中式数据库系统的优点易于管理低冗余度应用程序和数据库相对独立数据恢复能力强等主机数据库终端用户处理结果存取请求集中式系统模型5第6页,共73页集中式数据库系统的不足系统规模有限;可扩充性和安全性相对较差;主机瓶颈,可靠性不高;通信开销加大,影响性能;很难适应地理分散的大型公司管理数据需要;6更新硬件,如升级到性能更高的服务器更新软件,如移植到Oracle上利用复制订阅、镜像等功能做扩展使用分布式数据库架构,用若干台中小型的服务器去替代大型的服务器第7页,共73页问题解决方案7分布式系统的定义:分布式系统(distributed system)是建立在网络之上的软件系统

3、。分布式系统由多个高度内聚性和透明性的站点组成。这些站点分别承担数据访问管理、数据存储以及数据服务器监控管理等功能。内聚性是指每一个数据库分布节点高度自治,有本地的数据库管理系统。透明性是指每一个数据库分布节点对用户的应用来说都是透明的,看不出是由哪台数据存储服务器来完成。第8页,共73页8分布式系统的特点:在一个分布式系统中,一组互相独立的计算机展现给用户的是一个整体。系统拥有多种通用的物理和逻辑资源,可动态分配任务。分散的物理和逻辑资源通过计算机网络实现信息交换。系统中存在一个以全局的方式管理计算机资源的分布式操作系统。分布式操作系统往往又以现有的计算机操作系统为基础。对用户来说,分散的数

4、据分布与数据处理对应了同一个模型或范型。分布式操作系统之上有一层中间件负责实现这个模型。一个著名的分布式系统的例子是万维网。在万维网中,所有的一切看起来就好像是一个文档(Web页面)一样。第9页,共73页9分布式系统与网络系统的区别:在计算机网络中,这种统一性、模型以及其中的软件都不存在。用户看到的是实际的机器,如果这些机器有不同的硬件或不同的操作系统,计算机网络并没有使这些机器看起来是统一的。由于多数分布式系统是建立在计算机网络之上的,所以分布式系统与计算机网络在物理结构上是基本相同的。第10页,共73页目前存在很多动态网站,如学校教务系统、选课系统,它们属于分布式系统吗?10分布式系统一般

5、由以下几个部分等组成:分布式操作系统负责管理分布式处理系统资源和控制分布式程序运行。不需要直接管理系统硬件资源,因此它往往建立在现有操作系统基础之上。分布式程序设计语言用于编写运行于分布式计算机系统上的分布式程序。现实是大部分现行分布式系统都采用普通的程序设计语言进行开发。第11页,共73页11分布式数据库系统由分布于多个计算机结点上的若干个数据库系统组成,它提供有效的存取手段来操纵这些结点上的子数据库。分布式文件系统具有执行远程文件存取的能力,并以透明方式对分布在网络上的文件进行管理和存取。第12页,共73页12分布式数据库系统(Distributed DataBase System,简称D

6、DBS)由一组被管理的数据及管理软件(也就是熟称的管理系统)组成,这些数据以及管理软件分布在计算机网络的不同计算机上。分布式数据库系统强调场地自治性(局部应用)以及自治场地之间的协作性(全局应用)。分布式数据库系统是数据库技术和网络技术两者相互渗透和有机结合的结果。主要的目的是用廉价的机器提供高性能的服务。第13页,共73页1.2 分布式数据库系统的定义13第14页,共73页网络场地3图1 DDBMS结构图场地1LDBLDBMSGDBMSCM用户GDD场地214DDBMS由以下部分组成:LDBMS(Local Database Management System,局部数据库管理系统),主要用于

7、管理局部数据库,提供场地自治能力,执行局部应用以及全局查询的子查询。LDB(Local Database,局部数据库),主要用于存储部分数据。GDBMS(Global Database Management System,全局数据库管理系统),主要用于向终端用户提供分布透明性、协调全局事务的执行、协调各局部DBMS以完成全局应用、保证各数据库的全局一致性、执行并发控制、实现更新同步、提供全局恢复等。第15页,共73页15GDD(Global Data Dictionlary,全局数据字典),存放全局概念模式、分片模式、分布模式等的定义,以及各模式之间的映像定义,存放有关用户存取权限的定义、完整

8、性约束的定义等。CM(Communication Management,通信管理),主要用于在GDBMS与LDBMS或各LDBMS之间的通信调度与路由。16按全局控制类型分类全局控制集中型DDBMS全局数据库和全局数据字典集中于某一结点,其优点是控制简单,容易实现更新一致性,但该结点容易成为系统的瓶颈,系统也较脆弱。第17页,共73页分布式数据库系统的分类17全局控制分散的DDBMS全局数据库控制器和全局数据字典分散在网络上的每一个结点上,每个结点都能完成全局事务的协调和局部数据库事务的控制功能。每个结点既是全局事务的参与者,也是全局事务的协调者。其优点是结点独立,自治性强,但全局控制的协调机

9、制和一致性维护都比较困难。全局控制部分分散的DDBMS介于上述两者之间,根据应用的需要将全局数据库管理器和全局数据字典分散在某些结点上。第18页,共73页18按局部DBMS的数据模型类型分类同构型DDBMS每个结点的局部数据库具有相同的DBMS;异构型DDBMS各结点的局部数据库具有不同的DBMS;第19页,共73页19数据独立性数据的逻辑独立性数据的物理独立性数据的分布透明性集中与自治相结合的控制机构数据的共享有两个层次:一是局部共享;二是全局共享。第20页,共73页分布式数据库系统的特点20全局一致性分布式数据库系统中各局部数据库应满足集中式数据库的一致性、并发事务的可串行性和可恢复性。应

10、保证数据库的全局一致性、全局并发事务的可串行性和系统全局的可恢复性。分布式数据库系统中全局应用要涉及两个以上结点的数据,全局事务可能由不同结点上的多个操作组成。第21页,共73页21数据存在一定冗余在不同的结点存储同一数据的多个副本目的一:提高系统的可靠性、可用性,当某一结点出现故障时,系统可以对另一结点的相同副本进行操作,不会因为一处故障而造成整个系统的瘫痪;目的二提高系统性能,系统可以选择用户最近的数据副本来进行操作,减少通信代价,改善整个系统的性能。第22页,共73页22第23页,共73页分布式数据库系统的优点:成本低廉数据访问速度快数据存储量大易于拓展分布式数据库系统的缺点:存取结构复

11、杂系统开销大数据安全性和保密性较难处理23现在的分布式数据库模式大致有两种:在原有关系型数据库的基础上进行拓展,如Oracle、IBM DB2、MySQL、Amobea等。重新构造适合应用需求的分布式数据结构,如以XML或其它文件形式进行数据存储,包括BigTable、HyperTable、HBase、Cassandra等。很多开源分布式数据库系统都是基于Google公开发表的BigTable-a distributed storage system for structured data进行设计与实现的。第24页,共73页1.3 分布式数据库系统的发展现状24分布式数据库系统的发展阶段20世

12、纪70年代末期产生20世纪80年代成长阶段20世纪90年代商品化应用阶段21世纪大规模应用阶段第25页,共73页25目前开源分布式数据库系统类型主要包括:以Google的BigTable为原型和基础建立起来的面向数据半结构化的开源分布式数据库系统,其中包括Hypertable、Hbase、Cassandra。它们支持的是稀疏矩阵化的结构化数据。面向文档的分布式数据库系统,包括MongoDB、CouchDB等。实现分布式缓存,如Memcached等。实现Key/Value数据库引擎,包括Riak、Redis、Keyspace、Tokyo Cabinet等。基于嵌入式的分布式数据库,包括Neo4j

13、、Oracle Berkeley DB等。26目前分布式数据库系统的研究热点分布式数据存储模式:Nosql和SQL模式分布式数据查询与优化分布式数据库管理模式分配与监管问题分布式事务处理分布式数据并发控制分布式数据一致性问题安全与可靠性问题异构互联:? 第27页,共73页27分布式数据库的发展趋势与计算机网络、移动、网格数据库整合成为物流网、云计算基础云计算将网络上分布的计算、存储、服务构件、网络软件等资源集中起来,基于资源虚拟化的方式,为用户提供方便快捷的服务,它可以实现计算与存储的分布式与并行处理。第28页,共73页1.4 分布式数据库系统发展趋势28物联网(Internet of Thi

14、ngs,IoT)最早于1999年由麻省理工学院提出。最开始的物联网是指依托射频识别(Radio Frequency Identification,RFID)技术和设备,按约定的通信协议与互联网相结合,使物品实现智能化识别和管理,实现物品信息互联。现代意义的物联网可以实现对物的感知识别控制、网络化互联和智能处理有机统一,从而形成高智能决策。第29页,共73页29第30页,共73页30第31页,共73页31第32页,共73页架构演变第一步:物理分离webserver和数据库架构演变第二步:增加页面缓存补充材料1:大型网站构架变迁32第33页,共73页架构演变第三步:增加页面片段缓存架构演变第四步:数据缓存33第34页,共73页架构演变第五步:增加webserver架构演变第六步:分库34第35页,共73页架构演变第七步:分表、DAL和分布式缓存35第36页,共73页架构演变第八步:增加更多的webserver36第37页,共73页架构演变第九步:数据读写分离和廉价存储方案37第38页,共73页架构演变第十步:进入大型分布

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论