分布式数据库综述报告.doc_第1页
分布式数据库综述报告.doc_第2页
分布式数据库综述报告.doc_第3页
分布式数据库综述报告.doc_第4页
分布式数据库综述报告.doc_第5页
已阅读5页,还剩3页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

数据库新技术课程综合考核报告电子科技大学研究生课程综合考核报告 课程名称:数据库新技术 教师姓名:胡旺 学生姓名:董辉 学 号: 201521060521 成 绩: 学 期:2015年下学期 分布式数据库综述报告摘要 随着传统的数据库技术日趋成熟、计算机网络技术的飞速发展和应用范围的扩充,数据库应用已经普遍建立于计算机网络之上。这时集中式数据库系统表现出它的不足:数据按实际需要已在网络上分布存储,再采用集中式处理,势必造成通信开销大;应用程序集中在一台计算机上运行,一旦该计算机发生故障,则整个系统受到影响,可靠性不高;集中式处理引起系统的规模和配置都不够灵活,系统的可扩充性差。在这种形势下,集中式DB的“集中计算”概念向“分布计算”概念发展。分布计算主要体现在客户机服务器模式和分布式数据库体系结构两个方面。分布式数据库系统通常使用较小的计算机系统,每台计算机可单独放在一个地方,每台计算机中都有DBMS的一份完整拷贝副本,并具有自己局部的数据库,位于不同地点的许多计算机通过网络互相连接,共同组成一个完整的、全局的大型数据库。DDBS已成为信息处理学科的重要领域,正在迅速发展,原因基于以下几点:它可以解决组织机构分散而数据需要相互联系的问题。如果一个组织机构需要增加新的相对自主的组织单位来扩充机构,则分布式数据库系统可以在对当前机构影响最小的情况下进行扩充。均衡负载的需要。数据的分解采用使局部应用达到最大,这使得各处理机之间的相互干扰降到最低。负载在各处理机之间分担,可以避免临界瓶颈。当现有机构中已存在几个数据库系统,而且实现全局应用的必要性增加时,就可以由这些数据库自下而上构成分布式数据库系统。关键词:分布式数据库 集群 数据存储1. 分布式数据库产生背景 20世纪六十年代末和七十年代出现了比较成熟的数据库系统。以IMS为代表的层次型数据库系统于1968年问世。20世纪七十年代初,美国CODASYL的数据库任务组的提出了有名的网络数据库模型DBTG。分布式数据库的研究始于20世纪70年代中期。E. F. Codd于20世纪七十年代中期提出了关系数据库。世界上第一个分布式数据库系统SDD-1是由美国计算机公司(CCA)于1979年在DEC计算机上实现。七十年代,计算机科学技术的发展与飞速发展的现代通信技术相结合,导致了计算机网络的出现。这个时期,世界上先后建成了许多规模巨大的、全国性的广域计算机网络对经济、国防、情报、科学技术和社会生活产生了深刻的影响。随着微型计算机的广泛应用,又自然地提出了这样的新问题,为了加强和扩大微型计算机处理数据的功能,要求将许多分布在不同地点上的微型计算机互连起来,共同工作。这样,进入了分布式数据库时代。20世纪90年代以来,分布式数据库系统进入商品化应用阶段,传统的关系数据库产品均发展成以计算机网络及多任务操作系统为核心的分布式数据库产品,同时分布式数据库逐步向客户机服务器模式发展。 随着传统的数据库技术日趋成熟、计算机网络技术的飞速发展和应用范围的扩充,数据库应用已经普遍建立于计算机网络之上。这时集中式数据库系统表现出它的不足:数据按实际需要已在网络上分布存储,再采用集中式处理,势必造成通信开销大;应用程序集中在一台计算机上运行,一旦该计算机发生故障,则整个系统受到影响,可靠性不高;集中式处理引起系统的规模和配置都不够灵活,系统的可扩充性差。在这种形势下,集中式DB的“集中计算”概念向“分布计算”概念发展,以分布式为主要特征的数据库系统的研究与开发受到人们的注意。分布式数据库是数据库技术与网络技术相结合的产物,在数据库领域已形成一个分支。2. 国内外研究进展 分布式数据库系统(Distributed Database system,简称DDBS)已有20多年的发展历史,经历了一个从产生到发展的过程,取得了长足的进步,许多技术问题被提出并得到了解决。20世纪90年代起,DDBS己进入商品化应用阶段,当前,分布式数据库技术已经成熟并得到广泛应用。一些数据库厂商在不断推出和改进自己的分布式数据库产品,以适应多种需要和扩大市场的占有份额。但是,实现和建立分布式数据库系统绝对不是数据库技术与网络技术的简单结合,而是在这两种技术相互渗透和有机融合后的技术升华,它又产生了很多新的技术。而且,分布式数据库系统虽然基于集中式数据库系统,但分布式数据库系统却有它自己的特色和理论基础。由于数据的分布环境形成了很大的固有的技术难度,使得分布式数据库系统的应用被推迟。至今完全遵循分布式数据库系统规则,特别是实现完全分布透明性的商用系统还很难见到。 2.1 分布式数据库国内发展现状 我国对分布式数据库系统的研究约在20世纪80年代初期开始,一些科研单位和高校先后建立和实现了几个各具特色的分布式数据库系统。如由中国科学院数学研究所设计,由该所与上海科学技术大学、华东师范大学合作实现的CPOREL,武汉大学研制的WDDBS和WOODDBS,东北大学研制的DMDFO系统等,尤其值得一提的是华中科技大学达梦数据库多媒体研究所开发的DMZ多媒体数据库,它解决了异构数据库系统实现数据的共享和透明访问的难度。他们的工作对我国分布式数据库技术的理论研究和应用开发起到了积极的推动作用。 2.2 分布式数据库国外发展现状 国外对分布数据管理的研究有两个方面:一是单项的研究。比如数据的分布问题,通信问题等。在研究一个问题时,假定其它因素是不变的,得出研究成果。此处还要研究的是要将各种因素综合起来,研究它们的相互作用和结果。数据库设计和更新同步之间就有密切的联系,对于更新要求,依据不同的更新同步方案,对通信系统的要求也随着不同。因此,就要对这些因素综合地考虑。二是对计算机网络的研究。计算机网络技术的迅速发展, 已经很大程度地影响到了数据库和分布数据库的领域。不管是在远程网络还是局域网领域,都发生了很多的变比。局域网和远程网之间的处理差别,必然会导致处理数据库和分布数据库问题的显然不同的一些原则和方法。分布式数据库系统已经成为信息处理学科的重要领域,正在迅速发展之中。3. 分布式数据库实现思路及体系结构 分布式数据库系统是在集中式数据库系统的基础上发展起来的,由分布式数据库管理系统和分布式数据库组成,是数据库技术与计算机网络技术的产物。分布式数据库管理系统是具有管理分布数据库功能的计算机系统,分布式数据库则是一组逻辑上属同一系统,但物理上分布在计算机网络的不同结点的结构化数据的集合,由分布于计算机网络上的多个逻辑相关的数据库组成。网络中的每个结点(场地)具有独立处理的能力(称为本地自治),可执行局部应用,同时,每个结点通过网络通讯系统也能执行全局应用。所谓局部应用即仅对本结点的数据库执行某些应用。所谓全局应用(或分布应用)是指对两个以上结点的数据库执行某些应用。支持全局应用的系统才能称为分布式数据库系统。对用户来说,一个分布式数据库系统逻辑上看如同集中式数据库系统一样,用户可在任何一个场地执行全局应用。 分布式数据库系统抽象为4层的结构模式。这种结构模式得到了国内外的支持和认同。4层模式划分为全局外层、全局概念层、局部概念层和局部内层,在各层间还有相应的层间映射。这种4层模式适用于同构型分布式数据库系统,也适用于异构型分布式数据库系统。4. 分布式数据库主要特点及优缺点DDBS的基本特点:(1)物理分布性:数据不是存储在一个场地上,而是存储在计算机网络的多个场地上。逻辑整体性:数据物理分布在各个场地,但逻辑上是一个整体,它们被所有用户(全局用户)共享,并由一个DDBMS统一管理。(2)场地自治性:各场地上的数据由本地的DBMS管理,具有自治处理能力,完成本场地的应用(局部应用)。(3)场地之间协作性:各场地虽然具有高度的自治性,但是又相互协作构成一个整体。DDBS的其他特点(1)数据独立性 (2)集中与自治相结合的控制机制 (3)适当增加数据冗余度 (4)事务管理的分布性DDBS的优点 (1)具有灵活的体系结构 (2)适应分布式的管理和控制机构 (3)经济性能优越 (4)系统的可靠性高、可用性好 (5)局部应用的响应速度快 (5)可扩展性好,易于集成现有的系统DDBS的缺点 (1)系统开销较大,主要花在通信部分 。(2)复杂的存取结构(如辅助索引、文件的链接技术),在集中式DBS中是有效存取数据的重要技术,但在分布式系统中不一定有效。 (3)数据的安全性和保密性较难处理。5.分布式数据库发展趋势 未来分布式数据库的发展趋势,除了解决当前面临的技术挑战还有一些更好的发展方向。比如与人工智能的有机结合、与面向对象技术的结合、应用并行计算机、高性能工作站对其影响显著,也引导着分布式数据库的发展趋势。人工智能和分布式数据库的相结合是数据库技术发展的重要方向之一,这种结合能够使分布式数据库更加智能化,即数据挖掘和知识工程。两技术的结合能够旨在发现大量数据中的新信息、所蕴含的知识,而这些内容将为人们的生活提供便利与帮助。传统的数据库技术仅仅是一种数据处理、分析方面的技术,它的优势在于对数据进行存储、管理、检索,而逻辑推理能力是数据库技术所不具备的。另一方面,人工智能则可以通过计算机模拟人的大脑思维过程,逻辑推理和判断是人工智能技术的主要特征。智能化的分布式数据库应该是人工智能分布式数据库技术的有机结合,同时具有两者的优点且避免他们的缺点,而这也就是分布式知识库系统。知识库是存储事实的外延数据库和存储常用知识的内涵数据库的联合体。以关系代数为理论基础的关系数据库管理系是非常严格的数据库系统。目前,它已经能够满足现实生活中的众多应用。然而,随着近些年软件工程技术的发展,传统的结构化的软件编程方法已经逐步进入到基于面向对象的编程时代,这一点也逐渐渗透到数据库技术领域,也推动着分布式数据库的应用发展由传统领域往面向对象领域的扩展。分布式面向对象数据库具有以下几个优点,高性能和高可用性,能够很好的适应面向对象数据库的高度分布,同时,它还支持异构数据库,也拥有隐藏信息的特性。 随着数据库技术的迅猛发展,新一代数据库必将具有数据量大和结构复杂的特点,而新的 数据库应用则需要具有复杂数据处理操作和高效事物处理能力,这也就需要高性能的数据库系统支持。近些年,并行计算机系统发展迅猛,而并行计算机机群为高性能数据库系统的实现带来了强有力的支持。在这个基础上建立的数据库系统称为并行数据库系统。并行数据服务器系统和分布式数据库相比,具有以下三点重要的不同:应用目标不同,并行数据服务器中并不苛求最大程度的本地处理能力;实现方式不同,在并行服务器系统中,站点间工作负载主要利用高速网络相互调节;各站点的地位不同,即并行服务器系统中不存在局部应用和全局应用的概念,站点之间是完全不独立的。现在随着大数据和云时代的到来,面对海量的数据,在将来的计算机发展历程中分布式数据库系统将会越来越重要,我们也相信在不久的将来,分布式数据库系统会给我们的生活带来更多的便捷。6.结论 数据库技术的产生,主要是为了方便人们自动化管理和使用日常生活中的海量数据。利用数据库系统对数据进行自动化地管理、分析,能够有效提供人们的工作效率。而随着传统的人工管理数据文件的方式逐渐被取代,它也逐渐被广

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论