(计算机应用技术专业论文)点对点模式分布式多数据库系统研究.pdf_第1页
(计算机应用技术专业论文)点对点模式分布式多数据库系统研究.pdf_第2页
(计算机应用技术专业论文)点对点模式分布式多数据库系统研究.pdf_第3页
(计算机应用技术专业论文)点对点模式分布式多数据库系统研究.pdf_第4页
(计算机应用技术专业论文)点对点模式分布式多数据库系统研究.pdf_第5页
已阅读5页,还剩66页未读 继续免费阅读

(计算机应用技术专业论文)点对点模式分布式多数据库系统研究.pdf.pdf 免费下载

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

论文题目:点对点模式分布式多数据库系统研究 专业:计算机应用技术 硕士生:王亚楠( 签名)王礁拘 指导教师:刘天时( 签名) 薹灶 摘要 随着数据库技术与网络技术的发展,由计算机网络与数据库系统结合构成的分布式 系统已经逐步成为当今的主流系统。其中,分布式多数据库系统很好地解决了数据的共 享和跨地域管理以及节点自治等问题,符合当前大型企事业机构的管理思想和管理方式。 本文研究一种基于点对点模式的分布式多数据库系统,它利用m o d e m ,通过p s t n 将若 干个分布于不同物理节点的数据库应用系统连接起来,构成一个对等网络,网络中各节 点的松散集合构成全局多数据库系统。系统中各物理节点的数据结构完全复制,共享的 或者重要的数据以水平分片的原则就近存放。本系统的开发以o r a c l e 9 i 为数据库管理系 统、p o w e r b u i l d e r 为前端开发工具,利用触发器机制和数据库到文本的转换技术实现了集 中式或单机版数据库应用系统的网络分布化。它通过对节点间相关参数设置,生成相应 的触发器等后台管理程序,以监控应用系统并进行分布式管理。点对点分布式多数据库 系统不需要重新建立新的分布式多数据库系统,为企事业单位节省了大量的资源,而且 转化周期短,会带来巨大的经济效益和社会效益。 关键词:点对点模式分布式多数据库系统触发器分布式事务 论文类型:应用研究 ( 本文得到陕西省教育厅科研项目基金的资助,编号:0 3 j k l 6 3 ) s u b j e c t :s t u d y o fd i s t r i b u t e dm u l t i d a t a b a s es y s t e mb a s e d 0 up e e rt op e e r s p e c i a l i t y :c o m p u t e r a p p u c a t i o n t e c h n o l o g y n a m e :w a n gy a n a n ( s i g n a t u r e ) 幽妞 i n s t r u c t o r :l i ut i a n s h i ( s i g n a t u 代) 丛五乙州旧型生j 竺一 w i t ht h e d e v e l o p m e n t o fd a t a b a s ea n dn e t w o r kt e c h n o l o g y , t h ed i s t r i b u t e d s y s t e m c o n s t r u c t e d b y d a t a b a s e s y s t e m w h i c hc o m b i n e d b yc o m p u t e rn e t w o r k h a sb e c o m et h e m a i n s t r e a ms y s t e ma tp r e s e n t i nt h ef i e l do fd i s t r i b u t e ds y s t e m ,d i s t r i b u t e dm u l t i d a t a b a s e s y s t e mh a sr e s o l v e dt h es h a r ea n dm a n a g e m e n t o ft h ed a t ai nd i f f e r e n ta r e a sa n dt h ea u t o n o m y o ft h en o d e i ta l s oa c c o r d sw i t ht h em a n a g e m e n ti d e aa n dm a n a g e m e n tm e t h o do ft h el a r g e s c a l ee n t e r p r i s e t h i st h e s i ss t u d i e sad i s t r i b u t e dm u l t i - d a t a b a s es y s t e mb a s e do np e e rt op e e r m o d e l ,w h i c hc o n n e c t ss o m ed a t a b a s ea p p l i c a t i o ns y s t e m sl o c a t e di nd i f f e r e n tn o d e sb yu s i n g m o d e ma n dp s t nt of o r map e e rt o p e e rn e t w o r k ,a n da l l n o d e so ft h en e t w o r ka r el o o s e c o n s t r u c t i o ni nt h eg l o b a lm u l t i d a t a b a s es y s t e m t h ed a t as t r u c t u r eo ft h es y s t e mi nt h en o d e s i s r e p l i c a t e de n t i r e l y , a n d t h es h a r eo r i m p o r t a n t d a t ai ss t o r e d n e a r b y w i t hh o r i z o n t a l f r a g m e n t a t i o np r i n c i p l e t h es y s t e mi sd e v e l o p e db yo r a c l e 9 ia sd b m s a n dp o w e r b u i l d e ra s d e v e l o p m e n tt o o l ,a n d i tt r a n s f o r m st h ed a t a b a s es y s t e mo fc e n t r a l i z a t i o no rs i n g l ec o m p u t e r i n t od i s t r i b u t e dd a t a b a s es y s t e mb yu s i n gt r i g g e rm e c h a n i s ma n dc o n v e r s i o nt e c h n o l o g yf r o m d a t a b a s et ot e x t t h es y s t e mc r e a t e st r i g g e r sb ys e t t i n gs o m er e l a t i o n a lp a r a m e t e r so fn o d e si n o r d e rt od e t e c tl o c a ls y s t e ma n dm a n a g et h e mi nd i s t r i b u t e dm o d e l i td o e s n tn e e dt oc r e a t ea n e wd i s t r i b u t e dm u l t i _ d a t a b a s es y s t e ma n ds h o r t e n st h et r a n s f o r m a t i o np e r i o do ft h es y s t e m , t h e r e f o r e ,i tc a ns a v er e s o u r c el a r g e l yf o re n t e r p r i s ea n db r i n ge c o n o m i ca n ds o c i a lb e n e f i t k e y w o r d s :p e e r t o p e e r , d i s t r i b u t e d m u l t i - d a t a b a s e s y s t e m ,t r i g g e r , d i s t r i b u t e d t r a n s a c t i o n t h e s i s :a p p f i c a t i o ns t u d y ( t h ep a p e ri ss u p p o r t e db yi t e ms c i e n c er e s e a r c hf o u n d a t i o no ft h ee d u c a t i o n o f f i c ei ns h a a n x ip r o v i n c e ,a n dt h ei t e mn u m b e ri s 0 3 j k l 6 3 ) 学位论文创新性声明 本人声明所呈交的学位论文是我个人在导师指导下进行的研究工作及取得的研 究成果。尽我所知,除了文中特别加以标注和致谢中所罗列的内容以外,论文中不包 含其他人已经发表或撰写过的研究成果;也不包含为获得西安石油大学或其它教育机 构的学位或证书而使用过的材料。与我一同工作的同志对本研究所做的任何贡献均已 在论文中做了明确的说明并表示了谢意。 申请学位论文与资料若有不实之处,本人承担一切相关责任。 论文作者签名: 圣! 坠蝤日期:兰丝垒,主:7 学位论文使用授权的说明 本人完全了解西安石油大学有关保留和使用学位论文的规定,即:研究生在校攻 读学位期间论文工作的知识产权单位属西安石油大学。学校享有以任何方法发表、复 制、公开阅览、借阅以及申请专利等权利。本人离校后发表或使用学位论文或与该论 文直接相关的学术论文或成果时,署名单位仍然为西安石油大学。 论文作者签名:至韭搁 、 导师签名:童丑! ! 翌 日期: 呈! ! 竺! 参_ 7 日期:? 驯呼,夕 第一章绪论 第一章绪论 1 1 研究背景及意义 随着计算机应用技术的不断发展,人们对计算机的依赖越来越强,目前 许多机构都采用数据库来组织处理信息数据并管理其业务数据。最初,用户 将所有的数据集中在单个数据库中,通过使用各种数据库工具,如数据描述 语言、数据操作语言、各种访问机制和约束监测等来实现数据的维护和使用。 然而在实际应用中,大多数的用户只需要同自己相关的局部数据进行交互操 作,并且由于处理业务的扩大,公司、企业向着跨地域方向发展,数据的集 中管理更加困难,因而集中式数据库系统的应用范围越来越小。相应地,在 那些地域上分散而管理上又相对集中的大集团、大企业中,往往既要有各部 门的局部控制和分散管理,同时也要有整个组织的全局控制和高层次的协同 管理,这种协同管理要求各部门之间的信息既能灵活交流和共享,又能统一 管理和使用,这些问题的解决都需要将数据库的数据和功能进行划分和分 布。在分布式多数据库系统中,尽可能地把各部门经常用到的数据就近存放, 进行局部数据管理,保持各局部数据库的自治性、数据透明性和完整性【1 1 。 同时提供一个统一存取数据的环境,保持整体的逻辑协调,满足实际应用。 分布式多数据库系统符合当今信息系统应用的需求,符合当今企业组织的管 理思想和管理方式。它已经逐步成为当今的主流系统。 分布式多数据库系统的环境是一个分布式计算环境,若干个分布于不同 物理节点的局部数据库之间,以及局部数据库与全局数据库之间必然需要交 换数据进行信息通信。网络互连技术的飞速发展为分布式计算环境提供了两 种计算模式f 2 ,即客户机服务器( c s ,c l i e n t s e r v e r ) 模式和点对点( p 2 e , p e e r t o p e e r ) 模式。点对点分布式计算模式采用面向通讯的设计方法,网络体系 结构松散灵活,且参与网络中的各节点之间地位平等不存在明确的客户与服 务器之分,更容易实现信息的透明交互。并且在通信时,节点之间无需相互 等待,通信方连接拨号,通信结束立即挂断,从而减少了通讯代价。然而如 果网络结构采用基于c s 的分布式计算模式,通过远程过程调用进行数据维 护,将付出较大的通讯代价。 西安石油大学硕士学位论文 点对点模式分布式多数据库系统在应用过程中不需要重建新的分布式 数据库系统,它只需将原来分布于各地区的数据库系统通过公共交换电话网 络( p s t n ,p u b l i cs w i t c ht e l e p h o n en e t w o r k ) 连接起来,并创建相应的全 局系统即可。这就为企事业单位节省了大量资源,而且转变周期短,提高了 工作效率,因而会带来巨大的经济和社会效益。点到点模式分布式多数据库 系统具有较强的应用背景,它对我国油气田开发,特别是在西部地区环境复 杂、交通不便的工作环境下提供了一个科学、方便、经济、有效的工作模式。 并且它也适用于一些地域上分散的大机构的管理,如各种报修系统、仓储系 统、超市销售系统等。随着数据库技术和网络技术的不断提高,点对点模式 分布式多数据库系统将有着更为广泛的应用。 1 2 研究现状 1 2 1 分布式多数据库系统 分布式数据库系统在2 0 多年的发展历史中,经历了一个从产生到发展 的过程,取得了长足的进步。目前,分布式数据库系统理论已经成熟,其技 术问题也已经基本解决,它开始逐步走向实用化的阶段。二十世纪九十年代 已经有产品进入市场,许多产品具有一定的分布式数据库的特色,如 o r a c l e n e t 、i n g r e s n e t 等。由于分布式数据库系统无论在政府军事上 还是在民用商业上都有着深刻的应用背景,因此,各国都投入了大量的人力 和物力用于研制分布式数据库系统,例如:德国研制的p o r e l 系统,以 p a s a c a l l 语言作为宿主语言。美国i b m 公司的s a nj o s e 研究室研制的 r + 和s y s t e mr ,以s q l 语言作为用户接口语言。我国对分布式数据库系统 的研究始于8 0 年代初,目前已经建立和实现了几个各具特色的分布式数据 库原型,其中包括武汉大学数据库组研制的w d d b s 系列和基于此的 w o o d b s ,东北大学数据库组研制的d m u f o 系统,以及近期正在研制的 异构分布式多数据库系统。这些工作对我国的分布式数据库技术的理论研究 和开发应用起到了推动作用。 随着计算机网络技术的飞速发展和广泛应用,分布式数据库系统的研究 和开发变得更加活跃。分布式数据库系统具有潜在的大市场,如银行系统、 西安石油大学硕士学位论文 电力管理系统、交通系统及各种集团公司的管理无不需要分布式数据库系统 的支持。但是由于系统复杂性对于完全透明的分布式数据库还难于达到,建 立大量节点( 如数百个节点) 的分布式多数据库系统的运行环境是相当困难 的,而且在可靠性、可用性( 在各种软、硬件故障,网络分割或故障等) 方 面很难进行正确的评估。但是研究并没有停止,而且随着计算机技术尤其是 网络技术的高速发展,分布式数据库系统的研究更加活跃。 目前,国内外关于分布式多数据库系统即多节点分布式数据库资源的数 据分布处理及其一致性维护的研究越来越多,它要求提供对多节点上任意数 据库资源的完全透明的访问,既要保证全局数据的共享,又要保证各成员数 据库的自治。目前有三种实现方案【3 : 1 ) 为分布在各个节点上的各种数据库建立用户交互接口,不进行任何 模式的集成。各个成员数据库数据进行区域分段管理,对本区域以外的数据 操作则通过远程登录方式进行。这种方案虽然简单易行,但用户无法透明地 访问数据,而且当增加一个新的数据库时,必须增加用户接口,实现途径比 较繁琐。 2 ) 用分布式数据库系统结构,将物理上分布而且逻辑上相关的数据库 通过分布式数据库系统进行管理。分布式数据库系统具有独立性和透明性的 特点,用户对任何数据库的操作都如同在本地进行,不必关心其数据模型、 物理位置等细节。例如,m ss q ls e r v e r 中用s q l d m o ( s q ld i s t r i b u t e d m a n a g e m e n to b j e c t s ) 来进行分布式数据管理,其重要的一个技术途径是采用 出版、订阅、复制代理来进行多个数据库之间的数据一致性维护。这种方案 要求在各成员数据库之上建立一个全局模式,对数据库实施统一的管理。该 全局模式由所有成员数据库模式集成,若数据库是异构的,建立这个全局模 式则相当困难。 3 ) 采用联邦数据库系统结构,它不采用全局模式,而是在维持局部成 员数据库自治的前提下,对异构的成员数据库进行部分的集成,提供数据的 共享和透明性,采用数据转储技术来解决多节点群的分布数据处理及致性 维护问题。 西安石油大学硕士学位论文 1 2 2 点对点模式 随着i n t e m e t 和网络计算技术的迅猛发展,点对点( 或称对等体到对等 体,p 2 p ) 的计算模式已经成为研究、开发和应用的热点。点对点模式是一 种最早的和常用的网络计算模式。传统的对等网络通常是由少数几个工作站 组成,共享一、二台打印机和工作站硬盘上的数据文件。当前的对等网络是 一种发展了的全新的对等概念,它不需要中心服务器和中心路由器,每台主 机在完全透明的情况下,既可以作为客户机又可以作为服务器,地位是完全 平等的【4 】。各主机之间通过各种各样的交互协作实现资源的收集、任务的分 派、信息的发送等多种工作。 从技术角度来说,点对点技术并不是一种全新的技术,它只是分布式计 算技术在互联网上的应用。在局域网中,我们经常使用的网上邻居就是一种 典型的基于点对点网络技术的通信方式。目前,点对点网络技术的应用主要 包括以下方面 5 】: 1 ) 文件共享:点对点技术使任意两台相连的计算机之间可以直接交互, 而不需要使用任何中央服务器,它使共享文档、多媒体等文件成为可能。在 点对点模式的网络中,对等体之间通过不同的查询机制定位含有所需资源的 对等体后,将直接与其建立联系。 2 ) 协同系统:它构成了完全另外一种类型的点对点网络。它是指一群 一起工作的用户相互间共享着不同的因特网资源,但它们通过协同工作完成 同一项任务。和文件共享不同,协同系统中的一个用户可以在同一时刻将一 个信息多点传送到多个用户。 3 ) 深度搜索引擎:点对点技术使用户能够深度搜索文档,而这种搜索 不需要通过网络服务器,也不受信息文档格式和宿主设备的限制,可以达到 传统目录式搜索引擎无可比拟的深度。 4 ) 分布式计算:这是点对点技术的一个重要特征。 目前,国内外关于点对点计算模式的代表性研发产品和技术有6 1 : 1 ) i c q 类的即时通信软件:两个或多个用户互相使用文字、语音或文 件进行交流,快速、直接,易于同非p c 网络设备( 如p d a 、手机) 通信,而 西安石油大学硕士学位论文 且它不依赖设备即可辨别用户。国内腾讯公司的o i c q 软件就是典型的即时 通信软件。 2 ) f a r s i t e ( m i c r o s o f f ) 、o c e a n s t o r e 类数据存储软件。用于在网络上将存 储对象分散化存放,而不像现在放于专用服务器。 3 ) n a p s t e r 类软件:目前国内此类软件有w o r k s l i n k 、p p 点点通,实现 数据共享的网络文件交换软件,突破了客户服务器( c s ) 模式,通过互联 网,用户之间可以直接建立点对点的连接,不通过服务器就可进行直接交流, 进行文件交换,数据下载,共享硬盘资源,就像在一个局域网中一样简单。 4 ) i n f r a s e a r c h 、p o i n t e r a 类数据搜索及查询软件。用来在p 2 p 网中完成 信息检索。 5 ) g r o o v e 类数据或行动协同软件。它是基于p 2 p 连接的软件工具,可 以建立一个安全的企业级协同工作平台( p 2 p 网) ,提供供求信息链上的互动 信息沟通。 1 3 研究内容 主机 服务器 图卜1 点对点模式分布式多数据厍系统结构 课题研究一种基于点对点模式的分布式多数据库系统【7 1 ,其结构如图 1 1 所示。它利用m o d e m ,通过公共交换电话网络p s t n 将若干个分布于不 同物理节点的数据库应用系统连接起来,构成一个分布式多数据库系统。网 络中各节点局部数据库系统的松散集合构成全局多数据库系统,各节点具有 很强的自治性,既可以是具有主动处理能力的以单机模式开发的集中式数据 库系统,也可以是由一个局域网构成的c s 模式开发的数据库系统。网络中 的任何两个节点间可以不受距离限制地传送数据,实现远程数据库访问控 制。每一个节点都是一个对等方,它从另一个节点接收访问,根据接收的信 息在本地处理数据,或者向其它节点主动提供服务。各个节点之间不存在明 西安石油大学硕士学位论文 确的客户和服务器之分,当其申请服务时就是客户身份,当其提供服务时又 转变为服务身份。 系统中各物理节点的数据结构完全复制,共享的或者重要的数据以水平 分片的原则就近存放。由于分布式多数据库系统支持位置透明性和分片透明 性,用户使用分布式多数据库可以像使用集中式数据库一样,认为使用的数 据就存放在本节点【8 1 。分布式多数据库系统的成功运行依赖于网络中各节点 可靠的通信能力,因而为了保证节点之间数据的可靠性传输,采用异步通信 方式1 9 】,各节点之间遵循一个点对点通信模式的串行通信协议s r s c ( s i m p l e a n dr e l i a b l es e r i a lc o m m u n i c a t i o n ) ,它以d l l 方式为系统提供支持,实现 各局部数据库之间,以及局部数据库与全局数据库之间的数据一致性。 本文主要针对上述这种分布式多数据库系统的数据结构和实际应用的 特点,提出并实现了一种将集中式或单机数据库应用系统进行网络分布化 ( 应用系统分布化) 的方法,即将数据结构完全相同的应用系统转换形成分 布式多数据库系统。它通过对节点间相关参数的设置,生成相应的触发器等 后台管理程序,以监控应用系统并进行分布式管理。系统的工作原理是:当 某节点发生数据变化( 插入、修改、删除) 时,即表示有一个基本事件发生。 如果该事件对其它节点有影响,则自动启动相应的触发器,生成数据变化消 息存储于缓冲中,由消息处理机制以事务为单位进行处理,分布式事务遵循 弱一致性原则。由于分布式多数据库系统使用统一的数据模型,具有局部数 据库高度自治性和全局系统数据库结构全复制的特点,局部数据库更新后, 只需向相关节点发送s q l 语句序列,接收方收到数据后,可在本地直接执 行s q l 语句,从而实现全局数据库的远程数据库操作以及全局数据的完整 性和位置透明性。 1 4 论文组织 本文以应用系统网络分布化的设计和实现作为主要研究对象,分为四大 部分。 第一部分从理论上详细地介绍了分布式多数据库系统的体系结构和多 数据库事务管理方法以及点对点网络模式的基本概念,从而更有利于对点对 西安石油大学硕士学位论文 点模式分布式多数据库系统的理解。主要包括第二章的内容。 第二部分对系统功能及其设计思想进行了讨论,包括第三章至第四章的 内容。第三章根据点对点分布式多数据库系统的特点,结合实际应用,提出 应用系统分布化的功能结构和总体模型。第四章主要对数据库的设计原理进 行分析,并介绍了o r a c l e 数据字典、对象模式等基本概念,最后给出了分 布式协调数据库的数据模型。 第三部分由第五章构成,介绍了系统开发所用的关键技术及其实现方 法。借助触发器、动态s q l 、游标及窗口继承等技术,完成系统的开发。 这一部分介绍了数据标准化、节点配置和数据传输配置的实现,并详细阐述 了构造s q l 语句序列及创建触发器的实现过程。最后,通过塔西南加油站 系统的应用与测试,验证系统的正确性与合理性。 第六章为第四部分,总结系统的主要特点和创新技术,指出当前存在的 问题,并以此作为今后进一步完善系统的主要内容。 1 5 本章小节 分布式多数据库系统已经逐步成为当今数据库系统发展的主流系统,符 合当前大型企事业机构的管理思想和管理方式。网络通信技术的飞速发展, 也为分布式多数据库系统的发展打开了大门。点对点计算模式作为种常用 的网络模式,网络体系结构松散灵活,参与网络中的各节点之间地位平等没 有明确的客户与服务器之分,更容易实现数据信息的透明交互。 本文针对分布式多数据库系统的结构及点对点计算模式的特点,提出一 种将集中式或单机数据库应用系统进行网络分布化( 应用系统分布化) 的方 法,并:睁对这种方法的分析和实现部分作为本文重点内容。最后还分析了点 对点分布式多数据库系统的应用前景。 蔓三童坌塑塞垒鏊堡堕墨丝 第二章分布式多数据库系统 2 1 分布式多数据库系统概念 2 1 1 分布式多数据库系统定义 1 分布式数据库系统 由于数据库应用需求的拓展和计算机硬件环境,特别是计算机网络技术 的发展,人们期望着符合现实需要的、能处理分散地域的、具备数据库管理 等特点的新的数据库系统的出现。这样,分布式数据库系统应运而生,并成 为计算机技术最活跃的研究领域之。 分布式数据库系统( d d b s ,d i s t r i b u t e dd a t a b a s es y s t e m ) 是地理上分 散而逻辑上集中的数据库系统。分布式数据库系统通常使用计算机网络将地 理位置分散而管理控制又需要不同程度集中的多个逻辑单位( 集中式数据库 系统) 连接起来,共同组成一个统一的数据库系统。因此,可以把分布式数 据库系统看成是:数据库系统和计算机网络的有机结合。 在分布式数据库系统中,被计算机网络连接的逻辑单位称为站点( s i t e ) 或节点( n o d e ) 。地理上分散是指各个节点分散在不同的地方,大可以是不 同的国家,小可以是同一建筑物内的不同位置。逻辑上集中是指由网络连接 的各节点之间是一个逻辑整体,并由一个统一的分布式数据库管理系统进行 管理。 2 分布式多数据库系统 一个多数据库系统是若干个相关的数据库的集合,这些数据库在建立多 数据库系统之间就已经存在,在加入多数据库系统之后仍然具有自治行。通 常,将组成个多数据库系统中的各个数据库称为参与数据库,各参与数据 库可以存在于同一场地,也可以分布在多个不同场地。将后者称为分布式多 数据库系统( d m d b s ,d i s t r i b u t e dm u l t i d a t a b a s es y s t e m ) ,它是指在已经存 在的数据库或文件系统( 称局部数据库:l d b ,l o c a ld a t a b a s e ) 之上为用 户提供一个统一的存取数据的环境。一个d m d b s 是由一组独立发展起来的 l d b 组成,并在这些l d b 之上为用户建立一个统一的存取数据的层次,使 得用户像使用一个统一的数据库系统一样使用d m d b s 。 西安石油大学硕士学位论文 分布式多数据库系统与分布式数据库系统的根本区别在于全局概念模 式的定义不同【1 0 1 。分布式数据库系统属于全局逻辑集成方式,全局概念模式 定义了整个数据库的概念视图;而分布式多数据库系统属于松散集成方式, 全局概念模式只表示每个局部数据库系统所共享的那部分局部数据的集合。 因此,分布式多数据库系统中的全局数据库概念等于各局部数据库并集的子 集。 2 1 2 分布式多数据库系统特点 分布式多数据库系统具有如下三个基本特点【1 1 】: 1 ) 物理分布性:是指分布式多数据库系统的数据不是存放在单一节点 的单个计算机的存储设备上,而是按照全局需要将数据划分成一定结构的数 据子集分散地存储在由计算机网络联结起来的多个节点上。这是与集中式数 据库系统的最大差别之。 2 ) 逻辑协调性:是指分布式多数据库系统的分布在各个节点上的数据 子集之间由严密的约束规则加以限定,在逻辑上构成一个整体,它们被分布 式多数据库系统的所有用户( 全局用户) 共享,并由一个分布式多数据库管 理系统统一管理。这是与分散式数据库系统的最大区别。 3 ) 节点自治性:每个节点上的数据信息由本地的数据库管理系统进行 控制,它可以制定本地使用的信息策略,完成本节点的应用( 局部应用) 。 这是分布式多数据库系统与多处理机系统的区别。多处理机系统虽然把数据 分散于不同的数据库中,但从应用角度来看,这种数据分布与应用程序没有 直接的联系,所有的应用程序都由前端机处理,程序的执行由多个处理机进 行。 2 1 3 分布式多数据库系统体系结构 1 分布式数据库系统结构 分布式数据库系统不仅包含分布式数据库管理系统和分布式数据库,还 含有更多的内容。分布式数据库系统是按照分布式数据库方式对数据进行存 储和维护,并向应用的网络环境系统提供数据和信息的分布式系统,它是存 储介质、处理对象、管理系统和网络环境的综合体。分布式数据库系统的体 西安石油大学硕士学位论文 系结构如图2 1 所示。 固 亟 卫k 婴 八、hg d b m sl l g d b m s h ,、 逛苎岁压掣洲巨翠t 婴乡 商商夕商趣 q 卿尚“丽丽乃 岛匝坠h 国 l o l ,o j 图2 1 分布式数据库系统的体系结构 从图2 1 可以看到,分布式数据库系统由下述成分组成: 1 ) 多台计算机设备,并由计算机网络连接。 2 ) 计算机网络设备,网络通讯的一组软件。 3 ) 分布式数据库管理系统,它包括全局数据库管理系统( g d b m s ) 、 局部数据库管理系统( l d b m s ) 、通讯管理程序( c m ) ,除了具有由g d b m s 链接的全局用户接口外,还具有由节点l d b m s 链接的自治节点用户接口。 4 ) 分布式数据库包括全局数据库( g d b ) 和局部数据库( l d b ) 。 5 ) 分布式数据库管理者可分为二级,级为全局数据库管理者,另一 级为局部或自治节点数据库管理者,称为局部数据库管理者。 2 分布式多数据库系统结构 分布式多数据库管理系统的体系结构与分布式数据库管理系统的主要 区别是存在完全独立的多个数据库管理系统,各自管理不同的数据库【惶】。多 数据库管理系统是在独立的局部数据库管理系统之上运行的一层软件,以支 持多数据库上的应用去访问各个不同的数据库。在所有参加多数据库系统的 每个数据库管理系统的节点上,需要建立多数据库系统层。对于每个数据库 管理系统而言,多数据库系统层可以看作是支持多数据库请求和回答的另外 一层。 设计分布式多数据库系统时遵循以下原则【1 3 】: 1 ) 分布式多数据库系统要求对局部数据库系统的应用软件不做任何改 动,即设计的自治性。也就是说,分布式多数据库系统对于局部数据库系统 西安石油大学硕士学位论文 而言就像一个应用程序或一个新的用户。 2 ) 分布式多数据库系统不能妨碍局部数据库系统原来的工作模式,即 局部数据库系统还可以运行只应用本地资源的应用程序,而要访问多个局部 数据库资源的应用则需要在分布式多数据库系统上运行。 3 ) 在分布式多数据库系统中只使用一种统一的数据库语言,用户像使 用一个数据库一样使用分布式多数据库系统。 4 ) 分布式多数据库系统必须对用户屏蔽各个局部数据库系统异构的操 作环境,包括计算机、操作系统、网络环境等。 2 1 4 数据的分片与分布 在分布式数据库系统中,数据的分片与分布是两个非常重要的概念。实 际上,分布式数据库的许多问题都是由于数据的分片和分布引起的。它对整 个系统的可用性、可靠性和效率都有重要的影响,同时也与查询处理等问题 密切相关。 1 数据的分片 数据分片是指将分布式数据库的全局关系划分成相应的逻辑片段,也称 数据分割。在一个分布式数据库中,全局数据库是由各个局部数据库的逻辑 组合而成。反之,各个局部数据库是由全局数据库的某种逻辑分割而得。通 过关系代数的基本运算得出数据分片具有三种基本方法。 1 ) 水平分片:根据某些条件将全局关系按照行横向( 水平方向) 划分 成元组的子集,每个子集为全局关系的一个逻辑片段。它们通过对全局关系 实施选择运算得到,并且可以通过对这些逻辑片段执行合并操作来恢复全局 关系。 2 ) 垂直分片:是指将全局关系按照列纵向( 垂直方向) 以属性组划分 成若干片段。在垂直分片时,对全局关系作投影运算得到垂直片段。为了保 证片段的重构性,每一个垂直片段都包含该全局关系的键属性,这样,可以 通过对这些片段执行连接操作来恢复全局关系。 3 ) 混合分片:是水平分片与垂直分片的混合操作,即对关系进行选择 和投影操作。根据应用的需要,可以先水平分片再垂直分片,或先垂直分片 西安石油大学硕士学位论文 再水平分片,但这两种顺序的结果是不同的。 2 数据的分布 数据分布是指分布式数据库中的数据不是存储在单一节点的计算机存 储设备上,而是根据需要将数据划分成逻辑片段,按照某种原则将这些片段 分散地存储在各个节点上。合理的数据分布可以提高数据操作的自然并行度 和执行效率。数据分布常有四种基本类型: 1 ) 集中式:数据虽然经过分片,但是所有的逻辑片段完全集中安排在 同一个节点上。这种分布原则对数据的控皋和管理仍然像集中式数据库系统 一样,数据的一致性和完整性能够得到保证。但是系统对同一节点的依赖性 过强,数据的检索和更改都必须通过这个节点,容易出现瓶颈问题导致整个 系统崩溃,系统的可靠性不高。 2 ) 分割式:数据经过分片后,所有逻辑片段各自分布于某个指定的节 点上,即所有节点上分布的只是全局关系的一个子关系。这种分布原则可以 充分利用各个节点上的存储设备,数据的存储量大。每个节点可以自治的检 索和更改数据,有利于提高系统的并发操作能力。同时,当某个节点出现故 障时,其他节点仍能够运行,提高了系统的可靠性。但是,对于全局检索和 更改,需要进行通信,时间较长。 3 ) 复制式:全局数据具有多个副本,每个节点上都有一个完整的数据 副本。这种分布原则使系统整体可靠性高,响应速度快,数据库恢复简单方 便。但是要保持各个节点上数据的同步更新,将付出昂贵的代价,并且整个 系统冗余大。 4 ) 混合式:数据被划分后的逻辑片段根据需要进行分布。共享的片段 在需要共享的节点上设置副本,高度自治的片段只设置在本地节点上。这种 分布原则兼顾了分割式和复制式的策略,因此它具有二者的优点,系统效率 高,灵活性强。但是也包括了两者的复杂性。 3 模式结构 分布式数据库是基于计算机网络连接的集中式数据库的逻辑集合。因 此,分布式数据库的模式结构既保留了集中式数据库模式结构的特色,又比 西安石油大学硕士学位论文 集中式数据库模式结构复杂。分布式数据库是多层模式结构,一般划分为四 层。这四层模式划分为:全局外层:全局外模式;全局概念层:全局概念模 式、分片模式、分配模式;局部概念层:局部概念模式;局部内层:局部内 模式。在这四层中相应模式之间的转换,由全局数据库管理系统( g d b m s ) 和局部数据库管理( l d b m s ) 提供的多层次映射实现。图2 2 是分布式数 据库模式结构示意图。 圈2 2 分布式数错厍的模式结构 2 2 分布式多数据库事务管理 2 2 1 多数据库事务定义和特性 1 分布式事务定义和特性 事务是对数据库进行存取的一个操作序列,执行这个操作序列使数据库 从一种一致状态转换到另一种一致状态,即事务就是保证数据库正确的最小 运行单位。分布式数据库系统中的分布式事务是传统事务的扩充。在分布式 数据库系统中,任何一个应用的请求最终将转化成对数据库存取操作的序 列。但是,由于在分布式数据库系统中数据分布的特性,一个事务的执行可 能涉及到多个节点上的数据。这使得分布式事务的执行方式与传统事务不 同,分布式事务将在多个节点上的多台计算机上执行,即分布式事务的执行 是分布的。 堕窒互塑奎兰堡主堂垡堡壅 一 在分布式数据库系统中,一个事务在执行时被分解为若干个与相应节点 有关的操作序列组成的子事务。也就是说,一个事务( t ) 是由若干个不同 节点上的子事务( t i ) 组成的,即t = u t i ,t i 为t 在节点i 的子事务,对应 的操作集记为s q l t i ,i - - 1 ,2 ,n 为节点编号。 分布式事务具有原子性( a t o m i c i t y ) 、一致性( c o n s i s t e n c y ) 、隔离性 ( i s o l a t i o n ) 和持久性( d u r a b i l i t y ) 四个特性,总称为事务的a c i d 特性。 1 ) 原子性:是指事务执行时的不可分割性。一个事务的操作要么全部 执行,要么全部不执行。事务的原子性保证数据库的状态总是从一个一致的 状态变化到另一个一致的状态,而不会出现不一致的中间状态。 2 ) 致性( 或称可串行性) :并发执行的若干个事务,其操作的结果应 与某种顺序串行执行这几个事务所得出的结果相同,以保证并发事务执行时 数据库状态的一致。 3 ) 隔离性:是指一个没有执行完的事务不能在其提交之前把自己的中 间结果提供给其它的事务使用。保证维护事务的交互一致性是保持事务隔离 性的重要原因。因为未提交事务的结果不是最终结果,它有可能在以后的执 行中被取消,如果其它事务用到了它的中间结果,该事务也将夭折。 4 ) 持久性:是指当一个事务正常结束后,即提交后,其操作的结果将 永久化,而与提交后发生的故障无关。 在分布式数据库系统中,为了保证事务的原子性,组成这个分布式事务 的各个子事务,要么全部提交( 成功结束) ,要么全部回滚( 不成功结束) , 这需要对各个子事务进行协调和控制。 2 多数据库事务模型。 在分布式多数据库系统中,对数据的操作也是由事务完成的,称为多数 据库事务。多数据库事务是一组具有相互依赖关系的子事务集合,每个多数 据库事务都有一个可接受状态集合,定义了全局事务成功或失败的条件。子 事务是基本的原子性单位,必须遵守a c i d 四性。在多数据库事务中,个别 子事务的成功或失败不一定影响全局事务的执行结果,称为多数据库原子 性。多数据库事务的部分结果可以被其它事务引用,称为多数据库隔离性。 西安石油大学硕士学位论文 多数据库事务允许数据的弱一致性,即分布在不同节点的数据可能在一段时 间内不一致,允许一个节点上的操作不能立即在其他节点上得到反映,但当 事务成功提交之后,各节点数据保持一致。多数据库事务是多数据库系统中 的基本运行单位。 多数据库事务中的每个子事务是负责某个节点上执行特定操作的逻辑 单元。为了提高多数据库系统的可用性,允许将一个子事务分为可补偿事务 或不可补偿事务。可补偿事务允许局部提交,不必等待全局决定,此时,它 的执行结果显示给其它事务。因此,为了减少一系列的夭折及不可挽回的损 失,只有可补偿事务的子事务允许独立提交。对于可补偿事务,要求当子事 务补偿之后对该事务的执行结果所影响到的对象进行相应的处理。不可补偿 事务相当于传统分布式事务管理中的子事务,当它进入就绪状态之后,必须 等待全局决定以后,才可以进行提交操作。即全局事务严格遵守a c i d 特性, 所操作的数据严格地从一个一致性状态变化到下一个一致性状态。这种要求 对于长事务而言,将极大地降低系统的可用性,容易造成死锁【4 1 。 一个多数据库子事务包括6 个基本元组:子事务的标识、子事务所属全 局事务的标识、子事务的类型( 可补偿和不可补偿两种) 、子事务之间的执 行依赖关系、执行的操作集和执行状态。子事务的执行依赖是指一个全局事 务中各个子事务的执行条件和执行顺序,即每个子事务的执行时刻和执行的 先后次序。在多数据库环境中,将全局事务所要达到的执行目标对应的子事 务状态集合称为可提交状态。一个多数据库事务的可提交状态是由子事务状 态的多元组组成的。子事务的执行状态有四种: 子事务未被执行( n ) ; 子事务正在执行( e ) ; 子事务执行成功,即已经提交或准备提交( s ) ; 子事务执行失败,即已经回滚或准备补偿( f ) 。 因此,一个多数据库子事务的执行过程是:当全局事务启动后,子事务 处于状态n ;子事务交给局部节点执行,子事务进入状态e ;如果完成操作, 则达到状态s ,否则状态置为f 。 西安石油大学硕士学位论文 2 2 2 多数据库事务管理的系统结构 在分布式多数据库系统中支持两类事务: 1 ) 局部事务:局部数据库系统的本地事务,它可以由局部数据库管理 系统直接完成,不受多数据库管理系统的控制。 2 ) 全局事务:在多数据库系统控制下进行操作。一个全局事务可以分 解为若干个全局子事务,每个子事务只需要存取一个本地数据库中的数据, 在本地数据库管理系统的控制之下作为一个本地事务完成。 因此在局部数据库系统中存在两类事务,一类是不为多数据库系统所知 的局部事务,另一类是全局子事务。多数据库管理相应地分为局部事务管理 ( l t m ) 和全局事务管理( g t m ) 。全局事务管理负责协调全局子事务的执 行,局部事务管理保证按照全局事务管理确定的子事务相对执行次序。多数 据库事务管理的系统结构如图2 - 3 所示。 图2 3 多数据厍事务管理系统结构图 多数据库事务管理的目标是要保证数据的一致性和局部节点的自治性 u “。自治性要求全局事务管理功能的完成独立于局部事务的执行功能,局部 自治性包括执行自治性和控制自治性。执行自治性是指允许局部数据库管理 系统延迟或拒绝局部事务或全局子事务的任何操作:控制自治性是指用户应 用的局部事务不需要了解多数据库系统。多数据库事务管理方法具有以下优 点: 1 ) 通过弱一致性定义,支持长事务处理。 2 ) 通过功能复制,使系统具有容错能力。 3 ) 通过增强局部执行自治性和全局子事务并行执行,改善系统的吞吐 西安石油大学硕士学位论文 量,提高系统的性能。 4 ) 支持不同管理方式的局部子系统。 2 2 3 多数据库事务的提交机制 在分布式数据库系统中,分布事务的执行一般采用两段提交协议( 2 p c , t w o p h a s ec o m m i t m e n tp r o t o c a l ) 。2 p c 将事务的提交过程分为两个阶段:第 一阶段为决定阶段,作出提交或中止全部子事务的决定;第二阶段为执行阶 段,就是实现第一阶段所做的决定。在2 p c 中,分布式事务一般指定始发 节点上的代理为协调者,负责分布事务的提交

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论