(管理科学与工程专业论文)分布式数据库在管理信息系统中的应用.pdf_第1页
(管理科学与工程专业论文)分布式数据库在管理信息系统中的应用.pdf_第2页
(管理科学与工程专业论文)分布式数据库在管理信息系统中的应用.pdf_第3页
(管理科学与工程专业论文)分布式数据库在管理信息系统中的应用.pdf_第4页
(管理科学与工程专业论文)分布式数据库在管理信息系统中的应用.pdf_第5页
已阅读5页,还剩52页未读 继续免费阅读

(管理科学与工程专业论文)分布式数据库在管理信息系统中的应用.pdf.pdf 免费下载

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

鸯鞠警蓄警蛊黧女蓝 摘要 信息的传递是2 l 世纪缀济活动中不可或缺的重要鳃成部分,获取信 惫夔速度会壹接关系委垒盐瓣经济效益。隧营金数结秘懿逐步分数纯,集 中式的数据库系统己经越来越难以满足企媲倍惠管理的需要,分布式数据 库祭统将成为信息管理系统的主流技术。本人通过大量的分析与实践,对 分布式数据库程锗理信息系统中的应用做丁比较全面的研究。 分毒式数撵疼是撂物毽上分教在不露场爨瑟逻辑上又是一个整体戆 数据瘁系统。它可以分为同稳分布帮异稿分布两大类,熊有共享往、巍治 憾、冗余的可控性以及事务处理的分散性镣特点。分布式数据库系统的研 究始于2 0 世纪7 0 年代,9 0 年代已经有部分产品进入市场。开放式数据 摩服务器、并行数据服务器、分布式知识鹰系统以及分布式厦趣对象数据 露系统等是当今瓣磅究热点,e 经成为分露式今磊静笈瀵方囊。 分布式数掰库的模式结构分为局部内朦、局部概念屡、全局概念屡和 全局外层四个部分,数据库的管理又是由企局数据库管瑷系统、局部数据 库管理系统和邋讯程序来完成的。网络、通讯设备、分布式数据库管耀系 缀、分毒式数鬃瘁、分毒式数攥瘁警理考秘分毒式数据黪较 孚文搂一起籀 成了完整的分稳式数据库系统。 分布式数据库系统中传输数据首先要滋行数据的分布与分片操作。分 片熙按照需求将数据库进行分割,而分布越将不同的片段放置在不同的地 理位置上。分摩擦作包括水平分片、垂壹分冀、混合分嚣巍诱导分片。分 布式翡并发事务处理能傈证事务静高效正确静进行,它缀括锁和对溺印两 种控制模型。完熬性约束能保证数据传输麟整个分布式数据库系统数据的 一致性与完整憾。本文还提出利用基于角甑的权限控制来保证分布式数据 库的安全性。 s q ls e v e r2 0 0 0 孛戆笈翻模登是浃遮建立努毒式数据疼系统秘方便 工熙,它通过醚鬣复制、建立发布、订阅发布、应用初始快照和同步数据 等五个步骤来完成整个系统的建立与维护。复制分为快照复制、事务炭制 和合并复制三种方式,通过复制监视器等工具来保证复制运行的正确性。 本文鼓菜爨垃公司静营镑管理平台惫锲,逶过系绞戆霉求分接、凌戆 设计、分布式数据库设计、安全性傈证彝系统实施等五个方面详细验诞了 分布式数据库技术在企业管理信息系统中的应用。事实诞明分布式数据库 系统能够满足企业分散结构的需要,对企北提高工作效率,创造更高的价 馕夔定了坚实的麓硝。 关键词:分布式数据库、信息管理系统、s q ls e v e r 复制模烈、 营销管理平台 鱼墼錾盔笪型耋遨 a b s t r a c t t h ee x c h a n g eo fm e s s a g ei sa ni m p o r t a n tp a r ti nt h ee c o n o m i ca c t i v i t i e s o ft h e2 1 s tc e n t u r y t h es p e e do f g e t t i n gm e s s a g eh a sp r o x i m a t eb e e nb o u n d u pw i t ht h ep r o f i to ft h ec o m p a n y w i t ht h ee n t e r p r i s e ss t r u c t u r em o r ea n d m o r es e p a r a t e d ,i n t e n s i v ed a t a b a s eh a sn o ts a t i s f i e dt h en e e do ft h eu s e r sa n y l o n g e r a n dt h et e c h n o l o g yo f t h ed i s t r i b u t e dd a t a b a s ew i l lb e c o m et h er o l e t h ea u t h o rh a sd o n es o m er e s e a r c ho nt h ea p p l y i n gd i s t r i b u t e dd a t a b a s et ot h e i n f o r m a t i o nm a n a g e m e n t s y s t e mb y m u c h a n a l y s i sa n dp r a c t i c e t h ed i s t r i b u t e dd a t a b a s em e a n sad a t a b a s ew i t c hs e p a r a t e di nd i f f e r e n t p l a c e sa n du n i t e di nl o g i c i tc a nb ed i v i d e dt o t w os o r t st h e r ea r ea l i k e s t r u c t u r ea n dd i f f e r e n ts t r u c t u r e a n di th a sc h a r a c t e r ss u c ha s u s i n g i n c o m m o n ,i n d e p e n d e n c e ,c o n t r o l l i n gr e d u n d a n c ya n ds e p a r a t e dt r a n s a c t i o no f b u s i n e s s t h er e s e a r c ho nd i s t r i b u t e dd a t a b a s eb e g a nf r o mt h e1 9 7 0 sa n d s o m ep r o d u c th a sb e e np u tt ou s ei nt h e1 9 9 0 s t h ef u t u r ed i r e c t i o no ft h e d e v e l o p m e n t o ft h ed i s t r i b u t e di n c l u d e so p e n i n gd a t a b a s es e v e r , c o l l o c a t ed a t a s e v e r , d i s t r i b u t e dk n o w l e d g es y s t e m t h em o d u l es t r u c t u r eo fd i s t r i b u t e dd a t a b a s ei n c l u d e sl o c a li n t e m a l s t r a t u m ,l o c a lc o n c e p ts t r a t u m ,g l o b a lc o n c e p ts t r a t u ma n dg l o b a li n t e m a l s t r a t u m t h em a n a g e m e n to ft h ed i s t r i b u t e ds y s t e mi s c o m p o s e do fg l o b a l d a t a b a s e m a n a g e m e n ts y s t e m ,l o c a l d a t a b a s e m a n a g e m e n ts y s t e m a n d c o m m u n i c a t i o n m a n a g e m e n t n e t , c o m m u n i c a t i o nd e v i c e ,d i s t r i b u t e d m a n a g e m e n ts y s t e m ,d i s t r i b u t e dd a t a b a s e ,s y s t e ma d m i n i s t r a t o ra n ds o f t w a r e w o r dw i t c hm a k e u p o f t h ew h o l e d i s t r i b u t e ds y s t e m t h ef i r s tw o r ki s d i s t r i b u t i n g a n dd e m a r c a t i n gd a t ai no r d e rt os e n d m e s s a g e d i s t r i b u t i n gm e a n sd i v i d i n gd a t ao nt h eg r o u n d so ft h en e e d so f u s e r sa n d d e m a r c a t i n g i s p u t t i n g d i f f e r e n tf r a m e w o r kt o v a r y i n gp l a c e s d i s t r i b u t i n gi n c l u d e sh o r i z o n t a l ,v e r t i c a l ,m i x e da n di n d u c t i v ed i v i d i n gm o d e s t h ec o l l o c a t e dt r a n s a c t i o nc a ni n s u r eo fe f f i c i e n ta n dc o r r e c tw o r ka n di th a s l o c ka n dt i m ei m p r e s s i o nc o n t r o lm o d e l s i n t e g r a t e dr e s t r i c t i o nc a ns t a n du p f o rt h ed a t a sa c c o r d a n c ea n dt o t a lo ft h ew h o l ed i s t r i b u t e dd a t a b a s ea f t e r 鱼翻錾垄塑生墅遨 s e n d i n gd a t a t h ep a p e r a l s od i s c u s s e sb u i l da na u t h o r i t yc o n t r o lv i ae n du s e f s a c c e s st om a k es u r eo f t h es a f e t yo f t h ed i s t r i b u t e dd a t a b a s es y s t e m t h e r e p l i c a t em o d e li nt h es q l s e v e r2 0 0 0i sat o o lt oe s t a b l i s hd i s t r i b u t e d d a t a b a s es y s t e mq u i c k l ya n df a c i l i t i e sb yc o n f i g u r a t i o nr e p l i c a t i o n , f o u n d i n g p u b l i s h ,s u b s c r i b i n gp u b l i s h ,a p p l y i n go r i g i n a ls n a p s h o t t h er e p l i c a t i o nh a s t h r e em o d ea ss n a p s h o t ,t r a n s a c t i o na n da m a l g a m a t e t h ep r o c e d u r ec a nb e s u p e r v i s e db yo v e r s i g h td e v i c e t h ep a p e rt e s t i f i e dt h ea p p l i c a t i o no ft h ed i s t r i b u t e dd a t a b a s e t e c h n o l o g y i nt h em a n a g e m e n ti n f o r m a t i o ns y s t e mb yd e s i g n i n gas y s t e mf o ram e d i c a l c o r p o r a t i o na sp r a c t i c a le x a m p l ei n d e t a i lw i t c hi n c l u d e s r e q u i r ea n a l y s i s , d e v i s i n g f u n c t i o n ,d e s i g n i n g d i s t r i b u t e d d a t a b a s e ,s a f e t y i n s u r a n c ea n d a p p l y i n gs y s t e m i tc a r lb eb e l i e v e dt 1 1 a tt h ed i s t r i b u t e dd a t a b a s ec a ns a r i s f yt h e n e e d so ft h es e p a r a t e dc o r p o r a t i o ns t r u c t u r e ,b eas u b s t a n t i a lb a s i st oi m p r o v e t h ee f f i c i e n c yo ft h ew o r ka n dc r e a t em o r e p r o f i t k e yw o rds :d i s t r i b u t e dd a t a b a s e ,i n f o r m a t i o nm a n a g e m e n ts y s t e m ,s q l s e v e rr e p l i c a t i o nm o d e l ,s a l e m a n a g e m e n t t e r r a c e 鎏鹜甄签酱毡鲨鎏逸 第1 牵概论 1 1 分布式数据库的定义 随着信息技术国新月舜的飞速更新,人们对计算机的依赖性也越来越 强,嚣露对诗算极酶要求瞧越来越毫。赞绞瓣攀诗箕撬系绕在功栽嚣性能 上已不能满足人们对信息的需要,由网络连接的多台计算机系统所构成的 分布式系统澄经或为当今滟主流系统。计算税体系终构酶发展,傻传统的 软件系统也馘临新的挑战从集中走向分稚。在数据库领域中,分布式 数据库技术融成为个主鬻的研究方向。 。 。 数掇势希麓需求分耩 传统鲍数据库整理模式是梅所有数擐集中予单个戆数攒痒孛,震户遽 过各种数据库工具,如数据描述语言、数据操作语言、各种访问机制和约 泰监测等来实现数攥淳懿维护程镬矮。毽是,在实酥应用中,这榉熬方式 有时很难满足用户的需要。当这个数据库中的数据量特别大时,用户查询 菜一数据( 褥剐是糯户在舜遣薅) 往往需要耗费大量的时溺,显然这无法 满足当今快节奏的工作步伐;同时,当出现一魑人为和自然灾害等对数擐 的破坏时,数据的安全性将无法得到保护,甚至出现完全丢失。 蔼采焉数据豹分布技术虿淤很好建弥耠传统数据管理方式韵欠缺。据 有关资料调畿显示,超过9 0 以上的用户只需鞭同自己相关的局部数据进 行交曩,将各个用户所需要的不阀数据进行分类,贮存在不同的局部数据 库中,能够极大地提高数据访阀的速度;月默,采用数据螅分布式管理, 在不问的站点进行数据的备份,宵利于增大数据的安全性。 1 2 分希式数据库系统的定义 分布式数据库( d i s t r i b u t e d d a t a s y s t e m ,d d b s 逶谂黉亟说, 是物理上分散而逻辑上集中的数据库系统。分布式数据库系统使用计算机 丽络臻缝理使置分敬丽管理帮控嘉l 又需要不闲程度集中的多个逻辑单位 ( 通常是集中式数据库系统) 联接起来,菇同缎成一个同意的数据俺系统。 因魏可看成: 鸯罂鋈盔鲨坠兰重盆銮 数据库系统十计算机网络 其严格定义应是:分布式数据库是一组数据集,逻辑上它们属于同 一系统,而物理上它们分散在用计算机网络连接的多个场地上,并统一由 一个分布式数据库管理系统管理。 分布式数据库系统由分布式数据库( d i s t r i b u t e dd a t ab a s e ,d d b ) 和分布式数据库管理系统( d d b m s ) 组成。分布式数据库是计算机网络环 境中各场地或节点上数据库的逻辑集合。它包括局部应用和全局应用:局 部应用即对仅对本结点的数据库执行某些应用;而全局应用( 或分布应用) 是指对两个以上结点上的数据执行某些应用。支持全局应用的系统才能称 为分布式数据库系统。分布式管理系统是分布式数据库系统中的一组软 件,负责管理分布式环境下的数据存取、一致性、安全性和完整性等。 1 2 分布式数据库系统的特点 分布式数据库是同网络结合的集中式数据库的发展,所以,它具有集 中式数据库的特点的同时,也还有一些自身的特点。 1 2 1 共享性与自治性 对于分布式数据库而言,多个场地或节点的局部数据库在逻辑上集 成为一个集体,并为分布式数据库系统的所有用户使用。简单地说,分布 式数据库的用户在使用该数据库时,同使用集中式数据库一样,无论该数 据位于任何站点上,只要权限允许,该用户就可以查询或修改数据,而不 需要具体关心数据的物理位置,所有站点上的数据都是共享的。这就是分 布式数据库的共享性。 自治性指的是每个站点的数据库系统管理人员可以根据以根据实际 的情况,选择存放于站点数据库中的数据是否参与全局的数据共享。对于 那些不能参与共享的数据,分布式数据库系统允许它们仅仅只保留在蟊占点 数据库中。 1 2 2 冗余的可控性 在集中性数据库系统中,数据的冗余量的大小是衡量一个数据库系统 是否最优的重要标志。但对于分布式数据库系统,适当的数据冗余可以提 高数据的查询速度,增强数据的安全性。对于不同站点用户应用的相同数 鸯窑塑耋耋堡垡丝鎏 据,在这些用户的站点上各自存放一份,可以减少网络通信的成本,提高 用户操作数据的效率。特别是,当某些站点上的数据丢失时,可以通过其 它的站点对它进行数据恢复。这是分布式数据库系统与集中式系统非常不 同的地方。 1 2 3 事务管理的分布性 事务是数据库系统中一个非常重要的概念,数据库系统中对数据的操 作都离不开事务。分布式数据库中的事务处理比集中式的事务处理更复 杂。分布式数据库中结构与集中式的不同,数据也从逻辑结构和物理结构 的组织方式扩展为全局逻辑结构、局部逻辑结构和局部物理结构方式。分 布式的事务管理是针对全局数据的管理,它的所有事务是由局部子事务合 成的,因此,它的事务管理策略与集中式数据库系统有着本质的区别。 1 2 4 存取效率 在分布式数据库系统中,数据存放于不同的站点。用户在访问数据时, 可以在多副本中选取最合适的场地副本进行数据访问。同集中式数据库系 统相比,这种访问方式,能够使得场地间的数据传输量以及次数最少,极 大地降低系统通信开销。同时,可以提高数据访问的速度。 1 3 分布式数据库系统的分类 根据分布式数据库系统建立的原则,可以把分布式数据库系统分为两 类:同构分布式数据库管理系统和异构分布式数据库管理系统。这两类分 布式数据库系统具有不同的特点,可满足不同的系统需求。 1 3 1 同构分布式数据库特点 同构分布式数据库是指各个站点上的数据库的数据模型都是一致的。 它类似于一个集中式数据库,只不过同构分布数据库将数据存放在网络中 分布的不同结点内,而不是存放在一个结点内。根据数据库管理系统的不 同,同构分布式数据库又可以分为同构同质型和同构异质型。 1 3 2 异构分布式数据库的特点 各个站点上数据库的数据类型不同的分布式数据库称为异构分布式 数据库。它的特点是在各个结点上运行着不同的数据库管理系统。它又可 以分为两个子类:一个是完全在本系统中进行集成;另一个是还要通过网 关( g a t e w a y ) 与其它系统实现连接。 鱼罂鋈垄塑生箜磐 1 4 分布式数据库的研究现状 分布式数据库系统的研究始于2 0 世纪7 0 年代中期。美国计算机公司 研制第一个分布式数据库系统的原型系统s d d 一1 。这一系统是1 9 7 6 “1 9 7 8 年进行设计,1 9 7 9 年在d e c 一1 0 和d e c 一2 0 计算机上实现的。它概括了 分布式数据库的几乎全部理论和实现技术,是分布式数据库发展中的一个 典范。目前已经有了一些同构分布与异构分布的分布式数据库系统的原 型。 我国对分布式数据库的研究是8 0 年代初开始的,虽然起步比较晚, 但起点高。目前已经研制的原型系统在性能和功能上都已达到当今世界水 平。其中有武汉大学数据库组研制的w d d b s 系统、东南大学计算机系开发 的s u n d d b 系统、人民大学数据与知识工程研究所研制的d o s s e l s 、东北 大学研制的d m u f o 等系统。 经过近2 0 年的发展,分布式数据库理论已经成熟,其技术问题也基 本解决。9 0 年代已有部分产品进入市场,但由于系统复杂性对于完全透 明的分布式数据库还难于达到,所以造成分布式数据库系统未进入实用 化。 分布式数据库系统符合当今信息系统应用的需求,符合当今企业组织 的管理思想和管理方式。尤其是那些地域上分散而管理上又相对集中的大 集团、大机关、大企业,如全球性的或全国性的公司、银行、连锁店、保 险业、各类交通运输业,以及全国性人、财、资源、环境管理机构和军事 国防部门等。在这些组织中,往往既要有各部门的局部控制和分散管理, 同时也要有整个组织的全局控制和高层次的协同管理。因此,分布式数据 库系统具有潜在的大市场。 1 5 分布式数据库的发展方向 随着一些新应用的出现和计算机技术的发展,分布式数据库技术也出 现了许多新的发展方向。 1 5 1 开放式数据服务器 开放式数据服务器是将数据服务器技术和分布式数据库技术结合在 4 鸯黼磐垄塑鹜麴瓣塞 一起的数据服务器结构。例如,一个地理上分散的分布式数据库中的舔个 场滤是透过广域弼遘行连接,瑟每个场建又是透过一个罄一羧务器霸避遘 局城网连接酌一缀工俸站组成。每个工作站都能够通过髑域网或广域潮存 取任何数据服务器上的数据。 这毒孛结擒送行数据查邂黪,霹强采臻嶷燕裁鼹务器受责鼹毒懿套诲处 遴,也可以在每个应用服务嚣上设置分布斌查询处理器和查询哥录。 开放式数据服务器结构邋应于分散于备地的办事她或分公司规模较 大熬全球大型跨隰公霹、业务菠围广的大型企业等,办搿处或分公蔼建豁 采溺c s 翡服务器帮客户梳络构,同时各个办事处或分公司韵服务器通过 i n t e r n e t 等广域网进行通信。这种技术间管理信息系统相结合能够满足 上谶企业结构的需要。 器2 并行数据鼹务器 并行数据服务器是利用计搏机并行体系结构建立的数据库服务器,它 能够避行有效的数据管理。并雩亍体系是通过多处理枫缝梅来完成的,多处 疆祝结构是交鬻滤通讯奔囊逡接起来懿多令狻立处理攀元组成的。备个处 理单元可以分别执行不同的操作、查询或予操作等,以并行的方式执行相 互查询、内部奁询和内部操作。 金狻占结构憝多楚理税髂系结擒孛翡一耱,其中每个处理瓿对一个或 多个内存模块或磁盘单元只自谶行互斥访问,所共享的资源仅有网络和总 线,用以交换信息。这种结构可以成为分布式数据库系统的一种特殊实现 方式,其鏊夔是在数令爱戆弱瓣奎蔑攘诗冀撬基麓之上实蕊一个功戆舔大 的计算机系统。 通过并行数据服务器技术,企业可以利用现有的计算机组成一个功能 强大靛分毒式数爨摩系统蠢不溪要耗费匿资霪囊配墨褒移。这襻有裂予孛 小众渡普及分布式的信息管理系统,加快髂患化的建设步伐。 1 5 3 分布式知识库系统 分毒式絮谖薄系统是褥专寒系统霭分纛姣数据瘴技术穗结舍懿产物, 鱼辇篷垄馨鲨篓蹩 具有从己知信息搬导出新的信息的能力。一个知识库可定义为一个内涵数 据痒和一个外延数据库缀成的并集。内涵数器库焉于存储公共知识,郧命 题和规则等:外延数据艨用于存储事实,即基本数据。 分布式知识库系统能够提商集中式专家系统的性能,打破专家库中知 识积累翁戆域疆铡,热袄整个系统静遮行遗波。所叛,分布式知识库系统 具有广阔的应用前景,怒目前分布式数据库研究的一个发展方向。 1 5 4 分布式谶向对象数据库系统 面向对象数据库是措提供了面向对象的建模方法、编程语言和数掇库 语言灼支持嚣向对象的数握库。宅综合了嚣国对象驰程序设诗按零期数据 库管理技术,具有面向对象方法所具有的建模能力和灵活性,能支持复杂 数撂褒示黪管理;豫枣 了嵌入式语言豹不足,完全冒敬瑁褥商对象静数据 库语言来开发复杂的数据库系统;同时,面向对象数据库提供了高级的数 据瘴特性。 嚣囊对象数据摩技零笼够缭短数鬃瘁系绞骜并发霭期,提高系统翡淫 能,方便用户对系统进行维护。分布式面向对象数据库技术是分布式数据 痒系统又一个热门筋发栽方向,受至了广大编程人员的欢逐。 6 鸯黧骚盔篁鹜警誊远盔 第2 章分布式数据库系统体系结构 2 。 分布式数据库模式结构 分布式数据库系统是集中式数据库系统在网络环境下的扩展和深入。 因此,分布式数据库系统保持了集中式数据库系统的特饿,又比集中戏数 据艨系统复杂。 目前,关于分布式数据库的结构尚无统一的标准。般认为分布戏数 据魔系统为四层的模式结构( 如图1 1 ) 。这种四层模式划分为:全局外 屡( 或称全局褫辫) 、全局壤念层、届部檄念屡秘鼹部内朦。囤霹,凌各 瀑次之闻还有相应的层闻映射。下面通过与集中式数摇癣模式结构的对比 来分析分布式数据库的模式结构。 图k t 分布式数据库结构图 7 鱼墼竖荃鲨彗兰趑 2 1 1 全局外层 分布式数据库的全局外层如同集中式数据库一样,由多个用户视图 ( 简称为视图) 组成,它们是分布式数据库系统特定的全局用户对分布式 数据库的最高层次的抽象。 分布式数据库与集中式数据库的视图有同样的概念,不同的只是它不 是从某一个具体场地上的局部数据库中抽取,而是从一个虚拟的由各局部 数据库逻辑集合中抽取。对全局用户而言,在所有分布式数据库的各个场 地上都可认为所有的数据库都在本场地,也就是说他们不需要关心数据分 布的实际物理位置,只需要使用他们所需的数据。 2 1 2 全局概念层 全局概念层是分布式数据库的整体抽象,包含了全部数据特性和逻辑 结构。就像集中式数据库中概念视图一样,是对数据库全体的描述。 分布式数据库全局模式概念层具有三种模式描述信息:全局概念模 式、分片模式和分配模式。全局概念模式描述分布式数据库全局数据的逻 辑结构,是分布式数据库的全局概念视图,包含全局概念模式名、属性名、 每种属性的数据类型定义和长度:分片模式描述全局数据的逻辑划分视 图,是全局数据逻辑结构根据某种条件的划分,即成为局部的逻辑结构, 每一个逻辑划分即是一个片段或分片:分配模式描述局部逻辑的局部物理 结构,是划分后的片段( 或分片) 的物理分配视图。 从全局概念层观察分布式数据库,它定义了全局数据的逻辑结构、逻 辑分布性和物理分布性,但并不涉及全局数据在每个局部场地上的物理存 储细节。 2 1 3 局部概念层 局部概念层是由局部概念模式描述,它是全局概念模式的子集,全局 概念模式经逻辑划分后被分配在各局部场地上。在分布式数据库局部场地 上,对每个全局关系有该全局关系的若干个( 可允许是全部) 逻辑片段的 物理片段集合,该集合是一个全局关系在某个局部场地上的物理映像,其 鱼罂琶签塑生箜磐 全部则组成局部概念模式。如果两个场地上所有的物理映像都相同,则其 中一个场地上的物理映像必是另一个场地的副本,因此两个场地的局部概 念模式也相同。 2 1 4 局部内层 局部内层是分布式数据库中关于物理数据库的描述,相当于集中式数 据库的内层。其描述的内容和方法与之大致相同。 总之,分布式数据库四层结构及其模式定义和映射关系,体现了分布 式数据库是一组用网络联结的局部数据库的逻辑结合。它们在地理位置上 是分散的,但是在逻辑上是一个整体。 2 2 分布式数据库管理系统 分布式数据库管理系统如同集中式数据库管理系统一样,是对数据库 进行管理和维护的一组软件,是分布式数据库系统的重要组成部分,是用 户与分布式数据库的接口。 分布式数据库管理系统包括三个组成部分:全局数据库管理系统 ( g d b m s ) 、局部数据库管理系统( l d b m s ) 和通讯管理程序( c m ) 。它能支 持四个基本功能:应用程序的远程数据库操作( 包括查询和更新操作) 、 支持分布式数据库系统的完全的或部分的透明性、对分布式数据库( 包括 全局数据库和局部数据库) 的管理和控制以及支持分布式事务的并发和恢 复。 2 2 1 全局数据库管理系统( g d b m $ ) 全局数据库管理系统负责管理分布式数据库中的全局数据,主要有以 下的几个方面:全局数据库管理系统起到用户和局部数据库管理系统、用 户与通讯管理系统之间的接口;负责定位和查找用户请求的数据;对不同 的请求采取相应的策略;当某一场地出现故障时,能保证其他场地的正常 运行,并及时恢复该场地以及处理全局数据与局部数据之间各个方面的转 换等。 9 亟鳖墼茎耋墼箜丝錾耋 2 2 2 局部数据库管理系统( l d b m s ) 局部数据库管理系统是分布式数据库系统中各场地的数据库管理系 统。对不同的分布式系统,它的功能有很大的差异。对于场地自治性很强 的分布式系统,局部数据库管理系统的功能将和集中式数据库管理系统一 样。若场地数据库系统和全局系统不一致,局部数据库管理系统则必须承 担各种转换( 根据映射) 并执行。 2 2 3 通讯管理程序( c m ) 通讯管理程序是保证分布式数据库系统中场地间信息传送部分。无论 对于什么样的通讯网络,它们都遵循网络协议,来保证场地间的通讯服务。 通讯管理程序就是正确地使用这种协议,为分布式数据库提供正确而可靠 的通讯服务。 总之,个分布式数据库管理系统必须对物理上分布存储于用计算机 网络连接的多个场地上的,而逻辑上又是一个整体的分布式数据库进行全 面的管理,使之具有高可靠性、高并行处理性、高可用性和处理代价低、 通信成本少、易升级等集中式数据库系统所不具有的优点。 2 3 分布式数据库系统结构 分布式数据库系统是数据库系统的一个子集,它不仅包括分布式数据 库管理系统和分布式数据库,还包括其它的部分。它按照分布式数据库方 式存储和维护数据,并向应用的网络环境系统提供数据和信息的分布式系 统。它是存储介质、处理对象、管理系统和网络环境的综合体。 无论是哪种分布式数据库系统,它们的结构都是由这几部分组成( 如 图2 1 ) :多台计算机设备,并由计算机网络连接:计算机网络设备,网 络通讯的一组软件;分布式数据库管理系统,包括g d d m s 、l d b m s 和c m 等: 分布式数据库( d d b ) ;分布式数据库管理者( d d b a ) 和分布式数据库系统 软件文档。 分布式数据库管理者分为二级,一级是全局数据库管理者( g d b a ) , 另一级是局部数据库管理者( l d b a ) 。g d b a 负责面向全局数据和信息的控 1 0 墓黧璺霪塑驻盏墓冀这 制和管理,l d b a 是磷向g d b a 鞠髑部数据及信熙的控制与管理。 图2 工分布式数据库系统体系结构 黧鬻星鹜鎏鹜筮鍪l 这 第3 章分布式数据库数据传输机制 3 。1 数据分游与分配 在实施分布式数据库系统时,必须考虑如何将数据分布在系统的各个 场地( 站点) 上,也就是说怎样将数据进行分片,在进行分片后又怎样将 它奶进行分嚣。分片是对整个蒙据疼孛盼数据来谨匏,瑟分嚣是分布焱鼗 掰痒在物理位鬣上豹存储。 3 1 1 数据划分原则与分片方法 数瑟楚分是撵褥8 豹企昃关系翅分海翡庭懿邋瓣片段,蓟分是对 d d b 的一种分片操作。 分片一般按照两个原则进行数据划分,根据d d b 外魏j 特征划分和协部 穗缝。赡帮拷鬣建撞爰户毳劐翡d d b ,惫戆按照数据繁嶷、数藜矮袋等送 行划分;内部特征是指d d b 的组成性质。 分片操作包括水平分片、霆直分片、混合分片及诱拧分片四种。水平 分片是毒霉关系按霉亍横囱( 承乎囱) 戳莱些蘩箨楚分残元缀豹子集,镣个子 鬃食有一定的逻辑意义,称为一个逻辑片段。垂直分片怒将关系按列纵向 ( 瓣直向) 以属性组划分成糟干片段。混含分片是垂直分片和水平分片的 缀会。诱导分片是基于水平分片的诱导,怒一种半联结搽俸。 以某学校学艇的基本情况袤作为事例来进行具体的数据分片操作( 如 图3 1 ) 。水平操作是以“班级”属性值对农中的行进行水平划分:藏直 分片是将原表按照“姓名”秘“班级”划分为两个表,水平幸亍数不变,壤 号楚两个表豹公莛藩往,毽含在两个片段申:混合分片怒将东平分冀翮垂 直分片综合在一超,先按照“班级”进行水平划分,再进行垂直划分,将 原袭分为三个子液;如果存藏两个表,一个存放学生的班级和姓名,国一 个露放学生麴瞧爨瑟籍贯+ 嚣臻怼嚣一令焱缓照藏表审熬“褒缀”瀑瞧避 行承平划分,这就是诱导分片。 为了保证分片的正确性,通常采用三个方面的检查。首先是完整憔的 捡焱,全局关系鹚所有数据壤必须包括在经舞令冀段巾,不兔谗窭瑗遗 型翻盗筮翟连籍鎏盗 潺:重构性检查是指赝有片段必须能耋秘( 逆操作) 成全届关系:最后是 不栩交检查,这不是必须的,但是尽量要求划分时不相交。 编号姓名班级 编号姓名班缓 1 2 0 0 1 李乎9 7 0 l l,2 。,牵平9 7 0 l 编号娥名班级 | 1 2 0 0 2张蓝9 7 0 2 1 2 0 0 2张蓝9 7 0 2 ,2 。3王铃9 7 0 2 1 2 0 0 3王铃9 7 0 2 ( a ) 水平分片 国) 垂燕势片 鱼罂鋈盔塑型耋丝 编号姓名 1 2 0 0 3王铃 1 2 0 0 2张蓝 编号姓名班级 夕一 编号姓名 1 2 0 0 1李平9 7 0 l1 2 0 0 1李平 1 2 0 0 2张蓝9 7 0 2 编号班级 1 2 0 0 3 王铃9 7 0 2 1 2 0 0 19 7 0 l 1 2 0 0 29 7 0 2 ( c ) 混合分片 1 2 0 0 39 7 0 2 1 4 鸯翟逛盔塑捌鲞垡誊塞 3 1 2 数据分配的原潮和方法 全届关系经过分片露,等到著于个片段,零要将它们磐叁放爨一个物 理场地( 站点) 上。这就是数据分配问题。为分布式数据库系统的可靠性, 需要将片段技置在一个懿上静场逸上。 数据分配畜甄搴孛类型:集中型、分割型、全复测型彝混合型。集中型 是数据虽经划分,但所裔的逻辑片段宪全集中在一个场地上,像集中式数 据簿祥;分裁黧是据掰春懿逻辑片浚都分鹣在一个不弱鹣场建上;全复 制型是所有的逻辑片段在每个场地上均重复设置;混合型是数据划分后的 遂辑片段嘏据需甏分配。 琵较这嚣释分配方式,集审燮阕集孛式数攥疼基本一致,没骞额终存 储费用,但系统的可靠性差,故障恢复能力弱,外场地检索数据耗费时间 长,通讯成本高,没有翮本更新闼题。分截黧的存储代徐没有蹭鞠,系统 的可靠性比集中戮强,棱索当地数据时间短,但检索外场地数据耗费时间 长,菜场蟪出现故障后臌然不影响其他站点,但由于没有副本,系统无法 对蠢进霉亍恢复。全复制型豹可靠牲最好,无论 王傍蛄点出现故跨鄯可以进 行俄复。但存储代价高,数据熙新复杂。混合型是综合了前面三种分配模 式静没萋,辩予纛绞中菸享静逻辑片段应考虑浚嚣副本;依蕹瘦建孛熨凝 检索比确定更新代价与检索代价的评估。 简化地说,数据分配的方法有非冗余分配和冗余分配两种。非冗余分 配是疼每一释分愆方寨( # 趸众) 黎楚行计簿,然后选择一个牧签最好豹 方案。这种方法没有考虑给定场地上两个相关场地的影响。冗余分配比较 复杂,又分为选耩所有救益场地法帮添茄副本法。选择繇有狡懿殇遮法是 在全部场地内选择一组场地,当片段的一个剿本分配在这一组场地时,其 收益高于所花费的代价,刚该触本就放置在这一缀场地上;添加副本法是 先黑“最馕”法决定 # 冗余分飘方案,然后增加副本,搜其仍能收盏,再 添加副本鼠至到无法收箍为止。 3 2 并发事务控制 攀务题分毒式数据黪管理系统豹一个羹嫠组残部分,数攥露载各项攥 15 鱼塑驻盏翟滤耋擞 干笮都篷通过搴务采避行楚理韵。并发控奄l 是分布式攀务处理静基本任务之 一,其目的是保证分布式数据库系统中多个攀务的瀚效正确执行。在分布 式数据库系统中有两稀臻务调动的基本模鹜,一稀是戳锁方式的形式模 型;爨一种楚以时间印方式的时间模型。 3 2 1 锁模型 锁方式的基本思想是:事务对任何数据的操作必须先申请该数据项的 铰,只窍孛谤到锬渡嚣,瑟热琰成功以矗,君毒戳爻雩数撂矮进嚣操 睾。操 作完成以后,要释放己申请的锁。通过锁的共享及排斥的特性,实现事务 静可帛行诧谲度。 锁懿类慰分为读锬和写锬。读锁愚对数攒顼进行读摄像对要麴豹锬, 因为读操作是可以共享的,因此也称作共享锁:写锁是对数据项进行写操 俸辩装翱黪镁,写搽俸是不可共享於,透蘧魄称爻簧 它簇。 锁摸型实现并发豹最著名鲍募法怒两段锬协议( 2 p l 执议) 。基本内容 是,任何事务对数据项的操作先加锁,加锁的方法熄事务中全部加锁操作 在第一令解镶操传豹蘩蘸完成。燕锬释解锬操俸分毒在攀务中鹣瑟个浚 段,故称2 p l 协议。在分布式数据库系统中,如果众部的分布式攀务均以 2 p l 协议热锁,孀系统中的各场遣上静局部调度是霹串行的。也就是说, 如果分布式数据瘁系统采用2 p l 协议加锁,则它在任何场地( 站点) 的全 部子攀务也蹙2 p l 协议加锁的。 3 2 ,2 分布式琵镶及处理 采月锬模型约方法控铡并发式事务,可能会出魏死锬戆煌况。毽为黠 每个子事务而言都可能谯申请了部分资源锁以后,申请锁住了已l h 另, j 的潦 务锬往的姿源,觚褥进入等待状态。蓉掰鸯瓣子事务均不骚串请蠲全豁懿 锁则进入永远的相互等待状态,从而进入死锁。 氍分布戏数据库系统中,通过一些检测算法来处理死锁问题。常用的 检测簿法蠢:超辩浚解决琵镂、死锬等德霆、集孛式或势瓣控痞l 梭测殛镁 等。 1 6 巍翟墓茎塑馨卷稿鑫 超时法是解决死锁问题燎简单的方法,当事务申请对某数据项加锁 时,或在一个一定长的时间内来申请到锬,则认定系绕处于死锁状态。进 入瑟镇处理过稷,停止该事务,释放由萁占摇靛资源。该方法豹优点建没 有额外的控制报文的传送;缺点是超时的界限难以确定,分布式系统在各 个站点的计算机性能存在差异,设立统一的时限较困难。 等待鹜( w a i tf o rg r a p h ,篱写w f g ) 是捂萁节点表示每个事务,当 攀务t ,对数据项x 要获得锁时,x 已被另一事务t :锁住,这时t 。必须等待 t 。释放对x 的锁,在图中即有从,r 。指向t 。的边。出现死锁,当且仅当阁中 蛇逑有霞路。奁分布式数据露系统孛,要产垒一令分表式豹等跨霾( d w f g ) , 它幽各局部场地上的等待图( l w f g ) 联结构成( 如图3 2 ) 。 场地1场地2场地1 厂i 、余 、 、一 l 奈 , 强a 2、 、 、 f t l a l 、 工 、 f t 2 a 2 、 ( a ) 分布式死锁等待图( b ) 局部等待图 鼙3 。2 全齑帮躅帮等特銎 集中式死锁检测方法是选择一个场地来运行集中式的死锁检测程序, 然飚从系统中的熊他场地接收l w f g 。当所有的l w f g 收到后,由该穰j 挚生 成全局等待蓬d w f g ,在d w f g 巾按溅嚣路,翔有鏊路,麓发瑗死镁势避行 死锁解除处理;甭则没有死锁。同时,因为发生死锁的不是所有场地,因 此可采用分层控制方法。这种方法通过建立死锁检测程序的整颗树,通过 分艨的检索来降低网络的逶谶费惩。 通常在发现鞭锁后,采用中止事务来释放资源这榉的方式来解除殛 锁a 一般选择要中止的事务时依据下列的一些原则:中此最年轻的事务: 中止占用资源最少,代价最少的事务;中止预期完成畸阕最长的事务。 鱼墼墼盗篁蛋登继 3 2 3 多副本的并发控制 分布式数据库系统的一个特点就是存放在不同站点有多个数据项的 副本,这样可以提高系统的安全性、可靠性,提高存取效率。但是,副本 的选择以及副本的更新会增加系统的复杂性。在锁模型中,通常采用读一 写全法、多数法、主副本法、中心场地法和主副本令牌法等进行加锁处理。 读一写全法的特点是当事务对某一数据项加锁时,若加读锁,则只对 其多副本中的任一副本加锁;若加写锁,则要对该数据的所有副本加锁。 对读锁而言,只要随便采用包含该数据项的哪一个副本都可以。但是,写 锁操作需要对所有副本的都要发送报文申请,只要其中有一个回答不能加 锁,则整个操作都不能向下进行。这种方法需要进行大量的网络通讯,通 讯费用较大。 多数法是指只有在获得多于副本数一半以上的锁( 包含读或写锁) 以 后,才可以获得对该数据项的加锁,即加锁的副本数总大于未加锁的副本 数。该种方法同读一写全比,发送报文的次数要少。 主副本法是不论其副本数多少,只要其中一个称之为主副本的加上 锁,即得到该数据项的锁。一般来说主副本选择在用户提出锁某项数据申 请最多的场地,该场地称之为主场地,因此主副本方法中通讯的费用非常 低,但并发的程度也降低了。 中心场地法采用在分布式数据库系统由一个专门的场地来管理加锁 的请求,这一场地称之为中心场地。系统中所有的加锁请求都由其它场地 传给中心场地,由中心场地决定同意或拒绝用户的加锁请求。这种方法对 中心场地的依赖性很高,当申请很多时,处理的时间也会很长。 主副本令牌法是假设有一些专门的场地,这些场地拥有某一数据项的 读令牌或写令牌,这些令牌在网络中是不断传递的。当某一场地拥有某一 数据项的写令牌时,它就可以得到该数据项的读写锁,当拥有读令牌时, 它就可以得到该数据项的读锁。 这几种方法都是用来控制分布式事务处理中加锁操作的,它们各有优 耋鬻鐾垄塑鹜磬蒸塞鎏 劣。可以根据系统的实

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论