




已阅读5页,还剩67页未读, 继续免费阅读
(计算机应用技术专业论文)基于cscw的分布式异构数据库的研究与实现.pdf.pdf 免费下载
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
武汉理t 大学硕十学位论文 摘要 随着计算机及网络技术的发展,数据库系统由小型化向大型化发展,由集 中式向分布式发展。由于地理位置分布的原因、考虑到数据安全和数据分布的 需求,很多业务系统形成了具有站点自治性的分布式异构数据库体系结构,一 个个信息孤岛,很难达到互联互通,真正实现数据的共享。如何保证各个数据 库之间的数据相互访问,消除异构数据库中数据的冲突、异常,成为一个重要 的问题,分布式异构数据源集成是整合企业各项信息和对企业实现有效管理的 基础。 数据库集成技术可以有效地检测数据异常、尽早地调整数据、消除数据的 不完整和不一致,从而有助于提高信息综合利用的质量。本论文在基于c s c w 的分布式异构数据库集成方面展开研究,主要是解决在分布式、异构环境下的 数据源的访问以及数据交换问题,并把研究的内容运用到办公自动化系统中去。 首先论述课题的研究背景和意义,介绍课题所要做的工作。然后介绍c s c w 的相关问题。分布式数据库和异构数据库的基本概念,特别论述了文档数据库 和关系数据库这两种结构不同的数据库之间的区别。从而研究分布式数据库、 异构数据库相互融合的技术。对课题涉及到的关键技术进行了研究,包括如何 消除异构模式,文档数据库与关系数据库如何实现数据交换,分布式数据库中 并发控制、数据分布和数据同步的问题。仔细分析了系统的应用情况,根据应 用选择开发平台和开发模式,并论述了l o t i l sd o m i n o n o t e s 和n e t 两个平台在 本文中使用到的技术,以及c ,s 和b s 结构的特点。然后设计数据库的体系结 构,给出系统的框架。在研究数据库的设计方案时,针对基于c s c w 和w e b 的 数据库访问方法,文档数据库与关系数据库如何实现数据交换,以及分布式数 据的存储机制,做了详细的分析和选择。最后结合实际应用,实现了系统的主 要功能。 关键字:c s c w ,办公自动化系统,分布式异构数据库,l o t u sd o m i n o ,t 武汉理工大学硕士学位论文 a b s t r a c t w i t l ln l ed e v e l o p m e n to fc o m p u t e ra n dn e t w o r kt e c h n o l o g y ,d a t a b a s es v s t e m s d e v e l o 口f r o mm i n i a t 耐z a t i o nt on l a x i m i z a t i o n a n df 而mc o n c e n 订a t i o nt od i s 埘b u t i o n c o n s i d e r i n gt h ed i s t r i b u t e dg e o g m p l l i c a lp o s i t i o na 1 1 dm ed e m a l l dt h a tt 1 1 es e c u r i t y a n dd i s t r i d u t i o no ft h ed a t a a1 0 to fb u s i n e s ss v s t e m sf b 咖t h ed i s t r i b u t e d h e t e m g e n c o u sd 撕b 耶es y s t e mw h i c hh a v ea u t o n o m i c 、v c b s i t ed i s t r i b u t e d d i 丘宅r e m c o m p u t e r s 盯eh e t e r o g e n e o u sa 1 1 db e c o m ei n f o r r n a t i o ni s l a n d s ,o nw h i c hd a t as h 盯i n 皿 a n di n t e m p e m b i l i t yb e c o m em o r ea n dm o r ed i m c u l t s oh o wt od e t e c ta n dr e s o l v e d a t ac o 1 i c t sa i l dh e t e r o g e n e i t ya r et h ef 1 1 帕a m e n t a li s s u e s t h ei n t e g r a t i o no f d i s 打i b u t e dh e t e r o g e n e o u sd a t a b a s ei st 1 1 ef i l t l d 锄e t i o nf o rc o n f o m l i n 窑t l l ee n t e r p r i s e i o n a t i o na l l dr e a l i z i n ge f f b c t i 、岵m a n a g e m e n t d a ta _ b a s ei n t e 犁a t i o nt e c 量l n o l o g i e sp r o v i d ee f i e c t i v e c h a i l l l e l sf o fd e t e c 血壤d a t a h e t e r o g e n e i 劬m o d i 研n g d a t a e a r l i e r , r e s o l v i n g d a t a i n c o m p l e t e n c s s a n d i n c o n s i s t e n c i e s ,趾df i n a l l yi m p r o v i n gd a t aq l l a l i t yf o rc o m p r e h e n s i v eu s a g e t h j s 也e s i sr e s e 鲫c h e sd i s 懈b u t e dh e t e r o g e n e o u sd a t a b a s co nc s c w t h em a i n p r o b l e mi st l l a th o wt oa c c e s s i n g 趾de x c 血趾g i n gd i f f b r e n td a t as o l l r c e su n d e rt l l e d i s t r i b u t e dh e t e r o g e n e o u se n v i r o n m e n t ,a i l dh o wt o 印p l y i n gt h et e c l l i l o l o g yo nt l l e o 伍c ea u t o m a t e ds y s t e m 1 1 1 em e s i sb e g i 芏1 s 、 ,i md e s c m i n gr c s e a r c hb a c k g r o u n da i l dm e a i l i n go fs u b j e c t , a i l di n t r o d u c i l l gw h a tt od o ni m m d u c e st l l er c l e v a n tp r o b l e m so fc s c w ,也eb a s i c c o n c e p t i o no ft h ed i s 仃i b u t e da n dh e t e r o 窖e n e o u sd a ta _ b a s e t h ed i 任b r e n c eb e t w e e n d o c u m e md a 【乜b a s e s 趾dr c l a t i o nd a t a b a s ei se s p e c i a l l yd e s c r i b e d ,f o rs t u d y i n gt l l e c o n f o m i t ) rt e c l l r l o l o g 耳na l s oc a r r i e so nr e s e a r c hi nk e yt e c h n o l o g yi n c l u d i n g d i s p e l i n gt h ed i f l b r e n tm o d eo fd a 【t a ,i n t e r c h a n g i n gd a t ab e t v 旧e nd o c u m e n td a t a b a s e a i l dr e l a t i o nd a t a b a s e ,m ec o n c u r r e n c yc o n 扛o l ,d a t ad i s t r i b u t i o na n dd a l as i m u l t a n e i “ i nd i s t r i b u t e dd a t a b 髂e a f t e ra n a l y s i n gt l l es y s t e ma p p l i c a t i o 玛w ec h o o s et l l e d e v e l o p i n gp l a t f o 肌a i l dm o d e ,a n di n t r o d u c et h e 鲰p i a t f o r n l so fl o t u s d o m i n o m o t e 趾d n e tt h e nm es v s t e ms 仃u c n l r eo f m ed a t a b a s ea n dt l l es v 鼬e m a t i c m m l ea r ed e s i g n e d w l l i l e 咖d y i n gt h ed e s i g np l a no ft h ed a t a b a s e ,t h et 1 1 e s i s a i l a l v s e s 血em e t h o d sa c c e s s i l l gt om ed a t a b a s eb a s e do nc s c w a n dw 曲,t l l e 、v a y st o e x c h a n 2 ed a 诅,a n dt l l en l e m o r ym e c h a l l i s mo ft h ed i s t r i b u t e d 出n a f i n a l l y l em a i n f u n c t j o no f 吐l es y s t e mi sd e s c r i b e dt h r o u g l lap f a c t i c a ia p p l i c a 廿0 n k e yw o r d s :c s c w , o a s ,d i s m b u t e dh e t e r o g e n c o u sd a t a b 船e , l o t u s d o m i n o ,n e t 武汉理工大学硕士学位论文 1 1 课题研究的背景 1 1 1 办公自动化系统 第1 章绪论 现代社会,办公自动化已经突破以往狭窄、封闭的办公室范围,进入一个 广阔的发展天地,办公自动化系统( o a ) 也已成为现代信息社会的重要标志。 随着时代的发展,如今办公自动化技术的内涵及外延都在发生改变。在企业信 息系统中引用各种综合技术可以使办公人员处理更为广泛的业务和办公信息, 并使经营业务与办公事务互相融合。网络的发展拓展了0 a 的作用范围,现代意 义上基于网络的o a 已经不仅仅是提高像打字录入、编辑排版这样的个人事务处 理效率,甚至也不仅仅是实现公文收发、流转、签发、归档这样的群组作用效 率。事实上,网络时代的0 a 是一种企业级跨部门运作的基础信息系统,可以联 接企业各个岗位上的各个工作人员,可以联接企业各类信息系统和信息资源。 o a 系统的运行可以适应单位为提高运作效率而进行的机构调整,而且还可能促 进企业资源合理配置的进程,甚至改革机构运作的流程。也就是说,o a 在模拟 手工作业的同时,还将反作用于传统的办公流程。因此,在企业信息系统的建 设过程中,要改变以往以业务数据为主的管理信息系统的观念及陈旧的办公自 动化的概念,应用先进的技术及创新的理念,构造一个在企业信息系统中不可 或缺的高效的办公运作系统。 因特网的发展孕育着企业管理和经营模式的革命,同时也为办公自动化系 统提供了一个广阔的舞台。可以这样看待办公自动化与其他信息系统之间的关 系: 企业的办公系统是所有员工与管理者都必须应用的系统,它结合强大的通 讯技术和工作流技术,它的信息多为文档是上下文关联的信息,主要面向于企 业的日常运作和管理。而企业的信息系统( m i s 、e r p 等) 多处于相对专业的数 据集合。结合两者的优势使企业的信息进行集成和有效地共享,让企业信息能 被所有需要信息的管理者和员工及时、有效地获取和应用,充分发挥企业的信 武汉理工人学硕士学位论文 息的作用,支持企业的运作管理,提高企业的整体反应能力,使企业在激烈地 竞争中处于有利地位。 第一代办公自动化是以数据为处理中心的系统。它的最大特点是,应用基 于文件系统或关系型数据库系统,以结构化数据为存储和处理对象,强调对数 据的计算和统计能力。其贡献在于把i t 技术引入办公领域,电子化纸质文件, 提高了文件管理水平。但是缺乏对于协作型工作的处理能力,而办公过程主要 是群组协作过程,如收发文件。 第二代是以工作流为中心的办公自动化系统。伴随网络技术的发展,软件 技术也发生了巨大的变化。办公自动化己实现了以工作流为中心的模式。这种 方式彻底改变了早期办公自动化系统的不足之处。以e m a i l 、文档数据库管理、 复制、目录服务、群组协同工作等技术作支撑,以工作流为中心的第二代办公 自动化系统包含众多实用功能和模块,实现了对涉及人、事、文档、会议的自 动化管理。较第一代办公自动化系统相比,第二代系统有三个显著特点:以网 络为基础,以工作流自动化作为主要的技术手段,缺少对知识管理的能力。 第三代办公自动化系统即以知识管理为核心的新一代办公自动化系统。在 实践中,由于网络的普遍应用带来的人们对信息共享的需求,使得企业更需要 越来越多的外界信息和企业内部知识的积累,并在它们之间不断地交互与碰撞 中使知识获得再生和增值。办公自动化不应只是人际办公的计算机化,而是要 融入新的管理方式,要融知识管理于办公自动化之中。通过新系统,办公自动 化系统为领导层、办公室、业务部门等提供了全新的、高效的工作模式。第三 代o a 的核心是知识。较第二代相比,第三代o a 不仅模拟和实现了工作流的自 动化,更模拟和实现了工作流中每个单元和每个工作人员运用知识的过程。不 管是哪一代的0 a 系统,都要有数据库的支持,下面简单介绍数据库技术。 1 1 2 数据库技术 数据库技术产生于2 0 世纪6 0 年代末7 0 年代初,它的出现使得计算机应用 进入了新的时期。数据库技术聚集了数据处理最精华的思想,是管理信息最先 进的工具。 数据库管理系统( d b m s ) 是由一个互相关联的数据集合和一组用以访问这 些数据的程序组成的软件系统。肺m s 的基本目标是要提供一个可以方便地、 有效地存取数据库信息的环境。在这样的环境下,用户不必了解他的文件的存 2 武汉理工人学硕十学位论文 储细节,可以抽象地、逻辑地使用数据,其一切繁琐的存储细节由d b m s 来完 成。 设计数据库系统的目的是为了管理大量信息。对数据的管理既涉及到信息 存储结构的定义,又涉及信息操作机制的提供。此外,数据库系统还必须提供 所存储信息的安全性保证,即使在系统崩溃或有人企图越权访问时也应保障信 息的安全性。如果数据将被多用户共享,那么系统还必须设法避免可能产生的 异常结果。数据库系统有以下几个的功能特性1 2 】: ( 1 ) 数据独立性 数据独立性是数据库系统一个最重要的目标。简单地讲就是数据独立于应 用程序。数据处理的发展史就是数据独立性不断进化的历史。独立性的实现是 数据库管理系统通过改变映射关系而完成的。 ( 2 ) 数据安全性 数据的安全性是指防止无关人员获取他不该知道的数据。数据库系统中采 取身份验证、子模式和存取控制等措施和策略来保证数据的安全性。 ( 3 ) 数据完整性 数据完整性就是数据的正确性、真实性、客观性。 ( 4 ) 数据一致性 表示客观世界同一事物状态的数据,不管出现在何时何处都是一致的、正 确的、完整的。所以数据库系统也应该具有这种一致性。 ( 5 ) 数据共享 数据是一种十分宝贵的资源,如何充分利用这些资源是数据处理一项很重 要的任务。数据共享是数据库系统的主要功能特色之一。它体现在,多个应用 可以使用同一数据文件、记录、数据项值,在同一时刻多个用户可以存取同一 数据等方面。 ( 6 ) 控制冗余 数据库系统由于有子模式的概念,实现了数据共享,控制冗余就比较容易 解决。但是数据库中没有彻底消除冗余,因为有时保留一点冗余对提高系统效 率有好处,尤其在分布状态下,可以减少网上的传输时间。 ( 7 ) 集中管理 数据库系统要全面负责各文件的管理,不仅对文件的结构、数据的装入、 文件的各种操作要集中管理,而且对文件的内容、数据的类型、长度、大小、 安全、保密等都要检查、过问。 武汉理工大学硕十学位论文 ( 8 ) 并发控制 由于数据库系统实现了多用户共享数据,就可能在同一时刻多个用户要求 存取同一数据。对这些同时发生的操作施行的控制策略称为并发控制。 ( 9 ) 故障恢复 在数据库系统运行中,很难做到不出故障。在数据遭到破坏时,如何尽快 地使它恢复正常,就是数据库系统故障恢复功能需要做的事。其中采取的策略 有建立副本、日志、检查点等。 ( 1 0 ) 数据字典 数据库系统中所包含的信息除了数据库本身外,还有很多非数据的信息, 一般把这些信息集中保存在一个专门的地方,这就是数据字典。 1 2 课题的提出及其研究意义 信息社会的到来,使信息和数据的处理处于越来越重要的地位,也使人们 的工作任务越来越繁重。计算机技术的发展和应用使得快速处理大量数据成为 可能,特别是数据库技术的出现和发展,为信息和数据的处理提供了强有力的 工具,同时,也使传统的集中式数据库系统很难满足应用的需求。计算机数据 库系统已趋向于通过通信网络互相连接起来,形成分布式数据库系统。采用分 布式数据库系统能够更好地实现计算机硬件、软件及人才资源的共享,避免投 资上的过度消费。 企业常常分阶段开发0 a 系统,或者企业内部不同部门有各自的信息要求且 有特定的应用,每个部门根据自己应用的特征去选择一个适当的数据库管理系 统支持自己的应用。在系统进一步开发或系统集成中,常常面临的一个突出问 题就是一个办公自动化系统中存在两种以上不同的数据库环境。因此,如何最 大限度保护用户投资,透明地跨越异构网络、计算机平台,实现异构数据库之 间的连接、数据交换和数据共享,无缝地联合使用异构信息源中的信息,已经 成为办公自动化系统开发的关键。如果能实现结构不同的数据库的交互访问, 不仅可以提高业务管理的安全性、可靠性及工作效率,同时为管理者提供了快 速的信息收集、传递和处理方法,方便了用户与管理人员之间的交流与合作。 并且使得所有信息可自由顺畅地在分散的各办公地点之间传递。这对办公自动 化系统具有十分重要的意义,使得办公自动化系统的功能更强大、实用。 4 武汉理丁:大学硕士学位论文 1 3 课题的主要工作 计算机自诞生以来,被大量用于数据处理工作。由于在选择数据处理系统 时存在时间和空间上的差异,使得人们使用的数据源千差万别,这就相应的带 来了数据集成的问题。例如:一个集团内部的各个子公司分别根据自身要求选 用了不同的数据库,当要在集团内进行跨公司的数据处理时,就将牵涉到多种 异构数据库,这是空间上的异构;而一个企业在发展的过程中也往往需要随着 情况的变化,升级选用更适合的新系统,这是属于时间上的异构。近来,随着 社会合作国际化的加强,数据集成的要求愈发强烈。 本论文在基于c s c w 的分布式异构数据库集成方面展开研究,主要是探讨 和解决在分布式、异构环境下的数据源的访问以及数据交换问题,并把研究的 内容运用到办公自动化系统中去。 全文共分为七章,各章节的具体内容如下: 第1 章绪论论述课题的研究背景和意义,介绍课题所要做的工作和对本文 其他部分的概述。 第2 章c s c w 概述介绍c s c w 的相关问题,包括基本概念及其对数据库 的要求。 第3 章分布式异构数据库介绍分布式数据库和异构数据库的基本概念,特 别论述了文档数据库和关系数据库这两种结构不同的数据库之间的区别。从 而研究分布式数据库、异构数据库相互融合的技术。 第4 章基于c s c w 的分布式异构数据库的关键技术对课题涉及到的关键 技术进行了研究,包括如何消除异构模式,文档数据库与关系数据库如何实 现数据交换,分布式数据库中并发控制、数据分布和数据同步的问题,为系 统的设计打基础。 第5 章基于c s c w 的分布式异构数据库系统的设计首先仔细分析了系统 的应用,根据应用选择开发平台和开发模式,并论述了l o t u sd o m 诂。烈o t c s 和n e t 两个平台在本文中使用到的技术,以及c s 和b s 结构的特点。然 后设计数据库的体系结构,给出系统的框架。在研究数据库的设计方案时, 针对基于c s c w 和w e b 的数据库访问方法,文档数据库与关系数据库如何 实现数据交换,以及分布式数据的存储机制,做了详细的分析和选择。 第6 章系统的实现结合实际应用描述系统的主要功能。 第7 章结论本文内容的总结和下一步的工作展望。 武汉理工大学硕士学位论文 2 1 什么是c s c w 第2 章c s c w 概述 计算机技术的发展将人类社会推进到信息时代,改变着企业经营过程、人 们的工作学习和休闲方式。随着信息化的深入,网络通信技术和计算机技术的 融合。以及i n t e m e t 的普及,计算机应用从过去的单用户工作模式过渡到了分布 式的多用户协作模式。于是就产生了计算机支持的协同工作( c o m p u t e rs u p p o r t c o o p e m t i v ew o r k ,c s c w ) 。 c s c w 可以定义为这样的计算机系统【3 】,地域分散的一组用户借助计算机及 其网络技术( c s ) ,共同协调与协作来完成一项任务( c w ) ,并提供给他们访 问共享环境的接口。即一个任务、多个用户,多用户为完成一项共同的任务而 组成用户群,c s c w 为这个用户群提供协同支持。通过建立协同工作的环境, 改善人们进行信息交流的方式,消除或减少人们在时间和空间上的相互分隔的 障碍,节省工作人员的时间和精力,提高群体工作质量和效率,从而提高企业、 机关、团体、乃至整个社会的整体效益和人类的生活质量。 2 2c s c w 的作用 l 、信息共享 信息共享是c s c w 的基本任务,它要求c s c w 应用系统为各协作成员提供 方便可靠的信息采集、访问、修改和删除机制。具体地说就是:提供运行在不 同操作平台上的不同应用程序对数据的存取和交换,例如对于电子邮件实现不 同文档格式的转换:支持分布成员,信息资源以及当前活动信息的维护,便于 人们去寻找相应的工作伙伴,利用相应的资源,参加某项特定的活动,提供信 息共享的不同访问方式;根据用户的身份,提供对数据的不同的访问权限等等。 2 、多媒体群组通信 c s c w 系统提供了支持在协作成员之间互换多媒体信息的通信机制,这些 媒体包括文本、语音、图形、图像、音频和视频。其次,提供群组通信支持, 6 一茎堡墨三奎堂堡圭堂焦堡苎 包括异步组通信和同步组通信,它使通信服务具备多种数据交换方式,即点到 点、点到多点、多点到一点和多点到多点等。这意味着,协作的用户可作为数 据的发方或收方,又可以同时具备收,发的功能。 3 、个体活动管理 c s c w 系统允许参加者对同一事务的不同部分以不同形式进行观看和修改: 同时提供安全机制,对公用操作数据和私有操作数据进行区分,为参加协调工 作的用户保留一部分私有数据不为群体共享。 4 、群体协作管理 c s c w 系统支持多个用户参与同一工作,它提供给各协作用户一个公共平 台,每一个协作用户在它的协调下完成一项共同的工作,它负责对活动的步骤 加以协调,其中包括:工作流支持系统、群组方法支持工具、群组工作程序协 调系统和群组决策支持系统,也包括群体活动中成员间任务和责任的划分;同 时在协调中采用协调控制策略,如:令牌控制方式、并发控制和协商控制等, 以避免个体之间的冲突口】。 2 3c s c w 的分类 群体协作方式的多样性,为c s c w 研究提供了丰富的内容。在c s c w 系统 中,人们围绕共同的任务需要进行交互通信( i n t e r a c t i v cc o m m u i l i c a t i o n ) 、协调 ( c o o r d i n a t i o n ) 、协作( c o l l a b o r a t i o n ) 、协同( c o o p e r a t i o n ) 等基本活动。可 以根据c s c w 系统中的基本活动方式、群体成员地理分布位置、群体规模、使 用的基本工具和工作环境、应用等对c s c w 系统进行分类p j 。 按交互协作方式分类,群体成员之间的协同工作按时间划分可有同步方式 和异步方式两种。在同步方式时,群体各成员在同一时间进行同一任务的协作; 在异步方式时,群体各成员在不同时间进行同一任务的协作。 按群体成员的地理分布,协作又分成同地协作( c o 1 0 c a t c d ) 和异地或远程 协作( r _ e m o t e ) 两种。 按群体规模分类,分为两人协同系统和多人协同系统。 按使用的基本工具和工作环境分类,在c s c w 系统中所使用的基本支撑环 境和工具有信报系统( m e s s a g es y s t e m 电子邮件系统) 、电子布告栏、会议系统、 协同协作和讨论( 编著) 系统、工作流系统和群件等等。 武汉理上人学硕士学位论文 按c s c w 应用系统分类,c s c w 有着广阔的应用领域,如协同科研系统、 协同设计系统、远程医疗系统、远程教育系统、协同决策系统、军事协同( 参 谋会议) 系统和协同办公系统等等。 2 4c s c w 对数据库的要求 与传统的应用软件系统相比,c s c w 具有诸如多级存取权限、复杂u n d o 操 作、并发控制、分布性、时态性、实时性、主动性、移动性、多媒体性、保留 历史记录、感知性等特点,这些特点对数据库提出了新的要求。下面将具体阐 述c s c w 对数据库的要求i 4 j 。 ( 1 ) 多级存取权限:c s c w 对数据的存取权限控制比传统的数据的存取权 限控制复杂得多。在c s c w 中,数据的存取权限控制不能简单地用“读”与“写” 两种方式来区分,而应该对数据的存取权限进行分级,实现存取权限的多级管 理,并且用户对数据的存取权限可以动态转换。例如,在协同会议系统中,随 着会议的进展,会议的主持者权限可以在不同的用户( 如会议主持人、会议主 席等) 之间动态转换。 ( 2 ) 复杂u n d o 操作:c s c w 中的u n d o 操作扮演着重要的角色,一般可 分为全局u n d o 与局部u n d o ,并实现难度大;尤其在协同协作、协同编辑等系 统中。u d o 操作的处理更为复杂。 ( 3 ) 并发控制:c s c w 是群体成员之间共享数据信息,共同协作完成一项 任务,故并发控制在c s c w 中显得尤为重要。 ( 4 ) 分布性:c s c w 中的群体成员的地理位胃分散分布,故c s c w 工作在 分布式环境下,处理的信息具有分布性。 ( 5 ) 时态性:c s c w 的群体成员之间交互的信息流中包含时间要素,故具 有时态性。 ( 6 ) 实时性:同步模式下的c s c w 具有较高的实时性要求。 ( 7 ) 主动性:c s c w 中的群体成员往往希望系统能灵活地根据外部环境或 内部状态等情况而主动做出各种反应,故具有主动性。 ( 8 ) 移动性:c s c w 有时需要处理移动对象,尤其是移动c s c w ,故具有 移动性。 ( 9 ) 多媒体性:c s c w 有时需要处理大量的多媒体数据,故具有多媒体性。 武汉理一l 人学硕士学位论文 ( 1 0 ) 保留历史记录:c s c w 涉及多个成员之间的协同工作,故保留协作 的历史记录是必需的,以实现协作历史的跟踪与审计和协作过程的回放等操作。 ( 1 1 ) 感知性:c s c w 是群体成员协同工作,讲究人人交互,即既要让协 作成员看到共享的数据,又让其感知到其它协作成员对该数据的操作,以便及 时获得数据变化的通知,故具有感知性。 武汉理t 大学硕七学位论文 第3 章分布式异构数据库 3 1 分布式数据库技术 3 1 1 分布式数据库的定义 分布式数据库系统,通俗地说,是物理上分散而逻辑上集中的数据库系统 5 1 。 分布式数据库系统使用计算机网络将地理分散而管理和控制又需要不同程度集 中的多个逻辑单位( 通常是集中式数据库系统) 联接起来,共同组成一个统一 的数据库系统。因此,分布式数据库系统可以看成是计算机网络与数据库系统 的有机结合,是分散与集中的统一。 在分布式数据库系统中,被计算机网络联接的每个逻辑单位,称为站点 ( s i t e ) 或结点( n o d e ) 。所谓地理位置上分散是指各站点分散在不同的地方, 大可为不同国家,小可为同一建筑物中的不同位置。所谓逻辑上集中是指各站 点之间是一个逻辑整体,并由一个统一的数据库管理系统进行管理,这个数据 库管理系统称为分布式数据库管理系统( d i s t r b u t e dd a _ t a b 嬲em a l l a g e m e n t s v s t e m ,简称d d b m s ) 。 一个用户如果只访问他注册的那个站点上的数据则称为本地( 或局部) 用 户或本地应用;如果访问涉及两个或两个以上的站点中的数据,则称为全局用 户或全局应用。 3 1 2 分布式数据库的特点 分布式数据库有如下特点1 6 】: l 、数据的物理分布性 数据库中的数据不是集中存储在一个地区一台计算机上,而是分布在不同 场地的计算机上,多个场地的局部数据库在逻辑上构成一个集体,并为所有的 全局用户所使用。 2 、数据的逻辑整体性 1 0 武汉理工人学硕士学位论文 数据库虽然在物理上是分布的,但这些数据并不是互不相关的,它们在逻 辑上是互相联系的整体。 3 、数据的分布独立性( 也称为分布透明性) 在用户看来,整个数据库仍然是个集中的数据库,用户不关心数据物理 位置分布的细节,也不必关心数据副本的一致性,分布的实现完全由系统来完 成。 4 、场地自治和协调 系统中的每个站点都具有独立性,能执行局部的应用请求,每个站点又是 整个系统的一部分,可通过网络处理全局的应用请求。 5 、数据的冗余 与集中式数据库不同,分布式数据库中应存在适当冗余来提高系统处理效 率和可靠性。这是由于分布式数据库数据存储的分散性,使各场地在网络上传 输数据时,传输代价增加。因此分布式数据库的数据一般存储在经常使用的场 地上,以节省开销。 6 、集中与自治相结合的控制机制 分布式数据库系统常常采用集中和自治相结合的控制机制。各局部的d b m s 可以独立地管理局部数据库,具有自治的功能。同时,系统又设有集中控制机 制协调各局部d b m s 的工作,执行全局管理功能。 7 、事务管理的分布性 分布式数据库由于数据的分布特点使事务执行和管理也具有分布性,一个 被执行的事务将被划分成在许多场地上执行的子事务,子事务的执行结果合并 成全局事务的执行结果。同样事务的原子性、一致性、可串行性、隔离性和永 久性以及事务的恢复也都要考虑分布性。 3 1 3 分布式数据库的优点 分布式数据库系统把数据库技术和网络技术的应用统一起来。数据库技术 是一种抽象的集中数据管理方法,它通过集中实现数据共享,通过抽象达到数 据的独立性。它向用户提供一个聚合的、唯一的数据集合及其统一的管理方法。 而计算机网络把分散的计算机系统联接起来,利用通信技术分享分布在这些计 算机上的数据与程序,以适应企业组织地域分散的需要,也是系统本身可靠性 的保证。因此,分布式数据库系统是集中与分散的有机结合,把这两种表面上 武汉理t 大学硕十学位论文 矛盾的技术,在一个更高的层次上,以一种新的方法统一起来,获得了成功, 也显示了它如下的优点【6 j : 1 、良好的可靠性和可用性 虽然分布式数据库系统是由多站点构成,组成结构较集中式复杂,产生故 障的几率可能较集中式高,但多数故障的影响被限制在使用故障站点中数据的 那些应用。即在个别站点或个另通信链路发生故障时,系统仍然可以继续工作。 也由于分布式数据库系统通常采用数据的多副本存放,使可用性得到改进。因 为,只要某个数据有一个副本可用。认为该数据就是可用的,访问就可继续下 去。数据的多副本存放还有利于被破坏数据的恢复,如因某种原因使某一数据 的一个副本被破坏,就可以很容易使用其他副本对它进行恢复。 2 、提高效率,降低通信费用 数据分布合理,即把数据存放在常用该数据的站点中。这样使访问该数据 的大多数应用成为本地应用,既能加快响应速度,提高效率,而且也降低了通 信费用。 3 、较大的灵活性和可伸缩性 这是由于分布式数据库系统的模块性决定的,可以在已有的系统中,增加 或减少一个站点,根据需要调整站点配置,以及动态改变数据的冗余度,以适 应应用系统的多变性,而且这种增减对系统的其他部分影响较小。 4 、经济性和保护投资 对分布式数据库系统进行扩展要比集中式数据系统进行扩展的成本低。因 为在某个或某些站点上增加或扩充设备,甚至增加一个新的站点,比用一个更 大的系统代替一个已有的集中式数据库系统要容易得多,也经济得多,而且可 以保护现有的投资。 5 、适应组织的分布式管理和控制 这是产生分布式数据库系统的重要原因之一。分布式数据库系统的思想和 目标就是为适应分布式管理和控制,符合实际用户地域分散的组织结构。 6 、系统站点具有较好的自治性 这是分布式数据库系统的特点之一。各个站点可以有自己的控制、管理和 使用信息的策略。 武汉理工大学硕士学位论文 3 1 4 分布式数据库的分类 分布式数据库按照不同的分类方法,可分为多种类型1 5 l 。按照站点数据库采 用的数据模型分类可以分为匀质的和非匀质的。如果各站点数据库采用相同的 数据模型,则称该分布式数据库是匀质的,否则称为非匀质的。在匀质系统中, 如果各站点又采用相同的数据库管理系统,则称为同构的,否则就称为异构式 系统。通常异构式系统的硬件平台也是不同的。一般来说异构式系统比同构式 系统更为复杂些,实现起来也更加困难。 与同构式系统相比,构造异构式系统会遇到许多难题。在分布式异构数据 库系统中,不仅要解决与同构分布式系统中类似的技术问题,如数据分片、查 询处理、并发控制、事务管理、故障恢复、目录管理等,而且由于子系统使用 的全局数据模型和各局部数据模型的不同,各局部数据模型之间的不同,相应 的全局操作语言之间的不同。在操作不同的数据库系统时,由于它们的操作接 口和命令往往差异较大,操作语言之间的转换也是异构型分布式数据库所要解 决的关键问题。此外,由于各站点使用的是不同的机型,它们使用的网络协议 也可能是不同的。这就要求系统能进行各种网络协议之间的转换,实现异种机 型的互联,从而增加了系统的复杂性和对低层协议的依赖。当要连接的站点的 类型数量增加时,这个问题更加突出。 3 1 5 分布式恢复 在数据库系统中,恢复的功能是指系统出现故障时使数据库回到正确的状 态,因此恢复的策略和故障的类型密切相关i _ ”。在分布式数据库系统中,既可能 出现集中式数据库可能出现的故障,也可能出现其特有的故障。 l 、集中式数据库故障类型 ( 1 ) 不丢失信息的故障。这类故障主要原因是命令无法执行引起事务撤销, 但不会对存储介质上的数据产生不正确的结果,介质上的数据全部是正确的。 这类故障重新启动事务就可恢复。 ( 2 ) 丢失主存信息的故障。这类故障将使主存中的数据处于一种不正确状 态,但辅存上的数据库仍处于正确的状态,如果事务未正确提交或撤销,就破 坏了事务的原子性。这类故障可以利用恢复机制对其进行恢复。 ( 3 ) 丢失辅存中信息的故障。这种故障表现在永久存储的数据库信息的丢 失。这类故障对于数据库系统是致命的,一般不可恢复,只能重建。 武汉理j 二大学硕士学位论文 2 、分布式数据库系统中的故障类型 除以上集中式数据库中可能发生的故障外,分布式数据库还具有自己特有 的故障类型,这主要体现在系统中站点间的通讯故障。 ( 1 ) 报文丢失。报文丢失是指在传送过程中报文的丢失导致了数据的不正 确。这种报文丢失将造成系统处于等待状惫,但可以通过一个有限的协议加以 解决,即传送报文的数目是有限的。传送过程在有限的时间内完成。因此当一 段时间的延迟后仍收不到回答则认为报文丢失,此时将重发报文。若重发若干 次后仍收不到回答,则认为网络发生故障或对方站点发生故障,这时进入相应 的恢复处理。 ( 2 ) 网络分割。网络分割是指通讯网络中一部分站点和另一部分站点之间 完全失去联系。当出现网络故障时系统的处理要更复杂,但出现的情况非常少。 故障恢复处理的难度从小到大为:一是站点故障;二是站点故障和报文丢 失,但无网络分割;三是站点故障,报文丢失及网络分割。 3 2 事务 3 2 1 事务概念 事务是一个不可分割的执行单位,也叫原子单位。它是这样的一个操作序 列,要么完全执行,要么完全不执行。事务的特性【8 1 : 1 、原子性。 原子性要求一个事务由于故障而中断时,它的部分结果也被取消。事务不 完成的原因一般有两个,即事务中止和系统故障。一个事务的中止可能由该事 务自己( 或其用户) 来请求,这可以是因为它的某些输入有错,或者发现了某 些情况使得完成该事务并不合适或没有用处。事务的中止也可以因与系统有关 的原因而由系统来强迫中止,典型例子为系统过载和死锁。在出现事务中止时 保证其原予性的措施叫做事务恢复,丽在系统故障时保证原子性的措施叫做故 障恢复。 2 、持久性, 一旦一事务提交以后,系统必须保证其操作的结果永不丢失,且与后续的 故障无关。因为必须由系统保留的事务结果是存放在数据库中的,所以提供事 务持久性的活动叫做数据库的恢复。 1 4 武汉理r 大学硕士学位论文 3 、可串行性。 如果并发的执行几个事务的话,其结果必须与以某种次序串行的执行它们 的结果相同。保证事务可串行性的活动叫做并发控制。如果系统提供了并发控 制的话,程序员就可以像单独执行的事务一样来编写它们。 4 、隔离性。 一个未完成的事务不能在其提交之前把结果暴露给其他事务。为了避免级 联式中止( 也叫做多米诺效应) 就需要这个特性,也就是说,所有事务如果能 观察到以后将被中止的事务的部分结果就必须被中止。如果这些事务中有几个 已被提交,则不得不取消它们。 3 ,2 2 分布式事务 分布式事务和集中式事务一样,具有原子性、可串行性( 一致性) 、隔离 性和持久性的特点。但由于分布式系统的特性,分布式事务在执行时将被分解 为若干站点上的子事务。为了保证子事务的正确调度执行,分布式事务必须在 相应站点上为每个子事务创建一个代理进程( 代理者) 执行该子事务。另外, 在子事务的调度执行中,必须有一个协调进程协调各子事务的执行。一般来说, 这样的协调进程由启动该分布式事务的始发站点上的代理进程承担。这时该代 理进程称为根代理者( r o o ta g e n t ) m i 。 根代理者的功能:调动整个分布式事务;请求其它参与站点创建本地代理 执行子事务;发出“事务开始”“提交”和“撤销”原语。 3 2 3 两阶段提交协议2 p c 在两阶段提交协议中,称具有协调作用的代理者为协调者,所有其它必须 一起提交的代理者为参与者。协调者负责做出最后的提交或撤销决定。参与者 负责本地子事务的动作。 2 p c 的基本思想是l s 】:为全部参与者做出关于提交或撤销全部本地子事务的 唯一决定。如果其中有一个参与者不能本地提交其子事务,则全部参与者必须 本地撤销。此协议由两阶段组成:第一阶段的目的是达到共同的决定;第二 阶段的目的是实现这个决定。 武汉理上人学硕士学位论文 3 3 分布式数据库对c s c w 的支持 c s c w 在分布式环境下工作,处理的信息具有分布性。针对这一特点,引 入分布式数据库来支持c s c w 的分布性。 分布式数据库中,网络上的各个站点都具有自主处理能力,即能执行局部 应用,并通过通信系统,至少参与一个全局应用。这个定义与c s c w 的数据分 布性要求是一致的。同时在c s c w 中分布透明性是必不可少的。分布透明性是 指在编写基于数据库的应用程序时,数据就好像没有被分布一样。这样,无论 把数据存储在甲地或乙地,或者是把数据从一个站点移到另一个站点,都不会 影响应用程序执行的正确性与有效性。当然,根据c s c w 应用环境的不同,用 户还可考虑采用不同级别的分布透明性,如片段透明度、分配透明度、复制透 明度等。 目前,对于分布式数据库在c s c w 中的应用,有的学者已做了一些研究, 取得了一些成果。例如,陈立挺与鲁东明等从网络计算、网络分布结构以及c s c w 特有的要求与技术三方面描述了c s c w 与分布式系统的关系,最终得出c s c w 是对一般分布式系统的继承与发展的结论;王国意与徐光佑针对分布式系统中 面向系统的控制与分布透明性不能满足c s c w 对面向用户的显式协作的要求, 提出了一个c s c w 系统的结构模型,以支持群体成员之间的协作。当然,由于 c s c w 自身的特殊要求,如协同用户界面与多媒体通信等,因此对分布式数据 库进行适当的扩展是必要的,以便更好地支持c s c w 【4 】。 3 4 异构数据库技术 3 4 1 异构数据库概述 异构数据库系统是相关的多个数据库系统的集合,可以实现数据的共享和 透明访问,每个数据库系统在加入异构数据库系统之前本身就已经存在,拥有 自己的d b m s 。异构数据库的各个
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 粮食供应链协同创新及其在储备中的应用
- 跨文化交流中的创意碰撞与合作
- 制造业升级背景下的工业园区发展策略
- 油菜生长周期管理与增产策略
- 教育信息化背景下的语文教学创新
- 商法实务基础知识点归纳
- 人工智能助力基层医疗服务的突破
- 传统节庆的现代化开发与体验设计
- 房产行业新人导引
- 《数字绘画基础教程》课件-06造型篇-项目六
- 手工皂制作教程(课堂)课件
- 部编版小学道德与法治三年级下册期末质量检测试卷【含答案】5套
- 断亲协议书范本
- 五年级语文下册第八单元【教材解读】课件
- 篮球比赛计分表word版
- 手卫生依从性差鱼骨分析
- 外科围手术期患者心理问题原因分析及护理干预
- 电荷耦合器件(CCD)介绍和工作原理
- JJF(闽) 1101-2020 在线式CCD图像尺寸测量系统校准规范
- 生产安全事故调查工作实务含直接经济损失计算方法和标准
- 四川省甘孜州2022年中考语文试题及参考答案
评论
0/150
提交评论