




已阅读5页,还剩2页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
中文摘要 嘉士兰等銎茹术监 硕士生 刘威 签名 盘l 蚣 指导教师 刘天时 签名 i 盅竺 j 摘要 石油行业工作现场分散 自然环境恶劣 其现有的医院信息管理存在点多 面广 区 域分散的特点 这些系统分布在各节点上运行 数据采集后不能及时进行综合处理和分析 各场地之间的协调和合作也相当困难 因而影响工作效率 为了使信息最大限度地得到利 用 建立分布式多数据库系统是必要的 本文分析了油田医院的现状 并结合分布式数据库系统的特点 设计了分布式医院数 据库系统模型 研发了基于点对点的分布式多数据库系统 它利用p 2 p 技术 通过网络将 若干个分布于不同物理节点的数据库应用系统连接起来 构成一个对等网络 网络中各节 点的松散集合构成全局多数据库系统 医院的相关数据分散在各连接的节点上 形成了局 部数据和全局数据的合理分布 本医院管理信息系统的开发以o r a c l e 9 i 为数据库管理系统 p o w e r b u i l d e r 为前端开发 工具 利用c s 和b s 混合模式 实现了医院系统的综合管理 在本地节点 客户机负责 与用户的交互 收集用户信息 通过局域网络向服务器请求对诸如数据库 电子表格或字 处理文档等信息的处理工作 在异地节点 通过异步方式传输基础数据 以进行数据的分 布和集中管理 关键词 点对点模式分布式多数据库系统医院管理信息系统分布式事务 论文类型 应用研究 英文摘要 s u b j e c t s p e c i a l i t y n a m e i n s t r u c t o r t h em a n a g e m e n ti n f o r m a t i o ns y s t e mo fd i s t r i b u t e dh o s p i t a l c o m p u t e ra p p l i c a t i o nt l i uw e i s i g n a t u r e l i ut i a n s h i s i g n a t u r e 5 函幽辎 a b s t r a c t t h ew o r k i n gs i t eo fp e t r o l e u mi n d u s t r yi ss c a t t e r e d a n dt h en a t u r a le n v i r o n m e n ti s a b o m i n a b l e e x i s t i n gh o s p i t a lm a n a g e m e n ti n f o r m a t i o ns y s t e m sa l ed i s t r i b u t e da n dr u no ne v e r y n o d e t h ed a t ai nt h es y s t e m sc a n n o tb ed e a l tw i t ha n da n a l y z e ds y n t h e t i c a l l yi nt i m ea f t e ri ti s g a t h e r e d t h ec o o r d i n a t i o na n dc o o p e r a t i o na m o n ge v e r yn o d ei sq u i r ed i f f i c u l t a n dt h e r e f o r e i n f l u e n c e sw o r k i n ge f f i c i e n c y i no r d e rt om a k ei n f o r m a t i o nu t i l i z e dt om a x i m u me x t e n t i ti s n e c e s s a r yt os e tu pt h ed i s t r i b u t e dd a t a b a s es y s t e m t h i st h e s i sa n a l y s e st h ec u r r e n ts i t u a t i o no ft h eo i lf i e l dh o s p i t a l c o m b i n e st h ec h a r a e t e r i s t i c o ft h ed i s t r i b u t e dm u l t i d a t a b a s es y s t e m d e s i g n st h ed a t a b a s es y s t e m a t i cm o d e l d e v e l o p st h e h o s p i t a ls y s t e mb a s e d o nt h ep e e rt op e e r p 2 p d i s t r i b u t e dm u l t i d a t a b a s es y s t e m s w i t ht h ep 2 p a n dt h en e t w o r kt e c h n o l o g y t h es y s t e mt h a td i s t r i b u t e sd i f f e r e n tp h y s i c a ln o d ef o r m sg l o b a l d a t a b a s es y s t e m c a l l e dd i s t r i b u t e dm u l t i d a t a b a s es y s t e m w h i c hm a k e st h er e l e v a n td a t a d i s t r i b u t e di nn o d e so ft h eh o s p i t a lt ob er e a s o n a b l e b a s e do nc sa n db sm i x e dm o d e t h eh o s p i t a lm a n a g e m e n ti n f o r m a t i o ns y s t e mi s s t r u c t u r e db yo r a c l e 9 ia sd a t a b a s em a n a g e m e n ts y s t e ma n dp o w e r b u i l d e ra st h ed e v e l o p i n gt 0 0 1 a m o n gl o c a ln o d e s c l i e n te x c h a n g e sm e s s a g ew i t hu s e r sa n dr e q u e s t ss e r v i c ew i t hs e r v e rt o p r o c e s sd a t a b a s e e l e c t r o n i cc h a r to rw o r dp r o c e s s i n gf i l e i nr e m o t en o d e s y s t e mt r a n s m i t st h e b a s i cd a t at h r o u g ht h ea s y n c h r o n o u sw a yt om a n a g ed a t ad i s t r i b u t e do rc e n t r a l i z e d k e y w o r d t h e s i s p e e rt o p e e r d i s t r i b u t e d m u l t i d a t a b a s e s y s t e m h o s p i t a lm a n a g e m e n t i n f o r m a t i o ns y s t e m d i s t r i b u t e dt r a n s a c t i o n a p p l i c a t i o ns t u d y 学位论文创新性声明 本人声明所呈交的学位论文是我个人在导师指导下进行的研究工作及取得的研究 成果 尽我所知 除了文中特别加以标注和致谢中所罗列的内容以外 论文中不包含 其他人已经发表或撰写过的研究成果 也不包含为获得西安石油大学或其它教育机构 的学位或证书而使用过的材料 与我一同工作的同志对本研究所做的任何贡献均已在 论文中做了明确的说明并表示了谢意 申请学位论文与资料若有不实之处 本人承担一切相关责任 论文作者签名 学位论文使用授权的说明 本人完全7 解西安石油大学有关保留和使用学位论文的规定 即 研究生在校攻 读学位期间论文工作的知识产权单位属西安石油大学 学校享有以任何方法发表 复 制 公开阅览 借阅以及申请专利等权利 本人离校后发表或使用学位论文或与该论 文直接相关的学术论文或成果时 署名单位仍然为西安石油大学 t 论文作者签名 越日期 吨越 导师签名 蒸 至 蜀日期 三 厂 第一章绪论 第一章绪论 1 1 选题背景 2 0 世纪末 多媒体 网络和数据库等领域新技术的不断涌现和融合 深刻改变了现代 化信息系统的结构和形式 信息产业处于日新月异的技术更新阶段 i n t e r n e t 的迅猛发展也 使得信息网络化成为必然趋势 随着人口的增长和人民大众对健康要求的提高 医院的医务管理工作日益繁重 如何 利用现代化的技术手段提高医院的管理水平和服务质量是摆在各医院面前亟待解决的问 题 而计算机的普及和网络技术的日趋成熟 给医院的现代化管理提供了强有力的工具 石油工业作为我国经济的支柱产业 对我国经济的发展起着巨大的作用 然而油田工 作现场分散 自然环境恶劣 其现有的医院存在点多 面广 分散的特点 虽然现有医院 管理中使用计算机信息管理的有病案 统计分析 财务 人事 图书 药品等部门 在一 定程度上提高了医院的管理水平 但由于这些系统分散在单节点上运行 数据采集后不能 及时综合处理 分析 各场地之间的协调和合作也相当困难 因而工作效率较低 要使信 息最大限度地得到利用 必须依赖计算机网络 建立分布式多数据库的医院管理信息系统 提高医院信息服务层次和整体效益 1 2 选题的意义 数据库是数据管理的新技术 是计算机科学的重要分支 从2 0 世纪8 0 年代以来 数 据库技术在商业领域的取得了很大成功 数据库管理系统己从专用的应用程序包发展成为 通用的系统软件 人们在总结信息资源开发 管理的各种手段时 认为最有效的是数据库 技术 数据库的应用己越来越广泛 从小型的单项事物处理到大型的信息系统都用到先进 的数据库技术来保持系统数据的完整性 整体性和共享性 目前 一个国家的数据库建设 规模 数据库信息量的大小和使用频度已成为衡量这个国家现代化程度的标志之一 1 数据库应用需求的拓展和计算机硬件环境 特别是网络技术的发展 使分布式数据库 系统应运而生 并成为计算机技术最活跃的研究领域之一 英国国家计算中心 n a t i o n a l c o m p u t i n gc e n t e r 专门对分布式数据库作了分析和预测 断言 分布式系统 特别是以 分布式数据库作为系统的核心 将成为今后计算机科学发展的主要方向之一 医院信息系统作为医院管理的手段 为医院信息化做出了很大的贡献 在医院信息网 的网络体系结构上 如何在现有技术支持下构建适合于医院自身的分布式管理信息系统的 体系结构平台是一个具有重要意义的课题 如何在信息网上利用当今流行的大型网络数据 库系统 如o r a c l e s q ls e r v e r s y b a s e 等 对医院的信息数据进行管理 构建分布式 数据库和实现分布式处理 也成为一个具有实际意义课题 近年来 不少医院根据管理需要采取了一些信息管理模式 但是这些系统大多都是应 用在单机 传统的局域网等环境的 随着计算机应用的深八和发展 早期系统的局限性日 益明显 传统的单机和孤立的局域网越来越不能满足管理的需要 点对点模式分布式多数 据库系统是一个创新性的应用开发项目 具有很强的应用背景 对油田特殊的地理环境 两安石油大学硕士学位论文 特别是油区环境复杂 交通不便的工作环境下的医院管理提供了一个科学 方便 有效的 工作模式 可以充分有效地利用了计算机通信网络资源 提高工作效率 对于提高医院的 效益和管理水平具有重要的意义 基于对等网络的点对点技术用于分布式多数据库系统 中 对于系统的集成 尤其在分布式计算机环境下系统的集成也是很有意义的 1 3 研究现状 1 3 1 分布式数据库系统 数据管理随着计算机硬件和软件的发展而不断发展 经历了人工管理阶段 文件系统 管理阶段和数据库管理阶段 到了现在 分布式计算与数据管理技术的最终结合出现了采 用合作分布式处理方式的客户 服务器器结构 分布式数据管理系统 1 3 1 1 国外发展现状 分布式数据库系统得在国外研究起步较早 但不像集中式数据库那样很快达到实用 化 商品化 早期的数据库系统大多是在单机上实现 一般采用集中式 数据处理方式也 很有局限性 从七十年代中期开始 由于计算机通信和网络技术的突飞猛进 各种通信网 络设施的使用 处于不同地域的用户对数据分布应用的广泛需要 使得数据库开始从集中 式系统向非集中式系统迈进 分布式数据库 d d b 的概念最终被提出来 人们对其开展 了 系列的研究p l 世界上第一个分布式数据库系统s d d 1 s y s t e mo f d i s t r i b u t e dd a t a b a s e 是由美国计算机公司 c c a 于1 9 7 6 年至1 9 7 8 年设计 并于1 9 7 9 年在d e c 一1 0 和d e c 一 2 0 计算机上实现 4 1 其中初步的原型系统中有代表性的是 i b m 圣约瑟研究实验室研制的 分布式s y s t c mr 系统 美国加州大学伯克利分校研制的分布式i n g r e s 系统 德国斯图加 特大学的e j n u e h o l d 教授领导的研究小组研制的p o r e l 系统 法国政府资助的i n r i a 组织研制的s i r i v s 系统等 这当中一些是对原有单机数据库系统的基础上改造而成 其 余均是完全从头开发 实际上 上述原型系统都没能获得大规模商用 除了高额的成本因 素外 对于分布式数据库的概念理解的不成熟和概念体系本身的不完善 以及关键技术的 制约也不应忽视 数据存储的分布性需要把数据分散存储在许多网络节点中 因而数据库 技术要解决的首要问题就是如何对分布式数据进行有效管理和及时访问 由于一个事务处 理所涉及的数据可能分布在多个节点上 数据库系统就要具备优化的分布查询策略 以通 过分布的方式实现数据共享 进入八十年代 计算机网络进一步普及 面对人们的对数据分布要求和分布式数据库 产品短缺的矛盾 不少数据库开发厂商把数据库管理系统的软硬件支持从多终端机器或单 机推进到网络中的多台机器 其中一台或多台存储量大且速度快的计算机构成数据库服务 器 s e r v e r 分工数据存储和事务处理 其余计算机作为数据库客户机 c l i e n t 处于用 户端 提交事务 返回处理结果 就这样 数据库走向了客户机朋艮务器 c s 模型分布 九十年代以后 c s 技术日趋完善 最初 数据库客户机和服务器还局限于数据的纯 分布处理 数据库客户机和服务器均衡分担任务 造成网络通信负荷过重 对整个系统稳 定性带来不少问题 随着计算机软硬件技术的发展 人们考虑让计算能力强大的服务器承 第一章绪论 担更多任务 把大部分工作推给数据库系统的数据库胀务器端完成 事实上是一种对于用 户是分布使用而事务则集中处理的方式 形成所谓的瘦客户机 肥服务器 b s 模型9 j 很显然 它已经超出了分布式数据库应有的特征 但c s 采用的数据的高度集中化处理 并没有发生明显的根本变化 1 3 1 2 国内发展现状 我国对分布式数据库系统的研究在2 0 世纪8 0 年代初期开始 一些科研单位和高等学 校先后建立和实现了几个备具特色的分布式数据库系统 如由中国科学院数学研究所设 计 由该所与上海科学技木大学 华东师范大学合作实现的c p o p e l 武汉大学研制的 w d d b s 和w o o d d b s 东北大学研制的d m u f o 系统等等 他们的工作对我国分布式 数据库技术的理论研究和应用开发起到了积极的推动作用 完全的分布式数据库的进展事实上大多数仍停留在理论研究的扩展和软件原型设计 在商用领域很难见到具有最新研究成果的产品出现 只有在具体环境下有条件的采用某些 分布式数据库技术 扩大其应用面 才能推动理论发展 近年来 在我国广泛应用的证券 交易系统 银行清算系统 货物零售系统 飞机定票查询系统 旅馆自动预定系统和军事 调度指挥系统等 都不同程度地采用了如分布式查询 分布式数据处理等着干分布式数据 库处理技术 对分布式数据库系统的研究与产品开发起刻了有效的促进作用 1 3 1 3 实现方案 目前 国内外关于多节点分布式数据库资源的数据分布处理及其一致性维护的研究越 来越多 它要求提供对多节点上任意数据库资源的完全透明的访问 既要保证全局数据的 共享 又要保证各成员数据库的自治 目前有三种实现方案州 1 为分布在各个节点上的各种数据库建立用户交互接口 不进行任何模式的集成 各个成员数据库数据进行区域分段管理 对本区域以外的数据操作则通过远程登录方式进 行 这种方案虽然简单易行 但用户无法透明地访问数据 而且当增加一个新的数据库时 必须增加用户接口 实现途径比较繁琐 2 用分布式数据库系统结构 将物理上分布而且逻辑上相关的数据库通过分布式数 据库系统进行管理 分布式数据库系统具有独立性和透明性的特点 用户对任何数据库的 操作都如同在本地进行 不必关心其数据模型 物理位置等细节 例如 m ss q l s e r v e r 中 用s q l d m o s q ld i s t r i b u t e dm a n a g e m e n to b j e c t s 来进行分布式数据管理 其重要的一个 技术途径是采用出版 订阅 复制代理来进行多个数据库之间的数据一致性维护 这种方 案要求在各成员数据库之上建立一个全局模式 对数据库实施统一的管理 该全局模式由 所有成员数据库模式集成 若数据库是异构的 建立这个全局模式则相当困难 3 采用联邦数据库系统结构 它不采用全局模式 而是在维持局部成员数据库自治 的前提下 对异构的成员数据库进行部分的集成 提供数据的共享和透明性 采用数据转 储技术来解决多节点群的分布数据处理及一致性维护问题 西安石油大学硕士学位论文 1 3 2 点对点 p 2 p p e e rt op e e r 又称对等网 是网络通信的形式之一 p e e r 是能理解p 2 p 协议 的一个元素 它可以是处理机 机器 用户等 1 7 o 它很大程度上提高了网络资源的利用 效率 近年来引起了学术界和工业界广泛关注i s p 2 p 起源于最初的联网通信方式 是一种检索与共享的方法 9 如在建筑物内p c 通过 局域网互连 不同建筑物间通过m o d e m 远程拨号互连 从互联网的发展历史来看 p 2 p 并不是一个全新的概念 t c p 毋是现代互联网整体架构的基础 但在t c p m 中并没有 客户端和服务器的概念 所有设备都是通信中平等的一端 l o 早在3 0 年前 许多公司的 计算结构就可以用现在的p 2 p 构建 只不过由于带宽和处理能力等的限制 在信息沟通中 出现了许多中间环节 例如中间服务器 导航网站和第三方信息交易平台等 现在 廉价 的计算能力 网络通信能力和计算机存储能力强有力地推动这项技术迅速发展 1 1 随着i n t e r n e t 和网络计算技术的迅猛发展 点对点 或称对等体到对等体 p 2 p 的计 算模式已经成为研究 开发和应用的热点 点对点模式是一种最早的和常用的网络计算模 式 传统的对等网络通常是由少数几个工作站组成 共享一 二台打印机和工作站硬盘上 的数据文件 当前的对等网络是一种发展了的全新的对等概念 它不需要中心服务器和中 心路由器 每台主机在完全透明的情况下 既可以作为客户机又可以作为服务器 地位是 完全平等的 l2 l 各主机之间通过各种各样的交互协作实现资源的收集 任务的分派 信息 的发送等多种工作 点对点网络技术的应用主要包括以下方面 l 叫 1 文件共享 点对点技术使任意两台相连的计算机之间可以直接交互 而不需要使 用任何中央服务器 它使共享文档 多媒体等文件成为可能 1 4 1 在点对点模式的网络中 对等体之间通过不同的查询机制定位含有所需资源的对等体后 将直接与其建立联系 2 协同系统 它构成了完全另外一种类型的点对点网络 它是指一群一起工作的用 户相互间共享着不同的因特网资源 但它们通过协同工作完成同一项任务 和文件共享不 同 协同系统中的一个用户可以在同一时刻将一个信息多点传送到多个用户 3 深度搜索引擎 点对点技术使用户能够深度搜索文档 而这种搜索不需要通过网 络服务器 也不受信息文档格式和宿主设备的限制 可以达到传统目录式搜索引擎无可比 拟的深度 4 分布式计算 这是点对点技术的一个重要特征 国内外关于点对点计算模式的代表性研发产品和技术有 l5 j 1 i c q 类的即时通信软件 两个或多个用户互相使用文字 语音或文件进行交流 快 速 直接 易于同非p c 网络设备 如p d a 手机 通信 而且它不依赖设备即可辨别用户 国内腾讯公司的o i c q 软件就是典型的即时通信软件 2 f a r s i t e m i c r o s o f t o c e a n s t o r e 类数据存储软件 用于在网络上将存储对象分散化 存放 而不像现在放于专用服务器 4 第一章绪论 3 n a p s t e r 类软件 目前国内此类软件有w o r k s l i n k p p 点点通 实现数据共享的网 络文件交换软件 突破了客户服务器 c s 模式 通过互联网 用户之间可以直接建立 点对点的连接 不通过服务器就可进行直接交流 进行文件交换 数据下载 共享硬盘资 源 就像在一个局域网中一样简单1 1 6 1 4 i n f r a s e a r c h p o i n t e r a 类数据搜索及查询软件 用来在p 2 p 网中完成信息检索 5 g r o o v e 类数据或行动协同软件 它是基于p 2 p 连接的软件工具 可以建立一个安 全的企业级协同工作平台 p 2 p 网 提供供求信息链上的互动信息沟通 i 3 3 端到端 直接相连的节点对等实体的通信叫点到点通信 它只提供一台机器到另一台机器之间 的通信 不会涉及到程序或进程的概念 同时点到点通信并不能保证数据传输的可靠性 也不能说明源主机与目的主机之间是哪两个进程在通信 这些工作都是由传输层来完成 的 端到端模式 p o i n tt op o i n t 是建立在点到点通信的基础之上 它是由一段的点到点 通信信道构成的 是比点到点通信更高一级的通信方式 完成应用程序 进程 之间的通信 1 4 研究内容 本课题研究一种基于点对点模式的分布式医院多数据库系统 它将若干个分布于不同 物理节点的数据库应用系统连接起来 构成一个分布式多数据库系统 网络中各节点局部 数据库系统的松散集合构成全局多数据库系统 各节点具有很强的自治性 既可以是具有 主动处理能力的以单机模式开发的集中式数据库系统 也可以是由一个局域网构成的c s 和b s 混合模式开发的数据库系统 网络中的任何两个节点间可以不受距离限制地传送数 据 实现远程数据库访问控制 每一个节点都是一个对等方 它从另一个节点接收访问 根据接收的信息在本地节点处理数据 或者向其它节点主动提供服务 各个节点之间不存 在明确的客户和服务器之分 当其申请服务时就是客户身份 当其提供服务时又转变为服 务身份 1 5 论文组织 本文以应用系统分布式数据库的设计和实现作为主要研究对象 分为四大部分 第一部分分析了选题的背景 从理论上详细地介绍了分布式数据库系统发展 基本概 念以及点对点计算模式概念 从而有利于对本文中的基于点对点分布式多数据库系统的理 解 主要包括第一章和第二章的内容 第二部分对系统设计方案及结构进行了讨论 并根据分布式多数据库系统的特点 结 合实际应用 提出系统的功能结构和总体模型 包括第三章的内容 第三部分主要对医院数据库系统的设计进行分析 并介绍了设计方法和工具 以及分 布式解决方案 最后给出了医院分布式多数据库的数据模型 主要包括第四章的内容 第四部分由第五章构成 介绍了系统开发所用的开发工具 结构框架和基本模块的实 现 这一部分详细分析了系统各功能模块的流程和实现 第五部分主要是医院计费系统历史数据库的实现和外设协同工作的实现 其中借助触 西安石油大学硕十学位论文 发器 动态s q l 游标及窗口继承等技术 完成这些系统功能的开发 包括第六章内容 第六部分总结了系统的主要特点和技术 指出当前存在的问题 并以此作为今后进一 步完善系统的主要内容 主要包括第七章的内容 第二章数据库系统 第二章数据库系统 2 1 分布式数据库系统 2 1 1 分布式数据库系统定义 分布式数据库系统 d d b s d i s t r i b u t e dd a t ab a s es y s t e m 是地理上分散而逻辑上集 中的数据库系统 7 1 分布式数据库系统通常使用计算机网络将地理位置分散而管理控制又 需要不同程度集中的多个逻辑单位 集中式数据库系统 连接起来 共同组成一个统一的 数据库系统 因此 可以把分布式数据库系统看成是数据库系统和计算机网络的有机结合 1 8 1 这个定义强调了分布式数据库的两个特点 1 分布性 即这些数据库是分布在不同站点上的 这把分布式数据库和单一的集中式 数据库区别开来 2 逻辑关联性 即这些数据具有某些把它们联系在一起的性质 这把分布式数据库与驻留在计算机网络不同站点上的一组本地数据库区别开来 在分布式数据库系统中 被计算机网络连接的逻辑单位称为站点 s i t e 或节点 n o d e 地理上分散是指各个节点分散在不同的地方 大可以是不同的国家 小可以是同一建筑物 内的不同位置 逻辑上集中是指由网络连接的各节点之间是一个逻辑整体 并由一个统一 的分布式数据库管理系统进行管理 2 1 2 分布式数据库系统的优点 1 可靠性和可用性 在分布式数据库系统中 同一数据集可以在多个不同的站点上 冗余存放 这使得系统在某一部分出现故障时而不至于全部崩渍 2 可扩展性 在分布式数据库系统的应用过程中 可根据实际需要对系统进行扩展 加入新的组成部分 并实现新成员的无缝结合 3 自治性 在分布式数据库中 各站点可以对自己管理的信息加以控制 可以制定 各自使用信息的策略 使它们较少地依赖远程数据 4 效率 通过合理的数据分布 使数据存储在其常用站点上 配之有效的访问算法 这样不仅可使不同站点并行处理 协同完成一项任务 而且还 缩短了响应时间 减少了通讯费用 2 1 3 分布式数据库系统的分类 目前对分布式数据库的分类一般是以局部数据库的异同来加以划分 以构造数据模型 关系模型 网络模型 层次模型 相同且d b m s 相同的局部数据库组成的分布式数据库 称为同构的 只要d b m s 不同就称为异构的 l 2 1 4 分布式数据库体系结构 2 1 4 1 分布式数据库的模式结构 分布式数据库四层模式划分为全局外层 全局视图 全局概念层 局部概念层和局 西安石油大学硕七学位论文 部内层 如图2 1 所示 在各层之间还有相应的映射 这种划分不仅适合于同构型分布式 数据库系统 也适合于异构型分布式数据库系统 全局概念模式 分片模式 全局概念层 分配模式 局部概念层牵l 局蓑霎念l 1 局饕萋念l 局蓑霎念 局部内层 l 局部内模式ii 局部内模式1l 局部内模式l 图2 1 分布式数据库结构图 1 全局外层 分布式数据库的全局外层如同集中式数据库一样 由多个用户视图组成 它是分布式 数据库特定的全局用户对分布式数据库的最高层抽象 2 全局概念层 全局概念层是分布式数据库的整体抽象 包含了全部数据库特性和逻辑结构 和集中 式数据库中的概念模式一样 是对数据库的全体描述 分布式数据库全局概念层一般具有三层模式描述信息 1 全局概念模式 描述分布式数据库全局数据的逻辑结构 是分布式数据库的全局 概念视图 2 分片模式 描述全局数据的逻辑划分视图 它是全局数据逻辑结构根据某种条 件的划分 即成为局部的逻辑结构 每一个逻辑划分即是一个片段或分片 3 分配模式 描述局部逻辑的局部物理结构 是划分后的片段 或分片 的物理 分配视图 3 局部概念层 局部概念层由局部概念模式描述 它是全局概念模式的子集 全局概念模式经逻辑划 分后被分配到各局部站点上 在分布式数据库局部站点上 对每个全局关系都有该全局关 系的若干个逻辑片段的物理片段集合 该集合是一个全局关系在某个局部站点上的物理映 像 其全部则组成局部概念模式 4 局部内层 第二章数据库系统 局部内层是分布式数据库中关于物理数据库的描述 相当1 二集中式数掘库的内层 2 1 4 2 分布式数据库体系结构 分布式数据库体系结构如图2 2 所示 由下述部分组成 a 多台计算机设备 并由计算机网络连接 b 计算机网络设备 网络通讯的一组软件 图2 2 分布式数据库系统的体系结构图 c 分布式数据库管理系统 它包括全局数据库管理系统 g d b m s 局部数据库管理 系统 l d b m s 通讯管理程序 c m 除了具有由g d b m s 链接的全局用户接口外 还 具有由节点l d b m s 链接的自治节点用户接口 d 分布式数据库包括全局数据库 g d b 和局部数据库 l d b e 分布式数据库管理者可分为二级 一级为全局数据库管理者 另一级为局部或自治 节点数据库管理者 称为局部数据库管理者 2 1 5 分布式数据库技术 2 1 5 1 数据的一致性问题 分布式数据库的优点就是数据分散 减轻对节点性能指标要求的压力 减轻了网络负 担 整个系统容易扩展 但由于数据分散 就增加了数据更新的开销和设计复杂度 同时 会产生数据冗余和数据库安全控制工作的难题 为保证系统中的数据的安全 在系统发生 局部故障时仍能保持对发生故障部分的数据的正常访问 系统在其他节点保留该部分数据 的副本 而由此也就带来了数据的一致性问题 系统必须保证数据表所有副本的一致 只 要一个表被更新了 它的相关副本也必须更新 否则会带来系统的混乱 对于同一个数据表的多个副本 系统数据字典中将保存一个表 该表记录所有的副本 的位置 状态 是否正在被访问 以及是否与最近的副本一致等 传统的数据一致性的处理方法是采用两阶段 2 p c 协议 提交机制 即假如该修改可 以在本地提交 并且同时可以保证在数据表的所有副本处提交 系统才可以接受该修改 实际上 当系统中的副本较多时 这种理想情况的出现机会并不很多 系统很可能处于这 西安石油大学硕十学位论文 样一种情况 某一个存有该表副本的节点未工作 则所有对该数据表的修改都将被拒绝 因此 在分布式数据库系统中考虑允许某些副本的延迟更新 即将数据一致性的维护分两 种情况来处理 首先 如果系统中的一个副本处于加锁状态 即该副本正在被访问 那么所做的修 改就不能被提交 因为同时对被访问的两个副本所做的修改可能发生冲突 其次 如果系 统发现根本无法连接到某一副本所在的节点 可能该节点未工作或出现故障 那么系统 将暂时忽略该副本 提交所做的修改 这不意味着抛弃该副本 而是允许该副本延迟更新 系统将所做的修改用一个事务文件保存起来 同时设置系统数据字典中对应该副本的与最 近副本非一致标志 表明该副本有未提交的修改 并把在该副本处未提交的事务文件名称 记录到数据字典中去 当该副本所在的节点正常加入系统中时 它首先会查询系统数据字 典中的与最近副本非一致标志 如果该标志被设置 该节点应先运行相应的事务文件 若 某一个事务文件无法提交 表明该副本已经与其他副本产生了不可逆差异 于是该节点通 知系统抛弃该副本 并建议系统重新制作该节点处的数据副本 如果所有事务文件全部提 交成功 该副本将与其他副本重新保持一致 并继续保留在系统中 这种方法维护了系统 的数据一致性 同时使系统拥有更大的灵活度 2 1 5 2 网络透明性 分布式数据库系统不仅仅是把数据存储在不同的物理节点上 更重要的是实现透明的 数据访问 例如查询 修改以及复制等 尽管数据可能位于不同的物理节点 但从逻辑上看是一个完整的统一的数据库 在安 全规则许可的情况下 可以很方便地访问数据库中的任何数据 而不需关心它的具体位置 及其它状态 这要求分布式数据库系统具有数据透明性 在实现数据透明性方面 采用的 方法是使用系统数据字典 系统数据字典是整个数据库系统的核心 字典中主要存放以下内容 a 整个数据库系统中数据库与数据对象的定义 以及它们之间的相互关系 b 有关用户存取权限和安全规则的定义 c 数据库中所定义的一系列的完整性约束条件 d 全局以及分布模式的定义及各模式之间映像的定义 全局应用信息等 以上所有信息使系统中的数据可以更好地组织 从而方便了数据的查询和复制等操 作 系统的安全性和完整性得到了有力的保障 2 1 5 3 并发控制 分布式数据管理以可串行的调度模式来执行并发事务 最优的方法是假设事务之问的 冲突是不经常的 对事务执行的方式没有限制 但是 需要验证并保证更新没有产生冲突 保守的方法是强制事务间的相互操作满足可串行性的要求 典型的是基于锁和基于时间戳 的并发控制 这里只讨论锁机制 a 锁机制 t o 第二章数据库系统 最广泛使用的并发控制机制是基于锁的方法 它在事务中插入一系列加锁和解锁操 作 通常 除非所有的操作都是读操作 一个加锁的数据对象是不可共享的 事务在访问 数据前必须对它进行某种加锁 并且在完成访问之前必须通过解锁释放它 一般 可以使 用两种锁 读锁和写锁 读锁是共享锁 写锁是排它锁 一个事务可以在这两个模式下对 数据实行加锁 如果事务对数据加读锁 其它事务也可以把该数据锁在共享模式 如果事 务对数据加写锁 那么其他事务就不能再给它加锁 依据数据加锁的方式和时间 加锁机 制可以分为静态锁和动态锁 在静态锁中 事务在执行操作前 对所有需要的数据加锁 这种方法相对简单 但它 限制了并发性 因为有冲突的事务必须串行执行 在动态锁中 事务在执行的不同阶段对不同的数据加锁 一种动态加锁方法是两阶段 加锁 2 p l 并发执行的多个事物中事物对数据操作以前要进行加锁 且每个事物的所有 加锁操作在第一个解锁操作以前执行 因此 每个事物中的加锁和解锁操作分布在两个部 分中 如果他是合式的 访问数据前对它加锁 不对已经加锁的数据加锁 运行结束前 对所有加锁的数据解锁 就可以保证一致性 两阶段加锁有两个阶段 可以证明两阶段 加锁的合法调度都是可串行的 两阶段加锁的潜在问题是死锁 增长阶段 和层叠回退 收 缩阶段 通常 在分布式数据库系统中采用分散式加锁 每个节点维护自己的局部锁管理器 其功能是管理对存储在该节点上的数据进行加或解锁请求 这样 加锁管理由所有节点完 成 事务执行由许多节点共同协作 此分散式的数据副本处理能够避免集中控制的缺点 但同样导致复杂的死锁处理和增加实现难度 b 乐观的并发机制 基于锁的控制算法假设事务问的冲突是经常性的 而乐观的算法是首先在本地尝试更 新 如果投有一致性冲突就保留更新并扩散更新 比如基于时间戳的乐观算法 这个方法 有三个阶段 读 确认和写 读阶段是在临时存储空间中读入相关数据并进行更新 确认 阶段是检查所有更新 确定是否违反数据库的一致性 如果事务的写操作和读操作相交 就会发生冲突 这时 事务就要重启 如果检查通过 写阶段就把所有更新写进数据库 2 1 5 4 复制 数据复制是分布式数据库应用程序中常用的一种数据拷贝技术 它将一个数据库中的 数据拷贝到通过局域网 l a n 广域网 w a n 或i n t e r n e t 网络连接的不同站点或同一 个服务器中的不同数据库中 并能够自动保持这些数据的同步 使各个拷贝具有相同的数 据 在分布式数据库中存储数据表有三种方法 复制 分片和复制结合分片 复制是系统 在不同的节点存储这一数据表的完全相同的副本 并统一维护 这里只讨论数据复制 对于分布式数据库 可以采用不复制 每个节点的数据表各不相同 部分复制 若干 数据表在若干节点上存在副本 和完全复制 每个数据表在每个节点上都有相同的一份 西安石油人学硕士学位论文 如果数据表r 被复制 它在若干个节点上就存在完全相同的拷贝 极端的做法就是采用完 全复制的方式 即在系统中的每个节点上都有一个r 的拷贝 如果本地有数据拷贝 那么 一个读写请求可以得到迅速执行而无须任何通信 当其中一个节点发生故障或者网络被分 割时 就在另 个节点上找到r 系统仍能够继续处理涉及到表r 的查询 这样 对于目 录管理或资源定位器服务的工作也会减少或是取消 在绝大多数情况下 只是对表r 的读 取 那么几个节点可以并行地处理表r 的查询 表r 的副本越多 在事务执行时的节点上 发现所需数据的可能性就越大 所以 通过使用复制技术 就可以使系统降低各节点间的 数据通信量 从而有效地提高医院系统得使用效率 2 1 5 5 分布式事务 事务是对数据库进行存取的一个操作序列 执行这个操作序列使数据库从一种一致状 态转换到另一种一致状态 即事务就是保证数据库正确的最小运行单位 分布式数据库系 统中的分布式事务是传统事务的扩充 在分布式数据库系统中 任何一个应用的请求最终 将转化成对数据库存取操作的序列 但是 由于在分布式数据库系统中数据分布的特性 一个事务的执行可能涉及到多个节点上的数据 这使得分布式事务的执行方式与传统事务 不同 分布式事务将在多个节点上的多台计算机上执行 即分布式事务的执行是分布的 在分布式数据库系统中 一个事务在执行时被分解为若干个与相应节点有关的操作序 列组成的子事务 也就是说 一个事务 t 是由若干个不同节点上的予事务 t i 组成的 即t u t i t i 为t 在节点i 的子事务 对应的操作集记为8 q l t i i l 2 n 为节 点编号 分布式事务具有原子性 a t o m i c i t y 一致性 c o n s i s t e n c y 隔离性 i s o l a t i o n 和持 久性 d u r a b i l i t y 四个特性 总称为事务的a c i d 特性 a 原子性 是指事务执行时的不可分割性 一个事务的操作要么全部执行 要么全部 不执行 事务的原子性保证数据库的状态总是从一个一致的状态变化到另一个一致的状 态 面不会出现不一致的中间状态 b 一致性 或称可串行性 并发执行的若干个事务 其操作的结果应与某种顺序串行 执行这几个事务所得出的结果相同 以保证并发事务执行时数据库状态的一致 c 隔离性 是指 个没有执行完的事务不能在其提交之前把自己的中间结果提供给其 它的事务使用 保证维护事务的交互一致性是保持事务隔离性的重要原因 因为未提交事 务的结果不是最终结果 它有可能在以后的执行中被取消 如果其它事务用到了它的中间 结果 该事务也将夭折 d 持久性 是指当一个事务正常结束 即提交后 其操作的结果将永久化 而与提交 后发生的故障无关 为了保证事务的原子性 组成这个分布式事务的各个子事务 要么全部提交 成功结 束 要么全部回滚 不成功结束 这需要对各个子事务进行协调和控制 第一 章数据库系统 2 2 分布式多数据库系统 2 2 1 分布式多数据库系统概念 分布式多数据库系统 d i s t r i b u t e dm u l t i d a t a b a s es y s t e m d m d b s 是分布在各场地或 节点的若干个相关的数据库的集合 这些数据库在建立多数据库系统之前已经存在 加入 多数据库系统之后仍具有自治性 分布式多数据库系统是提供全自治性的一种分布式数据 库系统 它主要研究在计算机网络上如何进行数据的分布和处理 2 0 这种多数据库系统和分布式数据库系统有所不同 多数据库系统不存在一个统一的数 据库管理系统软件 而分布式数据库系统是在一个统一的数据库管理系统软件的管理与控 制之下运行的 多数据库系统主要采用自下而上的数据集成方法 因为异构情况在前而集 成要求在后 而分布式数据库系统主要采用自上而下的数据集成方法 全局数据库是各个 子库的并集 多数据库系统主要解决异种数据库集成问题 可以保护原有的数据资源 使 各局部数据库享有高度 自治性 而分布式数据库系统是在数据的统一规划下 着重解 决数据的合理分布和对用户透明的问题 当然 两者之间在技术上有很多交叉 可以互相 借鉴 2 2 2 分布式多数据库系统分类 多数据库系统一般分为两类 1 有全局统一模式的多数据库系统 多个异构数据库集成时有一个全局统一的概 念模式 它是通过映射各异构的局部数据库的概念模式而得到 2 联邦式数据库系统 各个异构的局部数据库之间仅存在着松散的联邦式耦合关 系 没有全局统一模式 各局部数据库通过定义输入 输出模式进行彼此之间的数据访问 2 2 3 分布式多数据库系统体系结构 分布式多数据库系统与传统分布式数据库系统的根本区别在于全局概念模式的定义 不同 传统分布式数据库系统属于全局逻辑集成方式 全局概念模式给出了数据库的概念 视图 即全局数据库等于各局部数据库的并集 而分布式多数据库系统属于松散集成方式 其全局数据库并不是各局部数据库的并集 而是这个并集的子集 在多数据库系统中 甚 至可以没有全局概念模式 2 2 4 分布式多数据库事务管理 多数据库环境下 传统事务中对某些性质的规定不再适合 需要放松事务的某些语义 要求 如原子性 隔绝性 多数据库事务通常涉及多个分离的局部数据库系统 因此 多数据库事务经常是非原子性的 即个别子事务的成功或失败并不一定影响全局事务的执 行结果 一个多数据库事务分为全局事务和局部事务 多数据库事务管理分为全局事务管理和 局部事务管理 多数据库事务管理的目标是要实现事务的原子提交 同时 要保证数据的 一致性和局部场地的自治性 多数据库事务允许数据的弱一致性 通过增强局部执行自治 性和子事务并行执行提高系统的性能 然而 国内外对多数据库事务处理的研究都未成熟 西安石油大学硕上学位论文 1 2 1 2 2 5 分布式多数据库系统特征 它的三个基本特点就是物理分布性 逻辑协调性 站点自治性 并具有以下特性 z l j 1 具有较高的可靠性 当系统中一台机器发生故障时 不会导致整个系统的破坏 当 故障排除后 分布式多数据库系统可将故障期间的数据库加以恢复修改 2 成员数据库的局部操作并不受其参与的多数据库系统的影响 3 成员数据
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025国际汉语教师证书考试写作与教案设计试卷含答案
- 战略管理咨询服务方案
- 萨克斯营销方案
- 尚创咨询解决方案
- 山西省文化活动方案策划
- 镇海路面平整施工方案
- 绿色建筑及绿色施工方案
- 纤维素回收技术与应用-洞察及研究
- 供应链转型咨询方案
- 女性艺术家与男性艺术家的比较研究-洞察及研究
- 2025面向机器学习的数据标注规范
- YY/T 0339-2024呼吸道用吸引导管
- 围手术期高血压专家管理共识
- 外科患者疼痛护理与管理
- 租金延迟缴纳申请书
- DL-T 2563-2022 分布式能源自动发电控制与自动电压控制系统测试技术规范
- 食堂工作人员培训内容
- 骨折康复护理的常见问题和处理方法
- 泛影葡胺在消化道造影中的应用
- 2022年11月四川省凉山州中级人民法院逐级遴选4名法官笔试题库含答案解析
- 两江三镇说武汉智慧树知到答案章节测试2023年武汉纺织大学
评论
0/150
提交评论