(计算机软件与理论专业论文)san技术及其管理的研究与实现——复制备份功能的设计与实现.pdf_第1页
(计算机软件与理论专业论文)san技术及其管理的研究与实现——复制备份功能的设计与实现.pdf_第2页
(计算机软件与理论专业论文)san技术及其管理的研究与实现——复制备份功能的设计与实现.pdf_第3页
(计算机软件与理论专业论文)san技术及其管理的研究与实现——复制备份功能的设计与实现.pdf_第4页
(计算机软件与理论专业论文)san技术及其管理的研究与实现——复制备份功能的设计与实现.pdf_第5页
已阅读5页,还剩56页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

西北工业大学硕士论文 摘要 在计算机系统由硬件和软件环境为中心向以应用和数据为中心转变的形势 下,计算机存储技术在概念和内涵上都发生了重大的改变。具体体现在:数据 的安全性和作业的连续性,其价值和重要性甚至超过了硬件系统本身:可以最 大限度的解决i o 瓶颈:简捷而无限的扩展能力。 s a n ( s t o r a g ea r e an e t w o r k ) 存储网络技术就是在这样的需求下应运而生的。 s a n 将成熟的网络技术应用到存储管理中,使得以前存储设备与主机点对点 连接的概念发生了根本的变化。在s a n 存储网络中,存储设备不再是某一台主 机的附属物,而是连接成一个整体存储网络,以此向所有主机提供服务。 存储区域网( s t o r a g ea r e an e t w o r k ) 以光纤通路( f c ) 为基础,实现了存储设备 的共享:突破了现有的距离限制和容量限制,服务器通过存储网络直接同存储 设备交换数据,释放了宝贵的l a n 资源。 硬件系统的故障是可以更换和维修的,但数据的丢失或作业系统的停顿则可 能造成灾难性损失。对于一个s a n 的管理系统软件而言,如何实现灾难恢复, 高效、安全的实现数据的备份和恢复,则成为整个系统的灵魂。 本文在介绍网络存储的发展、相关技术以及s a n 的硬件构成、管理系统软件 体系结构的基础上,结合作者参与研发的一个s a n 的存储管理软件的心得体会, 提出了一个s a n 管理系统软件的基本架构,并重点介绍了作者所负责的备份和 恢复模块( b a c k u p r e s t o r e ) 的体系结构、功能模块以及应用介绍,并对实现 中的关键技术进行了详实的介绍,对数据的备份和恢复中应用的数据快照 ( s n a p s h o t ) 技术进行了深入的讨论。最后,作者分析了所实现的备份恢复模块 的优点和不足,提出了自己的改善和应用新技术的设想。 关键字 存储区域网络存储管理系统备份,恢复灾难恢复数据快照 西北工业大学硕士论文 a b s t r a c t u n d e rt h ec i r c u m s t a n c e so f t h ef o c a so f c o m p u t e rc h a n g i n gf r o ms o f t w a r ea n dh a r d w a r e e n v i r o l l l t l e n tt o a p p l i c a t i o n a n dd a t a ,t h e c o n c e p t o fc o m p u t e r s t o r a g et e c h n o l o g y h a s c o m p l e t e l yc h a n g e d ,t o o a tf i r s t ,i tm a i n l yr e p r e s e n t s a tt h e s e c u r i t y o fd a t aa n dt h e c o n t i n l l i t yo fa s s i g n m e n t b e c a u s ew h i c hi sr a t h e ri m p o r t a n ta n de x p e n s i v et h a nt h el a a r d w a r e i t s e l f ;s e c o n d l y i tc a l ls o l v et h eb o t t l e n e c kp r o b l e mo fi 0o p e r a t i o na sw e l la sp o s s i b l e ; m o r e o v e l ,i th a st h ea b i l i t yt ob ee x p a n d e du n l i m i t e d l ya n dc o n c i s e l y w i t ht h er e q u i r e m e n t sm e n t i o n e da b o v e ,t h et e c h n o l o g yo f s a n ( s t o r a g e a r e an e t w o r k ) i sb r o u g h to u t s a n a p p l i e st h ew e l l d e v e l o p e dn e t w o r kt e c h n o l o g y t ot h ef i e l do f s t o r a g em a n a g e m e n t ; i tm a k e st h em e t h o do f c o n n e c t i n gw i t hh o s ta n d s t o r a g ed e v i c ec h a n g i n ge s s e n t i a l l y i ns a n , t h es t o j a g e d e v i c eb e c o m e sap a r to ft h es t o r a g en e t w o r ka n da p p l i e ss o m es e r v i c e st ot h e h o s ti n s t e a do fa l la d d i t i o n a lp a r to fah o s tb e f o r e s a ns h a r e st h es t o r a g ed e v i c et h r o u g ht h e f i b r ec h a n n e l ,a n db r e a k su pt h el i m i t a t i o no i ld i s t a n c ea n dc a p a b i l i t y ;h o s ta n ds t o r a g e d e v i c ec a ne x c h a n g ed a t aw i t he a c ho t h e rt h r o u g l lt h es t o r a g en e t w o r kd i r e c t l y , b yw h i c hi t n l a k e sl a nf r e ei t st r e a s u r er e s o u r c e st oo t h e ra p p l i c a t i o n s t h ef n u l t e di l a r d w a r ec o u l db er e p l a c e do rr e p a i r e d h o w e v e r , i tw o u l db ead i s a s t e ri f t i l e d a t av v a sl o s to rt h ea s s i g n m e n tw a si n t e r r u p t e d s o ,i tb e c o m e st h es o u lo ft h ew h o l e s y s t e m t h a tw h e t h e rt h ed a t ac o u l db eb a c k u p e da n dr e s t o r e ds a f e l ya n d q u i c k l y 1 - hi s p a p e ri n t r o d u c e s ab a s i cs t r u c t u r eo fs a nm a l a g e m e n ts o f t w a r eb a s e do nt h e d i s c u s s i o no ft h ed e v e l o p m e n to fn e t w o r ks t o r a g e ,t h ec o m p o s i t i o no fh a r d w a r e ,a n dt h e i e l a t e d t e c h n o l o g y , i n c l u d i n gt h ea r c h i t e c t u r eo f i t sm a n a g e m e n ts o f t w a r e t h ew r i t e rh a s t a k e n p a r t i nar e s e a r c ha n d d e v e l o p m e n to ns a nm a n a g e m e n t s o f t w a r et h e p a p e r , a c c o r d i n g t ot h ew r i t e r sl e a r n e da n d e x p e r i e n c e d e s c r i b e st h em o d u l eo fb a c k u pa n dr e s t o r e w h i c hs h el l a ds t u d i e dm a i n l y t h e nd i s c u s s e st h ek e m e ld e s i g no ft h em o d u l ed e t a i l e di n a d d i t i o n i td o e saf i t r h e rd i s c u s s i o no nt h er e a l i z a t i o no f s n a p s h o ti nb a c k u pa n dr e s o t r e a t t h ei a s t t h ew r i t e rg i v e so u ts o m ea n a l y s i so f t h es a n m a n a g e m e n ts o f t w a r e n o to n l yl i s t s t h em e r i t sa n dd e m e r i t s ,b u ta l s op u t sf o r w a r ds o m ei m p r o v e m e n ti m a g e s k e y w o r d s : s t o r a g ea r e an e t w o r k s t o r a g em a n a g e m e n ts y s t e m b a c k u pa n dr e s t o r e d l s a s t e rr e c o v e r y s n a p s h o t 西北工业大学硕士论文 构。 第1 章绪论 概要:本章介绍本文的研究背景与目的,研究的内容,以及本文的组织结 1 1 背景与目的 随着计算机和互联网络技术的普及应用和飞速发展,当前,数据存储量正 在以极高的速度逐年增长。这种增长归功于i n t e r n e t 、视频、联机事务处理 ( e l 。f p ) 、e r p ( e n t e r p r i s er e s o u r c ep l a n n ir i g :企业资源计划系统) 的应 用,以及通过数据仓库数据挖掘工具来生成有用数据等应用所带来的爆炸式的 数据膨胀。现在,各个企业、机构内部都分布着各种不同类型的系统,i t 界所 面临的挑战便是对这些系统进行管理,保证安全,并提供不问断的高速数据访 问的支持。业界的分析家估计,对存储容量的需求以后会以每年5 0 、1 0 0 9 6 的速 度递增。 总体来讲,目| i 对于利用计算及进行数据存储的应用主要有这样几个方面 的要求:存储的速度,存储的容量,数据的安全性以及充分的共享等。 就传统的文件服务器由于s c s i 标准的限制,各个服务器无法访问一个集中 的存储系统,备个服务器成了相互独立的信息孤岛。用户进行备份、数据同步、 集群汁算时,数据将通过网络进行传送,这样就对网络产生很大的带宽压力, 用户进行数据的管理也将变得复杂起来。因此,为了解决这种复杂的应用所带 来的网络数据管理的难题,近年来兴起了存储技术的革命,这样的革命来自于 一个看似简单的想法使数据成为有价的独立实体,将其与访问它的计算机 分离丌来。 国外的学术界和工业界都投入了大量的人力物力进行研究与丌发。人们从 存储机理、器件与设备、接口与通道、系统结构和存储软件等各方面进行了大 景的研究。目前,存储技术的发展十分迅速,所涉及的范围也十分广泛,并与 网络、集群系统、数据库、嵌入式系统等热点技术的发展紧密相关。但是,归 结超术,存储技术的发展可以归纳为三个方向,即d a s ( d i r e c ta t t a c h e d s t o f a g t ) 、n a s ( n e t w o c ka t t a c h e ds t o r a g e ) 和s a n ( s t o r a g ea f e bn e t w o r k ) , 组成_ 分为三大部分:磁盘阵列、互连和网络子系统、存储管理软件。 第1 页 西北工业大学硕士论文 其l h 存储管理软件在存储系统中的地位越来越重要,没有存储管理软件 的支持,再好的硬件也难以发挥作用。存储管理软件主要包括:存储资源管理 ( 存储媒介、卷、文件管理) 、数据备份和数据迁移、远程备份、集群系统、 火难恢复以及存储虚拟化等。存储管理可以提高资源的利用率、系统的可用性 和人们的1 二作效率。许多著名的i t 企业,如惠普、i b m 、e m c 、v e t i t a s 、s l n 等,都存对此进行研究。s n i a ( s t o r a g en e t w o r ki n d u s t r ya s s o c i a t i o n ) 还专 门成立了一个分支机构s n m w g ( t h es t o r a g en e t w o r km a n a g e m e n tw o r k i n gg r o u p ) 柬致力于解决存储区域网络管理所面临的问题。然而,尽管存储管理技术的研 究仍处丁其生命周期的早期阶段,它的技术相对来说还不成熟,对公认的行业 标准支持还1 i 够。 在国内,学术界、工业界和有关部门还没有充分意识到信息存储技术浪潮 的到来及其重要性,与i t 的其它领域相比,信息存储技术研究和丌发的力度都 很小。而事实上,作为一个拥有十几亿人口的大国,国内存在着极为广泛和潜 力i ,曼大的存储应用需求。 闲此我们认为存储区域网的技术的研究既有科研价值又具有应用价值。 1 2 研究内容 作者自2 0 0 2 年1 0 月以来,就开始着手与存储区域网的理论知识的学习 并与同课题组的同学一起,同中科院软件所合作,与国外的某业界知名公司合 作,研制丌发出一整套存储系统管理软件( s t o r a g em a n a g e m e n ts y s t e m ,以下 简称s m s 系统,有关这套系统的具体功能特色,将在第二章做集中的介绍) 。在 研究和丌发的过程中,严格按照软件工程的标准,以瀑布模型标准展丌s m s 系 统的研制 发,作者主要负责的是数据备份恢复模块( b a c k u p r e s t o r e ,以下简 称眦r 模块) 的研究和丌发工作,该模块所实现的主要功能是: 数据备份 数据恢复 远程灾难恢复 等等,b & r 模块可以说是s m s 系统中最核心的组成部分,因为对于磁盘阵列 的使用者来说,整套软件的核心应用和操作都要通过这个模块来完成,没有这 一部分,s m s 系统至多能够实现对特定硬件( 磁盘阵列) 子系统的基本配置、应 用没定,以及对其工作状态的监视等功能,事实上这些都是作为一个存储管理 软件的堪本功能或者是附加功能,而并不是它的重点所在。 第2 负 西北工业大学硕士论文 1 3 本文组织 第章绪论 第# 存储区域网介绍 第二洋s m s 系统设计 第四章b & r 模块的功能与实现 第土t 章具体实现中的关键技术 第六摹实现的分析及使用新技术的设想 第3 页 西北工业大学硕士论文 第2 章存储区域网介绍 概要:介绍网络存储的背景、目前投入应用的网络存储系统的类型和对比 其t i ,重点介绍s a n 的技术特点和优势。 2 1 网络存储背景 数据存储的压力,带来了s a n 的产生和发展。 利用刚络来实现数据的存储和共享其实并不是一个新兴的想法,在我们熟 悉的s e r v e r c lje n t 模型中,文件服务器可以利用网络连接为一组客户工作站 提供存储服务。只是,传统的文件组织应用和网络传输的速度不能很好地满足 现在的需求。近年来,网络存储技术有了很大的进展,包括光线通路技术、分 向式计算技术,同时,在存储设备和存储子系统方面也发生了很大的变化。于 是,新的存储系统s a n 应运而生。 s a n 发展到现在,所有的企业都在认真的评估他们在将来存储环境中的角 色。恨士 t :c a rl f _ l e rd a t a q u e s t 公司最近的一份报告,2 0 0 5 年的s a n 连接外部存 储市场将趟过2 2 0 亿美元,这将相当于3 0 0 万t b i t 的数据。有相关( 磁盘、软 件、服务、l 硎络设备等收入) 数据表明,d a s 环境正在逐步向s a n 环境过渡。 s a n 之所以已经成为主要的现今存储的首选方案,是它因为可以提高关键任 务数据部署的i i f 管理性、扩展性和有效性。 2 2 网络存储系统类型及对比 由f 存储过程是和系统紧密结合在一起的,因此,可能将存储网络称作系 统应用会更贴切一些。随着存储技术的发展,出现了许多各具特包的共享存储 体系。日| j i ,应用较多的体系结构根据存储设备和其他主机的连接方式,主要 的有如f 两类。 1 、a s ( n e t w o r ka t t a c h e ds t o r a g e ) n a s 使用标准仂、议如n f s ( n e t w o r kf i l es y s t e m ) 或c i f s ( c o m m o ni n t e r n e t f ? i1 。s y s t e m ) 在文件层提供数据的共享访问。存储设备和主机相连接,然 后该矗机通过文件共享的方式使存储设备为网络上的其他主机所利用。其 第4 页 两北工业大学硕:0 论文 他的主机以文件为单位访问网络文件系统。 图2 一ln a s 客户服务器之间的连接示意图 2 s a n ( s t , o r a g ea r e an e t w o r k ) s a n 是种专用网络,它通过光纤通路技术构建网络,存储设备和主机都连 入网络t 可以把一个或多个主机连接到磁盘阵列和子系统上。s a n 置于l a n 之下,而不涉及l a n 。因此,s a n 可以看作是负责存储传输的“后端”网络, 而“前端”网络负责f 常的t c p i p 传输。 注:所谓子系统是指存储设备和处理器的集成,不只是简单的存储装置。 第5 页 西北工业大学硕士论文 图2 2 典型的s a n 构成连接示意图 这两种方案都可以解决存储系统的扩展性问题,也各有优缺点,下面就针对两 者的特点做个简单的对比。 表2 - is a n 和n a s 特点对比 s a nn a s 协议f c p ( s c s d n f s ,c i f s ,h t t p 存储单位物理( b l o c k )逻辑( 文件) 接口类型光纤通路, e t h e r n e t f d d i e t h e r n e t i 文件系统的构建s e r v e r 来完成 s t o r a g e 部分完成 数据集中的实现好好 数据共享的实现一般好 系统成本较高较低 系统复杂程度 高低 】系统性能好受网络环境影响 f 系统配置复杂简单 l 系统使用较复杂简单 系统灵活性较好好 第6 页 西北工业大学硕士论文 l 系统扩展性好一般 f 应用限制有共享要求的系统网络资源受限的系 统 j 数据保护能力好较好 总之,n a s 应用比较简单灵活。它具备了磁盘阵列的所有主要特征:高容量、 高效能、高可靠。n a s 的管理和设置较为简单。价格比较低适,合中小型的应用。 而s n 则具有高效的可扩展性,与n a s 相比,s a n 具有无限的扩展能力。另 外,s a n 只有更高的连接速度和处理能力。s a n 采用了为大规模数据传输而专门 设计的光纤通路技术,目前的传输速度为l o o m b p s ,并会很快丌发出传输速度为 2 0 0 m b p s 和4 0 0 m s p s 的光纤通路交换机。 2 3 s a n 的构成要素 s a n 的构成要素主要可以分为:连接协议、硬件、管理软件。其中的网络 设备有s w jt c h ,h u b ,b r i d g e 等,概念上可以和以太网上的设备对应起来,但 是在功能和协议:两者区别很大。这些网络设备被给予千兆速率的s c s i 光纤通 道( f i b r ec h a n n e l ) ,使用的协议是s c s i 。 一、艘f ,f :i 5 ; 备 “门s a n 的剐络结构的特殊性,带来了其中硬件构成的特点。存储网络如 同l a n 一叶羊主机连到l a n 霈要网卡,主机连到s a n 上通过主机内部的h b a ( h o s t b u s a d a p i e r ) :l a n 中网线是光纤或铜缆,s a n 中也是样;s a n 中,设备可以 是环形连接,也可以用h u b 建立星型连接,还可以用多个s w i t c h 建成树状结构 的s a n 。从逻辑一h 看,s a n 是由一个或多个仲裁环( a r b i t r a t e dl o o p ) 组成。 仲裁环共享介质并且在多个设备之间共享1 g b s 的带宽,这是最普遍的连接方 式。几乎所有的h b a 和光纤通道存储设备都支持专用仲裁环( n o n f a b r i ca l ) , 但是支持个网络( f a b r i c ) 互连,势必就增加了设备的复杂性。硬件设备主要 包括: 一网络连接设备:如a ( h o s tb u sa d a p t e r ) ,f c - h u b ,s w i t c h i n gh u b ,f a b i r c s w l i c h ,转换器,g b i c ( 千兆位接口转换器) 等。 一 存储没备:如t a p el i b r a r y ,f i b r e a r r a y ( 光纤磁盘阵列) ,s c s ir a i d ( s c sr 磁盘阵列,具有r a i d 校验功能。) 等。 :、连接叻- 议 s a n 环境f _ 的连接方式主要有光纤通路、s c s i 和e s c o n 三种。e s c o n 般应 用1 二大型机系统;s c s i 主要应用于以传统的服务器为中心的s a n 结构中,但是 它是单机连接窄s c s i 最多能接7 台设备,宽s c s i 最多也只能接1 5 台,其连接 第7 页 西北1 = 业大学硕士论文 距离山近的汁人惋惜,即使目前出现的扩展s c s i 协议也仍然达不到光纤通路多 主机连接,支持1 6 0 0 力节点,1 0 公里的连接距离的优点。目前的s a n 网络中主 要采用的还是光纤通路协议。 三三、s a n 中的管理软件 由于许多服务器、磁盘阵列和磁带库等设备共享同一个存储网络,享受它 的高带宽和灵活性,重要数据都在存储网络之中,所以大中型的存储网络的管 理是极为必要的。其中主要包括: 网络管理软件。如网络设备的操作管理,监控管理,网络故障的侦测管 理和恢复管理等。 一存储资源管理软件。如对存储资源进行设置,监视性能分析以及访存控 制等。 _ 、k 务主机使用的业务软件。是实际应用存储网络进行数据存储业务的相 关软件。 第8 页 西北t 业大学硕士论文 第3 章s m s 系统设计 水一节介绍s i s 系统的整体构成和功能概述。目前,这个系统的丌发已经进 入j ,个比较成熟的阶段。无论是结构还是功能都已经处于了个比较稳定的 时期,由于已经得到了一定范围的应用,使本套软件设计的可行性以及系统地 鲁棒性都得到了充分的证明。 3 1s m s 系统介绍 s m s ( s t o r a g em a n a g e m e n ts y s t e m ) 系统是作为一个为存储应用提供一整 套从硬件到软件、从应用到管理高性能存储解决方案的一个管理软件的角色而 进行没计丌发的。它是基于s a n 的存储管理软件。其目的在于在与其它组成部 分起解决存储所面临的各种难题,如分散化管理存储变得日益困难,数据量 快迷增长带来的问题,实现3 6 0 * 2 4 时间的在线服务、有效利用大型机上积累的 曩贵数据等,为用户提供一个集中、可扩展性好、安全、低成本的管理解决方 案。 3 2s m s 系统的功能 s m s 系统是以c s 模型为基本模型,采用模块化设计的存储管理软件。它是 针对特定的磁捌j 车列系列产品进行设计和开发的。从与用户、管理员交互的g u i 界瓶到与磁盘阵列交互的s e r v e r 端,系统的各个模块之间采用s o c k e t 通信模 式和自行定义的特有通信协议实现客户和服务器之间的交流。s m s 系统的主要 功能有:构成表示、状态监视、日志输出、事件联络功能、性能优化、数据复 制等 第9 页 两北工业大学硕士论文 3 3s m s 系统的体系构成 s 是模块化的程序结构,下图所示为s e r v e r 端各个模块 图3 一ls m s 系统构成图 ( 1 ) m c ( m a i nc o n t r 0 1 ) 陔模块是s m s 系统s e r v e r 端的总控制进程。它负责创建和启动其他功能模 块,控制各个进程启动先后顺序和制约关系,并负责收集各个功能进程所申请的 系统资源( 主要是共享内存) 信息,对其进行统一管理:当系统异常退出后再 次启动的时候,负责释放被挂起的资源。不断收集系统运行的异常信息,如果 其子进程出现异常对出,会根据异常进程的重要程度,决定重新启动垓进程或 是停i 【:运行墼个系统。 第1 0 h 西北工业大学硕士论文 m 【:进程 低先度进程 i 返回终止信号1 卅 玲l 7 6 2 6 ,2 1 0 个磁麓可靠佼,物理性能下降 纛容鬃磁盘蠢霓余 3 。 。0 魏麴戏 在实际应殿中,考感到应用的溪要,使躅卷可以手漤黪通过s 添蛰毽软件 竣鬻一定豹冗余飘粼( 选撵需要豹r a i d 级剃) ,将荣予个物理磁盘捆绑起泉, 熏鞭划分成逻瓣意义上的磁盘,作为备份数据的单位。这种捆绑在一超的蕊千 伞阳簸鞫辙了令r a n k 。 r a n k ip d 0 0jp d o , 、一一一+ ,j , 鬻4 2r a n k 的稳成 对予滋豢 l 莩到嚣富翁l ,对予搽终琴绫采漉宅爱物瑗磁盘。幂【| 其 逛的搡佟系 统掰麓谈澍熬硬懿爨一撵鹣。捺律祭绞瓣激在这萃孛“褥瓒磁鑫”主,划分逻瓣分 隧,建女:史髂系缆麓等。 4 2 b & r 模块功裁缝成 灏r 骥块是宠裁b a c k u p 帮r e s t o r e 备份秘浚笺) 功麓的模块。这令模块在 s 鄹系统瀚s e r v e r 稷序襁c l i e n t 豹g u i 梅蔽串分翔有秘应懿鬣件。两部分缀箨 遴过s o 目钳造敬醚e 、ll e n t 撼毒模块耱c l i e n t 溺鹁控到疆廖失申赍,葶l 雳 s o c k c 遗蕊飘期,实凌鞠要耀懿缓恿海邋,蠡ls e r v e r 镤懑过代壤模块,传达 c li t 、n 西对嫩擞阵列的设定謦谚坶谤求。突成数据蠢份毒酲恢复功熊的渡定鞠操 话,行麓l f 确的表示出磁纛薄到当前的设鬣跨况帮麓割锹赛操,f 擘的当前状态。 攘1 6 爱 西北工业大学硕士论文 例立:某个磁舷对的拷贝状态是在进行复制还是在进行恢复操作;该磁盘对的 复制进行的进度百分比,达到两端数据同步的推测时间等等。 4 2 ib & r 模块应用的相关概念 能i j r 模块中有很多约定成俗的概念,在以后的功能设计和实现中将频 繁应用这止j 概念,为了便于后记内容的叙述和理解,在这一小节对最主要的部 分做统的介绍。 1 逻辑磁盘相关的概念 m v ( m a s t e rv o l u m e ) 主卷。是作为数据复制恢复的主体。通常是业务 s e r v e r 直接操作和访问的对象。 r v ( r e p l i c a t i o nv o l u m e ) 从卷。是数据复制和恢复的目的方。可能和 m v 处于同一个磁盘阵列中,也可能处于不同的磁盘阵列中。这取决于根 掘具体的应用目的和磁盘阵列的类型。 2 运用相关的概念 p a i r 磁盘对。具有复制关系的一对m v 和r v 。根据应用的需要,一个 m v 州+ 以同时连接多个l d ,作为它的r v 。组成磁盘对的两个l d 的磁盘 容量必须相同。 b a c k u p 复制。即实行数据从m v 到r v 数据备份操作。 r e s t e r e 恢复。当m v 出现物理或是逻辑故障时,所实行的数据从r v 到 m v 的数据复制。 1 ) i f f 差异。磁盘对之间数据的不同。主要从数据差异的量上衡量的。 s e p a r a t e 分离。当磁盘对之间的数据流动( 包括复制和恢复) 到d i f f 为o , 将r v - 中的数据复制到磁带等备份设备时,需要将正在进行数掘复制的两 个卷( v o l u m e ) 分离丌来,以保证向磁带复制的数据的正确性。 s u s p e n d 挂起。指磁盘对在数据流动的过程中,由于某种原因使这种流动 处1 :暂停的j 状念。可能是人为的干预也可能是硬件系统自动进行。 r e s u m e 还原。从挂起状态返回到继续挂起之前的动作。 n p ( n a t i v ep a i r ) 盘内磁盘对。m v 和r v 处在同一个磁盘阵列。主要用 于快速的备份数据,应付逻辑故障和硬件自身内因引起的物理故障。相当 i 刘、 户1 f 透明的镜像。 ( ) i ( 0 v e r s e ap a i r ) 盘问磁盘对。m v 和r v 处在不同的磁盘阵列。可以用 r m * 决内外因造成的物理故障和逻辑故障。更多的适用于灾难恢复。 s y n c b 同步复制。 s s y n c b 半同步复制。 a s y n b 异步复制。 第17 页 西北工业大学硕士论文 i ) i t ( d i s a s t e rr e c o v e r y ) 灾难恢复。是一种结合软件和硬件支持实现的比较 复j j 的功能,主要用来避免由于各种以外的自然灾害如火灾、地震导致的 谳龇阵列设备的破坏而造成数据丢失。 3 磁盘阵列的连接模式相关 l i n k 连接。磁盘阵列都有光纤接口,不同的磁盘阵列之间可以通过 这些接 j 利用光纤以及网络连接设备连接起来。这种磁盘阵列问的连接称 为ij i n k 。在具有l i n k 的磁盘阵列之间,就可以设盘间的磁盘对,即o p 。 d m ( d i r e c t l ym a n a g e ) 直接管理。s m s 系统可以完全控制的磁盘 阵列哎备。与服务器主机从物理上看有直接的连接通路( 如磁盘阵列从光 纡接1 7 1 引接光纤线,通过光纤h u b 等网络连接设各同主机相连) 是基本 l m 提。s m s 系统在启动时,根据初始化文件中的设定内容来决定直接管理 哪些磁盘阵列。 l d m ( i n d i r e c t l ym a n a g e ) 间接管理。不在系统初始化文件中,而是同 过i d n k 与直接管理的磁盘阵列相连,即称为间接管理。 4 2 2 应用实例 下面通过一。个典型的应用实例的示意图来将上面的概念具体化形象化,进 而说明b r 功能是如何进行应用的。 一n i ( n a t i v ep a i r ) 的用途。参见图4 3b & r 模块应用示例图p a i r m v l 专i w l l 就是一划n p 。应用者通过r v l l 来备份m v l 的数据。 1 b a c k u p 由于这两个l d 处在同一个磁盘阵列中,因此复制的速度比较 快,通常的情况下会采用同步复制( s n y c b ) 的模式来进行。在这对p a i r 刚刚设定的时候,两个l d 必需要做一次m v 数据的全复制,以达到同 步状态。 2 ! j 两个磁盘的数据达到同步的时候,就可以将两个磁盘分离( s e p a r a t e ) 这样利用r v l l 上的数据,向磁带设备备份数据,而m v l 此时则可以继 续玎展业务,读写数据。 3 两个磁崩:虽然是分离的,但是s m s 系统会监视两个磁盘之间的数据差异 ( i ) i i f ) ,当d i f f 累计到一定数量时,可以重新开始复制动作,将m v l f :发生变化的数据复制到r v l l 上。这种动作就是d i f f b a c k u p 。一般情 况下,、_ 一个磁盘对的关系建立并达到数据的同步化之后,都是进行的 i ) i f b a c k u p 。当然,也可以进行全b a c k u p 。此外,在b a c k u p 数据的 过襁l h 如果出现某些特殊的情况,可能需要暂停一| = i = ,这时就可以使 刖s u s p e n d 命令,需要时利用r e s u m e 命令来继续b a c k u p 。 第1 8 页 西北工业大学硕士论文 4 从存储能力方面来讲r v l l 和m v l 是完全等同的,因此用户也可以利用 r v l l 外展业务,即访问r v l l 上的数据或者在其上面写数据。因此,当 m v l 发,l 洪操作等逻辑数据丢失,或者该磁盘出现坏道等现象时,可以 毂接用r v l l 来替换,充当业务实施的对象。对于逻辑错误的另外一种 补救方法是将分离的m v l 和r v l l 做恢复操作( r e s t o r e ) ,即把保存在 r v i 上的数据重新拷贝到m v l 上后,继续展开业务。 二 o p ( o v e r s e ap a i r ) 的应用。互为磁盘对的两个盘不在同一磁盘阵列中。见 图中的m v l 和r v 2 1 。 这个惠f h 中,两个磁盘处于不同的地理位置。设置这种o p 的目的主要是 为j 防止外因造成的磁盘阵列的损坏,比如火灾,地震等情况发生的时候,可 以将保存到其它地点的数据恢复回来加以使用。在白天正常展丌业务的时候, 由于受到网络的性能和地理位置的影响,如果在这对磁盘之间用同期复制的方 式来备份数据,必然会导致m v l 业务性能的显著下降。因此,这种情况下多数 会采用异步或者半同步的方式来复制数据。复制的功能在后台运行,在业务空 闲、刚络,卜刚的时候就将实际数据向对方磁盘阵列进行拷贝,以备不时之需。 但魁这种方式也存在一些问题,由于异步复制的进度是完全是操作系统根 j :f l 及其的忙闲自动调度的,因此无法人为地控制复制的进度,也不知道何时能 够完成次d i f f 信息的复制,于是备份到异地的数据是否可用成为一个课题。 当然,如果应用的环境不是2 4 小时的连续服务,这种复制可以在夜间业务 停【j :时进行。由于这时网络比较空闲,可以采用同期拷贝。 三 应用二 二类似事务处理的灾难恢复应用 近年来,特别是美国的9 1 1 事件以后,在存储应用领域的应用中除了数据 存储量和数据存储速度上的要求以外,数据存储的可靠性和容灾性越来越受到 人f l 、m q 蘑视于是s t o r a g e 应用届出现了一个新的应用:d i s a s t e rr e c o v e r y 。 征数抓:库管理系统中我们经常会提到一个事务处理的概念。也就是说,对 于某些事件的处理必需保证原子性,即只要这个动作丌始必需等到整套动作全 部完成j 算成功。典型的例子就是银行交易。 从存储设备处理动作的角度来讲,可以视为有几组磁盘对组同时进行复制 动作,这种复制动作必需保证各个磁盘对的复制进度相同,否则复制后的数据 是无效数据。这种保证一组磁盘对动作原子性的功能,在本软件中称为原子业 务( a t o m i ct r a n s a c t i o n ) 功能。 见h 矧中原点虚线方框( 原子业务组a ) 划出的部分。这一组p a i r 是同时 进行数捌复耕陂复和分离操作的。这样,对于需要多个v o l u m e 的数据信息一 第1 9 页 西北工业大学硕士论文 致的数据备份操作就变的容易了。正如图中所画,m v 群和r v 群处于很远的 异地,这样当一处的数据遭到灾难性的破坏时,由于对方一组是可用的数据, 这f f j j 以通过反向的数据复制在最短的时间的内将业务数据恢复起来,从而继 续展丌业务。 m v l 是这个席_ l 磁龠对群中的最基本数据。a 地为北 a r r a y 3 京,b 地为婀安,c 地为上海。 处丁c 地 图4 - 3b & r 模块应用示例图 第2 0 页 嚣l 工韭天学硕士论文 第5 章实现中的关键技术 从功能来瓣,b & r 攫块的晷橡很麓零,就是蔡汉s m s 系统的s e r v e r 嗣c l i e n t 端的两个主控避程为逐接控制中心,实现这个功能模块的s e r v e r 和c l i e n t ( 瓴 括经c l i 在内) 之州的通信,根据用户的意愿利用磁毅阵列实现数据的复老4 和 後复。 5 1 进程管理和进程通信中的优先策略 通过第三章的介绍,我们可以了解刘对于b a r 模块来说,如果要完成自己的 功能,就必须间硬件方面进行交互,这就要通道s e r v e r7 的代理模块来实现。与 茈同时,b r 本隽是盘s m s 的黼模块痿动的,闲诧本模块要和多个送稳进行通 信,而且彼此刚的通信各具特点。这就涉及到进程分工、通信的管理问题。 5 1 i 进程间的通倍和父子进程的分工 b & r 模块的构成图参见3 2 页图5 6 。 8 r 模块的功能上有这样一些特点: 通信处瑾瓣复杂性帮多样秣 b & r 模块需要和多个进程避行交互:s m s 的m c 模块,连接硬件的代理模块, 接牧来鱼予获悉整程翁各耪遥鲡,翡皮来鑫g u i 衣c l i 豹各静请求等餐。 在与这些进程的交互中,谢些是绝对的服从型:如s m s 的m c 模块,它决定 本模块瓣生存与否,搴模块孛谤稳系绞资源必矮囱英报告,嚣蔻撼模块要统一 管理整个软件使用的资源。有烂是被动接受型;如与状态监视模块间的通信, 几乎是单向的,本模块接收到器静通知后,根握逮知熟具体内容寒判凝是否与 本模块共享内存的信息相符,然后决定自身的下一步动作,但并不向状态监褫 模块进程作出任何回应。有些则是充当种媒介的作用:如与g u i 以及c l i 之 闺的通倍。 共牵内存管理的复杂性 扶骚r 模块淘雍纛| 霉到爨发嚣戆念令来看,大致霹叛分为设萋型露谤逮鍪 两大类。一般对于o u i 的访问请求,b rs e r v e r 部分不会向硬件发行命令取得 楣应的信息,琢j 是直接熄共享痰存孛懿现有内褰加以遨强:恧对于设鬟型鲍动 第2 1 页 西北工业大学硕士论文 作请求,必须要通过代理模块向硬件提出请求,进行实际的设置即必须改变 硬件的实际状态。 诸多的处理集合到一起,处理起来就会比较混乱,因此在本模块设计了父 子两个进程,对各个任务进行分工。具体情况参见图5 - 6b & r 模块结构图。 从图中可以看出父子进程的分工情况具体如下: 父进程主要负责通信的管理和控制,通过分析接收到的电文的类型( 即判断 来源) 决定是否交付子进程处理。对共享内存的操作则仅仅限于访问其中的内 容,也就是院,对于g u i 的访问型请求,完全由父进程来处理,而不会传到子 进程。子进程则主要负责建立和维护共享内存,集中处理设置型的请求,并通 过代理进程实现与硬件的交互。最一般的处理时序图如下: 图5 1 进程处理时序示意图 当然,当响应状念监视进程的通知时,父进程收到处理完成的报告后,并不 向状念监视进程返回通知,而是有可能根据实际情况,通知g u i 更新自己的信 息。 5 1 2b & r 模块中的进程通信的优先策略 在程序实际运行的过程中,各个进程的发来的请求和通知顺序是不可预知 的,可能子进程f 在处理前一个任务,又收到新的任务请求。在这种情况下, 如果继续处理新接收到的电文,有可能造成s o c k e t 资源不足,还可能影响其他 第2 2 页 西北工业大学须士论文 模块的通信,甚至更严重的后果。有时各种请求的紧急程度有所不同,有时可 能两个处理请求是可以一并完成的因此,对接收的电文进行分析,设计一 个合理的优先策略处理各进程的请求,在当前有任务正在处理的情况下排队等 待是必要的。在8 r 模块中设计了一个等待队列控制来解决这一问题。 5 1 2 1 总体解决思路 执行中表 动作计数 实行开始时闻 m c 队列表 状态监视队列表 g u i 、c l i 队列表 正在执行的表 队列表a 队列表a i 队列表b 1 的指针 队列表a 2 等待队列管理、i 厂i 磊i i 石再丙 队列表b 1 r 一个队列表的指针 队列表b 2 f 一个队列表的指针 图5 2 进程通信优先度控制队列 建立一个进程请求的管理链表,由父进程负责维护,结合图5 2 大致的处 理步骤说明如下: “队列管理t a b l e ”对正在执行的节点和排队等待中的节点进行管理。 一个节点就是一个任务请求,在“队列管理t a b l e ”中分为m c ,状态 监视进程,g u u c l i 三类分别建立等待队列进行管理。 当有任务正在处理的时刻收到信息设置,访问请求电文时,将新请求作 为

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论