




已阅读5页,还剩48页未读, 继续免费阅读
(计算机应用技术专业论文)网络备份系统的研究与实现.pdf.pdf 免费下载
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
摘要 刚络为数据的急剧增长提供了合理有效的存储管理手段,同时也给数据引入了新的安全隐患, 譬如黑客入侵、病毒感染、人为误操作等。数据备份是保护数据的有力措施,所以建立一套全方位、 多层次的数据备份系统是网络建设的重要任务。 本文结合网络应用的实际需求,探讨了数据备份的相关知识:由于网络备份是网络存储的应用 之一,对网络存储技术及其发展方向进行了研究;并且对已有网络备份软件的功能特性进行了分析 比较。在此基础之上,提出了一款网络备份系统模型,阐述了其设计思路和开发方法,并结合u m l 图对软件实现进行了详细说明。该备份系统采用d a s 数据存储模式和c s s 结构,实现了网络备份 的集中管理和分布处理,不仅体现了网络存储的特点,而且可以充分利用现有网络,同时又易于拓 展。 备份是网络备份系统的核心功能。现有被广泛采用的文件级备份将文件作为备份的最小粒度, 容易产生冗余和造成空间浪费。本文借鉴c v s 和u n i x 的d i f f 操作。对文件级备份进行改进,提出 了基于差量的备份方式:特别地,针对只增不减的文件,提出了基于增量的备份方式。系统同时提 供这三种备份方式,增强备份的多样化和灵活性。 关键字:数据安全网络存储网络备份灾难恢复文件级备份 a b s t r a c t n e t w o r kp r o v i d e sar a t i o n a la n de f f e c t i v em e a n st os t o r ea n dm a n a g et h ei n c r e a s i n gd a t a ;a n d s i m u l t a n e o u s l yn e t w o r ki n t r o d u c e sn e wh i d d e ns a f e t yt r o u b l e ,s u c ha sh a c ka t t a c k s ,v i r u si r i f e c t i o n sa n d o p e r a t i o n sb ym i s t a k e d a t ab a c k u pc a ns t r o n g l yp r o t e c td a t a , s oi t i sa ni m p o r t a n tt a s kf o rn e t w o r k b u i l d i n gt os e tu pap o w e r f u lb a c k u ps y s t e m c o n s i d e r i n gp r a c t i c a lr e q u i r e m e n t so fn e t w o r ka p p l i c a t i o n ,t h i sp a p e rp r o b e si n t ok n o w l e d g ea b o u t d a t ab a c k u p ,a n a l y s e sa n dc o m p a r e sn e t w o r ks t o r a g et e c h n o l o g i e s ;a n dt h ef u n c t i o n so fs o m et y p i c a l n e t w o r kb a c k u ps o f t w a r e sh a v eb e e ni n v e s t i g a t e d b a s e do nt h ea b o v e ,t h ep a p e rb r i n g sf o r w a r dan e t w o r k b a c k u ps y s t e mm o d e l ,e x p a t i a t e si t sd e s i g na n dd e v e l o p m e n t ,a n di l l u s t r a t e si t ss o f t w a r ei m p l e m e n t a t i o nb y u m l t h es y s t e ma d o p t sd a s ( d i r e c ta t t a c h e ds t o m g e ) a n dc s s a r c h i t e c t u r e ,w h i c he m b o d i e st h e c h a r a c t e r i s t i c so f n e t w o r ks t o r a g e ,m a k e sf u l lu s eo f e x i s t i n gn e t w o r ka n di se a s yt oe x t e n d a tp r e s e n t ,f i l e - l e v e lb a c k u pi sw i d e l ya d o p t e d ,b u ti tt e n d st op r o d u c er e d u n d a n c ya n dt or e s u l t i n s p a c ew a s t e u s i n gc v sa n dg n ud i f ff o rr e f e r e n c e ,t h i sp a p e rp r e s e n t sd i f f e r e n c e b a s e db a c k u pt o i m p r o v eo nf i l e - l e v e lb a c k u p i na d d i t i o n ,i n c r e m e n t - b a s e db a c k u pi se s p e c i a l l yp r e s e n t e dt oa i ma t o n l y - i n c r e a s i n gf i l e st h r e em e t h o d sa r ea l lp r o v i d e dt oa d dt os y s t e mf l e x i b i l i t y k e y w o r d s :d a t as e c u r i t y , n e t w o r ks t o r a g e ,n e t w o r kb a c k u p ,d i s a s t e rr e c o v e r y , f i l e - l e v e lb a c k u p i i 东南大学学位论文独创性声明 本人声明所呈交的学位论文是我个人在导师指导下进行的研究工作及取得的研究成 果。尽我所知,除了文中特别加以标注和致谢的地方外,论文中不包含其他人已经发表 或撰写过的研究成果,也不包含为获得东南大学或其它教育机构的学位或证书而使用过 的材料。与我一同工作的同志对本研究所做的任何贡献均己在论文中作了明确的说明并 表示了谢意。 研究生签名:l 之逊馥日期:k 盟 东南大学学位论文使用授权声明 东南大学、中国科学技术信息研究所、国家图书馆有权保留本人所送交学位论文的 复印件和电子文档,可以采用影印、缩印或其他复制手段保存论文。本人电子文档的内 容和纸质论文的内容相一致。除在保密期内的保密论文外,允许论文被查阅和借阅,可 以公布( 包括刊登) 论文的全部或部分内容。论文的公布( 包括于u 登) 授权东南大学研 究生院办理。 研究生签名:哩莹蓝2 趣导师签名 华打期:一 第一章引言 第一章引言 1 1 研究背景 网络技术的飞速发展和网络的日益普及,使得信息交流空前简化同时也刺激了信息量的高速 增长。数据已经成为我们工作、生活中不可缺少的因素。建设网络的最根本目的就是要更方便地传 递信息,而如果不能保障这些信息的安全,那么对网络的大量投资将失去原来的意义。计算机内的 数据是最珍贵的财富,对计算机软硬件的操作,实质上都是为了利用其中的数据资源,数据的价值 大于设备的价值已不是天方夜谭。 在当今信息化社会,政府机构和企业对计算机网络应用和数据信息的依赖越来越强,不分鳖夜 在线传递的大量网络数据和海量存储的数据库,成了各级政府机构和金融、保险、大型企业赖以生 存的命脉。然而,恐怖事件、自然灾害、系统故障、人为误操作、计算机病毒、黑客攻击等不确定 因素在时刻威胁着数据的安全。任何原因导致的数据不完整、毁损甚至丢失都将对计算机系统的 作用的发挥,产生不可弥补和无法估量的损失。 在震惊全球的9r 】事件中,位于美国世贸大厦里的公司就上演过数据丢失的悲剧,只有2 5 使 用了海量数据存储系统的公司能够在灾难发生后迅速恢复业务,而其他很多公司则因数据全部丢失 而遭受毁灭性的打击甚至破产。2 0 0 2 年深交所事件、2 0 0 2 年及2 0 0 3 年首都机场离港系统故障等都 是典型例子。 数据的价值及重新产生它的代价都是很高的,然而许多对数据的威胁是难于防范的,但是这并 不意味着我们只能听天由命。事实上,只要我们做到及时、有效的备份,就绝对可以“高枕无忧”。 如果遭遇数据灾难,唯一的解决方案就是能够恢复系统和数据,而恢复的前提工作就是数据备份。 作为一种数据安全策略,备份是避免数据丢失的最基本也是最后的手段,是任何冗余和高可靠的方 案所不能替代的。在原始数据丢失或遭到破坏的情况下,利用备份数据把原始数据恢复出来,使系 统能够正常工作。备份只是一种手段,其目的是为了防止数据灾难,缩短停机时间,保证数据安全: 备份的最终目的:数据恢复i 有效的备份,能够让企业以5 1 0 的投资,实现1 0 0 的可靠。数 据备份系统是计算机信息安全体系的重要基础保障体系部分。 企业对数据的渴求已经到了分秒必争的地步,业务数据正变得越来越重要,数据是企业的血液, 但同时数据丢失的风险也越来越大。对很多用户来说,备份虽然已经不是一个全新概念,但它的重 要性及地位越来越高。现代企业不仅需要一个稳定、可靠的i t 环境,更需要对业务和数据进行可靠 的保护和存储备份,以全面提升数据的高可用性。另外,传统的存储方式越来越难以承受数据量大 幅度增匠所带来的巨大压力。在这种情况下,存储解决方案已经从集中式存储、分布式存储发展到 今天的s a n ( s t o r a g ea r e an e t w o r k 存储区域网络) 。网络备份因此成了除文件服务以外的第二个最 广泛的网络存储应用。 国外对网络备份系统的研究和开发,开始于2 0 世纪8 0 年代中期。到目前为止,成熟的产品只 有三、四家,如v e r i t a s 公司、c a 公司、l e g a t o 公司、i b m 公司等,其中v e r i t a s 公司的b a c k u d e x e c 系列产品由于技术上的成熟与先进性,在数据保护、系统恢复等方面均提供全面的产品支持, 目前在全球数据备份市场的占有率很高,已成为业界的事实标准。n t ,w i n2 0 0 0 、w i n d o w s 9 5 9 8 剐 n e t w a r e 都选择了v e r i t a s 作为操作系统自带备份功能的o e m 厂家,使得v e r i t a s 的可操作性、 兼容性以及和操作系统的集成性更加脱颖而出。在安全存储备份领域里,国外软件早就名满天r , e m c 、惠普等厂商都是名声显赫。 据调查统计,我国目前有相当比例的计算机网络系统用户,一是缺乏数据安全意识,二是缺乏 配置和使用数据备份系统的知识和技能,导致了已经应用的系统水平相对较低,大多数存储和备份 系统比较简单,主要靠手工操作,效率低下,容易出错:不能实时在线服务,需要停机备份,严重 影响业务运行;遇到意外事故或毁灭性灾难以后无法使数据恢复,其后果不堪设想。而采用国外产 品,不仅价格昂贵,还很容易留下隐患,给国家安全造成威胁。 国际数据备份技术及其应用蓬勃发展,而国内仍处于初期发展阶段,刚刚起步的国内厂商犹如 东南大学硕上学位论文 风中小草,尽管有政府的支持,依然举步维艰。我国的网络数据安全备份软件虽然起步于8 0 年代初 期,在科研开发上取得系列成果,也彤成了一些产品,但市场占有率很低,在产业规模、技术水 平、开发能力和国际竞争能力等方面与国际先进水平相比有着很大的差距。网络备份软件是进行网 络备份的必要工具,国内在这方面的成功案例寥寥可数;为应对国际品牌的挤压和发展民旗品牌, 研究和开发网络备份软彳q7 变得更加需要和迫切。 1 2 本文内容安排 本文阐述了一个网络备份系统的设计和实现。首先,介绍了数据备份的相关知识;其次,对臼 前出现的网络存储技术和基于网络存储的网络备份进行了分析和比较;接着,结合网络备份系统的 特性和功能,提出了系统框架和、嫂计思路;进而,介绍了系统采用的开发方法和技术,并结合u m l 图对系统的软件实现进行了较为详细的说明;然后,针对文件级备份的不足,对备份提出了改进, 并给出了算法和关键代码实现:最后,对该系统进行了应用分析和展望,指出了系统功能有待增强 的方面。 2 第二章网络数据备份与恢复 第二章网络数据备份与恢复 网络环境下的数据安全分为两个层面,一个是网络传输中的数据安全其主要保障手段是防火 墙和入侵检测系统:二是网络存储中的数据安全问题,其解决问题主要是网络备份系统。数据备份 是一项基本的网络管理工作,也是预防灾难的必要手段。随着对网络应用的依赖性越来越强和网络 数据量的日益增强,对数据备份的要求也在不断提高。 在备份越来越受到人们重视的今天,了解什么是真正的备份,才能让更多的用户选择正确的备 份方式和手段,从而更有效地保护网络中的数据安全。 2 1 数据备份与恢复 数据备份是- - e o 数据安全策略,是将原始数据完全一样地复制,严格来说应复制两份,保存在 异地。在原始数据丢失或遭到破坏的情况下,刹用备份数据把原始数据恢复出来,使系统能够正常 工作,从而避免事故( 如自然灾害、病毒破坏和人为损坏等) 造成的数据损失。数据备份不等了_ j 简 单的文件复制,也不等于文件的永久性归档,而是要求一种高速、大容量的存储介质对所有的文件 ( 网络系统、应用软件、用户数据) 进行全面的复制和管理。 数据恢复就是将数据恢复到事故以前的状态。数据恢复总是与备份相对应,实际上可以看作备 份操作的逆过程。备份是恢复的前提,恢复是备份的目的,无法恢复的备份是没有意义的。 2 1 1 备份与恢复的概念 2 1 1 1 数据备份不等同于数据复制 刚刚接触“备份”这个概念的人,往往将其等同于简单的数据复制( 拷贝) ,认为只要将数据拷贝 后保存起来就可以确保数据的安全。这种认识是片面的,这样做的结果是:我们花费了大量的资 金与宝贵的时间,却仍旧无法做到有效地保护数据的安全,同时还埋下了很大的隐患。 数据复制是指将重要的数据复制到其他存储介质,并保存在其他地方,当数据遭到意外损坏或 者丢失时,再将保存的数据副本恢复到系统。单纯的数据复制根本无法留下其历史记录以做追踪, 亦无法留下系统的n d s ( n o v e l ln e w e a r e ) 和r e g i s t r y ( m i c r o s o f tw i n d o w sn t ) 等系统状态信息, 这样只能将部分数据进行恢复,而数据的应用环境、属性及历史操作记录等重要信息都无法再次重 现。系统管理者在着手规划一个安全各份的网络环境时,也无法充分了解完全备份方案应具有那些 条件要素,往往投入了大量的人力、物力与财力却仍然无法实现预想的良好效果。对于成千上万的 文件和海量数据,简单的复制也将显得力不从心。 完善的备份必须在数据复制的基础上,提供对数据复制的管理,不仅是消除传统下指令的复杂 程序或手动备份的麻烦,更要能实现自动化及跨平台的备份,满足使用者的全面需求。一个完善的 备份解决方案应具备自动化的排程设定、资料的安全性和完整性、磁带管理,以及跨平台的备份功 能。 由此可见,备份不等于单纯的拷贝,管理也是备份的重要组成部分。管理包括备份的可计划性、 磁带机的自动化操作、历史记录的保存以及日志记录等等。正是有了这些先进的管理功能,在- 液复 数据时我们才能对所有的信息了然于胸,特别是还可以查询一些重要的历史i 己录,使备份真正变得 既轻松又可靠。从这个意义上说,备份应该是“拷贝+ 管理”。 2 。1 1 2 数据备份不同于硬件容错 硬件容错是指用冗余的硬件来保证系统的连续运行,即硬件备份。目前,很多企业的服务器都 采取了容错设计,例如,提供磁盘冗余的磁盘阵列、磁盘镜像;提供服务器冗余的投机或集群容错、 双机或集群熟备份等方式。如果主硬件破坏,则备份硬件就能立即接替主硬件工作。这种方式可有 效地防i t 硬件故障,从硬件级提供对数据的保护。 不可否认,与简单的拷贝相比,系统冗余固然可以保证进程的连续性和系统的高可用性,但却 不能因此就认为系统冗余可以代替数据备份。从逻辑角度讲,数据实际上只有一份,因此无法防l f 东南大学硕士学位论文 逻辑上的错误,如人为误操作、病毒破坏和数据错误等。例如,因人为操作( 比如误删文件) 导致 数据发生错误时,这些错误将同时复制到用于容错的存储介质。事实已经不止一次地表明,系统冗 余并不是很好的备份方案。 就双机热备份而言,确保这种方案备份有效性的前提是:在某一时刻,两台机器中只能有一台 机器发生故障,如果两台机器不巧都同时出现了故障,那么整个网络就将陷入瘫痪灾难的状态。而 在现实生活中,这种“不巧”是防不胜防的,我们无法预计的许多自然灾害,例如洪水、火灾、建筑 物坍塌,队及令人防不胜防的病毒等,都极有可能使两台机器同时出现故障。而且对于那些由人为 错误( 如误操作或恶意破坏) 而引起的数据丢失,硬件备份根本无能为力。即便是没有这些天灾人 祸,从投资的角度讲,硬件备份也不是晶佳的备份方案。比如双机热备份实际上是等于牺牲了台 服务器,因此会造成企业成本的提高和资源的浪费,其结果是我们为此投入了大量的资金与发各, 却仅仅给网络数据上了一层并不牢靠的安全保障。面对意外,我们依旧束手无策。这样的结局恐怕 是任何一个企业都不愿意看到的。 硬件容错的目的是为了保证系统的数据可用性和不间断运行,郎保护系统的在线状态,保证数 据可以随时被访问。数据各份则是将整个系统的数据或状态保存一f 来,咀便将来挽回因事故带来的 数据损失,保存的数据副本处于离线状态。备份数据的恢复需要一定的时间,在此期间,系统往往 是不可用的。 硬件容错不能作为数据备份的解决方案。但是,硬件容错与数据备份可以结合起来,在硬件级 和软件级两个层次上为网络系统提供更为完善的安全保护。 2 1 1 3 系统文件和应用程序的备份 在恢复数据时,人们最首要的是将其认为重要的数据文件恢复,这个需求使很多人误以为数据 备份只不过就是备份所有的数据文件,而系统文件与应用程序根本无需进行备份,因为它们可以在 恢复数据时重新安装后使用。实际上这也是对备份的一大误解。 特别是在计算机网络普及的今天,网络环境中的系统文件和一些应用程序的安装极为藤爆,我 们必须重新安装操作系统、所有的应用程序后,才能恢复备份数据,然后再重新设置各种参数、地 址及网络环境等。这个过程可能要持续好几天。而在这几天当中,原有的数据文件根本无法有效利 用,整个网络系统也无法使用,因为这些数据文件所依赖的系统环境或应用程序还没有得到恢复。 因此,最有效的备份是使用一种大容量的设备对整个网络系统进行备份。这样,无论系统遭到 何种程度的破坏,都可以很方便地将原来的系统恢复。例如,某网络出现了突发性事故,网络瞬间 呈瘫痪状态。虽然整个网络采用了多种操作系统( n t 、u n i x 等) 、多种应用软件和分散的大量数据 但我们不需要再找来无数张光盘与软盘进行逐一的安装和数据恢复,而只需要采用以往做好的大容 量备份系统对网络系统进行简单的恢复t 则在短时间内就可使全套的网络系统恢复如初。因而从这 个意义上来说,备份就等于“网络系统备份”。 2 1 1 4 数据备份通过备份软件实现 专业的备份系统需要使用专门的存储各份设各和专门的备份软件。软件备份可以完全防止逻辑 错误,因为备份介质和计算机系统是分开的,错误不会复写到介质上。 备份软件是整个数据备份系统的灵魂,它决定备份功能,影响各份效率。越是专业的备份系统, 越强调备份软件的作用。优秀的备份软件提供加速备份、自动操作和灾难恢复等功能,这对于数据 备份是非常重要的。 2 1 2 数据备份的类型 数据备份有许多种分类方法。 1 ) 据备份设备与系统的相对位置,可以分为本地备份和远程( 异地) 备份。 2 ) 据备份介质的不同,可以分为磁带备份、磁盘备份和光盘备份等。 3 ) 根据备份时间的不同,可以分为即时备份和定时备份。 4 ) 根据备份的自动化程度,可以分为手工备份和自动备份。自动备份包括按照备份时间计划 4 第二章刚络数据备份与恢复 的定时自动备份和满足备份条件的自动备份。 5 ) 根据备份数据的在线状态和备份的实时性,也即在备份过程中是否可以接收用户响应汞l 数 据更新,可以分为冷备份( 离线备份、非实时备份) 和热备份( 在线备份、实时备份) 。 6 ) 根据备份对象,可以分为文件备份和映像备份。 下面着重介绍另外两种重要的划分方法。 2 1 2 1 完全备份、增量备份和差分备份 完全备份是指对整个系统( 如组成服务器的所有卷) 或用户指定的所有文件数据进行一次全面 的备份。这种方法最基本也最简单,直观而易于理解。完全备份所需时间最长,但恢复时间最短, 操作最方便。当系统中的数据量不大时,采用完全备份最可靠。 增量备份只备份上一次备份后增加的和修改过的数据。优点很明显,由于没有重复的备份数据, 节省了磁带空间和缩短了备份时间。但是一旦发生灾难,恢复数据则比较麻烦。实际应用中般不 采用这种方式。 差分备份吸收了完全备份和增量备份的优点,只备份上一次完全备份后增加的和修改过的数据, 无需每天都做系统完全各份,因此备份所需时间短,并且节省空间;灾难恢复方便,系统管理员只 需两份数据,就可以将系统完全恢复。 增量备份和差分备份都能以比较经济的方式对系统进行备份,这两种方法的备份方法都是依赖 于时间,或者是基于上一次备份,或者基于上一次完全备份。下表对三种备份方法进行比较。 含义对整个系统或用户指定的所 只对上次备份后增加的和修对上次完全备份( 而不 有文件数据进行全面的备份。改过的数据进行备份。是上次备份) 之后增加 的和修改过的数据进行 备份。 优点备份的数据最全面、最完整。没有重复的备份数据,可缩 恢复数据时,只需要两 只需利用一份副本,就可以恢短备份时间,快速完成备份, 份数据,一份是上次完 复全部数据。 而且能节省各份介质存储空全备份,员一份是最新 间。的差分各份。 不足 备份工作量大,备份时间长,可靠性较差,备份数据的份 需要大量备份介质。如果完全数太多;当发生灾难时,恢 备份进行频繁,则备份文件中 复数据比较麻烦,需要按顺 会有大量重复数据,重复的数序依次恢复每次备份的数 据占用大量存储空间,对用户据,环环相扣。 来说意味着增加成本。 应用 不适用于业务繁忙、备份时间一般不使用增量备份,而用 适用于各种备份场台 范围有限的网络系统。不能进行太差分备份代替 频繁,通常只是在备份的最开 始一两天采用。 图表1 完全备份、增量备份和差分备份的比较 2 1 2 2 单机备份和网络备份 根据数据备份的网络实现方式,可以分为单机备份和网络备份。 1 ) 单机备份 对于网络数据备份来说,单机备份是传统的解决方案。 与传统的o a s 存储结构相适应,单机备份是将备份设备直接连接到网络服务器上,形成基于土 机的备份结构:备份系统直接将服务器硬盘上的数据保存到备份设备。目前流行的操作系统自带的 5 奎妻查堂雯兰:兰焦笙兰 备份系统大多基于此种结构。这种备份方式较为简单,但也有明显的不足,由于备份过程需要占用 服务嚣的大量c p u 资源和总线带宽,围此服务器很难处理其饱任务,影响了服务器的正常服务,而 且这种结构不便于拓展。下圈为单机备份的示意图。 客户机 服务器 图表2 单机备份 单机备份配置简单,适台于只有台服务器的网络。对于有多台服务器的网络,也可以为每台 服务器部署单机备份,但这种方式不便于集中管理,而且浪费资源。在这种情况下,采用网络备份 更为有效。单机备份也可通过网络备份其他计算机的数据资源,不过一般只能备份网络共享资源, 对于非本机的数据库服务器、系统数据的备份则无能为力。 2 ) 网络备份 网络各份支持基于网络的数据备份和恢复功能,为整个网络建立一套备份体系,能满足实时备 份、远程数据保护以及快速系统恢复等要求。 下图表示一个备份网络的例子,备份服务器发挥管理作用,备份代理执行备份,客户机提供人 机交互,三者协同合作,连同存储设备、数据库等构成网络备份系统。本文介绍的网络备份系统的 结构与该图所示有类似之处,详见后文。 嗵明 1 r筇釜各鬟储 醯鱼网 图表3 网络备份 网络备份进一步可以分为局域网备份和因特网备份。局域网备份需要配置备份服务器和专业备 份软件,存储设备和介质的管理维护负担重,需要专业技术人员投资较大。因特网备份提供远程 异地备份,备份数据远离本地网络现场,可以降低安全风险,提供容灾能力:本地管理维护开销小, 不需要管理存储设备和介质。 一般来讲,对于中小型网络,在只有一两台服务器的情况下。完全可以考虑单机备份的方案, 6 塑三主塑塑墼塑鱼堕皇堡墨一 尽可能在数据库服务器上部署单机备份。网络规模较大,有多台服务器需要数据备份,或者网络数 据备份操作比较频繁,对备份管理性能要求高,则应考虑使用网络备份方案。 2 1 3 备份的内容 2 1 3 1 应用软件 至少应该备份应用程序一次,许多网络系统对主要软件产品进行网络安装。这样当用户需要 安装某个软件产品时,用不着将磁带,磁盘或光盘拿来拿去,只需销售人员在网络上简单地安装一。 下就行了,这样傲既快又简单。据说过去应用程序不经常变化。现在已经不这样了。现在许多应用 程序可在j n t e r n e t 上更新,而且市场上的软件产品在有新产品时也会自动进行更新。在此基础上,许 多用户将设置不同的参数以便使应用程序适合他们的特殊需求。为第一次使用一个新的备份系统时, 就对应用程序进行备份是一个很好的习惯,然后再对这些应用程序进行定期备份以记录其变化和更 新。 2 1 3 2 数据文件 必须定期备份数据文件,每当进行写入时,数据文件都会产生变化。 2 1 3 3 网络操作系统文件 网络操作系统文件会变化吗? 应该多跃时间备份一次操作系统? 这里的答案有点复杂。构成操 作系统自身的文件只在安装新支持软件包或选件时才会产生变化,而操作系统的其他部分确定在变 化,几乎每天都在变化。 以w i n d o w sn t 为例,并从w i n d o w sr e g i s t r y 开始,这里是存储整个服务器结构的信息所在, 包括硬件及配置信息。这些信息几乎每天都在变化,而且,别忘了s e c u r i t yi d ( s i d ) 数据文件,这个 信息每当建立新用户,或者已有用户更改其属性或描述文件时,都会改变。这些信息都需要定期备 份。ini 文件和其他配置文 牛也要定期备份。 每天都需要进行完全备份吗 回答是不需要,没必要每天进行完全备份,但是确实需要建立一 个备份系统,包括某些每天都要注意的文件。 2 1 4 备份介质的类型 备份晟火的忌讳就是在备份过程中因介质容量不足而更换介质,这会降低备份数据的可靠性与 完整性。因此,存储介质的容量在备份中具有压倒一切的重要性。 备份是为了防备万一发生的意外事故,但这些意外事故不可能每天都发生,因此我们使用备份 数据进行恢复的频率不是很高。从这个意义上讲,备份数据的存取速度并不是一个很重要的因素, 没有必要为了追求一个并不重要的高速度而成倍增加对设备的投入。 用于备份的存储介质主要有磁盘、磁带和光盘等三大类。主流的备份系统都使用磁带作为备份 介质,磁带机作为p c 服务器的安全组件,国外的连接率达到6 0 。选择哪种类型的备份介质主要 依赖于特定的网络系统环境。 2 1 4 1 硬盘介质 硬盘介质存储,主要包括两种存储技术,即内部的磁盘机制( 硬盘) 和外部系统( 磁盘阵列等) 。 在速度方面硬盘无疑是存取速度最快的,因此它是备份实时存储和快速读取数据最理想的介质。但 是,与其它存储技术相比,硬盘存储所需费用是极其昂贵的。因此在大容量数据备份方面,备份只 是作为后备数据的保存,并不需要实时的数据存储,不能只考虑存取速度而不考虑投入成本。 采用硬盘作为备份的介质不是大容量数据备份最佳的选择。一般只有在数据规模较小的情况卜 可考虑使用硬盘备份。 2 1 4 2 光学介质 光学介质主要包括c d r o m 、d v d 和可擦写光盘等。光学存储设备具有可持久地存储和便r 携 带数据的特点。与硬盘备份相比较,光盘提供了比较经济的存储解决方案,但是它们的访问时间比 东南火学硕士学位论文 硬盘要陡2 到6 倍( 访问速度是受光头重量的影响) ,并且容量相对较小。备份大容量数据时,所需 数量极大,虽然保存的持久性较长,但是相对整体可靠性要低。 光学介质更适合于数据的永久性归档和小容量数据的备份。采用光学材料作为备份的介质也并 不是大容量数据备份最佳的选择。 2 1 4 3 磁带介质 磁带是存储大容量数据的最经济的介质。磁带易于转移,便于异地保存。磁带兼容于绝大多数 系统,便于实现自动化备份。磁带是最主要的备份介质,具有安全、可靠、易使用和投资相对较小 等特点。与硬盘和光盘相比,磁带的存取速度较慢。 磁带适用于备份大容量的数据,对原有系统恢复也很简单。磁带系统包括硬件介质和软件管理, 支持多种备份方案,允许随时扩容,是大量后台非实时数据各份的最佳方案。 对中小型网络来说,应从自身特点出发,根据数据容量、存取速度和可移动性等要素来选择备 份介质类型。磁带介质的价格低廉、扩展能力强、成熟可靠,是数据备份的首选介质。 2 1 5 备份系统的逻辑结构 备份系统的逻辑结构包括以下3 个部分。 备份源系统 主要用于从特定的系统中提取备份数据。操作系统、数据库和备份任务都需要相应的备份源代 理程序,获得备份数据。 各份管理器( 备份引擎) 用于管理和运行备份任务,提供备份用户管理、作业调度管理、备份数据库管理、备份跟踪和 审计、数据迁移等功能。备份管理器和备份源系统进行通信,并将来自源系统的数据传送至目标系 统。 备份目标系统 主要完成把备份数据保存到各份介质的工作,提供备份设备管理和介质管理等功能。 2 1 6 恢复备份的逆操作 数据恢复在整个备份制度中占据相当重要的地位,关系到系统在经历灾难后能否迅速恢复。恢 复不仅仅是备份的简单逆过程,而是比备份更为复杂。 大部分备份操作都是自动执行,无须照管;而恢复操作却不同,经常是手工作业,需要选择恢 复的数据实体,也可能需要选择恢复数据存放的介质。下面介绍一下常见的操作类型。 2 1 6 1 全盘恢复 全盘恢复一般应用在服务器发生意外灾难导致数据全部丢失、系统崩溃或是有计划的系统升级、 系统重组等,也称为系统恢复。 2 1 6 2 个别文件恢复 个别文件恢复比较常见,只需浏览各份数据库或目录,找到该文件,触动恢复功能,软什将恢 复该指定文件。 2 1 6 3 重定向恢复 将备份的文件恢复到另一个不同的位置或系统上去,而不是进行备份操作时他们所在的位置, 可以是整个系统恢复也可以是个别文件恢复。此种方法需慎重,要确保系统或文件恢复后的可用性。 2 2 网络存储技术 存储是备份的基础,存储技术的发展也必然会推进备份系统的发展。 8 第二章刚络数据备份与恢复 2 2 1d a s 在各类网络应用中普遍采用的数据存储模式是d a s ( d i r e c t a t t a c h e ds t o r a g e ) ,译为“直接附加 存储”或“直接连接存储”。d a s 将存储设备直接与服务器相连,完全以服务器( 主机) 为中心, 作为服务器的组成部分。用于d a s 的存储设备可以是磁盘、磁带、磁盘阵列或磁带库。 客户 图表4 d a s 示意图 d a s 不能提供跨平台文件共享,需要管理员耗费大量的时间为每台服务器进行数据维护当然 也不便于未来的扩展。问题主要有以下几点: 容易形成服务器到存储设备的瓶颈 当客户连接数增多时,服务器的i o 总线将会成为一个潜在的瓶颈,并且会影响到服务器本身 的动能,严重睛况下甚至会导致系统的崩溃。 影响数据的可用性 一旦服务器出现故障,数据将不能被访问。 存储设备分散,不便于管理监控 每台服务器都要配置存储设备,当网络规模增大时会成倍地增加网络的管理成本,而且会导致 资源利用率低下。 容易造成存储空间的浪费 在不同的存储设备上可能存在相同的数据,浪费存储空问。 对重要数据进行备份时将会极大的占有网络带宽。 可扩展性差 当系统结构进行扩展,客户机数和服务器的磁盘数同步增加时,由于服务器的内存限制,整个 系统的吞吐量不能同步增加。 数据的迅速增长对数据存储提出了新的要求:如何确保数据的致性、安全性和可靠性,如何 实现网络数据的集中访问,如何实现异构环境下的数据存储和管理? 面对这些问题,传统的d a s 数 据存储架构,已经无能为力。 网络的发展提供了基于网络的存储解决方案,采用网络存储技术可以解决上述问题。 网络存储技术是互联网发展的新趋势,掀起了以数据存储为中心的第三次i t 革命浪潮。网络 存储的出现把数据从以往的分散管理转变为集中管理,可火幅度降低成本、提高效率,同时使备份 系统从单机各份发展到网络备份,并且拓展了备份的范围,使得诸如异地备份、灾难恢复等技术得 以实现,并能为更多的用户服务,从而提供了高可靠性的数据备份。 9 查塑查堂堡主兰堡笙兰一 n a s 和s a n 是目前网络存储的主流技术。 2 2 2n a s n a s 是英文n e t w o r k a t t a c h e ds t o r a g e 的缩写,通常译为“网络附加存储”或“网络连接存储”, 意思是连接在嘲络上的存储设备。n a s 是适应信息存储和共享的应用需求而产生的网络存储技术, 因其具备简便商效的特点而得到厂。泛的应用。 n a s 实际上是一个带有瘦服务器的存储设备,舍弃了通用服务器的大多数计算功能,仅仅提供 文件系统功能,专用于存储服务。为提高n a s 设备与网络之间的数据传输效率,专门优化了系统硬 软件体系结构,采用多线程、多任务的网络操作系统内核来处理网络的i o 请求,不仅响应速度快, 而且数据传输速率也很高。 如下图所示,n a s 存储设备真接连接到t c p i p 网络( 可以是l a n 或w a n ) 上,在功能上完 全独立于网络服务器,客户机对存储设备的数据访问不在需要通过网络服务器转发,而是通过网络 直接进行数据存取,网络服务器仅起控制管理的作用。可将网络服务器从繁重的u o 负载中解脱出 来,因而具有更快的响应速度和更高的数据带宽,便于实现海量数据的网络共享。 客户 图表5 n a s 示意图 n s 存储设备 简言之,n a s 存储设备是使用t c p i p 协议的文件服务器,包括存储硬件、操作系统以及其上 的文件系统组成。即插即用,可以直接挂按到网络上。独立于操作系统平台,可以跨平台使用。 但是,n a s 没有解决好的个关键性问题,是其在备份过程中的带宽消耗,这使其无法完成大 容量的存储各份应用,而且系统可扩展性有限,不能对数据库服务提供有效的支持。这些缺点注定 了n a s 存储技术只能用来解决存储容量不足的问题,而在存储超大容量的信息时难有满意的一肚 能。 要想真正解决网络存储备份问题,还需要新型的网络存储技术。 2 2 3s a n :网络存储的主角 s a n 是英文s t o r a g e a r e a n e t w o r k 的缩写,通常译为“存储区域网络”,它是一种在服务器和外 部存储资源或独立的存储资源之间实现高速可靠访问的专用网络。s a n 采用可扩展的网络拓扑结构 连接服务器和存储设备,每个存储设备不隶属于任何一台服务器,所有的存储设备都可以在全部的 网络服务器之间作为对等资源共享。 根据所采用的传输协议以及传输介质的不同,s a n 有很多种实现方式,主要有f c 。s a n 和 i p 。s a n 两种。 f c s a n 最用高速的光纤通道构架存储网络,并用f c p ( f i b r ec h a r m e lp r o t o c 0 1 ) 协议传输s c s ! 命令和数据。由于光纤通道的远距连接能力以及高速的传输能力使得f c s a n 的性能非凡,但另 1 0 第二章网络数据备份与 炙复 一方面,光纤网络的采用使得f c s a n 的实现成本极其昂贵。 1 p s a n 是采用i s c s i ( i n t e r n e ts c s i ) 协议构架在i p 网络上的s a n ai s c s i 是一种实现s c s l 引 t c p i p 协议相连接的存储协议。i p s a n 结合i s c s i 和千兆以太网的优势,不仅提供f c s a n 的稳定 和强大功能,还省掉f c 不菲的组件成本。i p s a n 可以利用无所不在的1 p 网络,超越地理距离的限 制,十分适合对现存关键数据的远程各份。 图表6s a n 示意图 阵列 s a n 是目前比较先进的备份架构,将备份数据流从用户网络迁移到s a n ,从而缩短备份,- 恢复 时间和减少网络拥挤,充分保证了应用系统的效率;而且适用于任何操作系统,改善数据可用性及 网络性能,允许对备份作业进行集中式管理,使管理更简便,提高备份效率;再者,通过存储整合, 实现了高达8 5 的存储利用率。最后,传输距离长,易于实现物理上分离的存储备份。 s a n 侧重于高速存储,只有当数据量非常火,对存驭速度要求很高,才考虑采用s a n 。随着 s a n 在i p 网络中的成功应用,其低廉的成本,加上虚拟存储技术的广泛应用,s a n 极有可能成为 网络存储的主导方向,而存储虚拟化、数据高可用和容灾支持将会是s a n 的关键技术。 s a n 性能高,但是成本也高,而且技术尚未完全成熟,管理复杂,兼容性和互操作性还来完全 解决。由此,这种网络存储架构还只能是未来选择的方向。 2 2 4 网络存储的发展方向 2 2 4 。1 基于i n f i n i b a n d 的存储系统 l n f i n i b a n d 是被用来取代p c i 总线的新i o 体系结构。l n f i n i b a n d 把网络技术引入i o 体系中, 形成一个i o 交换网络结构,主机系统通过一个或多个主机通道适配器( h c a ) 连接到i o 交换网 上,存储器、网络通信设备通过目标通道适配器( t c a ) 连接到该i o 交换网上。l n f i n i b a n d 体系结 构把1 p 网络和存储网络合二为一,以交换机互连和路由器互连的方式支持系统的可扩展性。在 l n f i n i b a n d 体系结构下,可以实现不同形式的存储系统,包括s a n 和n a s 。 2 2 4 2 采用d a f s 技术 作为一种文件系统协议,d a f s ( 直接存取文件系统) 可以在大量甚至过量负载时有效地减轻存 储服务器的计算压力,提高存储系统的性能。d a f s 把r d m a ( 远程直接内存存取) 的优点和n a s 的存储能力集成在一起,全部读写操作都直接通过d a f s 的用户层r d m a 驱动器执行,从而降 低了网络文件协议所带来的系统负载。 d a f s 的基本原理是通过缩短服务器读写文件时的数据路径来减少和重新分配c p u 的计算任 1 1 东南大学硕士学位论文 务。它提供内存到内存的直接传输途径,使数据块的复制工作不需要经过应用服务器和文件服务器 的c p u ,而是在这两个物理设备预先映射的缓冲区中直接传输。也就是说文件可以直接由应用服 务器内存传输到存储服务器内存,而不必先填充各种各样的系统缓冲区和网络接收器。d a f s 可以 赢接集成到n a s 存储服务器中,一方面实现高性能的数据传输,另一方面也可以更好地支持数据库 管理系统,如o r a c l e 数据库等。 2 2 4 3 采用n a s d 技术 n a s d ( n e t w o r k - a t t a c h e ds e c u r ed i s k ) 是c m u 大学目前正在研究的网络存储项目,它是一个 类似n a s 存储设备的智能磁盘驱动器,但将管理、文件系统语义和存储转发相分离,仅实现基本的 存储元语,由文件管理器实现文件系统的高层管理部分。它对外提供以太网、a t m 等数据通信接口 与1 p 网络相连,或者通过f c 接口连接到s a n 上。因为网络通信可以通过公用数据网络采用普通的 通信协议完成,因而n a s d 需要提供安全机制,目前采用的是基于私钥公钥验证技术的安全机制。 2 2 4 4 统一虚拟存储 统一的虚拟存储将不同厂商的f c 。s a n 、n a s 、i p s a n 、d a s 等各类存储资源整合起来,形成 一个统一管理、监控和使用的公用存储池。虚拟存储的实质是资源共享,因此,统一虚拟存储的任 务有两点:其一是如何进一步增加可共享的存储资源的数量:其二是如何通过有效的机制在现有存 储资源基础上提供更好的服务。 从系统的观点看,存储虚拟化有三种途径:基于主机的虚拟化存储、基于存储设备的虚拟化存 储以及基于网络的虚拟化存储。统一虚拟存储的实现只能从虚拟存储的实质出发,因此,单一存储 映象的方法可能是虚拟存储的发展方向。 2 245 n a s 和s a n 的融合 n a s 和s a n 在不同的应用领域各有所长,出现了二者相互融合的趋势。 n a s 和s a n 的本质区别在于结构和底层操作方式的不同。n a s 是一个以文件( f i i e ) n 操作方式 的网络存储技术。而s a n 则是一个以数据块( b l o c k ) 为操作方式的网络存储技术。二者的融合存在其 合理性,s a n 提供速度,n a s 提供由文件处理带来的协作性。 2 3 网络备份一网络存储的应用 网络存储改变了存储系统作为主机附属的地位,也影响到了
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 工业园污水管网铺设实施计划
- 光伏设备采购风险规避方案
- 护理选拔面试题及答案
- 护理学测试题及答案
- 日语题目题库及答案初中
- 东南亚跨境电商市场跨境电商服务商发展报告
- 安全培训突出问题课件
- 安全培训知识货车课件
- 安全培训知识学习方法课件
- 安全培训相关管理要求课件
- 低压配电柜改造施工方案
- 中国模切行业分析报告:进出口贸易、行业现状、前景研究(智研咨询发布)
- 小学教材全解全析六年级上册数学人教版
- 《影视拍摄角度构》课件
- 151012-天华瑞安化龙桥项目概念方案+设计
- 《穴位贴敷治疗》课件
- 从理论到实践我的博士研究计划解析
- 《统计分析软件:使用R与Python》 课件全套 王洪 第1-10章 引言 -Python 数据处理
- 2024美容行业劳动协议样本
- 人教部编版九年级历史上册全册教案(全册)
- 电话客服服务流程与标准
评论
0/150
提交评论