LINUX环境下基于网络存储技术的操作系统远程备份恢复研究_第1页
LINUX环境下基于网络存储技术的操作系统远程备份恢复研究_第2页
LINUX环境下基于网络存储技术的操作系统远程备份恢复研究_第3页
LINUX环境下基于网络存储技术的操作系统远程备份恢复研究_第4页
LINUX环境下基于网络存储技术的操作系统远程备份恢复研究_第5页
已阅读5页,还剩81页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、V S6B823南开大学硕士研究生毕业学位论文Linux环境下基于网络存储技术的 操作系统远程备份恢复研究姓 名:肖飞研究方向:智能自动化与网络通信 专 业:控制理论与控制工程 导 师:陈增强教授南开大学信息技术科学学院自动化系二零零六年五月网络存储技术的飞速发展,为各种应用提供了廉价安全的网络存储空间。操 作系统作为管理服务器信息和终端系统信息的必备单元,其中也包含有大量重要 的配置及日志信息。利用网络存储技术建立操作系统的远程备份恢复方案不仅有 利于服务器系统的灾后重建,也可以减少终端操作系统损坏带来的损失。Linux是当前应用最广泛的类UNIX操作系统,它具有高效、稳定的优点, 并且对硬

2、件支持较好,非常适合服务器领域的应用。而JFS、XFS等大型日志文 件系统是服务器系统安装时的首选文件系统。在这个背景下,本文以Linux平台 及开源代码资源为基础,研究文件系统备份恢复技术,并利用成熟的网络存储技 术构建了这两种模式的操作系统远程备份恢复方案,其中:实现了一个基于Linux操作系统,具有跨域工作能力的NAS服务器。 对Unh iSCSI Target端驱动程序与LVM联合使用时产生的错误进行处理,并完善了相关功能。 开发了 JFS/XFS文件系统备份和恢复软件。 处理了非正常状态的JFS/XFS文件系统的备份和恢复。 本论文首先将介绍有关网络存储、文件系统的背景知识;然后详细

3、介绍了各 种网络存储技术;最后,将NAS技术、iSCSI技术及文件系统备份和恢复技术综 合起来搭建了操作系统远程备份恢复平台。 本文的创新性在于:提出了一个基于Linux系统的,可工作在Windows和NIS混合域中的NAS 服务器,能完成各种域用户的安全认证,并且支持即插即用的功能,为操作系统 备份镜像的局域网存储提供了良好的网络环境。将UNH的iSCSItarget与LVM管理工具结合起来,改正了该程序在对外 提供LVM逻辑卷时出现的各种错误,为操作系统的远程运行时备份提供良好的数 据传输服务。通过移植Linux内核中JFS/XFS的支持代码,实现一套不依赖于操作系 统文件系统支持的,文件

4、系统备份恢复软件。通过进一步研究操作系统备份恢复中可能遇到的文件系统不一致现象, 综合分析文件系统日志功能,建立了在文件系统不一致的情况下完成文件系统正 确备份的方案。关键词:Linux操作系统网络存储技术iSCSI文件系统备份恢复JFS文件系统XFS 文件系统AbstractThe rapid growth of network storage technologies, gives all kinds of application a safe and inexpensive storage space. The Operation System (OS) which manages th

5、e system information of the server and the terminal has a lot of configuration and log information. Using the network storage technologies implement a platform to backup and restore the Operation System remotely, which not only can help the rebuilding of the server system, but also can reduce the lo

6、st of cause by the damage of the terminal system.As a UNIX-like operating system, Linux operating system works with high efficiency and outstanding stability, and supports most popular hardware, so it has been used widely, especially on network server area. JFS, XFS etc. are the most popular file sy

7、stem used by servers. This thesis research the file system backup and restore by using the Linux open source code, and two model of Operation System remote backup and restore are designed, by using the network storage technologies:Developed a NAS server using the Linux OS, which can work in a mixed

8、domain.Deal with the bugs appeared in UNH iSCSI drivers when it works with LVM, and improved some correlated functions.Developed the JFS/XFS backup and restore system.Solve the backup and restore problem of JFS/XFS when they are in a incoherent mode.After the brief background introduction of network

9、 storage and file system, this thesis elaborates all kinds of network storage technology. At last, with the NAS, iSCSI and file system backup and restore technology, a platform is build witch can implement the remote backup restore of the Operation System. The new idea of this thesis:(1) Design and

10、implement a NAS server based on Linux operating system. This NAS server can work properly under mixed domains, and also support plug and play features. It can well store the images that build by the backup and restore system.Use the UNH iSCSI target with the LVM tools, and correct the bugs that appe

11、ared when share the LVM logical volume with in target. This can help the remotely backup and restore system send the data through the network.With the porting of Linux kernel code that implement the JFS/XFS, design a file system backup and restore software, which can work without the support of the

12、Operation Systerm.After research the incoherent mode of the JFS/XFS that will occur in the backup and restore process, and the journal of the file system, design a plan that can help the system backup and restore that kind of file system correctly.Key Words: Linux Operation System Network Storage Te

13、chnology Internet SCSl(iSCSl) File System Backup Restore JFS XFS第一章绪论第一章绪论随着计算机信息技术的飞速发展,人们对计算机的依赖也越来越大。不仅需 要利用计算机的运算功能完成复杂的计算任务,更多的是利用计算机存储和管理 各种各样数字化了的信息。本地存储资源,在大量关键数据的存储方面,无法全面满足用户在存储量和存储的安全性上的需求。网络存储技术11应运而生,专业化的异地存储模式在提供大存储空间的同时,也保障了数据的安全性。操作系统在使用过程中保存了大量的软件安装配置信息和软件使用的记录 及曰志信息,这些信息对于存储业务数据的用户

14、而言当然并不重要,他们关心的 是介质中存储的关键性业务信息,然而对于系统的使用和维护人员,这些信息则 相当重要,在没有备份信息的情况下,一个应用服务器的恢复工作也许会花上好 几个维护人员几天的时间。即使是终端操作系统的重建也会花费使用人员一到两 个工作日的时间。由于实现自动从操作系统中提取关键信息并进行备份相当困难,而手工提取 这些信息耗费工作量太大,因此实现简单的备份操作系统全部信息,在存储价格 曰益低廉的今天也是一个不错的解决方案。这样虽然会花费大量空间备份多余信 息,但是相对于复杂的系统重建工作,这样的代价是值得的。网络存储技术的飞速发展为实现快速、安全、可靠的远程备份恢复系统提供 了各

15、种可行技术。本文从网络存储技术出发,结合文件系统数据备份恢复方案的研究21及实现,设计了操作系统远程备份恢复方案。一方面实现基于Linux操作系统的大型服务器的操作系统异地远程备份恢复,为服务器的灾后重建提供方 便,节省服务器重建的时间及劳动量,减少灾难带来的经济损失;另一方面实现 终端PC机Linux操作系统的网络备份恢复,为局域网用户提供方便快捷的操作 系统备份恢复方案,减少工作中由于错误操作、病毒等带来的经济损失。第一节操作系统备份恢复操作系统(Operating System,简称OS)是指负责对计算机硬件直接控制及管理的系统软件。操作系统的功能一般包括处理器管理、存储管理、文件管理、

16、 设备管理和作业管理等。当多个程序同时运行时,操作系统负责规划进程以优化 每个程序的处理时间。小型嵌入式操作系统,存储ROM或Flash中,对于PC或大型服务器,操作系统都存储在硬盘或硬盘阵列上。不论使用何种存储介质, 操作系统的存储都必须用到某种文件系统,实现操作系统文件的管理。我们开发的不依赖于操作系统文件系统支持的数据备份和恢复软件,是实现 操作系统远程备份恢复的基本技术。该软件在完成文件系统备份恢复的同时实现 了操作系统内核镜像文件物理位置读取,保证了在恢复后的存储介质上操作系统 能正常启动,对于日志信息的处理,在保证文件系统完整性的同时,不丢失操作 系统运行相关的任何有用数据。以此备

17、份恢复技术为基础,配合逻辑卷管理器(Logic Volume Manager,LVM)13的快照功能就实现了操作系统的运行时备份而不必担心数据备份期间操作系统运行带来的数据更新。为实现操作系统的远程备份与恢复,必须利用某种成熟的网络存储技术,实 现备份恢复信息的远程传输。由于操作系统备份和恢复需要直接读写存储介质,iSCSI技术14以其独特性质成为实现操作系统远程备份恢复的首选网络存储技第二节网络存储技术网络存储技术利用传统的存储设备和网络设备实现网络存储功能,构造出能 够直接被网络访问的网络存储设备。在这种新型的存储结构中,存储系统不再通 过I/O总线附属于某个特定的服务器或客户机,而是通过

18、网络接口与网络相连,由用户通过网络访问。目前常见的网络存储技术主要有NAS,3鄉|5】和18081。 NASNAS(Network Attached Storage,网络附加存储),是一种将分布、独立的数据 整合为大型、集中化管理的数据中心,以便于不同主机和应用服务器进行访问的 技术。NAS是一种特殊的专用数据存储服务器,包括存储器件(例如磁盘阵列、 CD/DVD驱动器、磁带驱动器或可移动的存储介质)和内嵌系统软件,可提供跨 平台文件共享功能。NAS通常在一个LAN上占有自己的节点,无需应用服务器的千预,允许用 户在网络上存取数据,在这种配置中,NAS集中管理和处理网络上的所有数据, 将负载从

19、应用或企业服务器上卸载下来,有效降低总成本,保护用户投资。 NAS本身能够支持多种协议(如NFS、CIFS、SAMBA, FTP、 等), 而且能够支持各种操作系统。通过任何一台工作站,采用E或Netscape 浏览器就可以对NAS设备进行直观方便的管理。NAS是真正即插即用 的产品,并且物理位置灵活,可放置在工作组内,也可放在混合环境中,如混合了 UNIX/Windows NT局域网的环境中,而无需对网络环境进行 任何的修改- NAS产品直接通过网络接口连接到网络上,只需简单地配 置一下IP地进,就可以被网络上的用户所共享。SANSAN(Storage Area Network,存储区域网)

20、是一种将磁盘阵列、磁带等存储设备与服务器连接起来的髙速专用子网。SAN以FC( Fiber Channel,光纤通道)为硬件基础,结合了 FC和LAN的优点,绕过了传统网络的瓶颈,使数据的迁 移性更好。典型的SAN通常由存储设备(包括磁盘、磁盘阵列、磁带和磁带库)、 服务器、连接设备(包括铜缆、光纤、网桥、集线器、交换机和接口适配器等)、 存储管理应用软件(涉及数据共享、网络结构、数据保护和数据备份、数据交换、 群集、数据保护和灾难恢复等)。与传统服务器与磁盘阵列之间的主/从关系不同, FC-SAN上的所有设备均处于平等的地位,多台服务器以及多个存储器可以配置 在同一个SAN上,实现了在不同的

21、硬件和操作平台之间异构存储设备和数据的 整合。iSCSIiSCSI即Internet SCSI,是一种基于IP网络的数据块级的数据传送协议,它 能够通过IP网络传输包含SCSI命令和SCSI数据包的数据块,从而实现存储 设备的远程访问。基于iSCSI协议的SAN结合了 NAS和传统光纤SAN的优点,利用了现有 的IP网络实现块级存储。改变了 NAS设备中操作系统(包括文件系统和存储 子系统紧耦合的关系,将操作系统和存储子系统分开,其文件系统功能部分单独 构成一个Server用以保存元数据。其存储子系统采用外置式的SAN结构由 多个智能存储设备构成一个存储池,每个存储设备有独立的IP核,支持SC

22、SI 驱动。面向数据块的访问更靠近磁盘阵列和操作系统的底层,消除了对文件操作 的延迟,确保了系统的高性能,适合于对延迟敏感的应用程序和基于事务处理的 数据库。第三节文件系统第-章绪论文件系统m是操作系统重要的组成部分,它是系统中的数据信息的管理和组 织形式。文件系统管理和组织保存在磁盘驱动器上的数据,实现了数据完整性,即 保证写入磁盘的数据和随后读出的内容的一致性。除了保存以文件方式存储的数 据以外,文件系统同样存储和管理关于文件和文件系统自身的一些重要信息。然而具体分析起来,文件系统的含义又比较模糊。首先,文件含义就有狭义 与广义之分。狭义地说,文件是指磁盘文件,进而可以是有组织有次序地存储

23、于 任何介质(包括内存)中的一组信息。广义地讲,Linux从开始时就把外部设备 都当成“文件”。从这个意义上讲,凡是可以产生或消耗信息的都是文件。以在 网络环境中中来收发报文的“套接口”机制来说,它就不代表存储着的信息但 套接口的发送端“消耗”信息,而接收端则“产出”信息,所以把套接口看成文 件是合乎逻辑的。即使抛开文件定义的模糊性不说,文件系统又进一步有几种不同的含义,要 根据上下文才能加以区分:指一种特定的文件格式。例如,我们说Linux的文件系统是Ext2, MSDOS的文件系统是FAT16,而WindowsNT的文件系统是NTFS或Fat32就 是指这个意思。指按特定格式进行了“格式化

24、”的块存储介质。上我们说“安装”或 “拆卸” 一个文件系统时指的就是这个意思。指操作系统中(通常在内核中)用来管理文件系统以及对文件进行操 作的机制及其实现。文件系统实现数据的储存、检索和操作。为了实现这一目的文件系统需要 保持一个内在的数据结构使得数据的有组织存储,并且便于访问。这一内部的数 据结构被称为元数据。就是这个元数据的结构为文件系统提供了其特定的身份和 性能特征。通常,我们并不直接和文件系统的元数据打交道。而是一个特别的文件系统 驱动程序为我们作相应的工作。文件系统驱动程序是专门用来操作复杂的元数据 的。然而,为了使得文件系统驱动程序正常工作,有一个很重要的必要条件:它 需要在某种

25、合理的、一致的和没有干扰的状态下找到元数据。否则,文件系统驱 动程序就不能理解和操作元数据,那么也就不能存取文件了。文件系统检査程序实现对元数据的扫描从而保证元数据的一致性。当操作系 统关闭时,它仔细地把所有的缓冲区数据转送到磁盘,并确保文件系统被彻底卸 载,以保证系统再次启动时能够使用。然而,意外是无法避免的,操作系统可能 没有时间彻底卸载文件系统,这就导致元数据在某种情况下会陷入困境。第一章绪论 为了弥补这种情况,文件系统检查程序将在系统启动时彻底的扫描并且全面 地检查元数据,修正这一过程中找到的任何错误。一旦文件系统检查程序完成这 样的工作,文件系统就可以使用了。尽管意想不到的电源故障或

26、者系统挂起可能 造成最近修改的数据丢失,但是由于元数据现在是一致的,文件系统就可以被装 载和投入使用了。为确保文件系统的一致性,使用文件系统检査程序全面扫描文件系统以维护 全部的元数据,是一项极为费时的工作。通常至少要花上好几分钟才能完成。更 糟糕的是,文件系统越大,完成这个彻底的扫描所花费的时间就越长。更好的解 决方式是为文件系统添加日志。曰志文件系统通过增加一个叫做日志的新的数据结构来解决系统检查问题。 这个日志是位于磁盘上的结构。在对元数据做任何改变以前,文件系统驱动程序 会向日志中写入一个条目,这个条目描述了它将要做些什么。然后,继续修改元 数据。通过这种方法,日志文件系统就拥有了近期

27、元数据被修改的历史记录,当 检查到没有彻底卸载的文件系统的一致性问题时,就可以使用这个记录维护文件 系统的一致性了。JFS文件系统JFS8)由IBM公司开发,最初出现在AIX操作系统之上,它是一种基于日志的字节级、面向事务的高性能文件系统。它具有可伸缩性和健壮性,与非日志 文件系统相比,它的优点是其快速重启能力:JFS能够在几秒或几分钟内就把文 件系统恢复到一致状态。JFS是完全64位的文件系统。所有JFS文件系统结 构化字段都是64位大小。这允许JFS同时支持大文件和大分区。2000年2月,IBM宣布在一个开放资源许可证下,移植Linux版的JFS文件 系统。JFS也是一个有大量用户安装使用

28、的企业级文件系统。使用日志文件系统,性能上会稍有损失,因为维护一个日志,系统需要写许 多数据。JFS通过把同步日志转为异步日志从而减少了性能的损耗。使用同步日 志,系统直接进行与文件系统的动作成比例的日志记录操作;而异步日志,日志 记录较少,在不影响其它文件系统操作时进行记录,从而减少了日志开销。XFS文件系统XFS8文件系统是SGI开发的高级日志文件系统,XFS极具伸缩性,非常健 壮。所幸的是SGI将其移植到了 Linux系统中,它以开放资源形式发布了他们自 己拥有的XFS的源代码,并实现了向Linux的移植。作为一个64位文件系统, XFS可以支持超大数量的文件(9gxlgb,甚至更大的1

29、8gxlgb),可在大型2d和 3d数据方面提供显著的性能。XFS主要特性包括以下几点: 第一章绪论数据完全性采用XFS文件系统,当意想不到的当机事件发生后,首先,由 于文件系统开启了日志功能,所以你磁盘上的文件不再会意外当机而遭到破坏。 不论目前文件系统上存储的文件与数据有多少,文件系统都可以根据所记录的曰 志在很短的时间内迅速恢复磁盘文件内容。可扩展性XFS被设计成可扩展的,以面对大多数的存储容量和I/O存储需 求,可处理大型文件和包含巨大数量文件的大型目录,满足快速增长的磁盘需求。 XFS有能力动态地为文件分配索引空间,使系统形成髙效支持大数量文件的能 力。在它的支持下,用户可使用lex

30、abyte (lgxlgb)大的文件,远远大于现在 最大的文件系统。优秀的I/O性能典型的现代服务器使用大型的条带式磁盘阵列,以提供达 数gb/秒的总带宽。XFS可以很好地满足I/O请求的大小和并发I/O请求的数量。第四节Linux LVM技术简介Linux LVM是一个更高的层次存储介质管理工具,在LVM的使用中,将涉 及以下相关概念:物理卷物理卷是指硬盘分区或者从逻辑上看起来和硬盘分区类似的设备(比 如RAID设备)。逻辑卷一个或者多个物理卷组成一个逻辑卷。对于LVM而言逻辑卷类似 于非LVM系统中的硬盘分区。逻辑卷可以包含一个文件系统(比如/home或者 /usr)o卷组一个或者多个逻辑

31、卷组成一个卷组。对于LVM而言,卷组类似于非 LVM系统中的物理硬盘。卷组把多个逻辑卷组合在一起,形成一个可管理的单LVM的具体工作原理是,将每一个物理卷分成几个基本单元,即所谓的 PE(Pliysical Extents)。PE的大小是可变的,但是必须和其所属卷组的物理卷相同。 PE是一个物理存储里可以被LVM寻址的最小单元。每一个逻辑卷也被分成一些可被寻址的基本单位,即所谓的LE(Logical Extents在同一个卷组中,LE的大小和PE是相同的,LE的大小对于一个卷组 中的所有逻辑卷来说都是相同的。在一个物理卷中,每一个PE都有一个惟一的编号,但是对于逻辑卷这并不 一定是必需的。这是

32、因为当这些PE ID号不能使用时,逻辑卷可以由一些物理卷 组成。因此,LE ID号是用于识别LE以及与之相关的特定PE的。正如前面所 提到的,LE和PE之间是一一对应的。每一次存储区域被寻址访问或者LE的ID 被使用,都会把数据写在物理存储设备之上。类似的在非LVM系统中,有关分区的数据是存储在分区表中,而分区表被 存储在了每一个物理卷的起始位置,有关逻辑卷和逻辑卷组的所有元数据都存到 在VGDA(卷组描述符区域)中,其功能就好象是LVM的分区表,它存储在每一 个物理卷的起始处。第五节本文的结构安排本文第一章为引言,介绍了数据容灾、网络存储、文件系统、及LVM相关 的的基本概念。第二章主要涉及

33、网络存储技术,详细介绍了他们的特点、原理以及应用。 第三章详细介绍了 JFS和XFS文件系统的技术细节。 第四章讲述如何实现操作系统的远程备份恢复。第五章给出了搭建iSCSI服务器的方法和实现过程,从而实现操作系统远程 备份恢复的镜像数据传输。第六章给出了搭建跨域工作NAS服务器的方法和实现过程,为终端操作系 统备份镜像数据提供网络存储空间。第七章给出了 JFS/XFS文件系统的备份恢复的设计与实现。 第八章给出了非正常态JFS/XFS文件系统备份恢复的策略及实现。 第九章总结了系统设计的思路及部分模块设计心得。第二章网络存储技术 第二章网络存储技术网络存储沿着两条主要技术的发展方向前进:SA

34、N和NAS。 本章首先从起源,技术及应用等方面介绍NAS;其后将会详细讲解SAN技 术,包括它的拓扑结构、特点和应用。最后介绍iSCSI技术的基础原理和iSCSI 协议及体系结构。第一节NAS技术简介NAS的起源随着人们对存取其他机器上文件需求的产生,文件服务器概念应运而生。文 件服务器一般都要比桌面系统拥有更大的存储容量,并具有其他一些功能,如磁 盘镜像、双电源、多个网络接口卡。到后来,文件服务器逐渐进化到带有RAID 存储子系统和其他一些高可用特性的高性能系统。1985年,SUN公司发明了 NFS,用于UNIX桌面系统与UNIX服务器之间 的连接,以及在它们之间存取文件。同时,人们多次努力

35、在PC网络世界中也实 现同样的功能。IBM、3COM、微软和其他一些厂商开发出了网络操作系统设备。 在这些业界巨人的竞争中,Novell公司凭借其设备NetWare,成功推进了 PC领 域内网络服务的概念。很长一段时间里,Novell NetWare成为最主要的网络操作 系统(NOS),在主要包含PC的网络市场中非常流行。NOS解决方案需要消耗大量的管理资源,而且它的集成和安装工作相当复 杂,安装和管理上更加方便的NAS系统,在这种需求驱动下悄然出现。NAS的特点大多数NAS都具有三个基本的特点: (1)特殊的操作系统NAS最显著的特点之一是采用可提供存储功能的特殊操作系统或应用系统。 这些特

36、殊的操作系统去掉了一些与文件服务无关的功能,而将主要功能集中在文 件管理与操作。优化后的操作系统使内核更好地支持对存储器的读写,更充分地 利用诸如内存、CPU、总线周期和网络带宽等硬件资源,具有较大的数据吞吐量; 图2.1显示了专用操作系统和通用操作系统的区别。不过,NAS设备并不一定要 建立在这种特殊的操作系统之上。第二章网络存储技术(2)即插即用的网络集成NAS的另一个特性是可以快速地安装到一个网络上,而无需客户系统进行太 多的配置工作。一般的想法是在移动设备时,无需在客户系统上安装和配置新的 软件,也可以使用该设备。例如,对于Windows客户系统来说,通过使用Windows 系统的网络

37、邻居功能,可以定位和使用移动后的专用设备,就好像使用本地设备 一样。(3)NAS装置的可伸缩性NAS装置的一个主要特性是在几乎不影响客户系统的情况下,插入到网络 中。由于具备这种特性,因此NAS装置的功能易于扩展或伸缩。当设备增加容 量时,客户可以立即使用所增加的容量,这种特性为客户实现了无缝的存储伸缩 性。虽然不同设备的存储容量不能合并成单个存储池或使用单一的逻辑视图,但 至少可以在不中止现有的操作下添加额外的存储容量。(4客户端的灵活性采用NAS的另一个优点是它能适用于多种平台。因为NAS装置具有自己的 操作系统和通信功能,所以只需通过标准的协议接口和网络中其他的节点互联, 而无需弄清各个

38、客户和服务器系统内部的实现细节。NAS 般会支持Windows 系统和UNIX最常用的一些版本,以及苹果公司的Macintosh系统,但是MVS、 VAX. AS/400和OS/2系统通常不是NAS装置幵发商的目标,它们更适宜于与 NOS产品集成。NAS技术的应用NAS的应用领域比较广泛,这里主要介绍以下几个方面: (1)大型企业级的存储应用大型的NAS文件服务器能在高容量、高流量的环境下支持几百个用户,可 以满足大型企业级对存储的需求。这样的系统通常都设有专门的硬件和软件,以 支持大量的用户和流量;通过采用RAID技术、特殊文件系统、协议处理和完备 的冗余硬件设计,能支持多达TB数量级的存储

39、容量。NAS装置也可以集成光纤 路径SAN技术,以连接它们内部的磁盘子系统。通过一个或多个网络接口进行 以太网连接,NAS也可以支持FDDI、ATM和千兆以太网,如图2.1所示。第二章网络存储技术 图2.1企业级应用部门级的存储应用部门级或者中小企业的NAS存储设备,是一种比大型企业级存储设备规模 稍小的NAS产品。这些部门级的存储设备,虽然没有大型企业级NAS装置那样 的处理能力和容量,但是它们相对来说花费少,并且也具有相似的管理软件和集 成能力。它们的存储容量一般在50250GB范围内,并通常釆用SCSI总线连接 的磁盘子系统。这类系统通常带有1或2个10Mb或100Mb带宽的以太网接口。

40、SoHo类文件存储应用有一类NAS是体积非常小的SoHo类存储服务器。这种服务器的容量通常在 10240GB范围内,一般基于Linux或BSD UNIX系统,采用Intel处理器。基 于成本问题的考虑,这种文件服务器通常使用1或2个的SCSI或IDE独立磁盘, 它们可以做成镜像使用,但通常不做成RAID。另外,这种产品一般只提供一个 10/100Mb的以太网接口。NAS数据库类应用到目前为止,已经有一些NAS服务器被尝试能用来作为专门的数据库服务 器,但并没有取得人们预想的成功。尽管如此,人们还是期待NAS数据库产品 能作为数据库技术的接口,成功推向市场。正如文件服务NAS产品需要提供与 文件

41、访问协议的集成,数据库NAS产品也要求具备与数据库访问协议的集成能 力。Oracle和其他数据库厂商已公开表明了他们的计划,准备向这种NAS数据 库设备提供相关的软件甚至硬件支持。(6)备份类应用设计用来专门用于网络备份的NAS产品,但到目前为止都还没有取得很大 的成功。通常,这类产品设计用于备份网络操作系统及其连接的客户。不过,这 种网络备份设备还不足以用来保护高容量的服务器,通常高容量的服务器还需要 通过直接相连的磁带驱动器及时完成备份工作。也许,将来通过在一个设备上集 成NAS和SAN功能、支持以太网和I/O路径连接后,服务器备份设备能取得更第二章网络存储技术多的成功。NAS文件服务器设

42、备,被认为是用于备份桌面工作站和便携机的一 种方案。通常,桌面系统的备份对于许多机构来说是一个难题,它并不容易通过 服务器备份产品来解决。主要的困难在于,当运行服务器备份进程时,工作站和 便携机通常不能用于备份工作。另外,性能要求也是一个难点。采用NAS备份 桌面和便携机系统的基本思想,是当用户登录网络时,从用户系统到NAS装置 的磁盘信息同步。这种方法,类似于用来在桌面和便携机系统之间同步数据的磁 盘同步产品。总之,NAS设备有很大的伸缩性,大到企业级应用,小到家庭应用都可以看 到NAS的身影。NAS本身所具有的灵活、简单、性价比高的特性也使其在中小 型企业的应用中更加广泛。第二节SAN技术

43、简介SAN技术打破了传统的存储设备和计算机之间的联系方式。它将存储设备从 网络分离出来,使它成为计算机网络的对等体。换而言之,SAN技术将存储设 备重新组合为网络的组成部分,而不是将它们视为特定的集成系统中的一部分, 并根据数据存储和访问的要求对它们进行管理和规划。SAN技术借用了许多现 有的网络拓扑结构,并将其应用到数据存储中。SAN的拓扑结构点到点SAN最简单的SAN连接2个节点,使用一种被称为点到点的拓扑结构。这和一 个通过交叉线缆建造的2节点以太网很相似。除了点对点的SAN不是连接两个 系统,而是一个系统和它的存储器。图4.1说明了一个简单的点对点SAN,连接 距离最长能超过10000

44、米;其他的技术如SCSI和ATA也可以同样将一个设备连 到总线上来实现点对点的拓扑结构,但连接距离要远远小于SAN。图2.2点到点SAN第二章网络存储技术 交换式SAN:主机吵 图2.4环状SAN交换式SAN是釆用网络交换机构建的一种存储网络,这种网络交换机类似 于数据网络中所使用的交换机。交换式SAN在建立点对点通信方面,类似于点 对点网络。不同之处在于,它所建立的点对点连接并不是永久性的,可同时并发 很多点对点的虚连接。图2.3说明如何使用交换机建立SAN。asf-sse图2.3交换式SAN环状SAN环状SAN提供了在一个逻 辑环状网络上对公用管道的共 享类似于令牌环和FDDI。在 一个环

45、状SAN中使用的网络设 备被称为集线器,在有相同端口 数的情况下,它比交换机便宜许 多。环状SAN也可以级联,但 它不是通过多层交换层级联,而 是通过增加环的逻辑圆周尺寸 来级联环。图2.4是一个环状 SAN。SAN的特点SAN技术有如下的特点。 容量易扩展SAN没有提高单个磁盘驱动器的容量。它们也没有增加主机系统中支持的主 机I/O控制器的数量。然而,它们能显著地提髙连接到每个主机I/O控制器的设备数。它们还提供了通过将网络交换机和集线器级联来扩展容量的方法。能被连 接到一个SAN上的设备数目取决于所使用的技术。以光纤路径的使用为例,光 纤路径环网能支持多达126和设备,而具有交换功能的网络

46、在结构上没有寻找的 限制。由专门以太网改造而来的SAN也具有虚拟的无限寻址的能力。因此,对 于SAN而言,主机I/O控制器不再具有最大连接15个设备的限制,相反的,每 个控制器可以连接上百个甚至上千个设备。性能易扩展除了提供lOOMB/s的网络传输速率,SAN还可以为数据存取提供更好的可 扩展性。对于交换SAN,它使用一个私有的虚拟网络,在网络上,每个设备或子系统 有它们自己的路径。因此,在设备防火墙或I/O控制器的设备驱动器中没有必要 进行仲裁。设备访问的网络拥塞处理也转而由高速交换产品来完成。尽管使用多 个设备通过一个交换机进行连接的方式肯定会带来使用性能的下降,但和使用总 线仲裁技术带来

47、的性能下降相比是微乎其微的。而最终的结果是被安装的存储器 容量越大,其访问速度越快。对于环状SAN。它们对所有的节点是平等的,性能扩展要比SCSI总线能提 供的好得多。但和交换网比则还略逊一筹。但光纤路径环路由器的价格比光纤路 径交换机便宜得多。距离易扩展SAN能以高速在很长的距离上运作。而串行传输技术,如光纤路径,能比 并行传输技术(如S C S I)在更长的距离上进行数据传输。不仅仅是线缆更长 了,而且也更容易在一个大的面积范围中进行桥接。光纤路径技术在单模光纤中 不使用重发器,可以支持长达10公里的数据传输,价格便宜些的多模光纤技术 支持大约5 0 0米的传输距离。即使是使用铜芯的光纤路

48、径,它的3 0米的距离 限制也是SCSI的距离的两倍多。易升级SAN允许存储系统和设备在不中断服务器工作的情况下连接到已有的存储 网络。这是SAN存储技术的关键优势。设备和子系统能在SAN中存在,而不 属于任何一个特定的服务器系统,且允许存储升级的很大一部分工作在不中断现 存工作服务器的情况下被完成。替换存储子系统可以在被升级的设备和子系统间 断工作的同时完成测试。这样,新的子系统可以在对工作服务器影响很小,甚至 没有影响的条件下,用很短的时间甚至不用关闭系统就能完成升级过程。SAN的应用 备份SAN备份是第一个大的应用。SAN备份是一种基础应用,它将伴随着SAN 技术的发展产生根本的变化。备

49、份的解决方案会影响系统集成的其他方面,如支 持更大服务器系统的能力。存储池传统的存储系统面临的一个主要问题在于,它不能访问未使用的或空白的存 储资源。这些存储资源从网络中的其他服务器连接到一个服务器上。这导致了在 对容量和性能的要求做出改变时,改变存储结构要经历很长的时间。而SAN允 许所有的服务器能轻松访问其中的存储设备,从而解决了这些困难。这样,任何 空闲存储器都能被需要它的服务器访问。这种存储器可以随时根据指令使用,或 者固定地进行分配。这种将存储资源集中到一个存储池,从而被当作一个单一的多功能集合的能 力,被称为SAN的一个重要的基础应用。存储池将收集可用的存储空间,然后 将它们打包成

50、虚拟驱动器。数据共享上面描述的存储池允许服务器访问相同存储子系统中不同的存储资源,但它 不允许服务器共享相同的实际物理磁盘或虚拟磁盘上的相同文件或记录。如果能 够维护数据单个拷贝而不是同时保留若干个不同版本,则不仅可以防止当数据频 繁地在系统之间拷贝时不可避免发生的错误,而且,如果数据形成后不用再次迁 移,那么在复制数据传输时消耗的带宽也可以避免。数据共享是非常有用的系统基本应用。在诸如ERP分布式应用系统、互联网、 电子商务系统等应用中,常常会发生改变,应用模块需要从一个系统迁移到另一 个系统,此时总线连接的系统要求这些模块使用的数据也相应地进行迁移,从而 很大程度上增加了系统的复杂性。SA

51、N环境中的数据共享可以通过允许应用模 块在服务器之间的迁移,而不移动相关的数据来消除这些困难。I/O寻径I/O寻径指决定和管理系统和存储器之间的V0数据传输选用路径的能力。 改变I/O数据传输的路径或连接将极大地提髙系统管理和存储管理的效率。第二章网络存储技术SAN的一个主要特征在于,它能提供系统到设备的灵活连接。当这种自由被 视为一种主要的优势时,就需要对它进行正确的管理以避免出现问题。这就是I/O 寻径的由来。I/O寻径提供了一种通过SAN系统地将系统连接到存储器,以及当 发生变化时能有效进行响应的方法。I/O寻径都是使SAN正常工作的重要组成部数据迁移最后一个要讨论的SAN应用领域是数据

52、移动器。它的想法很简单,即一个 SAN实体直接将数据由一个设备子系统移动到另外一个子系统。系统管理功能、 文件传输、软件分发和数据复制等,会使用数据移动技术。数据移动器的主要优 点在于它的速度。通过使用直接的设备到设备传输,数据迁移能绕过会带来延迟 和阻塞的许多I/O路径部分。更重要的是,数据移动器将主机服务器从直接管理 数据传输中解放出来。数据移动器可以在几乎所有的I/O寻径组件中实现。这些 组件可以作为SAN中的发起者来启动它们的操作。可能实现的数据移动器包括 以下儿个部分:存储桥和路由器。 存储磁盘和磁带子系统。 SAN交换机和集线器。 主机I/O控制器和设备驱动器。 基于主机的卷管理器

53、。数据移动器的一个主要问题在于决定将哪些数据在存储设备间移动。所有设 备上和数据位置信息相关的智能,是由服务器的文件系统高速缓存或服务器上运 行的存储管理来实现。第三节iSCSI技术简介iSCSI协议把SCSI和TCP/IP网络结合起来,拓展了 SCSI的使用,使得存 储服务器可以通过IP网络同存储设备交换块数据;而且,面向数据块的访问更 靠近磁盘阵列和操作系统的底层,消除了对文件操作的延迟,在提高系统性能的 同时为远程备份恢复系统读取和写入本地数据提供了方便。iSCSI协议概述2003 年 2 月 11 日,IETF (Internet Engineering Task Force,互联网工

54、程任务 组)通过了 iSCSI (Internet SCSI)标准,这项由IBM、Cisco共同发起的技术标 准,经过三年20个版本的不断完善,终于得到IETF认可。iSCSI技术最重要的 贡献在于其对传统技术的继承和发展上:其一,SCSI (Small Computer Systems Interface,小型计算机系统接口)技术是被磁盘、磁带等设备广泛采用的存储标第二章网络存储技术 准,从1986年诞生起到现在仍然保持着良好的发展势头:其二,沿用TCP/IP 协议,TCP/IP在网络方面是最通用、最成熟的协议,且IP网络的基础建设非常 完善。这两点为iSCSI的无限扩展提供了坚实的基础。i

55、SCSI协议定义了在TCP/IP网络发送、接收block (数据块)级的存储数据 的规则和方法。发送端将SCSI命令和数据封装到TCP/IP包中再通过网络转发, 接收端收到TCP/IP包之后,将其还原为SCSI命令和数据并执行完成之后将 返回的SCSI命令和数据再封装到TCP/IP包中再传送回发送端。而整个过程在 用户看来,使用远端的存储设备就象访问本地的SCSI设备一样简单。支持iSCSI 技术的服务器和存储设备能够直接连接到现有的IP交换机和路由器上,因此 iSCSI技术具有易于安装、成本低廉、不受地理限制、良好的互操作性、管理方 便等优势。2,3.2 iSCSI协议模型iSCSI层对SC

56、SI层的命令和数据进行了封装,使其能通过TCP/IP协议在网 络中传输。iSCSI实现了 SCSI到TCP/IP的映射。当Initiator将SCSI命令和数据 封装到iSCSi协议包后,将向下提交到TCP层,最后封装成IP包在IP网络上传 输到达Target后通过解封装还原成SCSI指令和数据,再由驱动程序发送到指定 的驱动器,从而实现SCSI命令和数据在IP网络上的传输。iSCSI PDU 格式iSCSI PDU(Protocol Data Unit,协议数据单元)由4部分构成:BHS(Basic Header Segment,基本头部),长度 48 字节。AHS(Additional H

57、eader Segment,附加头部),包含一些附加信息,可选。Header-Digest,头部数据校验码。Data Segment,数据段,包含要传输的数据,可选。 BHS包括的字段有:Opcode作码。Total AHS LengthAHS的长度,如果AHS不存在,该项值为0。LUNLUN 号。Initiator Task TagInitiator用来区别不同iSCSI任务的唯一标识符。 会话管理iSCSI Initiator和Target通过建立TCP连接进行通信和数据传输,特定的 Initiator和Target之间的所有TCP连接组成了一个会话(session)iSCSI的会话由 一

58、个二元组#识,类似于SCSI协议中的I-T-Nexus(I-T-联结)。iSCSI会话分为登录阶段(Login Phase)和全工阶段(Full Feature Phase)。 iSCSI会话起始于登录阶段,登录阶段主要的工作包括:建立TCP连接,认 证,协商会话的参数,标识TCP连接所属会话等。最初,Target端程序会监听某个TCP端口等待请求,当Initiator连接到该端 口后,登录进程便开启了。会话的建立时需要进行认证,认证过程会受到会话协 商参数的影响。登录阶段的具体过程其实是一系列登录请求和及其响应。当认 证通过后,会话便进入全工阶段,这时便可以传输SCSI命令了。编号和排序iS

59、CSI对命令和状态进行编号,对数据进行排序。iSCSI协议规定SCSI命令在会话过程中被顺序传输,因此需要对这些命令进 行编号,iSCSI PDU 中使用 CmdSN(Command Sequence Number,命令顺序字) 储存这些序号,CmdSN字段长度为4个字节。命令顺序是建立在会话的基础上 的,被分配的CmdSN在会话范围内是统一的。Initiator和Target通过在会话中 都维护三个变量来实现命令的顺序传输。命名与寻址iSCSI的Initiator和Target使用IP地址作为网络实体的标识,iSCSI节点名 作为iSCSI节点的标识。典型的iSCSI地址包含了 IP地址或域

60、名、端口号以及iSCSI设备名称,其格 式如下:iSCSI:/:/错误处理(1)格式错误格式错误分为两种:PDU头中的内容非法和PDU内容不一致。当Initiator 或Target收到格式错误的PDU后,需要马上中止会话的所有连接。 摘要错误当Initiator和Target收到有头摘要错误的PDU时,需要丢弃该包以及前一个 包包头后的所有数据或者关闭该连接,因为摘要错误意味着头的长度域被损坏序列错误Initiator或Target收到的PDU中存在乱序的R2TSN/DataSN,说明发生了摘 要错误。如果是状态SN乱序,Initiator收到双份R2T/DataSN,则需要丢弃副本。协议错

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论