




已阅读5页,还剩23页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
RAID系统基础知识1.1 SCSI基础知识在配置磁盘阵列系统之前,你必须了解一些SCSI的基础知识。l SCSI IDSCSI ID是安排给一个SCSI设备的唯一的编号,这使这些设备在通过SCSI总线连接到主机后,能够很好的与主机之间交换信息。每个SCSI设备和SCSI卡必须有一个SCSI ID号(Fast SCSI-2 = 0 7,Ultra Wide/Ultra2 SCSI = 0 15)。一个ID号将唯一的定义在同一SCSI总线.上的一个设备,不能有多个设备使用同一ID号。如果一台主机有两条SCSI总线,则不同SCSI总线上的设备可以有相同SCSI ID号。注意:SCSI ID与设备到主机的连接顺序无关。l Terminator(终结器)基于SCSI的定义,SCSI总线必须在两端终结。这就是说,连接在SCSI总线最末端的设备必须使其终结器有效。连接在SCSI总线中间的设备必须使其终结器失效。其实,终结是为了使数据信号能不失真的在SCSI总线上传输。一些SCSI设备要手工加上或去掉终结器,而另一些设备内建有终结器,通过开关或软件命令使终结器有效或失效。1.2 Why disk arrayl 我们需要磁盘阵列在过去的七年间,PC机速度提高了50多倍,这种进步导致现在已能制造出功能非常强大的PC机,它们能执行那些以前被认为只有在大得多并且贵得多的机器上才能完成的任务.但是,存储数据的设备(指硬磁盘)的处理速度未能跟上来。图1说明了两者的巨大差异。虽然磁盘驱动器的性能就其价格容量比来说大大改善了,它的实际速度却只提高了3-4倍。因此,九十年代末最强大的计算将是那些磁盘系统性能优化的机器,如果磁盘系统的性能得到像计算机处理系统性能那样的改善,我们就有了真正的超级微型计算机.图1 CPU和磁盘的速度对比目前已经研制了新的技术来缩小日益增大的计算机主机和磁盘驱动之间的性能差距,这就是现在正在被人们逐渐认识的磁盘阵列技术。磁盘阵列技术可以详细地划分为若干个级别0 - 5 RAID技术。RAID是廉价冗余磁盘阵列(Redundant Array of Inexpensive Disk)的简称。某些级别的RAID技术可以把速度提高到单个磁盘驱动器的400% 。磁盘阵列把多个磁盘驱动器连接在一起协同工作,大大提高了速度,同时把磁盘系统的可靠性提高到接近无错的境界。这些“容错”系统速度极快,同时可靠性极高。28这本小册子将讨论这些新技术,以及不同级别RAID的优缺点。我们并不想涉及那些关键性的技术细节问题,而是将磁盘阵列和RAID技术介绍给对它们尚不熟悉的人们。相信这将帮助你选用合适的RAID技术。l RAID级别的定义 下表提供了RAID的简单定义,本书其后部分将对各级RAID进行更详尽的描述。RAID级别描述速度*容错性能至少要硬盘优点缺点可用空间RAID 0磁盘分段处理(条带化)磁盘并行输入/出(提供最佳读写性能)无(没有冗余)至少两块最大的可用空间,数据的分段处理带来性能提升没有冗余N * CRAID 1磁盘镜像没有提高有(允许单个磁盘错)只限于两块良好的读取性能冗余开销大(N/2)* CRAID 1E增强型RAID 1三块比RAID 1 有更多容量阵列冗余开销大(N/2)* CRAID 2磁盘分段加汉明码纠错没有提高有(允许单个磁盘错)RAID 3磁盘分段加专用奇偶校验盘磁盘并行输入/出有(允许单个磁盘错)(N-1)* CRAID 4磁盘分段加专用奇偶校验盘需异步磁盘磁盘并行输入/出有(允许单个磁盘错)三RAID 5磁盘分段加不对称奇偶校验分布在各磁盘磁盘并行输入/出比RAID 0稍慢有(允许单个磁盘错)三对空间利用率高与RAID1相比,较低的读写性能(N-1)* CRAID 5E增强型RAID 5四RAID 5EE类似RAID 5E,四更快的重新建构速度RAID6类似RAID5,但有两组奇偶校验信息有(允许两个磁盘错)四个,最多支持16个100%的数据保护比RAID5的性能差RAIDTP备注1:N代表驱动器总数目;C代表capacity,单个驱动器容量。 RAID 0:又称Striping阵列,做RAID 0需要两上或两个以上的、容量相同的硬盘,N个硬盘做成RAID0后的硬盘容量为单个硬盘的N倍。在做数据存储时将数据分割存储到多块硬盘上,磁盘读写时负载平均分配到多块硬盘,由于多块硬盘均可同时读写,所以速度显著提升。也正是由于数据被分割存储到多块硬盘,所以数据的完整性依赖于多块硬盘数据均完好无损,一旦其中一块硬盘的数据损坏或磁盘故障,那么所有的数据都将丢失。所以RAID0数据存取性能好、速度快,但可靠性差,RAID 0通常用于对磁盘性能要求高但对数据安全性要求不高的场合。 RAID 1:又称Mirror阵列,做RAID 1需要两个容量相同的硬盘,两个硬盘做成RAID1后的硬盘容量为单个硬盘容量。在做数据存储时将同样的数据写入两块硬盘,两块硬盘互为镜像盘,当一块硬盘中的数据受损或磁盘故障时,另一块硬盘可继续工作,并可在需要时重建RAID1阵列。但RAID 1不能提升磁盘性能,RAID 1适合对数据可靠性要求严格的场合。 RAID 2:带海明码校验磁盘阵列,RAID2是为大型机和超级计算机开发的。磁盘驱动器组中的第一个、第二个、第四个.第2的n次幂个磁盘驱动器是专门的校验盘,用于校验和纠错,例如七个磁盘驱动器的RAID2,第一、二、四个磁盘驱动器是纠错盘,其余的用于存放数据。使用的磁盘驱动器越多,校验盘在其中占的百分比越少。RAID2对大数据量的输入输出有很高的性能,但少量数据的输入输出时性能不好。由于海明码的特点,它可以在数据发生错误的情况下将错误校正,以保证输出的正确。它的数据传送速率相当高,如果希望达到比较理想的速度,那最好提高保存校验码的硬盘性能,对于控制器的设计来说,它又比RAID3、4、5要简单。但是利用海明码校验必须要付出数据冗余的代价。 RAID 3:做RAID 3至少需要三块硬盘,N个硬盘做成RAID 3后的硬盘容量为单个硬盘的N-1倍。RAID 3是将数据先做XOR 运算,产生Parity Data后,再将数据和Parity Data以并行存取模式写入成员磁盘驱动器中,进一步来说,RAID3每一笔数据传输,都更新整个Stripe即每一个成员磁盘驱动器相对位置的数据都一起更新,因此不会发生需要把部分磁盘驱动器现有的数据读出来,与新数据作XOR运算,再写入的情况发生。因此,在所有RAID级别中,RAID3的写入性能是最好的。RAID 3的Parity Data一般都是存放在一个专属的Parity Disk,但是由于每笔数据都更新整个Stripe,因此,RAID3的Parity Disk并不会如RAID 4的Parity Disk,会造成存取的瓶颈。RAID 3需要RAID控制器特别功能的支持,RAID3以其优越的写入性能,特别适合用在大型、连续性档案写入为主的应用。 RAID 4:带奇偶校验码的独立磁盘结构,做RAID 4至少需要三块硬盘,RAID 4和RAID 3很相似,不同的是RAID4对数据的访问是按数据块进行的,也就是按磁盘进行的,每次是一个盘。RAID 3是一次一横条,而RAID 4一次一竖条。所以RAID3常须访问阵列中所有的硬盘驱动器,而RAID4只须访问有用的硬盘驱动器。这样读数据的速度大大提高了,但在写数据方面,需将从数据硬盘驱动器和校验硬盘驱动器中恢复出的旧数据与新数据通过异或运算,然后再将更新后的数据和检验位写入硬盘驱动器,所以处理时间较RAID3长。 RAID 5:类似于RAID 0,做RAID 5至少需要三块硬盘,N个硬盘(N2)做成RAID5后的硬盘容量为单个硬盘的N-1倍,在做数据存储时将数据的每个字节按bit拆分到硬盘,在数据出错时可以按奇偶校验码重建数据,容错能力强于RAID0,但它需要一块硬盘来容纳额外的奇偶校验信息。RAID 5的Parity Data分散写入到各个成员磁盘驱动器,脱离如RAID 4单一专属Parity Disk的写入瓶颈。但是,RAID 5在做数据写入时,仍然稍微受到读、改、写过程的拖累。当RAID5的成员磁盘驱动器数目越多,其性能也就越高,但是反过来说,成员磁盘驱动器越多,RAID5中可能有磁盘驱动器故障的机率就越高,整个阵列的可靠度就会降低。基本上来说,多人多任务的环境,存取频繁,数据量不是很大的应用,都适合选用RAID 5架构。 RAID6:带有两种分布存储的奇偶校验码的独立磁盘结构,几乎没有进行商用。它使用一种分配在不同的驱动器上的第二种奇偶方案,扩展了RAID5。它能承受多个驱动器同时出现故障,但是,性能尤其是写操作却很差,而且,系统需要一个极为复杂的控制器。当然由于引入了第二种奇偶校验值,所以需要N+2个磁盘,同时对控制器的设计变得十分复杂,用于计算奇偶校验值和验证数据正确性所花费的时间比较多,造成了不必须的负载。突出价值点:IBM磁盘存储DS4200,DS4700,DS5100和DS5300支持RAID 6 p+q方式,RAID 6可提供最出色的容错能力,允许任意两块硬盘发生故障,而不会影响数据的完整性。 RAID 6使用相当于两块硬盘的容量进行奇偶保护,并将奇偶信息存放在所有硬盘上。 RAID 6至少由4块硬盘组成,n-2块硬盘用于奇偶保护。磁盘阵列使用RAID 6保护机制,可以有效降低因为磁盘损坏而造成的数据丢失的机率,从而保护用户数据可靠性,提高用户数据存储环境的安全性。 RAID 7:磁盘阵列新标准RAID 7。其实,RAID 7不仅仅是一种技术,还是一种存储计算机(Storage Computer)。因为它与RAID0、1、5标准有明显区别,RAID 7自身带有智能化实时操作系统和用于存储管理的软件工具,可完全独立于主机运行,不占用主机CPU资源。RAID7不仅具有更高的性能和卓越的存储管理能力,而且集普通RAID标准的所有优点于一身,因而RAID 7系统整体性能极佳。RAID7存储计算机操作系统(Storage Computer Operating System)是一套实时事件驱动操作系统,主要用来进行系统初始化和安排RAID7磁盘阵列的所有数据传输,并把它们转换到相应的物理存储驱动器上。通过自身系统中的阵列电脑板来设定和控制读写速度,存储计算机操作系统可使主机I/O传递性能达到最佳。如果一个磁盘出现故障,还可自动执行恢复操作,并可管理备份磁盘的重建过程。RAID7突破了以往RAID标准的技术架构,采用了非同步访问,极大地减轻了数据写瓶颈,提高了I/O速度。所谓非同步访问,即RAID7的每个I/O接口都有一条专用的高速通道,作为数据或控制信息的流通路径,因此可独立地控制自身系统中每个磁盘的数据存取。如果RAID7有N个磁盘,那么除去一个校验盘(用作冗余计算)外,可同时处理N1个主机系统随机发出的读/写指令,从而显著地改善了I/O应用。RAID7系统内置实时操作系统还可自动对主机发送过来的读/写指令进行优化处理,以智能化方式将可能被读取的数据预先读入快速缓存中,从而大大减少了磁头的转动次数,提高了I/O速度。RAID7可帮助用户有效地管理日益庞大的数据存储系统,并使系统的运行效率提高至少一倍以上,满足了各类用户的不同需求。 RAID 10:即RAID 0+1,它综合了RAID 0和RAID 1的优点,适合用在速度需求高、又要完全容错的应用。做RAID10至少需要4块硬盘,并且是偶数个,N个硬盘做成RAID 10后的容量为单个硬盘的N/2倍。RAID 0和RAID1的原理很简单,合起来之后还是很简单,但RAID 0+1到底应该是RAID 0 over RAID 1,还是RAID 1 over RAID 0?综合分析,RAID 0 over RAID 1要比RAID 1 over RAID 0更具有较高的可靠度。所以建议,当采用RAID 10架构时,应先作RAID1,再把数个RAID 1做成RAID 0。 其它模式:RAID 30、RAID 50与RAID10模式相似。还有RAID5增强型,即有一只硬盘正常情况处于准备状态,一旦某只硬盘故障,它自动替补上去,完成原有的RAID5功能。 RAID条切striped的存取模式 在使用数据条切(Data Stripping)的RAID系统之中,对成员磁盘驱动器的存取方式,可分为两种:并行存取Paralleled Access、独立存取Independent Access。RAID 2和RAID 3 是采取并行存取模式。RAID 0、RAID 4、RAID 5及RAID 6则是采用独立存取模式。l 磁盘数据跨盘(Spanning)数据跨盘技术使多个磁盘像一个磁盘那样工作,这使用户通过组合已有的资源或增加一些资源来廉价地突破现有的磁盘空间限制。图2磁盘数据跨盘图2所示为4个300兆字节的磁盘驱动器连结在一起,构成一个SCSI系统。用户只看到一个有1200兆字节的C盘,而不是看到C,D,E,F,4个300兆字节的磁盘。在这样的环境中,系统管理员不必担心某个磁盘上会发生磁盘安全检空间不够的情况。因为现在1200兆字节的容量全在一个卷(VOLUME)上(例如磁盘C上)。系统管理员可以安全地建立所需要的任何层次的文件系统,而不需要在多个单独磁盘环境的限制下,计划他的文件系统。磁盘数据跨盘本身并不是RAID,它不能改善磁盘的可靠性和速度。但是它有这样的好处,即多个小型廉价磁盘可以根据需要增加到磁盘子系统上。l 磁盘分段(Disk Striping ,RAID 0)磁盘分段的方法把数据写到多个磁盘,而不是只写到一个盘上,这也叫作RAID 0,在磁盘阵列子系统中,数据按系统规定的“段”(Segment)为单位依次写入多个磁盘,例如数据段1写入磁盘0,段2写入磁盘1,段3写入磁盘2等等。当数据写完最后一个磁盘时,它就重新从盘0的下一可用段开始写入,写数据的全过程按此重复直至数据写完。段由块组成,而块又由字节组成。因此,当段的大小为4个块,而块又由256个字节组成时,依字节大小计算,段的大小等于1024个字节。第11024字节写入盘0,第10252048安节写盘1等。假如我们的磁盘子系统有5个磁盘,我们要写20,000个字节,则数据将如图3那样存储。图3磁盘分段总之,由于磁盘分段的方法,是把数据立即写入(读出)多个磁盘,因此它的速度比较快。实际上,数据的传输是顺序的,但多个读(或写)操作则可以相互重叠进行。这就是说,正当段1在写入驱动器0时,段2写入驱动器1的操作也开始了;而当段2尚在写盘驱动器1时,段3数据已送驱动器2;如此类推,在同一时刻有几个盘(即使不是所有的盘)在同时写数据。因为数据送入盘驱动器的速度要远大于写入物理盘的速度。因此只要根据这个特点编制出控制软件,就能实现上述数据同时写盘的操作。遗憾的是RAID 0不是提供冗余的数据,这是非常危险的。因为必须保证整个磁盘子系统都正常工作,计算机才能正常工作,例如,假使一个文件的段1(在驱动器0),段2(在驱动器1),段3(在驱动器2),则只要驱动器0,1,2中有一个产生故障,就会引起问题;如果驱动器1故障,则我们只能从驱动器物理地取得段1和段3的数据。幸运的是可以找到一个解决办法,这就是磁盘分段和数据冗余。下面一小节将讨论这个问题。l 磁盘镜像(RAID 1)磁盘镜像(RAID 1)是容错磁盘阵列技术最传统的一种形式,在工业界中相对地最被了解,它最重要的优点是百分之百的数据冗余。RAID 0通过简单地将一个盘上的所有数据拷贝到第二个盘上(或等价的存储设备上)来实现数据冗余,这种方法虽然简单且实现起来相对较容易,但它的缺点是要比单个无冗余磁盘贵一倍,因为必须购买另一个磁盘用作第一个磁盘的镜像。磁盘镜像最简单的形式,是通过把二个磁盘连结在一个控制器上来实现的。图4说明了磁盘镜像。数据写在某一磁盘上时,它同时被写在相应的镜像盘上。当一个盘驱动器发生故障,计算机系统仍能正常工作,因为它可以在剩下的那块好盘上操作数据。图4磁盘镜像因为二个盘互为镜像,哪个盘出故障都无关紧要,二是盘在任何时间都包含相同的数据,任何一个都可以当作工作盘。在磁盘镜像这个简单的RAID方式中,仍能采用一些优化速度的方法,例如平衡读请求负荷。当多个用户同时请求得到数据时,可以将读数据的请示分散到二个磁盘中去,使读负荷平均地分布在二个磁盘上。这种方法可观地提高了读数据的性能,因为二个磁盘在同一时刻读取不同的数据片。但是磁盘镜像不能改善写数据的性能。被“镜像”的磁盘也可被镜像到其它存储设备上,例如可读写光盘驱动器,虽然以光盘作镜像盘没有用磁盘的速度快,但这种方法比没有使用镜像盘毕竟减少了丢失数据的危险性。总之,镜像系统容错性能非常好,并可以提高读数据的速度;它的缺点是需要双份磁盘,因此价格较高。l 磁盘分段和数据冗余(RAID 25)磁盘分段改善了磁盘子系统的性能,因为向磁盘读写数据的速度与磁盘子系统中磁盘数目成正比地增加,但它的缺点是磁盘子系统中任一磁盘的故障都会导致整个计算机系统失败。整个分段的磁盘子系统都能作镜像,如果已经用了4个磁盘进行分段,我们可以再增加4个分段的磁盘作为原来4个磁盘的镜像。很明显这是昂贵的(虽然可能比镜像一个昂贵的大磁盘来得便宜)。可以不用镜像而用其它数据冗余的方法来提供高容错性能。可以选择一种奇偶码模式来实现上述方法,可以外加一个专作奇偶校验用的磁盘(如在RAID 3中),或者可把奇偶校验数据分散分布在磁盘阵列的全部磁盘中。分散式奇偶校验数据(RAID5)的例子示于图5中。图5 RAID 5的磁盘分段不管用何种级别的RAID,磁盘阵列总是用异或(XOR)操作来产生奇偶数据,当子系统中有一个磁盘发生故障时,也是用异或操作重建数据。下例简单分析了XOR是怎样工作的。磁盘 A B C 奇偶位(A,B,C异或的结果放在D盘)数据 1 0 1 0首先记住在XOR操作中,2个数异或的结果是真(即“1”)时,这二个数中有且有一个数为1(另一个为0)。我们假设A,B,C中B盘故障,此时可将A,C和奇偶数据XOR起来,得到B盘失去的数据0;同样如C盘故障,我们可将A,B盘和奇偶盘的数据XOR,得到C盘原先的数据1。如果推广到7个盘的磁盘子系统:磁盘 A B C D E F 奇偶位数据 0 0 0 1 0 1 0如果丢失B盘数据,我们可以XOR A,C,D,E,F和奇偶位来得到失去的B盘数据0。而XOR A,B,C,D,E,F和奇偶位可恢复D盘的数据1。采用专用的奇偶校验盘(如上所述,即RAID3),当同时产生多个写操作时 ,每次操作都要对奇偶盘进行写入。这将产生I/O瓶颈效应。RAID 5把奇偶位信息分散分布在磁盘子系统的所有磁盘上(而不是使用专用的校验盘0,这就改善了上述RAID 3中的奇偶盘瓶颈效应。图5说明了RAID 5的一种配置,图中奇偶信息散布在子系统的每个磁盘上。利用每个磁盘的一部分来组成校验盘,写入磁盘的奇偶位信息将较均匀地分布在所有磁盘上。所以某个用户可能把它的一个数据段写在磁盘A,而将奇偶信息写在磁盘B,第二个用户可能把数据写在磁盘C,而奇偶信息写在磁盘D。从这里也可看出RAID5的性能会得到提高。这种方法将提高磁盘子系统的事务处理速度。所谓事务处理,是指处理从许多不同用户来的多个磁盘I/O操作,由于可能同时有很多用户与磁盘打交道,迅速向磁盘写入数据,有时几乎是同时进行的,这种情况下,用分布式奇偶盘的方式比起用专用奇偶盘,瓶颈效应发生的可能性要小。对磁盘操作来说,RAID 5的写性能比不上直接磁盘分段(指没有校验信息的RAID 0)。因为产生或存储奇偶码需要一些额外操作。例如,在修改一个磁盘上的数据时,其它盘上对应段的数据(即使是无关的数据)也要读入主机,以便产生必要的奇偶信息。奇偶段产生后(这要花一些时间),我们要将更新的数据段和奇偶段写入磁盘,这通常称为读-改-写策略。因此,虽然RAID 5比RAID 0优越,但就写性能来说,RAID 5不如RAID 0。镜像技术(RAID 1)和数据奇偶位分段(RAID 5)用于上述的磁盘子系统中时,都产生冗余信息。但在RAID 1中,所有数据都被复制到第二个相同的磁盘上。在RAID 5,数据的XOR码而不是数据本身被复制,因此可以用数据的非常紧凑的表现方式,来恢复由于某一磁盘故障而丢失的数据。采用RAID 5时,对于5个磁盘的阵列,有大约20%的磁盘空间用于存放奇偶码,而十个磁盘的阵列只有约10%的空间存放奇偶码。在可用空间总的格式化空间的意义上来说,磁盘系统中的磁盘越多该系统就越省钱。总之,RAID 5把磁盘分段和奇偶冗余技术的优点结合在一起,这样的磁盘子系统特别适合于事务处理环境,例如民航售票处,汽车出租站,销售系统的终端,等等。在某些场合,可优先考虑RAID 1(在那些写数据比读数据更频繁的情况)。但许多情况,RAID 5提供了将高性能,低价格和数据安全性综合在一起的解决办法。RAID技术的组合应用(10、30、50)在某些情况下,为满足对RAID硬盘的综合性能的需求,可以将两种RAID级别组合使用,比如RAID10就是将物理硬盘分为两组,分别做RAID0后,再互为镜像。而RAID30、50就是对几组RAID0磁盘组进行RAID3、5设置。l 磁盘故障恢复镜像和RAID提供了从磁盘故障中恢复数据的新方法。因为数据的所有部分都是有冗余的,数据有效性很高(即使在磁盘发生故障时)。另一重要优点是,恢复数据的工作不用立即进行,因为系统可以在一个磁盘有故障的情况下正常工作,当然在这种情况下,剩下的系统就不再有容错性能。要避免丢失数据就必须在第二个磁盘故障前恢复数据。图6从镜像盘恢复数据更换故障磁盘后,要进行数据恢复。在镜像系统中,“镜像”盘上有一个数据备份,因此故障磁盘(主磁盘或镜像磁盘)通过简单的磁盘到磁盘的拷贝操作就能重建数据,如图6所示。这个拷贝操作比从磁带上恢复数据要快得多。RAID 5磁盘子系统中,故障磁盘通过无故障磁盘上存放的纠错(奇偶)码信息来重建数据。正常盘上的数据(包括奇偶信息部分)被读出,并计算出故障盘丢失的那些数据,然后写入新替换的盘。这个过程示于图7,它比从磁带上恢复数据要快不少。图7目标地址相同的替换盘设计灵活的磁盘阵列可以重新配置,替换盘的地址不一定和故障盘的地址相同,见图8。这种灵活性使安装过程变得更为简单。备用盘甚至可以在磁盘故障前预先连在系统上。在那种情况下,它就成了随时可用的备份盘。这种盘通常称为“热备份”。图8目标地址不同的替换盘l 可靠性和可用性这二个名词虽然相互关连,事实上却代表了磁盘故障的二个不同的偶面,可靠性指的是磁盘在给定条件下发生故障的概率。可用性指的是磁盘在某种用途中可能用的时间。利用这二个名词,我们可以看到磁盘阵列是怎样把我们的磁盘系统可靠性提高到接近百分之百的程度的。磁盘阵列可以改善磁盘系统的可靠性。因为某一磁盘中的数据可以从其它磁盘的数据中重新产生出来(例如RAID 5),所以很少会有机会使整个磁盘系统失效。磁盘子系统的可靠性因而大大改善了。图表9是RAID磁盘子系统与单个磁盘子系统的可靠性比较:磁盘子系统类型磁盘数平均故障时间*平均丢失数据时间单个磁盘130,000小时30,000小时RAID 0(分段)530,000小时 6,000小时RAID 1(镜像)230,000小时49,9百万小时RAID 5(分段加奇偶码)530,000小时46,2百万小时图表 9 磁盘子系统可靠性比较我们还必须考虑系统的可用性。单一磁盘系统的可用性比没有数据冗余的磁盘阵列要好,而冗余磁盘阵列的可用性比单个磁盘的好得多。这是因为冗余磁盘阵列允许单个磁盘出错,而继续正常工作。此外,一个磁盘故障后的系统恢复时间也大大缩短(与从磁带恢复数据相比)。最后,因为发生故障时,磁盘上的数据是故障当时的数据,替换后的磁盘也将包含故障时的数据(而不是,举例说,前天晚上的备份数据)。要得到完全的容错性能,计算机磁盘子系统的其它部件也必须有冗余例如提供二个电源,或者配备双份磁盘控制器。没有其它部件的冗余,即使有非常可靠的磁盘子系统,还是不能防止计算机系统的失败。l 优化的容错系统如先前所述,直接分段的子系统(RAID 0)可以大大提高读写速度(相对单个磁盘),因为数据分散在多个磁盘,磁盘操作可以同时进行。把二个直接分段的磁盘子系统组成镜像,可以有效地构成全冗余的快速磁盘子系统。这样的子系统,其磁盘操作甚至比直接分段的磁盘子系统还快,因为该系统能同时执行二个读操作(每个磁盘一个读操作),而写操作的速度则与非镜像直接分段子系统几乎一样,因为把数据同时写入二个磁盘只需花费很少的额外开销。通过我们前面所述的概念,例如双工(双控制器,双电源等),可以进一步改善有关冗余方面的问题。双控制器还使我们得到更高的数据传输速度,因为控制器成为子系统性能瓶颈的可能性更小了。1.3 RAID卡与RAID控制器模式的区别RAID卡模式,二台服务器拥有各自的RAID控制卡,系统为双控制器结构。RAID控制器模式,二台服务器拥有各自的SCSI控制卡,磁盘阵列柜有可同时连接两台服务器的RAID控制器(双SCSI端口)。Function/ModeRAID控制器模式RAID卡模式特点RAID功能支持RAID level支持RAID levelRAID控制器一般都支持工业标准的RAID级别,0,1,3,5,0+10,1,3,5,0+1RAID卡还提供自己独有的标准如30、50方式安全性好差阵列柜是一种独立外设,对主机和操作系统无要求,而RAID卡是主机的一个部件,需占用主机资源,对主机的依赖性大,易受主机系统和驱动程序影响可移植性迁移方便迁移不方便RAID控制器采用标准的SCSI协议,可与各种平台连接,不需要任何驱动,迁移性好。由于RAID卡设计特点,使用RAID卡做的RAID组不能迁移到另外的RAID卡上。在RAID卡下配置必须进入设定程序,操作复杂。对双机容错对双机容错一般RAID卡RAID控制器具有两个独立主机通道,可同时连接的支持系统支持不支持双机两台主机。RAID卡以On Board或插卡方式存在,较好通过SCSI电缆与外置磁盘柜连接,很难支持双主机,某些厂商采用Share BUS技术,虽然支持双机,但RAID卡的firmware是支持Cluster结构的特殊版本,同时还必须使用SCSI BUS保护器。数据恢复可恢复性好可恢复性差一旦因为误操作或故障造成RAID组信息丢失,RAID控制器可通过超级用户设置恢复原来的配置信息和数据。若是RAID卡,则很难恢复原来配置信息。速度性能目前在数据处理能力方面,RAID控制器和RAID卡方式基本相同RAID卡与RAID控制器模式比较表来源:/view/7102.htmRAID是“Redundant Array of Independent Disk”的缩写,中文意思是独立冗余磁盘阵列。冗余磁盘阵列技术诞生于1987年,由美国加州大学伯克利分校提出。简单地解释,就是将N台硬盘通过RAID Controller(分Hardware,Software)结合成虚拟单台大容量的硬盘使用。RAID的采用为存储系统(或者服务器的内置存储)带来巨大利益,其中提高传输速率和提供容错功能是最大的优点。另外,raid还有杀虫剂品牌,法国特警队伍名,游戏专有名词等义项。 目录简介 功能 优点 种类及应用 技术术语解释 技术规范 常见故障 数据恢复指南 其他含义简介功能优点种类及应用技术术语解释技术规范常见故障数据恢复指南 其他含义简介RAID磁盘阵列(Redundant Array of Independent Disks)其特色是N台硬盘同时读取速度加快及提供容错性Fault Tolerant,所以RAID是当成平时主要访问数据的存储速度问题(Storage)不是备份问题(Backup Solution)。 在RAID有一基本概念称为EDAP(Extended Data Availability and Protection),其强调扩充性及容错机制, 也是各家厂商如:Mylex,IBM,HP,Compaq,Adaptec,Infortrend等诉求的重点,包括在不须停机情况下可处理以下动作:RAID 磁盘阵列支援自动检测故障硬盘; RAID 磁盘阵列支援重建硬盘坏轨的资料; RAID 磁盘阵列支援支持不须停机的硬盘备援 Hot Spare; RAID 磁盘阵列支援支持不须停机的硬盘替换 Hot Swap; RAID 磁盘阵列支援扩充硬盘容量等。 功能1、扩大了存储能力 可由多个硬盘组成容量巨大的存储空间。2、降低了单位容量的成本 市场上最大容量的硬盘每兆容量的价格要大大高于普及型硬盘,因此采用多个普及型硬盘组成的阵列其单位价格要低得多。3、提高了存储速度 单个硬盘速度的提高均受到各个时期的技术条件限制,要更进一步往往是很困难的,而使用RAID,则可以让多个硬盘同时分摊数据的读或写操作,因此整体速度有成倍地提高。4、可靠性 RAID系统可以使用两组硬盘同步完成镜像存储,这种安全措施对于网络服务器来说是最重要不过的了。5、容错性 RAID控制器的一个关键功能就是容错处理。容错阵列中如有单块硬盘出错,不会影响到整体的继续使用,高级RAID控制器还具有拯救功能。6、对于IDE RAID来说,目前还有一个功能就是支持ATA/66/100。RAID也分为SCSI RAID和IDE RAID两类,当然IDE RAID要廉价得多。如果主机主板不支持ATA/66/100硬盘,通过RAID卡,则能够使用上新硬盘的ATA/66/100功能。 优点RAID的采用为存储系统(或者服务器的内置存储)带来巨大利益,其中提高传输速率和提供容错功能是最大的优点。RAID通过同时使用多个磁盘,提高了传输速率。RAID通过在多个磁盘上同时存储和读取数据来大幅提高存储系统的数据吞吐量(Throughput)。在RAID中,可以让很多磁盘驱动器同时传输数据,而这些磁盘驱动器在逻辑上又是一个磁盘驱动器,所以使用RAID可以达到单个磁盘驱动器几倍、几十倍甚至上百倍的速率。这也是RAID最初想要解决的问题。因为当时CPU的速度增长很快,而磁盘驱动器的数据传输速率无法大幅提高,所以需要有一种方案解决二者之间的矛盾。RAID最后成功了。通过数据校验,RAID可以提供容错功能。这是使用RAID的第二个原因,因为普通磁盘驱动器无法提供容错功能,如果不包括写在磁盘上的CRC(循环冗余校验)码的话。RAID容错是建立在每个磁盘驱动器的硬件容错功能之上的,所以它提供更高的安全性。在很多RAID模式中都有较为完备的相互校验/恢复的措施,甚至是直接相互的镜像备份,从而大大提高了RAID系统的容错度,提高了系统的稳定冗余性。 种类及应用基于不同的架构,RAID 的种类又可以分为: 软件RAID (软件 RAID) ,硬件RAID (硬件 RAID) ,外置RAID (External RAID) 软件RAID很多情况下已经包含在系统之中,并成为其中一个功能,如 Windows、Netware及Linux。软件RAID中的所有操作皆由中央处理器负责,所以系统资源的利用率会很高,从而使系统性能降低。软件RAID是不需要另外添加任何硬件设备,因为它是靠你的系统主要是中央处理器的功能提供所有现成的资源。 硬件RAID通常是一张PCI卡,你会看到在这卡上会有处理器及内存。因为这卡上的处理器已经可以提供一切RAID所需要的资源,所以不会占用系统资源,从而令系统的表现可以大大提升。硬件RAID的应用之一是可以连接内置硬盘、热插拔背板或外置存储设备。无论连接何种硬盘,控制权都是在RAID卡上,亦即是由系统所操控。 在系统里,硬件RAID PCI卡通常都需要安驱动程序,否则系统会拒绝支持。 磁盘阵列可以在安装系统之前或之后产生,系统会视之为一个(大型)硬盘,而它具有容错及冗余的功能。磁盘阵列不单只可以加入一个现成的系统,它更可以支持容量扩展,方法也很简单,只需要加入一个新的硬盘并执行一些简单的指令,系统便可以实时利用这新加的容量。 外置式RAID也是属于硬件RAID的一种,区别在于RAID卡不会安装在系统里,而是安装在外置的存储设备内。而这个外置的储存设备则会连接到系统的SCSI卡上。系统没有任何的RAID功能, 因为它只有一张SCSI卡;所有的RAID功能将会移到这个外置存储里。好处是外置的存储往往可以连接更多的硬盘,不会受系统机箱的大小所影响。而一些高级的技术,如双机容错,是需要多个服务器外连到一个外置储存上,以提供容错能力.外置式RAID的应用之一是可以安装任何的操作系统,因此是与操作系统无关的。为什么呢?因为在系统里只存在一张SCSI卡,并不是RAID卡。而对于这个系统及这张SCSI卡来说,这个外置式的RAID只是一个大型硬盘,并不是什么特别的设备,所以这个外置式的RAID可以安装任何的操作系统。唯一的要求就是你用的这张SCSI卡在这个操作系统要安装驱动程序。 技术术语解释硬盘镜像(Disk Mirroring):硬盘镜像最简单的形式是,一个主机控制器带二个互为镜像的硬盘。数据同时写入二个硬盘,二个硬盘上的数据完全相同,因此一个硬盘故障时,另一个硬盘可提供数据。硬盘数据跨盘(Disk Spanning):利用这种技术,几个硬盘看上去像是一个大硬盘;这个虚拟盘可以把数据跨盘存储在不同的物理盘上,用户不需关心哪个盘上存有他需要的数据。硬盘数据分段(Disk Striping):数据分散存储在几个盘上。数据的第一段放在盘0,第2段放在盘1,直至达到硬盘链中的最后一个盘,然后下一个逻辑段将放在硬盘0,再下一个逻辑段放在盘1,如此循环直至完成写操作。双控(Duplexing):这里指的是用二个控制器来驱动一个硬盘子系统。一个控制器发生故障,另一个控制器马上控制硬盘操作。此外,如果编写恰当的控制器软件,可实现不同的硬盘驱动器同时工作。容错(Fault Tolerant):具有容错功能的机器有抗故障的能力。例如RAID 1镜像系统是容错的,镜像盘中的一个出故障,硬盘子系统仍能正常工作。主机控制器(Host Adapter):这里指的是使主机和外设进行数据交换的控制部件(如SCSI控制器)。热修复(Hot Fix):指用一个硬盘热备份来替换发生故障的硬盘。要注意故障盘并不是真正地被物理替换了。用作热备份的盘被加载上故障盘原来的数据,然后系统恢复工作。热补(Hot Patch):具有硬盘热备份,可随时替换故障盘的系统。热备份(Hot Spare):与CPU系统带电连接的硬盘,它能替换下系统中的故障盘。与冷备份的区别是,冷备份盘平时与机器不相连接,硬盘故障时才换下故障盘。平均数据丢失时间(MTBDLMean Time Between Data Loss):发生数据丢失的事件间的平均时间。平均无故障工作时间(MTBFMean Time Between Failure或MTIF):设备平均无故障运行时间。廉价冗余磁盘阵列(RAIDRedundant Array of Inexpensive Drives):一种将多个廉价硬盘组合成快速,有容错功能的硬盘子系统的技术。系统重建(Reconstruction or Rebuild):一个硬盘发生故障后,从其它正确的硬盘数据和奇偶信息恢复故障盘数据的过程。恢复时间(Reconstruction Time):为故障盘重建数据所需要的时间。单个大容量硬盘(SLEDSinge Expensive Drive)。传输速率(Transfer Rate):指在不同条件下存取数据的速度。虚拟盘(Virtual Disk):与虚拟存储器类似,虚拟盘是一个概念盘,用户不必关心他的数据写在哪个物理盘上。虚拟盘一般跨越几个物理盘,但用户看到的只是一个盘。 技术规范(1)RAID技术规范简介冗余磁盘阵列技术最初的研制目的是为了组合小的廉价磁盘来代替大的昂贵磁盘,以降低大批量数据存储的费用,同时也希望采用冗余信息的方式,使得磁盘失效时不会使对数据的访问受损失,从而开发出一定水平的数据保护技术,并且能适当的提升数据传输速度。过去RAID一直是高档服务器才有缘享用,一直作为高档SCSI硬盘配套技术作应用。近来随着技术的发展和产品成本的不断下降,IDE硬盘性能有了很大提升,加之RAID芯片的普及,使得RAID也逐渐在个人电脑上得到应用。 那么为何叫做冗余磁盘阵列呢?冗余的汉语意思即多余,重复。而磁盘阵列说明不仅仅是一个磁盘,而是一组磁盘。这时你应该明白了,它是利用重复的磁盘来处理数据,使得数据的稳定性得到提高。 (2)RAID的工作原理RAID如何实现数据存储的高稳定性呢?我们不妨来看一下它的工作原理。RAID按照实现原理的不同分为不同的级别,不同的级别之间工作模式是有区别的。整个的RAID结构是一些磁盘结构,通过对磁盘进行组合达到提高效率,减少错误的目的,不要因为这么多名词而被吓坏了,它们的原理实际上十分简单。为了便于说明,下面示意图中的每个方块代表一个磁盘,竖的叫块或磁盘阵列,横称之为带区。(3)RAID规范主要包含RAID 0RAID 7等数个规范,它们的侧重点各不相同,常见的规范有如下几种:RAID 0:无差错控制的带区组要实现RAID0必须要有两个以上硬盘驱动器,RAID0实现了带区组,数据并不是保存在一个硬盘上,而是分成数据块保存在不同驱动器上。因为将数据分布在不同驱动器上,所以数据吞吐率大大提高,驱动器的负载也比较平衡。如果刚好所需要的数据在不同的驱动器上效率最好。它不需要计算校验码,实现容易。它的缺点是它没有数据差错控制,如果一个驱动器中的数据发生错误,即使其它盘上的数据正确也无济于事了。不应该将它用于对数据稳定性要求高的场合。如果用户进行图象(包括动画)编辑和其它要求传输比较大的场合使用RAID0比较合适。同时,RAID可以提高数据传输速率,比如所需读取的文件分布在两个硬盘上,这两个硬盘可以同时读取。那么原来读取同样文件的时间被缩短为1/2。在所有的级别中,RAID 0的速度是最快的。但是RAID 0没有冗余功能的,如果一个磁盘(物理)损坏,则所有的数据都无法使用。RAID 1:镜象结构 raid1对于使用这种RAID1结构的设备来说,RAID控制器必须能够同时对两个盘进行读操作和对两个镜象盘进行写操作。通过下面的结构图您也可以看到必须有两个驱动器。因为是镜象结构在一组盘出现问题时,可以使用镜象,提高系统的容错能力。它比较容易设计和实现。每读一次盘只能读出一块数据,也就是说数据块传送速率与单独的盘的读取速率相同。因为RAID1的校验十分完备,因此对系统的处理能力有很大的影响,通常的RAID功能由软件实现,而这样的实现方法在服务器负载比较重的时候会大大影响服务器效率。当您的系统需要极高的可靠性时,如进行数据统计,那么使用RAID1比较合适。而且RAID1技术支持“热替换”,即不断电的情况下对故障磁盘进行更换,更换完毕只要从镜像盘上恢复数据即可。当主硬盘损坏时,镜像硬盘就可以代替主硬盘工作。镜像硬盘相当于一个备份盘,可想而知,这种硬盘模式的安全性是非常高的,RAID 1的数据安全性在所有的RAID级别上来说是最好的。但是其磁盘的利用率却只有50%,是所有RAID级别中最低的。 RAID2:带海明码校验从概念上讲,RAID 2 同RAID 3类似, 两者都是将数据条块化分布于不同的硬盘上, 条块单位为位或字节。然而RAID 2 使用一定的编码技术来提供错误检查及恢复。这种编码技术需要多个磁盘存放检查及恢复信息,使得RAID 2技术实施更复杂。因此,在商业环境中很少使用。下图左边的各个磁盘上是数据的各个位,由一个数据不同的位运算得到的海明校验码可以保存另一组磁盘上,具体情况请见下图。由于海明码的特点,它可以在数据发生错误的情况下将错误校正,以保证输出的正确。它的数据传送速率相当高,如果希望达到比较理想的速度,那最好提高保存校验码ECC码的硬盘,对于控制器的设计来说,它又比RAID3,4或5要简单。没有免费的午餐,这里也一样,要利用海明码,必须要付出数据冗余的代价。输出数据的速率与驱动器组中速度最慢的相等。 RAID3:
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 离婚房产及共同债务分割详细协议范本
- 农村土地流转与订单农业合作合同
- 知识产权归属与保密协议-虚拟现实技术合作
- 生猪养殖保险业务推广与养殖户购销合作协议
- 篮球运动场地施工与体育器材国际采购合同
- 教育局失泄密应急预案方案
- 离婚股权分割与夫妻共同财产分割执行合同
- 跨境电商零售进口市场线上线下融合趋势与策略报告
- 企业知识产权战略布局与法律顾问服务合同
- 租赁合同三方变更及租金调整协议
- 2025全国科普日科普知识竞赛题库及答案
- 2025企业劳动合同范本新版
- 舞蹈老师自我介绍课件
- 2025年吉林省教育系统校级后备干部选拔考试题及答案
- 社区安全知识培训资料课件
- 徐学义基础地质调查课件
- 2025主题教育应知应会知识题库及答案
- 无人机航空安全知识培训课件
- 警用侦查无人机在侦查行动中的应用分析报告
- 2024年春季云南省高中学业水平合格性考试化学试卷真题(含答案)
- 石膏板项目可行性研究报告
评论
0/150
提交评论