




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、RAID完全手册RAID是“独立磁盘冗余阵列”(最初为“廉价磁盘冗余阵列”)的缩略语,1987年由Patterson,Gibson和Katz在加州大学伯克利分院的一篇文章中定义。RAID阵列技术允许将一系列磁盘分组,以实现提高可用性的目的,并提供为实现数据保护而必需的数据冗余,有时还有改善性能的作用。随着计算机技术的快速发展,RAID已经从高端服务器市场日益步入寻常百姓家。但当我们接触到RAID的时候,常会被RAID的各种级别搞得眼花瞭乱。各种RAID级别有什么特殊的含义?我们怎样选择RAID级别?请关注以下的文章 RAID级别可以通过软件或硬件实现。许多但不是全部网络操作系统支持的RAID级
2、别至少要达到5级,RAID 10、30和50只有在磁盘阵列控制器控制下才能实现。基于软件的RAID需要使用主机CPU周期和系统内存,从而增加了系统开销,直接影响系统的性能。磁盘阵列控制器把RAID的计算和操纵工作由软件移到了专门的硬件上,一般比软件实现RAID的系统性能要好。 有三个因素将影响您对RAID级别的选择:可用性(数据冗余),性能和成本。如果不需要可用性,那么RAID-0将带来最佳性能。如果可用性和性能很重要而价格并不重要,那么选择RAID-1或RAID-10(视磁盘数而定)。如果价格、可用性和性能同样重要,那么选择RAID-3,RAID-30,RAID-5或RAID-50(视数据传
3、输类型和磁盘驱动器数目。下面的流图提供了选择RAID级别的一些指导原则。使用这些原则帮助您选择自己需要的RAID级别。需要知道的是,您的应用程序的某些特性也许使用不同的RAID级别更为合适。*如果只要得到最佳性能而不必考虑价格,那么应该考虑RAID1或RAID10。 选择RAID级别似乎就是这么简单,但是,要是想了解不同级别的RAID为什么会具备这些特性,乃至对各种RAID级别有个比较清晰的认识,那就需要看看左边这些对各种RAID级别的介绍。 最后,让我们看看一个RAID选择的实例,作者采取了定量测量的方法对RAID提供的安全性做了量度。 RAID0和RAID12001-03-09·
4、 ·编辑:stone··YESKY硬件频道RAID-0RAID-0(参见图1)使用一种名为“条带”(striping)的技术把数据分布到各个磁盘上,在那里每个“条带”被分散到连续“块”上,RAID0至少使用两个磁盘驱动器,并将数据分成从512字节到数兆字节的若干块,这些数据块被交替写到磁盘中。第1段被写到磁盘1中,第2段被写到磁盘2中,如此等等。当系统到达阵列中的最后一个磁盘时,就写到磁盘1的下一分段,如此下去。分割数据将IO负载平均分配到所有的驱动器。由于驱动器可以同时写或读,性能得以显著提高。但是,它却没有数据保护能力。如果一个磁盘出故障,数据就会丢失。RAI
5、D0不适用于关键任务环境,但是,它却非常适合于视频生产和编辑或图像编辑。条带允许从多个磁盘上同时存取信息,可以平衡磁盘间的输入/输出负载,从而达到最大的数据容量,最快的存取速度。RAID-0是唯一没有冗余的一级RAID。没有冗余使RAID-0除了速度外还有低成本的优点,但这也意味着如果阵列中某个磁盘失败,该阵列上的所有数据都将丢失。在RAID-0中,从磁盘故障恢复必须更换出错的磁盘,并从备份中恢复所有驱动器上的数据。对于可以承受因从磁盘故障中恢复而造成的时间损失的网络来说,RAID-0提供了一个高性能选择。它既可以通过软件,也可以通过硬件实现.RAID-1RAID-1(如图1所示)也被称为镜象
6、,因为一个磁盘上的数据被完全复制到另一个磁盘上。如果一个磁盘失效,另一个还可用,因此由于磁盘故障而造成的数据损失和系统中断实际上被去除了。RAID-1还可以实现双工-另一种数据保护技术。镜象只是复制到每个磁盘,双工则可以复制整个控制器,这样在磁盘故障或控制器故障发生时,您的数据都可以得到保护。镜象和双工的缺点是复制每个磁盘或驱动器的费用较高,在大型服务器上,这可能是一项很大的花销。RAID-l可以由软件或硬件方式实现。RAID3和RAID52001-03-09· ·编辑:stone··YESKY硬件频道RAID-3RAID-3(参见图2),也被称为带有专
7、用奇偶位的条带,每个条带片上都有相当于一“块”那么大的空间用来有效存储冗余信息,即奇偶位。奇偶位是编码信息,如果某个磁盘发生故障,可以用来恢复数据。在数据密集型环境或单一用户环境中尤其有益于访问较长的连续记录。RAID3需要同步主轴驱动器来预防较短记录的性能下降。HP NetRaid磁盘控制器的RAID-3版本可以进行带专用奇偶位的数据条带。它在物理实现上同RAID-3的原始定义不同:每个驱动器都有自己的通道和同步测量杆;但HP NetRaid控制器的RAID-3版本的性能与原始定义相似。控制器上的固件优化了RAID3在进行长时间的串行数据传输时的数据流动,需要这种数据流动的典型环境是视频和图
8、象应用程序。 RAID-5RAID-5(如图2)也被叫做带分布式奇偶位的条带,每个条带片上都有相当于一个“块”那么大的地方被用来存放奇偶位。与RAID-3不同的是,RAID-5象分布条带片上的数据那样把奇偶位信息也分布在所有的磁盘上。尽管有一些容量上的损失,RAID-5能提供最佳的整体性能,因而也是被广泛的一种数据保护方案。它适合于输入/输出密集、高读/写比率的应用程序,如事务处理等。为了具有RAID-5级的冗余度,需要最少由三个磁盘组成的磁盘阵列(不包括一个热备用)。RAID-5可以通过磁盘阵列控制器硬件实现,也可以通过某些网络操作系统软件实现了。RAID-10RAID10(参见图3),也被
9、称为镜象阵列条带。象RAID-0一样,数据跨磁盘抽取;象RAID-1一样,每个磁盘都有一个镜象磁盘。RAID-10提供100%的数据冗余,支持更大的卷尺寸,但价格也相对较高。对大多数只要求具有冗余度而不必考虑价格的应用来说,RAID-10提供最好的性能。使用RAID-10,可以获得更好的可靠性,因为即使两个物理驱动器发生故障(每个阵列中一个),数据仍然可以得到保护。RAID-10需要4个磁盘驱动器,而且只能通过HP NetRaid磁盘控制器实现。RAID-30RAID-30(参见图4)也被称为专用奇偶位阵列条带。象RAID-0一样,跨磁盘抽取数据;象RAID-3一样,使用专用奇偶位。RAID-
10、30提供容错能力,并支持更大的卷尺寸。象RAID-10一样,RAID-30也提供高可靠性,因为即使有两个物理磁盘驱动器失效(每个阵列中一个),数据仍然可用。RAID-30最小要求有6个驱动器,而且只能由HP NetRaid磁盘阵列控制器实现。它最适合非交互的应用程序,如视频流、图形和图象处理等。这些应用程序顺序处理大型文件,而且要求高可用性和高速度。RAID-50RAID-50(参见图5)也被称为分布奇偶位阵列条带。象RAID-0一样,跨磁盘抽取数据;象RAID-5一样,使用分布式奇偶位。RAID-50提供数据可靠性,优秀的整体性能,并支持更大的卷尺寸。象RAID-10和RAID-30一样,即
11、使两个物理磁盘发生故障(每个阵列中一个),也不会有数据丢失。RAID-50最少需要6个驱动器,而且只能通过HP NetRaid磁盘阵列控制器实现。它最适合需要高可靠性存储、高读取速度、高数据传输性能的应用。这些应用包括事务处理和有许多用户存取小文件的办公应用程序。硬盘阵列可靠度的计算2001-03-14· ·Tigerpa··YESKY硬件频道引言问题的提出及其思考三年前(1998),我台上了音频工作站,外存储器是七只希捷9.1G的SCSI硬盘组成的RAID5(6/7)磁盘阵列柜,实际可用容量为54.6G,就当时而言,是一个较好的方案。后来,在做升级方案
12、时,有人认为再买一只磁盘阵列柜,仍采用RAID5。也有人认为单只硬盘的容量已有了较大提高,不用磁盘阵列柜也是可行的,甚至可以考虑采用IDE硬盘作备份。其实问题的焦点是能否找到可靠度的数学模型,不就迎刃而解了吗。正是在这种情况下,我们作了一些资料收集与整理,对硬盘阵列的可靠度作了探索性求解,写成此文,以作抛砖引玉。RAID的特点1、成本低,功耗小,传输速率高。在RAID中,可以让很多磁盘驱动器同时传输数据,而这些磁盘驱动器在逻辑上又是一个磁盘驱动器,所以使用RAID可以达到单个的磁盘驱动器若干倍的速率。2、可以提供容错功能,提高了可靠度,当然这是以冗余为代价的。这是RAID获得广泛应用的重要原因
13、之一。3、RAID是获得大容量存储器的价廉物美、简单易行的好方法。这是RAID获得广泛应用的又一重要原因。4、当RAID由硬盘阵列柜实现时,硬盘阵列柜的价格比起硬盘来往往是较贵的。RAID的可靠性模型这里所说的模型是指可靠度的模型,它和电路上的串并联不可混为一谈。例如若有两只电容并联,但任何一只失效,都会使系统失效,那么在可靠性计算中则被判为串联。各种RAID可靠性模型示意图见左图。磁盘阵列可靠度的计算根据平均故障间隔时间(MTBF),可以推断出单只磁盘的规定时间的无故障可靠度概率。按希捷网站提供的数据,SCSI硬盘的MTBF为100万小时,IDE硬盘的MTBF为40万小时。部分品牌的硬盘未给
14、出MTBF,应该说,希捷的资料具有一定的代表性。按RAID可靠度的数学模型,计算出常见RAID的可靠度,并整理成表,以便对比。从该表不难看出,IDE的RAID1也有极高的可靠度。由于SCSI硬盘比IDE硬盘价格要贵得多,性能也高出不少,为了获得比较合理结论,可选择以下方式比较:规定时间内、相同价格下比可靠度;或规定时间内、相同可靠度下比价格;当然还有其他的比较方式。不难得出以下结论:SCSI硬盘一次性投资较大,相对一劳永逸,RAID的可选形式较多。IDE硬盘一次性投资小,要达到规定可靠度,必须分段投资,总价仍较低,相对麻烦,RAID的可选形式较少。由于计算机硬件发展极其迅速,上述结论最多只是特
15、点而已,具体如何处理,还得视具体情况而定。磁盘阵列可靠度表时间一年两年三年 SCSI硬盘可靠度 (MTBF=100万小时)单只硬盘0.9912782570.9826325820.974062314Raid 00.9826325830.9655667920.948797391Raid 0+10.9996983720.9988143540.997378292Raid 10.9999239310.9996983720.999327236Raid 5(2/3)0.999773120.9991055950.998016609Raid 5(3/4)0.9995488770.9982
16、318710.99610166Raid 5(4/5)0.9992524940.9970871390.993614621Raid 5(5/6)0.9988852460.9956810750.990586456Raid 5(6/7)0.9984483930.9940231020.987046811 IDE硬盘可靠度 (MTBF=40万小时)单只硬盘0.9783380640.9571453670.936411745Raid 00.9571453670.9161272540.876866957Raid 0+10.998163480.9929653620.984838253Rai
17、d 10.999530760.998163480.995956533结束语 硬盘生产方给出的MTBF是在特定的条件下作出的结论,一般来说,实际使用中环境各异,达不到那样好条件的较多。厂方测试用的硬盘一般无需经过长途运输,而客户用的硬盘都是有过运输经历的产品,甚至经过恶劣装运,使用技巧也是不容忽视的。因此实际可靠度会有所下降,但是各种形式的RAID之间的可靠度关系是客观存在的。 RAID代表Redundant Array of Inexpensive (or Independent) Drive。RAID的优点在于三个方面即可用性(Availability)、容量(Capacity)及
18、性能(Performance)。利用RAID技术于存储系统的好处主要有以下三种通过把多个磁盘组织在一起作为一个逻辑卷提供磁盘跨越功能通过把数据分成多个数据块(Block)并行写入/读出多个磁盘以提高访问磁盘的速度通过镜像或校验操作提供容错能力根据实际情况选择适当的RAID级别可以满足用户对存储系统可用性、性能和容量的要求。常用的RAID级别有以下几种:NRAID,JBOD,RAID0,RAID1,RAID0+1,RAID3,RAID5等。为提高可靠性和性能,常使用RAID5和RAID(0+1)。下面分别简要介绍各自的原理及特点:NRAID即Non-RAID,所有磁盘的容量组合成一个逻辑盘,没有
19、数据块分条(no block stripping)。NRAID不提供数据冗余。要求至少一个磁盘。JBOD代表Just a Bunch of Drives,磁盘控制器把每个物理磁盘看作独立的磁盘,因此每个磁盘都是独立的逻辑盘。JBOD也不提供数据冗余。要求至少一个磁盘。RAID0即Data Stripping数据分条技术。整个逻辑盘的数据是被分条(stripped)分布在多个物理磁盘上,可以并行读/写,提供最快的速度,但没有冗余能力。要求至少两个磁盘。我们通过RAID 0可以获得更大的单个磁盘的容量,且通过对多个磁盘的同时读取获得更高的存取速度。RAID 0首先考虑的是磁盘的速度和容量,忽略了安
20、全,只要其中一个磁盘住了问题,那么整个阵列的数据都会不保了。RAID 1,又称镜像方式,也就是数据的冗余。在整个镜像过程中,只有一半的磁盘容量是有效的(另一半磁盘容量用来存放同这一半完全一样的数据)。同RAID 0相比,RAID 1首 先考虑的是安全性,容量减半、速度不变。为了达到既高速又安全,出现了RAID 10(或者叫RAID 0+1),可以把RAID 10简单地理解成由多个磁盘组成的RAID 0阵列再进行镜像。RAID 3和RAID 5都是校验方式。RAID 3的工作方式是用一块磁盘存放校验数据。由于任何数据的改变都要修改相应的数据校验信息,存放数据的磁盘有好几个且并行工作,而存放校验数
21、据的磁盘只有一个,这就带来了校验数据存放时的瓶颈。RAID 5的工作方式是将各个磁盘生成的数据校验切成块,分别存放到组成阵列的各个磁盘中去,这样就缓解了校验数据存放时所产生的瓶颈问题,但是分割数据及控制存放都要付出速度上的代价。RAID 30、RAID 50相对应的工作方式可以像RAID 10那样去理解。由此可见,使用RAID功能组成阵列,总能做到单个磁盘无法做到的功能,所以说RAID卡+多磁盘对我们来说是充满诱惑的。另类RAID级别简介2001-09-26 10:40:00· 陈运迪· 天极硬件频道在以前的文章里,我们已经介绍过RAID 0、1、3、5、7、10、30、5
22、0等、除了这些比较常用的RAID级别,还有一些虽有定义,但较少应用的RAID级别,这里我们也做一下简单的介绍。RAID 2,带海明码校验磁盘阵列RAID2是为大型机和超级计算机开发的。磁盘驱动器组中的第一个、第二个、第四个第2的n次幂个磁盘驱动器是专门的校验盘,用于校验和纠错,例如七个磁盘驱动器的RAID2,第一、二、四个磁盘驱动器是纠错盘,其余的用于存放数据。使用的磁盘驱动器越多,校验盘在其中占的百分比越少。RAID2对大数据量的输入输出有很高的性能,但少量数据的输入输出时性能不好。RAID2很少实际使用。由于海明码的特点,它可以在数据发生错误的情况下将错误校正,以保证输出的正确。它的数据传送速率相当高,如果希望达到比较理想的速度,那最好提高保存校验码ECC码的硬盘,对于控制器的设计来说,它又比RAID3,4或5要简单。但是利用海明码校验必须要付出数据冗余的代价。RAID4:带奇偶校验码的独立磁盘结构RAID4和RAID3很相似,不同的是RAID4对数据的访问是按数据块进行的,也就是按磁盘进行的,每次是一个盘。 RAID3是一次一横条,而RAID4一次一竖条。所以RAID3常须访问阵列
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
评论
0/150
提交评论