磁盘阵列技术白皮书_第1页
磁盘阵列技术白皮书_第2页
磁盘阵列技术白皮书_第3页
免费预览已结束,剩余8页可下载查看

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、磁盘阵列技术白皮书目录 磁盘阵列基本知识 1.1磁盘阵列技术 什么是磁盘阵列 磁盘阵列是一种把若干硬磁盘驱动器按照一定要求组成一个整体,整个磁盘阵列由阵列控制器管理的系统冗 余磁盘阵列 RAID(Redundant Array ofIndependent Disks)技术1987年由加州大学伯克利分校提出,最初的研制目的是为了组合小的廉价磁盘来代替大的昂贵磁盘,以降低大批量数据存储的费用(当时 RAID称为Redundant Array of Inexpensive Disks 廉价的磁盘阵列),同时也 希望采用冗余信息的方式,使得磁盘失效时不会使对数据的访问受损失,从而开发出一定水平的数据保

2、护技术磁盘阵列的工作原理与特征RAID的基本结构特征就是组合(Striping),捆绑2个或多个物理磁盘成组,形成一个单独的逻 辑盘组合套(Striping Set)是指将物理磁盘组捆绑在 一块儿在利用多个磁盘驱动器时,组合能 够提供比单个物理磁盘驱动器更好的性能提升数据是以块(Chunks)的形式写入组合套中的,块的尺寸是一个固定的值,在捆绑过程实施前就 已选定块尺寸和平均I/O需求的尺寸之间的关系决定了组合套的特性总的来说,选择块尺寸的目的是为了最大程度地提高性能,以适应不同特点的计算环境应用.实际的计算环境依据其不同的特点,可被划分为转换速率密集(Transfer Rate Intens

3、ive)环境或需求速率密集(Request Rate Intensive),一个计算环境若通常服务于小的用户数量和大的I/O需求,可以被认为是转换速率密集环境,工程学和科学应用属于转换速率密集,例如CAM/CAD,图象处理和数据集合等.一个计算环境,如果它是自然存在的多用户或在线交易系统(OLTP),可以被认为是一个标准的需求速率密集,交互式的数据库应用能产生大量的小的I/O需求,由这些应用产生的I/O负荷可被称为需求速率密集具备独立驱动器操作功能的组合套可提供对于需求速率密集环境来说高的性能对于转换速率密集,I/O需求的尺寸比块尺寸大得多,这样可导致每一个I/O需求分布于所有驱 动器,数据由

4、组合套转换的速率可以增加,因为所有的驱动器可并行地传输数据,这样,组合套就象一个单磁盘一样有非常高的容许速度需求速率密集中I/O需求尺寸比块尺寸小很多,这将导致每一个I/O需求落于一个单个的驱动 器中,在这种情况下,由于有数个驱动器,阵列可同时处理数个需求,或者说比单磁盘快数倍. 一个单磁盘某一时刻只能满足一个处理业务,一个转换速率密集应用的阵列某一时刻虽也满足一个处理业务,但能比单磁盘转换数据速度快X倍(X是磁盘数),一个需求速率密集应用的阵列可满足的需求为单一磁盘的X倍,而其转换数据的速率与单磁盘相同.RAID的另一特征是具备数据校验(Parity)功能,校验可被描述为用于RAID级别2,

5、3,4,5的额外的信息,当磁盘失效的情况发生时,校验功能结合完好磁盘中的数据,可以重建失效磁盘上 的数据.对于RAID系统来说,在任何有害条件下绝对保持数据的完整性(Data Integrity)是最基本的要求.数据完整性指的是阵列面对磁盘失效时保持数据不丢失的能力,由于数据的破坏通常会带来灾难性的后果,所以选择RAID阵列的基础条件是它能提供什么级别的数据完整性 此外,数据可用性(Data Availability)也是RAID系统的指标之一,数据可用性指的是阵列内部 容错能力的水平,数据可用性程度越高,可被理解为当发生越多的部件失效时而数据访问仍不丢失.一个RAID阵列能提供的高可用性级别

6、范围可从简单的磁盘冗余到所有部件的冗余 性.当选择一个阵列时,重要的是了解所选的设备是否能够满足期望的可 使用时间目标.RAID阵列能够适应不同环境,在不同类型的主机之间以及操作系统之间移动一个RAID阵列的能力越高,一般说来,可带来更好的投资保护磁盘阵列优点磁 盘阵列有许多优点:首先,提高了存储容量;其次,多台磁盘驱动器可并行工作,提高了数据传输率;第三,由于有校验技术,提高了可靠性:如果阵列中有一台硬磁盘损坏,利用其它盘可以重新恢复出损坏盘上原来的数据,而不影响系统的正常工作,并可以在带电状态下更换已损坏的硬盘(即热插拔功能),阵列控制器会自动把重组数据写入新盘,或写入热备份盘而将新盘用做

7、新的热备份盘;另外磁盘阵列通常配有冗余设备,如电源和风扇,以保证磁盘阵列的散热和系统的可靠性.因其独特的特征和可靠的性能被广泛地应用于多个行业,如:ISP,医学影像,银行等在线处理业务部门,影像服务器,石油工业,关键部门的数据中心,多媒体和数据库 应用等.对于磁盘失效的保护通过RAID技术已经成功地实现,但RAID阵列降低数据存储费用的目的没有达到,实际上,RAID阵列的价格通常比标准的磁盘驱动器更高一些尽管如此,RAID技术确实提供了比通常的磁盘存储更高的性能指标,数据完整性和数据可用性,尤其是在当今面临的I/O总是滞后于CPU性能的瓶颈问题越来越突出的情况下,RAID解决方案能够有效地弥补

8、这个缺口.1.2 SCSI 技术概述SCSI直译为小型计算机系统专用接口(Small Computer System In terface)是一种连结主机和外围设备的接口,支持包括磁盘驱动器,磁带机,光驱,扫描仪在内的多种设备.它由SCSI控制器 进行数据操作,SCSI控制器相当于 一块小型CPU,有自己的命令集和缓存 要了解SCSI,必须 先了解它的类型,以下是STA(SCSI Trade Association,SCSI同业公会)的标准分类.1.2.2 SCSI 接口类型SCSI连接器分为内置和外置两种,内置数据线的外型和IDE数据线一样,只是针数和规格稍有差别,主要用于连接光驱和硬盘 .

9、40针IDE线有40根导线,40针ATA66有80根导线,SCSI 内置则分为50针,68针和80针.至于SCSI外置数据线,就有以多种规格,它们的密度均不相同, 千万别弄错了 .1.2.3 SCSI ID相信许多SCSI用户都有这种经历,插上设备之后,操作系统怎样也不认,后来检查总线,才发 现是终结和ID没有设置好D(identify)作为SCSI设备在SCSI总线的唯一识别符,绝对不允 许重复,可选范围从0到15,SCSI主控制器通常占用id 7,即是说我们可以用在设备上的 ID号 共有15个.在SCSI总线中,控制器也算一个设备,即实际最大可连接设备数目=理论最大支持设备数目-1.总线终

10、结器总线终结器能告诉 SCSI主控制器整条总线在何处终结,并发出一个反射信号给控制器,必须 在两个物理终端作一个终结信号才能 使用|scsi总线.常见的错误是把终结设置在 ID号最高 或最低的地方,而不是设置在物理终端的 SCSI设备上.其实,SCSI设备总是以链形来连接的, 按顺序就能分辨出哪一个是终结设备 .终结的方式有三种:自终结设备,物理总线终结器和自终结电缆.大多数新型SCSI设备都有自终结跳线,只要把非终结设备的自终结跳线设置成OFF即可避免冲突问题;物理总线终结器是一种硬件接头,又分为主动型和被动型两种,主动型使用|电压调整器来进行操作,被动型利 用总线上的能源信号来操作,被动型

11、比主动型更为精确;自终结电缆可以代替物理总线终结器 也是一种硬件,它的价格非常昂贵,常用于两个主机连接同一个物理设备,如:两个服务器存取同一个物理 SCSI硬盘.通过检查SCSI ID和总线终结器,我们可以找出大多数冲突现象的解决方法,这是SCSI设备用户必须重视的一点.规格公用的几个标准术语解释SCSI-1:它是最早SCSI,特点是:支持同步和异步 SCSI外围设备,支持7台8位的外围设备位的通道宽度,传输速率为4MB/S,这现在通常是扫描仪在用的SCSI-2:类似SCSI-1,但是可以支持同时连接7个装置,传输速率为10-20MB/S,目前有CD-R,CD-ROM 在使用.Fast SCS

12、I:8位的通道宽度,|使用|双倍的频率,传输速率为10MB/S.Wide SCSI:16位的通道宽度,传输速率为20MB/S.ULTRA SCSI:8位的通道宽度,传输速率为20MB/S,其允许接口电缆的最大长度为1.5米.Ultra Wide SCSI:16位的通道宽度,传输速率为40MB/S,其允许接口电缆的最大长度为1.5米.ULTRA 2 SCSI:8位的通道宽度,其采用了 LVD(Low V oltage Differential,低电平微分)传输模式, 传输速率为40MB/S,允许接口电缆的最长为 12米,大大增加了设备的灵活性,支持同时挂接15 个装置.WIDE ULTRA 2

13、SCSI:它跟Ultra 2 SCSI差不多,也是采用LVD传输模式,允许最长接口电缆 为12米,可同时挂接15个装置,不同于Ultra 2 SCSI,它有16位的通道宽度,因此传输速度为 80MB/S.Ultra 160 SCSI:支持最高数据传输率为160MB/S.Ultra320 SCSI:支持最高数据传输达到了320MB/S,是目前最新的SCSI接口类型.Single Ended(单终结):许多旧式设备都是单终结设备,它们限制于 SCSI-1协议的6米长度.注意:此距离包括设备内部电缆的距离.Differential(分差动):SCSI总线和设备可借助它来延长传输的距离,附加线的最大长

14、度为 25米.缺点是与单终结设备不兼容.STA术语最大总线速度MB/秒总线宽度 单位:bit最大总线长度单位(米)最大支持设备设备数目单终结LVDHVDSCSI -8Fast SCSI1083258Fast Wide SCSI201632516Ultra SCSI2081.5258Ultra SCSI20834Wide Ultra SCSI40162516Wide Ultra SCSI40161.58Wide Ultra SCSI40164Ultra2 SCSI40812258Wide Ultra2 SCSI8016122516Ultra3 SCSI160161216的优点与缺点SCSI接口优

15、点:适应面广,在一块SCSI控制卡上就可以同时挂接15个设备高性能(具有很多任务,宽带宽及少CPU占用率等特点) 具有外置和内置两种SCSI接口缺点:价格较IDE产品昂贵安装复杂1.3 Fibre 技术概述光纤通道是一种跟 SCSI或IDE有很大不同的接口 ,它很像以太网的转换开头.以前它是专为 网络设计得,后来随着存储器对高带宽的需求,慢慢移植到现在的存储系统上来了 光纤通道通常用于连接一个 SCSI RAID(或其它一些比较常用的 RAID类型),以满足高端工作或服务器 对高数据传输率的要求光纤的特点光纤现在能提供 100MBps的实际带宽,而它的理论极限值为 1.06GBps.不过现在有

16、一些公司 开始推出2.12Gbps的产品,它支持下一代的光纤通道(即Fibre Channel II).不过为了能得到更 高的数据传输率,市面的光纤产品有时是使用多光纤通道来达到更高的带宽 .不像SCSI,光纤通道的配线非常柔韧如果带有光纤光学电缆(Fiber Optic Cabling),它支持最 长的长度超过了 10公里,所以可以说SCSI在接口电缆长度的限制上跟光纤是没法比得,因为 SCSI 最长接口电缆不得超过 12 米 .FeaturesFibre ChannelSCSINode to Node100m20mMax. Optical Distance10,000m12mCurrent

17、 Speed200MB/s160MB/sFuture Speed400MB/s320MB/sMax.Connections126(loop) 16million(sw)15Peripherals SupportedAllLimited typesCost Compared to SCSIHigher but decreasingSerial ConnectivityYesNoProtocol SupportedUniversalSCSIANSI StandardYesYesDual Ported OperationYesNo1.3.3 光纤的优点与缺点 光纤通道优点 :具有很好的升级性 可以用

18、非常长的光纤电缆 (带有 Fiber Optic Cabling 时 ,光纤长度可以超过 10 公里 ) 具有非常宽的带宽 (现在一般的光纤都具有 1.06GBps, 而如果采用多光纤通道可以达到更宽 的带宽 )具有很强的通用性 光纤通道缺点 :价格非常昂贵组建复杂1.4 RAID 技术1.4.1 概述RAID, 为 Redundant Arrays of Independent Disks 的简称 ,中文为廉价冗余磁盘阵列 .作为高性 能的存储系统 ,已经得到了越来越广泛的应用 .RAID 的级别从 RAID 概念的提出到现在 ,已经 发展了 多个级别 ,有明确标准级别分别是 0,1,2,3

19、,4,5 等 .但是最常用的是 0,1,3,5 四个级别 .其 他还有 6,7,10,30,50 等RAID 技术采用若干硬磁盘驱动器按照一定要求组成一个整体,整个磁盘阵列由阵列控制器管理 .磁盘阵列有许多特点 :首先 ,提高了存储容量 ;其次 ,多台磁盘驱动器可 并行工作 ,提高了 数据传输率 ;第三 ,由于有校验技术 ,提高了可靠性 :如果阵列中有一台硬磁盘损坏 ,利用其它盘 可以重新恢复出损坏盘上原来的数据,而不影响 系统的正常工作 ,并可以在带电状态下更换已损坏的硬盘 (即热插拔功能 ),阵列控制器会自动把重组数据写入新盘,或写入热备份盘而将新盘用做新的热备份盘 ; 另外磁盘阵列通常配

20、有冗余设备 ,如电源和风扇 ,以保证磁盘阵列的 散热和系统的可靠性 .1.4.2 RAID 类型逻辑驱动器 (logical drives):逻辑驱动器 :是一个简单的由独立的物理硬盘组成的队列1.4.2.2 逻辑容量 (logical volume):逻辑容量是由一个或多个逻辑驱动器组成,其成员逻辑驱动器可以是相同RAID 集也可以是不同的 RAID 集1.4.2.3 RAID 的级别RAID LevelDescriptionMinimumData AvailabilityPerformance SequentialPerformance RandomNRAIDNon- RAID1Drive

21、DriveRAID 0Disk StripingN= NRAIDR:Highest W:HighestR:HighW:HighestRAID 1(0+1)Mirroring PlusStripi ng(if N1)N+1 NRAID=RAID5R:HighW:MediumR:MediumW:LowRAID 3Striping with Parity on dedicated diskN+1 NRAID=RAID5R:HighW:MediumR:MediumW:LowRAID 5Striping with interspersed parityN+1 NRAID=RAID5R:HighW:Med

22、iumR:HighW:LowNRAID硬盘连续使用NRAID意思是不 使用|RAID功能它使用硬盘的总容量组成逻辑碟 (不使用|条块读写)换句话 说,它生成的逻辑盘容量就是物理盘容量的总和此外,NRAID 不提供资料的备余JBODJBOD最小需要的硬盘数1容量1备余NoJBOD的含意是控制器将机器上每颗硬盘都当作单独的硬盘处理,因此每颗硬盘都被 当作单颗独立的逻辑盘 使用此外,JBOD并不提供资料冗余的功能RAID 0亦称为带区集可以把多块硬盘(至少2块)连接在一起而组成一个容量更大的存储设备处理数据时把数据分块并且同时读写入组成RAID的磁盘,从而大大提高I/O速率RAIDO设计简单且实现成

23、本较低,但RAID0没有冗余或错误修复能力,并且只要组成RAID的磁盘中有一块 出现故障,整个RAID系统的数据将丢失,无法进行任何补救.RAID 0可以提供更多的可用空 间和更好的性能,但是整个系统是非常不可靠的,所以,在所有的级别中,RAID 0的速度是最快 的.但是RAID 0没有冗余功能的, 如果一个磁盘(物理)损坏,则所有的数据都无法 使用RAID 1也称为磁盘镜像,至少需要2块硬盘每一个磁盘都具有一个对应的镜像盘.对任何一个磁盘的 数据写入都会被复制到镜像盘中,并且系统可以从一组镜像盘中的任何一个磁盘读取数据.RAID 1下,任何一块硬盘的故障都不会影响到系统的正常运行,而且只要在

24、任何一对镜像盘中有一块磁盘可以使用I,系统便可以正常运行;当一块硬盘失效时,系统会忽略该硬盘,转而 相应的镜像盘读写数据,RAID 1甚至可以在一半数量的硬盘出现问题时不间断地工作 . 在RAID 1下,我们所能使用的空间只是所有磁盘容量总和的一半,增加了系统的成本,是所有 RAID上磁盘利用率最低的一个级别.RAID 1最少需要的硬盘数目2 容量N/2备余YesRAID 3RAID 3使用一个专门的独立磁盘存放所有的校验数据,而在剩余的磁盘中以与RAID0相似的方式分割并读写数据,即可视为RAID3=RAID0+校验盘.虽然RAID 3具有容错能力,但整 个系统会因校验而受到影响,当一块磁盘

25、失效时,该磁盘上的所有数据块必须使用校 验信息重新建立;当我们更换了损坏的磁盘之后,系统必须一个数据块一个数据块地重建坏盘中的数据:整个过程包括读取带区,计算丢失的数据块和向新盘写入新的数据块等;所以,重建活动最好是在RAID系统空闲的时候进行,否则整个系统的性能就会受到严重的影响;鉴于这种原因,RAID 3更加适用于那些写入操作较少,读取操作较多的应用环境,例如数据库和 WEB服务器等.利用单独的校验盘来保护数据虽然没有镜像的安全性高,但是硬盘利用率得到了很大的提高,为n-1.不过,如果校验盘(物理)损坏的话,则全部数据都无法 使用,故为了解决这一缺陷 产生了 RAID5技术.RAID 3最

26、小需要的硬盘数3容量N-1 备余YesRAID 5在运行机制上,RAID 5和RAID 3完全相同,也是由几个数据块共享一个校验块.RAID 5和RAID 3的最大区别在于 RAID 5不是把所有的校验块集中保存在一个专门的校验盘中,而是分散到所有的数据盘中.RAID 5使用了一种特殊的算法,可以计算出任何一个校验块的存放 位置.这样就可以确保任何对校验块进行的读写操作都会在所有的RAID磁盘中进行均衡,从而消除了产生瓶颈的可能,并避免了像RAID3那样因校验盘损坏而导致系统失去容错能力的 严重故障.硬盘的利用率为 n-1.RAID 5Minimum Disks required3CapacityN-1RedundancyYesRAID (0+1)结合了 RAID 0和RAID 1 -条块化读写的同时 使用|镜像操作.RAID (0+1)允许多个硬盘 损坏,因为它完全使用|硬盘来实现资料备余如果有超过两个硬盘做 RAID 1,系统会自动实现 RAID (0+1).RAID (0+1)最少需要的硬盘数目4容量N/2备余YesRAID 30实施情况同Level 0数据条阵列,其中,每一段都是一个 RAID 3阵列它的冗余与容错能力同RAID 3.这对需要具有高数据传输率的RAID 3配置的IT系统有益,但是它价

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论