(计算机系统结构专业论文)二维磁盘矩阵系统结构及io加速策略研究.pdf_第1页
(计算机系统结构专业论文)二维磁盘矩阵系统结构及io加速策略研究.pdf_第2页
(计算机系统结构专业论文)二维磁盘矩阵系统结构及io加速策略研究.pdf_第3页
(计算机系统结构专业论文)二维磁盘矩阵系统结构及io加速策略研究.pdf_第4页
(计算机系统结构专业论文)二维磁盘矩阵系统结构及io加速策略研究.pdf_第5页
已阅读5页,还剩62页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

硕士学位论文 摘要 现代科技的进步,互联网的飞速发展,导致网络上的信息资源呈爆炸性增长。 1 9 9 8 年图灵奖获得者j i mg r a y 提出了著名的存储界“摩尔定律”:每1 8 个月全球 新增信息量等于有史以来全部信息量的总和。随社会发展,大量的信息需要进行 数字编码并进行存取,对信息存储系统的容量和速度提出了越来越高的要求。 在一个拥有多个阵列控制卡,每个阵列控制卡上多个磁盘的海量存储系统中, 为了满足用户对容量和响应时间的要求,阵列虚拟引擎必须能够将所有的物理存 储整合而向上对主机系统提供一个海量逻辑磁盘并能够快速响应主机i o 请求。 在不同应用环境下的存储服务器,其i o 请求表现出两种不同的特征:i o 请 求数据量大且地址连续和i o 请求数据量小且地址不一定连续。基于此,本文提 出了两种不同的二维磁盘矩阵结构以实现容量聚合:针对数据量大且地址连续 的i o 请求类型,设计了单个i o 队列磁盘矩阵;针对数据量小且地址不连续 的i o 请求类型,设计了多个i o 服务队列磁盘矩阵。并分析了两种磁盘矩阵的 数据分块和组织策略、逻辑空间管理、地址映射算法。在此基础上,提出了二维 磁盘矩阵的全并发访问策略和并行c a c h e 管理方法,实现了多主机的快速i o 访 问。最后,用排队理论建立了评价二维磁盘矩阵性能的i o 服务模型。理论分析 与测试结果表明,二维磁盘矩阵结构不仅可以部署海量的逻辑卷呈现给主机,而 且显著提高了多主机i 0 并发访问速度。 关键词:磁盘矩阵;全并发访问;容量聚合;多i o 服务队列;性能建模 三丝壁苎堡些蚕丝笙望罂5 f 2 垫鎏錾墼墼圣 a b s t r a c t t h ef a s td e v e l o p i n go fm o d e r s c i e n c ea n dt e c h n o l o g ya n dt h ep o p u l a r i z i n go f i n t e r n e th a v eg i v e nr i s et 0a ne x p l o s i v ei n c r e a s ef o rt h ei n f o r m a t i o nr e s o u r c e so ft h e i n t e r n e t j i mg r a y ,t h ew i n n e ro ft h et u r i n gp r i z eo f1 9 9 8 ,p r o p o s e dt h ef a m o u s ”m o o r e sl a w o fs t o r a g ef i e l d :t h ei n c f e a s e dn e wi n f o r m a t i o np e r1 8m o n t h se q u a l s t oa l li n f o r m a t i o np r o d u c e db e f o r e a st h ed e v e l o p m e n to ft h es o c i e e y ,l o t so f i n f o f m a t i o nn e e d st 0b ec o d e d ,s t o r e da n da c c e s s e d ,w h i c hf e q u i r et h eh i g h p e r f o r m a n c e o ft h ec a p a c i t ya n ds p e e do ft h ei n f o r m a t i o ns t o r a g es y s t e m i nam a s s i v es t o f a g es y s t e mt h a th a sm u l t i p l ea r r a yc o n t r o l e r sw h i c he a c hh a s m u l t i p l ed i s k s ,i no r d e rt oa c h i e v et h eg o a lo fm e e t i n gt h eu s e r sf e q u i r eo fc a p a c i t y a n dr e s p o n s et i m e ,t h ea r r a yv i r t u a le n g i n em u s th a st h ec a p a b i l i t yo fa g g r e g a t i n gt h e p h y s i c a ls t o r a g eo ft h es y s t e ma so n eo rm o r em a s s i v ev i r t u a ld i s ka n dp r o v i n d i n gt h e s p e e do fa n s w e r i n gt h em a i nf r a m e si or e q u e s ta sq u i e k l ya sp o s s i b l e t h ei or e q u e s t so ft h es t o r a g es e r v e ro fd i f f e r e n ta p p l i c a t i o n sh a st w os o r t so f d i f f c r e n tf c a t u r e s :b i gd a t as i z ea n da d j a c e n ta d d r e s s ,s m a l ld a t as i z ea n dn o n a d j a c e n t a d d r e s s b a s e do nt h e s es t a t eo fa f f a i r s ,t h i sp a p e rp r o p o s e dt w os o r t so fd i f f e r e n t v i r t u a ld i s km a t r i xs t r u c t l l r et oa c h i e v et h eg o a l0 fa g g r e g a t i n gt h ep h y s i c a lc a p a c i t y : 廷) t od i r e c tt o w a r d st h ei of e q u e s to fb i gd a t as i z ea n da d j a c e n ta d d r e s s ,p r o p o s e da d i s km a t r i xo fs i n g l ei oq u e u e t od i r e c tt o w a r d st h ei or e q u e s to fs m a l ld a t as i z e a n dn o n a d j a c e n ta d d r e s s ,p r o p o s e dad i s km a t r i x o f m u l t i p l e i 0 q u e u e s i n a d d i t i o n ,t h i sp a p e ra n a l y z e dt h ed a t ap a r t i t i o n i n ga n dp l a c e m e n ts t r a t e g y ,l o g i c a ls p a c e m a n a g e m e n ta n da d 由e s st r a n s f o r m a t i o na l g o r i t h mo ft h et w om a t r i x e s b a s e do nt h e m a t r i xs t r u c t u r e ,t h i sp a p e rp r o p o s e dt h ef u i lc o n c u r r e n c ya c c e s ss t f a t e g ya n dp a r a l l e l c a c h em a n a g e m e n tm e t h o do ft h em a t r i x ,w h i c ha c h i e v e dt h eg o a lo ff a s ti oa c c e s so f m u l t i p l ec l i e n t s a tl a s t ,t h i sp a p e rp r o p o s e dt h ei ,o s e n r i c em o d e lt oe v a l u a t et h e p e f f o r m a n c em a t r j xa c c o r d i n gt o t h eq u e u i n gt h e o r y t h et h e o r e t i c a la n a l y s e sa n d t e s t i gr e s u l t si n d i c a t et h a tn o to n l yt h em a t r i xc a np r e s e n tt h eh o s tw i t hm a s s i v e 1 0 9 i c a lv 0 1 u m e ,b u ta l s oe n o r m o u s l yi n c r e a s e dt h es p e e do fi oc o n c u r r e n c ya c c e s so f m u i t i p l ec l j e n t s k e yw o r d s :d i s km a t r i x ;f u l lc o n c u r r e n c ya c c e s s ;c a p a c i t ya g g r e g a t i n g ;m u l t i p l e i ,os e r v i c eq u e u e s ;p e t f o f m a n c em o d e l i n g 硕士学位论文 插图索引 1 1d a s 存储结构一3 1 2n a s 存储结构3 1 3s a n 存储结构图4 1 4 本地命令队列8 2 1 存储虚拟化概念结构1 5 2 2r a i d o 结构示例1 9 2 3r a i d 5 结构示例1 9 2 4 二维r a i d 的数据分布2 0 2 5r a i d 5 0 的物理数据分布2 1 2 6 阵列的两种物理划分一2 6 2 7 两个i o 服务队列的存储矩阵一2 7 2 8 主机视图和物理视图的对应关系2 7 2 9 阵列逻辑卷管理2 8 3 1 二级并发i o 模型3 3 3 2 多i o 队列模型3 5 4 1 全并发i o 排队模型3 8 4 2 多i o 服务队列排队模型4 0 4 3 全并发i o 和多i o 队列的数据分布4 1 5 1 存储服务器硬件结构4 5 5 2 全并发阵列的数据吞吐率4 7 5 3 全并发阵列的i o 完成率4 7 5 4i b 为2 m 时的全并发阵列的数据吞吐率4 8 5 5i b 为2 m 时的全并发阵列的i o 完成率4 8 5 6r a i d 0 0 的数据吞吐率4 9 5 7r a i d 0 0 的i o 完成率一4 9 5 8 系统是l i n u x 时,多i o 阵列的数据吞吐率5 0 5 9 系统是l i n u x 时,多i o 阵列的i o 完成率5 0 5 1 0 系统是w i n d o w 时,多i o 阵列的数据吞吐率5 1 5 。1 1 系统是w i n d o w 时,多i o 阵列的i o 完成率5 1 图图图图图图图图图图图图图图图图图图图图图图图图图图图图图 二维磁盘矩阵系统结构及加加速策略研究 附表索引 1 1s a t a 各阶段特性比较7 2 1v i rd e v 结构主要数据成员一2 2 2 2v o l u m e 数据结构主要数据成员2 4 5 1 全并发i 0 下的读写( i b 为5 1 2 k ) 4 6 5 2 全并发i o 下的读写( i b 为2 m ) 4 7 5 3r a i d 0 0 的读写一4 9 5 4l i n u x 下的多i o 队列阵列的读写5 0 5 5w i n d o w 下的多i o 队列阵列的读写5 1 v 表表表表表表表表 湖南大学 学位论文原创性声明 本人郑重声明:所呈交的论文是本人在导师的指导下独立进行研究所 取得的研究成果。除了文中特别加以标注引用的内容外,本论文不包含任 何其他个人或集体已经发表或撰写的成果作品。对本文的研究做出重要贡 献的个人和集体,均已在文中以明确方式标明。本人完全意识到本声明的 法律后果由本人承担。 作者虢弱吩 日秽徭 学位论文版权使用授权书 本学位论文作者完全了解学校有关保留、使用学位论文的规定,同意 学校保留并向国家有关部门或机构送交论文的复印件和电子版,允许论文 被查阅和借阅。本人授权湖南大学可以将本学位论文的全部或部分内容编 入有关数据库进行检索,可以采用影印、缩印或扫描等复制手段保存和汇 编本学位论文。 本学位论文属于 1 、保密口,在年解密后适用本授权书。 2 、不保密函。 鬟耋鲁:露;冕 硕士学位论文 1 1 课题背景 第1 章绪论 随着计算机及网络技术的普及,存储系统在银行、教育、电信、企业等政府 和电子商务领域得到了广泛的运用。人们不仅对存储系统的容量提出了很高的要 求,更在速度、可靠性、可扩展、可共享等方面提出了要求,具体如下: 容量:随日益膨胀的数据量,人们的存储容量要求会越来越大; 处理速度:能否在用户可忍耐的时间内完成用户请求,能否提供大的上传下 载速度等会成为用户的考虑因素。因此,数据吞吐量和i o 处理速率将是非常重 要的指标; 可扩展:存储系统能否扩展以适应用户增长的数据; 可共享:能够处理不同操作系统平台的用户主机提交的请求; 管理维护的复杂性:很显然,一个存储系统的管理维护越复杂,那么对操作 人员的素质要求就越高,也就越容易出错; 可靠性:银行,电信,电子商务等领域都要求2 4 奎7 小时的持续运转; 安全性:必须确保数据的安全和一致性,防止数据被破坏、丢失、遭受外来 攻击和非法访问,以保护宝贵的数据资源。 为了满足日益增长的用户要求,存储技术也得到了飞速发展。如果说c p u 的 飞速发展引起了第一次i t 浪潮,i n t e f n e t 的普及带来了第二次i t 浪潮,那么存储 技术的迅速崛起则掀起了i t 业的第三次浪潮。在第三次以网络存储技术为核心的 浪潮中,一些与前两次浪潮不同的特点和问题显露了出来: ( 1 ) 数据总量呈几何级数增长。近年来,人类生产的信息量超过了网络时代 以前人类积累的所有信息的总和,而且信息生产的速度依然在持续上升。据i d c 最新发布的数字统计,2 0 0 6 年制造、复制出的数字信息量共计1 6 1 0 亿g b ,开启了 前所未有的信息增长时期。i d c 预言,从2 0 0 6 年到2 0 1 0 年,每年创建和复制的信 息量将增加六倍,这说明2 0 1 0 年的信息量将高达9 8 8 e b ( e x a b y t e s ) 。信息技术的 飞速发展推动了对信息存储的巨大需求。这要求现代存储系统应该具备高度的可 扩展性,并且还要求这种扩展不应该中断正在进行的业务,实现动态可扩展。 ( 2 ) i o 访问速度成为新的性能瓶颈。目前,计算机的主要应用模式已经转 化成数据的存储和访问。由于受机械部件的限制,磁盘数据访问时间平均每年只 能提高7 1 0 ,数据传输率也只能以每年提高2 0 的速度发展,而同时现代微处 二维磁盘矩阵系统结构及酞) 加速策略研究 理器和内存系统正以平均每年增长5 0 。1 0 0 的速度发展,处理机和磁盘之间的性 能差距已经越来越明显。根据a m d a h l 定理,计算机系统性能的提高要受限于系统 中最慢的部件。因此,数据存储系统已经成为计算机系统新的性能瓶颈,即所谓 的i o 瓶颈。传统存储结构难以解决这一问题,采用新型存储结构,大幅度提高存 储系统性能的需求越来越迫切。 ( 3 ) 数据一最宝贵的财富。企业,政府或者银行等机构越来越多的依靠计算 机管理人事,工资,预算等。而一旦由于存储系统运行故障而丢失数据,损失将 是无法估量的,甚至是毁灭性的,这要求数据存储系统具有卓越的系统可靠性。 ( 4 ) 全天候服务的存储服务系统。在银行、网络购物等电子商务和网络服务 应用中,2 4 3 6 5 小时的全天候服务已是大势所趋,这要求网络存储系统具备在苛 刻条件下的高可用性。 ( 5 ) 集中化、自动化、智能化的存储系统管理维护。现在由于信息量的增大 以及系统越来越复杂,对系统的管理维护人员的素质要求也越来越高,因管理不 善而造数据灾害的可能性也大大增加。这就要求存储系统具有易管理性,最好是 具有智能的自动管理和维护功能。 ( 6 ) 多平台的互操作和数据共享及可移植性。由于存在不同的操作系统平台, 对于有不同的操作系统平台的用户访问,要能分别处理,并支持数据共享。这就 要求存储系统有高度的开放性和可移植性。 ( 7 ) 存储系统在中高端计算机系统价值中所占比例不断升高。但是,受日益 增长的虚拟化需求和i s c s is a n 需求的推动,用户对磁盘存储的需求日益增长。 根据分析公司i d c 在近日所发布的报告来看,磁盘存储的整体市场规模在2 0 0 7 年 第四季度增长到了7 5 亿美元,同比增长7 6 。 过去几年,中国存储市场一片繁荣,f cs a n 和i ps a n 两种技术正在以不同 的特点进行细分市场的争夺。硬件产品的差距不断缩小,软件差异化显著。用户 的存储理念由被动的接受转为主动的寻求支持与服务,中国网络存储系统市场将 迎来新的发展高峰期。虚拟存储、在线备份、重复数据删除成为应用焦点。 1 2 存储技术概况 现有的存储技术主要是( d i r e c ta c c e s ss t o r a g e ,d a s ) i n 、n a s ( n e t w o r k a t t a c h e ds t o r a g e ) i 、s a n ( s t o r a g ea r e an e t w o r 蛐i 厶j j 三种。 传统的存储模式d a s 是以服务器为中心的存储结构。各种存储设备通过i d e 、 s c s i 等i o 总线,经过一个通用的服务器连接在网络上,存储器与服务器之间通 过传统的o 总线通信。客户端如果需要访问存储器上的数据,必须先给文件服 务器发送请求信息;文件服务器解析这个请求并给存储器发送访问信息;存储器 2 硕士学位论文 访问数据并发送至文件服务器内存,最终由服务器把文件传送给客户机。 围d a s 存储结构- 图1 1d a s 存储结构 在这种结构中,服务器实际上只起到存储转发数据的作用。这一存储体系结 构存在容量限制、连接距离有限、不易于共享和管理等缺点,因而己不能满足网 络时代的应用需求。 n a s 系统拥有一个专用的服务器,服务器上安装着一个优化的文件系统和 “瘦”操作系统,其作用类似于一个专用的文件服务器。这种专用文件服务器去掉 了通用服务器原有的大多数计算功能,仅仅提供文件系统功能,用于存储服务。 而且,n a s 系统中的核心操作系统是经过特殊定制的,专门服务于文件请求且与 主要的网络环境兼容。 卜哥刁 操作系统e 阳 ,厘幽小 集成习字f 谱 _ _ c 二兰z , y 图n a s 存f i 誊结构 n a s 月爱务器 图1 2n a s 存储结构 n a s 存储系统的特点是通过基于i p 网络的网络文件协议向多种客户端提供 文件级i o 服务,客户端可以在n a s 存储设备提供的目录或设备中进行文件级操 作。当一个用户或应用程序试图访问文件时,经过解释的i o 请求被重定向到网 络传输路径。这些i 0 请求经过i p 网络传输到n a s 服务器端,由那罩的网络文 件协议接收,随后解包并处理客户端和块设备的映射关系,最后将正常的i o 操 作请求交给服务器上的文件系统处理。 3 二维磁盘矩阵系统结构及i o 加速策略研究 虽然与d a s 相比,n a s 结构已经在速度、可靠性等方面有很大的改善,但 仍然存在传输能力有限、可扩展性有限、数据备份能力有限等缺点。因此,n a s 仅仅是一种过渡性的解决方案,真正解决问题还需要新型的存储技术。 s a n 是一种面向网络的存储结构,是以数据存储为中心的。s a n 采用可扩展 的网络拓扑结构连接服务器和存储设备,并将数据的存储和管理集中在相对独立 的专用网络中,面向服务器提供数据存储服务。服务器和存储设备之间的多路、 可选择的数据交换消除了以往存储结构在可扩展性和数据共享方面的局限性。 舌一百一 存储区域网络( s a n ) c h e m 二l 图1 3s a n 存储结构图 通过协议映射,s a n 中存储设备的磁盘或磁带表现为服务器节点上的“网络 磁盘”。在服务器操作系统看来,这些网络盘与本地盘一样,服务器节点就像操作 本地s c s i 硬盘一样对其发送s c s i 命令。s c s i 命令通过f c p 【4 1 、i s c s i 、s e p 等 协议的封装后,由服务器发送到s a n 网络,然后由存储设备接收并执行。 与d a s 、n a s 相比,s a n 技术的主要优点包括以下一些:为每台主机提供 了更多的可控存储容量、可提供更高的传输带宽、可提供更长的连接距离、在数 据可用和共享方面更优等。 目前,业界几乎所有的主流存储厂商都打出了s a n 的大旗,与此同时,业界 也出现了s s p ( 存储服务供应商) 的概念,它们为客户提供存储服务、托管中小 企业的存储业务。数据中心服务供应商也开始提供更多存储服务。很显然,s a n 将成为网络化计算与应用时代的主流存储技术。 根据存储网络所采用的传输协议以及传输介质的不同,s a n 有很多种实现方 式,目前比较流行的是f c s a n 和i p s a n 。 f c s a n 【5 】是当前最主流的s a n 结构,它采用高速的光纤通道构架存储网络, 并用f c p 协议传输s c s i 命令和数据。由于光纤通道的远距连接能力以及高速的 4 硕士学位论文 传输能力,使得f c s a n 的性能非凡,被业晃普遍采用。但另一方面,光纤网络 的采用使得f c s a n 的实现成本极其昂贵。 i p s a n l 6 7 8 】是采用i s c s i ( i n t e m e ts c s i ) 协议构架在i p 网络上的s a n 。i s c s i 协议通过i p 协议来封装s c s i 命令,并在i p 网络上传输s c s i 命令和数据。在 f c s a n 结构中,服务器间的消息传递使用的是前端局域网,而数据传输则被限 制在后端的存储网络中。 当前,i s c s i 的市场份额不断扩大,而且发展潜力很大。在i ps a n 技术得到 肯定的情况下,i s c s i 的销售业绩令人兴奋,服务器虚拟化与快速以太网连接的 普及会增加i s c s i 在市场上的占有率。i d c 预计到2 0 1 0 年,i s c s i 的市场份额将 达到2 1 。 1 3s a t a 接口技术 由于本文的研究是基于s a l a 接口技术的,因此对s a t a 作个简单介绍。 在2 0 0 2 到2 0 0 3 两年间,s a r a ( s e r i a la d v a n c e dt e c h n o l o g ya t t a c h m e n t ) 【9 】 技术以其在传统的从低端到企业级存储市场中的突破性发展,吸引了众多的目光。 s 触噙技术的出现,为客户提供了除昂贵的光纤通道( f i b r ec h a n n e l ,f c ) 和小 型计算机接口( s m a nc o m p u t e rs y s t e mi n t e r f a c e ,s c s i ) 技术之外的更多选择。 s a l 队技术的冲击不仅波及到普通的桌面用户,在高端服务器、n a s 和s a n 应用 环境中也受到各大厂商的关注和采纳。 一方面,它成为解决集中存储问题的新途径的经典范例,使得客户能够在保 持系统性能和可管理性的同时,实现更大的存储容量。 另一方面,s a r a 技术的局限也越来越多地显露出来,使其在许多应用环境 中均无法被采用,因而为f c 和s c s i 留下了市场空间。基本上说,s a l r a 技术由 于理论上的可行性和应用上的经济性,已获得了进一步发展的推动力。 因此,2 0 0 4 年和2 0 0 5 年便很自然的成为s a t a i i 技术到来的时期。这个源 于s a t a 标准的新一代技术标准被视为实现s a t a 作为存储接口技术,由低端到 高端的转交,它架起了由面向桌面环境通往面向服务器环境的桥梁。使s a t a 作 为低成本的存储解决方案,用于服务器、n a s 和s a n 环境成为可能。 在一些高端的应用中,用户必须使用f c 或者s c s i 驱动器,但是s a t a 却提 供了一种更加经济,却依然可行的选择。s 朋r a i i 正在弥合s a t a 和f c s c s i 之 间原本不可逾越的鸿沟。本地指令队列( n a t i v ec o m m a n dq u e l l i n g ) ,组件管理 ( e n c l o s u r em a n a g e m e n t ) 和端口复用( p o r tm u l i t p l i e f ) 就是解决这问题的关 键。 s 御隗提供了一个存储系统如何应用于专业环境中的新概念。这种串行的接 5 二维磁盘矩阵系统结构及鹏i 力口速策略研究 口方式允许更多的端口集成在同一片硅晶片上,因而传统的双通道的觚a 控制器 可以被替换成8 端口的s 觚a 控制器。并且,新的线缆使得连接更多的硬盘较之 a 1 r a 更为容易。a t a 仅能连接4 块硬盘,然而s 触r ai i 能够最多连接1 5 块。这些 优势与s 筒隗控制器的低成本一起,创建了一种新的商业模式。 1 3 1s a t a 和s c s i s c s i 【l o 】与a t a 是硬盘的两大接口类型。当串行化的潮流向p c 架构涌入时, a t a 突然有了脱胎换骨的改变,无论是物理特性还是逻辑功能,都较以往有了重 大的突破。p a t a 至s a l a 的转变甚至也让企业级人士刮目相看。尤其是万转s a l 隗 硬盘出现,使s a l r a v s s c s i 的话题再次成为了用户争论的焦点。下面着重分析一 下在企业级应用中,s c s i 与s 觚a 的优劣。 一、可靠性 硬盘的可靠性是与接口无关的。接口在硬盘上就是一块p c b 电路板,而决定 产品可靠性的更多的是那些硬盘的其他可更换的组件,如磁头、马达、轴承、伺 服系统、磁头臂以及磁盘。使用与s c s i 硬盘相同的组件加上a t a 接口电路完全 可以达到相同的可靠性级别。w dr a p t o r 硬盘就可以提供1 2 0 万小时的平均无故 障时间和5 年质保。 二、性能 s c s i 硬盘目前的最高转速可达1 5 0 0 0 r p m ,s a l a 硬盘则是1 0 0 0 0 f p m 。但目 前最高采用率的s c s i 硬盘仍以1 0 0 0 0 r p m 为主,此时r a p t o r 与之相比完全不处劣 势。可以从以下两个方面进行讨论:( 1 ) 接口速度:s c s i 目前最高的水平是 3 2 0 m b s ,而目前s a t ai i 的数据传输率则已经高达3 0 0 m b s 。但s c s i 总线是共 享的,s 觚a 则是点对点的。( 2 ) 命令队列:s c s i 的标记命令队列( t c q ,t a g g e d c o m m a n dq u e u i n g ) 功能是相对于p a t a 的绝对优势,但这也只能怪p a t a 并没有 发挥a t a 完全的优势。而新一代s a t a 硬盘也将会支持s a t a 1 i 标准中的本机命 令队列( n c q ,n a t i v ec o m m a n dq u e u i n g ) 技术。另外,虽然r a p t o r 的t c q 只 支持3 2 级队列深度,但很少有硬盘能真正用上s c s i 的2 5 6 级命令队列。 三、容量与成本 这方面显然是s a l r a 占优了。s a l r a 硬盘已经达到4 0 0 g b ,而计划上市的s c s i 硬盘只达到3 0 0 g b 的水平。而且s a t a 硬盘的价格更加便宜。 此外,s a t a 硬盘还具备热插拔能力,并且可以在接口上具备很好的可伸缩 性,如在机架式服务器中使用s c s i s a l 陵、f c s 筒隗。转换接口,以及s a t a 端口 位增器( p o r tm u l t i p l i e r ) ,使其具有比s c s i 更好的灵活性。另外,一些专门用于 服务器领域的专业技术也完全可以应用于s 觚a 硬盘,如w d 的r a p t o r 就采用了 6 磺学像论文 可以感应高速旋转所产生的振动并校正磁头寻址的旋转加速前馈技术( r a 阡: r o t 撕o n a la c c e l e f o 趣e l e ff e e d f w 鑫f d ) ,同时它还具有类似于s c s i 的企业扩展 s m a r t 访问( e e s a :e n t e r p r i s ee x t e n s i o n ss m a r t a c c e s s e d ) 功能。 目前包括e m c 、i b m 、h p 、s t o r a g e t e k 、s u n 、d e l l 在内的国际著名存储设 备提供商都推出了基于s 角隗硬盘的次级存储系统,体现了s 筒除硬盘在企业级 应用中的强大潜力,掰一代s a l 隗一l i 标准无疑将进一步加强s 趟隗在这一领域的 实力。 综上所述,可以发现在中低端的企业级的应用环境中,s a i a 已经显现出强 大的竞争力。在搭建相应的企业级产品时,的确可以考虑采用s 筒陵硬盘了。 1 3 2s a l r ai i :通向企业级存储领域的桥梁 s a l 队i i 的引入,主要目的是解决s a l r a1 o 的局限性,以使该技术适合于大 规模扩展的专业部署环境。见表1 1 :s a l 渔l 与s 朋陡i i 比较。 表王薹s 简陵各阶段特性比较 s 期渔l 特性s 嬲渔| | 阶段一特性s 棚渔l l 除段二特性 1 0 0 的软件兼容性本地指令队列双活的主机通道;失效切换 最长l 米的细s 触队线缆s e s 和s a f t e 设备管理 大量磁盘的有效连接 更低的针脚数量 互联背板支持扩展追踪长度 3 0 g b ( 3 0 0 m b s ) 支持热插拔数据分散,聚集 更低的电源电压要求 s 筒陵l 薹有五个主要特性:更高的端墨传输率( 3 g b s 一3 0 0 m 转s ) ;本地命 令队列;组件管理;端口复用;可升级到s a s 。 由于s a l 渔i i 允许多个硬盘连接到同一个端口,更高的传输速率是有必要的, 它使得单个端口可以连接4 到8 块硬盘。 本地命令队烈使褥硬盘可以同时从处理器获得多个数据请求,并且对其进行 重新排序以获碍最高的吞吐量。盘体虽然仍然制约着性能,但是协议方面已经在 开始拉近s a l 阪与s c s i 、f c 之间的差距了。为了发挥这个特性的优势,硬盘制 造商需要提供具有合适的算法和计算能力的新硬盘。如图1 4 ,当发出指令 a b c d 时,无队列情况时,按照站b c d 的顺序执行,需要旋转两闵。但是有 队列时,按照b d a c 的顺序执行,则只需要旋转一周。 7 二维磁盘矩阵系统结构及加速策略研究 图1 4 本地命令队列 组件管理可以让用户知道出错的是哪个硬盘。原来用于s c s i 和f c 监控的协 议被移植到s a t a 中来,解决了用户不知道哪个硬盘出错的问题。 端口复用技术允许最多1 5 块硬盘连接到同一个端口上。s 触队i i 还具备高达 3 2 块硬盘的可扩展性。 s a s 【1 1 】已经在2 0 0 4 年年底发布。由于s a s 和s a l 陵相似的物理和电子特性, s a s 系统既可以使用s a s 的硬盘,也可以使用s 筒r a 硬盘来降低总体成本。客户 也有可能通过将s a t a 硬盘移动到s a s 系统中来实现s a t a 到s a s 的无缝升级。 因为s a l 除i i 能够弥合在协议和逻辑上与s c s i 、s a s 和f c 的差距,并仍能 保持明显的价格优势,所以s 觚ai i 必将进入用户的选择空间。 1 4 存储技术最新研究进展 当前,国外的大学,研究机构以及企业对于存储系统的研究投入了大量的人 力物力。世界各大跨国公司,如h d s ,e m c ,v e r i t a s ,i b m ,h p 等在存储系统 市场了已经取得了垄断性地位。其中e m c 在基于外部控制器的存储市场领先, 近期推出了c l a r i i o na x 4 存储系统,a x 4 将替代原有的低端产品a x l 5 0 和 c x 3 0 0 ,显示出了e m c 对于规模较小的用户的重视。i b m 公司是存储服务器领 域的佼佼者,其推出的全新中低端存储产品及解决方案,以更低的成本帮助中小 企业用户解决数据存储和保护问题,提高业务连续性和有效性。目前i b m 正着手 研究o p t o c a r d l l 2 3 】技术。0 p t o c a r d 技术使用光线而非导线来收发数据,最高带宽 可达8 r b p s ( 每秒1 t b ) ,相当于同时传输大约5 0 0 0 个高清视频流;同时只需要1 0 0 w 左右的功耗,也就是一个电灯泡而已,相当于1 0 0 英尺典型电线连接的百分之一、 1 0 0 英尺典型光纤连接的十分之一。 h p 【1 4 】在存储的高可用性,数据整合,容灾,存储管理和备份等技术方面具有 较大优势。h p 于2 0 0 4 年5 月推出了“s t o r a g e w b r k sg r i d ,存储网格新技术,满足 h p c 和企业应用的需求。存储网格是一种新的技术模式,能够把存储的可扩展性 围 硕士学位论文 和工作效率提高到全新水平。 日立数据系统( h d s ) 公司推出了n s c 5 5 。n s c 5 5 采用了h i t a c h iu n i v e f s a ls t a r n e t w o r k 交换架构,提供由t a g m a s t o r e 通用存储平台带来的、经过验证的企业级 功能外部存储虚拟化、逻辑资源分区和通用复制。n s c 5 5 集高端存储平台才 具有的高级功能以及业经客户验证的虚拟化软件两大功能于一身,打破了目前模 块化产品的局限性,超出所有现有模块化“磁盘式存储”以及基于交换机或其他设 备的虚拟化功能,是存储行业的一大创举。 由m e l l a n o x 公司提出的基于i n f i n i b a n d 【”1 6 】的体系架构也已成为业内新宠, 这种新的i o 总线技术取代了目前的p c i 总线,主要应用在企业网络和数据中心, 也可以应用在高速线速路由器,交换机,大型电信设备中。z e t e r a 技术架构运用 了i p 的标准构件模块和业界标准的网络交换机来运行存储解决方案,能完全满足 不同种类的用户需求,不论是个人用户还是庞大的数据中心。v c r i t a s 推出了全面 的异地容灾保护方案,即本地的切换保护和数据的实时异地复制和业务系统( 包 括数据库和应用软件) 的实时远程切换。 国外大学在存储技术的研究方面也成果颇丰。目前杜克( d u k e ) 大学,惠普 ( h p ) 研究中心,哈佛( h a r v a r d ) 大学,卡内基梅隆( c a r g e n i em e l l o nu n i v e r s i t y ) 大学等都致力于研究基于d a f s ( d i r e c ta c c e s sf i l es y s t e m ) 1 1 7 】的体系架构。该体 系满足了存储网络对扩展性,高性能数据管理,低拥有成本的要求,从而更好的 实现了n a s 和s a n 的融合;加州大学伯克利分校的j o h nk u b i a t o w i c z 等人提出 了全局存储体系结构0 c e a ns t o r e 【1 8 l ,用全局唯一的名字来实现任意存储,实现数 据的全局存储表示;g a r t ha g i b s o n 提出了基于智能存储设备的集成安全存储系 统n a s d ( n e t w o r ka t t a c h e ds e c u r ed i s k ) 【1 9 ,2 0 2 1 ,2 2 2 3 1 ,该系统在n a s 存储设备 智能基础上进行扩充来实现基于文件的安全访问。 目前,由国外厂商垄断存储市场的格局开始改变,自2 0 0 6 年起,浪潮、联想、 华为及中兴等国内it 企业相继涉足存储行业。2 0 0 7 年4 月,由华工科技集团推 出的国内首款具有自主知识产权的存储设备一磁盘阵列正式亮相。这套产品的推 出不仅标志着国产存储设备和服务解决方案向国际品牌发起挑战,而且从长远看 对我国信息安全具有重要的战略意义。浪潮存储基于开放架构和工业标准,以模 块化设计理念为指导,最新自主研发了一种并行网络存储系统,其包含了智能化 的嵌入式存储系统,跨平台的并行文件系统,模块化的存储功能软件以及软硬结 合的管理节点四大子系统,只要技术指标达到国际领先水平。华为3 c o m 推出的 n e o c e a ni x l 0 0 0 是面向多媒体海量数据用户,中小企业用户及大型组织分支机构 的模块化i p 存储产品,具有高性能,多功能,管理方便,即插即用等特点,是华 为公司“自适应网络存储架构”的智能模块产品。蚬壳星盈公司也推出了g a l a t i c 存 储系统,g a l a t i c 包含了存储应用服务器、i s c s i 存储、n a s 存储的功能模块,并 9 二维磁盘矩阵系统结构及琰) 加速策略研究 能够实现在s a l 队、s c s i 以及光纤网络环境中自由切换。另外,科软存储,飞骥 存储等国内专业存储企业也正在进行着深层次的研究。 清华大学海量存储网络课题组在海量存储领域开展了大量研究,力图解决当 前网络服务器系统中普遍存在的i o 瓶颈问题、存储容量问题和数据可靠性【2 4 2 5 l 问题。并分别于2 0 0 3 年和2 0 0 5 年推出了高可扩展的海量存储网络系统和深腾 2 6 0 0 新型网络服务器系统,在分布式虚拟存储技术,多路远程镜像技术,带外虚 拟存储技术,大容量内存虚拟磁盘技术做出了巨大贡献。清华大学高性能计算技 术研究所在承担国家“8 6 3 ”高科技项目中,研制开发出s a n 结构的m s t o r 系列存 储网络系统。该系统性能优越且成本低廉,可分别支持f c p 、i s c s i 协议,具有 存储管理、存储虚拟化、数据容灾等完整的系统组件,是国内首家拥有完全自主 知识产权的s a n 产品,已应用于油田、教育等行业。 华中科技大学的科研团队对面向磁盘存储系统底层的并行与并发处理【2 6 l 及 其相关技术,包括海量存储系统的新型系统结构、多个存储设备的并行操作和并 行调度以及影响存储系统性能的因素等做了多方面的研究。 中国科学院计算技术研究所的研究领域主要集中在研究网络存储系统以及基 于网络存储系统的高性能计算机系统的关键技术。 1 4 1 i o 加速技术研究现状 虽然国内外在存储技术方面做了大量工作,但前述研究均是针对不同的应用 来解决各自的问题。而在不同的应用环境下,有不同的存储服务质量需求,因而 有待加

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论