已阅读5页,还剩58页未读, 继续免费阅读
(应用数学专业论文)存储网络中cifs数据流程分析与传输效率改进.pdf.pdf 免费下载
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
存储网络中c l f s 数据流程分析与传输效率改进应用数学硕士生:崔涛指导老师:伍小明副教授摘要存储区域网络( s a n ,s t o r a g ea r e an e t w o r k ) 是正在蓬勃发展的一种全新的存储模式,它是网络技术在存储领域的应用。c i f s ( c o m m o ni n t e r n e tf “es y s t e m ) 协议是存储网络在应用层的核心协议,由全球存储网络工业协会( s n i a ,s t o r a g en e t w o r ki n d u s t r ya s s o c i a t i o n ) 负责组织和评审,是正在制定中的网络标准。本文简介了c i f s 的产生、发展和现状,描述了c i f s 在存储网络中的作用,解释了l i n u x 成为c i f s 的主要操作系统平台的原因。随后,本文介绍了c i f s的详细规程,包括c i f s 的主要特性、数据包格式、数据结构、字段含意。其中,重点解释了指令域与参数域的紧密联系和相互作用。在对c i f s 传输流程的论述中,本文以最常见的两种数据交换为例,深入剖析了数据交换中的每一个细节、服务器与客户端的每一个动作、数据交换过程中涉及到的每一个数据包,包括每一个数据包的详细格式、具体作用。通过上述分析,本文得出影响传输效率的四个方面,包括接口、流程、定义、并行性,然后介绍了目前对这四方面改进的研究现状。针对定义和并行性的改进,提出了提高c i f s 传输效率的两种构思,第一种是提高c i f s 传输大文件( 大于6 4 k ) 的效率,第二种是实现c i f s 对同一文件的访问请求的并行性,并给出了相关算法。关键词:c i f s 、l i n u x 、存储区域网络、数据流程、传输效率c i f sd a t as t r e a ma n a i y s ea n de 竹j c j e n c yl m p r o v e m e n ti ns t o r a g en e t w o r ka p p e dm a t h e m a t i c sn a m e :c u i1 _ a os u p e r v i s o r :w u i a om i n ga b s t r a c ts t o r a g ea r e an e “v o r kf s a n li sac o m p l e t en e wm o d e lo fs t o r a g eu n d e rd e v e l o p i n za c t i v e ly ,w h i c hi m p l e m e n t i n gt h ec e n 仃a l i z e ds t o r a g ea n dm a n a g e m e n tf o rm u l t i p l et y d e so fd a t a ,s ot t l ed a t ao w nt h eh i 曲- l e v e ls e c u r i t ya n dr c v o l u t i o n a r ya c c e s sc o n v e n i e n c e w h a t sm o r e ,s a nm a k es e n r e rs p e c i a l i z et h ed a t ap r o c e s sr e g a r d l e s st h ew o r ko fd a t as t o r a g e ,b e c a u s es a nd ow i t hs t o r a g ew o r k s os e e rc a ni m p m v ei l sb e h a v i o ro fd a t ap m c e s s 1 naw o r d ,s a nh a v eav e r yb r i g h tp e r s p e c t i v eo fd e v e l o p m e n t c o m m o nh l t e m c tf i l es y s t e mp r o t o li st h ec o r cp r o t o c o lo fs a n ,w h i c hm a l t h em o s td i f ! e e r e n c eb e t w e e ns a na n dg e n e r a ln e t w o r ks t o r a g cn e t w o r k i n 空i n d u s t f ya s s o c i a t i o n ( s n i a ) i sr e s p o n s i b l ef o ro f g a n i z a t i o na n dr e v i s eo ft t l ep r o d u c t i o no fc i f sp f o t o 1 d u et ot h ed i s a e r e e m e n ta n dl a c ko fc o l l a b o r a t i o n丘o md i f f c r e n td e v e l o p e r s ,c i f sp r o t o c o lc a i l ts t i l lb e c o m eaf o m a li n t e m e ts t a n d a r d ,e v e nn o tad r a f ts t a n d a r ds of a lb e c a u s ei _ j 肌xi sam a i no p e r a t i n gs v s t e mp e - 0 瑚w h i c hc i f su s e ,t h eb r i e fi n t r o d u c e0 fl j n u xa s p e c t sr e l a t e do fc i f sw i ub ei n c l u d e d f i r s t ,t h i s 口a 口e rs p e a k so ft h eo r i g i na n de v o l u t i o no fc i f s s e c o n d ,t h ec i f sh e a d e ra i l dt h ed a t as t m c t u r eo fc i f sd a c k e tw i l lb ed i s c u s s e dm o r ed e t a i l c d ,t h er e l a t i o n sj nt i d 、p l d 、m i da r ed i s c o v e r e d t h i r d ,t h em o s td i f f i c u l tp a r ti st h ep a r a m e t e rf i e l d ,d i f f e r e n tc o m m a n df i e l dd e c i d e st h ed f ! f e r e n tf u n c t i o na n df 0 n a to fc i f sp a c k e t ,t h ec h a n g eo ft h ep a r a m e t e rf i e l di sm o s ta c u i t ya n dc o m p l i c a t e di np a c k e te x c h a n g e t h ep a p e re n l p h a s e st h ea n a l y s e so ft h ep a c k e te x c h a n r ca n di sd e d i c a t e dt of i n do u tt h ee v e r ya c t i o nd e t a i lo fs e e ra n dc h e n t ,e x p e c t e dt od j s c o v e rt h e1 a wo fj n e r n a lc h a n 留eo fc i f sp a c k e ti nt h ec o m m u n i c a t i o n a f t e rt h ea n a l y s e so ft w ok i n d so fc i f sc o m m u n i c a t i o n ,t h el a c ko fe f f i c i e n c vi nt h et r a i l s m i s s i o nc a nb ef o u n do u t ,s os o m ed l a n sw h i c hb ee x p e d e dt oi m p m v et l l et f a n s m i s s i o ne f ! e j c i e n c yw i l lb ed i s p l a y e d ,b u tic a n tv e r i f yt h ep l a n sw i l lr e a l l vw o r k ,b e c a u s ep u t t i n gt h ep l a ni n t oa c t i o nw i l lc o s tm u c ht i m ea n dn e e do fn l u c ht a l e n t k e y w o r d s :s a n ,c i f s 、l i n u x 、p a c k e te x c h a n g e 、i m p r o v e m e n to fn a n s m i s s i o ne m d e n c y1 1中山大学数学与计算科学学院存储网络中c i f s 数据流程分析与传输效率改进第一章综述1 1i t 技术的发展与存储模式的变迁有人蜕当今是“信息爆炸”的时代,而导火线就是计算机和通信技术的飞速发展,即信息处理技术的日新月异。计算机技术和通信技术的融合导致了互联网的诞生,互联网的迅速发展使得信息可以跨越国界、民族、语言,使信息的流动的速度和范围大大超出人们的设想。一个人现在一天可以获得的信息量,在1 0 0 年前至少需要1 年。如此大的信息量带来一个问题:我们不可能凭记忆力记住所有信息,我们需要一种有效的存储方案来存储、管理和加工数量庞大的信息。工程师们在不断的努力,存储设备从刚开始时的只能存储几百k 字节数据的磁鼓,到可以存储几百m 字节的5 英寸大硬盘,到可以存储1 g 、1 0 g 、1 0 0 g 、3 0 0 g 字节的3 英寸小硬盘、1 英寸的微硬盘”。存储设备的体积越来越小、容量越来越大,一个主机可以同时使用的存储设备的数量和种类越来越多。然而,只是存储容量的扩张,总无法满足人们对信息存储的需求,随着存储的数据量的不断增大,人们对存储数据的易管理性、高安全性、可移植性、可修复性、更快的读取与写入速度、更低的访问延迟提出了越来越高的要求。而原有的扩充本地主机存储容量的方式无法满足上述要求,必须研究和开发新的存储模式,这导致的存储模式的变迁【2 】。1 1 1 三种存储模式随着社会信息化的不断发展,各种公司或机构开始利用计算机和网络来处理各种事务,信息处理技术应用的范围越来越广,需要存储的信息数量越来越大,对数据的可靠存储和有效利用,便成为一个需要解决的问题。数据存储经历了单机存储( d a s ) 、网络附加存储( n a s ) 、存储区域网络( s a n ) 三种模式的发展【3 l :( 一) 单机存储( d a s ,d i r e c t - a t t a c h e ds t o r a g e )单机存储是利用本地主机的存储设备( 例如硬盘、刻录机) 来存储和备份数据,这是早期的数据存储模式,现在则为一般个人用户的数据存储方式。该模式可以存储的数据量很小,数据存储的可靠性不高,没有数据备份,缺乏数据的安全性保证,存储的扩展只能靠增加硬盘数量和容量、光盘刻录来解决。若从企业的角度看,由于一个企业的内部有多台主机,单机存储的方式使数据无法集中管理,单机式的数据分散存储使得数据的安全性和可靠性存在很大的隐患,不同单机内存储的数据的同步和统计更成为一个极大的难题。所以,单机存储在当今企业级应用的空间很小,只出现在企业级应用的最初阶段。o l k = 1 0 2 41 m = 1 0 2 4 k1 g = 1 0 2 4 m中山大学数学与计算科学学院存储网络中c i f s 数据流程分析与传输效率改进( 二)网络附加存储( n a s ,n e 咐o r k a t t a c h e ds t o r a 2 e )网络附加存储是当今最主流的企业级应用存储方案,它利用客户机朋匣务器的模式,数据大部分从客户机输入,数据在客户机e 临时缓存一下后,随即发送到服务器。服务器集中处理和存储所有客户端发送过来的数据,所以数据的存储不是在本地( 客户机) 的存储器中,而是通过局域网( l a n ) 或因特网( i n t e m e t ) 发送到个或几个集中的服务器l ”。如下图所示:厂l客户机c l i e n t1ll网络( l a n 或i n t e m e t )图1 1 网络附加存储n a s 示意图不同j = l ;j 途的服务器,处理并存储相关数据。这里服务器有两个用途:数据处理与数据存储。此种模式使得集中式的数据存储和管理成为可能,而且数据的安全性与可靠性有了保证,客户端必须经过服务器端的验证才能访问服务器上的相关资源,管理员可以通过设置对服务器的访问规则来最大化的保护数据的完整和安全。服务器的应用程序可以使所有客户机的数据同步,使同一时间在不同的客户端访问同一个数据时,数据内容不会有任何差异。服务器集中存储和统一处理所有客户机发送的数据,使管理人员可以利用服务器上的数据库管理软件对存储的所有数据迸行及时和准确的分析。( 三)以上两种存储模式的不足之处1 随着信息处理技术和数据挖掘技术的不断发展,人们要求对不同类型的服务器上的数据进行综合、汇总、加工和处理。由于目标数据可能分布在不同的服务器,这些服务器可能在运行不同的操作系统和不同的数据库管理程序,所以怎样有效的访问和管理这些数据便成为一个需要解决的问题。2 客户机与服务器之间总是在很繁忙的传递数据,它们之间的网络的负荷本来就已经比较紧张,而在实现1 所述的问题时,服务器之间又需要通过网络交换大量的数据,这时网络很容易出现拥塞;而且服务器之间交换的数据比较敏感,这些数据要通过服务器与客户机之间的u 州或、lil广lj中山大学数学与计算科学学院存储网络中c l f s 数据流程分析与传输效率改进i n t e m e t 来传递,就会存在数据安全性的问题。3 服务器的用途不同,需要处理和存储的信息数量也不同,由于无法预知未来将出现的各种各样的状况,管理人员很难准确估计在今后的运行中各种类型的服务器需要的存储空间,若预先设置的存储空问不足,会给以后的数据扩充带来困难,若预先设置的存储空间过大,则会极大的增加成本和造成不必要的浪费。为了解决上述问题,存储区域网络( s a n ) 方案被提了出来,以应对未来的对数掘存储的诸多要求。1 1 2 存储区域网络存储区域网络( s a n ,s t o r a g e 心e an e t w o r k ) 常被简称为存储网络。该存储模式最大的特点是存储网络承担了服务器的数据存储工作,把在网络附加存储模式( n a s ) 中本该由服务器承担的与数据存储相关的工作交给存储网络来完成。在网络附加存储模式中( 参看图1 1 ) ,当服务器对客户机发送的数据进行处理时,若需要读取已存储的数据或存储新的数据,则直接对自己的硬盘进行读写操作即可;而在存储区域网络模式中,服务器必须穿过存储区域网络,对远端的磁盘柜或磁带库进行读写操作。存储网络的作用就是向服务器的数据处理程序提供与存储相关的服务,使服务器访问存储网络就如同访问自己的硬盘一样,存储网络的网络拓扑、管理程序、磁盘柜的真实位置、被保持数据的格式对服务器都是不透明的,服务器只需知道分配给自己的存储空间、访问口令等内容。服务器感受不到除了分配给自己的其他存储空间的存在。下图为存储区域网络示意图。! 坐堂塑蔓苎型兰兰堕壹堕旦垒主竺! 壁墼塑壅墨坌堑皇堕堕望皇整鲞客户机图1 2 存储区域网络示意图数据存储由存储区域网络负责,这里存储交换机( 也被称为文件控制交换机) 发挥了极为关键的作用,它根据预设的配置,让数据在服务器和磁盘柜之间进行有序的交换,实现了不同类型数据的集中存储和管理。4存储区域网络具有下列优势1 同时支持多种文件系统,包括w i n d o w 系列操作系统的r 玎1 6 、( r 3 2 、n t f s 文件系统,常用的u n j x 类操作系统( 例如u n u x 、n e 时a r e 、s o l a r i s等) 的e x t 2 、e x t 3 、h p f s 、m i n i x 文件系统,以及光盘驱动设备的i s 0 9 6 6 0文件系统。即不论存储区域网络中的服务器运行什么操作系统,采用何种文件格式,对存储区域来说都是“透明的”、“没有区别的”,存储网络负责把服务器发送来的各种格式数据转换的磁盘柜中统一的格式。2 虽然存储区域网络把所有服务器的数据集中存储在远端的磁盘柜中,但从存储区域的角度来看,就好像所有数据存放在了一个硬盘中。在存储区域中数据库管理软件可以像在一个主机中一样运行,而无需考虑数据的真实存储位置、文件格式差别和网络拓扑,大大方便了数据的统一管理,也便于各种数据分析程序的直接运行。3 服务器从原来的同时兼具数据处理和数据存储两种功能,转变为单一的数据处理功能,减轻了服务器的负担,提高服务器的应用性能。4 存储区域网络与客户机和服务器之间的网络不是同一个网络,它不会中山大学数学与计算科学学院存储网络中c l f s 数据流程分析与传输效率改进增加客户机和服务器之间的网络的负担。由于推荐使用光纤作为存储区域网络的传输介质,所以最大程度的降低了数据访问时延,提高了网络传输效率。由于数据存储使用专用网络,数据的安全性有了很高的保证。5 存储区域网络对服务器的存储空间的分配真f 做到“按需分配”,可以制定灵活的存储空间分配策略,提高存储空间的利用率,降低存储成本。存储区域网络是利用网络实现存储的功能。它虽然是一种网络,具有类似i s 0 ,o s i 网络层次模型的分层标准,然而各层的区分与定义与i s o o s i 网络层次模型有所不同,例如通常存储区域网络是专用网络无需跨越公用网络,它的网络层就无需定义或只有很少的定义。为了达到很高的传输速度,存储区域网络在物理层通常使用光纤作为传输介质。全球网络存储工业协会( s n i a ) 只是制定了存储区域网络对应i s o o s i 网络层次模型的上三层的规程,即只对存储网络的核心协议的运作位置做了严格定义,对网络中的其他层次定义由开发商自行决定。有的开发商直接使用i p 网络来实现存储区域网络,这时存储网络的层次结构和一般网络十分相似,而有的开发商使用光纤网络实现存储网络,这时存储网络的层次结构和一般网络就会有比较大的差异i 。s a n 使用的典型协议组是s c s i 和f i b r ec h a i l n e l ( s c s i - f c ) 。f i b r ec h a i l n e l特别适合这项应用,原因在于一方面它可以传输大块数据( 这点类似于s c s i ) ,另一方面它能够实现远距离传输( 这点又与s c s l 不同) 。协议组s c s i 和f i b r ec h 孤n e l ( s c s i f c ) 为存储网络的核心协议提供数据传输服务”。存储网络在应用层的核心协议是c i f s ( c o m m o ni n t e m e tf j l es y s t e m ) ,它标识了存储网络与一般网络的在最重要差别。对服务器中的数据库管理或数据处理程序来说,c i f s 是一个极为重要的中间件,它向服务器提供了对存储网络中的数据的访问服务,使服务器上的数据库管理或数据处理程序能如同访问本地硬盘一样方便的访问存储网络中的数据,即c i f s 提供了存储网络的核心功能。注意:这里的客户端指的是图1 2 中存储区域网络中的服务器。1 牟= 球网络存储工业协会的中文官方网址为:w w s n i a o f g c n网1 2域a区的置储中戗存络的、,j中山大学数学与计算科学学院存储网络中c i f s 数据流程分析与传输效率改进1 2 存储区域网络中常用的操作系统由于c i f s 协议是在i s o 0 s i 网络层次模型中处于应用层( 包括会话层和表示层) ,所以不论什么样的c i f s 实现方式,都必须运行在一个具体的操作系统平台之上。1 2 1 主要操作系统特性的简要对比现在主流的操作平台分两类:m i c r o s o f t 公司的w i n d o w 系列和其他大公司自行发展的u n 投类操作系统。两类操作系统各有优点和缺点:w i n d o w 操作系统功能丰富、界面友好、使用方便、具有优秀的硬件兼容性,是个人操作系统中的典范,但体积庞大、需要较高的硬件配置、缺乏长时问运行的稳定性、系统本身消耗了大量的硬件资源,更重要的是w i 们o w 的源代码不公开,开发者很难修改操作系统以适应c i f s 的需要。u n i x 类操作系统历史悠久,经历了相当长时间的发展,具有内核稳定、网络特性强大的优点,各大公司为了满足自己产品的需要,开发了不同的版本,例如i b m 公司的a l x ,s g i 公司的m i x ,s u n 公司的s o l a r i s ,s c 0 公司的n e t w a r e和o p e n s e r v e r ,但这些有版权的u n i x 操作系统价格昂贵,彼此互不兼容,而且源代码也不对本公司以外的开发人员公开,造成u n i x 类操作系统的发展缓慢且困难重重。然而,l i n u x 的出现大大改变了u n i x 类操作系统的发展前景。“n u x 是一位芬兰大学生l j n u sb e n e d i dt o r v a l d s 对u n i x 操作系统源代码的一次彻底改编,使平时在服务器( 包括大型机和小型机) 上运行的u n i x 能够在p c ( p e r s o n a lc o m p u t e r ) 级别的主机上运行,但是l j n u s 并没有申请专利,而是把源代码公开并允许所有人再次修改和免费使用。随后世界各地的u n u x 技术开发者和爱好者,在开源工程g n u 的组织下开始不断的对l j n u x 进行升级和发展,从1 9 9 3 年的第一个核心版本u n u xk 色m e l l 0 o ,已经发展到最新的核心版本l i n u xk e m e l2 6 1 ,所有的版本的源代码均可以从互联网上免费获取,所以l i n u x 的发展非常快,l i n u x 的用户也越来越多,从初始的个人用户发展到企业用户,包括l b m 、h p 、d e l l 等各大公司均开始支持l i n u x 的商业应用。由于u n u x 的源代码完全公开且允许使用者任意修改,开发者可以根据自己的需要改编l i n u x 的源代码,以针对不同的硬件环境和应用任务做出最大的性能优化。开发者完全可以对l i n u x 按需定制,针对系统要完成的工作,只保留完成此项工作所必须的代码部分,所以l i n u x 可以被压缩的非常小,例如工业控制使用的l i n u x 操作系统被嵌入了硬件内部,由于u n u x 在这里只需完成很单一的工作,所以与该工作无关的所有代码被删除和精简,此时l i n u x 的体积可以不超过1 0 m 字节,因而绝大部分嵌入式操作系统是“n u x 操作系统。当然,l i n u x 的体积也会因为任务的复杂而变得很庞大,例如,由于l i n u x 的稳定8 截争2 0 0 5 年3 月n u x 核心的蛙新版奉中山大学数学与计算科学学院存储网络中c i f s 数据流程分析与传输效率改进性和强大的网络特性,很多公司利用u n u x + o r a c l e 来组建自己的数据库服务平台,这时因为l i n u x 被添加了很多功能,包括图形化的用户界面、文件管理系统、存储管理系统、硬件管理数据库、崩溃回复机制等,此时l i n u x 的体积要达到1 g ( 1 g = 1 0 2 4 m ) 字节,但这仍比采用w i n d o w 服务器版本的相关方案占用的体积要小得多。1 2 2l i n u x 操作系统在存储网络区域应用中的优势与不足l i n u x 操作系统继承了u n i x 类操作系统的所有优势:强大的网络特性,成熟而稳定的内核,支持多任务并行运作。不但如此,l i n u x 还具备独有的特性:源代码公开且可免费获得,并允许用户任意修改。这样存储网络的开发者可以用极低的成本获得l i n u x 的源代码,根据实现c i f s 的需要对l i n u x 进行修改,并针对不同的硬件环境和应用任务做出对i j n u x 的代码作出最大的优化。存储网络区域需要把服务器的请求迅速转变为对磁盘柜中具体数据的读写指令,然后把数据从磁盘柜迅速地传输给请求的服务器,这旱的数据传输时延必须满足服务器数据处理的需要,所以时延不能太高。这要求存储区域网络有极高的数据交换和传输效率,这也是全球网络存储工业协会( s n n ) 推荐使用光纤作为存储网络区域传输介质的原因。同理,为了达到较高的数据交换和传输效率,实现c i f s 的操作系统平台占用的硬件资源必须越小越好,这时开发者可以通过修改l j n u x 操作系统,删除u n u x 中不必要的所有模块,只保留“n u x的网络管理相关的内容和c i f s 需要的内容,以最大化的减少i j n u x 的体积和占用的硬件处理资源。因为l i n u x 的源代码公开且允许修改,这给了存储网络的开发者极大的方便,同时i j n u x 几乎免费,也降低了开发成本。但在l j n u x 上实现c i f s ,并不是在所有方面都具有优势。由于w i n d o w s和u n i x 类( 包括u n u x ) 操作系统处理用户连接的方式不一样,所以实际得到的效率也完全不同。w i n d o w s 采用轻量级的线程来响应用户连接,这样能够在极短的时间内完成相应用户请求的动作。同时由于线程和服务进程共享内存地址空间,因而它对系统资源消耗也非常少。但在线程出现错误或者异常的时候,则可能会危害到父进程。u n i x 类操作系统采用进程来响应用户请求,虽然每个进程启动会消耗掉比较多的系统资源,而且响应时间也会比较长,但是进程之间互相不会有任何影响。所以理论上l i n u x 平台上实现c i f s 的响应时间比w i n d o w 慢,但l i n u x 要比w i n d o w 稳定l ”l 。所以,在存储区域网络中使用l i n u x 操作系统平台既有优势也有不足。7中山大学数学与计算科学学院存储网络中c i f s 数据流程分析与传输效率改进1 3c i f s 协议概述本节是对c i f s ( c o m m o ni n t e m e tf i l es y s t e m ) 协议的概述,介绍了c i f s在存储网络中的重要作用,c l f s 的起源、现状、发展等内容。以期在第二章对c i f s 的流程进行详细分析前,能对c i f s 的背景有一个较清晰的认识。从本质上说,c i f s 协议是一种正在制定中的网络共享协议,它还未成为互联网工程部( i e t f ,i n t e m e t e n g i n e e f i n gt a s kf o r c e ) 的正式网络标准,该协议基于c s ( c l i e n t s e r v e r ) 模式,客户端使用此协议来访问服务器上的文件( 包括对文件的进行读写操作) ,服务器则通过对客户端进行合法性认证来决定是否向客户端提供服务、提供什么类型和级别的服务。1 3 1c i f s 协议在存储网络中的应用存储区域网络是网络技术在存储领域的一种崭新应用,它革新了人们对数据存储的原有观念,使数据存储的质与量有了很大的提高。而伴随存储区域网络的崛起的是一种新的协议c i f s 。参看示意图( 1 2 ) ,在存储区域网络中,所有服务器使用c i f s 协议共享磁盘柜或磁带库,服务器访问远端的磁盘柜或磁带库就像自己的硬盘一样,服务器无需考虑自己的文件系统是否与磁盘柜中的文件系统相容,也无需考虑自己访问的数据在磁盘柜的真实位置。服务器装有c i f s 协议的客户端,存储交换机装有c i f s 协议的服务器端,存储交换机来确定每个服务器的不同访问区域、不同访问策略以及所有必要的细节,而这些对服务器都是“不透明的”,服务器除了看到被允许访问的数据外,对存储区域的拓扑和存储交换机所作的大量工作一无所知,服务器就如读取本地硬盘的数据一样读取存储网络中的数据。实现上述功能,c i f s 协议发挥了核心的作用。下页的示意图描述了以数据流的角度观察的c l f s 在存储网络的位置l 。中山大学数学与计算科学学院存储网络中c i f s 数据流程分析与传输效率改进应用程序t 上c i f st0l操作系统t 上网络传输协议t 上设备驱动程序tj r传输介质存储网络中可以使t = | 的网络传输协议i s c s l ( s m a l lc o m p u t e rs y s i e mi i s c s l ( i n t e m e is c s i ) 跨越i p即把s c s l 帧封装在l p 报文中s c s i f c ( f i b r e c h 卸n e l ) ,s c s i 协议与f c 光纤通道协议的融合,即用光纤传输s c s l 帧。t c 朋p 协议栈。即常见的以太网传输协议。删( 异步传输模式) 。( 9i p i ( i n t e l l 远e n tp e r p h e n l i n l e r f a c e ) 协议。( dh p p l ( h i 曲p e r f o m a n c e p a f a l l e l i n t e r f a c e ) 协议。图1 - 4 以存储网络中数据流的角度描述的c i f s 位置图。注意:上图的“设备”指的是网络连接设备。1 3 2c i f s 协议的起源c l f s 的前身是服务器消息块( s m b ,s e r v e rm e s s a g eb l o c k ) 协议,s m b是一种网络共享协议,它被极为广泛的应用于各种类型的操作系统,我们接触的最直观的s m b 应用是w i n d o w 的网络邻居,我们可以通过网络邻居来访问同一网络内的共享资源。s m b 是上世纪8 0 年代中期制定的网络共享协议,随着2 0 年来i n t e m c t 的几何级的扩涨,信息技术的高速发展,人们对网络的服务质量有了越来越高的要求。原有的s m b 协议对快速涌现的新技术的应用和日益提高的信息安全性要求越来越力不从心,m i c r o s o f t 、i n t e l 、m m 等公司开始考虑制定c l f s 协议以取代s m b 协议,由于c i f s 协议在存储区域网络中发挥了重要的作用,c i f s 协议由全球网络存储工业协会( s n 认,s t o r a g en e t 、v o r k i n gl n d u s t r v a s s o c i a t i o n ) 负责组织和评审,并与2 0 0 2 年3 月制定出1 o 版的技术参考书1 1 2 i 。1 3 3c l f s 协议的现状与发展c i f s 协议是正在制定中的新的网络共享协议,虽然该协议的本质作用是文件共享,( 这里的文件包括网络设备、存储设备,以操作系统角度来看,这些设备是一种特殊文件) ,但c i f s 的应用已远远超过了文件共享本身。c i f s 同时被用来进行文件管理、存储管理、用户认证、数据鉴别、桥接不同类型的操作系统平台、数据安全性保证、支持u n i c o d e 字符、服务器的差错控制和恢复等。然而,自从它被提出的那一刻起,开发商之间的争执就没有停止过,由于c i f s拥有广阔的发展前景和极高的应用价值,开发商都希望在c i f s 协议标准的制定中握有更大的发言权,甚至推出满足自己定义的c i f s 协议标准的产品,意图快9厂fllj、illl中山大学数学与计算科学学院存储网络中c l f s 数据流程分析与传输效率改进速占领市场,使自己定义的c i f s 协议标准成为事实上的标准,来迫使全球网络存储工业协会( s n 认) 采纳为正式标准。从总体上看,开发商分为两大阵营:以m i c r o s o f t 为代表的丌发商制定有利于w i n d o w 平台的c i f s 协议标准;以i b m和s a m b a 为代表的开发商制定有利于u n j x 类( 特别是l i n u x ) 平台的c i f s 协议标准。丌发商之间的严重分歧使全球网络存储工业协会( s n 队) 于2 0 0 2 年推出一个技术参考书1 o 版( c i f st e c h n i c a lr e f e r e n c er e v j s i o n1 0 ) 后,再也无法制定进一步的更为详细的文档”。由于没有形成一个统一的标准,不同开发商各自丌发c i f s ,并自行定义和增加c i f s 的功能和指令,导致c i f s 的版本繁杂,同一指令不同版本有不同名称,甚至同一指令不同版本导致的c i f s 数据包的格式也不同,例如,最普及的w i n d o w 系统至少支持6 种不同版本的c i f s 协议以达到可接受的兼容性。每一种版本被形象地称为c i f s 的一种“d i a l e c t ”( 方言,地方话) 。c i f s 协议所定义的功能的数量在近几年中被扩展了好几倍,现在c i f s 至少支持1 0 0 种操作功能。现在功能的扩展主要集中在”4 】:1 文件访问控制2 文件与记录锁定3 文件缓冲安全性4 文件变更提示5 协议自主选择与优化6 扩展的文件属性7 捆绑( 群发) 的请求8 u n i c o d e ( 统一代码) 支持存储区域网络的快速发展,离不开c 1 f s 协议的支持,虽然有关c i f s 协议标准的争吵不断,但没有阻止存储区域网络产品的不断涌现。目前,很多公司已有自己成熟的运行c i f s 协议的存储网络产品,例如d e l l 与e m c 公司联合推出的c x2 0 0 、c x4 0 0 、c x6 0 0 ,思科公司的c i s c om d s9 0 0 0 系列,i b m公司的l b mt 0 t a l s t o r a g es a n 交换机系列等。这些存储网络产品的操作系统是针对不同的硬件环境和应用需求,把修改过的u n u x 操作系统、c i f s 的实现方案、必要的网络管理程序( 符合s n m p 标准的程序) 紧密地整合在一起形成的,其中对l i n u x 的修改主要是针对硬件环境强化i j n u x 的网络与存储管理功能、删除和精简与上述功能无关的所有部分。有些软件过程甚至被设计成以硬件来实现,以最大化的提高性能。所以不同公司网络存储产品的操作系统( 包括各自的c i f s 实现方案) 是和具体的网络存储产品紧密地捆绑在一起的,目前不存在通用性。而全球网络存储工业协会( s n l a ) 和因特网工程部( 1 e t f ) 希望制定一个通用的c i f s 协议标准,使不同公司的存储网络产品能够在一起工作,所以这个标准一定要统一存储网络中数据包的交换流程和格式。然而,由于各公司都希望把自己产品的交换流程和格式制定成标准,却不愿意公布自己的实现细节和具体方式,使得至今全球网络存储协会只是推出了一个c i f s 技术参考书。由于1 0中山大学数学与计算科学学院存储网络中c i f s 数据流程分析与传输效率改进存储区域网络的广阔发展前景和极高的应用价值,统一的c i f s 协议的制定应该只是一个时间问题。因为i b m 和s a m b a 开发的c i f s 协议的相关文档和源代码均公开,并可免费使用,很多开发商或多或少的参考了i b m 和s 锄b a 的c i f s 协议实现方式和源代码,本文就是以i b m 和s a m b a 的文档和代码为例,以i j n u x 为操作系统平台来分析c i f s 的数据交换流程和进彳亍传输效率的改进分析。1 4n e t b i o s 对c l f s 提供的支持目前,c i f s 的运作离不开n e t b l o s 的支持,参看示意图1 3 ,n e t b i o s 对c 1 f s 提供了连接服务,c i f s 目前的运作与n e t b i o s 关系密切。为了随后进行的对c i f s 的传输流程的分析,我们必须简要介绍n e t b l o s 对c i f s 提供的服务。由于存储网络可以使用多种网络传输协议,不论是使用s c s i 协议、f c( f i b r ec h a 蚰e 1 ) 光纤通道协议、i p i ( i n t e l l i g e n tp e r p h e r a l i n t e r f a c e ) 智能周边接口协议、t c p ,i p 协议,或是以某种方式混合使用了上述协议,它们都会提供类似t c p ,u d p 的网络传输控制功能。为了表述简单,我们在论述n e t b l o s 对c i f s 提供的服务时,假设是t c p 椰d p 协议在n e t b i o s 的下层。1 4 1n e t b i o s 对c i f s 提供的三种服务1 9 8 4 年,l b m 公司开发了一个能在小型子网内的主机之间进行基本网络通信的应用程序接口( a p p l i c a t i o np r o 铲a m m e r i n t e r f a c e ,a p i ) 。这个应用程序接口( a p l ) 需要传输层的协议来发送和接收数据。第二年,i b m 公司开发了一种传输层协议使得这个应用程序接口( a p i ) 能够确实发挥作用。随后l b m 干脆把该a p i 和这种传输层协议合并在一起成为一个整体,被称为n e t b l o se n h a n c e du s e ri m e r f a c e ( 网络基本输入输出系统的增强型用户接口) ,简称n e t b e u i ,下文称之为n e t b l o s 接口。当时传输层有几种不同的协议在使用,包括d e c n e t 、i p x s p x 和t c p i p 等,那一种都没有占据统治性地位,i b m 公司对这个接口进行了不断修改,使得这个n e t b e u i 接口能在几乎所有主流的传输层协议之上进行运作【l ”。当微软和英特尔公司开始创建当时被称为“c o r cp m t o c o l ”( 核心协议) 的c i f s 文件共享协议时,它们选择上文提到的应用程序接口来传送其上层的c i f s数据报,随后使用n b t ( n e t b i o so v e rt c p ) 的c i f s 协议成为标准的网络共享机制。该部分主要介绍会被上层的c i f s 服务使用的n e t b i o s 功能。n e t b l o s 运行在传输层之上,而t c p i p 协议是当今使用最广泛的传输层协议,所以n e t b i o s主要运行在t c p l p 协议之上,它身处于会话层。中山大学数学与计算科学学院存储网络中c i f s 数据流程分析与传输效率改进这里只介绍n e t b i o s 对上层协议c i f s 提供的三种服务:1 名称服务2 会话服务3 报文( d a t a 铲a m ) 服务( 1 ) 名称服务n e t b l 0 s 名称是被指定给网络上的计算机的名称,该名称能被人们识别和辨认。一般说来n e t b i o s 名称就是我们指定的计算机名称。我们可以通过w i n d o w 的网络邻居看到和我们处于同一局域网的其他主机的n e t b i o s 名称。n e t b l o s 的名称服务与d n s 域名服务有着几乎相同的作用,它们允许人们通过人们指定的名称来识别网络上不同的计算机,它们都是把一个易于人们识别的名称映射到一个主机所分配的i p 地址。只不过n e t b i o s 名称服务通常用于局域网而d n s 域名服务用于互联网。然而,对n e t b i o s 名称服务来说,给一个计算机名称注册一个i p 地址与解析一个计算机名称得出它的口地址是采用了很不相同的方法。为了便于理解n e t b i o s 名称服务的工作流程,我们先介绍n c t b i o s 名称服务定义中的主要属性,然后描述大体的服务规程。n e t b i o s 名称的注册和查阅即可以通过向局域网广播查询数据包来完成,也可以通过设置一个集中的n e t b i o s 名称服务器( n b n so f w i n s ) 来完成。由于n e t b i o s 名称服务存在两种方式,所以不能像d n s 域名服务一样只需设霞一台专门的服务器来运作,它需要管理员来配置客户端使用何种获取服务的方式l “l 。方式1 只使用广播方式( 这时客户端被称为b - n o d e ) 。方式2 只使用向n e t b i o s 名称服务器( n b n so rw i n s ) 注册和查询的方式( 这时客户端被称为p n o d e ) 。方式3 首先使用广播方式,若无响应,则使用服务器注册和查询方式( 这时客户端被称为m n o d e ) 。方式4 首先使用服务器注册和查询方式,若无响应,则使用广播方式( 这时客户端被称为h n o d e ) 。有关动态注册:在d n s 域名系统中,域名与i p 地址之间的联系永远是固定不变的,除非管理员进行改变。而在n e t b i o s 提供的名称服务中,主机的n e t b i o s 名称( 对w i n d o w 、l i n u x 等主流操作系统它同时也是计算机名称) 与i p 地址的联系
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 概率论与数理统计课件 第五章 大数定律与中心极限定理
- 2026年黑龙江省哈尔滨市道里区中考语文二模试卷(含详细答案解析)
- 能源化工企业设备档案管理自查自纠整改复查报告
- 2025执业兽医考试题库附参考答案详解(典型题)
- 乡村产业扶持项目中期检查验收管理细则
- 重组抗破伤风毒素单克隆抗体临床应用专家共识总结2026
- 2025年建筑行业数字化转型实施方法论
- 2026届江苏省宿迁市高考冲刺历史模拟试题含解析
- 2026年智能物流机器人标准化行业创新报告
- 2026年特殊医学食品技术突破报告
- DL∕T 5344-2018 电力光纤通信工程验收规范
- 仓储标准化管理培训课程PPT仓库收、发、存作业标准规范
- 武汉大学法硕复试真题
- 居家养老入户服务合同
- JJF 1101-2019环境试验设备温度、湿度参数校准规范
- GB/T 8806-2008塑料管道系统塑料部件尺寸的测定
- 大一《有机化学》题库Word版
- 英语课题结题报告范文
- 一例给药错误不良事件汇报
- 中国2型糖尿病防治指南课件
- 小学语文句型转换课件
评论
0/150
提交评论