基于云存储的重复数据删除文件系统设计与实现_第1页
基于云存储的重复数据删除文件系统设计与实现_第2页
基于云存储的重复数据删除文件系统设计与实现_第3页
基于云存储的重复数据删除文件系统设计与实现_第4页
基于云存储的重复数据删除文件系统设计与实现_第5页
已阅读5页,还剩65页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、分类号学校代码 1 0 4 8 7学号密级M201172630硕士学位论文基于云存储的重复数据删除文件系统设计与实现学位申请人:石俊杰学 科 专 业:计算机技术指 导 教 师:万继光答 辩 日 期:2013.5.27副教授A Thesis Submitted in Partial Fulfillment of the Requirementsfor the Degree of Master of EngineeringThe Design and Implementation of a De-duplication FileSystem Based on Cloud StorageCandid

2、ateMajorSupervisor: Shi Junjie: Computer Technology: Assoc. Prof. Wan JiguangHuazhong University of Science & TechnologyWuhan, Hubei 430074, P.R.ChinaMay, 2013独创性声明本人声明所呈交的学位论文是我个人在导师指导下进行的研究工作及取得的研究成果。尽我所知,除文中已经标明引用的内容外,本论文不包含任何其他个人或集体已经发表或撰写过的研究成果。对本文的研究做出贡献的个人和集体,均已在文中以明确方式标明。本人完全意识到本声明的法律结果由本人承担

3、。学位论文作者签名:日期:年月日学位论文版权使用授权书本学位论文作者完全了解学校有关保留、使用学位论文的规定,即:学校有权保留并向国家有关部门或机构送交论文的复印件和电子版,允许论文被查阅和借阅。本人授权华中科技大学可以将本学位论文的全部或部分内容编入有关数据库进行检索,可以采用影印、缩印或扫描等复制手段保存和汇编本学位论文。本论文属于保密,不保密。在年解密后适用本授权书。(请在以上方框内打“”)学位论文作者签名:指导教师签名:日期:年月日日期:年月日华中科技大学硕士学位论文摘要随着在线存储需求量的增长,各大云存储公司开始计费模式的探索,只有付费才能获得更好的服务,免费的云存储空间已经不能满足

4、用户的需求,云存储的成本问题已经开始影响用户的工作生活。针对上述问题,提出了一种基于云存储的重复数据删除文件系统。该系统是一个具有云存储增量同步的用户端文件系统,采用重复数据删除技术,自动将用户的本地数据无冗余上传到云端。系统由六个模块构成,用户接口模块接收从 Fuse 内核空间传递过来的系统请求,调用相关模块完成响应。云端同步模块利用云存储开放接口,配合系统各模块进行本地与云端数据同步。文件管理模块从云端获取文件列表,建立文件索引节点,对文件进行组织管理。文件操作模块处理系统读写请求。数据重删模块在源端进行重复数据删除,该模块采用基于内容的变长切分算法,使用一个长度固定的滑动窗口对文件数据计

5、算指纹,如果指纹模一个特定的整数等于预定的数值,就把窗口位置作为块的边界,若出现指纹相同的块则认为重复。将去重后的文件和记录数据块信息的元数据表上传到云端。垃圾回收模块在系统卸载时,回收不用的表和冗余的数据文件。利用多版本内核文件和虚拟机文件,对系统进行重复数据删除压缩比测试。结果表明,在大规模文档数据中,去重率最高达到 67%。以阿里云平台计费标准核算,1TB 用户数据理论上能够节省 4391 元/年。关键词:重复数据删除,云存储,文件系统I华中科技大学硕士学位论文AbstractAs the demand for online storage services increases, the

6、 cloud storage companiesbegin to explore the billing model. The better service you get, the more money you shouldspend. Free cloud storage space has been unable to meet the needs of users. The cost ofcloud storage is beginning to affect the users life. Aiming at this problem, a de-duplicationfiles s

7、ystem based on cloud storage is proposed.The system is a cloud storage incremental synchronization client file system, thede-duplication technology has been used in the system, the local data that without redundantwill be uploaded to the cloud storage automatically. The system consists of six module

8、s, theuser interface module receive the system request from the Fuse kernel, it will call somemodule to complete the response. Cloud synchronization module use the cloud storage openinterface to corporate with other modules for local synchronization. File managementmodule obtain the file list from t

9、he cloud synchronization module, create the index nodes, toorganize the files. File operation module handle the read and write requests. De-duplicationmodule remove redundant data at the source side, the module uses the content chunkingmethod, a fixed-sized sliding window is used to calculate the fi

10、ngerprint for each overlapsegment of the file, if fingerprint mod a special integer equals a predetermined amount, theportions of the object between these breakpoint values are classified as chunks, if thefingerprint is equal to the last fingerprint, it will be classified as duplicate data. After th

11、esestep, the system upload the file and metadata to the cloud storage. When the file system isgoing to be destroyed, garbage collection module will delete the useless metadata and theredundant file.Real-world data sets like Linux kernel and virtual machine disk images have beenused to evaluate the s

12、ystems de-duplication ratio. According to the results, in large-scaledocument data, the highest de-duplication ration can reach 67%. We used the Ali cloudplatform charging standard to count, when the system is used, one terabyte user data cansave 4391 yuan per year in theory.Keywords: De-duplication

13、, Cloud storage, File systemII华中科技大学硕士学位论文目录摘 要. IAbstract. II1绪论1.11.21.31.422.12.22.32.433.13.23.33.43.53.63.744.1研究背景与意义 . (1)国内外研究状况 . (2)研究目的和内容组织 . (4)课题来源 . (5)系统介绍与关键技术云存储系统概述 . (6)用户空间文件系统 FUSE 介绍. (11)重复数据删除技术 . (13)本章小结. (19)重复数据删除文件系统的设计系统概况. (20)设计目标. (20)系统总体设计 . (21)用户空间文件系统设计 . (23)重

14、复数据删除设计 . (27)垃圾回收模块设计 . (33)本章小结. (34)重复数据删除文件系统的实现开发环境 . (35)III华中科技大学硕士学位论文4.24.34.44.54.64.755.15.25.35.45.566.16.2用户接口模块 . (35)文件操作模块 . (37)文件管理模块 . (38)重复数据删除模块 . (41)云端同步模块 . (42)本章小结 . (46)系统性能测试与分析测试平台介绍 . (47)系统测试目的与方法 . (47)重复数据删除压缩比测试 . (48)测试结果与分析 . (49)本章小结 . (54)总结与展望全文总结 . (55)研究展望 .

15、 (56)致 谢. (57)参考文献. (59)IV华中科技大学硕士学位论文1 绪论1.1 研究背景与意义随着数据容量的增长,在线存储服务需求量也持续增长,存储服务商正在从单一的备份服务转向云存储平台。远程备份服务提供给用户一个在线的平台用来收集,压缩,加密和传输数据到一个拥有备份服务器的主机。云存储是指那种可扩展和具备弹性存储容量通过网络提供弹性服务,并且采用基于用户使用的价格服务,用户存储容量的改变所消耗的费用会及时核算1。重复数据删除技术是指在存储器中只存储冗余数据的单一拷贝,并且重复的数据通过一个指针指向相应的数据部分。随着存储服务从磁带转向磁盘,数据重复数据成为备份处理的关键模块。通

16、过只存储和传输重复数据的一份拷贝,重复数据删除不仅节省了带宽,而且节省了磁盘空间。对于提供商来说,重复数据删除带来了节省能源和制冷开支的附加价值,主要因为它减少了磁盘磁碟的数目。这些方面的开支节省同样也利于用户节省开支。重复数据删除的效率受到数据的类型,保持的时间和用户的数量几个因素的影响。然而,在将数据委托存储到云端有其固有的风险。因为,这样做数据的拥有者已经丧失了数据的控制权。尽管如此,大量用户和应用程序还是更加愿意将保存他们数据的存储任务交给云服务提供商。他们相信云服务提供商是公正的,同时拥有保护数据的安全措施。目前国内各大互联网公司,都开始尝试提供云存储服务。目前云存储已经开始由免费向

17、计费模式的探索,以收费为手段向用户提供更加优质的服务,比如提供更多的空间、更大的共享外链流量等。这给普通用户更好的使用云存储服务带来了价格因素的影响。针对上述问题,本文设计与实现了一个基于增量同步的用户空间文件系统,实现了本地文件无重复数据上传,节省云端空间,同时节省上传流量费用。目前典型的上传策略都是全文件上传,这样不仅在带宽上面有所浪费,同时会占用云端大量的空间。本系统在出现重复数据时,只需上传文件的元数据信息即可,能够高效的保1华中科技大学硕士学位论文证文件的完整性和正确性。1.2 国内外研究状况1.2.1数据重删系统技术特点重复数据删除是一种通过检测一系列文件相似数据块并且只保存冗余数

18、据的一份拷贝的技术2。后续请求存储数据块,如果存储空间已存在该数据块,仅通过指向具有相同数据块的文件 inode 节点或是数据块链表;并不需要再次存储该数据块,这使得系统存储更少的数据,因此节省了开支3,4。根据采用文件分块技术方式的不同可以有以下不同的方式实现重复数据删除。固定分块技术,比如使用在 venti5系统中的,简单的将文件以固定块边界切分。变长切分技术,这个在 LBFS3和 Deep Store6系统中使用,它滑动窗口计算 Rabin7或类似函数来计算指纹作为分块的边界,这样产生的是变长的数据块。这种方法可以提供更好的重复数据删除效率,这在插入或删除文件中的小部分字节非常有效。虽然

19、检测相同数据块的方法不同,但是固定分块和变长分块都用采用 MD5 或SHA18这种加密算法来计算数据块内容的哈希值用来区别不同数据块,同时这个哈希值能够帮助系统快速检测新生成的块是否已经存在。即使采用 128 位的 MD5 作为哈希值,依然有 1015 个块约合 1018 字节会产生一次冲突,假设平均块大小是 1KB,那么冲突率约为 10-9。通过 160 位的 SHA1 作为哈希值,能够使得 EB 级别的块存储冲突了降低到 7 10-18 9。重复数据删除和类似的技术已经应用到网络文件系统中用来减少带宽和存储的需求,同时用来节省虚拟机镜像的存储空间,在备份系统中存放更少的数据,以及在归档系统

20、中减少存储请求的次数3,10,11。在线系统中使用重复数据删除需要快速的检测重复的数据块;Bhagwat 开发的技术12能够解决这个问题。重复数据删除是通过检测数据流中的冗余数据,只会保留数据块的一份拷贝,重复的数据块则使用指针指向原始数据。与数据压缩技术相比,重复数据删除技术可以消除文件内部和文件间的冗余数据,而数据压缩只是相对一个文件而言的。另外,重复数据删除技术还能消除多个数据集间的冗余数据。2华中科技大学硕士学位论文1.2.2云存储数据同步策略云存储属于云计算技术的一个领域,它是指通过网络技术、集群应用或分布式文件系统等技术,协调网络中不同类型的各种存储设备,使其共同对外提供业务访问和

21、数据存储服务功能的系统13。目前云存储服务受到各大公司的重视,亚马逊、微软、谷歌、苹果等公司已经推出了相关服务。这些公司提供的服务方式有所不同,但都是以应用服务和存储服务为主,本文将主要讨论云服务在存储方面的应用。表 1.1 对各大云存储公司云端文件同步策略进行对比。表 1.1 各大云存储应用同步策略云存储Google DriveDropboxAmazon s3百度云盘酷盘坚果云新浪微盘金山快盘文件下载文件的链接完整文件完整文件完整文件完整文件完整文件完整文件完整文件文件上传完整文件完整文件/部分完整文件完整文件完整文件/部分完整文件/部分完整文件完整文件增量同步否支持否否支持支持否否完全同步

22、支持支持支持支持支持支持支持支持表 1.1 列出了目前主流的云存储应用的同步策略,Google Drive 将默认的下载方式设定为只下载文件的链接或者说是快捷方式,一切还是在云端,这在众多云存储应用中脱颖而出,用户从云端同步数据量大幅减少,节省同步的延迟。Dropbox、酷盘、坚果云这几款云存储应用推出了增量同步的功能。如果用户已经上传过一个大文件,再次修改这个文件时,这些应用会通过智能分析这个文件和上一个版本之间修改的部分,在同步时只上传两个版本的差异部分,而不必再次上传完整的文件,从而大大加快文件的同步速度、降低流量的消耗,这就是增量同步。对于某些类型的文件,例如体积大的文档、数据库等,该

23、技术最高能将同步速度提高上百倍。可见这些云存储应用采取的同步策略都是在上传或是下载方面3华中科技大学硕士学位论文减少同步数据量来提升系统的性能。1.3 研究目的和内容组织由于目前主流的云存储平台还没有提供相应的增量同步功能。但是各大云存储服务商都已经开始进行收费策略,随着用户数据量的持续增长,用户使用云存储平台的成本必然成为一个需要研究的问题。本文利用重复数据删除技术,消除冗余的数据,同时设计相关元数据表保证数据的完整性来节省存储成本。本文基于普通的云存储平台实现用户上传数据的去重,分析去重前后的成本。本文的主要内容如下:第一章首先介绍了重复数据删除技术的背景知识以及相关策略,然后分析了目前主

24、流云存储平台的同步策略。同时概括性的介绍了本文的主要研究内容及其工作意义。第二章从宏观上介绍了整个系统基于的背景和关键技术。简要介绍了云存储的分类和发展趋势,着重介绍了各大云存储服务商的成本对比,并分析了各大云存储服务商的优势。对系统设计的用户空间文件系统 Fuse 框架进行了原理和架构的介绍。最后详细介绍了重复数据删除技术的策略和基本流程,并对常用重复数据删除方案做了对比。第三章首先介绍了本系统的设计方案,以及系统的设计目标。然后介绍了系统的整体框架,并对系统的工作流程做了详细介绍。最后明确了系统各模块需要实现的功能以及接口。第四章介绍了系统的开发环境,以及各模块的重要数据结构以及运行原理和

25、流程。通过介绍重要的结构体和重要的流程图,可以清晰的认识各模块的具体实现。第五章根据设计实现的增量同步文件系统的代码,首先测试重复数据删除的效率,然后分析相关元数据的开销,根据论文前面收集的各大云存储的价格计算成本节省,最后通过分析相应的测试数据,分析系统所能带来的效益。第六章总结完成系统过程中所做的工作,分析系统的优点和缺点。4华中科技大学硕士学位论文1.4 课题来源本课题受国家 973 项目“高效能存储系统组建方法研究”(项目编号:2011CB302303)资助。5华中科技大学硕士学位论文2 系统介绍与关键技术本章将介绍系统设计和实现过程中所需要的背景知识和关键技术。首先介绍云存储平台的基

26、本原理和发展趋势,同时结合各大云存储服务商的计费策略进行成本分析。最后根据系统所涉及的关键技术用户空间文件系统 Fuse 和重复数据删除技术进行相关原理和工作流程的介绍。2.1 云存储系统概述云存储这个技术领域受到了各大存储公司的关注。亚马逊公司推出了支持数据持久性存储的弹性块存储服务;谷歌公司开发了在线存储服务 GDrive;云存储平台提供商 Nirvanix 和基于内容分发网络服务供应商 CDNetworks 通过在云存储领域的技术合作,提供内容传送服务和云存储集成平台;易安信公司收购了伯克利数据存储系统公司,易安信公司通过该公司的 Mozy 在线服务软件,推出了 SaaS 服务;微软公司

27、推出云存储平台 WindowsAzure,同时其庞大的数据中心已经分布在美国各地;存储领域的 IBM 也已经将云存储作为公司业务拓展的一个重要领域。传统存储与云存储相比,有以下不同:(1)数据管理方面,云存储不仅要管理和支持海量数据,而且要能够对传统文件进行访问读取。(2)功能需求方面,传统存储针对一些高性能计算的应用,而云存储则提供在线网络存储服务。(3)性能需求方面,数据可靠性和安全性是云存储需要考虑的问题,云存储这种在线存储服务用户规模很大,同时提供的服务具有多样化的特点,云存储需要在性能方面进行不断改进。通过对云存储的特点的分析,可以将其划分为四个层面,自顶向下依次为:访问、应用接口、

28、基础管理以及存储四大层面。图 2.1 展示云存储平台的整体框架。(1)用户访问层授权用户只需按照公用应用接口就可以在任何地方,通过终端联网享受云存储6华中科技大学硕士学位论文服务。访问层个人空间服务、商空间租赁等企事业单位实现数据备份、数据归档等视频监控、IPTV等系统的集中存储。在线存储等网络(广域网或互联网)接入、用户认证、权限管理应用接口层公用API接口、应用软件、web service集群系统基础管理层 分布式文件系统网格计算内容分发P2P重复数据删除数据压缩数据加密数据备份数据容灾存储层存储虚拟化、存储集中管理、状态监控、维护升级等存储设备(NAS、FC、iSCSI等)图 2.1 云

29、存储框架(2)数据服务层该层可以根据不同用户的需求,实现不同的应用接口,提供对应的服务。由于针对用户设计,它具有很强的可扩展性。(3)数据管理层该层对上提供统一的管理视图,对下组织多台设备协同工作,使得上层服务不会受到底层存储的影响,同时底层存储的改变不会影响上层服务。(4)数据存储层该层对外提供海量的数据存储,对内组织大量独立的存储设备,对多台存储设备进行集中管理,并且能够实现存储容量的弹性扩展。2.1.1云存储的应用和工作原理目前各大云服务提供商提供的云计算服务主要由 4 块核心服务组成,以最早推出云存储服务的亚马逊网络服务(Amazon Web Services)为例,简要介绍提供的 4

30、块核心服务14。(1)弹性计算云用户可以根据需求短时间增加或减少容量。并且可以启动若干个服务器实例。这些操作都是通过开放的 API 控制,应用程序可以根据自身需要自动扩展。弹性计算7华中科技大学硕士学位论文云具有可靠性和安全性,能够提供一个可靠的环境,保证用户的计算资源的安全。(2)简单储存服务Amazon S3 服务15是以 Web 服务界面形式提供,用户通过网络在任何位置存储和搜索任意大小的数据。这个服务提供了一个具有高性能、可扩展和高效益的基础存储设施,能够为应用开发者带来很大的便利。(3)简单数据库服务该服务也是一种网络服务,用户能够使用和扩展数据库。该服务是的用户可以访问常用的数据库

31、引擎16。能够直接支持用户现有数据库的代码、应用程序。方便用户使用该数据库服务。(4)简单队列服务简单队列服务是为了实现在分布式计算机系统之间的工作流而设计的。目前主要以消息机制完成多客户之间的并发操作。SAE_STD_LIBvisitorsFirewallProxyStorageProxyStorageProxyStorage图 2.2 新浪云应用框架在云存储服务中,简单储存服务应用的比较广泛,本文的基于增量的用户空间文件系统也是基于该服务实现的,基于简单存储服务,百度云提供了百度云盘,新浪云提供了新浪微盘,金山云提供了金山快盘,这些都是基于云存储扩展的云应用。图 2.2 是以新浪云为例展示

32、的云存储服务使用的框架。8华中科技大学硕士学位论文Storage 是新浪云(SAE)为开发者提供的分布式文件存储服务,用来存放用户的持久化存储的文件。用户可以通过 API 读取文件、写入文件、获取文件属性、取得文件列表等操作。基于 Storage,开发者可以很方便的开发出类似于云存储的应用。2.1.2云存储的部署模型(1)私有云云存储设施专门提供给一个企业操作使用。它可以被这个公司直接管理或通过第三方管理。只要使用的方式正确,就能为企业带来效益17。(2)社区云这种部署模型支持一个特定的社区里面的多加公司具有相似的目标如任务,安全需求,政策,云存储基础设施能够被这样的多个公司共享。它可以被这些

33、公司直接管理或是通过第三方管理17。(3)公有云这个服务的云存储设施向所有用户提供或是一个大的公司组织。这种设施一般由提供云存储服务的公司所享用,能够向用户提供相关的云存储服务17。(4)混合云这种云存储设备一般由两种或多种云构成,可以是私有云,公用云或社区云之间的某种混合关系。它们之间是相互独立的,但是在云内部根据一些标准规范能够结合起来使用,使得数据和应用具有可移植性。比如在云存储系统之间实现负载均衡17。2.1.3云存储的发展趋势根据希捷公司的市场调研报告显示,预计到 2020 年全球的磁盘容量将有 60%以上用于云存储。云存储将主要以服务形式提供存储。随着移动互联网的发展,手机终端的用

34、户量大幅增加、大数据以及云计算正在影响着计算机技术的发展趋势,这同以往相比最大的特点就是用户是几十亿数量级,对智慧存储提出新要求。同时,根据互联网数据中心的调查显示,用户开始使用公共云或自己构建的私有云以及托管的私有云。云计算在未来几年将会持续高速增长,云存储在云计算中将不仅仅是存储数据而会用来提供服务。9华中科技大学硕士学位论文一些数据密集型的应用如备份18、归档和存储服务将成为云服务应用,在云环境下,随着虚拟化平台的推动,对存储的需求无论是私有云还是公有云,开放的应用模块和易结合的基础架构将会是未来云计算下数据中心的发展方向。在行业的发展变化过程中,在存储方面,需要对设备的购买支出、使用率

35、和管理方面进行优化。采用重复数据删除节省磁盘开支。在减少支出的前提下,分级存储解决策略,以及横向扩展技术,大幅提升了存储的效率19。同时在云服务下将会有更多的用户从虚拟层面来存储,需要更加重视虚拟化的稳定性和安全性。可见,在云时代的发展下对云存储提出了更多的要求,主要有成本节省、优化管理、提升效率,未来云时代的应用需要通过创新的技术来发展壮大。2.1.4云存储的成本分析目前国内各大云存储提供商的计费体系都是基于 amazon s3 的计价模式20来设计的。一般的云存储费用包括了用户使用的容量,外网流量和用户请求云端的次数。其中最基本的计费部分是云存储磁盘容量计费,根据用户占用的存储空间收取费用

36、;第二部分的收费是流量计费,用户从云端读取数据产生的流量计费;最后是用户向云端请求次数计费,一般以元/万次为单位计算费用。表 2.1 列举各大云存储提供商的云存储费用。表 2.1 成本对比阿里云金山云盛大云Amazon s30G-500G500G-1T1T 2T2T - 10T10T- 20T20T -50T0.6 元/GB/月0.55 元/GB/月0.55 元/GB/月0.5 元/GB/月0.45 元/GB/月0.45 元/GB/月0.42 元/GB/月0.39 元/GB/月0.39 元/GB/月0.35 元/GB/月0.32 元/GB/月0.32 元/GB/月0.6 元/GB/月0.6 元

37、/GB/月0.6 元/GB/月0.6 元/GB/月0.6 元/GB/月0.6 元/GB/月0.58 元/GB/月0.58 元/GB/月0.49 元/GB/月0.49 元/GB/月0.49 元/GB/月0.49 元/GB/月由于本文重点在存储空间上的研究,所以关于各大云存储服务商针对请求方面的收费细则,没有列出。同时 amazon s3 已标价提供用户购买的存储空间要比国内大很多,同时在流入流量方面在小于 1G 的时候 amazon s3 是免费的。在上述几家云10华中科技大学硕士学位论文存储服务商中,在存储容量小于 50T 的情况下金山云的收费最低,在流出流量方面金山云的收费也是最低的。2.2

38、 用户空间文件系统 FUSE 介绍FUSE(用户空间文件系统)21作为 Linux 系统平台上可加载的内核模块,非特权用户能够被允许创建功能齐全的文件系统,而且不用重新编译内核。它仅仅提供内核模块的接入口,但是本身的主要实现代码在用户空间中完成,通过用户空间的代码完成对文件系统操作的处理。2.2.1FUSE 的工作原理FUSE(用户空间文件系统)和真实的文件系统不同,它的超级块,I 节点,文件入口结构体等文件系统重要结构都是由内存虚拟而来,不用关心它在磁盘上的真实结构,对用户真实的数据请求通过驱动和接口一层层传递到用户空间中用户自己编写的具体实现流程中来,这用就为用户开放自己的文件系统提供了便

39、利,简而言之,用户不用关心内核态文件系统调用是如何工作的,只需要完成用户空间下文件操作的具体逻辑过程就可以了。FUSE 由 FUSE 内核模块、FUSE 库以及一些挂载工具三个部分组成。FUSE 内核模块实现了和 VFS22(虚拟文件系统)的对接,它看起来像一个普通的文件系统模块。另外,FUSE 内核模块实现了一个可以被用户空间进程打开的设备,当 VFS发来文件操作请求之后,它将该请求转化为特定格式,并通过设备传递给用户空间进程,用户空间进程在处理完请求后,将结果返回给 FUSE 内核模块,内核模块再将其还原为 Linux Kernel 需要的格式,并返回给 VFS。图 2.3 是用户请求传送

40、过程的具体流程。用户通过列出详细文件(LS)的系统命令查询文件夹里面的文件,通过系统库模块转换为系统调用,从用户空间将请求下发到内核空间,虚拟文件系统(VFS)获得了该请求,选择相应的文件系统的内核模块,将该请求转发给 FUSE 的内核模块。处于内核态的 FUSE 模块通过目录/tmp/fuse/的文件描述符与处于用户态的,被 FUSE挂载的文件系统进行通信,最后完成相应的系统命令。11华中科技大学硕士学位论文./fufs /tmp/fuseLs -l /tmp/fuseglibclibfuseglibcUserspaceKernelFUSEVFSNFSExt3图 2.3 FUSE 工作流程2.2.2FUSE 的应用由于 FUSE 提供给开发者不关注内核空间的函数接口,开发者可以短期开发基于用户空间的文件系统。基于 FUSE 开发的文件系统种类很多,从网络存储到实际某些功能需求的应用都有。Lessfs23是一个高性能的用来剔除冗余文件数据的 Linux工具,它是基于 FUSE 方式在用户空间开发的,提供了不错的性能表现,处理文件数据传输率高达

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论