付费下载
下载本文档
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
企业私有云存储技术研究
0企业存储平台的应用状况目前,许多用户正在关注互联网行业、石油和石化行业、数字媒体行业、医疗行业、金融分析行业及其他部门。文件和数据量的指数在增加。传统的文件存储工具不能适应企业的增长,管理体制复杂,系统成本和运营成本不断上升,存储行业面临着一些挑战。如邮件、图片、音频、视频等非结构化数据爆炸性增长;越来越多的企业级应用对高性能联机事务处理能力和复杂查询操作能力的需求不断提高;对数据访问带宽和响应时间以及数据的并行访问业务有更高的要求;企业现有系统的扩展能力差,难以满足企业快速变化的业务需求。传统的NAS方案扩展能力有限,并且面向企业级的NAS设备价格往往非常昂贵,购买以及安装独立的NAS设备,将面临着巨大的经济压力和额外的维护成本。因此,为企业提供一种经济可行的、易于管理的存储平台,可以帮助企业使用尽可能低的成本完成数据与计算双重密集型任务。云计算具有动态部署的功能,可以利用廉价的服务器构建企业级存储平台,具有更加弹性、更加安全以及更低的成本。尤其是私有云能够保护企业核心数据的安全,相比公共云服务,私有云服务所带来的风险会降低很多。企业针对关键业务应用、核心数据存储以及数据的高可靠性需求上更容易接受企业私有云的运营模式。1企业云存储模式1.1存储分布式存储系统的构建Hadoop是Apache下的一个开源项目,由HDFS、MapReduce、HBase、Hive和ZooKeeper等项目组成。Hadoop主要由两部分构成:Hadoop分布式文件系统(HDFS)和在HDFS上的MapReduce编程模型实现。HDFS是GoogleGFS的开源版本的实现,作为一个高度容错的分布式文件系统,它能够提供高吞吐量的数据访问,适合存储海量(PB级)的大文件(通常超过64M),其原理见图1。HDFS采用Master/Slave结构。其中NameNode主要负责维护集群内的元数据,所有块的元数据都被注册在NameNode,对外提供创建、打开、删除和重命名文件或目录的功能。DataNode负责存储数据,并提负责处理数据的读写请求。DataNode定期向NameNode上报心跳,NameNode通过响应心跳来控制DataNode。HadoopHBase是基于GoogleBigtable的开源实现,属于Hadoop的一个子项目。HadoopHBase可通过利用HadoopHDFS提供的文件存储系统,HadoopMapReduce提供的海量数据处理能力和HadoopZookeeper提供的协同服务,构建一个高可靠性、高性能、面向列、可伸缩的分布式存储系统。这种分布式存储系统的特点是实现可在廉价节点上搭建起大规模结构化存储集群。HBase由一个主节点(Master)协调一个或多个区域服务器(Regionserver)从节点组成,见图2。HadoopHBase主节点负责引导初始安装,分配区域给已注册的区域服务器,恢复区域服务器的故障。主节点负载较轻,区域服务器0到多个区域,响应客户端的读/写请求。区域服务器同时负责通知主节点,区域分裂新的子区域的信息,以便主节点管理父区域的下线及替代子区域的分派。HBase依赖于Zookeeper提供协同服务,默认情况下,一个HBase对应一个Zookeeper实例为集群状态提供授权。1.2云存储模式分类云存储概念是在云计算概念上延伸和发展出来的一个新的概念。云存储的本质是服务,云存储通过计算机集群技术、网格技术和分布式文件系统等技术,将网络中大量各种不同类型的存储设备组织起来协同工作,提供统一的数据存储服务和业务访问功能的一种存储模式。企业私有云存储模式实现企业现有资源的改造扩展,从而应对企业级用户高速增长的数据量存储业务与数据高速处理业务。云存储模式比较传统存储模式具有如下特点:第一,在功能上,相比传统存储模式面向如高性能计算、事务处理应用,云存储模式具有面向多种类型的网络在线存储服务的特点;第二,在性能上,云存储模式具有高数据安全性、高可靠性、高效率,以及适合处理大规模用户、网络环境复杂多变等业务的特点;第三,在数据管理功能上,云存储模式需要满足传统文件访问方式,同时能够支持海量数据管理并提供公共服务支撑功能,以方便云存储系统后台数据的维护。基于上述特点,云存储模式整体架构自底向上依次是:数据存储层、数据管理层、数据服务层以及云端应用层。数据存储层包括底层的存储介质部署、计算机集群搭建以及设备虚拟化过程;数据管理层实现用户权限控制、数据安全等业务;数据服务层实现数据存储、共享和备份业务逻辑;云端应用层实现用户的定制业务。云存储模式整体架构见图3。2对象实体数据存储HDFS具有高容错性和高吞吐量,以较低的成本将海量文件存储在普通机器集群上。HDFS作为企业私有云存储平台的底层分布式文件系统,适合处理和存储大文件。但是,HDFS系统结构不适合小文件的处理和存储业务,可以利用HDFS作为对象数据存储容器,通过在HDFS上层构建一个抽象层,对外提供对象存储功能。基于Hadoop的企业私有云存储架构模型见图4。模型由对象访问接口层、对象元数据存储层、对象实体数据存储和数据归档管理层四部分组成。对象访问接口层对外提供API接口供上层云应用业务调用,同时提供了REST、SOAP和HTTPS支持WEB业务的访问,提供NFS网关实现网络文件共享服务。对象元数据存储层是基于HBase实现,负责对象数据创建、查询和删除等业务,利用HBase可以满足系统的扩展性和高可靠性。对象实体数据存储基于HDFS分布式文件系统,能够实现对象数据和归档文件的可靠存储,同时支持数据冗余。数据归档管理层利用HadoopMapReduce模块实现对零散小对象文件的归档业务,以及归档文件存储管理和失效对象的磁盘空间回收等功能。对象访问接口层提供了主流的Web服务接口,主要负责为云端应用提供访问接口。在Hadoop开源框架下实现可供应用层调用的API接口、外部应用可以通过接口调用实现对对象元数据的创建、查询和删除等功能。对象元数据存储层主要利用HBase开源架构实现了对象元数据的管理等功能。HBase介于NoSQL和RDBMS之间,仅能通过主键(rowkey)和主键的range来检索数据,仅支持单行事务。该模型的对象元数据存储层共设计了三张表,分别是用于存储对象元数据索引信息的索引容器表,索引容器表结构见表1,用于描述对象元数据信息的对象元数据表,对象元数据索引表见表2和描述用户删除的失效数据的已删除数据表,已删除数据表结构见表3。对象元数据存储层建立在HBase之上,通过管理和维护这三张表实现了对象元数据的创建、查询和删除,以及小文件数据归档的功能。当访问层提交创建数据请求后,系统会检查访问合法性和索引容器表的容量,如果索引容器表的容量不够,将会创建一条新的对象元数据索引容器记录。通过检查后将对象元数据信息添加至对象元数据索引表,同时更新索引容器表的容量,最后将对象元数据存储到HDFS文件系统中。当访问层提交删除数据请求后,系统会检查访问合法性,通过检查后删除对象元数据在对象元数据索引表中的索引信息,同时在已删除数据表添加一条删除数据记录,更新索引容器表容量,进入数据归档周期时,系统将会删除HDFS文件系统中的对象元数据。数据归档管理层的主要任务是周期性执行的MapReduce任务,实现对象实体数据的归档和压缩工作。系统周期性的扫描对象元数据存储层元数据信息表,统计未归档的数据信息,根据配置的归档文件大小限制,对数据进行分组。分组完成后将每个分组中的对象文件合并到一个归档文件中,更新相关对象元数据信息表中的数据标识信息。3存储模式及应用基于Hadoop实现的企业私有云存储平台,能够为企业提供一种廉价的大规模数据存储以及高速数据处理的解决方案。同时,该存储平台具有弹性扩展的特性,能够满足企业对存储平台实时的按需扩容的需求。基于HBase实现的对象存储模型,以HDFS作为数据存储的容器,解决了数据冗余备份的问题。针对企业部门众多,各部门数据格式不同等情况,企业私有云存
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2026年国际阴郁症心理测试题及答案
- 2022上海事业单位统考历年真题+刷题组答案解析
- 2023年广西事业单位考试B类模拟题及答案 下载量超10万的备考资料
- 2026社招德语游戏客服3年经验面经配套面试题库及标准答案
- 2021临床器械试验方案设计专项考试题及详细答案解析
- 2024工地铆工安全考核必刷题及标准解析答案
- 2024中储粮笔试历年高频考题及标准答案解析
- 开美发店股东协议书
- 首发精神分裂症的治疗
- 整体护理病例健康指导
- 2026中国商用飞机公司招聘面试题库
- 4.1《致敬劳动者》课件 统编版道德与法治三年级下册
- 中考总复习数学100道基础题三大专题
- OpenClaw专题学习培训
- 安徽省合肥市一六八中学2026届高三3月份规范训练 语文试卷(含答案详解)
- 第一章 三角形的证明及其应用 单元测试(含答案)2025-2026学年数学北师大版八年级下册
- 2026年迎接国家义务教育质量监测工作实施细则方案及应急预案
- (2025年)食品生产许可证审查员考试全考点试题带答案
- 水包砂施工技术交底
- 国别与区域研究毕业论文
- 防水公司挂靠协议书
评论
0/150
提交评论