向黎洪-19209307-云存储的核心技术及发展状况_第1页
向黎洪-19209307-云存储的核心技术及发展状况_第2页
向黎洪-19209307-云存储的核心技术及发展状况_第3页
向黎洪-19209307-云存储的核心技术及发展状况_第4页
向黎洪-19209307-云存储的核心技术及发展状况_第5页
已阅读5页,还剩3页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、.:.;云存储的中心技术及开展情况姓名:向黎洪 学号:19209307联络方式如今这个信息科学技术飞速开展得时代,无论是企业还是个人,都无时无刻不在享用着先进信息技术的成果。存储技术作为人们信息数据处置领域的一项重要技术,也时辰遭到人们的关注。但随着社会的开展,人们所需求的数据量的不断增长,数据信息的处置技术也要随之不断提高。而在数据信息处置领域中的存储技术更是需求不断满足人们的需求。当今世界是曾经来到了一个信息大爆炸的时代,至少在未来几年里,数据将以每年50%到60%的速度爆炸式增长,人们对数据的存储量及其存活期有了更高的要求。另外,企业的业务开展和合规性要求也要求

2、企业延伸数据的保管期。此外,如今的商业环境出现了越来越多的诉讼要素,这些都要求企业寻觅一种全新的辅助存储方案。新建数据越来越多,而且企业有很多的缘由必需保管数据,不论是为了满足合规性要求,还是IP的需求,或是为了反复运用它们或其他缘由。总体上企业在长期保管数据方面通常有如下五个方面:1、归档 2、本地数据维护备份 3、远程数据维护灾难恢复 4、合规性/诉讼 5、普通长期数据保管这些方案虽然根本上能处理企业在长期保管数据方面的问题,但这些方案并不满足企业的经济效益,而且思索到方案优化方面,这些方案对数据存储带来了极大的不便。随之我们发现了一种新的趋势,可以处理企业的存储之痛,那就是与数据存储有关

3、的各种云效力。云存储作为一项大型数据存储效力,便是在企业业务开展和合规性要求下开展起来的。目前基于云存储概念的网盘市场曾经详细了诸如网易、腾讯、Google、DBank华为背景、金山等诸多的知名企业。云存储成为网络经济下一个新的增长点似乎曾经成为一种共识,知名企业的扎堆也使整个行业从一开场就面临着猛烈的竞争。与传统的存储设备相比,云存储不仅仅是一个硬件,而是一个网络设备、存储设备、效力器、运用软件、公用访问接口、接入网、和客户端程序等多个部分组成的复杂系统。各部分以存储设备为中心,经过运用软件来对外提供数据存储和业务访问效力。可以说,云存储除在数据存储方面比较有竞争力外,还更加强调它本身的效力

4、特性。云存储是在云计算(cloud computing)概念上延伸和开展出来的一个新的概念,是指经过集群运用、网格技术或分布式文件系统等功能,将网络中大量各种不同类型的存储设备经过运用软件集合起来协同任务,共同对外提供数据存储和业务访问功能的一个系统。 当云计算系统运算和处置的中心是大量数据的存储和管理时,云计算系统中就需求配置大量的存储设备,那么云计算系统就转变成为一个云存储系统,所以云存储是一个以数据存储和管理为中心的云计算系统。云存储系统的构造模型由四个模块组成,其分别是:存储层、根底管理层、运用接口层和访问层。其中存储层是云存储最根底的部分。云存储中的存储设备往往数量庞大且分布地域很广

5、,彼此之间经过广域网、互联网或者FC光纤通道网络衔接在一同。存储设备之上是一个一致存储设备管理系统,可以实现存储设备的逻辑虚拟化管理、多链路冗余管理,以及硬件设备的形状监控和缺点维护。云存储最中心的部分是根底管理层。根底管理层经过集群、分布式文件系统和网格计算等技术,实现云存储中多个存储设备之间的协同任务,使多个的存储设备可以对外提供同一种效力,并提供更大更强更好的数据访问性能。CDN内容分发系统、数据加密技术保证云存储中的数据不会被未授权的用户所访问,同时,经过各种数据备份和容灾技术和措施可以保证云存储中的数据不会丧失,保证云存储本身的平安和稳定。而运用接口层是云存储最灵敏多变的部分。不同的

6、云存储运营单位可以根据实践业务类型,开发不同的运用效力接口,提供不同的运用效力。比如视频监控运用平台、IPTV和视频点播运用平台、网络硬盘援用平台,远程数据备份运用平台等。再者就是访问层。任何一个授权用户都可以经过规范的公用运用接口来登录云存储系统,享用云存储效力。云存储运营单位不同,云存储提供的访问类型和访问手段也不同。要完成这些部分的效力功能就需求相应的技术前提,包括集群技术、网格技术和分布式文件系统、CDN内容分发、P2P技术、数据紧缩技术等。其中的中心技术就是基于云计算的编程模型、海量数据分布存储技术、海量数据管理技术、虚拟化技术、云计算平台管理技术。(1)编程模型 MapReduce

7、是Google开发的java、Python、C+编程模型,它是一种简化的分布式编程模型和高效的义务调度模型,用于大规模数据集大于1TB的并行运算。严厉的编程模型使云计算环境下的编程非常简单。MapReduce方式的思想是将要执行的问题分解成Map(映射)和Reduce(化简)的方式,先经过Map程序将数据切割成不相关的区块,分配调度给大量计算机处置,到达分布式运算的效果,再经过Reduce程序将结果汇整输出。这样提高了数据的存储效率。 (2) 海量数据分布存储技术 云存储系统由大量效力器组成,同时为大量用户效力,因此云存储系统采用分布式存储的方式存储数据,用冗余存储的方式保证数据的可靠性。云存

8、储系统中广泛运用的数据存储系统是Google的GFS和Hadoop团队开发的GFS的开源实现HDFS。 GFS即Google文件系统Google File System,是一个可扩展的分布式文件系统,用于大型的、分布式的、对大量数据进展访问的运用。GFS的设计思想不同于传统的文件系统,是针对大规模数据处置和Google运用特性而设计的。它运转于廉价的普通硬件上,但可以提供容错功能。它可以给大量的用户提供总体性能较高的效力。 一个GFS集群由一个主效力器master和大量的块效力器(chunkserver)构成,并被许多客户Client访问。主效力器存储文件系统全部的元数据,包括名字空间、访问控

9、制信息、从文件到块的映射以及块的当前位置。它也控制系统范围的活动,如块租约lease管理,孤儿块的渣滓搜集,块效力器间的块迁移。主效力器定期经过HeartBeat音讯与每一个块效力器通讯,给块效力器传送指令并搜集它的形状。GFS中的文件被切分为64MB的块并以冗余存储,每份数据在系统中保管3个以上备份。 客户与主效力器的交换只限于对元数据的操作,一切数据方面的通讯都直接和块效力器联络,这大大提高了系统的效率,防止主效力器负载过重。 (3) 海量数据管理技术 在云存储系统中需求对分布的、海量的数据进展处置、分析,因此,数据管理技术必需可以高效的管理大量的数据。云存储系统中的数据管理技术主要是Go

10、ogle的BT(BigTable)数据管理技术和Hadoop团队开发的开源数据管理模块HBase。 BT是建立在GFS, Scheduler, Lock Service和MapReduce之上的一个大型的分布式数据库,与传统的关系数据库不同,它把一切数据都作为对象来处置,构成一个宏大的表格,用来分布存储大规模构造化数据。 Google的很多工程运用BT来存储数据,包括网页查询,Google earth和Google金融。这些运用程序对BT的要求各不一样:数据大小从URL到网页到卫星图象不同,反响速度不同从后端的大批处置到实时数据效力。对于不同的要求,BT都胜利的提供了灵敏高效的效力。 4虚拟化

11、技术 经过虚拟化技术可实现软件运用与底层硬件相隔离,它包括将单个资源划分成多个虚拟资源的裂分方式,也包括将多个资源整合成一个虚拟资源的聚合方式。虚拟化技术根据对象可分成存储虚拟化、计算虚拟化、网络虚拟化等,计算虚拟化又分为系统级虚拟化、运用级虚拟化和桌面虚拟化。 5云计算平台管理技术 云存储系统需求云计算平台进展数据管理,云存储系统需求云计算平台进展数据管理,云计算资源规模庞大,效力器数量众多并分布在不同的地点,同时运转着数百种运用,如何有效的管理这些效力器,保证整个系统提供不延续的效力是宏大的挑战。 云计算系统的平台管理技术可以使大量的效力器协同任务,方便的进展业务部署和开通,快速发现和恢复

12、系统缺点,经过自动化、智能化的手段实现大规模系统的可靠运营。对于现代企业管理,很强调设备的整体拥有本钱TCO,而不像过去只强调采购本钱。而云存储技术管理的本钱,可分为二种,一个是系统管理人力及能源需求的降低,一个是减少因系统停机呵斥的业务中断,所添加的管理本钱。Google 的效力器超越200万台,其中1/4用来作为存储,这么多的存储设备,假设采用传统的盘阵,管理是个大问题,更何况假设这些盘阵还是不同的厂商所消费,那管理难度就更无法想象了。为理处理这个问题,google 才开展云存储这个概念。云存储技术针对数据重要性采取不同的拷贝战略,并且拷贝的文件存放在不同的效力器上,因此遭遇硬件损坏时,不

13、论是硬盘或是效力器坏掉,效力一直不会终止,而且由于采用索引的架构,系统会自动将读写指令导引到其它存储节点,读写效能完全不受影响,管理人员只需改换硬件即可,数据也不会丧失,换上新的硬盘或是效力器后,系统会自动将文件拷贝回来,永远坚持多份的文件,以防止数据的丧失。扩容时只需安装好存储节点,接上网络,新添加的容量便会自动合并到存储中,并且数据自动迁移到新存储节点,不需求做多余的设定,大量的降低了维护人员的任务量。在管理界面中可以看到每个存储节点及硬盘的运用情况、读写带宽,管理非常容易,不论运用哪家公司的效力器,都是同一个管理界面,一个管理人员可以轻松的管理几百台存储节点。随着数据量的大幅添加,数据被

14、读取的时机越来越小,根据2021年 Berkeley 大学的一份研讨报告显示,在过去十年,数据读/写的比率曾经从 4:1 变为1:2,90%的数据从来没有被读取过。加上全球能源价钱的高涨,面对这样的趋势,节能设计在今天变得非常重要。在数据中心,电力的本钱很高,有些云存储技术会提供节能的功能,客户可以自行设定读写期限,超越期限没有被读写的文件,系统会将它迁移到节能区,节能区的效力器硬盘是spin-down的,这样可以节省大量的电力,减少电力损耗,就是减少二氧化碳排放量,既可以降低运用本钱也是每一个地球公民的义务。云存储技术相对低廉的硬件采购本钱及硬件冗余的架构,能在硬件损坏时,自动接纳效力,并且不影响效力效能,数据也不会丧失,这样保证了效力的延续性,而节能的设计也对整体存储拥有本钱的降低,产生了决议性的影响。开发云存储战略能够会很复杂,而且对平安性要求也很高。但是,从早期用户的运用阅历来看,云存储的真正优势在于能为用户节约本钱。分析师称采用基于云的效力可以节约

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论