云计算关键技术.ppt

上传人：g*** IP属地：河南上传时间：2020-03-15 格式：PPT 页数：108 大小：6.66MB 积分：15 举报 版权申诉

已阅读5页，还剩103页未读，继续免费阅读

版权说明：本文档由用户提供并上传，收益归属内容提供方，若内容存在侵权，请进行举报或认领

文档简介

云计算关键技术郑伟平2011 7 26 Page 2 虚拟化技术内容 1虚拟化定义2虚拟化分类3全虚拟化与半虚拟化4虚拟化实现5虚拟化技术比较与选型6虚拟化带来的好处7虚拟化带来的问题8虚拟化适用范围9服务器虚拟化过程 MapReduceMapReduce是一个简单易用的并行编程模型它极大简化了大规模数据处理问题的实现 Page 3 DivideandConquer Work w1 w2 w3 r1 r2 r3 Result worker worker worker Partition Combine ParallelizationChallenges Howdoweassignworkunitstoworkers Whatifwehavemoreworkunitsthanworkers Whatifworkersneedtosharepartialresults Howdoweaggregatepartialresults Howdoweknowalltheworkershavefinished Whatifworkersdie Whatisthecommonthemeofalloftheseproblems CommonTheme Parallelizationproblemsarisefrom Communicationbetweenworkers e g toexchangestate Accesstosharedresources e g data Thus weneedasynchronizationmechanism ManagingMultipleWorkers DifficultbecauseWedon tknowtheorderinwhichworkersrunWedon tknowwhenworkersinterrupteachotherWedon tknowtheorderinwhichworkersaccessshareddataThus weneed Semaphores lock unlock Conditionalvariables wait notify broadcast BarriersStill lotsofproblems Deadlock livelock raceconditions Diningphilosophers sleepybarbers cigarettesmokers Moralofthestory becareful CurrentTools ProgrammingmodelsSharedmemory pthreads Messagepassing MPI DesignPatternsMaster slavesProducer consumerflowsSharedworkqueues But nowMapreduce Mapreduce Parallel DistributedComputingProgrammingModel Inputsplit shuffle output TypicalproblemsolvedbyMapReduce 读入数据 key value对的记录格式数据Map 从每个记录里extractsomethingmap in key in value list out key intermediate value 处理inputkey valuepair输出中间结果key valuepairsShuffle 混排交换数据把相同key的中间结果汇集到相同节点上Reduce aggregate summarize filter etc reduce out key list intermediate value list out value 归并某一个key的所有values 进行计算输出合并的计算结果 usuallyjustone 输出结果 MapreduceFramework MapreduceFramework ShuffleImplementation PartitionandSortGroup Partitionfunction hash key reducernumberGroupfunction sortbykey Exampleuses ModelisWidelyApplicableMapReduceProgramsInGoogleSourceTree GoogleMapReduceArchitecture MapReduceOperation Initialdatasplitinto64MBblocks Computed resultslocallystored MsendsdatalocationtoRworkers Finaloutputwritten Masterinformedofresultlocations Executionoverview 1 InputfilesaresplitintoMpieces 16to64MB Manyworkercopiesoftheprogramareforked 2 Onespecialcopy themaster assignsmapandreducetaskstoidleslaveworkers3 Mapworkersreadinputsplits parse key value pairs applythemapfunction createbufferedoutputpairs 4 Bufferedoutputpairsareperiodicallywrittentolocaldisk partitionedintoRregions locationsofregionsarepassedbacktothemaster 5 Masternotifiesreduceworkeraboutlocations Workerusesremoteprocedurecallstoreaddatafromlocaldisksofthemapworkers sortsbyintermediatekeystogroupsamekeyrecordstogether Executionoverviewcont 6 Reduceworkerpasseskeypluscorrespondingsetofallintermediatedatatoreducefunction Theoutputofthereducefunctionisappendedtothefinaloutputfile 7 Whenallmapandreducetasksarecompletedthemasterwakesuptheuserprogram whichresumestheusercode FaultTolerance workers master保持一些数据结构它为每个map和reduce任务存储它们的状态空闲工作中完成和worker机器非空闲任务的机器的标识 Masterpingsworkersperiodically Noresponse workermarkedasfailed Completedmaptasksareresettoidlestate sothattheycanberestarted becausetheirresults localtofailedworker arelost Completedreducetasksdonotneedtobere started outputstoredinglobalfilesystem Reducetasksarenotifiedofthenewmaptasks sotheycanreadunreaddatafromthenewlocations FaultTolerance Master MasterwritescheckpointsOnlyonemaster lesschanceoffailureIfmasterfailes MapReducetaskaborts Refinement RedundantExecution SlowworkerssignificantlydelaycompletiontimeOtherjobsconsumingresourcesonmachineBaddisksw softerrorstransferdataslowlySolution Nearendofphase spawnbackuptasksWhicheveronefinishesfirst wins Dramaticallyshortensjobcompletiontime Refinement LocalityOptimization Masterschedulingpolicy AsksGFSforlocationsofreplicasofinputfileblocksMaptaskstypicallysplitinto64MB GFSblocksize MaptasksscheduledsoGFSinputblockreplicaareonsamemachineorsamerackEffectThousandsofmachinesreadinputatlocaldiskspeedWithoutthis rackswitcheslimitreadrate Refinement SkippingBadRecords Map ReducefunctionssometimesfailforparticularinputsBestsolutionistodebug fixNotalwayspossible third partysourcelibrariesOnsegmentationfault SendUDPpackettomasterfromsignalhandlerIncludesequencenumberofrecordbeingprocessedIfmasterseestwofailuresforsamerecord Nextworkeristoldtoskiptherecord CompressionofintermediatedataCombiner Combiner functionscanrunonsamemachineasamapperCausesamini reducephasetooccurbeforetherealreducephase tosavebandwidthLocalexecutionfordebugging testingUser definedcounters OtherRefinements HadoopMapReduceArchitecture Master WorkerModelLoad balancingbypollingmechanism HistoryofHadoop 2004 InitialversionsofwhatisnowHadoopDistributedFileSystemandMap ReduceimplementedbyDougCutting MikeCafarellaDecember2005 Nutchportedtothenewframework Hadooprunsreliablyon20nodes January2006 DougCuttingjoinsYahoo February2006 ApacheHadoopprojectofficialstartedtosupportthestandalonedevelopmentofMap ReduceandHDFS March2006 FormationoftheYahoo HadoopteamMay2006 YahoosetsupaHadoopresearchcluster 300nodesApril2006 Sortbenchmarkrunon188nodesin47 9hoursMay2006 Sortbenchmarkrunon500nodesin42hours betterhardwarethanAprilbenchmark October2006 Researchclusterreaches600NodesDecember2006 Sorttimes20nodesin1 8hrs 100nodesin3 3hrs 500nodesin5 2hrs 900nodesin7 8January2006 Researchclusterreaches900nodeApril2007 Researchclusters 2clustersof1000nodesSep2008 ScalingHadoopto4000nodesatYahoo April2009 release0 20 0 manyimprovements newfeatures bugfixesandoptimizations 分布式文件系统分布式文件系统特点和基本要求缓存容错和可扩展性 Page 28 29 2020 3 15 分布式文件系统的特点和基本要求分布式文件系统的特点为整个网络上的文件系统资源提供了一个逻辑树结构用户可以抛开文件的实际物理位置仅通过一定的逻辑关系就可以查找和访问网络的共享资源用户能够像访问本地文件一样访问分布在网络中多个服务器上的文件分布式文件系统的顾客服务员和存储设备分散在各机器上服务活动必须跨网完成存储设备不是单一的集中数据存储器分布式文件系统的具体配置和实现可以有很大的不同有的服务员运行在专用的服务器上有的机器既是服务员又是顾客 30 2020 3 15 分布式文件系统的特点和基本要求分布式文件系统的基本要求透明性位置透明性服务员和存储器的多重性和分散性对顾客透明移动透明性用户意识不到资源的移动性能透明性当服务负载在一定范围内变化时客户程序可以保持满意的性能扩展透明性文件服务可以扩充以满足负载和网络规模的增长性能分布式文件系统比常规文件系统类似有时更好的性能和可靠性 31 2020 3 15 容错为了处理暂时的通信错误容错设计可以基于最多一次性语义无状态的服务器崩溃重启时不需恢复安全性身份验证访问控制安全通道效率应提供比传统文件系统相同或更强的性能和可靠性分布式文件系统的特点和基本要求 32 2020 3 15 分布式文件系统的缓存缓存方案的设计需要考虑的问题缓存的单位问题存储部分文件的位置如何决定各个顾客缓存中的数据是否一致 33 2020 3 15 分布式文件系统的缓存缓存的粒度和地点缓存的粒度如果数据单元即粒度愈大则下次访问的数据在顾客方的本地找到的可能性愈大但传送数据的时间和一致性问题也增加了反之粒度太小通信的开销也随之增加缓存的地点在一个各自有主存和磁盘的客户服务器系统中有四个地方可以用来存储文件或存储部分文件服务器磁盘服务器主存客户磁盘如果可用的话或者客户主存 34 2020 3 15 分布式文件系统的缓存更新策略缓存有效性检验和一致性判定本地缓存的数据副本是否与原本一致有两个基本方法验证其有效性顾客发动的方法顾客与服务员联系检查本地数据与原本是否一致这个方法的关键是有效性检验的频度服务员发动的方法服务员为每个顾客登记被该顾客缓存的文件或文件的某个部分当服务员检测出可能不一致时必须做出反应服务员发动方法的一个问题是违背顾客服务员模型 35 2020 3 15 容错和可扩充性可用性与文件复制可恢复性当对某个文件的操作失败或由顾客夭折此操作时如果文件能转换到原来的一致状态则说此文件是可恢复的坚定性如果当某个存储器崩溃和存储介质损坏时某个文件能保证完好则说此文件是坚定的可用性如果无论何时一旦需要就可访问甚至在某个机器和存储器崩溃或者在发生通信失效的情况下某个文件仍然可被访问则这种文件叫做是可用的 36 2020 3 15 容错和可扩充性可用性与文件复制文件复制文件复制是一个冗余措施这里指的是不同机器上的文件复制而不是同一机器上不同介质上的文件复制如镜像磁盘文件复制的原因通过对每个文件的独立备份来增加系统的可靠性当一个文件服务器出现问题时仍允许进行文件访问将工作量分配到多个服务器上避免运行性能上的瓶颈 37 2020 3 15 容错和可扩充性可用性与文件复制用户需要了解文件复制到何种程度吗在文件复制进程中需要达到什么要求呢文件复制的要求应对用户隐匿复制细节把一份复制件名字变换成指定的复制件是命名方案的任务与复制件有关的主要问题是它们的更新从用户观点看文件的所有复制品代表同一逻辑实体所以对任何复制件的更新必须反映到所有其他复制件大多数情况下不能放弃文件数据的一致性因此使用复制来增加可用性时还要使用复杂的更新传播协议 38 2020 3 15 容错和可扩充性可扩充性设计大规模系统要考虑的问题首先是有界资源 boundedresources 原理从系统的任何部分来的服务要求应该限于一个常数此常数和系统中的节点数无关负载和系统规模成比例的任何服务员一旦系统扩充到超过某一范围则必然阻塞再增加资源也缓解不了这个问题广播是一种使网络中的每个机器都参加的活动在广播基础上建立的机构对超大型系统很明显不实际网络拥挤和延迟是大规模系统的主要障碍使用缓存和实施放松的共享语义使跨机器的交互作用最少 39 2020 3 15 容错和可扩充性可扩充性设计大规模系统要考虑的问题不应当使用集中控制方案和集中的资源建立可扩充的和容错的系统分散化的一个重要方面是系统的管理分配管理职责时应有利于自治性和对称性不干扰分布式系统的连贯性和一致性将系统划分为若干半自治的小组每个小组包括一些机器和一个专用的小组服务员为了尽量减少跨越小组的文件访问大多数时间每个机器的请求应由其小组服务员满足 HDFS HadoopDistributedFileSystem Hadoop分布式文件系统 HDFS 被设计成适合运行在通用硬件 commodityhardware 上的分布式文件系统它和现有的分布式文件系统有很多共同点但同时它和其他的分布式文件系统的区别也是很明显的 HDFS是一个高度容错性的系统适合部署在廉价的机器上 HDFS能提供高吞吐量的数据访问适合大规模数据集上的应用 HDFS放宽了一部分POSIX约束来实现流式读取文件系统数据的目的 Page 40 GoalsofHDFS VeryLargeDistributedFileSystem 10Knodes 100millionfiles 10PBAssumesCommodityHardware Filesarereplicatedtohandlehardwarefailure DetectfailuresandrecoversfromthemOptimizedforBatchProcessing Datalocationsexposedsothatcomputationscanmovetowheredataresides ProvidesveryhighaggregatebandwidthUserSpace runsonheterogeneousOS HDFS采用master slave架构一个HDFS集群是由一个Namenode和一定数目的Datanodes组成 Namenode是一个中心服务器负责管理文件系统的名字空间 namespace 以及客户端对文件的访问 Namenode执行文件系统的名字空间操作比如打开关闭重命名文件或目录它也负责确定数据块到具体Datanode节点的映射集群中的Datanode一般是一个节点一个负责管理它所在节点上的存储 HDFS暴露了文件系统的名字空间用户能够以文件的形式在上面存储数据从内部看一个文件其实被分成一个或多个数据块这些块存储在一组Datanode上 Datanode负责处理文件系统客户端的读写请求在Namenode的统一调度下进行数据块的创建删除和复制 Page 43 DistributedFileSystem SingleNamespaceforentireclusterDataCoherency Write once read manyaccessmodel ClientcanonlyappendtoexistingfilesFilesarebrokenupintoblocks Typically128MBblocksize EachblockreplicatedonmultipleDataNodesIntelligentClient Clientcanfindlocationofblocks ClientaccessesdatadirectlyfromDataNode NameNodeMetadata Meta datainMemory Theentiremetadataisinmainmemory Nodemandpagingofmeta dataTypesofMetadata Listoffiles ListofBlocksforeachfile ListofDataNodesforeachblock Fileattributes e gcreationtime replicationfactorATransactionLog Recordsfilecreations filedeletions EtcNamenode全权管理数据块的复制它周期性地从集群中的每个Datanode接收心跳信号和块状态报告 Blockreport 集群中单一Namenode的结构大大简化了系统的架构 Namenode是所有HDFS元数据的仲裁者和管理者这样用户数据永远不会流过Namenode DataNode ABlockServer Storesdatainthelocalfilesystem e g ext3 Storesmeta dataofablock e g CRC Servesdataandmeta datatoClientsBlockReport PeriodicallysendsareportofallexistingblockstotheNameNodeFacilitatesPipeliningofData ForwardsdatatootherspecifiedDataNodes BlockPlacement CurrentStrategy Onereplicaonlocalnode Secondreplicaonaremoterack Thirdreplicaonsameremoterack AdditionalreplicasarerandomlyplacedClientsreadfromnearestreplicaWouldliketomakethispolicypluggable Page 48 在大多数情况下副本系数是3HDFS的存放策略是将一个副本存放在本地机架的节点上一个副本放在同一机架的另一个节点上最后一个副本放在不同机架的节点上这种策略减少了机架间的数据传输这就提高了写操作的效率机架的错误远远比节点的错误少所以这个策略不会影响到数据的可靠性和可用性于此同时因为数据块只放在两个不是三个不同的机架上所以此策略减少了读取数据时需要的网络传输总带宽在这种策略下副本并不是均匀分布在不同的机架上三分之一的副本在一个节点上三分之二的副本在一个机架上其他副本均匀分布在剩下的机架中这一策略在不损害数据可靠性和读取性能的情况下改进了写的性能 DataCorrectness UseChecksumstovalidatedata UseCRC32FileCreation Clientcomputeschecksumper512byte DataNodestoresthechecksumFileaccess ClientretrievesthedataandchecksumfromDataNode IfValidationfails Clienttriesotherreplicas NameNodeFailure AsinglepointoffailureTransactionLogstoredinmultipledirectories Adirectoryonthelocalfilesystem Adirectoryonaremotefilesystem NFS CIFS Page 51 HDFS未实现的功能总结 1 文件追加写入这个功能近期内不会实现没有这个功能会引起当文件尚未关闭的时候数据服务器死机或者目录服务器死机会引起文件文件丢失并且不可后续恢复写入 2 系统快照一个全系统的快照功能如果没有这个功能就不能实现文件系统的回滚操作 3 集群负载均衡均衡策略暂时没有实现有几个策略十分有用比如在某台数据机可能磁盘过低的时候把该数据机上面的一些数据转移到还有很多空间剩余的数据机上当某个文件突然被大量读写的时候动态增加该文件的冗余因子并且数据块复制到更多的数据机上面以提高读取性能 4 文件系统的用户权限这个也是近期内不会实现的了 5 访问权限现在是无限制访问的没有访问权限控制分布式数据库技术定义特点分类体系结构分片与分布模式结构事务模型分布式数据库的定义分布式数据库的定义通俗地说是物理上分散而逻辑上集中的数据库系统使用计算机网络将地理位置分散而管理和控制又需要不同程度集中的多个逻辑单位连接起来共同组成一个统一的数据库系统可以看作是数据处理即数据库系统和计算机网络技术的结合分布式数据库的特点物理分布性逻辑整体性不同于分散式数据库有全局数据库和局部数据库的概念站点自治性场地自治各站点数据由本地DBMS管理具有自治处理能力完成本地应用这一点与多机系统不同数据分布透明性分片透明数据复制透明数据位置透明集中与自治相结合的控制机制局部共享和全局共享一定的数据冗余可靠可用单个站点故障不会影响整体不利于更新维护成本高查询速度快事务管理的分布性全局事务可以分解为若干子事务事务的ACID特性受到考验分布式数据库的特点分布式数据库的12条准则本地自治性不依赖于中心站点可连续操作性位置独立性数据分片独立性数据复制独立性分布式查询处理分布式事务处理硬件独立性操作系统独立性网络独立性数据库管理系统独立性单个DBMS的本地运算不受多数据库系统中其它DBMS的加入而影响单个DBMS处理查询和优化查询的方式不受访问多数据库的全局查询执行的影响系统已执行或操作在单个DBMS加入或离开多数据库联盟时不受危害分布式数据库的分类按局部数据库管理系统的数据模型分类同构型 homogenous DDBS 数据模型相同同构同质型各站点上的数据模型关系网状层次相同且都是同一种DBMS 同构异质性各站点上的数据模型关系网状层次相同但不是同一种DBMS 异构型 heterogenous DDBS 各站点上的数据模型不同分布式数据库的分类按分布式数据库系统的全局控制类型分类全局控制集中型DDBS 全局控制机制和全局数据字典位于一个中心点中心点完成全局事务的协调和局部数据库的转换全局控制分散型DDBS 全局控制机制和全局数据字典位于各个站点上每个站点都能完成全局事务的协调和局部数据库的转换每个站点既是全局事务的协调者也是参与者全局控制可变型DDBS 主从型DDBS 站点有两类主站点和从站点主战点上包含全局控制机制和全局数据字典辅助站点不包含全局控制机制和全局数据字典分布式数据库系统的体系结构包括局部DB 全局DB局部DBMS和全局DBMS局部DBA和全局DBA局部数据字典LDD和全局数据字典GDD通信模块CM 分片又称为数据分割有三种分片方式水平分片按特定条件将全局关系划分成若干互不相交的片段通过对全局关系进行选择运算得到垂直分片把全局关系的属性集分成若干子集通过对全局关系进行投影运算获得混合分片上述两种方法的混合分片规则完备性条件不多即全局关系的所有数据必须映射到各个片段中不允许有属于全局关系的数据不属于它的任何一个片段可重构条件不少即必须保证能够由同一个全局关系的各个片段来重构该全局关系水平合并垂直连接不相交条件一个全局关系被分割后所得的各个数据片段不重叠分布式数据库中的分片与分布分布根据需要将数据划分成逻辑片段按照某种策略将这些片段分散存储在各个站点上策略集中式所有数据片段放在同一个站点上对数据控制和管理容易数据一致性和完整性能够得到保证系统对数据站点依赖过重数据站点故障将导致整个系统崩溃检索效率低分割式所有数据只有一份经过逻辑分割后形成多个片段每个片段放在某个特定的站点上充分利用各个站点的存储能力每个站点可自治检索和修改数据并发能力强部分站点故障系统仍能运行可靠性高全局查询和修改响应时间长网络通信代价较大全复制式全局数据有多个副本每个站点上都有一个完整的数据副本可靠性高查询速度快数据同步困难系统冗余大混合式全部数据被分为若干个子集每个子集安置在不同的站点上但任一站点都不保存全部数据灵活性好系统效率高复杂分布式数据库系统的模式结构全局DBMS 全局外模式全局应用的用户视图全局概念模式描述分布式数据库中全局数据的逻辑结构和数据特性是分布式数据库的全局概念视图分片模式描述全局数据的逻辑划分分配模式根据选定的数据分配策略定义各片段的物理存放位置确定是否冗余及冗余的程度局部概念模式是全局概念模式的子集由分配在同一站点上的一个或多个逻辑片段组成局部内模式是分布式数据库关于物理数据库的描述跟集中式内模式类似但是不仅包含本站点数据的存储描述还包括全局数据在本站点的存储描述全局关系R的逻辑片段与物理影像 67 分布式事务模型事务的ACID局部事务全局事务局部事务管理器保证本地节点上执行的事务的ACID本次事务可能是全局事务的一部分维护一个易于恢复的日志参与适当的并发控制事务协调器协调该节点上发起的事务全局或局部的执行启动事务的执行分发事务协调事务的终止在所有节点上提交或中止分布式事务模型 68 TC1 TCn TMn TM1 事务管理器事务协调器 69 故障节点故障消息丢失网络故障提交原子性事务T必须要么在所有节点上提交要么在所有节点上都中止两阶段提交三阶段提交 70 两阶段提交阶段1 决定阶段协调器prepareT节点事务管理器readyT或abortT阶段2 执行阶段收到有一个abortT 则abortT收到所有readyT 则commitT节点commitT并写Log后发出acknowledgeT收到所有acknowledge 则completeT阻塞协调器发出prepareT后故障处于不定状态双方针对超时均可重发 71 三阶段提交阶段1同两阶段方式阶段2收到有一个abortT 则abortT收到所有readyT 则precommitT节点precommitT之后写Log 发出acknowledgeT阶段3收到所有ack 则commitT节点commit后发出ackT收到所有ackT后 completeT恢复只要有一个具有commitT 则提交只要有一个precommitT 已readyT 可提交都没有收到precommitT 则回滚 72 协议的比较两阶段提交有阻塞的可能使用较广三阶段提交对于网络链路故障的处理能力偏弱 Hbase Hbase是一个分布式开源数据库基于Hadoop分布式文件系统模仿并提供了基于Google文件系统的Bigtable数据库的所有功能为什么需要HBASE数据库系统已无法适应大型分布式数据存储的需要改良的关系数据库副本分区等难于安装与维护关系模型对数据的操作使数据的存贮变得复杂主要特点HBASE从设计理念上就为可扩展做好了充分准备Column oriented空间的扩展只需要加入存储结点使用表的概念但不同于关系数据库不支持SQL它又不适合事务处理实质上是一张极大的非常稀疏的存储在分布式文件系统上的表 Page 73 Page 74 HBase历史 2006年底由PowerSet的ChadWalters和JimKellerman发起2008年成为ApacheHadoop的一个子项目现已作为产品被使用WorldLingoSOpenPlacesYahooAdobe HBASE用例 WebTable 存储抓取网页和相关信息每个页面对应一行是个有百万行的大表要基于此表进行分析与解析并由搜索引擎对关键字进行索引表需要并发地被众多网页抓取程序随机地访问以及更新数据表内容也要作为网页实时缓存被大量用户随机访问逻辑视图 RowKey RowKey与nosql数据库们一样 rowkey是用来检索记录的主键访问hbasetable中的行只有三种方式 1通过单个rowkey访问2通过rowkey的range3全表扫描Rowkey行键 Rowkey 可以是任意字符串最大长度是64KB 实际应用中长度一般为10 100bytes 在hbase内部 rowkey保存为字节数组存储时数据按照Rowkey的字典序 byteorder 排序存储设计key时要充分排序存储这个特性将经常一起读取的行存储放到一起位置相关性注意行的一次读写是原子操作不论一次读写多少列这个设计决策能够使用户很容易的理解程序在对同一个行进行并发更新操作时的行为 Page 78 数据模型行每行数据有一可排序的关键字和任意列项字符串整数二进制串甚至与串行化的结构都可以作为行键表按照行键的逐字节排序顺序对行进行有序化处理表内数据非常稀疏不同的行的列的数完全目可以大不相同可以只对一行上锁对行的写操作是始终是原子的数据模型行行键列列数据模型列列必须用族 family 来定义任意一列有如下形式族标签其中族和标签都可为任意形式的串物理上将同族数据存储在一起数据可通过时间戳区分版本列族hbase表中的每个列都归属与某个列族列族是表的chema的一部分而列不是必须在使用表之前定义列名都以列族作为前缀例如courses history courses math都属于courses这个列族访问控制磁盘和内存的使用统计都是在列族层面进行的实际应用中列族上的控制权限能帮助我们管理不同类型的应用我们允许一些应用可以添加新的基本数据一些应用可以读取基本数据并创建继承的列族一些应用则只允许浏览数据甚至可能因为隐私的原因不能浏览所有数据 Page 82 列族hbase表中的每个列都归属与某个列族列族是表的chema的一部分而列不是必须在使用表之前定义列名都以列族作为前缀例如courses history courses math都属于courses这个列族访问控制磁盘和内存的使用统计都是在列族层面进行的实际应用中列族上的控制权限能帮助我们管理不同类型的应用我们允许一些应用可以添加新的基本数据一些应用可以读取基本数据并创建继承的列族一些应用则只允许浏览数据甚至可能因为隐私的原因不能浏览所有数据 Page 83 数据模型列族标签物理视图 HTable小结 HBASE物理存储 1已经提到过 Table中的所有行都按照rowkey的字典序排列 2Table在行的方向上分割为多个Hregion 3region按大小分割的每个表一开始只有一个region 随着数据不断插入表 region不断增大当增大到一个阀值的时候 Hregion就会等分会两个新的Hregion 当table中的行不断增多就会有越来越多的Hregion Page 87 4HRegion是Hbase中分布式存储和负载均衡的最小单元最小单元就表示不同的Hregion可以分布在不同的HRegionserver上但一个Hregion是不会拆分到多个server上的 Page 88 5HRegion虽然是分布式存储的最小单元但并不是存储的最小单元 HRegion由一个或者多个Store组成每个store保存一个columnsfamily 每个Strore又由一个memStore和0至多个StoreFile组成 StoreFile以HFile格式保存在HDFS上 Page 89 Page 90 HFile分为六个部分 DataBlock段保存表中的数据这部分可以被压缩MetaBlock段可选的保存用户自定义的kv对可以被压缩 FileInfo段 Hfile的元信息不被压缩用户也可以在这一部分添加自己的元信息 DataBlockIndex段 DataBlock的索引每条索引的key是被索引的block的第一条记录的key MetaBlockIndex段可选的 MetaBlock的索引 Trailer 这一段是定长的保存了每一段的偏移量读取一个HFile时会首先读取Trailer Trailer保存了每个段的起始位置段的MagicNumber用来做安全check 然后 DataBlockIndex会被读取到内存中这样当检索某个key时不需要扫描整个HFile 而只需从内存中找到key所在的block 通过一次磁盘io将整个block读取到内存中再找到需要的key DataBlockIndex采用LRU机制淘汰 HFile的DataBlock MetaBlock通常采用压缩方式存储压缩之后可以大大减少网络IO和磁盘IO 随之而来的开销当然是需要花费cpu进行压缩和解压缩目标Hfile的压缩支持两种方式 Gzip Lzo Page 9

人人文库> 全部分类> 应用文书 > 技术指导

温馨提示

1. 本站所有资源如无特殊说明，都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2. 本站的文档不包含任何第三方提供的附件图纸等，如果需要附件，请联系上传者。文件的所有权益归上传用户所有。
3. 本站RAR压缩包中若带图纸，网页内容里面会有图纸预览，若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 人人文库网仅提供信息存储空间，仅对用户上传内容的表现方式做保护处理，对用户上传分享的文档内容本身不做任何修改或编辑，并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容，请与我们联系，我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

云计算关键技术.ppt

文档简介

温馨提示

最新文档

评论

云计算关键技术.ppt

文档简介

温馨提示

最新文档

评论

相关文档