《大数据分析技术应用》课件-20.HBase系统架构_第1页
《大数据分析技术应用》课件-20.HBase系统架构_第2页
《大数据分析技术应用》课件-20.HBase系统架构_第3页
《大数据分析技术应用》课件-20.HBase系统架构_第4页
《大数据分析技术应用》课件-20.HBase系统架构_第5页
已阅读5页,还剩10页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

HBase系统架构HBase系统架构设计HBase关键技术解析目录HBase系统架构设计01整体架构概述整体架构概述HMaster(Master)负责HRegionServer的负载均衡为HRegionServer分配RegionHRegionServer宕机后,重新分配其上的Region不处理Client的数据读写请求管理元数据管理表的创建、删除和修改HRegionServer(Slave)处理Client的数据读写请求管理Region

Split(分裂)管理StoreFile

Compaction(合并)整体架构概述Zookeeper实现HMaster高可用监控HRegionServer的上下线信息,并通知HMaster存储元数据的寻址入口Client通过接口访问Hbase为了加快数据访问速度,将元数据、Region位置等信息缓存在ClientCache中整体架构概述Region分布式存储和负载的最小单元系统将表水平划分(按行)为多个Region,每个Region保存表的一段连续数据默认每张表开始只有一个Region,随着数据不断写入,Region不断增大,当Region大小超过阀值时,当前Region会分裂成两个子Region随着Region的不断增多,HMaster会将部分Region迁移到其他HRegionServer中,实现负载均衡表通常被保存在多个HRegionServer的多个Region中Store一个Region由多个Store组成,每个Store存储一个列族Store由内存中的MemStore和磁盘中的若干StoreFile组成整体架构概述MemStore与StoreFileMemStore是Store的内存缓冲区,数据读写都先访问MemStoreStoreFile是MemStore的磁盘溢写文件,在HDFS中被称为HFile写数据时,先写MemStore,当数据量超过阈值时,HRegionServer会将MemStore中的数据溢写磁盘,每次溢写都生成一个独立的StoreFile(HFile)当Store中的StoreFile数量超过阈值时,HRegionServer会将若干小StoreFile合并为一个大StoreFile当Region中最大Store的大小超过阈值时,HRegionServer会将其等分为两个子RegionClient读取数据时,先找MemStore,再找StoreFile整体架构概述HLog含义:以WAL(WriteAheadLog,预写日志)方式写数据时产生的日志文件目的:HRegionServer意外宕机时的数据恢复每个HRegionServer维护一个HLog先写HLog,再写MemStore,最后写StoreFile定期删除HLog过期数据数据恢复过程HMaster通过ZooKeeper自动感知HRegionServer宕机HMaster处理HLog,针对不同的Region拆分HLogHMaster重新分配失效的Region通过HLog将尚未持久化的数据重新写入MemStore,然后溢写到StoreFileHBase关键技术解析02HBase采用分区技术将数据表按照行键划分为多个分区(Region),每个分区包含一定范围的数据,可独立存储和访问,提高系统扩展性和并行处理能力。数据分区HBase支持多种分区策略,如基于行键的哈希分区和范围分区等,可根据数据特点和访问模式选择合适的分区方式。分区策略HBase支持数据分片机制,即将数据分散存储到多个RegionServer上,实现负载均衡和容错。分片机制数据分区与分片技术复制策略HBase支持多种复制策略,如基于行键的复制和基于Region的复制等,可根据数据重要性和系统需求选择合适的复制方式。一致性保障HBase通过严格的复制机制和数据一致性校验,确保数据的一致性和完整性。数据复制HBase采用数据复制技术,将每个Region复制到多个RegionServer上,保证数据的高可用性和容错性。数据复制与一致性保障03解压缩性能HBase采用高效的解压缩算法和缓存机制,保证数据读取时的解压缩性能,减少对系统性能的影响。01压缩算法HBase支持多种数据压缩算法,如Snappy、LZO和GZIP等,可根据数据特点选择适合的压缩方式,减少存储空间和传输成本。02压缩策略HBase提供灵活的压缩策略,可针对列族、列和整个表等不同级别进行压缩设置。数据压缩与解压缩技术数据加密HBase支持数据加密技术,可对敏感数据进行加密存储,防止数据泄露和非法访问。同时,HBase还支持透明加密和密钥管理等功能,方便用户管理和使用加密数据。认证机制HBase提供多种认证机制,如K

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论