HBase培训(课堂PPT)_第1页
HBase培训(课堂PPT)_第2页
HBase培训(课堂PPT)_第3页
HBase培训(课堂PPT)_第4页
HBase培训(课堂PPT)_第5页
已阅读5页,还剩21页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、回顾一下传统关系型数据库回顾一下传统关系型数据库事务的保障,事务的保障,ACID丰富的数据类型和丰富的数据类型和SQL操作操作严格的数据模型严格的数据模型,行式存储行式存储互联网的需求互联网的需求对数据高并发读写的要求对数据高并发读写的要求对海量数据的存储和访问对海量数据的存储和访问伸缩性,可用性,可靠性方面的需求伸缩性,可用性,可靠性方面的需求关系型数据库的解决方案关系型数据库的解决方案高并发高并发 措施:读写分离,分库分表 带来数据一致性问题海量数据海量数据 措施:分库分表 实现复杂,后期迁移维护复杂, 路由规则(DHT,自定义)高可用,可靠,伸缩高可用,可靠,伸缩 措施:主备,主从,多主

2、 本身扩展性差,增加和节点宕机需要进行数据的迁移 NOSQL-CAPCAPBASENOSQL一致性一致性强一致强一致 2PC W+RN PAXOS弱一致弱一致 Gossip 向量时钟 时间戳 Merkle treeHBase在在hadoop体系中位置体系中位置分布式数据库分布式数据库HBase的特点的特点基于列式的高效存储基于列式的高效存储强一致的数据访问强一致的数据访问高可靠高可靠高性能高性能可可伸缩伸缩,自动切分,迁移,自动切分,迁移Schema free逻辑数据模型逻辑数据模型TableRegionColumnFamilyRowColumnValueTimeStampHBase的体系组成

3、的体系组成体系结构组成体系结构组成体系结构组成体系结构组成HBase各对象职责各对象职责Client HBase的访问接口,维护cache加快HBase的访问Zookeeper 监控master,保证只有一个master 存储Region的入口地址 监控RegionServer上下线,并告知Master 存储Hbase shcema和table 的元数据Master 分配Region到RegionServer RegionSever的负载均衡 发现失效的RegionServer并重新分配其上的Region 管理用户对Table的增删改查操作RegionServer 维护Region,处理对这些

4、Region的IO Split&CompactRegion的定位的定位-ROOT-.METARegion的定位的定位LSM-TreeBTree(索引读)(索引读) mysql,Oracle Hash(key value) redis,mongodb 无法范围查询 无法避免表扫描 无法避免数据排序 LSM-Tree(写)(写) HBaseBooleamFilter 快速定位数据是否位于某集合 少量的错判率Lsm-treebitmapPut/Get操作操作存储分布存储分布HFileHLogRegionServer宕机恢复宕机恢复(可靠性可靠性)冗余冗余节点宕机节点宕机,内存中的数据还未内存

5、中的数据还未Flush到文件中到文件中 Region Server1MasterzookeeperRegion1storesHDFSRegion2stores Store1 store2WAL.logs/rs1/xxxxx1.logs/rs1/xxxxx2Region1 .splitlogsRegion2 .splitlogsSeqNum checkRegion Server2Split logAssign RegionOpen RegionRelay logSplit&Compact(可用性)(可用性)为什么要分裂为什么要分裂 避免单个region访问过于频繁 单机压力过大,均衡压力

6、 为什么要为什么要Compact 减少HFile文件的个数 提高性能 清除过期和删除数据 分裂过程分裂过程 触发split region zookeeper创建split点 hdfs创建临时分裂目录 Region下线 分裂两个子region 更新META表 打开Region 更新META表关于子Region的位置信息 更新zookeeper分裂状态完成 *建议禁止自动split,系统不忙的时候手动进行 Split&Compact(可用性)(可用性)Compact minor compact major compact Region所有的Hfile合并成一个,垃圾清理 建议定时或者手工进行 MemStoreHFileCompact ThreadFlush, snapshotCompact queueHFileHFileHFile应用方式应用方式RowKey设计设计 userNum$2013

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论