




已阅读5页,还剩11页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
HBase简介 HBase是一个构建在HDFS上的分布式列存储系统 HBase是基于GoogleBigTable模型开发的 典型的key value系统 HBase是ApacheHadoop生态系统中的重要一员 主要用于海量结构化数据存储 从逻辑上讲 HBase将数据按照表 行和列进行存储 与hadoop一样 Hbase目标主要依靠横向扩展 通过不断增加廉价的商用服务器 来增加计算和存储能力 HBase表的特点大 一个表可以有数十亿行 上百万列 无模式 每行都有一个可排序的主键和任意多的列 列可以根据需要动态的增加 同一张表中不同的行可以有截然不同的列 面向列 面向列 族 的存储和权限控制 列 族 独立检索 稀疏 空 null 列并不占用存储空间 表可以设计的非常稀疏 数据多版本 每个单元中的数据可以有多个版本 默认情况下版本号自动分配 是单元格插入时的时间戳 数据类型单一 Hbase中的数据都是字符串 没有类型 HBase结构图 HBase体系架构 Client 包含访问HBase的接口 并维护cache来加快对HBase的访问 比如region的位置信息Master 为Regionserver分配region负责Regionserver的负载均衡发现失效的Regionserver并重新分配其上region管理用户对table的增删改查操作 HBase体系架构 RegionServer Regionserver维护region 处理对这些region的IO请求Regionserver负责切分在运行过程中变得过大的region Zookeeper 通过选举 保证任何时候 集群中只有一个master Master与RegionServers启动时会向ZooKeeper注册所有Region的寻址入口实时监控Regionserver的上线和下线信息 并实时通知给Master存储HBase的schema和table元数据默认情况下 HBase管理ZooKeeper实例 比如 启动或者停止ZooKeeper HBase逻辑模型 1 HBase以表的形式存储数据 表有行和列组成 列划分为若干个列族 rowfamily 2 HBase支持多列族 但是官方不建议使用多个列族 RowKey 是Bytearray 是表中每条记录的 主键 方便快速查找 Rowkey的设计非常重要 ColumnFamily 列族 拥有一个名称 string 包含一个或者多个相关列Column 属于某一个columnfamily familyName columnName 每条记录可动态添加VersionNumber 类型为Long 默认值是系统时间戳 可由用户自定义Value Cell 由 rowkey column version 唯一确定的单元 cell中的数据是没有类型的 全部是字节码形式存贮 HBase原语 建表语句 create beijing tb gpsinfo NAME cf BLOOMFILTER ROW VERSIONS 1 IN MEMORY true KEEP DELETED CELLS FALSE DATA BLOCK ENCODING NONE COMPRESSION snappy MIN VERSIONS 0 BLOCKCACHE true BLOCKSIZE 8192 REPLICATION SCOPE 0 HBase物理模型 Table中所有行都按照rowkey的字典序排列 Table在行的方向上分割为多个Region Region按大小分割的 每个表开始只有一个region 随着数据增多 region不断增大 当增大到一个阀值的时候 region就会等分会两个新的region 之后会有越来越多的region Region是Hbase中分布式存储和负载均衡的最小单元 不同Region分布到不同RegionServer上 HBase物理模型 Region虽然是分布式存储的最小单元 但并不是存储的最小单元 Region由一个或者多个Store组成 每个store保存一个columnsfamily 每个Strore又由一个memStore和0至多个StoreFile组成 StoreFile包含HFile memStore存储在内存中 StoreFile存储在HDFS上 HBase部署 安装JDK 建议使用JDK1 8以上版本 安装hadoop集群 安装zookeeper集群 安装HBase 安装顺序 Groupname generalCommands status table help version whoamiGroupname ddlCommands alter alter async alter status create describe disable disable all drop drop all enable enable all exists get table is disabled is enabled list locate region show filtersGroupname namespaceCommands alter namespace create namespace describe namespace drop namespace list namespace list namespace tablesGroupname dmlCommands append count delete deleteall get get counter get splits incr put scan truncate truncate preserve Hbase客户端工具 HBaseshell Groupname toolsCommands assign balance switch balancer balancer enabled catalogjanitor enabled catalogjanitor run catalogjanitor switch close region compact compact mob compact rs flush major compact major compact mob merge region move normalize normalizer enabled normalizer switch split trace unassign wal roll zk dumpGroupname replicationCommands add peer append peer tableCFs disable peer disable table replication enable peer enable table replication list peers list replicated tables remove peer remove peer tableCFs set peer tableCFs show peer tableCFsGroupname snapshotsCommands clone snapshot delete all snapshot delete snapshot list snapshots restore snapshot snapshotGroupname configurationCommands update all config update configGroupname quotasCommands list quotas set quotaGroupname securityCommands grant list security capabilities revoke user permissionGroupname proceduresCommands abort procedure list proceduresGroupname visibilitylabelsComm
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年事业单位工勤技能-湖南-湖南放射技术员二级(技师)历年参考题库典型考点含答案解析
- 2025年事业单位工勤技能-湖南-湖南地图绘制员四级(中级工)历年参考题库含答案解析
- 2025年事业单位工勤技能-湖南-湖南下水道养护工四级(中级工)历年参考题库典型考点含答案解析
- 2025年事业单位工勤技能-湖北-湖北热处理工五级(初级工)历年参考题库典型考点含答案解析
- 2025年事业单位工勤技能-湖北-湖北家禽饲养员三级(高级工)历年参考题库典型考点含答案解析
- 2025-2030中国纳迪克酸酐行业运营格局及投资盈利预测报告
- 低碳城市规划与绿色建筑设计2025年创新案例分析
- 2025年事业单位工勤技能-河南-河南造林管护工二级(技师)历年参考题库典型考点含答案解析
- 2025年事业单位工勤技能-河南-河南园林绿化工三级(高级工)历年参考题库典型考点含答案解析
- 2025年事业单位工勤技能-河南-河南保安员二级(技师)历年参考题库典型考点含答案解析
- 2025年云南省投资控股集团有限公司招聘考试笔试试题【附解析】
- 2025年中国充电桩行业政策、市场规模及投资前景研究报告(智研咨询发布)
- 2025年时事政治试题库【必刷】附答案详解
- 内部员工筹资协议书范本
- 2025年起重指挥人员考试题库
- 信息公开条例培训课件
- 2025年留疆战士考试题库及答案
- 新初一入学分班考试语文卷(含答案)
- 2025年高考英语新课标Ⅱ卷点评及2026备考方向 课件
- 2025广西专业技术人员公需科目培训考试答案
- 人教版2024年小学升学考试数学模拟测试卷(共5套)(含答案解析)
评论
0/150
提交评论