已阅读5页,还剩12页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
北风网项目培训北风网项目培训 讲师:Robby Hadoop HbaseHbase中数据存中数据存储储方式方式 按RowKey的字典顺序 Table Region Region Region Region Region Servers Region Server Region Server Region Server Region Server 字典字典顺顺序序 特点: 拥有相同“前缀”的数据,会存储在相邻区域 a ab abc b ba bab c ca cab HTable = HRegion = HStoreHTable = HRegion = HStore Table Region Region Server HRegion Region Region Region HStore MemStore StoreFile StoreFile StoreFile HStore MemStore StoreFile StoreFile HStore MemStore StoreFile HStoreHStore是怎是怎样样工作的工作的? ? HStore MemStore StoreFile StoreFile StoreFile 向表中写入数据的过程: 1. 首先写入MemStore,同时写入HLog 2. 但MemStore到达一定大小的时候,MemStore会 flush成一个StoreFile(HFile文件) 3. 但StoreFile的数量达到一定阀值,会触发compact , 将多个StoreFile合并成1个StoreFile 4. 当单个StoreFile达到一定大小的时候,会触发split , 将当前的Region拆分成2个Region,并且分发到 不同的Region Server上 HStoreHStore是怎是怎样样工作的工作的? ? HFileHFile的存的存储储格式格式 Data Block是HBase I/O的基本单元,每个Data块除了开头的Magic以 外就是一个个KeyValue对拼接而成 KeyValueKeyValue的存的存储储格式格式 开始是两个固定长度的数值,分别表示Key的长度和Value的长度。紧 接着是Key,开始是固定长度的数值,表示RowKey的长度,紧接着是 RowKey,然后是固定长度的数值,表示Family的长度,然后是Family ,接着是Qualifier,然后是两个固定长度的数值,表示Time Stamp和 Key Type(Put/Delete)。Value部分没有这么复杂的结构,就是纯粹 的二进制数据了。 对于任意一个cell,都需要存储rowkey, column family, column qualifier 目前已经完成的功能 Struts2 + Jsp + bootstrap开发环境搭建 HBase Interface 1. 创建了用户管理相关的表 2. 创建新用户 3. 验证用户名和密码 界面部分(JSP+Struts2 Actions) 1. 用户注册,登陆和注销 接下来将要实现的功能 用户关注和微博投递 1. 表结构的设计 2.Hbase接口的实现 3.JSP和Action的实现 用户关注 表(1) tab_follow tab_followed rowkeyname:userid useridusername rowkeyuserid userid_followed_useriduserid 发送微博 tab_post tab_inbox rowkeyPost:usernamePost:contentPost:ts postidxxxxxxxxx rowkeypostid userid+postidpostid 基于短信话单的应用 话单入库 多线程入库 使用Protocol Buffer 话单查询 Ajax技术 话单统计 在Hbase中使用MapReduce MapReduce Locality Data Node Data Node Region Server Map Data Node Region Server Data Node Region Server NameNode Hive Data Types TypeSize(byte) TINYINT 1 SMALLINT 2 INT 4 BIGINT
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2026年外贸服饰行业分析报告及未来发展趋势报告
- 2026年摩托车轮胎行业分析报告及未来发展趋势报告
- 2026年新疆科技职业技术学院单招职业技能考试参考题库附答案详解
- 大学试题(管理类)劳动组织管理题库含答案解析
- 2025年漫画中国史题库及答案
- (2025年)项目部人员安全教育试题及答案
- 2026年机械停车行业分析报告及未来发展趋势报告
- 2026年体育场馆运营师高级专业知识与技能测试试题及答案
- 2026年安全生产月知识竞赛题库(含答案)
- 2025年兽医疾病症状识别试题及答案
- 2026江苏南京师范大学专业技术人员招聘10人备考题库附完整答案详解(考点梳理)
- 《融合新闻学》第二版 课件05 网络图文报道
- 小红书账号运营培训课件【互联网】【运营课件】
- 水路客运安全培训课件
- 2026年深圳中考历史答题规范特训试卷(附答案可下载)
- 车前子提取物对增强T淋巴细胞活性的研究-洞察及研究
- 项目网络配线架端接工艺
- 2026年中国化工经济技术发展中心招聘备考题库及参考答案详解
- 徐州卷烟厂操作考试题及答案
- 雨水管道施工方案及措施
- 2026年驾驶员劳动关系合同书
评论
0/150
提交评论