付费下载
下载本文档
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、测试环境 :172.25.3.103-106 ,172.25.3.103 是 master 节点。测试步骤 :拔了 172.25.3.105 节点的网线。现象描述 :原先每个 regionserver 负责 25 个 region ,当 172.25.3.105 节点挂了以后,它负责 的 region 会有其他 regionserver 接管, 500 多万的数据,恢复时间为 6 分钟左右。问题分析 :1. 在 zookeeper 的 /hbase/rs 目录下维护在线的 regionserver 节点, 当 zookeeper 检测 至U某个节点 expiration , ServerMan
2、ager 会将该节点添加至Udead servers,并提交ServerShutdownHandler 执行 Splitting logs。2. 将 172.25.3.105 上的 WALs 拆分成两个文件,如: 172-25-3-105%2C60020%2C1447730854044.1447817260887 172-25-3-105%2C60020%2C1447730854044.1447813660762同时启动 task 任务,将拆分后的文件分配给 172.25.3.103 和 172.25.3.104 节点的 SplitLogWorker。3. 将新生成的两个 WALs 文件放入
3、hdfs:/mycluster/hbase/oldWALs4. 调用 recoverLease 方法,获取新生成的 WALs 文件租约(在 hdfs 的设计中, Lease是为了实现一个文件在一个时刻只能被一个客户端写) 。 recoverLease 方法返回有 几种途径: 1)成功获取租约; 2)达至超时时间; 3)文件关闭。在分别获取两个 路径租约的时候,第一个路径成功获取租约:recoverLease=true ;另一个路径一直获取不至租约,在重试 7 次之后,文件关闭,after 324721ms 返回, 这也是恢复过程耗时长的主要原因 。第一次失败, sleep 4000ms 后重试
4、;之后每次重试 sleep 时 间根据参数: hbase.lease.recovery.dfs.timeout 而定,我们系统设置该值为 64000ms 。5. recoverLease 方法返回后, HLogSplitter 开启 writer thread ,将 172.25.3.105 节点上 的 region 进行拆分,以 0bfdac9dc87129b7e0e6ed7be99fb8f7 region 为例:a) Creating writer path = hdfs:/mycluster/hbase/data/default/falcon_picrecord/0bfdac9dc871
5、29b7e0e6ed 7be99fb8f7/recovered.edits/0000000000000002161.tempb) Split writers finished 后, Submitting close of hdfs:/mycluster/hbase/data/default/falcon_picrecord/0bfdac9dc87129b7e0e6ed 7be99fb8f7/recovered.edits/0000000000000002161.tempc) Closing hdfs:/mycluster/hbase/data/default/falcon_picrecord/
6、0bfdac9dc87129b7e0e6ed 7be99fb8f7/recovered.edits/0000000000000002161.tempd) Closed wap hdfs:/mycluster/hbase/data/default/falcon_picrecord/0bfdac9dc87129b7e0e6ed 7be99fb8f7/recovered.edits/0000000000000002161.tempe) Rename hdfs:/mycluster/hbase/data/default/falcon_picrecord/0bfdac9dc87129b7e0e6ed 7
7、be99fb8f7/recovered.edits/0000000000000002161.temptohdfs:/mycluster/hbase/data/default/falcon_picrecord/0bfdac9dc87129b7e0e6ed 7be99fb8f7/recovered.edits/00000000000000022816. Rename region 完成后,开启 flush ,先对本机原有的 region 进行 flush ,以 7da3ddf6e948ee2742f0cec68cf6ee93 region 为例:a) HRegionServer: periodic
8、Flusher requesting flush for regionb) HRegion: Started memstore flush for falcon_picrecord,094,1447749551421.7da3ddf6e948ee2742f0cec68cf6ee93.c) DefaultStoreFlusher: Flush into tmp file hdfs:/mycluster/hbase/data/default/falcon_picrecord/7da3ddf6e948ee2742f0ce c68cf6ee93/.tmp/f87842e59e9f450d9514959
9、bade2c121d) HRegionFileSystem: Committing store file hdfs:/mycluster/hbase/data/default/falcon_picrecord/7da3ddf6e948ee2742f0ce c68cf6ee93/.tmp/f87842e59e9f450d9514959bade2c121as hdfs:/mycluster/hbase/data/default/falcon_picrecord/7da3ddf6e948ee2742f0ce c68cf6ee93/col/f87842e59e9f450d9514959bade2c12
10、1e) HStore: Added hdfs:/mycluster/hbase/data/default/falcon_picrecord/7da3ddf6e948ee2742f0ce c68cf6ee93/col/f87842e59e9f450d9514959bade2c121f) HRegion: Finished memstore flush7. Flush 完成后开启 major compaction ,还是以 7da3ddf6e948ee2742f0cec68cf6ee93 为 例:a) HRegion: Starting compaction on col in region fa
11、lcon_picrecord,094,1447749551421.7da3ddf6e948ee2742f0cec68cf6ee93.b) HStore: Starting compaction of 3 file(s) in col ofc) falcon_picrecord,094,1447749551421.7da3ddf6e948ee2742f0cec68cf6ee93. into tmpdir =hdfs:/mycluster/hbase/data/default/falcon_picrecord/7da3ddf6e948ee2 742f0cec68cf6ee93/.tmpd) Com
12、pactor: Compacting hdfs:/mycluster/hbase/data/default/falcon_picrecord/7da3ddf6e948ee2742f0ce c68cf6ee93/col/c892b1043660402a8a7ee557918d17ae hdfs:/mycluster/hbase/data/default/falcon_picrecord/7da3ddf6e948ee2742f0ce c68cf6ee93/col/3d3adc0339f94b02b434b7a616e6b0c8 hdfs:/mycluster/hbase/data/default/
13、falcon_picrecord/7da3ddf6e948ee2742f0ce c68cf6ee93/col/f87842e59e9f450d9514959bade2c121e) HRegionFileSystem: Committing store file hdfs:/mycluster/hbase/data/default/falcon_picrecord/7da3ddf6e948ee2742f0ce c68cf6ee93/.tmp/4eccfc22b593438395c73210f2a8040aas hdfs:/mycluster/hbase/data/default/falcon_p
14、icrecord/7da3ddf6e948ee2742f0ce c68cf6ee93/col/4eccfc22b593438395c73210f2a8040af) HFileArchiver: Finished archiving from hdfs:/mycluster/hbase/data/default/falcon_picrecord/7da3ddf6e948ee2742f0ce c68cf6ee93/col/c892b1043660402a8a7ee557918d17ae,to hdfs:/mycluster/hbase/archive/data/default/falcon_pic
15、record/7da3ddf6e948ee2 742f0cec68cf6ee93/col/c892b1043660402a8a7ee557918d17ae hdfs:/mycluster/hbase/data/default/falcon_picrecord/7da3ddf6e948ee2742f0cec68cf6ee93/col/3d3adc0339f94b02b434b7a616e6b0c8,tohdfs:/mycluster/hbase/archive/data/default/falcon_picrecord/7da3ddf6e948ee2742f0cec68cf6ee93/col/3
16、d3adc0339f94b02b434b7a616e6b0c8hdfs:/mycluster/hbase/data/default/falcon_picrecord/7da3ddf6e948ee2742f0ce c68cf6ee93/col/f87842e59e9f450d9514959bade2c121,tohdfs:/mycluster/hbase/archive/data/default/falcon_picrecord/7da3ddf6e948ee2742f0cec68cf6ee93/col/f87842e59e9f450d9514959bade2c121g) HStore: Comp
17、leted major compaction of 3 files of7da3ddf6e948ee2742f0cec68cf6ee93 into 4eccfc22b593438395c73210f2a8040a8. 当另一个recoverLease方法返回后,删除原先的WALs文件,将172.25.3.105上的region 通过 round-robin 分配到其他三个 regionserver 上, AssignmentManager : Assigning 8 region(s) to 172-25-3-103Assigning 9 region(s) to 172-25-3-104As
18、signing 9 region(s) to 172-25-3-1069. 将分发到各个 regionserver 的 region Online :a) AssignmentManager: Handling RS_ZK_REGION_OPENING state=PENDING_OPENb) RegionStates: Transitioned state=PENDING_OPEN to state=OPENINGc) AssignmentManager: Handling RS_ZK_REGION_OPENED state=OPENINGd) RegionStates: Transitioned state=OPENING to state=OPENe) OpenedRegionHandler: Handling OPENED of5ebe39a8fb6c5144663d7b1c63400625 from 172-25-3-103, deleting unassigned node.f) AssignmentManager: Znode 5ebe39a8fb6c5144663d7b1c63400625 deleted, state
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2026中国联通苍南县分公司招聘3人备考题库(浙江)附答案详解(培优b卷)
- 2026新疆昌吉农高集团电商公司继续招聘专业运营人才备考题库(第二批)含答案详解(新)
- 2026新华人寿保险股份有限公司宜宾中心支公司续期服务人员招聘6人备考题库及一套参考答案详解
- 2026广东广州市荔湾区白鹤洞街道环卫站招聘环卫工人4人备考题库及完整答案详解1套
- 2026山西吕梁市消防救援局社会招聘政府专职消防员的170人备考题库及一套答案详解
- 2026上海政法学院上海司法研究所(派遣制)招聘1人备考题库附答案详解(完整版)
- 2026黑龙江大庆市肇源县招聘公益性岗位人员206人备考题库含答案详解(培优b卷)
- 2026黑龙江省龙江化工有限公司招聘1人备考题库附答案详解(轻巧夺冠)
- 2026江苏徐州医科大学招聘85人备考题库附答案详解
- 2026湖北大学医院招聘工作人员1人备考题库含答案详解(培优)
- 零件CAM软件编程-CAXA制造工程师 课件全套任务1-7 CAXA 制造工程师 2022 软件功能认知-壳体加工
- 广东省佛山市华英学校2024-2025学年上学期七年级入学分班考试英语试卷
- 2025年自贡市中考物理试题卷(含答案解析)
- 产品返修件管理制度
- 篮球裁判员手册(2人执裁与3人执裁2018年版)
- 烧烤营地合作协议书
- 黑龙江省园林绿化工程消耗量定额2024版
- 食品工程原理课件蒸发
- 人工智能助力智慧护理的发展
- 公路工程标准施工招标文件第八章-工程量清单计量规则(2018年版)
- 危险化学品安全有关法律法规解读
评论
0/150
提交评论