版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、Ceph RADOS简介 (Reliable, Autonomic Distributed Object Store) 京东虚拟化总监 何雨 架构简介 两个部分组成: 由数目可变的大规模OSDs(Object Storage Devices)组成的集群,负责存储所有的Objects数据 由少量Monitors组成的强耦合、小规模集群,负责管理Cluster Map,其中Cluster Map是整个RADOS系统的关键数据结构,管理集群中的所有成员、关系、属性等信息以及数据的分发。Cluster Map 管理cluster的核心数据结构 指定了OSDs和数据分布信息 monitor上存有最新副本
2、 依靠epoch增加来维护及时更新 增量信息Cluster Map 1.The Monitor Mapcluster fsid, the position, name address and port of each monitor 2.The OSD Mapcluster fsid,a list of pools, replica sizes, PG numbers, a list of OSDs and their status 3.The PG Map:PG version, its time stamp, the last OSD map epoch, the full ratios,
3、 and details on each placement group such as the PG ID,the Up Set, the Acting Set, the state of the PG (e.g., active + clean), and data usage statistics for each pool. 4.The CRUSH Mapa list of storage devices, the failure domain hierarchy (e.g., device, host, rack, row, room, etc.), and rules for tr
4、aversing the hierarchy when storing data 5.The MDS MapMDS map epoch,the pool for storing metadata, a list of metadata servers, and which metadata servers are up and in数据存放1Object到PG的映射。PG (Placement Group)是Objects的逻辑集合。相同PG里的Object会被系统分发到相同的OSDs集合中。由Object的名称通过Hash算法得到的结果结合其他一些修正参数可以得到Object所对应的PG。2
5、RADOS系统根据根据Cluster Map将PGs分配到相应的OSDs。这组OSDs正是PG中的Objects数据的存储位置。RADOS采用CRUSH算法实现了一种稳定、伪随机的hash算法。CRUSH实现了平衡的和与容量相关的数据分配策略。CRUSH得到的一组OSDs还不是最终的数据存储目标,需要经过初步的filter,因为对于大规模的分布式机群,宕机等原因使得部分节点可能失效,filter就是为过滤这些节点,如果过滤后存储目标不能满足使用则阻塞当前操作。关于pools 是一个存储对象的逻辑分区概念 所有权/访问对象 对象副本的数目 PG数目 CRUSH规则集的使用 以上后三项决定ceph
6、最后如何存储数据计算PG的ID 1.Client输入pool ID和对象ID(如pool=liverpool,object-id=john) 2.CRUSH获得对象ID并对其hash 3.CRUSH计算OSD个数hash取模获得PG的ID(如0 x58) 4.CRUSH获得已命名pool的ID(如liverpool=4) 5.CRUSH预先考虑到pool ID相同的PG ID(如4.0 x58)Device Stateinoutassigned PGsnot assigned PGsuponline activeonline & idle& reachabledownunrea
7、chableunreachablefailed& not remappedpeer和set peer 属于同一个PG 彼此检查心跳 数据同步 set Acting set PG内所有osd属于Acting set Up set PG内up&in的osdmap传播 所有消息传播都有一个epoch client端: 首次进入去找monitor要最新副本 存取时找OSD对比epoch OSD端: peers之间保持心跳 只保证两个OSD之间同步数据复制 读文件通过一个OSD 主OSD 写文件通过多个OSD复制 Client把对象写进一个确定的PG组中的主OSD 主OSD利用CRUSH map用来确定二级OSDs,复制的对象放入其中。 对象存储成功后进行响应client。数据复制错误检测和恢复 错误检测: 利用心跳 上报monitor 更新map 错误恢复 主osd主持恢复工作 若主osd挂掉,二级osd选择一个顶上数据条带化 由于存储设备吞吐量的限制,影响性能和可伸缩性。 跨多个存储设备的连续块条带化存储信息,以提高吞吐量和性能 Ceph条带化相似于RAID0 注意:ceph条带化属于client端,不在RADOS范畴注意:条带化是独立于对象副本的。由于CRUSH副本对象跨越OSDs,所以条带自动的被复制。条带化参数 Object Size: 足够大可以容纳条带单元,必
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2026年陕西省妇幼保健院医护人员招聘笔试备考试题及答案详解
- 2026年三六三医院医护人员招聘考试备考试题及答案详解
- (2026年)食堂采购管理制度
- 2026年山东省口腔医院医护人员招聘笔试参考试题及答案详解
- 2026年昆山市第一人民医院医护人员招聘考试参考题库及答案详解
- 2026年中国人民解放军海军第九零五医院医护人员招聘笔试备考题库及答案详解
- 2026年中国人民解放军陆军第九五八医院医护人员招聘笔试备考题库及答案详解
- 2026年华夏银行(湖州分行)人员招聘考试参考题库及答案详解
- (2026年)校园足球特色学校未来三年工作计划
- 2026年吉林大学第一医院医护人员招聘考试备考试题及答案详解
- 2026云南大学附属医院招聘2人笔试参考题库及答案详解
- 2026浙江绍兴市福利彩票发行中心编外用工招聘3人笔试参考题库及答案详解
- 2025年九江银行人员招聘笔试考试试题及答案详解
- 2025年广东佛山市初二学业水平地生会考考试真题及答案
- 2026年注册计量师(一级)资格考试全真试题及答案解析
- 北工大材料科学基础(II)课件第4章 固态相变第5节 马氏体转变
- 广铁集团校招机考题库
- 2026年毛泽东思想和中国特色社会主义理论体系概论知识考试卷及答案(共四套)
- 做最勇敢的自己
- 三菱J型自动扶梯维修工艺培训资料
- 经纬仪与角度测量课件
评论
0/150
提交评论