下载本文档
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、基于纠删码的分布式容错存储技术研究, , : , ,而节点失效导致的数, 相比于副本技术 , 基于纠删码的数据冗余技术能够在保证相同容错能力的基 础上, 极大地降低存储开销 , 成为了当前分布式存储领域研究的热点。 基于纠删码 的分布式容错存储技术面临的主要挑战在于 :(1) 现有的纠删码数据写入方法将 数据分块、编码与传输等任务集中于同一节点 , 存在较为严重的瓶颈问题。随着数据量的不断增大 ,瓶颈问题更加突出。 (2) 节点规模的不断增加使得多 点失效的概率明显增大 , 在多点修复过程中现有的纠删码数据修复方法修复效率 较低, 修复开销较大。(3) 纠删码更新过程中涉及较多的数据传输与复杂
2、的数据计算 , 现有的纠删 码更新方法需要消耗较大的网络开销 ,导致了较低的更新效率。 为此,本文围绕实 现基于纠删码的高效低成本存储服务这一目标 , 分别针对基于纠删码的数据写入、 数据修复和数据更新技术展开深入研究。针对已有的纠删码数据写入方法因单点瓶颈而导致写入效率较低的问题, 本文研究提出了一种基于分组的分布式流水线数据写入方法D2CP D2CP 采用一种基于分组的分布式框架以维护源节点、数据节点与编码节点之间的邻居关系。通过一种基于一致性哈希的数据放置算法,D2CP 将节点位置与数据存储位 置进行哈希计算以提高数据放置效率。为了降低写入开销,D2CP 采用一种基于分 组的数据发送调度
3、算法以动态调度源节点的数据发送。,D2CP 组织编码节点之间的计算。基于 HDFS-RAIDf 与目前 已有的纠删码数据写入方法相比,D2CP 24.5%, 显著提升了纠删码数据写入效 率并降低了网络开销。在多点失效场景中 , 集中式修复方法存在单点瓶颈的问题 , 而分布式修复方 法存在修复开销大的问题。两种方法的修复效率随着数据量的增大而显著下降。为此,本文研究提出了一种基于协作的自适应数据修复方法DARSDARS采用一种星型结构与树型结构结合的自适应数据修复模型以同时支持单点失效和多 点失效的修复。通过一种带宽感知的节点选择算法,DARS 选择具有更高可用带宽的节点以 保证节点之间的高可用
4、带宽。通过一种线型结构的数据传输算法,DARS 有效组织 提供者节点与中继节点之间的数据传输。通过一种基于中心节点的数据分发算法,DARS 有效组织协调者节点与新生 节点之间的数据交互 , 进而保证节点之间的数据传输效率。为了最小化网络代 价,DARS 通过条调整提供者节点的数目从而保证负载的均衡性。,并动态基于HDFS-RAIDfTSR和CORE目比,,DARS29%和55%,显著提升了纠删码数据修复效率。 更新过程中复杂的数据传输与计算 使得已有的纠删码单点更新方法效率随着数据规模的增长而显著下降为此, 本文研究提出了一种基于树型结构的单点数据更新方法 TA-UpdateTA-Update
5、 采用一种编码参数无关的更新树结构维护节点之间的连接关系,以支 持不同参数的编码算法。通过一种机架感知的树型构建算法 ,TA-Update 构建了一颗最优更新树 , 以 保证节点之间数据传输的高效性。通过一种自顶向下的流水线数据处理算 法,TA-Update 将节点之间的数据传输流水线化并将更新计算任务分布在多个不 同的节点中。TA-Update 通过一种基于缓存的失效处理算法高效修复失效数据并恢复暂 停的更新过程以提高方法的适应性。基于HDFS-RAID, ,TA-Update在单点失效情况下的更新时间平均减少了纠删码单点更新效率。44%,显著提升了多点更新过程中 ,顺序更新的方式导致已有的
6、更新方法更新开销较大 ,更新 效率随着数据量的增大而显著下降。为此 , 本文研究提出了一种基于分组结构的 多点更新方法Group-U。Group-U 采用基于分组的更新框架以有效组织节点之间的邻居关系。 通过一 种负载感知的分组算法 ,Group-U 依据更新负载自适应地为多个待更新节点选择 合理的分组方式与分组大小。通过一种混合更新算法 ,Group-U 依据时间间隔阈值有效组织多个更新节点 的更新时机,从而保证数据节点的数据一致性和编码节点的更新效率。通过一种 基于缓存的失效处理算法 ,Group-U 有效处理更新过程中出现的节点失效并保证 更新过程的顺利进行基于HDFS-RAIDf 台的测试结
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 中途接班班主任工作经验总结
- 垂体瘤患者护理查房 (1)课件
- 河南大学《高等数学》课件-空间解析几何
- 2026年运动半身裙行业分析报告及未来发展趋势报告
- 2026年胸苷行业分析报告及未来发展趋势报告
- 2026年税控电脑加油机行业分析报告及未来发展趋势报告
- 重症疾病康复的标准治疗方案总结2026
- 2026年黑颈龟养殖行业分析报告及未来发展趋势报告
- 2026年步进式衰减器行业分析报告及未来发展趋势报告
- 2026年村卫生室行业分析报告及未来发展趋势报告
- 2026年上海市嘉定区高三下学期二模化学试卷和答案
- 钉钉内部审批制度流程
- 2026中国东方航空第二期国际化储备人才招聘备考题库及参考答案详解一套
- 模具加工异常奖惩制度
- 《社会工作法规与政策(中级)》课件全套 第1-18章 社会工作服务相关法规与政策的基本体系与主要功能-特定人群权益保护与服务的法规与政策
- 【答案】《人工智能数学思维与应用》(杭州电子科技大学)章节期末慕课答案
- 2025年水下机器人探测精度五年技术报告
- 2025年中核集团校招笔试题库及答案
- 医疗设备人员培训方案范文
- 安徽交控集团所属安徽交控资源有限公司2026年校园招聘备考题库完整参考答案详解
- “欧普照明杯”城市照明行业电工理论考试题库(附答案)
评论
0/150
提交评论