第8章分布式系统的可靠性.ppt

上传人：油*** IP属地：浙江上传时间：2020-03-22 格式：PPT 页数：53 大小：222.51KB 积分：30 举报 版权申诉

已阅读5页，还剩48页未读，继续免费阅读

版权说明：本文档由用户提供并上传，收益归属内容提供方，若内容存在侵权，请进行举报或认领

文档简介

第8章分布式系统的可靠性分布式系统八 08 05 2 基本模型分布式系统的一个重要目标是获取高度的可依赖性 Dependability 可依赖性的概念包括以下三个方面可靠性在错误存在的情况下持续服务的能力安全性不出现灾难性错误的能力保密性指避免或承受对系统进行的故意性攻击的能力本章重点关注可依赖性中的可靠性即故障错误或失效 faults errors orfailures 这些概念通用的检测和处理分布式系统八 08 05 3 基本模型分布式系统可靠性的目标是当故障发生时确保系统的全局一致性即确保系统具备容错能力故障来源于如下4类节点硬件故障物理硬件故障程序软件故障软件设计或编码错误通讯故障通信介质故障时序故障物理故障导致运行时序错误分布式系统八 08 05 4 基本模型要确保系统具备容错能力通常使用冗余技术有四种冗余类型硬件冗余如额外的PE I O系统等软件冗余如软件模块的额外版本信息冗余如使用了额外位数的错误检测代码时间冗余如用来完成系统功能的附加时间分布式系统八 08 05 5 基本模型有三种基本的处理故障的方法主动复制所有的复制模块协同进行并且它们的状态紧密同步被动复制由唯一的一个处于主动的模块设定定期检查点定期更新其它模块的交互状态半主动复制是主动复制和被动复制的混合此种方法所需的恢复开销相对较低主动复制用到了错误屏蔽的概念即隐藏出现的故障或防止故障造成错误结果被动复制又称为动态方法它通过从系统中检测错误的存在并采取一定措施转移错误元件来获得容错分布式系统八 08 05 6 基本模型故障检测可被分为两类外部检测将检测节点失效的职责赋予节点的外部附件或其它节点但需防止检测者本身故障检测者和被检测者间通信故障时导致的误检误报内部检测将检测机制置于一个节点内部自检通常假定内部有一个可以完全信赖的硬核 hardcore 检测元件硬核不受节点故障的冲击完全做到这一点其实是很难的通常结合使用外部检测方法和内部检测方法以得到一个有效的故障检测方案故障检测的技术实施手段包括通信应答超时编码校验结果比较等分布式系统八 08 05 7 基本模型处理软件故障通常采用两个软件模型基于进程的模型一个应用程序由一连串协同作业的进程组成如 P1 P2 Pn 基于对象的模型一个应用程序由一连串对象组成每一个对象都是一个独立的原子操作通过很好定义的界面访问就可以获得对象的封装我们的讨论中以基于进程的模型为例分布式系统八 08 05 8 容错系统设计的构件模块具备容错能力的可靠的分布式系统中涉及到三种逻辑实体包括二种构件模块稳定存储器故障停止处理器和一个用于构件模块的原子操作分布式系统八 08 05 9 稳定存储器稳定存储器是在系统失效的情况下可以躲过系统错误的特定存储空间的抽象概念也就是说稳定存储器空间里的内容不被一个失效所摧毁存储器的两个基本操作是读和写稳定存储器的目标是在系统失效的情况下屏蔽不希望的事件正确地执行读写操作分布式系统八 08 05 10 稳定存储器对于读read address a 来说返回 status goodorbad data d 其不希望结果包括 a是好的但读取返回bad 同上而且后来的读也返回bad a是坏的但读取返回good 或者a是good 但读取返回不同的数据d 对于写write address a data d 来说其不希望的结果 a保持不变而d变为不同的数据d a变为 bad d 一个理想的稳定存储器读总是返回正确的结果写总是成功分布式系统八 08 05 11 稳定存储器 RAID 获得适宜的稳定存储器的一个方法是使用RAID技术 RedundantArraysofInexpensiveDisks 廉价磁盘冗余阵列目前常用的有下列RAID技术分布式系统八 08 05 12 故障停止处理器一个处理器故障时最好的结果是不进行任何不正确的操作而简单地停止工作这样的处理器称为故障停止处理器一个故障停止处理器有以下特性 a 处理器停止运行 b 暂态存储丢失而稳态存储不受影响 c 任何处理器均可检测到故障停止处理器的失效状态分布式系统八 08 05 13 故障停止处理器可以使用下面的方法使一个非故障停止处理器变成一个故障停止处理器使用稳定存储器和一个可靠的存储处理器一个控制存储媒介的处理器以及k 1个处理器这k 1个处理器都运行同样的程序并通过存储处理器访问同一个稳定存储器如果存储处理器发现任何一个请求是不同的或者任何一个请求没有在指定的期间到达存储处理器则意味着检测到一个失效事件因而应该丢弃所有请求这个故障停止处理器是一个k 故障停止处理器当系统中有 k个元件失效时仍然可以满足故障停止处理器的要求分布式系统八 08 05 14 原子操作一个原子操作就是由硬件独立执行的一系列动作即每一个动作或者被完全彻底地执行或者系统的状态保持不变动作根本没有执行每一个动作都是孤立的当执行这一动作时在进程中感觉不到外界活动的存在也意识不到外界状态的变化同样任何外界的进程均感觉不到一个孤立的原子操作的内在状态的变化即原子操作具有全或无性质许多应用都需要原子操作如对信号量操作对数据库的访问等分布式系统八 08 05 15 故障的处理节点故障的处理拜占庭式故障的处理通信故障的处理软件故障的处理分布式系统八 08 05 16 节点故障的处理使用主动复制的方法处理节点故障相对来说比较简单和容易但其代价较大处理永久故障的硬件冗余比较昂贵处理暂时故障的时间冗余重试其效率受到较大影响我们讨论被动复制的方法在被动复制中可以使用向前式恢复或向后式恢复向前式恢复中假定系统中故障和损失的性质可被完全准确地获知这样就可能去掉这些故障以使系统继续向前运行看似简单实现困难向后式恢复适用于当故障的性质无法预知及去掉时系统要定时地记录系统状态这样当失效导致系统处于不相容的状态时系统可以重新恢复到从前没发生故障的状态比较可行分布式系统八 08 05 17 向后式恢复检查点 Check point 进程执行中设定的记录当时进程状态的用于以后节点故障时进程向后恢复回来的点被称为检查点有两种方法来保存检查点每个检查点被传送到每一个被动备份模块每个检查点被存储在当地的稳定存储器中系统总是保存最近最新的一个检查点当进程无故障地运行到一个新的检查点时就需要进行新旧检查点保存的替换检查点保存的替换必须是原子操作即要么保存替换为新检查点要么保留旧检查点分布式系统八 08 05 18 向后式恢复一个进行新旧检查点保存替换的方案 Sequoia 使用2个处于稳定存储器中的内存库 A库和B库作为检查点的双份保存在对新检查点状态信息进行保存以刷新旧检查点状态信息时同时写入4个固定相同的时戳 A库刷新前Ta1 刷新后Ta2 B库刷新前Tb1 刷新后Tb2 通过分析替换操作后的时戳结果确定下一步的措施以及是否导致替换操作成功例中假设先刷新A库若相反则类似分布式系统八 08 05 19 向后式恢复如果4个时戳相等则新旧检查点保存替换操作完全成功如果一个库中只写下刷新前的时戳如Ta1 则失效发生在向该库 A库刷新的过程中即该库 A库中新检查点是不完全的此时需用另一个旧库 B库中的旧检查点信息将该库 A库恢复一旦有一个库刷新成功如Ta1 Ta2 则可以复制这个新库 A库中的新检查点信息到旧库 B库中而使整个新旧检查点保存替换操作成功分布式系统八 08 05 20 节点故障的处理当检测到节点模块如PE 出现故障时使用被动复制的向后式恢复方法可以这样处理对于永久性故障用后备冗余模块替换故障模块替换上来的模块从稳定存储器中获得上一个检查点最近的的系统状态从该处重新执行硬件冗余对于暂时性故障使用原来的模块从稳定存储器中获得上一个检查点最近的的系统状态从该处重新执行时间冗余分布式系统八 08 05 21 前卷式恢复一个向前式恢复策略是前卷式恢复它是半主动复制的一个特例其主要的思路是一个进程任务的初始备份或上一个正确的检查点开始由不同的处理器来运行这些版本的结果在检查点进行表决或比较如果表决结果是成功的则可以获得一个储存在稳定存储器中的正确结果在这个结果的基础上再执行下一项任务的备份如果表决结果是失败的非故障处理器就在以前的任务的每一个结果的基础上执行下一项任务的备份与此同时后备处理器替换故障处理器对以前的任务执行一次回卷运行即在后备处理器上再运行以前的任务目的是获得正确的结果稳定存储器只保存基于以前的任务项的正确版本的经过表决后正确的结果而抛弃掉其他结果所有版本都失效或后备处理器重新运行以前的任务也不能获得正确的结果回卷是不可避免的但这种最坏情况发生的可能性很小因此前卷式恢复仍然可以节省很多的回卷时间分布式系统八 08 05 22 前卷式恢复 Pradhan和Vaidya提出有2个验证间隔的前卷式恢复方案 Long Fuchs和Abraham提出有1个验证间隔的前卷式恢复方案 P171 P172 需要参考相关文献分布式系统八 08 05 23 向后恢复中的问题考虑向后恢复中的两个特殊问题检查点的存储讨论检查点存储的策略检查点方法讨论设置检查点的方法分布式系统八 08 05 24 检查点的存储向后恢复式的系统中将系统的数据分为2类活动数据进程执行中的数据检查点数据检查点时刻保存的数据系统存储器可以分为3个层次第一层寄存器 register 和高速缓存 cache 易失性的如失电丢失第二层内存 memory 易失性的或非易失性的如闪存flashmemory 或自供电内存第三层磁盘 disk 非易失性的 3个层次的存储器其访问速度依次指数级降低成本依次指数级降低容量依次指数级增大分布式系统八 08 05 25 检查点的存储可能的检查点存储的分配方案有在第一层寄存器和高速缓存存储活动数据在第二层非易失性内存和第三层磁盘存储检查点在第一层和第二层易失性内存存储活动数据在第三层存储检查点总之检查点数据必须存储在稳定存储器中前一种方案检查点存储的效率较高分布式系统八 08 05 26 检查点的存储一个方案基于高速缓存的检查点方案活动数据存储在CPU的寄存器和高速缓存中检查点数据存储在内存中检查点和回卷的要求如下在检查点将局部状态 CPU寄存器保存在一个特殊的内存区域将更改过的高速缓存中的数据写到内存中回卷时从特殊的内存区域装入CPU寄存器将高速缓存中的所有被更改的数据设定为使无效高速缓存中不能命中从而强制从内存中读取检查点数据分布式系统八 08 05 27 检查点的存储此方案的另一个重要问题是活动数据不能全部在高速缓存时需要保持更改过的高速缓存中的数据与内存的一致有2种方法写通 write through 高速缓存方法高速缓存被更改时改变将立刻写入内存写回 write back 高速缓存方法只有高速缓存失效退出时才进行更新内存在写回方法中因为在处理器失效的情况下没有必要改写内存因此恢复时会更快分布式系统八 08 05 28 检查点的存储另一个方案双胞胎页面方案活动数据存储和检查点数据存储映射到存储等级的两块区域当使用新的检查点时它们就彼此交换角色即活动数据变成检查点数据检查点数据区域用于活动数据两块区域的分配策略有将活动数据存储和检查点数据存储映射到同一个等级如第二层或第三层将活动数据存储和检查点数据存储映射到相邻的等级如第一层和第二层或第二层和第三层分布式系统八 08 05 29 检查点方法一个全局状态的定义是一系列局部状态检查点的集合每个局部进程有一个局部状态而各局部进程设置局部检查点是独立的这就可能出现两种不好的状态丢失的消息进程Pi的状态当前检查点显示它给进程Pj发送了消息m 但是进程Pj并没有关于这个消息的记录孤儿消息进程Pj的状态显示它收到了一个来自进程Pi的消息m 但是进程Pi的状态显示它从来没有向Pj发送过m 分布式系统八 08 05 30 检查点方法丢失消息这个状态出现的可能性消息真的丢失了通信链路的故障消息没有丢失正在传输中但全局状态中Pi和Pj的检查点设置不合理如下图a 消息被收到了但接收者在收到消息后但在开始下一个检查点之前崩溃了如下图b 通过设置接收者日志可以追查到这个消息当前检查点当前检查点 Pi Pj m a 当前检查点当前检查点 Pi Pj m b 下一个检查点接收者日志分布式系统八 08 05 31 检查点方法孤儿消息这个状态出现的可能性发送者在发送完消息后失效被卷回到前一个检查点如下图通过设置发送者日志可以追查到这个消息为了解决孤儿消息接收者回卷到上一个检查点并且清除对孤儿消息的记录当前检查点当前检查点 Pi Pj m 下一个检查点发送者日志 Pi记录了消息m的接收但Pj没有记录消息的发送分布式系统八 08 05 32 检查点方法然而这样可能会导致多米诺效应 dominoeffect 当前检查点当前检查点 Pi Pj n 下一个检查点 m 分布式系统八 08 05 33 检查点方法几个概念非常一致的强一致的 stronglyconsistent 检查点集合一系列的没有孤儿或丢失的消息的局部检查点的集合显然在这些检查点的中间时段进程间没有信息流动一致的 consistent 检查点集合一系列的没有孤儿消息的局部检查点的集合如果每个进程都在发送一个消息之后就马上生成一个检查点则最近的检查点的集合将永远是一致的但并非强一致的分布式系统八 08 05 34 检查点方法检查点的设置可以是同步的异步的也可以是二者的混合另外也可以选择要不要对一个进程发送或接收的消息做日志同步检查点有关的进程协调它们的局部检查点行为确保所有的最近的检查点都是一致的如接收进程对消息的接收设置了检查点则该消息的发送进程对消息的发送要设置检查点显然同步检查点的设置需要一些额外的开销异步检查点每个进程都在没有任何协调的情况下设置最自己的检查点异步检查点情况下可以通过间隔时间依赖图来判断一个检查点集合是否一致当且仅当不存在i和j满足LCi LCj Pi是发送进程 Pj是接收进程即所有的发送进程Pi和接收进程Pj之间不存在孤儿消息分布式系统八 08 05 35 检查点方法混合检查点更好地利用了同步和异步检查点的方法在一个较长的时间中使用同步检查点在这些同步时段里会有一些异步时段这样既可以有效地控制回卷又不会在建立检查点的过程中引入很多开销检查点日志对所有的发送和接收消息都记录下来发送者日志和接收者日志这样在一致的状态下可以利用接收者日志减少回卷工作量即只需将收到的消息重放一遍这也可以有效地控制多米诺效应当前检查点当前检查点 Pi Pj m 下一个检查点接收者日志分布式系统八 08 05 36 检查点方法在没有其它处理器故障的前提下发送者日志可以提供无需回卷的恢复即下图中发送者Pj根据发送日志不需要再发送消息m 当前检查点当前检查点 Pi Pj m 下一个检查点发送者日志分布式系统八 08 05 37 处理拜占庭故障故障停止处理器模型的其它情况一个有故障的处理器可能会向不同的处理器做出一些恶意的行为如提供一些不同的不可信的结果或发送不同的令其它处理器费解的消息这种不稳定的变幻莫测的故障叫做拜占庭故障 Byzantinefault 处理拜占庭故障一个重要的应用是一致协议 agree mentprotocol 一个进程处理器集合需要在部分进程处理器发生拜占庭故障时能够产生一个一致的正确的结果分布式系统八 08 05 38 同步系统中的一致协议更确切的说一个一致协议需要满足一致性所有正确的进程取得一致的结果而且是最后的结果合法性所有进程同意的结果必须来自某个正确的进程的输入有限性每个进程在有限的步数内取得一个结果分布式系统八 08 05 39 同步系统中的一致协议拜占庭将军问题 Byzantinegeneralproblem 拜占庭军队的几个师围在一个敌军军营周围每个师都有自己的将军领导每个将军可以通过信使与其它将军传递消息但某些将军可能是叛徒在对敌军进行考察后将军们必须决定一个战略计划这个计划由一个将军称为commandinggeneral 发送给其他的将军称为lieutenant 必须设计一个算法满足 1 所有忠诚的lieutenant得到相同的命令 2 如果commandinggeneral是忠诚的那么每一个忠诚的lieutenant必须得到commandinggeneral正确的命令分布式系统八 08 05 40 对一个发送者的一致系统中的每个非出错进程都使用来自进程Pi的结果来进行决策这样一致性将军问题就变为系统中的进程都同意一个进程比如P0的结果确切地说所有非出错进程都使用来自进程P0同样的值v0 如果发送进程P0是非出错的那么所有非出错进程都使用P0发送的正确的结果这个要求叫做交互一致性 interactiveconsistency 达到上述要求的困难之处在于一个进程发往另一个进程的消息是不可轻信的所以为了同意一个进程发送的值除了从那个进程取得值以外还需要从其它进程取得其收到的值然后进行确认少数服从多数的决策以确定它是原来的值分布式系统八 08 05 41 对一个发送者的一致交互一致性算法条件一个发送者 k个出错节点至少3k 1个进程总数具体算法算法共k 1步 IC l l k 初始时 l 0 S S 发送者列表 1 发送者将它的值和发送者列表发送给其它的进程共 n l 1 个消息 2 设vi是进程Pi从发送者接收到的值或者是如果没有收到值时使用的缺省值在IC l 1 k 进程Pi作为发送者将结果vi和发送者列表S Pi 发送给其它不在发送者列表中的n l 2个进程如果l 1 k 则调用IC k 3 对每个进程Pi 设vj是从进程Pj接收到的值由Pj转发给Pi 即IC l 1 的结果节点使用值majority vi vj j S IC k 1 发送者将它的值发送给其它n k 1个进程 2 每个进程使用它从其它至少2k个接收者发送来的加上自己收到的然后进行majority的值或者是如果没有收到值时使用的缺省值分布式系统八 08 05 42 对一个发送者的一致算法说明每个进程都可以和其它任何一个进程通信第一个发送者可能是出错进程算法总结是一个递归算法算法经过k 1轮的消息交换算法被交换的消息总数是 n 1 n 2 n k 1 个算法的复杂度是O nk 算法例一个有7个进程的例子 P178 参考拜占庭将军问题资料分布式系统八 08 05 43 多个发送者的一致系统中有多个消息发送者可以通过对每个发送者都重复同样的协议将交互一致扩展到多个发送者的情况已经证明当且仅当n 3k 1时这个问题才时可解的 n是进程总数 k是故障进程数解决这个问题的算法需要至少k 1轮的消息交换 Fisher lynch和Merritt证明了在3个进程中最多有1个进程出错的情况下另外2个进程不可能达成一致 P179一个例证分布式系统八 08 05 44 多个发送者的一致算法实例 n 4 k 1 通过2轮消息交换 1 每个进程将它的局部值发给其他3个进程 2 每个进程将它从第1轮收到的消息发给其他所有的进程 3 每个进程对自己的专用值和在上2步收到的值执行一个决策过程少数服从多数结果见P180表8 2 其中vi是进程Pi的专用值 vik表示不同类型的故障值表示空值假设P1是故障进程其他3个正确的进程P2 P3和P4可以通过对每列的4个向量进行多数投票获得相同的结果向量 v18 v2 v3 v4 分布式系统八 08 05 45 不同模型下的一致 Turek和Shasha提出了不同模型下关于一致问题的一些参数系统是同步的 A 1 还是异步的 A 0 通信延迟是有限的 B 1 还是无限的 B 0 消息是有序的 C 1 还是无序的 C 0 传输机制是点对点的 D 0 还是广播 D 1 经过证明不同模型下取得一致的条件是 AB AC CD True即 1 AB 1 处理器是同步的通信延迟是有限的 2 AC 1 处理器是同步的消息是有序的 3 CD 1 消息是有序的传输机制是广播其它的条件下如异步点对点系统两军问题不可能达到一致分布式系统八 08 05 46 被鉴别消息的一致一个有故障的接收者可能会将一个消息的不同值转发出去但在接收者不能改变消息的情况下问题就简单了可以通过给消息增加一个数字签名来实现这一点每个消息m都附加一个发送者签名的列表S P181 182 书上错误 P182 P i 中的位置 S i 分布式系统八 08 05 47 处理通信故障解决通信故障的最简单的方法就是使用应答和超时机制如果发送者没有收到来自接收者的应答信号发送者就会重新发送这个消息如果认为错误是临时性的就采用相同的路径如果认为错误是永久性的就选择另外一个点分离的路径永久性故障环境下的超时方法 success F i 1 success i number of node disjoint path setup t sendmessagemtoreceiveralongtheithpath receiveackfromreceive success

人人文库> 全部分类> 教育资料 > 课件下载

温馨提示

1. 本站所有资源如无特殊说明，都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2. 本站的文档不包含任何第三方提供的附件图纸等，如果需要附件，请联系上传者。文件的所有权益归上传用户所有。
3. 本站RAR压缩包中若带图纸，网页内容里面会有图纸预览，若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 人人文库网仅提供信息存储空间，仅对用户上传内容的表现方式做保护处理，对用户上传分享的文档内容本身不做任何修改或编辑，并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容，请与我们联系，我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

第8章分布式系统的可靠性.ppt

文档简介

温馨提示

最新文档

评论

第8章 分布式系统的可靠性.ppt

文档简介

温馨提示

最新文档

评论

相关文档

第8章分布式系统的可靠性.ppt