分布式系统的可靠性课件_第1页
分布式系统的可靠性课件_第2页
分布式系统的可靠性课件_第3页
分布式系统的可靠性课件_第4页
分布式系统的可靠性课件_第5页
已阅读5页,还剩99页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

基本模型分布式系统的一个重要目标是获取高度的可依赖性(Dependability)。■可依赖性的概念包括以下三个方面可靠性:在错误存在的情况下持续服务的能力。安全性:不出现灾难性错误的能力。保密性:指避免、或承受对系统进行的故意性攻击的能力■本章重点关注可依赖性中的可靠性,即故障、错误或失效(faults,errors,orfailures,这些概念通用)的检测和处理。《分布式系统》(八)2019基本模型1基本模型■分布式系统可靠性的目标是当故障发生时,确保系统的全局一致性。即确保系统具备容错能力。■故障来源于如下4类:节点(硬件)故障:物理硬件故障;程序(软件)故障:软件设计或编码错误;通讯故障:通信介质故障时序故障:物理故障导致运行时序错误。《分布式系统》(八)2019基本模型2基本模型■要确保系统具备容错能力,通常使用冗余技术■有四种冗余类型硬件冗余:如额外的PE、Ⅳ○系统等软件冗余:如软件模块的额外版本。信息冗余:如使用了额外位数的错误检测代码。时间冗余:如用来完成系统功能的附加时间《分布式系统》(八)2019基本模型3基本模型有三种基本的处理故障的方法主动复制。所有的复制模块协同进行,并且它们的状态紧密同步。被动复制。由唯一的一个处于主动的模块设定定期检查点定期更新其它模块的交互状态。半主动复制。是主动复制和被动复制的混合。此种方法所需的恢复开销相对较低。■主动复制用到了错误屏蔽的概念,即隐藏出现的故障或防止故障造成错误结果。被动复制,又称为动态方法,它通过从系统中检测错误的存在,并采取一定措施转移错误元件来获得容错。《分布式系统》(八)2019基本模型4基本模型■故障检测可被分为两类外部检测:将检测节点失效的职责赋予节点的外部附件(或其它节点但需防止检测者本身故障、检测者和被检测者间通信故障时导致的误检(误报)。内部检测将检测机制置于一个节点内部(自检)。通常假定内部有一个可以完全信赖的“硬核”(hardcore)检测元件,“硬核”不受节点故障的冲击。完全做到这一点其实是很难的。■通常结合使用外部检测方法和内部检测方法,以得到个有效的故障检测方案。■故障检测的技术实施手段包括:通信应答超时、编码校验、结果比较等《分布式系统》(八)2019基本模型5基本模型■处理软件故障通常采用两个软件模型基于进程的模型:一个应用程序由一连串协同作业的进程组成,如P1P2l.Pn]基于对象的模型:一个应用程序由一连串对象组成,每一个对象都是一个独立的原子操作。通过很好定义的界面访问,就可以获得对象的封装。■我们的讨论中,以基于进程的模型为例。《分布式系统》(八)2019基本模型6容错系统设计的构件模块■具备容错能力的、可靠的分布式系统中涉及到三种逻辑实体,包括二种构件模块稳定存储器故障一停止处理器和一个用于构件模块的:原子操作《分布式系统》(八)2019容错系统设计的构件模块7稳定存储器■稳定存储器是在系统失效的情况下,可以躲过系统错误的特定存储空间的抽象概念。也就是说,稳定存储空间里的内容不被一个失效所摧毁。■存储器的两个基本操作是读和写,稳定存储器的目标是在系统失效的情况下,屏蔽不希望的事件,正确地执行读、写操作《分布式系统》(八)2019稳定存储器8稳定存储器对于读read(address:a来说,返回(status:goodorbad,data:d),其不希望结果包括:是好的,但读取返回bad同上,而且后来的读也返回bad;a是坏的,但读取返回good;或者a是good,但读取返回不同的数据d■对于写write(address:a,datad)来说,其不希望的结a保持不变,而d变为不同的数据d"a变为(bad,d)。理想的稳定存储器:读总是返回正确的结果,写总是成功。《分布式系统》(八)2019稳定存储器9稳定存储器一RAID■获得适宜的稳定存储器的一个方法是使用RA|D技术(RedundantArraysofInexpensiveDisks,廉价磁盘冗余阵列)。■目前常用的有下列RAD技术:数组种类英文简述硬盘谷错吗?可用容量RAIDlevel0Stripe/span(分条/分跨)NRAIDlevel1Mirror(镜像)YeN/2RAIDlevel3ParallelwithParity(分条奇偶校验)YeN-1RAIDlevel4ParallelwithParity(分区奇偶校验)YesN-1RAIDlevel5StripedwithRotatingParityRAIDlevel0+1MirrorStripe《分布式系统》(八)2019稳定存储器一RAID10分布式系统的可靠性课件11分布式系统的可靠性课件12分布式系统的可靠性课件13分布式系统的可靠性课件14分布式系统的可靠性课件15分布式系统的可靠性课件16分布式系统的可靠性课件17分布式系统的可靠性课件18分布式系统的可靠性课件19分布式系统的可靠性课件20分布式系统的可靠性课件21分布式系统的可靠性课件22分布式系统的可靠性课件23分布式系统的可靠性课件24分布式系统的可靠性课件25分布式系统的可靠性课件26分布式系统的可靠性课件27分布式系统的可靠性课件28分布式系统的可靠性课件29分布式系统的可靠性课件30分布式系统的可靠性课件31分布式系统的可靠性课件32分布式系统的可靠性课件33分布式系统的可靠性课件34分布式系统的可靠性课件35分布式系统的可靠性课件36分布式系统的可靠性课件37分布式系统的可靠性课件38分布式系统的可靠性课件39分布式系统的可靠性课件40分布式系统的可靠性课件41分布式系统的可靠性课件42分布式系统的可靠性课件43分布式系统的可靠性课件44分布式系统的可靠性课件45分布式系统的可靠性课件46分布式系统的可靠性课件47分布式系统的可靠性课件48分布式系统的可靠性课件49分布式系统的可靠性课件50分布式系统的可靠性课件51分布式系统的可靠性课件52基本模型分布式系统的一个重要目标是获取高度的可依赖性(Dependability)。■可依赖性的概念包括以下三个方面可靠性:在错误存在的情况下持续服务的能力。安全性:不出现灾难性错误的能力。保密性:指避免、或承受对系统进行的故意性攻击的能力■本章重点关注可依赖性中的可靠性,即故障、错误或失效(faults,errors,orfailures,这些概念通用)的检测和处理。《分布式系统》(八)2019基本模型53基本模型■分布式系统可靠性的目标是当故障发生时,确保系统的全局一致性。即确保系统具备容错能力。■故障来源于如下4类:节点(硬件)故障:物理硬件故障;程序(软件)故障:软件设计或编码错误;通讯故障:通信介质故障时序故障:物理故障导致运行时序错误。《分布式系统》(八)2019基本模型54基本模型■要确保系统具备容错能力,通常使用冗余技术■有四种冗余类型硬件冗余:如额外的PE、Ⅳ○系统等软件冗余:如软件模块的额外版本。信息冗余:如使用了额外位数的错误检测代码。时间冗余:如用来完成系统功能的附加时间《分布式系统》(八)2019基本模型55基本模型有三种基本的处理故障的方法主动复制。所有的复制模块协同进行,并且它们的状态紧密同步。被动复制。由唯一的一个处于主动的模块设定定期检查点定期更新其它模块的交互状态。半主动复制。是主动复制和被动复制的混合。此种方法所需的恢复开销相对较低。■主动复制用到了错误屏蔽的概念,即隐藏出现的故障或防止故障造成错误结果。被动复制,又称为动态方法,它通过从系统中检测错误的存在,并采取一定措施转移错误元件来获得容错。《分布式系统》(八)2019基本模型56基本模型■故障检测可被分为两类外部检测:将检测节点失效的职责赋予节点的外部附件(或其它节点但需防止检测者本身故障、检测者和被检测者间通信故障时导致的误检(误报)。内部检测将检测机制置于一个节点内部(自检)。通常假定内部有一个可以完全信赖的“硬核”(hardcore)检测元件,“硬核”不受节点故障的冲击。完全做到这一点其实是很难的。■通常结合使用外部检测方法和内部检测方法,以得到个有效的故障检测方案。■故障检测的技术实施手段包括:通信应答超时、编码校验、结果比较等《分布式系统》(八)2019基本模型57基本模型■处理软件故障通常采用两个软件模型基于进程的模型:一个应用程序由一连串协同作业的进程组成,如P1P2l.Pn]基于对象的模型:一个应用程序由一连串对象组成,每一个对象都是一个独立的原子操作。通过很好定义的界面访问,就可以获得对象的封装。■我们的讨论中,以基于进程的模型为例。《分布式系统》(八)2019基本模型58容错系统设计的构件模块■具备容错能力的、可靠的分布式系统中涉及到三种逻辑实体,包括二种构件模块稳定存储器故障一停止处理器和一个用于构件模块的:原子操作《分布式系统》(八)2019容错系统设计的构件模块59稳定存储器■稳定存储器是在系统失效的情况下,可以躲过系统错误的特定存储空间的抽象概念。也就是说,稳定存储空间里的内容不被一个失效所摧毁。■存储器的两个基本操作是读和写,稳定存储器的目标是在系统失效的情况下,屏蔽不希望的事件,正确地执行读、写操作《分布式系统》(八)2019稳定存储器60稳定存储器对于读read(address:a来说,返回(status:goodorbad,data:d),其不希望结果包括:是好的,但读取返回bad同上,而且后来的读也返回bad;a是坏的,但读取返回good;或者a是good,但读取返回不同的数据d■对于写write(address:a,datad)来说,其不希望的结a保持不变,而d变为不同的数据d"a变为(bad,d)。理想的稳定存储器:读总是返回正确的结果,写总是成功。《分布式系统》(八)2019稳定存储器61稳定存储器一RAID■获得适宜的稳定存储器的一个方法是使用RA|D技术(RedundantArraysofInexpensiveDisks,廉价磁盘冗余阵列)。■目前常用的有下列RAD技术:数组种类英文简述硬盘谷错吗?可用容量RAIDlevel0Stripe/span(分条/分跨)NRAIDlevel1Mirror(镜像)YeN/2RAIDlevel3ParallelwithParity(分条奇偶校验)YeN-1RAIDlevel4ParallelwithParity(分区奇偶校验)YesN-1RAIDlevel5StripedwithRotatingParityRAIDlevel0+1MirrorStripe《分布式系统》(八)2019稳定存储器一RAID62分布式系统的可靠性课件63分布式系统的可靠性课件64分布式系统的可靠性课件65分布式系统的可靠性课件66分布式系统的可靠性课件67分布式系统的可靠性课件68分布式系统的可靠性课件69分布式系统的可靠性课件70分布式系统的可靠性课件71分布式系统的可靠性课件72分布式系统的可靠性课件73分布式系统的可靠性课件74分布式系统的可靠性课件75分布式系统的可靠性课件76分布式系统的可靠性课件77分布式系统的可靠性课件78分布式系统的可靠性课件79分布式系统的可靠性课件80分布式系统的可靠性课件81分布式系统的可靠性课件82分布式系统的可靠性课件83分布式系统的可靠性课件84分布式系统的可靠性课件85分布式系统的可靠性课件86分布式

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论