容错计算第4章_第1页
容错计算第4章_第2页
容错计算第4章_第3页
容错计算第4章_第4页
容错计算第4章_第5页
已阅读5页,还剩23页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

同步技术,北京邮电大学计算机科学与技术学院姚文斌,结构,引言时钟级同步松散同步任务级同步同步技术的典型应用,引言,同步技术是多模冗余容错系统故障检测和故障恢复的前提与基础在多模冗余系统中,各个模块运行相同的计算任务,将其中间或最终结果进行比较和表决,从而达到检错、容错以提高整个系统可靠性目的。为保证个模块在比较、表决时刻所用的数据是同一次计算的结果,以维持冗余模块计算数据的一致性,就必须使各个冗余模块计算任务的执行时间相同。通俗的说,就是要求冗余模块在统一的参考时间下具有相同的运行步调,结构,引言时钟级同步松散同步任务级同步同步技术的典型应用,时钟级同步,指系统中各个冗余模块在每个时钟周期T具有相同的执行进度时钟同步是一种紧密同步方式,它维持冗余模块时钟级数据的一致性。在这种方式下,可对各模块的时钟级计算结果进行比较、表决。因而具有故障发现及时、故障恢复快等优点。缺点是需要专门的硬件支持,而且总线上的瞬时故障极易产生的共模错无法检测时钟级同步分为精确独立时钟同步、公共外时钟同步和时钟反馈同步三种形式,精确独立时钟同步,各个模块间完全隔离,依靠各模块间时钟频率的一致性达到模块间的同步要求各个模块时钟频率必须精确一致由于始终模块相互独立,各冗余时钟之间的相位差将是随机的,难以实现逐字节或是逐字的硬件表决实践证明,即使很精确的时钟,也只能使冗余模块获得很短的同步周期,公共外时钟同步,很容易获得具有完全相同频率和相位的多路时钟源,可以个冗余模块提供理想的同步时钟,在早期的硬件同步技术中占主导地位缺陷是不能摆脱时钟漂移对整个系统可靠性的影响,存在单点故障,不能容忍公共时钟的故障,时钟反馈同步,相对于公共外时钟同步方法,为弥补时钟误差积累及公共时钟可靠度等方面的缺陷,可采用冗余系统中各模块自身的电源时钟,其中的每个模块参照其他冗余模块的时钟组,共同产生统一的同步时钟时序,以锁相技术达到系统的同步。包括两个操作根据所有其他的冗余模块的时钟信息产生一个参考时序参考时序与本模块过去的同步时钟信号共同校正他的时钟频率,从而获得系统当前的同步信息,时钟反馈同步-2,能时刻跟踪系统的同步点,及时纠正时钟的偏差,保证冗余系统长期稳定同步优点:不存在单点故障问题,可靠性高,硬件结构简洁,所需要的技术已经比较成熟,结构,引言时钟级同步松散同步任务级同步同步技术的典型应用,松散同步-1,松散同步是指系统中各冗余模块在多个时钟周期内,使冗余模块具有相同的执行进度松散同步为一种时间片或桢同步方式,即冗余模块在时序上,仅具有相同的时间片或桢序列,在时间片或桢边界维持冗余模块的数据一致性,系统对时间片或桢边界数据进行比较或表决相对于时钟同步方式,松散同步允许冗余模块在时间片或桢内部的时钟时序上存在一定的异步度,同步过程周期性地将各模块的相同时间片或桢边界对齐,使冗余模块在时间片或桢边界具有数据一致性特征时间片或桢往往由多个时钟周期组成,松散同步-2,松散同步是以相位锁定为基础的一种修正策略,建立在时间触发规约下实现同步。这种同步策略为保证运算能力较强的模块与较弱的模块匹配地工作,在同步器内部强制向能力低者看齐,以获取模块间的平衡,松散同步-3,松散同步可以用软件算法替代硬件桢同步装置实现。系统中各冗余模块都采用自己的时钟,它们之间在接近同步的方式下,这类算法所获得的同步程度取决于模块之间的通讯能力、时钟之间的精确程度和同步的频率为实现松散同步时序配合,保证N模冗余系统的容错能力,在每个模块中设置一个同步信箱,共含N个窗口,每个窗口分配给一个模块,在执行任务后以广播方式分别填入。时间效率高的算法是“交互收敛”算法:系统中的每一个冗余模块都相对于其他模块时钟计算自己的时钟偏差如果时钟偏差超出了预先设定的界值,则将其清零,再用所有外部模块的时钟偏差的平均值来调整它,结构,引言时钟级同步松散同步任务级同步同步技术的典型应用,任务级同步-1,任务级同步是指容错系统中各冗余模块在每个任务的操作系统调度周期,使冗余模块具有相同的执行进度任务同步是以一个冗余模块中独立运行的、具有一定逻辑任务的一次执行作为同步的基础,维持冗余模块任务级数据的一致性。用这种方式,系统在任务中设立一个或多个比较、表决点,对其中结果和最后输出结果进行一致性判断,任务级同步-2,任务级同步-3,从用户参与角度看,表决分三个层次:操作系统级表决点:表决点由操作系统实现,无须用户参与,对用户具有完全的透明性。因此,需要系统支持或修改OS内核程序库表决点:任务表决点由处于应用层的程序库和应用程序自身共同实现,它具有用户级半透明性。其方法是通过将用户应用程序目标文件与系统提供的特定程序库相连,重新编译而得到新的文件,此时可获得用户级透明表决点;而对用户不具有应用程序目标文件的可执行应用程序时,则不能通过重新编译而达到用户级透明表决用户级表决点,表决点完全由用户自己在应用程序变成时设定,为用户级非透明表决点。特点是系统开销小,在容错计算中经常采用。对用户不透明。,结构,引言时钟级同步松散同步任务级同步同步技术的典型应用,Stratus容错计算机,Continuum支持UNIXOS采用冗余的容错硬件体系结构以消除单点故障,保护数据的完整性、一致性冗余部件采用时钟锁步运行:在同一时间执行相同的指令处理,属时钟同步ftServer在总线交易级锁步运行,为一种松散同步方式部件故障发生时,无处理中断、无数据丢失,且系统性能不降低支持不见热插拔,Stratus容错计算机-ftServer,TANDEM(COMPAQ)容错机,TANDEM(COMPAQ)容错机-2,同步机制全局存储器访问操作同步,局部存储器不要求同步访问全局存储器同步:对写操作进行数据表决;对读操作只同步,不表决中断请求等异步事件进行同步这是为了避免CPU对中断请求等异步事件的不同响应,执行不同的分支,从而造成CPU失步这种同步机制为松散同步方式,C.vmp表决式多处理机,C.vmp表决式多处理机,组成:由能以独立方式执行三组不相关程序的三台分立机器组成。在外部事件或一个处理器的控制下,能同步其冗余部件,并启动执行关键代码松散同步策略采用两级同步来保持三个处理器同步总线信号同步:表决器激活时,利用RPLY信号同步三条总线,当处理器同时接收RPLY时可保持同步处理器时钟同步:利用表决器上的振荡器来驱动三个处理器的时钟电路,表决器的译码时钟信号同步三个处理器的相位,C.vmp表决式多处理机,OPIAC/FT容错计算机,OPIAC/FT容错计算机,硬件为主实现容错系统总线双份,并设计了一条故障诊断与辅助恢复

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论