分布式数据库中的可靠性.ppt

上传人：闯*** IP属地：广东上传时间：2020-03-28 格式：PPT 页数：80 大小：364.50KB 积分：25 举报 版权申诉

已阅读5页，还剩75页未读，继续免费阅读

版权说明：本文档由用户提供并上传，收益归属内容提供方，若内容存在侵权，请进行举报或认领

文档简介

分布式数据库系统及其应用 2012年11月 2013年1月分布式数据库的可靠性的概念及其度量分布式数据库系统的故障原因和容错技术分布式数据库的可靠性协议网络分割和提交协议不一致性监测和解决方法分布式数据库中的可靠性第6章可靠性指数据库在一给定时间间隔内不产生任何失败的概率它强调数据库的正确性要求数据库正确运行既符合某种规格化要求通常用来描述不可修复的系统可用性强调的是当需要访问数据库时它是可用的指在给定的时间t 数据库按照说明能正常运行的概率通常用于描述那些可以修复的系统两者关系通常认为构建可用性的系统比可靠性的系统容易两者是统一的可靠性高的系统可用性自然是好的两者又是矛盾的增加错误风险的情况下可提高可用性采用太谨慎的策略会降低可用性例 Site1Site2x1x2Lockx1Lockx22PC Ready 故障出现 Site1也Ready故Commit Site2等待此时站点2有两种可能策略策略一以正确性为标准 x2保持在锁定状态直到故障修复时为止提高了可靠性但牺牲了可用性策略二在数据库中引入不一致性的风险下尽量提高可用性解锁x2 其它事务可以使用它的值两阶段提交协议实现了第一个策略牺牲可用性获得高可靠性如果要得到高可用性就要考虑使用第二个策略 Site1正常结束已知 x1和x2是x的副本事务T是更新x的事务 Site1是协调站点且是事务T原发站点遵守两阶段提交协议通常使用两个参数的指标来度量一个分布式数据库的可靠性程度平均故障间隔时间MTBF和平均修复时间MTTR 平均故障间隔时间MTBF指在可以自我修复的系统中相继失败之间的期望时间通过可靠性函数R t 来计算MTBF 0 R t dt可靠性函数R t 与系统失败的概率有直接的关系平均修复时间MTTR是指修复一个失败的系统所需要的期望时间它与失败概率有关指数型失败和修复的概率的系统可用性可以描述为 A MTBF MTBF MTTR 可用性系统5个9 99 999 常用来描述可用性系统建立一个高可用性系统比建立一个通常要求的系统要花费更高的成本时间人力财力等具体设计时要仔细分析与最终用户商定以确定用户可以忍受多长的停机时间以及停机可能造成的影响并且明确说明高可用性系统的成本故障任何偏离规范说明的行为称为故障软故障和硬故障软故障包括间歇性 intermittent 和瞬变性 transient 故障通过重启动来修复硬故障指永久性故障错误设计等软故障占90 以上并且该比例稳定67年美空军指出计算机中电子器件故障80 是间歇性的67年 IBM指出90 故障是间歇性的80年研究指出软故障的发生明显高于硬故障87年 Gray指出大部分软件故障是瞬变性故障软件故障通信或数据库的原因是产生软件故障的主要原因软件故障的典型原因是代码中的Bug 曾有报告指出 1000条指令中 0 25 10个BUG 软件故障难以排除一个典型的软件工程在到达测试阶段以前要经过大量的设计审查和代码检验审查不同计算机系统中出错的统计数据IBM XA的OS可靠性报告57 是硬件 12 软件 14 操作 7 环境斯坦福线性加速器SLAC Tandem计算机18 硬件25 软件25 维护17 操作 14 环境AT T5ESS数字交换机32 3 硬件 44 3 软件 17 5 操作永久性故障错误的设计不稳定或者临界的组件不稳定的外部环境操作者的过失系统失败永久性错误间歇性错误瞬变的错误系统失败的原因容错设计出一种使系统识别出可能会发生的错误的方法在系统中建立一种机制使错误在造成系统故障之前就会被检测出来并能被清除或得到补偿错误预防技术保证所实现的系统不包含任何错误错误预防有两个方面错误回避保证系统不会带入错误的技术详细的设计方法学和质量控制错误清除清查那些在使用了错误回避技术路线后还残留在系统中的错误并清除它们需要大量的测试和证实过程故障检测潜伏的故障故障发生一段时间后才被检测出来错误潜伏期从故障发生到被检测出来的时间平均检测时间 MTTD 平均错误潜伏时间平均修复时间 MTTR 修复一个失败的系统所需要的期望时间平均故障间隔时间 MTBF 在可以自我修复的系统中相继的失败之间的期望时间由经验或从可靠性函数计算 MTBF MTTD MTTR 在这段时间内可能发生多起错误故障发生造成错误检测到错误修复故障发生造成错误时间相继发生的事件冗余所有容错系统设计中都采用的基本原则是在系统的组件中提供冗余对冗余的附加和补充的容错原则是设计的模块化模块化系统的每个组件被设计为具有定义很好的输入输出接口的模块模块化可以把故障隔离在单一的组件中容错系统实现故障停止模块 fail stopmodule 进程对 Processpairs time正常停止恢复正常易失存储丢失稳定存储ok 故障停止模块不断地对自身进行检测当检测到一个故障时就自动停止优点是缩短了故障检测的潜伏期进程对 Processpairs 通过软件模块的双工来实现容错它的思想是通过两个相互通信和合作的进程完成系统的每一个服务的方法来减少单个的故障点这两个进程中的一个叫做主进程另外一个叫备份进程它们同时提供同样的服务主进程与备份进程都是基于故障停止模块实现进程对机制要求进程之间进行通信可以通过共享存储区的手段来实现进程之间的通信当设计一个可靠的软件环境时使用基于消息传送的通信机制来实现一个操作系统是非常重要的由于每个进程都在自己的地址区间内执行一个进程可能发生的错误就不会传播到另外一个进程这种方法可以有效地进行错误隔离目的分布式数据库可靠性协议是为了保证在分布式数据库上执行的分布式事务的原子性和持久性这些协议描述了begin transaction read write abort commit和recover原语的分布式执行过程原语Begin Transaction 该命令执行登记的功能 Read 该命令指定一个数据项 LRM先在Trans的缓冲区中读若不在则向缓冲区管理器发Fetch命令读出数据后 LRM将它交给调度程序 Write 该命令指定了数据项和新值若在Buffer中得到则在那更新否则对BufferManager发Fetch命令读出数据并修改同时数据的前像和修改后的后像写入Log Abort 该命令是异常终结事务处理失败的一个信号 LTM读取相应的事务处理日志并且用数据项的前值取代在易变数据库中的更新后的数据项的值同时调度程序被告知异常终结已经被成功地完成 Commit 该命令使LTM将一个事务处理结束记录写入日志中分布式数据库系统的可靠性协议组成包括提交协议终结协议恢复协议提交和恢复协议详细说明了提交命令和恢复命令是如何被执行的终结协议是分布式系统特有的协议在执行一个分布式事务时若一个站点有故障希望其它站点也停止该事务处理这种情况的技术就称为终结协议终结协议与恢复协议的比较假若一个站点失效终结协议确定了未失效站点如何处理该失效事件恢复协议确定失效站点重启动后进程协调者参与者恢复它的状态的过程网络分割时终结协议采取必要的措施终结在不同网络区间执行的活动事务当网络重新连接后恢复协议保证使各个冗余数据库相互一致两阶段提交协议的要点将本地原子性提交行为的效果扩展到分布式事务保证分布式事务提交的原子性在不损坏日志情况下实现快速故障恢复提高DDB系统的可靠性两阶段提交协议把事务的提交过程分为两个阶段第一阶段表决阶段即形成一个共同的决定第二阶段执行阶段目的是实现这个决定允许参与者单方面撤销事务直到做出肯定性的建议一旦参与者确定了提交或者撤销提议它不能再更改它的提议当参与者处于就绪状态根据协调者发出的消息的种类它可转换为相应的提交或者撤销状态协调者依据全局提交规则作出全局终结决定在发生故障的情况下协调者和参与者可能会进入互相等待的状态一般采用定时器来解决这种问题每个进程进入一个状态时都要设置定时器如果所期待的消息在定时器超时之前没有到来定时器向进程报警进程于是调用它自己的超时协议初始写begin commit到日志等待有要求撤消的写commit到日志提交写end of trans 到日志初始准备提交写ready到日志就绪消息类型写abort到日志写commit到日志提交撤消撤消写abort到日志写abort到日志协调者参与者 no no abort commit 发送准备消息发送建议撤消消息发送建议提交消息发送全局撤消消息发送全局提交消息 ACK 发送应答ACK确认消息两阶段提交协议的活动 yes yes 假定撤销2PC和假定提交2PC协议这两种协议的基本思想是只要当一个已就绪的参与者向协调者询问事务的结果时如果在协调者的日志中找不到该事务的任何信息就认为该事务被撤销对假定撤销2PC协议或已经提交对假定提交2PC协议目的是改善2PC的性能假定撤销2PC协议中协调者不必等待参与者的ACK消息减少了协调者与参与者之间传递消息的数量当使用假定撤销2PC协议时可以看出协调者在决定撤销后可以立即忘记该事务它可以写入撤销记录且不用等待参与者确认撤销命令写入撤销记录后协调者无需写入事务结束记录假定撤销2PC和假定提交2PC协议假定提交2PC协议中可以不将Prepare写入Log 减少了Log写入的次数如果使用假定提交2PC协议协调者在发送准备消息之前强制性写入一条收集记录它包含了参与执行事务的所有参与者的名字此时协调者进入收集状态随后协调者发送准备消息并进入等待状态当参与者收到准备消息后以建议撤销或者以建议提交消息响应当协调者收到所有参与者的决定后它就可以作出该事务是撤销或提交的决定如果决定撤销协调者写入撤销记录进入撤销状态并发送全局撤销命令直到协调者收到参与者的撤销确认就写入一条结束记录并忘记该事务如果它决定提交该事务就写入提交记录发送全局提交消息然后忘记该事务当参与者收到全局提交消息后它们写入提交记录并更新数据库如果参与者收到全局撤销消息它们写入撤销记录并确认事务阻断某个站点上本来可以终结提交或撤销的子事务由于分布式数据库系统的故障它必须等到有故障的子事务修复后取得必要的信息才能决定故障的恢复是不可预料所以它占有的资源也不能释放也没法继续执行此时称该事务处于事务阻断状态阻断协议提交协议称为阻断协议是指发生某类故障时使分布式事务可能处于阻断状态在两阶段提交协议中如果在提交阶段协调者出故障若某个参与者与此同时宣布其已就绪提交它必须等到协调者修复后才能决定是否提交在这种情况下两阶段提交协议是阻断协议事务阻断降低了系统的可用性因为它们持有的锁不能被释放终结协议允许一事务在有故障情况下仍能正确地结束它提高系统的可用性当正常的提交过程被故障中断时就调用终结协议使无故障的站点正确地终结该事务终结的可能类型提交还是撤销依赖于当事务被故障中断时提交协议使它处于什么状态终结协议仅对某些类型的故障起作用而不是对所有故障都起作用判断2PC协议是终结协议的条件至少有一个站点已收到结果命令此时可由该站点告诉其它参与者关于该事务的结果并由它们来终结该事务没有一个参与者曾收到过结果命令并且只有协调者站点出故障此时所有参与者站点都是可工作的参与者可以选举一个新的协调者然后继续没有一个可工作的参与者曾收到此命令并且至少有一个参与者出故障时终结就不可能因为可工作的参与者无法知道出故障的参与者它已干过什么仍无法独立作出决定终结协议在协调者和参与者的定时器超时时发挥作用超时发生在目的站点在期望的时间内没有从发送站点得到所期望的消息时处理超时的方法依赖于失效发生的时间和失效的类型因此需要考虑在两阶段提交协议执行时的不同时间发生失效的情况由于使用两阶段提交协议的状态转换图而使讨论变得容易状态图中圆形表示状态边表示状态转换终结状态用同心圆表示边的标号按如下方式解释横线上方表示状态转换的原因即所收到的消息横线下方表示状态转换时所发出的消息超时处理技术协调者超时协调者可以在三种状态中发生超时故障等待状态提交状态和撤销状态在等待状态超时在等待状态协调者正在等待参与者的局部决定协调者不能单方面提交事务因为不满足全局提交规则协调者可以决定全局撤销事务此时协调者在日志中写入撤销记录并向所有参与者发送全局撤销消息在提交状态或撤销状态发生超时在这种情况下协调者不能确定是否在所有参与者站点上本地恢复管理程序都执行完提交或撤销过程因此协调者重复发出全局提交命令或全局撤销命令给没有响应的站点并等待确认初始写begin commit到日志等待有要求撤消的写commit到日志提交写end of trans 到日志初始准备提交写ready到日志就绪消息类型写abort到日志写commit到日志提交撤消撤消写abort到日志写abort到日志协调者参与者 no no abort commit 发送准备消息发送建议撤消消息发送建议提交消息发送全局撤消消息发送全局提交消息 ACK 发送应答ACK确认消息两阶段提交协议的活动 yes yes 协调者超时 I W C A F commit 申请申请 prepare ack ack noabort prepared commit t timeout 超时处理技术参与者超时被阻断时出现在初始状态发生超时参与者在该状态下正在等待准备消息此时协调者必然在初始状态发生失效参与者在超时后可以单方面撤销事务在就绪状态发生超时参与者在该状态下正提议提交事务但不知道协调者的全局决定参与者不能单方面作出决定由于它处于就绪状态它必须提议事务因此它不能改变它的决定和单方面撤销另一方面它不能单方面决定提交事务因为其他参与者可能提议撤销在这种情况下参与者将保持阻断直到它从其他站点处了解到事务的最终命运初始写begin commit到日志等待有要求撤消的写commit到日志提交写end of trans 到日志初始准备提交写ready到日志就绪消息类型写abort到日志写commit到日志提交撤消撤消写abort到日志写abort到日志协调者参与者 no no abort commit 发送准备消息发送建议撤消消息发送建议提交消息发送全局撤消消息发送全局提交消息 ACK 发送应答ACK确认消息两阶段提交协议的活动 yes yes 参与者超时 I R C A 申请 prepareprepared 等价于结束状态 t ping 申请 prepareno commitack abortack commitack abortack 设计终结协议如果参与者之间能够互相通信可以设计一个更加分布的终结协议超时的参与者只需简单地请求其他参与者来帮助它作出决定考虑假定Pi是超时的参与者询问Pj 其它参与者Pj按如下响应 Pj处于初始状态于是单方面Abort 并回送建议abort 给Pi Pj处于就绪状态此时不能帮助Pi终结 Pj处于提交或撤销状态此时向Pi发送建议提交或建议撤销消息协调者站点失效协调者在初始状态失效发生在协调者初始化提交过程之前因此它将在恢复时启动提交过程协调者在等待状态失效这时协调者已经发送了准备命令恢复时协调者将从头开始启动提交过程再次发送准备消息协调者在提交状态或撤销状态失效这时协调者已经把它的决定通知了参与者并终结了事务在恢复时如果它已经收到了所有的确认消息就不需要做任何事情否则就要启动终结协议参与者站点失效一个参与者在初始状态失效在恢复时该参与者应该单方面撤销事务一个参与者在就绪状态失效这时协调者已经收到失效站点在失效前发送的肯定决定恢复时失效站点的参与者认为是在就绪状态发生了超时于是启动终结协议来处理该事务一个参与者在提交状态或撤销状态失效这些状态表示了终结条件所以在恢复时参与者不需要采取任何专门的措施提交协议是非阻断的充要条件是在其状态转换图中不包含两种情形没有状态是即与提交状态又与撤销状态相邻不存在不可提交状态是与提交状态相邻相邻指从一个状态经过一次转换就可以到达的另一个状态 2PC中的状态如果任意一个进程处于提交状态就知道所有站点都已建议提交事务这些状态称为可提交的 C 提交状态是可提交状态其它为不可提交状态就绪状态是不可提交状态由于一个进程处于此状态并不意味着所有进程都已建议提交事务所以它是不可提交的等待状态是不可提交状态它们都侵犯了非阻断协议的充要条件从而考虑改变2PC 使其满足非阻断协议条件在等待状态和提交状态之间或者在就绪状态和提交状态之间增加另一种状态作为缓冲状态用于在准备提交但还没有提交的时候从初始状态到提交状态之间有三次状态转换从而有了3PC协议 I W A C commitprepare vote abortglobal abort vote commitprepare to commit I R A C preparevote commit global abortACK prepare to commitready to commit preparevote abort 3PC中事务的状态转换图 PC PC ready to commitglobal commit global commitACK a 协调者 b 参与者协调者参与者初始写begin commit到日志等待有要求撤消的写Prepare to commit到日志准备提交写end of trans 到日志初始准备提交写ready到日志就绪消息类型写abort到日志写prepare to commit到日志准备提交撤消撤消写abort到日志写abort到日志准备撤消提交全局撤消准备提交 ACK ACK no no abort Prepare to commit 写commit到日志提交提交写commit到日志撤消提交准备提交协调者超时在等待状态超时与2PC中协调者在等待超时相同协调者单方面决定撤销事务然后它在日志中写入撤销记录向所有建议提交事务的参与者发送全局撤销消息在预备提交状态超时此时协调者不知道未响应的参与者是否已经转换到预备提交状态但它知道它们至少处于就绪状态这意味着它们一定已经建议提交事务因此协调者可以发送预备提交消息使所有参与者转换到预备提交状态再将提交记录写入日志并发送全局提交消息给所有可操作的参与者在提交撤销状态超时协调者不知参与者是否已确实执行了提交撤销命令但是它们至少处于预备提交状态因此协调者不需要做专门的处理参与者超时在初始状态超时与2PC中的情况相同在就绪状态超时参与者已经建议提交事务但不知道协调者的全局决定由于与协调者失去联系终结协议将选举一个新的协调者新协调者根据三阶段提交协议的终结协议终结事务在预备提交状态超时参与者已收到预备提交Prepare to commit 消息正在等待来自协调者的全局提交消息处理同第二条协调者参与者 1 等待超时撤销事务 3 提交撤销超时忽略 1 初始超时撤销事务 2 就绪超时终结协议 3 预备提交超时终结协议 2 预备提交超时把参与者移入预备提交终结协议规则新协调者在等待状态将全局撤销事务此时参与者可能处于初始状态就绪状态撤销状态或预备提交状态等任何状态若参与者处于预备提交状态正在等待全局提交消息但它们却收到全局撤销消息它们的状态转换图不存在从预备提交状态到撤销状态的转换而这种转换对于终结协议是必需的所以该转换应当是执行终结协议时的一种合法转换新协调者处于预备提交状态此时参与者可以处于就绪状态预备提交状态或提交状态没有参与者可能处于撤销状态协调者因此将全局提交事务并发送全局提交消息新协调者处于撤销状态收到第一个消息后参与者也都转换到撤销状态 3PC与2PC恢复协议的差别很小协调者在等待状态失效按照终结协议参与者已终结事务因此协调者在恢复时必须向它们询问以确定如何终结事务协调者在预备提交状态失效终结协议再一次指导可操作参与者终结事务由于此过程可从预备提交状态转换到撤销状态协调者必须询问以确定如何终结事务一个参与者在预备提交状态失效它必须询问以确定其它参与者如何终结事务三阶段提交协议的一个特性使用三阶段提交协议能够无阻断地终结事务网络分割是由通信线路故障引起的简单分割仅仅是网络分裂成两部分多重分割更复杂网络分割非阻断协议的存在性即在发生网络分割时是否存在允许独立恢复的协议独立恢复是指站点重启动时无需远程访问若存在处理分割的非阻断协议那么该协议可使某个分割中的站点到达终结决定而且这个决定与另一分割中的决定一致一般结论独立恢复协议只存在于单站点故障的情形若发生网络分割的时候丢了报文的话则不存在任何非阻断的协议能从网络分割故障中恢复非冗余数据库任何需要访问存储在另一网络区域里的数据项的新事务都被阻断等待网络修复位于同一区域里的数据项的并发访问由并发控制算法处理网络分割时由提交协议处理冗余数据库分割时副本可能位于不同的区域由复制协议处理网络分割处理策略一致性与可用性的选择非冗余数据库处理网络分割的终结协议集中式协议基于集中式并发控制算法主站点法和主副本法基于表决的协议冗余数据库处理网络分割的终结协议复制控制协议多数法和基于法定人数法在事务中止或提交前大多数站点必须一致同意中止或提交基于法定人数的规则每个站点i有选票数Vi Vi是正整数V Vi事务在提交前它必须获得提交法定票数Vc事务在Abort前它必须获得Abort法定票数VaVa Vc V 当0 Va Vc V n i 1 网络分割时在每个分割部分选择一个新的协调者3PC中加入PA状态从而不允许从Wait Ready到Abort状态的转换原因有多个协调者阻止事务终结不允许多个协调者得出不同的结论因此希望协调者获得撤销的决定如果新协调者故障它不知道是否达到提交或撤销的法定票数这样参与者必须明确做出提交或撤销的决定Ready 或Wait 都不满足该需求预示引入另一个状态Pre Abort 该状态在Ready和Abort之间 I W A C commitprepare vote abortglobal abort vote commitprepare to commit I R A C preparevote commit global abortACK prepare to commitready to commit preparevote abort 基于法定人数3PC中事务的状态转换图 PC PC ready to commitglobal commit global commitACK a 协调者 b 参与者 PA ready to abortglobal abort PA ready to abortglobal abort 基于法定人数的3PC集中式协议选择一个新的协调者协调者收集状态信息并按如下规则执行1 若至少一个站点已Commit Abort 则协调者对其它站点发送Commit Abort 命令2 若处于PC状态站点的票数 Vc 则发送Commit3 若PA状态站点的票数 Va 则发送Abort4 若PC状态站点的票数 Ready状态站点的票数 Vc 则发送PC命令给不确定站点等待2 状态出现5 若PA状态站点的票数 Ready状态站点的票数 Va 则发送PA命令给不确定站点等待3 状态出现6 否则等待故障修复数据复制的目的高吞吐量较好的响应时间高可用性复制作为可选择的提交协议数据在多站点独立更新使用惰性复制协议减少数据不一致问题基本方法每个副本看作一个独立的数据项 X1 X2 X3 LockmgrX3 LockmgrX2 LockmgrX1 Txi Txj Txk 对象X有副本X1 X2 X3 Read X 获取X1共享锁获取X2共享锁获取X3共享锁分别读X1 X2 X3事务结束时释放X1 X2 X3锁 X1 lockmgr X3 lockmgr X2 lockmgr read Write X 获取X1互斥锁获取X2互斥锁获取X3互斥锁写新值到X1 X2 X3事务结束时释放X1 X2 X3锁 X1 X3 X2 lock lock lock write write write 读锁和访问只对一个副本写锁全部并且更新全部副本读可用性高写可用性低只要有一个副本不可获得更新事务就不能终结 ROWA方法 X1 X2 X3 读者加锁写者发现冲突 ROWA的改进 ROWA A ROWA A 读一个写所有可获得协议基本思想是写命令在所有可获得的副本上执行然后事务终结当时不可获得的副本将在它们重新可获得时被捕获更新事务T的协调者向所有包含x副本的站点发送WT x 并等待执行或拒绝的确认当不可获得站点恢复时也将更新自己的数据库但如果站点在T开始之前就不可获得它们就可能没有注意到T的存在以及T对x的更新问题协调者认为不可获得的参与者仍然工作并且更新了x 但是其确认没有到达协调者站点在事务启动时不可获得随后恢复并开始执行事务于是协调者在提交前要进行有效性验证检查所有不可获得的站点是否仍然不可获得如果协调者收到一个响应它就撤销T 若都是不可获得则检查在WT x 执行是可获得的站点仍然可获得是则提交事务ROWA A比ROWA协议能更好地适应失效包括网络分割 ROWA的改进 ROWA A 基于法定人数的复制控制 Gifford算法读法定人数Vr 写法定人数Vw规则1 Vr Vw V 可避免读写冲突规则2 Vw V 2 避免写写冲突该算法确保了在两个不同网络区域上启动且访问同一数据的事务不会同时终结惰性复制协议思想只在一个或多个副本上执行更新以后再将更新传播到所有副本上特点所有权参数定义更新副本的权限副本可以更新就称为主Copy 主站点否则称辅Copy 辅站点传播参数定义何时把对一个副本的更新传播到包含该对象的其它副本刷新参数定义了刷新事务的调度策略配置参数描述站点和网络的特点两类所有副本都可更新存在副本的组所有权常用延迟立即方式更新只有一个被更新的主站点惰性主站点法几种刷新方案按需刷新每次提交执行查询时执行所有收到的刷新事务来刷新被查询读取的辅Copy 造成查询响应延迟成组刷新根据应用刷新要求成组执行刷新事务定期刷新在固定时间间隔内触发刷新惰性复制协议网络的一致视图可靠性算法是假定全部能工作的站点对网络的所有站点包括其本身的状态即工作或故障具有一致的视图决定网络的一致视图监视网络的状态当站点状态发生转换时能及时发现新的信息一致地传播给全部站点假设建于广义的网络范围内每个站点有一状态表每个站点一个表项记录其工作不工作程序可查询状态表得到状态信息任何程序能够在任一站点设置一个看守当该站点变化状态时它就收到一个中断分割时状态表和一致视图的意义站点只认为那些能和它通信的站点是工作的一致视图的数目与分离的站点组数目一样多监视网络的状态决定一站点是否工作时向它请求一个报文然后等待到超时控制站点请求站点受控站点在一广义监视算法中受控站点周期性地发送I am up 我在工作报文网络站点K 3 UP 站点K 2 DOWN 站点K 1 站点K UP DOWN 状态网络上站点的状态站点K控制站点K 3 即它检查来自K 3的I am up报文是否到达站点K负责发现站点K 1和K 2从不工作到工作的恢复上图中K 1和K 2不一定是有故障它们可能在分割的另一组中图反映了站点K和K 3的网络视图广播新的状态监视功能每次检测出一个状态变化就激活此广播功能此功能的目的是广播新的状态表使同一组的全部站点具有相同的状态表此功能可由若干站点并行激活需要某种机构来控制冲突状态表的每个新的版本附加一全局唯一的时间戳在I am up报文中包含当前状态表的版本号启动新状态表广播的站点首先执行一次同步以获得一时间戳然后发送状态表给已回答的所有站点需求处理故障的策略有可能牺牲正确性来提高可用性因此接受了不一致性的风险在这种情况下监测这些不一致性并尽可能地加以解决是很有用的概念需要首先发现哪些数据部分已经不一致不一致性检测然后根据发生的情况给这些部分赋予一个最合理的值不一致性的解法提出问题假设网络分割期间在两个或多个站点组中已执行了若干事务可能对同一数据片断的不同副本进行了独立更新检测方法一种比较自然的方法比较各副本的内容检查其是否相同但是这种方法不仅效率低一般也是不正确的检测方法采用版本号允许对数据项操作的站点的副本是主副本其它是孤立或隔离的副本正常工作期间全部副本都是主副本并且互相一致每份副本维持一个原版号和一个当前版本号网络分割时每个孤立副本的原版本号被置为当前版本号值并且直到分割修复为止此原版号不会改变例子已知前提数据项x的副本x1 x2 x3存储在三个不同站点V1 V2 V3分别是x1 x2 x3的版本号初始时三份副本一致所以有 V1 0 2 V2 0 2 V3 0 2 假设经过了两次更新原版本号当前版本号发生一次分割把x3从其它两个副本分开多数法选择x2和x1为主副本版本号变为V1 0 2 V2 0

人人文库> 全部分类> 教育资料 > 课件下载

温馨提示

1. 本站所有资源如无特殊说明，都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2. 本站的文档不包含任何第三方提供的附件图纸等，如果需要附件，请联系上传者。文件的所有权益归上传用户所有。
3. 本站RAR压缩包中若带图纸，网页内容里面会有图纸预览，若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 人人文库网仅提供信息存储空间，仅对用户上传内容的表现方式做保护处理，对用户上传分享的文档内容本身不做任何修改或编辑，并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容，请与我们联系，我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

分布式数据库中的可靠性.ppt

文档简介

温馨提示

最新文档

评论

分布式数据库中的可靠性.ppt

文档简介

温馨提示

最新文档

评论

相关文档