数据库恢复技术_第1页
数据库恢复技术_第2页
数据库恢复技术_第3页
数据库恢复技术_第4页
数据库恢复技术_第5页
已阅读5页,还剩79页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第十章数据库恢复技术,数据库恢复技术,10.1事务的基本概念10.2数据库恢复概述10.3故障的种类10.4恢复的实现技术10.5恢复策略10.6具有检查点的恢复技术10.7数据库镜像,事务的基本概念,事务是用户定义的一个数据库的操作序列,这些操作要么全做,要么全不做,是一个不可分割的工作单元例如,在关系数据库中,一个事务可以是:一条SQL语句一组SQL语句整个程序事务是并发控制与调度的基本单位,也是数据库恢复的基本单位,定义事务,显示地定义事务:BEGINTRANSACTIONSQL语句1SQL语句2.COMMIT/以COMMIT或者ROLLBACK结束ROLLBACK隐式地定义事务:当用户没有显式地定义事务时,DBMS按缺省规定自动划分事务,定义事务(续),事务和程序是两个不同的概念BEGINTRANSACTION表示事务的开始COMMIT/ROLLBACK表示事务的结束COMMIT表示提交,即提交事务的所有操作,将事务中所有对数据库的更新写回到磁盘上的物理数据库中,事务正常结束ROLLBACK表示回滚,即事务在运行的过程中发生了某种故障,事务不能继续执行,系统将事务中对数据库所有已经完成的操作全部撤销,回滚到事务开始时的状态这里的操作指对数据库的更新操作,事务的特性,事务具有ACID四个特性:原子性(Atomicity)一致性(Consistency)隔离性(Isolation)持久性(Durability),事务的特性(续),原子性:事务是数据库系统运行的原子程序单元。事务的所有操作要么被全部成功地执行,要么一个也不被执行一致性:事务隔离执行时要保持数据库的一致性即正确性,也就是说,事务的执行的结果必须是使数据库从一个一致性状态变到另一个一致性状态隔离性:一个事务的执行不能被其他事务干扰。即一个事务内部操作及使用的数据对其他并发事务是隔离的,并发执行的各个事务之间不能互相干扰持久性:一个事务完成后,它对数据库的改变必须是永久的,即使系统出现故障时也是如此,事务的特性(续),保证事务ACID特性是事务管理的重要任务,事务ACID特性可能遭到破坏的因素有:多个事务并行运行时,不同事务的操作交叉执行事务在运行过程中被强行停止,事务的特性(续),事务是恢复和并发控制的基本单位本章将以一个简化的银行系统为例,该系统由A、B、C账户以及访问、更新这些账户的一组事务组成。暂且假设数据库永久驻留在磁盘上,有些部分临时驻留在主存储器中事务访问数据使用如下的两个操作:read(X):从数据库传送数据项X到读操作事务的局部缓冲区write(X):从写操作事务的局部缓冲区把数据项X传回数据库,事务的特性(续),例事务从账户A过户50元到账户B。该事务可定义为:T:read(A);A:=A50;write(A);read(B);B:=B+50;write(B).,事务的特性(续),原子性:假设事务Ti执行前,账户A和账户B分别有1000元和2000元。现在假设在事务Ti执行时,系统出现故障,导致Ti的执行没有成功完成这种故障可能是电源故障、硬件故障或软件故障等再假设故障发生在write(A)操作之后,write(B)执行之前。这种故障,数据库反映出来的是账户A有950元,而账户B有2000元。该故障的结果导致系统销毁了50元,系统的这种状态就称为不一致状态系统必然会在某一时刻处于不一致状态,如何保证这种不一致性在数据库系统中是不可见,是要求事务保持原子性的原因具有原子性的事务,其所有活动要么在数据库中全部反映出来要么全部不反映,事务的特性(续),一致性:要求事务执行不改变A、B之和如果没有一致性要求,事务就会创造或销毁钱!容易验证,如果数据库在事务执行前是一致的,那么事务执行后仍将保持一致性,事务的特性(续),隔离性:即使每个事务都能确保一致性和原子性,但如果几个事务并发执行,它们的操作会以某种人们所不希望的方式交叉执行,这也会导致不一致的状态在上述例子中,当A中总金额已被减去50元并已写回A,而B中总金额被加上50元后还未被写回时,数据库暂时是不一致的。此时此刻,另一个并发执行的事务Tj在这个中间时刻读取A和B的值并进行A+B的计算,将会得到不一致的值。若事务Tj基于它所读取的不一致值对A和B进行更新,即使两个事务顺利完成,数据库仍可能处于不一致状态事务的隔离性确保事务并发执行后的系统状态与这些事务以某种一个接一个的次序执行后的状态是等价的,事务的特性(续),持久性:一旦事务成功完成,即资金转账已经发生,系统就必须保证任何系统故障都不会引起这次转账相关数据的丢失。假设计算机系统的故障会导致内存数据丢失,但已写入磁盘的数据却不会丢失,在这种条件下,通过以下任何一条可确保事务的持久性:事务做的更新在事务结束之前已经写入磁盘有关事务已执行的更新和已写到磁盘上的更新信息必须足以让数据库在系统出现故障后,能够重新构造事务所做的更新,事务状态,成功完成的事务称为已提交事务在无任何故障的情况下,所有事务能够成功完成其各执行步骤但是,事务并非总能顺利完成,这种事务被称为中止事务若要确保事务的原子性,中止事务对数据库所做的任何改变必须撤销。一旦中止事务造成的变更被撤销,就说事务已回滚,事务状态(续),为了详细研究事务运行过程中状态的变化,建立了一个简单的抽象事务模型。事务必须处于以下状态之一:活动状态(active):初始状态,事务执行时处于该状态部分提交状态(partiallycommitted):最后一条语句被执行后的状态失败状态(failed):正常的执行不能继续后的状态中止状态(aborted):事务回滚并且数据库已被恢复到事务开始执行前的状态提交状态(committed):成功完成后的状态,事务状态(续),可以在事务中执行如下操作来实现事务状态转换:BEGIN-TRANSACTION开始运行事务,使事务进入活动状态END-TRANSACTION说明事务中的所有读写操作都已经完成,使事务进入部分提交状态,把事务的所有操作对数据库的影响存入数据库COMMIT-TRANSACTION标志事务已经成功地完成,事务中所有操作对数据库的影响已经安全地存入数据库,事务进入提交状态,结束事务的运行ABORT-TRANSACTION标志事务进入失败状态,系统消除事务中所有操作对数据库和其他事务的影响,结束事务的运行,事务状态(续),活动状态,中止状态,部分提交状态,提交状态,失败状态,图10-1事务的状态转换图,事务状态(续),一个事务进入失败状态后,数据库管理系统首先消除该事务的操作对数据库和其它事务的影响,然后使事务进入中止状态,然后系统有两种选择处理:重启事务(restart)仅当引起事务中止的软硬错误不是由事务的内部逻辑所产生时才可以重启事务重启事务将被看成是一个新事务废除事务(kill)若中止错误是由于事务的内部逻辑错误,如零做除数、程序有误,或者输入错误,或者程序所需数据在数据库中没有找到等情况下,要进行该事务的废除,SQL对事务的支持,SQL的数据操纵语言包含一些与事务活动有关的语句。SQL中事务的开始是隐含的,事务的结束用下列SQL语句之一来表示:COMMITWORK:提交当前事务并开始一个新的事务。ROLLBACKWORK:中止当前事务。这两个语句中的关键字WORK是可选的,这些语句强制每个打开的游标关闭,这就引起了所有数据库定位的丢失注意有些SQL实现能在COMMIT时防止自动地CLOSE和数据库定位的丢失,但对ROLLBACK不支持如果一个程序结束前没有用这两条命令,其对应的更新结果或者提交或者回滚(具体哪一个会发生,标准没有规定)视具体实现而定,SQL对事务的支持(续),SETTRANSACTION语句可用于设置下一事务的特性,该语句只有当程序中无事务在执行时才能执行,具体语句形式如下:SETTRANSACTION可以指定存取模式或隔离级别,或两者都指定存取模式可以是READONLY只读READWRITE读写若两者都未指定,在隔离级别未指定为READUNCOMMITED的情况下,则存取模式默认为READWRITE如果指定了READWRITE,则隔离级别不能为READUNCOMMITED,SQL中的事务定义(续),隔离级别的格式为ISOLATIONLEVEL这里从低到高依次为READUNCOMMITED读未提交的修改,只能在只读状态下使用READCOMMITED读提交的修改REPEATABLEREAD可重复读SERIALIZABLE可串行化隔离级别越高(低),可能出现的问题越少(多),系统并发度越低(高)SQL标准还规定系统必须保证可串行化和不存在级联回滚,该标准的可串行化要求具体调度的执行结果必须与一个可串行调度的,数据库恢复技术,10.1事务的基本概念10.2数据库恢复概述10.3故障的种类10.4恢复的实现技术10.5恢复策略10.6具有检查点的恢复技术10.7数据库镜像,10.2数据库恢复概述,故障是不可避免的系统故障:计算机软、硬件故障人为故障:操作员的失误、恶意的破坏等。错误的情形:运行的事务非正常中断影响数据库中数据的正确性破坏数据库,使数据库中全部或部分数据丢失。数据库的恢复(恢复子系统实现)把数据库从错误状态恢复到某一已知的正确状态(亦称为一致状态或完整状态),数据库恢复技术,10.1事务的基本概念10.2数据库恢复概述10.3故障的种类10.4恢复的实现技术10.5恢复策略10.6具有检查点的恢复技术10.7数据库镜像,10.3故障的种类,事务内部的故障系统故障介质故障计算机病毒,事务内部的故障,事务内部的故障有的是可以通过事务程序本身发现的,有的是非预期的,不能有事务程序处理的例如,银行转账事务,这个事务把一笔金额从一个账户甲转给另一个账户乙。BEGINTRANSACTION读账户甲的余额BALANCE;BALANCE=BALANCE-AMOUNT;(AMOUNT为转账金额)写回BALANCE;IF(BALANCE0)THEN打印金额不足,不能转账;ROLLBACK;(撤销刚才的修改,恢复事务)ELSE读账户乙的余额BALANCE1;BALANCE1=BALANCE1+AMOUNT;写回BALANCE1;COMMIT;,事务内部的故障(续),这个例子所包括的两个更新操作要么全部完成要么全部不做。否则就会使数据库处于不一致状态,例如只把账户甲的余额减少了而没有把账户乙的余额增加。在这段程序中若产生账户甲余额不足的情况,应用程序可以发现并让事务回滚,撤销已作的修改,恢复数据库到正确状态。,事务内部的故障(续),什么是事务故障?某个事务在运行过程中由于种种原因未运行至正常终止点就夭折了事务故障产生的原因输入数据有误运算溢出违反了某些完整性限制某些应用程序出错并行事务发生死锁。事务故障的恢复事务撤销(UNDO)强行回滚(ROLLBACK),将事务恢复到执行前的状态,系统故障,系统故障又称为软故障,是指造成系统停止运转的任何事件,使得系统要重新启动整个系统的正常运行突然被破坏(cpu故障、操作系统故障、DBMS代码错误、系统断电等)不破坏数据库内存中数据库缓冲区的信息全部丢失所有正在运行的事务都非正常终止,系统故障(续),发生系统故障时,事务未提交恢复策略:强行撤消(UNDO)所有未完成事务发生系统故障时,事务已提交,但缓冲区中的信息尚未完全写回到磁盘上。恢复策略:重做(REDO)所有已提交的事务,介质故障,介质故障称为硬故障,指外存故障磁盘损坏磁头碰撞操作系统的某种潜在错误瞬时强磁场干扰介质故障对数据库的影响磁盘上的物理数据库遭到毁灭性的破坏影响正在存取这部分数据的所有事务这类故障比事务故障和系统故障发生的可能性小得多,但破坏性最大,介质故障的恢复,装入数据库发生介质故障前某个时刻的数据副本重做自此时始的所有成功事务,将这些事务已提交的结果重新记入数据库,计算机病毒,计算机病毒一种人为的故障或破坏,是一些恶作剧者研制的一种计算机程序可以繁殖和传播危害破坏、盗窃系统中的数据破坏系统文件破坏物理数据库,各类故障小结,各类故障,对数据库的影响有两种可能性一是数据库本身被破坏二是数据库没有被破坏,但数据可能不正确,这是由于事务的运行被非正常终止造成的。,数据库恢复技术,10.1事务的基本概念10.2数据库恢复概述10.3故障的种类10.4恢复的实现技术10.5恢复策略10.6具有检查点的恢复技术10.7数据库镜像,10.4恢复的实现技术,恢复操作的基本原理:冗余利用存储在系统其它地方的冗余数据来重建数据库中已被破坏或不正确的那部分数据。恢复机制涉及的关键问题(1)如何建立冗余数据数据转储(backup)登录日志文件(logging)(2)如何利用这些冗余数据实施数据库恢复,10.4.1数据转储,什么是数据转储数据转储的方法,数据转储,数据转储是数据库恢复中采用的基本技术转储即DBA定期的将整个数据库复制到磁带或另一个磁盘上保存起来,这些备用的数据成为后备副本(backup)或后援副本如何使用数据库遭到破坏后可以将后备副本重新装入重装后备副本只能将数据库恢复到转储时的状态,转储和恢复,故障发生点转储运行事务正常运行TaTbTf重装后备副本重新运行事务恢复,转储的方法,静态转储与动态转储海量转储与增量转储转储方法小结,静态转储,在系统中无运行事务时进行的转储操作转储开始时数据库处于一致性状态转储期间不允许对数据库的任何存取、修改活动得到的一定是一个数据一致性的副本优点:实现简单缺点:降低了数据库的可用性转储必须等待正运行的用户事务结束新的事务必须等转储结束,动态转储,转储操作与用户事务并发进行转储期间允许对数据库进行存取或修改优点不用等待正在运行的用户事务结束不会影响新事务的运行动态转储的缺点不能保证副本中的数据正确有效例如:在转储期间的某个时刻Tc,系统把数据A=100转储到磁带上,而在下一时刻Td,某一事务将A改为200。转储结束后,后备副本上的A已是过时的数据了,动态转储(续),动态转储对数据库的恢复:利用动态转储得到的副本进行故障恢复把动态转储期间各事务对数据库的修改活动登记下来,建立日志文件。后备副本加上日志文件才能把数据库恢复到某一时刻的正确状态。,海量转储与增量转储,海量转储:每次转储全部数据库增量转储:只转储上次转储后更新过的数据海量转储与增量转储比较从恢复角度看,使用海量转储得到的后备副本进行恢复往往更方便但如果数据库很大,事务处理又十分频繁,则增量转储方式更实用更有效,转储方法小结,数据转储分类,10.4.2登记日志文件(Logging),日志文件的格式和内容日志文件的作用登记日志文件,日志文件的格式和内容,什么是日志文件日志文件(log)是用来记录事务对数据库的更新操作的文件日志文件的格式以记录为单位的日志文件以数据块为单位的日志文件日志文件的内容各个事务的开始(BEGINTRANSACTION)标记各个事务的结束(COMMIT或ROLLBACk)标记各个事务的所有更新操作注:以上所有内容均为之日文件中的一个日志记录(logrecord),日志文件的格式和内容(续),以记录为单位的日志文件,每条日志记录的内容事务标识(标明是哪个事务)操作类型(插入、删除或修改)操作对象(记录内部标识)更新前数据的旧值(对于插入操作而言,此项为空值)更新后数据的新值(对删除操作而言,此项为空值)以数据块为单位的日志文件,每条日志记录的内容事务标识(标明是哪个事务)被更新的数据块,日志文件的作用,进行事务故障恢复进行系统故障恢复协助后备副本进行介质故障恢复,日志文件的作用(续),与静态转储后备副本配合进行介质故障恢复静态转储的数据已是一致性的数据如果静态转储完成后,仍能定期转储日志文件,则在出现介质故障重装数据副本后,可以利用这些日志文件副本对已完成的事务进行重做处理这样不必重新运行那些已完成的事务程序就可把数据库恢复到故障前某一时刻的正确状态,日志文件的用途(续),故障发生点静态转储运行事务正常运行TaTbTf登记日志文件重装后备副本利用日志文件恢复事务继续运行介质故障恢复-登记日志文件,利用日志文件恢复,日志文件的用途(续),介质故障恢复:LOGFILE+动态转储后备副本动态转储数据库:同时转储同一时点的日志文件后备副本与该日志文件结合起来才能将数据库恢复到一致性状态利用这些日志文件副本进一步恢复事务,避免重新运行事务程序,登记日志文件,登记日志文件必须遵循的两条原则登记的次序严格按并行事务执行的时间次序必须先写日志文件,后写数据库写日志文件操作:把表示这个修改的日志记录写到日志文件写数据库操作:把对数据的修改写到数据库中,登记日志文件(续),为什么要先写日志文件写数据库和写日志文件是两个不同的操作在这两个操作之间可能发生故障如果先写了数据库修改,而在日志文件中没有登记下这个修改,则以后就无法恢复这个修改了如果先写日志,但没有修改数据库,按日志文件恢复时只不过是多执行一次不必要的UNDO操作,并不会影响数据库的正确性,数据库恢复技术,10.1事务的基本概念10.2数据库恢复概述10.3故障的种类10.4恢复的实现技术10.5恢复策略10.6具有检查点的恢复技术10.7数据库镜像,10.5恢复策略,事务故障的恢复系统故障的恢复介质故障的恢复,事务故障的恢复,事务故障:事务在运行至正常终止点前被终止恢复方法由恢复子系统应利用日志文件撤消(UNDO)此事务已对数据库进行的修改事务故障的恢复由系统自动完成,对用户是透明的,不需要用户干预,事务故障的恢复(续),系统恢复的步骤:1.反向扫描文件日志(即从最后向前扫描日志文件),查找该事务的更新操作2.对该事务的更新操作执行逆操作。即将日志记录中“更新前的值”(BeforImage,BI)写入数据库。插入操作,“更新前的值”为空,相当于删除操作删除操作,“更新后的值”为空,相当于插入操作修改操作,使用修改前的值(BI)代替修改后的值(AI)3.继续反向扫描日志文件,查找该事务的其他更新操作,并做同样处理4.如此处理下去,直至读到此事务的开始标记,事务故障恢复就完成了,系统故障的恢复,系统故障造成数据库不一致状态的原因一些未完成事务对数据库的更新已写入数据库一些已提交事务对数据库的更新还留在缓冲区没来得及写入数据库恢复方法1.Undo故障发生时未完成的事务(撤销)2.Redo已完成的事务(重做)系统故障的恢复由系统在重新启动时自动完成,不需要用户干预,系统故障的恢复(续),系统恢复的步骤:1.正向扫描日志文件(即从头扫描日志文件)重做(REDO)队列:在故障发生前已经提交的事务这些事务既有BEGINTRANSACTION记录,也有COMMIT记录撤销(Undo)队列:故障发生时尚未完成的事务这些事务只有BEGINTRANSACTION记录,无相应的COMMIT记录2.对撤销队列中的各个事务进行撤销(Undo)处理反向扫描日志文件,对每个UNDO事务的更新操作执行逆操作即将日志记录中“更新前的值”写入数据库3.对重做队列中的各个事务进行重做(Redo)处理正向扫描日志文件,对每个Redo事务重新执行日志文件登记的操作即将日志记录中“更新后的值”写入数据库,介质故障的恢复,1.重装数据库,使数据库恢复到一致性状态2.重做已完成的事务,介质故障的恢复(续),介质故障恢复的步骤1.装入最新的后备数据库副本(离故障发生时刻最近的转储副本),使数据库恢复到最近一次转储时的一致性状态对于静态转储的数据库副本,装入后数据库即处于一致性状态对于动态转储的数据库副本,还须同时装入转储时刻的日志文件副本,利用与恢复系统故障的方法(即REDO+UNDO),才能将数据库恢复到一致性状态2.装入有关的日志文件副本(转储结束时刻的日志文件副本),重做已完成的事务首先扫描日志文件,找出故障发生时已提交的事务的标识,将其记入重做队列然后正向扫描日志文件,对重做队列中的所有事务进行重做处理。即将日志记录中“更新后的值”写入数据库,介质故障的恢复(续),介质故障的恢复需要DBA介入DBA的工作重装最近转储的数据库副本和有关的各日志文件副本执行系统提供的恢复命令具体的恢复操作仍由DBMS完成,数据库恢复技术,10.1事务的基本概念10.2数据库恢复概述10.3故障的种类10.4恢复的实现技术10.5恢复策略10.6具有检查点的恢复技术10.7数据库镜像,10.6具有检查点的恢复技术,1.问题的提出2.检查点技术3.利用检查点的恢复策略,问题的提出,两个问题搜索整个日志将耗费大量的时间REDO处理:重新执行,浪费了大量时间解决方法具有检查点(checkpoint)的恢复技术在日志文件中增加检查点记录(checkpoint)增加重新开始文件恢复子系统在登录日志文件期间动态地维护日志,检查点技术,检查点记录的内容(1)建立检查点时刻所有正在执行的事务清单(2)这些事务最近一个日志记录的地址重新开始文件的内容记录各个检查点记录在日志文件中的地址,检查点技术,图10.3具有检查点的日志文件和重新开始文件,动态维护日志文件的方法,周期性地执行如下操作:建立检查点,保存数据库状态具体步骤是:1.将当前日志缓冲区中的所有日志记录写入磁盘的日志文件上2.在日志文件中写入一个检查点记录3.将当前数据缓冲区的所有数据记录写入磁盘的数据库中4.把检查点记录在日志文件中的地址写入一个重新开始文件,建立检查点,恢复子系统可以定期或不定期地建立检查点,保存数据库状态定期按照预定的一个时间间隔,如每隔一小时建立一个检查点不定期按照某种规则,如日志文件已写满一半建立一个检查点,利用检查点的恢复策略,使用检查点方法可以改善恢复效率当事务T在一个检查点之前提交,T对数据库所做的修改已写入数据库写入时间是在这个检查点建立之前或在这个检查点建立之时在进行恢复处理时,没有必要对事务T执行REDO操作,利用检查点的恢复策略(续),10.4恢复子系统采用的不同策略,利用检查点的恢复策略(续),T1:在检查点之前提交T2:在检查点之前开始执行,在检查点之后故障点之前提交T3:在检查点之前开始执行,在故障点时还未完成T4:在检查点之后开始执行,在故障点之前提交T5:在检查点之后开始执行,在故障点时还未完成恢复策略:T3和T5在故障发生时还未完成,所以予以撤销T2和T4在检查点之后才提交,它们对数据库所做的修改在故障发生时可能还在缓冲区中,尚未写入数据库,所以要REDOT1在检查点之前已提交,所以不必执行REDO操作,利用检查点的恢复步骤,1.从重新开始文件中找到最后一个检查点记录在日志文件中的地址,由该地址在日志文件中找到最后一个检查点记录2.由该检查点记录得到检查点建立时刻所有正在执行的事务清单ACTIVE-LIST建立两个事务队列UNDO-LIST:需要执行undo

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论