版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、RAC 锁管理与锁问题的定位 一从我一到公司,主要工作就是维护我们的一套大RAC。主库5个节点,备库最多时曾有4个节点,后来备库减至单实例了。主、备一共8套存储,总间共300T空间。内部互联采用业内最快的InifiniBand。也算是豪华配置了。最高峰时,主库数据130T左右,每天归档量巅峰时接近6T,是我见过的最大、最忙的数据库。 库一大,很多本来不是问题的问题,就会变成问题。比如数据字典维护,Oracle在这一块上做的很好,因为这是Oracle的根本。这一块上罕有问题的。但是,当数据库中有几百万个段时呢!其实就算有
2、几百万个段,Oracle也运行的好好的,在极偶然的情况下,会遇到问题。还有控制文件,通常也就几十M,但当它接近1G呢,它就会像一个活火山一样,偶而爆发。另外,还有更容易想到的,如备份的问题,搭建备库的问题等等。如果一个库只有1T,搭建个备库只需要几个小时,但是上百T呢!不但是时间问题,选择合适的方法是另一个需要考虑的问题。 平时工作太忙,现在有时间了,慢慢和大家分享,总比烂在我的肚子里强。 开始今天的正题,聊一聊RAC中的锁管理。
3、 大家一般对RAC中的CacheFusion比较熟悉,而对锁管理,讨论的不多。其实,锁管理更为基础,因为块,或者更准确点,Buffer cache中的Buffer,也是锁管理的对象之一。好,下面我们开始。一、 首先,了解一下RAC中要管理的锁的类型:(一)、你在V$LOCK中看到的全部锁,这一部分我们可以称之为高级队列锁。(二)、Library cache lock/pin,还有Row cache lock,这一部分我们称之为中级内存锁。(中级内存锁还有一个
4、,就是Buffer pin,它导致的竞争,就是我上遍文章中所讲的buffer busy waits。注意啊,想降低buffer busy waits吗,哪就使用更快速的设备存放Redo File吧。详在中的第一遍日志,或在上个帖子中参加讨论:(三)、还有,就是针对Buffer cache中的块的锁了,Oracle为它定义的类型为BL。 上面这些,就是RAC锁的全部了。也就是说,RAC的数据库在运行期间,只有这些东西,需要在节点间同步。 下面提个
5、问题,猜猜看哪种锁数量最多? 你一定会说针对Buffer的BL锁,但不是。大多数情况下,是Row cache lock的数量最多(这里不讨论极致情况)。 但是Row cachelock通常是静止的,很少修改。数据字典,元数据吗,改动当然不多。而Buffer的BL锁就不一样的,修改频繁。因此,Oracle在普通的锁管理机制之外,针对BL又搞了个Cache Fusion。好,这里就不讨论它了,以后我会再详细讨论Cache Fusion的。二、
6、60; 资源池与主节点 和单实例中的队列锁一样,RAC中的锁,也分为两部分:资源结构和锁结构。 在共享池中,还有一个资源结构池,审请锁的第一部,就是到这个池中审请一个Free的资源结构。 可以把资源池想像一块内存,其时,它就是一大块内存,在实例启动时分配。如下图:2012-3-7 22:38 上传下载附件
7、(30.95 KB) 在资源池中,内存又被分成一个个小块,每个小块,就是上图中的一行,Oracle称为一个Slot。每个Slot,就叫做一个资源结构(Resource struct)。每个资源结构中的主要信息如下:资源名(RESOURCE_NAME)转换者队列地址(ON_CONVERT_Q)持有者队列地址(ON_GRANT_Q)主节点(MASTER_NODE) 可以进一步把资源池想像成如下的表格:2012-3-7 22:41 上传下载附件 (34.14 KB) 我们把其中重要的东西解释一下。 &
8、#160; 1、资源名:和单实例中的队列锁一样。资源名由资源类型加两个参数构成。比如TM锁的资源名,一般写为TM-ID1-ID2,TM是资源类型(也就是锁类型)。参数ID1是DBA_OBJECTS中的对象编号,ID2为0。假设有个表,对象编号是195,它的TM资源(或称为TM锁)的资源名为:TM-195-0。这点对于单实例、多实例来说,是一样的。 再来找个不一样的,比如一个Buffer。资源类型是BL,两个参数ID1、ID2分别是从块地址计算出来的(计算规则我会在Cache Fus
9、ion中详细描述)。这个BL-ID1-ID2锁,在单实例中,绝对不会出现。 2、转换者队列和持有者队列:这分别是两个链表,记录有多个进程持有锁,或正在等待锁。RAC认为每个实例中的每个进程都可以获得空锁,所以,如果进程想获得独占锁,但没有成功,那么它是要从空锁转换成独占锁而没有成功。所以这里没有等待者队列,只有转换者队列。我们可又把转换者队列,理解为等待者队列,记录所有正在等待进程信息。 3、主节点:这个信息,是单实例中资源结构所没有的。RAC中,
10、每个锁都有一个主节点。或者,准确点说,每个资源结构都有一个主节点。 主节点的计算方式,是用资源名作HASH。这里的HASH算法,可以理解为根据资源名的一串字符,求得一个数字,再用这个数字除以节点数,取余数。比如有个这样的资源名,TM-1234-0,求得的HASH值为3,它的主节点就是3。 某个节点的进程,如果想对某个资源加锁,第一步就是根据资源名计算出HASH值,根据HASH值找到资源的主节点。注意:锁,或者队列锁,也叫资源。它包含两部分信息,
11、资源结构和锁结构。资源结构有主节点,锁结构没有主节点。千万不要被资源结构、锁结构这样的名称所误导。这两个东西,就是锁的两部分信息。三、资源结构的查找 各节点的进程想要加锁,第一步就是定位资源结构。如何定位,HASH算法。Oracle内部,只要涉及在内存中查找东西,比如要Buffer Cache中找某个Buffer,在共享池中找某条SQL,等等,全部用的是HASH。资源结构的查找定位也不例外。 比如,有个表叫MythData,节点1的进程程想在M
12、ythData表上加锁,此表的对象编号为1234,那么资源名为TM-1234-0,根据此资源名,计算HASH值,得到主节点为2号节点。节点1向节点2发送加锁请求。接到加锁请求,节点2根据TM-1234-0这个资源名,再次计算HASH值,这次不再是为了求主节点了,是为了在自己的内存中定位此资源的资源结构。 如下图:2012-3-7 22:44 上传下载附件 (39.04 KB) 接下来,节点2在自已的内存中定位资源TM-1234-0:2012-3-7 22:44 上传下载附件 (58.39 KB) 四、锁结构
13、 如果节点1可以持有TM-1234-0,接下来Oracle会如何处理呢?在资源结构上加锁结构。 我们再一次强调,千万不要被资源结构、锁结构这样的名称所误导。这两个东西,就是锁的两部分信息。 同样的,共享池中也有一个锁池,如下图:2012-3-7 22:47 上传下载附件 (45.72 KB) 再进一步的,锁池内存也被分为一个个的小块,每一块称为一个Slot,就是图中的一行。每一行我
14、们就称之为一个锁结构。 锁结构中的信息比较多,有资源名、加锁的节点、加锁的进程、锁结构所在队列、状态等信息。下面把重要的说一下: 加锁的节点:锁结构没有主节点,锁结构只会隶属于某个资源结构。而资源结构是有主节的。 锁结构所在队列:如果请求进程可以加锁,锁结构会被加入资源结构的持有者队列。否则,如果有其他人以不兼容的方式持有锁,请求进程将被挂在资源结构的转换者队列,也就是
15、说,请求被阻塞了。 也就是说,锁池的形式如下:2012-3-7 22:47 上传下载附件 (42.46 KB) 好,下面我们来详细说一下完整的锁的获取过程。接着上面第10点。五、完整的锁的获取过程 上面第10步,已经说到,主节点2中,TM-1234-0的资源结构显示,无人持有此资源,持有者队列为空。转换者队列也为空。哪么节点1可以持有此资源。 接下来再看下面这些图:20
16、12-3-7 22:53 上传下载附件 (50.76 KB) 2012-3-7 22:53 上传下载附件 (52.93 KB) 2012-3-7 22:53 上传下载附件 (57.97 KB) 注意,下面的图,和上面的图的区别,多了个箭头。2012-3-7 22:55 上传下载附件 (56.25 KB) 第15步的目的,就是建立资源结构和锁结构的联系。更通俗点说,就是将锁结构挂到对应资源结构的持有者队列中。 至此,节点1的操作完毕。主节点(节点2)也会有类似操作。主节点上的操作不再详述,大至如下:(1)、如果TM-12
17、34-0在节点2上还没有资源结构,节点2会在自已的共享池中的资源池中审请一个Slot,并填入信息(2)节点2在共享池的锁池中审请一个锁结构,并填入信息。(3)、将锁结构挂在资源结构的持有队列中。具体如下:2012-3-7 22:55 上传下载附件 (59.27 KB) 也就是说,主节点和审请节点,都会有锁的相关信息。再次强调,“锁的相关信息”指的就资源结构和锁结构。六、实际操作 理论先说这么多吧,下面来点实验。我们的最终目的,是要从理论中学习如果RAC出现了锁问题,如何定位。我们研究理论,也要和实践挂钩,要不然,理论就
18、成了虚无飘渺的东西。但是,有时研究内部、研究理论,不是马上就能有成果,往往需要潜心研究一段时间才可。 总之,我的观点,研究内部,一定不能满足于听一听、或看一看别人的成果,这样的研究,毫无意义。一定要自己动手,反复测试、验证别人的理论,这样才会进步。 好,闲言少叙,开始。1、测试环境 两节点RAC,有表T3,对象号为12566,16进制为3136。我分别在两个节点进行如下
19、操作:节点2,会话1: insert into t3 values(1,'a'); 插入为DML,在T3对象上要加TM锁。也就是要在资源名为TM-3136-0的资源上,加共享型的锁。节点2,会话2:insert into t3 values(2,'b'); 也在TM-3136-0上加共享型的锁。节点1,会话1:insert into t3 values(3,'c');
20、 同上。节点1: lock table t3 in exclusive mode ; 在TM-3136-0上,加独占锁。 每做完一步,用视图观察资源结构和锁结构。步1:在节点2执行:SQL> insert into t3 values(1,'a'); 1 r
21、ow created.步2:查看锁情况:(1)、在节点2查看资源结构:SQL> select RESOURCE_NAME, ON_CONVERT_Q,ON_GRANT_Q, MASTER_NODE from V$DLM_RESS where resource_name like '0x3116%TM%'RESOURCE_NAME ON_CONVERT_Q ON_GRANT_QMASTER_NODE- - -0x31160
22、x0,TM 0 1 0RESOURCE_NAME:资源名,就是TM-3116-0。ON_CONVERT_Q:转换者队列中锁结构的数量。现在为0,也就是没有人补阻塞。ON_GRANT_Q: 持有者队列中锁结构的数量。现
23、在为1,有进程的锁结构在持有者队列中。MASTER_NODE:资源的主节点。此处为0,即主节点为0,也就是节点1。(2)、在节点1查看资源结构:SQL> select RESOURCE_NAME, ON_CONVERT_Q,ON_GRANT_Q, MASTER_NODE from V$DLM_RESS where resource_name like '0x3116%TM%'RESOURCE_NAME ON_CONVER
24、T_Q ON_GRANT_QMASTER_NODE- - -0x31160x0,TM 0 1 0 和在节点2查看一样。(3)、在节点2查看锁
25、结构:SQL> set linesize 1000SQL> col STATE for a15SQL> select GRANT_LEVEL, REQUEST_LEVEL,PID, OWNER_NODE,WHICH_QUEUE,STATE,BLOCKED,BLOCKER from V$GES_ENQUEUE whereRESOURCE_NAME1 like '0x3116%TM%'GRANT_LEV REQUEST_L PID OWNER_NODE WHICH_QUEUE STATE BLOCKED
26、160;BLOCKER- - - - - - -KJUSERCW KJUSERCW 29079 1 1 GRANTED 0 0GRANT_LEVEL: 锁的类型,我只记得最后两个字母的意义,CW是共享,EX为独占,NL为空锁。REQUEST_LEVEL:请求的锁的类型。PID:进程号。OWNER_NODE:审请并持有
27、锁的节点。此处为1,即节点2.WHICH_QUEUE:锁结构被挂在资源结构的哪队列中。此处是1,即持有者队列。为0则为转换者队列,此表正在等待。STATE:状态。BLOCKED:是否被阻塞。BLOCKER:是否阻塞别人。 根据这些列的信息,我们可以知道,29079号进程,在节点2上审请TM-3116-0资源。请求的模式为共享,得到的模式也为共享,没有被阻塞。(4)、在节点1观察锁结构:SQL> set linesize 1000SQL> col STATE for a15SQL> select GRA
28、NT_LEVEL, REQUEST_LEVEL,PID, OWNER_NODE,WHICH_QUEUE,STATE,BLOCKED,BLOCKER from V$GES_ENQUEUE whereRESOURCE_NAME1 like '0x3116%TM%'GRANT_LEV REQUEST_L PID OWNER_NODE WHICH_QUEUE STATE BLOCKED BLOCKER- - - - - - -KJUSERCW KJUSERCW 0 1
29、 1 GRANTED 0 0 显示结构同在节点2中看到的基本一样。有一列不同,就是PID列,此处为0。步3:再在节点2执行一条DML语句:另外在节点2上打开个一会话,执行:SQL> insert into t3 values(2,'
30、b');1 row created.步4:查看锁情况(1)、在节点2查看资源结构与锁结构:SQL> select RESOURCE_NAME, ON_CONVERT_Q,ON_GRANT_Q, MASTER_NODE from V$DLM_RESS where resource_name like '0x3116%TM%'RESOURCE_NAME ON_CONVERT_Q ON_GRANT_QMASTER_NO
31、DE- - -0x31160x0,TM 0 1 0ON_GRANT_Q仍然为1,但其实TM-3116-0资源的持有者队列中,已经有两个共享锁结构了。这说明ON_GRANT_Q只是说明有锁结构在持有者队列中,至于有多少
32、锁,此列并不显示。SQL> select GRANT_LEVEL, REQUEST_LEVEL,PID, OWNER_NODE,WHICH_QUEUE,STATE,BLOCKED,BLOCKER from V$GES_ENQUEUE whereRESOURCE_NAME1 like '0x3116%TM%'GRANT_LEV REQUEST_L PID OWNER_NODE WHICH_QUEUE STATE BLOCKED BLOCKER- - - - - - -KJUSERCW KJUSERCW
33、60; 12870 1 1 GRANTED 0 0KJUSERCW KJUSERCW 29079 1
34、60; 1 GRANTED 0 0锁结构又多了一个,PID为12870。(2)、在节点1上显示资源结构与锁结构SQL> select RESOURCE_NAME, ON_CONVERT_Q,ON_GRANT_Q, MASTER_NODE from V$DLM_RESS where resource_name like '0x3116%TM%'RESOURCE_NAME
35、160; ON_CONVERT_Q ON_GRANT_QMASTER_NODE- - -0x31160x0,TM 0 1 &
36、#160; 0资源结构的显示结果,与在节点2上显示的一样。SQL> select GRANT_LEVEL, REQUEST_LEVEL,PID, OWNER_NODE,WHICH_QUEUE,STATE,BLOCKED,BLOCKER from V$GES_ENQUEUE whereRESOURCE_NAME1 like '0x3116%TM%'GRANT_LEV REQUEST_L PID OWNER_NODE WHICH_QUEUE STATE BLOCKED BLOCKER-
37、 - - - - - -KJUSERCW KJUSERCW 0 1 1 GRANTED 0 0 锁结构的显示结果就不一样了。在节点2(1号节点)上,已经有两个锁了(也就是有两个锁结构),但在主
38、节点上,只显示一行。 这是Oracle为了节省内存做的优化。主节点没有必要知道其他节点持有的全部锁,只需要知道某个节点持有的最高级别的锁即可。现在,1号节点也就是节点2,持有的最高级别的锁是共享锁。步5:在节点1上执行DML:SQL> insert into t3 values(3,'c');1 row created.步6:查看信息(1)、资源结构中的信息,在两个节点中都没有变化。(2)、锁结构的信息,节点2没有变化。因为节点2不是主节点,并且新的操作也不是在节点2上产生的。所以节点2上的锁结构
39、完全没有变化。(3)、节点1的锁结构信息:SQL> select GRANT_LEVEL, REQUEST_LEVEL,PID, OWNER_NODE,WHICH_QUEUE,STATE,BLOCKED,BLOCKER from V$GES_ENQUEUE whereRESOURCE_NAME1 like '0x3116%TM%'GRANT_LEV REQUEST_L PID OWNER_NODE WHICH_QUEUE STATE BLOCKED BLOCKER- - - - - - -KJUSERC
40、W KJUSERCW 30873 0 1 GRANTED 0 0KJUSERCW KJUSERCW 0 1
41、60; 1 GRANTED 0 0多了一个PID为30873的锁。OWNER_NODE节点为0,0号结构也就是节点1。步7:在节点1产生一个独占锁请求:SQL> lock table t3 in exclusive mode ;步8:观察锁信息(1)、节点2上资源结构和锁结构没有变化。
42、(2)、节点1上资源结构:SQL> select RESOURCE_NAME, ON_CONVERT_Q,ON_GRANT_Q, MASTER_NODE from V$DLM_RESS where resource_name like '0x3116%TM%'RESOURCE_NAME ON_CONVERT_Q ON_GRANT_Q MASTER_NODE- - -0x31160x0,TM
43、60; 1 1 0ON_CONVERT_Q列变为了1。证明有进程被阻塞、放进了转换者队列。(3)、节点1上锁结构:SQL> select GRANT_LEVEL, REQUEST_LEVEL,PID, OWNER_NODE,WHICH_QUEUE,
44、STATE,BLOCKED,BLOCKER from V$GES_ENQUEUE whereRESOURCE_NAME1 like '0x3116%TM%'GRANT_LEV REQUEST_L PID OWNER_NODE WHICH_QUEUE STATE BLOCKED BLOCKER- - - - - - -KJUSERCW KJUSERCW 30873 0 &
45、#160; 1 GRANTED 0 1KJUSERCW KJUSERCW 0 1 1 GRANTED
46、0;0 0KJUSERNL KJUSEREX 10897 0 2 OPENING 1 0 第三
47、行,PID为10897的,BLOCKED为1,代表,代表被别人阻塞了。REQUEST_LEVEL中,请求的锁类型为EX,也就是独占。GRANT_LEVEL列中,获得的锁类型为NL,也就是空锁。 注意,第一行BLOCKER为1,Oracle想表达此行阻塞了其他事务,其实,还有第二行对应的节点2中的事务,也阻塞了其他事务。步9:在节点2中,提交一个DML:SQL> commit;Commit complete.步10:观察信息(1)、节点1和节点2中的资源结构都没有变化。(2)、节点2中的锁结构:SQL> se
48、lect GRANT_LEVEL, REQUEST_LEVEL,PID, OWNER_NODE,WHICH_QUEUE,STATE,BLOCKED,BLOCKER from V$GES_ENQUEUE whereRESOURCE_NAME1 like '0x3116%TM%'GRANT_LEV REQUEST_L PID OWNER_NODE WHICH_QUEUE STATE BLOCKED BLOCKER- - - - - - -KJUSERCW KJUSERCW 29079
49、0; 1 1 GRANTED 0 1少了一行,因为一个事务已经提交。其他没啥变化。(3)、节点1中的锁结构:SQL> select GRANT_LEVEL, REQUEST_LEVEL,PID, OWNER_NODE,WHICH_QUEUE,STATE,BLOCKED,BLOCKER from V$GES_ENQUEUE whereRESOUR
50、CE_NAME1 like '0x3116%TM%'GRANT_LEV REQUEST_L PID OWNER_NODE WHICH_QUEUE STATE BLOCKED BLOCKER- - - - - - -KJUSERCW KJUSERCW 30873 0 1 GRANTED
51、 0 1KJUSERCW KJUSERCW 0 1 1 GRANTED 0 0KJUSERNL KJUSEREX
52、160; 10897 0 2 OPENING 1 0没有变化,虽然有一个事务提交了。原因是什么,你可以自己考虑一下,很简单的哦。步11:将节点1中的DML事务提交:SQL> commit;Commit complete.步12:观察信息:(1)、节点1
53、和节点2中的资源结构都没有变化。(2)、节点2的资源结构无变化。因为提交的事务在主节点,和节点2没有关系。SQL> select GRANT_LEVEL, REQUEST_LEVEL,PID, OWNER_NODE,WHICH_QUEUE,STATE,BLOCKED,BLOCKER from V$GES_ENQUEUE whereRESOURCE_NAME1 like '0x3116%TM%'GRANT_LEV REQUEST_L PID OWNER_NODE WHICH_QUEUE STATE BL
54、OCKED BLOCKER- - - - - - -KJUSERCW KJUSERCW 0 1 1 GRANTED 0 0KJUSERNL KJUSEREX 10897 0 2 OPENING 1 0
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 外研八下英语Unit 5 Presenting ideas-Reflection《单元语法沙龙》课件
- 2025 网络基础中网络职业技能培训的网络教学资源更新机制课件
- 2025 高中信息技术数据结构在电商用户购买行为聚类分析课件
- 2026年酒精供货合同(1篇)
- 2026年空白房屋抵押合同(1篇)
- 2026年物流垫资合同(1篇)
- 非遗展厅可行性研究报告
- 管理体系可行性研究报告
- 2026年邵阳市高三第二次联考试题数学试卷含答案
- 2025 高中信息技术数据与计算之数据挖掘的分类算法的主动学习策略优化课件
- 2025年四川大学教育培训部业务岗工作人员招聘考前自测高频考点模拟试题附答案详解
- 江苏省2025年接受高级访问学者的高等学校
- 村民自治课件
- 2024注册核安全工程师考试历年机考真题集附完整答案详解
- gmp规范培训课件
- 腰椎术后伤口感染管理要点
- 狱内案件立案表宁夏警官职业应用法律系87课件
- -世界水日主题班会课件
- 2022公共图书馆服务外包要求
- 2025新人教版七年级下册英语 Unit 6知识点梳理及语法讲义(答案版)
- 考古调查勘探辅助工程方案投标文件(技术方案)
评论
0/150
提交评论