SQLSERVER排查阻塞.doc_第1页
SQLSERVER排查阻塞.doc_第2页
SQLSERVER排查阻塞.doc_第3页
SQLSERVER排查阻塞.doc_第4页
SQLSERVER排查阻塞.doc_第5页
已阅读5页,还剩14页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

学习资料收集于网络,仅供参考SQL Server允许并发操作,BLOCKING是指在某一操作没有完成之前,其他操作必须等待,以便于保证数据的完整性。BLOCKING的解决方法要查看BLOCKING的头是什么,为什么BLOCKING头上的语句执行的很慢。通常来讲只要我们能找到BLOCKING头上的语句,我们总能够想出各种各种的办法,来提升性能,缓解或解决BLOCKING的问题。但是问题的关键是,我们不知道BLOCKING什么时候会发生。用户跟我们抱怨数据库性能很差,等我们连上数据库去查看的时候,那时候有可能BLOCKING可能就已经过去了。性能又变好了。或者由于问题的紧急性,我们直接重新启动服务器以恢复运营。但是问题并没有最终解决,我们不知道下次问题会在什么时候发生。BLOCKING问题的后果比较严重。因为终端用户能直接体验到。他们提交一个订单的时候,无论如何提交不上去,通常几秒之内能完成的一个订单提交,甚至要等待十几分钟,才能提交完成。更有甚者,极严重的BLOCKING能导致SQL Server停止工作。如下面的SQL ERRORLOG所表示, 在短短的几分钟之内,SPID数据从158增长到694, 并马上导致SQL Server打了一个dump, 停止工作。我们很容易推断出问题的原因是由于BLOCKING导致的,但是我们无法得知BLOCKING HEADER是什么,我们必须要等下次问题重现时,辅之以工具,才能得知BLOCKING HEADER在做什么事情。如果信息抓取时机不对,我们可能要等问题发生好几次,才能抓到。这时候,客户和经理就会有抱怨了。因为我们的系统是生产系统,问题每发生一次,都会对客户带来损失。2011-06-01 16:22:30.98 spid1931 Alert There are 158 Active database sessions which is too high. 2011-06-01 16:23:31.16 spid3248 Alert There are 342 Active database sessions which is too high. 2011-06-01 16:24:31.06 spid3884 Alert There are 517 Active database sessions which is too high. 2011-06-01 16:25:31.08 spid3688 Alert There are 694 Active database sessions which is too high. 2011-06-01 16:26:50.93 Server Using dbghelp.dll version 4.0.52011-06-01 16:26:50.97 Server *Dump thread - spid = 0, EC = 0x00000000000000002011-06-01 16:26:50.97 Server *Stack Dump being sent to D:MSSQL10.INSTANCEMSSQLLOGSQLDump0004.txt2011-06-01 16:26:50.97 Server * *2011-06-01 16:26:50.97 Server *2011-06-01 16:26:50.97 Server * BEGIN STACK DUMP:2011-06-01 16:26:50.97 Server * 06/01/11 16:26:50 spid 41242011-06-01 16:26:50.97 Server *2011-06-01 16:26:50.97 Server * Deadlocked Schedulers2011-06-01 16:26:50.97 Server *2011-06-01 16:26:50.97 Server * *2011-06-01 16:26:50.97 Server * -2011-06-01 16:26:50.97 Server * Short Stack Dump2011-06-01 16:26:51.01 Server Stack Signature for the dump is 0x0000000000000258BLOCKING的信息抓取有很多种方法。这里罗列了几种。并且对每种分析它的优缺点。以便我们选择。在枚举方法之前,我们先简单演示一下BLOCKING.我们首先创建一个测试表:DROP TABLE TESTTABLEGOCREATE TABLE dbo.TESTTABLE(ID int NULL,NAME nvarchar(50) NULL)GOINSERT INTO TESTTABLE VALUES (1, aaaa)GO然后打开一个查询窗口,执行下面的语句, 该语句修改一行数据,并等待3分钟,然后在结束transactionBEGIN TRANSACTIONUPDATE TESTTABLE SET NAME = bbbb WHERE ID = 1WAITFOR DELAY 00:03:00COMMIT TRANSACTION这时候,如果打开另外一个查询窗口,执行下面的语句,下面的语句就会被BLOCK住。UPDATE TESTTABLE SET NAME = cccc WHERE ID = 1方法一, 抓取SQL Profiler=SQL Profiler里面包含大量的信息。其中有一个事件在Errors and Warnings-Blocked Process Report专门用来获得blocking的情况。但是因为信息量比较大,而且我们并不能很好的估算在什么时候会产生blocking,另外在生产环境使用Profiler, 对性能可能会有影响,所以SQL Profiler并不是最合适的工具。我们在这里并不对它赘述。方法二, 执行查询=如果我们检查问题的时候,blocking还存在,那么,我们可以直接可以运行几个查询,得知BLOCKING HEADER的信息SELECT * FROM sys.sysprocesses where spid50上述查询只是告诉我们,BLOCKING HEADER的头是SPID=53, 但是并没有告诉我们SPID=53在做什么事情。我们可以用下面的查询,得到SPID=53的信息DBCC INPUTBUFFER(53)我们可以把上述的两个查询合并起来,用下面的查询:SELECT SPID=p.spid, DBName = convert(CHAR(20),), ProgramName = program_name, LoginName = convert(CHAR(20),), HostName = convert(CHAR(20),hostname), Status = p.status, BlockedBy = p.blocked, LoginTime = login_time, QUERY = CAST(TEXT AS VARCHAR(MAX) FROM MASTER.dbo.sysprocesses p INNER JOIN MASTER.dbo.sysdatabases d ON p.dbid = d.dbid INNER JOIN MASTER.dbo.syslogins l ON p.sid = l.sid CROSS APPLY sys.dm_exec_sql_text(sql_handle) WHERE p.blocked = 0 AND EXISTS (SELECT 1 FROM MASTER.sysprocesses p1 WHERE p1.blocked = p.spid)这样,一次执行,就能告诉我们BLOCKING header的SPID信息,以及该SPID在做的语句。我们可以进一步研究该语句,以理解为什么该语句执行很慢。用这个方法有一个缺点,就是使用的时候,要求BLOCKING是存在的。如果BLOCKING已经消失了,那么我们的方法就不管用了。方法三,长期执行一个BLOCKING SCRIPT=因为我们通常无法知道BLOCKING什么时候会产生,所以通常的办法是我们长期运行一个BLOCKING SCRIPT, 这样,等下次发生的时候,我们就会有足够的信息。长期运行BLOCKING SCRIPT对性能基本上是没有影响的。因为我们每隔10秒钟抓取一次信息。缺点是,如果问题一个月才发生一次,那么,我们的BLOCKING日志信息会很大。所以这种方法适用于几天之内能重现问题。运行方法如下:如果要停止运行,我们按ctrl+c就可以了。BLOCKING的信息存在log.out这个文件中我们可以打开log.out这个文件, 会发现SPID 54被 SPID 53给Block住了。而随后,我们可以看到SPID=53在做什么事情:下面是BLOCKING SCRIPT的脚本, 我们可以把它存为blocking.sqluse mastergowhile 1 =1beginprint Start time: + convert(varchar(26), getdate(), 121)Print Running processesselect spid, blocked, waittype, waittime, lastwaittype, waitresource, dbid, uid, cpu, physical_io, memusage, login_time, last_batch,open_tran, status, hostname, program_name, cmd, net_library, loginamefrom sysprocesses -where (kpid 0 ) or (spid 50open ibufferfetch next from ibuffer into spidwhile (fetch_status != -1)beginprint print DBCC INPUTBUFFER FOR SPID + spidexec (dbcc inputbuffer ( + spid + )fetch next from ibuffer into spidenddeallocate ibufferwaitfor delay 0:0:10End这种方法的缺陷就是,log.out会比较巨大,会占用很大的空间,如果blocking一个月甚至更长时间才发生一次,那我们的这个方法就不太适宜。方法四,我们用Agent Job来检查BLOCKING=长期运行一个BLOCKING SCRIPT的缺点是我们每隔一段时间,去查询信息,但是大多数收集的信息是无用的。所以会导致日志文件巨大,对于一个生产系统来讲,磁盘空间满可不是个好事情,另外,有一些客户对于用命令行来长期运行TSQL脚本有所顾忌,所以我们做了一个改进。这次,我们只收集有用的信息。对于无用的信息我们不关注。这样能极大减少日志大小。我们首先创建一个观察数据库,然后建立两张表格 Blocking_sysprocesses和Blocking_SQLText, 建立一个存储过程和一个Job, 该Job每隔一段时间去调用存储过程。只有发现有blocking的,我们才记录到表格Blocking_sysprocesses和Blocking_SQLText这两个表格中。如果跟blocking无关,我们就不对它进行记录。下面是TSQL语句:CREATE DATABASE MonitorBlockingGOUSE MonitorBlockingGOCREATE TABLE Blocking_sysprocesses(spid smallint,kpid smallint,blocked smallint,waitType binary(2),waitTime bigInt,lastWaitType nchar(32),waitResource nchar(256),dbID smallint,uid smallint,cpu int,physical_IO int,memusage int,login_Time datetime,last_Batch datetime,open_Tran smallint,status nchar(30),sid binary(86),hostName nchar(128),program_Name nchar(128),hostProcess nchar(10),cmd nchar(16),nt_Domain nchar(128),nt_UserName nchar(128),net_Library nchar(12),loginName nchar(128),context_Info binary(128),sqlHandle binary(20),CapturedTimeStamp datetime)GOCREATE TABLE dbo.Blocking_SqlText(spid smallint,sql_text nvarchar(2000),Capture_Timestamp datetime ) GOCREATE PROCEDURE dbo.checkBlocking ASBEGINSET NOCOUNT ON;SET TRANSACTION ISOLATION LEVEL READ UNCOMMITTED declare Duration int - in milliseconds, 1000 = 1 secdeclare nowdatetimedeclare Processes intselect Duration = 100 - in milliseconds, 1000 = 1 secselect Processes = 0select now = getdate()CREATE TABLE #Blocks_rg(spid smallint,kpid smallint,blocked smallint,waitType binary(2),waitTime bigInt,lastWaitType nchar(32),waitResource nchar(256),dbID smallint,uid smallint,cpu int,physical_IO int,memusage int,login_Time datetime,last_Batch datetime,open_Tran smallint,status nchar(30),sid binary(86),hostName nchar(128),program_Name nchar(128),hostProcess nchar(10),cmd nchar(16),nt_Domain nchar(128),nt_UserName nchar(128),net_Library nchar(12),loginName nchar(128),context_Info binary(128),sqlHandle binary(20),CapturedTimeStamp datetime)INSERT INTO #Blocks_rgSELECT spid,kpid,blocked,waitType,waitTime,lastWaitType,waitResource,dbID,uid,cpu,physical_IO,memusage,login_Time,last_Batch,open_Tran,status,sid,hostName,program_name,hostProcess,cmd,nt_Domain,nt_UserName,net_Library,loginame,context_Info,sql_Handle,now as Capture_TimestampFROM master.sysprocesses where blocked 0 AND waitTime DurationSET Processes = rowcountINSERT into #Blocks_rgSELECT src.spid,src.kpid,src.blocked,src.waitType,src.waitTime,src.lastWaitType,src.waitResource,src.dbID,src.uid,src.cpu,src.physical_IO,src.memusage,src.login_Time,src.last_Batch,src.open_Tran,src.status,src.sid,src.hostName,gram_name,src.hostProcess,src.cmd,src.nt_Domain,src.nt_UserName,_Library,src.loginame,src.context_Info,src.sql_Handle,now as Capture_TimestampFROM master.sysprocesses src inner join #Blocks_rg trgt on trgt.blocked = src.spidif Processes 0BEGININSERT dbo.Blocking_sysprocesses SELECT * from #Blocks_rgDECLARE SQL_Handle binary(20), SPID smallInt;DECLARE cur_handle CURSOR FOR SELECT sqlHandle, spid FROM #Blocks_rg;OPEN cur_HandleFETCH NEXT FROM cur_handle INTO SQL_Handle, SPIDWHILE (FETCH_STATUS = 0)BEGININSERT dbo

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论