




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、处理归档日志增加过快一例(2010-08-25 20:03:47) 转载标签: oracle归档日志增加过快分类: 原创文章 处理归档日志增加过快一例摘要 本文介绍了不久前作者是如何彻底解决一家医院数据库由于归档日志增长过快,导致磁盘剩余空间占满,引起宕机全过程。通过本案例的描述,我们可以了解到当遇到数据库宕机问题时,应该如何分析现象、找到问题关键、最终彻底解决该问题的一个总体思路,最后还应该深入思考该问题产生的原因,总结出避免以后再出现该问题的建议。关键字: ORACLE、归档日志、宕机、DML语句初步了解 &
2、#160; 早上一来到公司,XZH就告诉我接到CQ公司的有一个技术申请,大致情况为一家三甲医院,采用Rac+Linux环境,启用了归档模式,但是由于日志增长过快,我们的技术人员设虽然置自动删除归档的任务,但是还是没有避免磁盘空间被占满,已经引起医院2次全院无法使用,虽然CQ公司也安排多名技术人员去现场处理,但是医院认为一直没有解决彻底,因此信息主管对此意见较大,希望公司安排技术支持部现场彻底解决该问题。 通过申请描述,我大致了解到以下几个关键点:
3、60; 1.医院启用了归档,也做了定期自动删除归档日志的任务。 2.由于归档日志增加过快,已经导致医院2号节点宕机。 3.我们的技术人员去了几次,都未彻底解决,用户已经意见很大了。 这只是个初步情况,往往只能了解问题的大概,具体的问题产生的原因还是得到用户那里去才能真正了解,于是立即出发,前往用户处处理问题。现场分析问题 &
4、#160; 到达医院,同系统管理员互相寒暄了几句,了解大体情况是医院昨天凌晨部分科室反映不能登录导航台,于是系统管理员深夜被叫到医院,查看服务器发现数据库已经宕机,检查磁盘空间,发现其中一个节点的剩余空间为0,于是立即删除部分过去的归档日志,重新启动服务器,下面科室才能够正常登录,谈话间不断听见系统管理员抱怨深夜到医院是如何如何不情愿,看来意见是比较大。而且同样的问题不久前才出现过一次,当时是中午,询问同去的同事,了解到确实不久前也出现过一次同样的情况,当时认为是归档日志的定期删除保留的日志时间太长,当时保留的是30天的日志,后来改为保留5天的日志,心想不会
5、再出现该问题,没想到还是无法避免。 接下来,该我们自己着手分析问题了,因为毕竟用户描述的只是他的主观判断,而且真正要想了解到时发生的真实情况,看是应该看下Oracle的日志才能确认,这也是我们处理问题必须遵守的原则,首先看下该节点的alter.ora在出现问题时的错误记录,部分记录情况如下:Fri Jul 18 22:10:18 2010Errors in file /u01/app/oracle/admin/orcl/bdump/orcl2_arc1_13762.trc:ORA-19502: Message 19502
6、not found; No message file for product=RDBMS, facility=ORA; arguments: /u01/app/oracle/archive/2_24046_698868487.dbf 22529 512ORA-27072: Message 27072 not found; No message file for product=RDBMS, facility=ORALinux-x86_64 Error: 9: Bad file descriptorAdditional information: 4Additional information:
7、22529Additional information: 507392ORA-19502: Message 19502 not found; No message file for product=RDBMS, facility=ORA; arguments: /u01/app/oracle/archive/2_24046_698868487.dbf 22529 512Fri Jul 18 22:10:18 2010ARCH: Archival stopped, error occurred. Will continue retryingFri Jul 18 22:10:18 2010ORAC
8、LE Instance orcl2 - Archival Error 从日志记录的时间可以看出,真正出问题应该是在22点多钟,只是系统管理员凌晨才得到问题反馈,可以看出自己查看日志是多么的重要,不过从来错误的记录看,确实是由于无法归档,导致该节点出现问题,这个判断到是准确的。首先检查了下日志的增长速度,发现每个节点平均每13分钟就产生一个50M的归档日志,一天的归档日志就接近30G,而医院的日志放在本地磁盘,磁盘剩余空间也就100多G,按照这种日志的增长速度,空间被日志撑爆也就理所当然了。但是以该院的规模和业务量来看,产生
9、这么多的日志肯定是不正常的,所以找到日志增长过快的原因,是解决问题的根本。 首先观察下归档日志产生的频率,我们取当天24小时产生日志的频率数,如下图: 发现除了在上午业务高峰期(89点),其他时间段没有明显的曲线变化,而且凌晨时分(07点)的日志也切换频繁,这就肯定有问题,于是我生成今天2点3点的AWR报告进行分析,分析情况如下:
10、160; 首先看该时间段的会话不多,只有60多个会话,除去系统自带的几个会话,真正应用ZLHIS的会话肯定不多,证明当时医院的业务肯定不繁忙。 但是每秒钟的处理事务却有23.82,比很多三甲医院业务高峰期的事务都要大,肯定有问题,进一步分析执行sql: 发现即使在凌晨时分,居然也会如此频繁的执行大量的sql语句,其中涉及到update等DML语句,势必会产生大量归档日志,从表名看,
11、应该是与体检系统有直接关系,通过分析,发现是zl_体检任务结果_Transation过程中的语句。该过程是实现把体检病人的检验结果更新到体检系统里面,我们程序有2种方式进行更新: 1.后台每天晚上定时对全院未完成体检的病人集中更新一次,通过调用zl_体检任务结果_TransationAll实现,其中zl_体检任务结果_TransationAll过程里面,又循环调用了zl_体检任务结果_Transation过程。 2.是由操作人员在程序上操作,单独更新某
12、一指定病人,只调用zl_体检任务结果_Transation过程。 后一种情况肯定不会频繁执行该过程,目标锁定在第一种,后台作业方式,于是查看系统后台作业,发现问题作业,如下: 该后台作业中该过程的执行频率被调整3分钟,通过对zl_体检任务结果_TransationAll过程分析我们知道,只要体检病人没有完成体检,都会对其检验结果进行更新,而该医院当时正好进行大量体检,有上千病人没有完成体检,每次执行该过程,都会对这些病人进行更新,可想而知肯
13、定会产生大量日志,所以如此频繁的执行该过程,肯定是不现实的,定位了问题,接下来就该处理该问题。现场处理问题 询问相关人员,了解到由于该院体检科想实时得到体检病人的检验结果,所以我们的同事按医院的要求对作业执行频率进行了调整所致,说明了问题的严重性,经过和医院协商,阐述利弊,得到医院的同意,按医院要求最后把该后台作业修改为每天执行2次,中午一次,晚上一次。处理方法如下:1. 1. 删除原来的job由于知道job号为107,所以调用dbms_j
14、ob包删除 exec dbms_job.remove(107);2. 2. 创建2个的job,一个是中午13点执行,一个晚上执行1点-1点的jobvariable job number;begin sys.dbms_job.submit(job => :job,
15、; what => 'zl_体检任务结果_TransationAll;', next_date => to_date('20-07-
16、2010 01:00:00', 'dd-mm-yyyy hh24:mi:ss'), interval => 'trunc(Sysdate)+1+01/24+00/(24*60)+00/(24*60*60)'); commit;end;/-13点的jobvariable job
17、160;number;begin sys.dbms_job.submit(job => :job, what => 'zl_体检任务结果_TransationAll;',
18、60; next_date => to_date('20-07-2010 13:00:00', 'dd-mm-yyyy hh24:mi:ss'), interval => 'trunc(S
19、ysdate)+1+13/24+00/(24*60)+00/(24*60*60)'); commit;end;/3. 3. 后续处理 通过上面的修改,马上可以观察到2个节点的日志产生速度明显下降了,观察了1个小时,才产生了1个归档日志,由于是在下午时分,本身医院业务不是太忙,这种归档日志的产生速度应该是正常的。 然后,再对每个节点的备份和归档日志的删除策略进行下检查,1,2号机都改为每天晚上12点定时删除30天前的归档日志,standby的机器由于空间比较大,调整为每天12点定时删除60天前的归档日志,最后要求医院近期观察下日志的生成速度,经过医院的确认,得到医院的认可。(另:第二天,要求医院提供日志切换的次数统计,如下图,可以看到确实归档日志切换已经恢复正常,看到问题得到解决,医院的管理员也相当高兴。) 后续总结
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 小学五年级英语下册知识点归纳总结模版
- 信息技术安全质量保障补充协议
- 纳米材料研发与知识产权保护合同
- 汽车美容连锁加盟店投资合作协议
- 低碳绿色建筑运维期碳排放管理合同
- 校招应聘笔试题库及答案
- 电商企业客服知识库建设与大数据分析合同
- 火锅连锁经营授权与特色底料研发生产及品牌推广协议
- 校招项目经理面试题目及答案
- 影视特效替身演员动作捕捉与数据处理合同
- 2025年四川省绵阳市富乐学校中考模拟英语试题(含答案)
- 2025年教育信息化2.0背景下教师跨学科教学能力培养模式创新与优化
- 2025猪蓝耳病防控及净化指南(第三版)
- 2025年全国保密教育线上培训考试试题库含完整答案(各地真题)附答案详解
- 财务公司调账合同协议
- 2025-2030工业燃气燃烧器行业市场现状供需分析及重点企业投资评估规划分析研究报告
- 配送公司车辆管理制度
- 广西壮族自治区2025年4月高三毕业班诊断学考试物理试卷及答案(广西三模)
- 2025-2030中国建筑装配行业发展分析及竞争格局与发展趋势预测研究报告
- 现代农业产业园入园合同
- 第六单元《军民团结一家亲》课件 中学音乐人音版七年级下册
评论
0/150
提交评论