XX系统巡检方案-xxx年度xx巡检报告_第1页
XX系统巡检方案-xxx年度xx巡检报告_第2页
XX系统巡检方案-xxx年度xx巡检报告_第3页
XX系统巡检方案-xxx年度xx巡检报告_第4页
XX系统巡检方案-xxx年度xx巡检报告_第5页
免费预览已结束,剩余10页可下载查看

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、XX系统巡检报告(xxx年度第x季度)系统名称:XX系统巡检日期:编写:编写日期:审核:审核日期:批准:批准日期:目录、概述3、巡检方案31 数据库方面31.1 数据库服务器(硬彳基本信息: 31.2 数据库配置41.3 数据库检查内容 51.4 数据库检查总结 62 应用服务器方面62.1 应用服务器(硬件)基本信息: 62.2 应用服务器检查内容72.3 应用服务器检查总结 93 XX系统业务检查93.1 业务检查内容 93.2 业务检查总结 94 XX系统特色检查 114.1 日终批次情况检查 114.2 业务统计检查125网络通讯部分 125.1 网络通信检查内容 125.2 网络通信

2、检查总结 136热备/冷备部分136.1 热备/冷备检查内容 136.2 热备/冷备检查总结 137系统性能评估13一、概述合同名称:合同编号:巡检地点:巡检人员:巡检时间及安排:2巡检目标:检查XX系统本期巡检重点:1、检查数据库参数,是否有问题。2、检查应用服务器状况是否正常。3、监控系统的日常运行,包括操作系统,数据库,应用服务,网络。4、监控一线操作人员登陆业务系统,业务使用系统情况。5、检查服务器可用资源,包括 内存,CPU,磁盘的使用情况,以及数据的备份情况 建议:在非业务时间(19:00-24:00之间)操作应用服务器(A、B机分别执行)ap.bat数据库服务器 db.bat、d

3、b_stat.bat yw.bat、ts.bat二、巡检方案1数据库方面1.1数据库服务器(硬件)基本信息:厅P项目名称检查方法参考值实际结果1机器名登录数据库服务器,执行db.bat脚本中的命令 ipconfig /all ,在网络信息中 查看机器名DongChanYW-db1DongChanYW-db12用途(生产,测试, 开发)生产生产生产3所在城市,物理位置 (机房,远程)机房机房机房4:硬件供货商IBM1IBMIBM5型号旧M,9133-55AIBM,8233-E8B6操作系统登录数据库服务器,执行db.bat脚本中的命令verWindows_NTWindows_NT7操作系统版本登

4、录数据库服务器,执行db.bat脚本中的命令echo %OS%MicrosoftWindows版本 6.1.7601Microsoft Windows 版本 6.1.76018内存登录数据库服务器,打开任 务管理器,选择性能标签页7936 MB8191 MB9CPU个数登录数据库服务器,打开任 务管理器,选择性能标签页4410剩余磁盘空间(in %)登录数据库服务器,命令行打 开 diskmgmt.msc 查看磁盘使用情况卷文件系统状态可用C: NTFS状态良好30%卷文件系统状态可用C: NTFS状态良好30%系统保留 NTFS状态良好74%E: NTFS状态良好60%11处理器数(由实例使

5、用)打开SQLServer服务器面板查有4412总服务器内存(KB)打开SQLServer服务器面板查有3147776314777613可用性需求(系统使 用时间)正常正常1.2数据库配置生产库:在舁 厅P项目名称检查方法参考值实际结果1实例名打开SQLServer服务器面板, 查看实例名称DONGCHANYW-DB1DONGCHANYW-DB12数据库名SCFDBSCFDB3版本打开SQLServer服务器面板, 查看数据库版本10.50.160600.14表空间信息执行db_stat.bat脚本正常正常1.3 数据库检查内容在舁 厅P检查项目方法检查项目描述参考值实际结

6、果1打开sqlserver 管 理面板,选择日志, 检查数据库日志文 件中是否有系统错 误信息。查看 sqlserverlog_ 日期.log 文件中11月31日后是否后错 误码,要查看错误码的相关解 释可参考sqlserver帮助文档正常正常2检查表空间使用情 况,评估数据库表 空间的使用情况 方法:执行db_stat.bat 脚本执行命令后可查看到保留空 间、使用空间、索引使用空 间、未用空间正常正常3检查每晚的备份是 否成功目前采用虚拟机整机备份,检 查备份是否止常备份正常。备份正常。4监控数据库性能:执行db_stat_connection. ba;,痴+物理连接 数情况,执行db_s

7、tat_lock.bat , 检查是否存在死 锁,并解锁主要关注以下几项:1、查看物理连接数是否在止常范围内2、检查是否存在死锁在业务高峰期取6次快 照得到以下结论:1、当前连接的应用程序 的最大连接数48在系 统范围设置范围内(0-90)2、未检测到死锁。在业务高峰期取6次快照得 到以下结论:1、当前连接的应用程序的 最大连接数23在系统范围 设置范围内(0-103)2、未检测到死锁5检查数据库配置信息:执行db.bat脚本通过提取的配置信息,结合数 据库表空间使用情况,分析数 据库是否满足目前的系统要 求。正常正常6检查数据库基础数据方法:执行base_data.bat 脚本通过提取的基础

8、数据,结合业 务配置流程等,分析基础数据 是否满足目前的系统要求正常经过检测分析得到如下结论:正常7查看业务繁忙时数 据库cpu及内存使 用情况 方法:书开命令行,输入 taskmgr.exe,打开 任务管理器,选择“性能”标签项, 并截图保存(根据 统计语句获得业务 系统统计的数据量 得到每天的业务高 峰时间段,在这个 时间段内执行6 次)。cpu的平均使用率低于30%。正常正常1.4 数据库检查总结通过对收集到的数据库信息分析得出以下结论:1、关于数据库连接数,本系统web服务器was设置的最大数据库连接数为100个,而目前业务高峰 期的数据库最大连接数为20个,也就是在当前业务高峰期间,

9、数据库的最大连接数只占到系统设置的 20% 左右,完全满足系统业务需求。2、未检测到有死锁现象,数据库运行良好。2应用服务器方面2.1 应用服务器(硬件)基本信息:在舁 厅P项目名称检查方法参考值实际结果1机器名登录应用服务器,执行ap.bat 脚本中的ipconfig /all ,在网络 信息中查看机器名DongChanYW-app1DongChanYW-app12用途(生产,测试, 开发)生产生产生产3所在城市,物理位 置(机房,远程)机房机房机房4硬件供货商IBMIBMP IBM5型号旧M,9133-55A旧M,9133-55A6操作系统登录应用服务器,执行ap.bat脚本中的命令ech

10、o %OS%Windows_NTWindows_NT7操作系统版本登录应用服务器,执行ap.bat 脚本中的命令verMicrosoft Windows 版本 6.1.7601Microsoft Windows 版本 6.1.76018内存登录应用服务器,打开任务管 理器性能标签4095 MB4095 MB9CPU个数登录应用服务器,打开任务管 理器性能标签2210剩余磁盘空间(in %)登录数据库服务器,命令行打 开diskmgmt.msc查看磁盘使 用情况卷文件系统状态可用C: NTFS状态良好30%卷文件系统状态可用C: NTFS状态良好79%系统保留 NTFS状态良好72%E: NTF

11、S状态良好94%11可用性需求(系统 使用时间)13*713*72.2 应用服务器检查内容在舁 厅P检查项目方法检查项目描述参考值实际结果1检查所有应用服务 器标准输出和错误 输出日志。查看错误日志(E:/IBM/WebSphe re/AppServer/prof iles/AppSrv01/log s/server1/ScfOut.log )中是否启错误 代码,如果存在,根 据日志中错误信息 检查检查是否存在错误日志正常正常2查看业务繁忙时应 用服务器的CPUZ及 内存使用情况。方法:书开命令行,输入taskmgr.exe,打开任 务管理器,选择“性 能”标签项,并截图 保存。根据统计语句获

12、得 业务系统统计的数 据量得到每天的业务高峰时间段,在这 个时间段内执行 6 次(根据统计语句获 得业务系统统计的打开任务管理器性能页面,查 看系统资源使用情况是否止 常CPU的平均使用率低 于 30%。CPU的平均使用率 低于30%。数据量得到每天的 业务高峰时间段,在 这个时间段内执行 数次)。3查看应用服务器进程状态方法:执行 ap.bat脚本中的%SystemRoot%/syst em32/tasklist查看当前是否后 was进程在 运行正常正常4主要参数/配置 方法:1、Websphere 服务器 处理线程数。打开管 理控制台,依次打开 目录树,应用程序服 务器 > serv

13、eri > 线程池>WebContainer,查看 最大大小2、JVM虚拟机堆大 小,服务器-> 应用程 序服务器 ->server1-> 进程定 义->java虚拟机,查 看初始堆大小和最 大堆大小的值3、Web容器传输链, 应用程序服务器 > serveri > Web 容器 传输链>WCInboundDefault> HTTP入站通道(HIIP_2),查看最 大持久后求数4、数据源-> Microsoft SQL Server JDBC Driver Appi 查看连接数据库的 服务器的IP地址, 并点“测试连接”, 连接

14、成功;点“连接 池属性”,查看最大 连接数检查Web容器线程池大小、Java虚拟机堆大小、每个连接最大持久请求数、数 据库连接池最大连接数1、Web容器线程池502、Java虚拟机堆大小256M-1024M3、Web容器最大持久请求数1004、数据库连接池最大连接数1001、Web容器线程池502、Java虚拟机堆大小 256M-1024M3、Web容器最大持久请求数1004、数据库连接池 取大连接数10092.3 应用服务器检查总结通过应用服务器检查分析得出以下结论: 应用服务器各项检查正常。3 XX系统业务检查3.1 业务检查内容1、非业务时间(建议在 19:00-24:00之间),登录数

15、据库服务器执行以下脚本:1)通过执行脚本yw.bat可以分析得到每天的业务操作高峰大约在几点钟的每天的业务量。2、执行表数据量统计脚本db_stat.bat,得到目前各个表数据量。3、查看 WAS连接数据库的物理连接数,可以在数据库服务器上每间隔一段时间执行db_connection.bat查看当前数据库连接数。或者登录 Was控制台,进入性能查看器,选择数据源,查看目前连接池打开的物理连接。3.2 业务检查总结1.最近一星期内每天每小时的业务流水量:时间2013-04-102013-04-112013-04-122013-04-132013-04-1480110092101010222311

16、195990121101013352001492256152428616240021722000718012000190200020010002100000结论:通过上表可以看出业务高峰期集中在(时间段):10:0012:002 .最近一星期内每天的业务流水量:日期申请笔数2013-04-1092013-04-11202013-04-1222013-04-13122013-04-146日期通信笔数2013-04-103982013-04-115102013-04-12272013-04-13372013-04-14792结论:通过上表可以看出日平均业务量较少3 .业务高峰期数据库连接数执行时间

17、2013-04-10 10:002013-04-10 10:202013-04-10 11:002013-04-10 14:002013-04-1014:302013-04-1015:00物理连接数161816192018结论:通过上表可以看出在业务高峰期数据库连接数大概为18个左右4 .数据量统计收集数据表的数据量和统计信息,据此进行重整规则优化,必要时制定数据清理方案,需要关注的大表及记录数如下:结论:目前以上为纪录数均未超过 20万,暂不需对历史数据迁移。4 XX系统特色检查4.1 日终批次情况检查提取最近一周终批处理日志,分析批次运行情况,检查每一步运行是否成功,以及每一步运行时间。1

18、) 7月-9月批次总耗时时间抽样:日期处理类型是否成功开始时间结束时间用时(毫秒)2013-01-05日终批次成功2013-01-05 23:00:302013-01-05 23:00:3771422013-01-21日终批次成功2013-01-21 23:00:232013-01-21 23:00:3071722013-02-02日终批次成功2013-02-02 23:00:182013-02-02 23:00:2466412013-02-29日终批次成功2013-02-29 23:00:282013-02-29 23:00:35 :72032013-03-01日终批次成功2013-03-0

19、1 23:00:332013-03-01 23:00:4062502013-03-09日终批次成功2013-03-09 23:00:292013-04-09 23:00:3556412) 1月-3月批次各任务的平均时间(毫秒)如下模块1月2月3月跌破监管下限预警104910381052价格波动异常预警960980973流转频率预警393742未巡库提示959996SCF库存信息同步CMS402399403跌破监管下限预警(监管公司设定上浮值)4543393) 1月-3月批次涉及关联系统接口通讯情况日期CMS2013-1-01正常2013-1-20正常2013-2-04正常2013-2-22正常

20、2013-3-01正常2013-3-10正常结论:日终批次运行正常,批次中涉及关联接口通讯正常4.2 业务统计检查执行ts.bat,检查业务统计情况,包括按申请类型(出质入库、换货、调价、监管下限调整等)查询业务 申请统计情况,分析目前动产业务系统承载能力。业务申请统计情况:业务类型代码总笔数绑定规则修改申请232监管协议终止申请9259日常入库申请22210换货通知申请905调价申请(快速)9711追加出质申请07510提货申请031押品监管下限设定申请25130换货申请0453出质入库申请02250调价申请9872押品监管下限调整申请18761结论:各业务种类申请数据量不大,系统能够支撑正

21、常业务处理。5网络通讯部分5.1 网络通信检查内容在舁 厅P检查项目操作命令或检查方法参考值实际结果1数据库服务器通讯检查ping数据库服务器IP正常发送和收到数据包正常发送和收到数据包2应用服务器A通讯检查ping应用服务器IP正常发送和收到数据包正常发送和收到数据包3应用服务器B通讯检查ping应用服务器IP正常发送和收到数据包正常发送和收到数据包4HII用艮务器Aa讯检查ping Http所在服务器IP 正常发送和收到数据包正常发送和收到数据包5HII用艮务器B通讯检查ping Http所在服务器IP正常发送和收到数据包正常发送和收到数据包145.2 网络通信检查总结6热备/冷备部分6.

22、1 热备/冷备检查内容在舁 厅P检查项目操作命令或检查方法参考值实际结果1热备软件的可用性1)在CAMA:控系统查看备份是否 成功,是否定期正常运行。2)检查备份目录下是否有周 备份数据。备份执行成功虚拟机整机备份2备份方式及策略1)备份方式:每天零晨 3: 00执 行执行联机热备份备份方式和策 略合理虚拟机整机备份6.2 热备/冷备检查总结7系统性能评估1)通过 任务管理器及系统信息信息界面,检查服务器目前内存、cpu数及频率,通过磁盘管理器检查目前磁盘空间的使用情况。通过任务管理器检查服务器平稳运行情况下,虚拟内存的使用情况。分析目前内存,CPU硬盘空间是否满足业务系统的要求。总结:根据获

23、取的硬盘信息分析,应用服务器及数据库服务器部份文件系统占用磁盘空间较大,按 照目前的业务增量,后续可能会导致磁盘空间不够,建议增加磁盘空间。系统运行的线程数量没有 超出CPUb限,cpu平均空闲率达到90%2)通过db.bat中执行sql脚本获取数据库版本 检查数据库的补丁版本及实例是否启动并正常运行 总结:数据库运行情况良好。3)通过db.bat中执行sql脚本获取数据库表空间使用情况 检查数据库表空间的状态是否正常,及使用情况。总结:数据库表空间的使用情况正常。4)检查近期的备份是否正常,分析备份策略是否合理。总结:备份情况正常,备份方式和策略合理。5)通过db.bat中的命令提起快照信息,分析数据库的发生的死锁数及缓冲池的命中率。 总结:没有检测到互斥锁定升级,也没有检测到死锁。缓冲池使用情况良好。6)登录WaS勺控制台,检查WaS勺配置参数是否符合要求。Web器线程池:50Java虚拟机堆大小:512M-1024MWeb 容器传输链 > WCInboundDefa

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论