




下载本文档
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、设备健康检查计划XX集团股份有限公司2009 年目录前言31 .服务概况3客户名称3服务时间3服务设备3服务内容32 .服务前期准备工作4巡检服务的前期准备工作: 4客户方的前期准备工作: 4双方待讨论和协'商的问题: 53 .服务具体计划54 .应急计划75 .备件计划76 .文档信息8附录8SUN系统巡检报告及相关命令说明 8ORACL激据库巡检报告及相关命令说明 8系统配置信息8ORACL遨据库系统维护检查报告 15前言感谢尊敬的广东XXX用户选择了 XXX勺服务,XXX公司秉承用户至上宗旨,坚持以 技术为先导,严格按照项目流程和规范管理服务项目,竭诚为用户提供一流优质的服务。本
2、文档的主要内容是对客户信息系统进行系统健康检查(简称:巡检)的计划安排。 包括服务概况、服务前期准备工作、服务具体计划、应急计划等等。1 .服务概况客户名称广东XXX服务时间待定服务设备见设备清单服务内容系统健康检测维护服务的目的在于了解被巡检系统截至到目前系统的性能状态和存在的隐患和运行风险;检查系统的运行状况、系统配置和连接方式、系统设置的情况、系统使用环境的及 系统的日志文件,进行系统的自检和检测,分析已经发现的和潜在的问题,建议必要的 措施,提高系统的可用性和可靠性。内容包括如下:检查设备使用环境是否符合要求和发生显著变更,包括湿度、电压、湿度、摆设位置等检查电源,信号线的连接是否牢固
3、;检查、清洁、调节系统硬件,并为需要的设备更换元件;检查系统的硬件和系统环境配置及网络环境配置;针对客户系统现状,提出建议和意见。查阅有关系统信息,检查有无出错信息,如发现出错信息,设法了解问题原因,并 后续给出问题的可能原因和解决建议。进行系统分析和检测,及时掌握系统的运行和安全状况,发现系统潜在问题,排除故障隐患和安全 漏洞。在完成系统健康检测后,XXXK务工程师将会同xxxft术专家团队一起分析系统状 况,并内向客户提交巡检分析报告和有关改进措施建议。2 .服务前期准备工作巡检服务的前期准备工作:1 .负责提交巡检方案,获得客户认可2 .负责准备巡检报告模板2份,巡检报告模板请见附录。(
4、注:一机一份,巡检完毕后, 现场提交用户)3 .提供服务的工程师在约定时间准时到达现场客户方的前期准备工作:1 .负责环境、场地、电源、网线、终端设备等准备工作。2 .负责提供系统主机Root登陆口令(清单)。3 .负责提供系统设备IP地址(清单)。4 .负责下电设备的加电准备工作5 .负责确定下电设备加电后的连网情况双方待讨论和协商的问题:1 . Root 口令以何种方式提供一般可采取两种方式,一是每台设备由客户来输入Root 口令,另外一种方式是由客户事先临时修改Root 口令,提供给服务工程师,巡检完毕后再由客户改回。2 .下电设备加电后,是否仍然具备连网条件如果下电设备加电后不连接网络
5、,则需要采取串口直接连接主机的方式来进行巡检,可能会影响巡检整体速度。3 .确定巡检主机顺序系统健康检测不会影响在线设备的运行。建议巡检顺序为,首先用一台终端依次检测所有连网设备,包括加电后能连网的设备,其次检测所有加电后无法连网的设备。3.服务具体计划任务名称XXX责任人客户方配合人员计划持续时间步骤1.现场环 境勘察 以及用 户交流1服务工程师了解现场机房环境状况服务工程师约40分钟2服务工程师在开始实施巡检时,向客户了解自前一次维护服务以来所发现的异常和问题,并采取必要的措施服务工程师3在对系统米取任何行动之前,确保已经采取必要的数据信息保护措施,如系统的备份或数据转存等;服务工程师步骤
6、2 .巡检服务4服务工程师收集与所服务 的系统有关的系统变更、微 码发布、软件升级、软件 PATCK布和系统问题的信 息和资料服务工程师约一到二个工作日5依次按照巡检内容对系统设备进行逐项巡检,并填写巡检报告服务工程师6巡检过程中如果发现任何系统问题,双方将协调处理服务销售7巡检过程中如果发现任何突发事件,请参考本文档5。服务销售步骤3.服务收尾工作8提交现场巡检报告,客户签字服务工程师大约1个小时9请客户填写服务满意度评价表10双方交流服务工程师11五个工作日内提交巡检分析报告服务工程师-4 .应急计划本次巡检服务中的设备为在线系统, 理论上讲,巡检只是对系统状态进行查看,本 身不会对系统产
7、生影响,只是在极少数情况下,系统本身已经有故障隐患,因为巡检触 发,可能会影响系统的运行,必须通过事先充分准备,识别可能的风险,并进行规避和控 制。通过以下方法来尽可能减少风险:服务工程师在开始实施巡检时,应首先向客户了解自前一次维护服务以来所发现的异常和问题,并采取必要的措施在对系统采取任何行动之前,应确保已经采取必要的数据信息保护措施,如系统的 备份或数据转存等;服务工程师在巡检过程中记录操作步骤,一旦发生突发问题,也有据可查,方便问题的定位。服务工程师在巡检过程中如果发现设备有重大问题,必须尽快进行处理的事件,由现场巡检工程师向本次用户通报,由用户同 XX刈艮务销售进行协商进行处理。5
8、.备件计划针对本次健康检查服务,我方主要提供对SUNK统以及ORACL敢据库的检查服务为主, 如果在检查过程中,发现有备件坏,我们会第一时间跟用户通报,并从XXX广州备件库 调相应备件进行更换;如果备件更换处于合同覆盖范围, 我们将不收取备件费用,如果合同未覆盖,我们将收 取备件物料成本费;为此次检查服务准备的备件清单包含但不限于:型号描述数量Sun V480 整机带cpu,内存,硬盘1X6805A,10000 RPM 硬盘4ST3310带控制器,无硬盘1XTA-SC1NC-73G10K73GB,3310阵列硬盘4XTA-SC1NC-146G10K73GB,3310阵列硬盘46 .文档信息本文
9、档由XXX负责起草附录SUN系统巡检报告及相关命令说明ORACL敢据库巡检报告及相关命令说明系统配置信息SUN系统巡检报告日期:年 月 日报告编号:客户名称检查地点主机型号IP地址主机SNHost ID配置部件型号/数量部件型号/数量CPU主板内存CPU内存板硬盘I/O板显卡存储阵列电源磁带驱动器SCSI型号外扩网卡型号其它卡型号系统盘Raid情况管理软件名称版本RAID类型硬件检查项目结果不正常请注明原因检查项目结果不正常请注明原因显示器正常 不正常光驱正常 不正常键盘正常 不正常软驱正常 不正常鼠标正常 不正常线缆正常 不正常磁带机正常 不正常板卡正常 不正常系检查项目内容结果不正常请注明
10、原因系统指示灯状态Front Panel LEDS正常 口不正常Power Supply LEDS正常 口不正常统Disk LEDS正常 口不正常System Controller Board LEDS(CPU/Memory 、I/O etc.)正常 口不正常系统messages信息cd /var/admgrep WARN messages*grep error messages*grep panic messages*/var/adm/messages正常 口不正常/var/adm/正常 口不正常/var/adm/正常 口不正常/var/adm/正常 口不正常/var/adm/正常 口不正常
11、硬件运行状态/usr/platform/sun4u/sbin/prtdiag -v正常 口不正常文件系统利用率dfkdfo i/利用率%正常 口不正常/usr 利用率%正常 口不正常/var 利用率%正常 口不正常其它分区正常 口不正常londe利用率(是否有空闲)正常 口不正常Swa阴区swap - susedk availablek 正常 口不正常cpim 载sar1 10% idle正常 口不正常内存剩余量vmstat 1KBytes正常 口不正常I/O资源iostatEn正常 口不正常网络接口流量netstat - i 1正常 口不正常网口以及IP状态ifconfig -a正常 口不正
12、常网络传输率ping网关(1分钟)averagems正常 口不正常NTP状态ntpq -p正常 口不正常远程登录设置/etc/ftp口开启 关闭telnet口开启 关闭进程总数ps - ef|wc -l个进程核心Patch版本uname - a冗Disk Suite 状态metastat输出结果是否正常正常 口不正常余软件(没有的不填)metadbMetadb建立在有个备份Volume Manager状态(没有的不填)vxdisk list输出结果是否正常正常 口不正常vxdg list有磁盘组Vxprint -ht输出结果是否正常正常 口不正常高 可 用 性 软 件SunCluster 状态
13、版本scstat输出结果是否正常正常 口不正常备注存储ST3310 阵歹 U外观及指示灯是否正常正常 口不正常show-config输出结果是否正常正常 口不正常固件版本SUN&机巡检相关命令及说明检查项目使用的命令及相关目录内容及其说明外观检查无检查机器的指示灯情况、看有无故障指示主机的总体情况/usr/platform/sun4u/sbin/prtdiag -v通过该命令,可以查看到CPU的数量、主频、CACH改小,内存、板卡、风扇转速、环境温度等情况查看文件系统挂接情况df -k可以查看到文件系统的挂接、使用量等情况,如果某个文件系统使用大于85%则要提请注意,大于90%W要对其
14、进行清理,删除废文件,如果根文件系统使用量达到 100%,会造成系统崩溃检查系统日志文件grep panic /var/adm/messages*grep error /var/adm/messages*grep WARN /var/adm/messages*检查系统的日志文件, 看有无panic、 error、WAR第和错误有关的关键字, 其中,panic关键字一般出现在操作 系统因软件或硬件故障崩溃的时候, error则是系统因软件或硬件产生了 错误,WAR恻相对关注级别较低,属于警告,这2种情况,都要根据系 统的日志提示,进一步检查系统情况检查CPU使用情况sar 1 10检查CPU的I
15、DEL值,越大越好,这里给出的命令是指间隔1秒,检查10次交换分区使用情况swap -s查看交换区(即虚拟内存) 的使用情况内存使用情况vmstat 1检查内存的使用情况, 尤其检查其中的剩余内存量,如内存剩余过少,则要检查进程及应用的情况,如无异常,则意味着系统需要更多的物理内存硬盘数量及容量format通过该命令,可以查看到硬盘的容量大小、数量等情况,硬盘及其他存储设备的情况iostat -E这个命令可以看到硬盘的运行情况,包括:厂商、序列号,有无运行错误等网络情况netstat -i 1查看网络的包吞吐情况以及冲突、包错误率等情况网络的IP设置ifconfig -a查看系统中的IP地址设
16、置查看操作系统的核心版本uname -a该命令除了能查看到操作系统的核心版本外,还可以查看到主机的硬件型号主机的1商ID号hostid可以查看到厂商为主机设置的唯一ID统计系统当前进程数量ps -ef |wc -l可以查看到系统当前进程数量远程登录设置grep ftp /etc/greptelnet /etc/可以查看系统的远程登录是否打开网络流通情况pingping网络中的另一设备,通常是缺省网关,以检查网络的流通延时情况检查SUNCLUSTER!理的双机系统状态scstat该命令可以显示 SUNCLUSTERZ机系统的和配置、状态有关的信息通过Web方式管理SUNCLUSTERS机系统通过
17、浏览其,输入主机的IP地址,端口号为3000,可以通过Web的方式管理SUN CLUSTERS机系统存储及冗余软件相关检查及其命令检查项目使用的命令及相关目录内容及其说明外观检查无检查机器的指示灯情况、看有无故障指示ST3x10阵列检查无通过串行口连接到阵列的串口,利用其设置界菜单检查,具体的参数为:波特率38400,数据位8,停止位1,奇偶校验无,流控无ST3x10阵列检查(通过sccli 工具检查)show-config连接了 ST3x10阵列的主机,如果安装了 sccli工具,通过输入 sccli命令,选择了控制器后,在其界面下输入的命令用 Varitas VolumeManager管理
18、的硬盘检查其管理下硬盘的状态vxdisk list检查Varitas Volume Manager管理下硬盘的状态用 Varitas VolumeManager管理的硬盘检查其管理下磁盘组的状态vxprint -ht检查Varitas Volume Manager管理下磁盘组的状态,包括其划分的子磁盘的、所做的卷等的状态用SDS管理软件管理的磁盘及其虚拟设备状态metastat对于用Solstice DiskSuite (SDS新的版本改为 Solaris Volume Manager ,简称 SVM管理的磁盘,在操作系统下,输入该命令,检查其管理的磁盘以及虚拟磁盘(mcl)的状态用SDS管理
19、软件管理的磁盘,检查起状态数据库的状态metadb对于用Solstice DiskSuite (SDS新的版本改为 Solaris Volume Manager ,简称 SVM管理的磁盘,在操作系统下,输入该命令,检查其管理数据库(用户保存SDS的设置等)的状态ORACLEl库系统维护检查报告报告编号:用户基本信息用户名称:联系人:电话/传真:地址:应用系统名称:巡检时间:主机厂商/型号:操作系统/版本:cpuB /硬件内存:数据库服务器运行方式:Oracle产品/版本:系统运行状况检测序号检测内容检测指令检测结果建议1检查alert 日志,是否有ora错误提示Alert 文件2数据库名SQL
20、>show parameter db_name3实例名SQL>showparameterinstance_name4数据库版本SQL>select * from v$version;5是否归档模式SQL>archive log list6安装组件SQL>select * from v$option;7初始化参数SQL>show parameters8SGAKSQL>show sga9用户检查SQL>selectusername,account_status,default_tablespace,temporary_tablespace,creat
21、ed from dba_users10用户权限检查SQL>select*fromdba_role_privs;11是否存在失效对象SQL>selectowner,object_name,object_typefromdba_objects where status = 'INVALID'12检查控制文件SQL>select*fromv$controlfile13检查联机日志SQL>select * from v$logfile;14检查数据文件SQL>select * from v$datafile;15查看现有回滚段及其状态SQL>SELE
22、CTSEGMENT_NAME,OWNER,TABLESP _NAME,SEGMENT_ID,FILE_ID,STAT US FROM DBA_ROLLBACK_SEGS;ACE16是否有异常等待事例SQL>selectevent,sum(decode(wait_Time,0,0,1)"Prev",sum(decode(wait_Time,0 ,1,0) "Curr",count(*)“Tot”from v$session_Wait group by event order by 4;17检测连接数情况SQL>SELECT status,cou
23、nt(*) "count" FROMv$session GROUBY status;selectsid,serial#,username,program, machine,status from v$session;18检查表空间使用情况19备份策略的讨论与实施20listener 可用性检查lsnrctl status21CRSffi程检查ps - df |grep结论:1、alert 文件:有无错误2、表空间使用情况:set linesize 300SELECT upper "tablespace_name","tablespace(M)&
24、quot;,-"used(M)",round( - / * 100,2) "use%","free_space(M)",round / * 100,2) "free%”FROM(SELECT tablespace_name,round(SUM(bytes)/(1024*1024),2) total_bytes,round(MAX(bytes)/(1024*1024),2) max_bytesFROMGROUP BY tablespace_name) f,(SELECT , round(SUM/(1024*1024),2) T
25、ot_grootte_MbFROM ddGROUP BY dWHERE =ORDER BY 4 DESC/3、Shared Pool Size 命中率:select round(sum(gets)-sum(reloads)/sum(gets)*100,1) "libiary cache hit ratio % from v$librarycache where namespacein ('SQL AREA','TABLE/PROCEDURE','BODY','TRIGGER');4、数据字典命中率:select roun
26、d(1-sum(getmisses)/sum(gets)*100,1) "data dictionary hit ratio %" from v$rowcache;5、锁竞争:select substr,1,25) Name,100* "% Ratio (STAY UNDER 1%)"from v$latch l, v$latchname lnwhere in ('cache buffers lru chain')and # = #;6、排序命中率:select "Sort(Disk)", "Sort(Mem
27、ory)",round(100*decode(+, 0,1,+),2) "% Ratio (STAY UNDER 5%)"from v$sysstat a, v$sysstat bwhere = 'sorts (disk)'and = 'sorts (memory)'7、数据缓冲区命中率:select round(1-+)*100,1)|'%' ratiofrom v$sysstat phy,v$sysstat cur,v$sysstat conwhere ='physical reads' and
28、='db block gets' and ='consistent gets'8、v$session_wait :select sid,seq#,event,WAIT_TIME,SECONDS_IN_WAIT from v$session_wait where event not like 'SQL%' and event not like 'rdbms%'9、回滚段的争用情况:select name, waits, gets, waits/gets "Ratio"from v$rollstat a, v$ro
29、llname bwhere =;10、无效对象情况:col OBJECT_NAME for a36SELECT object_name, object_type,status FROM dba_objects WHERE status like 'INVALID'客户签名:工程师签名:日期:检查项目使用的命令及相关目录内容及其说明alert文件alert XXX在sqlplus命令行状态卜,检查日志文件,其中XXX是只alert文件名数据库名SQL>show parameter db_name显示数据库名实例名SQL>show parameterinstance_n
30、ame显示数据库实例名版本SQL>select * from v$version;显示数据库版本归档设置SQL>archive log list显示归档设置,状况安装组件SQL>select * from v$option;显示已安装的组件初始化参数SQL>show parameters显示初始化参数SGASQL>show sga显示SGA勺设置,状态用户SQL>selectusername,account_status,defa ult_tablespace,temporary_tab lespace,created from dba_users用户检查权
31、限SQL>select * from dba_role_privs;检查用户的权限设置失效对象SQL>select owner , object_name,object_type from dba_objects where status = 'INVALID'检查是否启失效对象控制文件SQL>select * fromv$controlfile检查控制文件连机日志SQL>select * from v$loge;检查数据库的连接日志数据文件SQL>select * from v$datafile;检查数据文件回滚段SQL> SELECTSE
32、GMENT_NAME,OWNER,TABLEE_NAME,SEGMENT_ID,FILE_ID,SATUS FROM DBA_ROLLBACK_SESPAC查看现有回滚段及其状态TGS;Sessionselect SESSIONS_CURRENT , SESSIONS_HIGHWATER from v$license;系统Session使用状态字符集select userenv('language') from dual;字符集共享池命中率selectround(sum(gets)-sum(reloads )/sum(gets)*100,1) "libiarycache hit ratio %" from v$librarycache where namespace in ('SQLAREA','TABLE/PROCEDURE',&
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- CJ/T 3071-1998转刷曝气机
- 《Windows Server操作系统维护与管理项目教程》课件学习情境6
- DB13T 2997-2019 夏播玉米机械收粒技术规程
- 建筑能耗异常检测与预警企业制定与实施新质生产力项目商业计划书
- 高端定制家居装饰服务行业深度调研及发展项目商业计划书
- 浙江教师招聘考试试题及答案
- 放射工作人员证考试:放射防护(下)
- 长兴成人高考数学真题及答案
- 怎么考安全员资料考试试题及答案
- 云南省计算机一级c考试试题及答案
- 关于皮肤科药物知识讲座
- 【小学心理健康教育分析国内外文献综述4100字】
- 2025年日历日程表含农历可打印
- 锐意进取开拓新市场
- 焊接施工流程图
- 2023年贵州省六盘水市钟山区数学六下期末达标检测试题含解析
- 2023年黑龙江省高校毕业生三支一扶计划招募考试真题
- 新加坡介绍-课件
- 新版心肺复苏流程图
- 北科大2023年微机原理期末试卷
- 初三物理滑轮习题
评论
0/150
提交评论