AIX巡检报告以及操作手册_第1页
AIX巡检报告以及操作手册_第2页
AIX巡检报告以及操作手册_第3页
AIX巡检报告以及操作手册_第4页
AIX巡检报告以及操作手册_第5页
已阅读5页,还剩18页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、机器型号序列号:机器型号序列号:检查时间1.2.3.有4.故障内容若有硬件巡检报告单年月日机房环境:温度符合要求不符合湿度符合要求不符合机器清洁(根据需要清洁机器各部件): 已清洁 不需要 检查系统硬件情况:设备故障灯是否有亮 有 无 是否有其他否异常情况(如硬盘、风扇异常的声音,电缆破损)无系统错误报告(Error Log):有否硬件故障 有 无 运行故障诊断分析错误报告( eg: diag -ed hdisk1) 结论(如SRN, FRU等):有否软件故障有故障内容:结论:无5.有否发给root用户的错误报告(mail):有无结论:6.检杳 hacmp .out, smit.l og, b

2、ootlog 等:正常不正常7.文件系统的使用率不大于 80%:是否查看卷组信息(lsvg -l vg_name),有没有stale状态的逻辑卷:口是 否若有,用syncvg命令修复stale逻辑卷。备注:系统性能,有否性能瓶颈(topas, vmstat等):有无交换区使用率是否超过70% (lsps -s),实际值CPU 是否繁忙(sar 1 10), idle 值I/O 平衡(iostat 1)备份:有否合符要求的系统备份:有 无有否合符要求的系统备份:有 无最近一次系统备份的时间最近一次系统备份的时间有否符合要求的用户数据备份:有有否符合要求的用户数据备份:有无无磁带机是否需要清洗:需

3、要 不需磁带机是否需要清洗:需要 不需11.通信:网卡的状态、IP地址、路由表等:11.通信:网卡的状态、IP地址、路由表等:正常不正常网卡通信( ping):正常不正常/etc/hosts 文件或 DNS 设置:正常不正常12.系统 DUMP 设置是否正确:正常 不正常13.HACMP 测试:常;Cluster Verification:正常不正相关参数设置检查:正常 不正常(根据需要)接管测试:正常不正常;Cluster Verification:正常不正相关参数设置检查:正常 不正常(根据需要)接管测试:正常不正14.不正常系统硬件诊断:14.不正常 TOC o 1-5 h z 系统板、

4、CPU、内存、I/O板:正常口网卡、SCSI卡、SSA卡:正常不正系统其他扩展卡:正不正常硬盘、磁盘阵列:正不正常磁带机、磁带库:正不正常查系统参数是否正确:是否I/O pacing: High Water Mark/Low Water Mark:33/24Syncd:10Aio :available/etc/environment文件中TZ不应有夏时制Hacmp系统中Power Monitor子系统应关闭补丁程序(PTF)检查,现有补丁维护版本为:根据系统运行状况决定是否安装新的PTF。 需要安装的补丁程序:运行#snap - ac,生成文件命名为snap+s/n.pax.Z。检查 errd

5、emon, srcmstr 是否正常运行:是 否巡检内容及操作指导1 IBM RS6000 小型机机房要求:1机房的卫生状况,要求清洁,键盘、显示器、机柜上没有灰尘。2.温度(摄氏C)10 C-40C湿度( %)8% - 80%2.设备故障灯分类: 主机故障灯 面板上不能有数字显示,如果有的话,说明系统有故障。FAStT700 磁盘阵列故障灯 告警灯为黄色表示有故障 磁带机故障灯告警灯为黄色说明有故障或磁带机太脏,须清洗。3系统错误报告3系统错误报告(Error Log)的检查:硬件故障检测命令:# errpt -d H -T PERM若有故障执行命令# errp t -a -d H -T P

6、ERM/tmp/harderror.log保存,分析结果 报告给客户软件故障检测命令: # errpt -d S -T PERM若有故障执行命令# errp t -a -d S -T PERM/tmp/sof terror.log保存,分析结果 报告给客户有否发给root用户的错误报告(mail):#mail1.观察所有未读消息,注意有关diagela的消息。1.观察所有未读消息,注意有关diagela的消息。2.常用命令:hnumDisplayheadingsofgroupcontainingmessagenumtmsg_listDisplaymessagesinmsg_listhnumDi

7、splayheadingsofgroupcontainingmessagenumtmsg_listDisplaymessagesinmsg_listorcurrentmessage.Display next message.Quit5文件系统的检查:5文件系统的检查:命令:# df -kP%Used 为文件系统的使用率。所有文件系统的使用率不能大于 80%6磁带机清洁的检查:命令:#/usr/lpp/diagnostics/bin/utape -cd rmt0 - n显示结果为磁带机使用的小时数,若大于 72 小时,则不论磁带机黄灯是否亮都应用 清洁带清洗。6通信系统的检测:1网卡的状态命令:

8、#ifconfig - a输出判断:en0:flags=7e080863inet 192.168.1.3 netmask 0 xffffff00 broadcast 192.168.1.255主备网卡的flag为UP属正常。同时检查ip地址和net mask是否正确。2路由的检测2路由的检测命令:#lsattr - El inetOhostnameshaixsvr Host NameTruegatewayGatewayTruerouteRouteTruebootup_option noSerial OpticalNetwork Interface Truerout6FDDI NetworkIn

9、terfaceTrueauthm65536Authentication MethodsTrue3网络的检测命令:#ping ip address输出判断:用ping命令对/etc/hosts文件中的IP地址进行操作,检测网络是否联通。RAID 的 Hotspare 属性是否打开#smitty ssaraid Change/Show Attributes of an SSA RAID Array 检查 Enable Use of Hot Spares 属性是否为 YES8系统DUMP设置的检查命令:#sysdumdev -l 输出判断:结果应为primary/dev/hd6primary/dev

10、/hd6secondary/dev/sysdumpnullsecondary/dev/sysdumpnullcopy directory/var/adm/rascopy directory/var/adm/rasforced copy flagTRUEalways allow dumpFALSEdump compressionOFF若不正确请用下列命令修改:#sysdumdev - P - p /dev/hd6 - s /dev/sysdumpnull9HACMP 配置检测: Cluster Verification: 命令:# /usr/sbin/cluster/diag/clconfig

11、-v -tr 输出判断:结果无 Fail 项输出。10系统硬件诊断:命令顺序为:1#diagEnterDiagnostic Routines4.System VerificationAll ResourcesF7输出判断:结果应为 No trouble was found.11 补丁程序(PTF)的检查系统维护补丁版本为ML05,检查命令为:#instfix - i |grep ML12.系统参数的检查HIGH water mark for pending write I/Oslsattr -El sys0 |grep maxpout输出判断:结果应为Truemaxpout 33HIGH wa

12、ter mark for pending write I/Os per fileTrueLOW water mark for pending write I/Oslsattr -El sys0|grep minpout输出判断: 结果应为minpout24LOW water mark for pending write I/Os per file True更改命令为:#chdev -l sys0 -a maxpout=33 -a minpout=243Syncd 参数# grep syncd /sbin/rc.boot输出判断:结果应为nohup /usr/sbin/syncd 10 /dev

13、/null 2&1 &更改命令为:#vi /sbin/rc.boot4aio 参数# lsdev -Cc aio输出判断:结果应为aio0 Available Asynchronous I/O# lsattr -El aio0输出判断:结果应为Trueminservers 1 MINIMUM number of serversTruemaxreqs4096Maximum number of REQUESTSTrueTrueTrueTruekprocprio TrueTrueTrueautoconfig available STATE to be configured at system res

14、tart fastpath enableState of fast path更改命令为:#smitty aio5Limits 文件的设置:#ulimit - a输出判断:结果应为time(seconds)unlimitedfile(blocks)2097151data(kbytes)262144 /尤其是这项参数stack(kbytes)32768memory(kbytes)32768coredump(blocks)2097151nofiles(descriptors)2000更改命令为:#vi /etc/security/limits更改 data 为 524288巡检内容及操作指导 1 I

15、BM RS6000 小型机机房要求:1机房的卫生状况,要求清洁,键盘、显示器、机柜上没有灰尘。温度(摄氏C)10 C-40C湿度( %)8% - 80%设备故障灯分类:主机故障灯面板上不能有数字显示,如果有的话,说明系统有故障。FAStT700 磁盘阵列故障灯告警灯为黄色表示有故障磁带机故障灯告警灯为黄色说明有故障或磁带机太脏,须清洗。系统错误报告(ErrorLog)的检查:硬件故障检测命令:# errpt -d H -T PERM若有故障执行命令# errp t -a -d H -T PERM/tmp/harderror.log保存,分析结果报告给客户软件故障检测命令: # errpt -d

16、 S -T PERM若有故障执行命令# errp t -a -d S -T PERM/tmp/sof terror.log保存,分析结果报告给客户4有否发给root用户的错误报告(mail):#mail1观察所有未读消息,注意有关diagela的消息。2常用命令:h Display headings of group containing message t Display messages in or current message.nDisplay next message.qQuit3对发现的问题详细分析,结果报告给客户5文件系统的检查:命令:# df -kP%Used 为文件系统的使用

17、率。所有文件系统的使用率不能大于 80%6磁带机清洁的检查:命令:#/usr/lpp/diagnostics/bin/utape -cd rmt0 - n显示结果为磁带机使用的小时数,若大于 72 小时,则不论磁带机黄灯是否亮都应用 清洁带清洗。6通信系统的检测:1网卡的状态命令:#ifconfig - a输出判断:en0:flags=7e080863inet 192.168.1.3 netmask 0 xffffff00 broadcast 192.168.1.255主备网卡的flag为UP属正常。同时检查ip地址和net mask是否正确。2路由的检测命令:#lsattr -El inet

18、OTruehostnameshaixsvr Host NameTruegatewayGatewayTruerouteRouteTruegatewayGatewayTruerouteRouteTruebootup_option noSerial Optical Network Interface Truerout6FDDI Network InterfaceTruebootup_option noSerial Optical Network Interface Truerout6FDDI Network InterfaceTrueauthm65536 Authentication Methods

19、True3网络的检测authm65536 Authentication MethodsTrue3网络的检测命令: #ping ip address输出判断:用 ping 命令对 /etc/hosts 文件中的 IP 地址进行操作,检测网络是否联通。RAID 的 Hotspare 属性是否打开#smitty ssaraid Change/Show Attributes of an SSA RAID Array检查 Enable Use of Hot Spares 属性是否为 YES8系统DUMP设置的检杳命令:#sysdumdev -l输出判断:结果应为primary/dev/hd6second

20、ary/dev/sysdumpnullcopy directory/var/adm/rasforced copy flagTRUEalways allow dumpFALSEdump compressionOFF若不正确请用下列命令修改:#sysdumdev - P - p /dev/hd6 - s /dev/sysdumpnull 9HACMP 配置检测: Cluster Verification: 命令:# /usr/sbin/cluster/diag/clconfig -v -tr 输出判断:结果无 Fail 项输出。10系统硬件诊断:命令顺序为:1 #diag2.EnterDiagno

21、stic Routines4.System Verification5.All Resources6.F7输出判断:结果应为 No trouble was found.11 补丁程序(PTF)的检查1.系统维护补丁版本为ML05,检查命令为: #instfix - i |grep ML12系统参数的检查 1HIGH water mark for pending write I/Os# lsattr -El sys0 |grep maxpout输出判断:结果应为Truemaxpout 33 HIGH water mark for pending write I/Os per fileTrue2LOW water mark for pending write I/Os# lsattr -El sys0|grep minpout输出判断:结果应为Trueminpout 24 LOW water mark for pending write I/Os per file 更改命令为:True#chdev -l sys0 -a maxpout=33 -a minpout=243Syncd 参数# grep syncd

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论