aix系统健康检查.doc_第1页
aix系统健康检查.doc_第2页
aix系统健康检查.doc_第3页
aix系统健康检查.doc_第4页
aix系统健康检查.doc_第5页
全文预览已结束

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

系 统 健 康 检 查IBM 健康检查表客户名称:机器信息:系统健康检查时间机器型号机器序列号业务用途 检查内容: 1检查机房环境,电源温度、湿度是否符合要求 符合要求 不符合 备注:电源:相电压 符合要求 不符合 备注:线电压 符合要求 不符合 备注:零地电压 符合要求 不符合 备注: 2检查系统硬件情况检查设备故障灯是否有亮: 有 无备注: 有否异常情况(如硬盘、风扇异常的声音,电缆破损) 有 无备注: 3检查有无内置磁带机内置磁带机 有 无 4检查系统错误报告(Error Log):有否硬件故障 有 无故障内容: 有否软件故障 有 无故障内容: 结论:注意:如果故障记录太多,应将故障报告取回,作进一步分析。 5用mail命令查看有否发给root的错误报告。 有 无故障内容: 6查文件系统查看有没有“满”的文件系统。文件系统满可导致系统不能正常工作,尤其是AIX的基本文件系统。如/(根文件系统)满则会导致用户不能登录。有否“满”的文件系统 有 无备注: 7查看卷组信息 (lsvg l vg_name):有没有“stale”状态的逻辑卷。 有 无若有,用syncvg命令修复“stale”逻辑卷。备注: 8检查内存交换区(paging pace)使用率(lsps -s):使用率是否超过70% 有 无备注: 9检查CPU是否繁忙(sar 1 10)CPU空闲是否小于20% 有 无备注: 10检查I/O是否繁忙(iostat 1)是否大数据读写都集中在某些硬盘上 有 无备注: 11系统备份(MKSYSB):系统备份是指ROOTVG的备份。系统备份要及时,它应能恢复操作系统崩溃前的正常工作状态。因此每当系统改变设置,安装PTF,调整应用程序等的前后都应做好系统备份。有否合符要求的系统备份: 有 无最近一次系统备份的时间: 备注: 磁带机清洗。通常磁带机每使用30小时(8mm20GB为72小时)或至少每月清洁一次,不要等故障灯亮起后再清洁。可用“/usr/lpp/diagnostics/bin/utape cd rmt0 n“查看磁带机使用时数。使用时数: 是否需要清洗: 需要 不需要 12检测诊断(Diagnostic)机器Shutdown后以慢启动方式作自检,启动后运行Diag系统诊断程序。系统板、CPU、内存、I/O板 正常 不正常网卡、SCSI卡、SSA卡 正常 不正常系统其他扩展卡 正常 不正常硬盘、磁盘阵列 正常 不正常磁带机、磁带库 正常 不正常备注: 13通信测试检查各网卡的状态、IP地址、路由表等 正常 不正常用“ping”等命令检查通信 正常 不正常备注: 14补丁程序(PTF)和微代码(Microcode)检查检查PTF的版本并根据系统运行状况决定是否安装新的PTF和Microcode。需要安装的补丁程序/微代码: 15检查磁盘阵列(如:7133)状况,并填写下表: 客户名序列号硬盘数硬盘微码硬盘大小有无HotSpare硬盘何种数据保护FastWriteCathe是否打开 16检查硬盘使用率整体存储空间: GB使用空间: GB 客户签字: 年 月 日 工程师签字: 年 月 日1、检查系统硬件情况:设备故障灯是否有亮 2、系统错误报告(errlog) errpt -d H -T PERM对有怀疑的进一步:errpt -aj 错误代码|more3、有否发给root用户的错误报告(mail)mail 4、检查hacmp.out,smit.log,boot.log cd /tmpls hacmp.out*找到时间最近的字节不为零的文件,vi查看如果怀疑系统曾经有调整操作,检查/smit.logalog -ot boot5、关键系统的文件使用率不大于80% df -k查看%Used6、逻辑卷有否stale lsvg -l 卷组名称查看状态是否有stale的逻辑卷7、内存交换区使用率是否超过70%lsps -a查看占用率是否超过70% 8、内存交换区的大小是否为物理内存的1.5倍 命令同上现在原则有所改变,2G内存以下可按照1.5倍的标准,2G内存以上如果交换区占用率不高,可用2GB标准9、检查备份情况(有否系统备份、用户数据备份、磁带机是否需要清洗) 口头询问:系统备份、数据备份检查磁带机面板,提醒用户清洗10、通信(网卡、IP、路由表、ping、/etc/hosts、DNS设置等) netstat -innetstat -rnnetstat -ivi /etc/hosts检查DNS相关文件内容11、是否有数据保护方式如RAID10/RAID5,是否有Hot spare 如果是7133,diagTask SelectionSSA Service AidsLink Verification,smitty ssaraidFAStT产品使用其管理软件Storage Manager查看ESS使用ESS控制台查看12、系统DUMP设置是否正确sysdumpdev -l 13、检查系统参数是否正确1)/etc/environment中的TZ不能有夏时制 vi /etc/environment检查环境变量TZ,其格式应该是这样:TAIST-8,而不能是TAIST-8TAIDT-7这样的格式2)如有数据库:Aio:available lsdev -C|grep aio查看其状态是否available如不是:smitty chgaio,将状态修改为available,重启系统3)HACMP中I/O pacing:High Water Mark/Low Water MArk:33/24如果系统中运行了HACMPsmitty chgsysy,将High/Low water mark从0/0修改为33/244)HACMP中Syncd:10如果系统运行了HACMP查看/etc/inittab,将syncd后次参数修改为10,然后telinit q,kill -9 syncds PID5)HACMP中Power Monitor off 14、检查rootvg是否有镜象 lsvg -l rootvg查看镜像15、检查errdaemon,srcmstr是否正常运行 ps -ef|grep errps -ef|grep src16、机房环境(电压、湿度) 基本要求:零地电位差不得大于1V;严格要求:零地电阻=1(国内没几个能做到,=3就差不多了)湿度:45%70%17、系统性能:有否性能瓶颈(topas,vmstat) 18、补丁程序(PTF)、微码(是否需要升级)instfix -i|grep ML查看补丁级别及是否完整;lscfg -vp检查所有硬件设备微码19、HACMP测试:Cluster Verification

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论