AIX日常维护.doc_第1页
AIX日常维护.doc_第2页
AIX日常维护.doc_第3页
AIX日常维护.doc_第4页
AIX日常维护.doc_第5页
已阅读5页,还剩1页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

AIX日常维护1 文件系统是否满方法: df k 可以以K为单位检查文件系统的使用率。(90%以上,需要调整)2 检查系统出错日志 使用errpt |more来检查清除现有的log: Errclear 03 检查系统合法/非法登陆情况使用Last命令来检查来自登陆的地方。4 检查系统是否有巨大的Core文件生成使用 find / -name core print来检查。对Core文件,一般直接删除就可以了。5 系统性能检查:a) CPU性能:使用vmstat, topas来检查b) 内存使用情况:也是使用topas, vmstat来检查c) 检查IO平衡使用情况:使用iostat来检查d) 交换空间使用情况:使用lsps a来检查6 Mail检查7 Diag 一个月一次补充两点:1。硬件检查,检查各指示灯状态和各物理设备的可用情况。2。进程检查,检查是或有死进程。用who -d 查出一些死进程!AIX日常指令和常用操作一:开机登录在开机之前,先检查电源是否插好;然后,按下前面板上白色电源开关后,主机会进入硬件自检和引导阶段;此时,前面板上的液晶会有代码跳动,每一个代码表示自检或引导的不同阶段,最后在引导结束时,前面板液晶上的代码消失,彩显或终端上有显示,进入系统初始化和登录提示。如果主机停在某一代码上,引导不下去 (大于半小时),说明系统可能有故障,请与IPACS 联系,并把代码一起报给我们。二:关机1)关闭应用程序2)HACMP软件,先用smit clstop关闭HACMP。3)命令行打“shutdown -F”进关机,显示器上出现“Halt Completed”可按下前面板上白色电源开关,关电源。如果需要关机后重新引导,打“shutdown -Fr”命令。三:基本定义1) Physical Volume(PV)Physical Volume就是指硬盘,在AIX中用hdiskx表示。7133磁盘阵列中的某个硬盘用pdiskx表示,pdiskx对应的AIX操作系统中Physical Volume用hdiskx表示。用lspv命令来看一下PV与VG对应关系用lsdev -Cc disk命令看一下硬盘状态,Available 表示硬盘可用,Defined 表示物理硬盘找不到,只有逻辑定义。2)Volume Group(VG)Volume Group 是由多个Physical Volume组成的集合。Physical Partition是VG分配空间的最小单位。AIX操作系统所在的卷组就是rootvg可用lsvg 查看VG信息,用lsvg -o 查看打开的卷组。3)Logical Volume(LV)和FileSystem(FS)Logical Volume和Filesystem是在卷组上划分的空间,不能跨多个卷组而且只能扩大不能缩小。Filesystem是在LV上建的,使用时,需mount在AIX某一目录上。可用lsvg -l VG_Name来看VG 上所有的LV和FS用 df 命令来看Filesystem 使用情况用mount命令来看已mount的Filesystem四: 日常系统管理AIX通过smit 工具 (smitty是字符界面)来进行系统管理。1)增加修改删除用户smit user2)增加修改删除卷组smit vg3)增加修改删除逻辑卷smit lv4)增加修改删除文件系统smit fs5)网络设置和查询smit tcpipMinimal Configuration填入IP地址,子网掩码,网关等参数;Start Now改为Yesnetstat -i / netstat -in 查看网卡interface状态和参数6)日常维护平时需用 df 和 errpt 检查一下文件系统使用率和有无新的错误日志。如果文件系统使用率大于90%,需扩大该文件系统。命令行打errpt后,可以显示类似下列错误日志;ERROR_IDENTIFIER TIMESTAMP T CL RESOURCE_NAME ERROR_DESCRIPTION192AC071 0101000070 I 0 errdemon Error logging turned off0E017ED1 0405131090 P H mem2 Memory failure9DBCFDEE 0101000070 I 0 errdemon Error logging turned on038F2580 0405131090 U H scdisk0 UNDETERMINED ERRORAA8AB241 0405130990 I O OPERATOR OPERATOR NOTIFICATION其中,TIMESTAMP代表日期,以MMDDhhmmYY格式;如0405131090表示1990年4月5日13时10分T(Type)一栏中,P表示永久性错误,T 表示零时性错误,U 表示不能决定是什么错误,I 表示信息而非错误。CL(CLass)一栏中,H表示硬件错误,S 表示硬件错误,O 表示通知操作员。如果 T(Type)一栏中是P且 CL(CLass)一栏中是H,表示较严重错误,需跟IBM联系。五:系统备份(仅rootvg备份)备份是用户的责任,可用下列步骤备份rootvg,其它数据需另外备份。系统备份要定时做,一般1-2月做一次,凡rootvg数据有变化(如系统参数修改)要马上备份。最好用几合带子轮流备份。备份带上要标明备份时间和内容。1)用root用户登录2)mount rootvg下需备份的文件系统3)smit mksysb选择备份介质Expand /tmp filesystem if needed 改为 Yes六:诊断diag-System Verification选择需诊断的硬件设备七:常用命令set -o vi 类似PC DOS 中doskey命令,先按ESC键再按几下k键,可重现以前打过的命令。export TERM=vt100/ibm3153/lft 设置终端类型lsdev -C和lscfg -v 显示硬件配置1、df -k文件系统空间使用情况2、lsvg 列出系统中所有vg的名字lsvg -o 列出激活vg名字lsvg vgname列出指定vg的详细信息lsvg -l vgname列出指定vg上的lv情况3、lsdev -P -H列出AIX支持的设备(即预定义odm数据库中的设备对象)lsdev -C 列出AIX支持的设备已定义的odm数据库中的设备对象lsdev -Cc xxx列出定制odm数据库中某个设备对象的信息例如:lsdev -Cc disklsdev -Cc tapelscfg列出系统上已安装的资源的配置信息lscfg -vl列出某个设备的VPD信息例如:lscfg -vl ent1lscfg -vl hdisk1lscfg -l xxx*列出设备的不带VPD的相关信息lscfg -l proc*lscfg -l hdisk*4、修改文件及目录的属性4.1 chmod例如:chmod 765 xxx 修改文件xxx属性为765chmod -R 765 XXX 修改目录xxx及其下子目录及文件属性为7654.2 chown例如:chown user:usergroup xxx修改文件xxx的属主为user:usergroupchmod -R user:usergroup xxx 修改目录xxx及其下子目录及文件属主为user:usergroup5、系统性能检测工具vmstat内存、pagespace、CPU等监测(vmstat 2 10每隔2秒钟执行一次,共执行10次)iostat 硬盘I/O监测netstat网卡监测topas综合检测工具6、ps进程察看ps -ef|grep 进程名例如:ps -ef|grep sapps -ef|grep oracleps -ef|grep tsmps -ef|grep cluster其他的指令可参照smitty工具来操作Basis学习showmount -e iplsdev -Cc adapter|grep ent 查看网卡lsdv -Cc if 查看网卡接口ifconfig -anetstat -in 看网卡IP信息netstat -rn 路由lssrc -t telnetlssrc -t ftpvi /etc/inetd.conf禁止远程通过 root 登陆,修改 /etc/security/user 文件,在root选项将 false 作为 rlogin 的值进行AIX 的日常维护,需要关注哪些日志文件?文件 描述 建议core 和 snapcore 由应用产生的 dump 文件,可用于诊断错误 可删除nohup.out nohup 命令的输出结果 可删除.xerrors X11的输出结果 可截短mbox 用户邮箱中的邮件 可截短smit.log 和 smit.script 用户使用smit 命令后的日志 可适当保留最后1000行,或删除/var/adm/wtmp 记录用户的登录信息,是二进制文件,用who 命令来阅读其内容 根据需要保留60天中有用的内容,其余删除/etc/security/failedlogin 记录用户失败的登录信息,是二进制文件,用who 命令来阅读其内容 可根据需要保留60天中有用的内容,其余删除/var/adm/sulog 用户使用su 命令的日志 可根据需要保留60天中有用的内容,其余删除/var/adm/cron/log cron的日志 可截短/var/tmp/snmpd.log snmp 监控进程日志 可截短/var/tmp/dpid.log/var/tmp/dpid2.log/var/tmp/hostmidb.log/var/tmp/muxatmd snmp 子系统日志 可截短dead.letter 未成功的邮件 可删除trcfile trace 实用程序的输出 可删除/var/adm/messages 用于记录syslog进程的日志 可适当保留最后1000行,或删除/etc/shutdown.log 系统关机过程日志,用shutdown -l 命令产生 可适当保留最后1000行,或删除如何自动杀死UNIX僵死的进程作者:曹苏华人保系统的计算机应用,已从单机运行方式过渡到以公司为中心的集中处理方式,各县级支公司通过广域网、远程telnet登录到市公司主机。由于网络的原因,有些进程会突然僵死。这些僵死的进程,会消耗系统大量的资源,直接影响机器的正常运行。为了实时地、自动地杀死这些僵死的进程,本人编写了 Shell程序Autokill。Autokill程序脚本# autokill#ps -ef | awk print $1,$2,$7,$8 | awk /0-90-9:0-90-9:1-90-9/ print $1,$2,$3,$4 | awk !/root/ print kill -9 $2 /tmp/k_killchmod 777 /tmp/k_kill/tmp/k_killAutokill程序解释首先,用UNIX 命令 ps -ef 查看进程状态,通过管道传送给 awk 进行处理。在第一个 awk 中,获取进程的用户标识(UID)、进程号(PID)、进程占用CPU时间(Time)、进程执行命令(CMD)四个字段的值。在第二个awk 中,通过模式匹配,选取所有匹配模式的行。在awk 中,0-9匹配09中任一个数字,1-9匹配19中任何一个数字,连用两个0-90-9则匹配一个任意两位数,因此0-90- 9:0-90-9:1-90-9则匹配 Time时间字段值,查找占用 CPU 时间超过 10 秒的进程;如果要查找占用 CPU 时间超过半小时的进程,则把模式改成 0-90-9:3-90-9:0-90-9。在第三个 awk 中,用 “!/root/ ”过滤掉由 Root用户生成的进程,并进行Shell语言拼装,并将最终结果定向到文件 /tmp/k_kill。在 /tmp/k_kill 文件中,都是形如 kill -9 123 的Shell命令。在Autokill程序的最后,执行 /tmp/k_kill 杀死进程。查看中间结果Autokill程序采用了管道处理方式,如要查看中间结果,则可以依次断开管道。第一步执行:ps -ef第二步执行:ps -ef | awk print $1,$2,$7,$8 第三步执行:ps -ef | awk print $1,$2,$7,$8 | awk /0-90-9:0-90-9:1-90-9/ print $1,$2,$3,$4 第四步执行:ps -ef | awk print $1,$2,$7,$8 | awk /0-90-9:0-90-9:1-90-9/ print $1,$2,$3,$4 | awk !/root/ print kill -9 $2 /tmp/k_kill最终查看 /tmp/k_kill 文件。再有,如只想自动杀死由某一用户执行的进程(如jdc3206),只要将模式“!/root/”改成 “/jdc3206/”即可;如只想杀死执行某一命令的进程(如 xinmu ),只要将模式“!/root/” 改成“/xinmu/”即可。最后用 crontab -e 增加一个 cron 作业。0,30 * * * * /tmp/autokillKill命令失灵怎么办经过以上步骤

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论