IBM-System-P日常管理和故障处理-KunMing-tele_第1页
IBM-System-P日常管理和故障处理-KunMing-tele_第2页
IBM-System-P日常管理和故障处理-KunMing-tele_第3页
IBM-System-P日常管理和故障处理-KunMing-tele_第4页
IBM-System-P日常管理和故障处理-KunMing-tele_第5页
已阅读5页,还剩58页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

IBMSystemP日常管理与故障处理IBMSystems内容提要系统健康检查HMC的使用ASMI的使用常用操作故障的处理IBM服务热线系统健康检查系统健康检查检查文件系统查看有没有“满”的文件系统。文件系统满可导致系统不能正常工作,尤其是AIX的基本文件系统。如/(根文件系统)满则会导致用户不能登录。#df-k (查看AIX的基本文件系统)Filesystem1024-blocksFree%UsedIused%IusedMountedon/dev/hd424576145295%259922%//dev/hd26144002806896%2296715%/usr/dev/hd9var8192454045%64932%/var/dev/hd31679361579686%891%/tmp/dev/hd116384533268%140235%/home系统健康检查除/usr文件系统,其他文件系统都不应太满,一般不超过80%。处理方法1:找出(删除)垃圾文件#du-sk*|sort–rn|head查找出当前目录下占空间最大的子目录,逐层往下直到找出占空间最大的文件。(要区分哪些目录是文件系统的mountpoint,哪些是文件系统的子目录)删除文件,释放空间。有时删除文件后空间并不马上释放,这是由于你删除的文件正被某个程序打开。只有当这个程序停止后空间才释放,有时甚至需要重起系统。系统健康检查处理方法2:增加文件系统大小#smittychjfs 文件系统可以在任何时候加大,前提是卷组(VG)中有剩余空间。检查文件系统的完整性#umountfilesystem_name#fsckfilesystem_name#fsck-yfilesystem_name注意:文件系统必须先umount,再做检查和修复,否则可导致未知的后果。系统健康检查查看卷组信息lsvg-lvg_name有没有"stale"状态的逻辑卷。用syncvg命令修复。#smittysyncvgLVNAMETYPELPsPPsPVsLVSTATEMOUNTPOINThd5boot122closed/syncdN/Ahd6paging48962open/syncdN/Apaging00paging32642open/syncdN/Ahd8jfslog122open/syncdN/Ahd4jfs122open/stale

/hd2jfs32642open/syncd/usrhd9varjfs5102open/syncd/varhd3jfs482open/syncd/tmphd1jfs122open/syncd/home系统健康检查检查内存交换区(pagingspace)使用率#lsps-s使用率不要超过70%。增加交换区,或增加内存。观察内存大小的命令:lsattr–Elmem0

#lsps-sTotalPagingSpacePercentUsed2048MB15%#lsps–aPageSpacePhysicalVolumeVolumeGroupSize%UsedActiveAutoTypehd6hdisk0rootvg2048MB15yesyeslvPaging00Paging01…系统健康检查网络检查netstat-i查看网卡状态Ierrs/Ipkts和Oerrs/Opkts是否>1%pinghost_name/IPAddress查看是否通和是否有丢包。路由表#netstat-rn查看路由表是否正确,ping各路由器是否通。核对主机名#hostname系统健康检查#ifconfig-aen0:flags=4e080863<UP,BROADCAST,NOTRAILERS,RUNNING,SIMPLEX,MULTICAST,GROUPRT,64BIT,PSEG>

inet172.40.10.31netmask0xffff0000broadcast172.40.255.255lo0:flags=e08084b<UP,BROADCAST,LOOPBACK,RUNNING,SIMPLEX,MULTICAST,GROUPRT,64BIT> inet127.0.0.1netmask0xff000000broadcast127.255.255.255 inet6::1/0系统健康检查#lsattr–Elinet0authm65536AuthenticationMethodsTruehostnameqtsmsHostNameTruegatewayGatewayTrueroutenet,,0,172.40.10.1RouteTruebootup_optionnoSerialOpticalNetworkInterfaceTruerout6FDDINetworkInterfaceTrueroute属性是否有相应的路由信息。格式为:net,,0,172.16.23.81如果没有缺省路由,执行命令:#chdev–linet0–aroute=0,172.16.23.81其中172.16.23.81为网关如果缺省路由不正确,则先删除路由,再增加缺省路由:#chdev–linet0–adelroute=net,,0,133.16.23.81#chdev–linet0–aroute=0,172.16.23.81系统健康检查检查dump设置#sysdumpdev–lprimary/dev/hd6secondary/dev/sysdumpnullcopydirectory/var/adm/rasforcedcopyflagTRUEalwaysallowdumpFALSEdumpcompressionOFF若不正确请用下列命令修改:#sysdumdev–P–p/dev/hd6–s/dev/sysdumpnull系统健康检查系统故障记录(errorlog)errdemon进程在系统启动时自动运行记录包括硬件、软件及其他操作信息故障记录文件为/var/adm/ras/errlog,可备份下来或拷贝到别的机器上分析errpt命令的使用(普通用户权限也可使用)系统健康检查系统健康检查系统健康检查系统健康检查发给root的mail信息#mail#mail–f;查看已经存起来的邮件#Ctrl+d;存盘退出,存在/var/spool/Mail目录下,每个用户一个文件#mhmail;将邮件另存至/Mail/inbox目录下,每个邮件一个文件

系统会定期将PD的结果以邮件形式发送给root,比errlog更详细准确。HMC的使用HardwareManagementConsole进行P系列小型机的硬件管理、维护,以及逻辑分区的划分等9119必须配置HMC对其进行管理9117如果需要划分逻辑分区,则必须配置HMCHMC通过TCP/IP与需要管理的主机进行连接HMC使用HMC使用–网络连接9119BPC(BulkPowerControllers)需要HMC为其分配IP地址。9119不支持静态地址的管理方式(9117570等低端产品支持静态IP)由HMC将网络拓扑信息通知给ServiceProcessors和BPCServiceProcessor连接到BPC的内部交换机上,通过这个交换机,连接到HMC上并获得IP地址HMC使用–操作界面HMC使用–操作界面ASMI的使用ASMI的使用AdvancedSystemManagementInterface硬件故障信息硬件设备信息硬件状态信息CUoD可以在任何时候访问(机器在PowerOff状态,或者Operating状态)类似P4机器的SP菜单ASMI的使用–连接方式HMCGUI使用硬件管理终端访问网页模式使用PC或笔记本,用网线连接到负责HMC和FSP通信的交换机、或者HUB上通过浏览器,输入FSP的IP地址即可访问ASMI串口模式使用串口线链接到串口,可访问字符界面ASMIASMI的使用–访问界面(Web)ASMI的使用–访问界面(Web)ASMI的使用–访问界面(Web)常用操作常用操作系统备份系统备份除每日进行正常的用户数据备份外,建议定期进行系统备份。备份前先停止业务系统软件和HACMP软件的运行。其他无关的用户退出,停止无关的操作。系统备份只备份ROOTVG,除系统基本的5个文件系统外,其他ROOTVG上已mount上的文件系统也会被备份。用smittymksysb命令进行系统备份,备份前先清掉root的密码。每当系统作变更(安装新软件、补丁程序等)前后,都需要做系统备份。常用操作系统备份

BackUptheSystemTypeorselectvaluesinentryfields.PressEnterAFTERmakingalldesiredchanges.[TOP][EntryFields]WARNING:Executionofthemksysbcommandwillresultinthelossofallmaterialpreviouslystoredontheselectedoutputmedium.Thiscommandbacksuponlyrootvgvolumegroup.*BackupDEVICEorFILE[/dev/rmt0]+/CreateMAPfiles?no+EXCLUDEfiles?no+Listfilesastheyarebackedup?no+Generatenew/image.datafile?yes+EXPAND/tmpifneeded?yes+Disablesoftwarepackingofbackup?no+[MORE...2]F1=HelpF2=RefreshF3=CancelF4=ListEsc+5=ResetEsc+6=CommandEsc+7=EditEsc+8=ImageEsc+9=ShellEsc+0=ExitEnter=Do常用操作系统备份检查系统备份带是否有效用备份带启动机器,但不要进行安装,我们只是验证系统备份带是否能用于启动。出现以下菜单后,关机即可。 WelcometoBaseOperatingSystem InstallationandMaintenanceTypethenumberofyourchoiceandpressEnter.>>> 1StartInstallationNowwithDefaultSettings 2Change/ShowInstallationSettingsandInstall 3StartMaintenanceModeforSystemRecovery88Help?99PreviousMenu常用操作系统备份#smittylsmksysb ; 检查系统备份带的内容。系统备份不是万能的。备份最好有两份。用户数据备份文件系统可用tar命令,切记不要使用绝对路径。数据库可用数据库的备份方式备。逻辑卷(LV)可用dd命令。smittysavevg用户卷组备份只备份mount起的文件系统。注意:不备份逻辑卷(裸设备)。常用操作系统备份磁带机卡带子时可尝试RESET磁带机。按住磁带机的弹出按钮15~30秒,直到磁带机液晶面板显示RESET。磁带RESET后磁带应能弹出。(此方法仅适用于8mm20GB磁带机)#diag-cdrmt0#tctl-f/dev/rmt0reset如果上述方法均不奏效,则只有重起机器。常用操作镜像镜像(rootvg)lspv,lsvg–lrootvg,lsvgrootvg,lsvg–prootvg,lslv–mlv_name,lsvg–Mrootvgextendvg–frootvghdisk1chvg–ay–Qnrootvgmirrorvg–Srootvghdisk0hdisk1bosboot–a–l/dev/hd5–d/dev/hdisk1bootlist–mnormalhdisk0hdisk1syncvg–vrootvg常用操作镜像拆镜像(rootvg)lsvg–Mrootvg;检查有效的pv,确认hdisk1坏unmirrorvgrootvghdisk1bosboot–a–d/dev/hdisk0bootlist–mnormalhdisk0cd0mkboot–c–d/dev/hdisk1sysdumpdev–l;检查dump所在的lv(缺省hd6)sysdumpdev–P–p/dev/hd6;reducevgrootvghdisk1rmdev–dlhdisk1shutdown-Fr常用操作HACMP的操作HACMP的操作 启动:smittyclstart 停止:smittyclstop启动/停止过程可以查看/tmp/hacmp.out文件:#tail–f/tmp/hacmp.out检查Cluster是否运行正常Cluster进程是否运行:#lssrc–gcluster,至少两个进程,且为active。IP地址是否获取:#netstat–i,看bootIP是否变为serviceip。VG是否varyon:#lsvg–o文件系统是否mount:#mount应用进程是否启动:#ps–ef|grepapp_name常用操作HACMP的操作HACMP相关日志/usr/adm/cluster.log;以事件为单位的纪录/tmp/hacmp.out;详细记录/usr/sbin/cluster/history/cluster.mmdd;

历史纪录AdministrationGuideConceptsandFacilitiesGuideHACMPTroubleshootingGuidePlanningandInstallationGuide以上文档可以在随机所带的光盘上找到常用操作HACMP参考文档常用操作dump设置dump的有关设置估算系统dump的大小,在系统最

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论