版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、甲类优选#江西建行江西建行IBMIBM小型机日常维护小型机日常维护第一篇:日常维护部分第一篇:日常维护部分第二篇:故障处理部分第二篇:故障处理部分第三篇:安图特公司技术支持电话第三篇:安图特公司技术支持电话甲类优选#第一篇日常维护部分目录第1章AIX系统管理日常工作(检查篇).11.1常用的命令.11.2语法介绍.11.2.1vmstat:检查内存、CPU、进程状态.11.2.2sar:检查CPU、IO.21.2.3PS:检查进程状态命令.31.2.4svmon:显示进程占用内存.31.2.5iostat:显示磁盘IO.41.2.6netstat,entstat:显示网卡信息.41.2.7no
2、:显示tcpip参数设置.51.2.8其它命令.5第2章AIX系统管理日常工作(LV篇).62.1IBMAIX系统管理的日常工作.62.1.1开关机步骤.62.1.2用户组及用户管理.62.1.3文件系统维护.62.1.4系统日常管理.72.1.5系统备份.72.1.6定时清洗磁带机.72.1.7定时检查设备指示灯状态.72.1.8简单故障的判断.72.1.9熟悉ibmaix操作系统.72.2关于IBMAIX的逻辑卷管理.72.3LVM命令.8第3章AIX系统管理日常工作(关键参数检查篇).103.1AIO参数检查.103.2磁盘阵列QUEUE_DEPTH参数检查.113.3用户参数检查.11
3、甲类优选#3.4激活SSAFAST-WRITECACHE.123.5IO参数设置.123.6SYNCDDAEMON的数据刷新频率.123.7检查系统硬盘的镜像.12第4章AIX系统管理日常工作(性能分析篇).134.1性能瓶颈定义.134.2性能范围.14第5章AIX系统管理日常工作(SHUTDOWN篇).145.1概念.145.2关机命令.14第6章AIX系统管理日常工作(备份与恢复篇).156.1用SMIT备份.156.2手工备份.156.3恢复系统.15第7章HACMP的双机系统的管理和维护.157.1HACMP双机系统的启动.157.2HACMP双机系统的关闭.167.3察看双机系统的
4、当前状态.167.4HACMP环境下的排错.177.4.1了解问题的存在.177.4.2判断问题的出处.18甲类优选#第第11章章AIXAIX系统管理日常工作系统管理日常工作(检查篇检查篇)1.1常用的命令CPUMemoryDiskNetwork标准标准UNIX命令(包命令(包括括HP、SUN等)等)vmstat,sar,psvmstat,psiostat,sar,vmstat,netstat,nfsstatAIX详细输出详细输出Tprofsvmon,rmssfilemon,fileplaceentstatAIX非常详细输出非常详细输出syscalls,trace,emstattracetra
5、cetrace,iptrace分析工具分析工具topastopastopasTopas1.2语法介绍1.2.1vmstat:检查内存、CPU、进程状态#vmstat115kthrmemorypagefaultscpu-rbavmfrerepipofrsrcyinsycsussyidwa1028132812770000001323756765134020281328127700000012733813199000202813281277000000132316131990002028132812770000001203171269900020281328127700000014631612799
6、000甲类优选#20281328127700000013031712599000202813281277000000135316127990002028132812770000001293171249900020281328127700000013330412799000r:正在运行的进程b:被阻挡的进程avm:活动的虚内存,单位4kbfre:自由列表,位4kbpo:页换出pi:页换入sy:系统占用CPUid:空闲CPUwa:等待的CPU1.2.2sar:检查CPU、IO例如:sar-u130sar-PALL110语法:sar-abckmqruvwyAintevalrepetition-bbu
7、ffer活动-c系统调用-k内核进程统计.-m消息及信号量活动甲类优选#-q正在运行的队列数及等待队列数-r页交换统计-uCPU利用-PCPU负载.1.2.3PS:检查进程状态命令ps:显示当前SHELL重所有进程ps-ef:显示系统中所有进程,f显示更详细信息ps-uoracle:显示oracle用户进程psemoTHREAD:显示线程信息psau;psvg:按使用时间显示进程(最近一次调用)psaux:按使用时间显示进程(进程启动)1.2.4svmon:显示进程占用内存svmonG:显示系统占用内存svmon-Ccommand_name:显示某个用户进程占用内存svmon-Ppid显示某个
8、进程占用内存甲类优选#svmonS:显示段占用内存1.2.5iostat:显示磁盘IOtty:tintoutavg-cpu:%user%sys%idle%iowait0.04.00.91.395.42.5Disks:%tm_actKbpstpsKb_readKb_wrtnhdisk058.4218.341.2172920hdisk116.885.621.44280hdisk250.6223.955.6110020hdisk316.885.621.44280hdisk40.00.00.000hdisk543.4279.169.813960hdisk60.00.00.000hdisk716.427
9、.220.20136hdisk80.00.00.000hdisk99.4156.011.40780hdisk1016.427.220.20136cd00.00.00.0001.2.6netstat,entstat:显示网卡信息netstaten0:显示en0信息netstats:甲类优选#显示网络信息netstat-m显示网络stat-i显示网卡状态netstat-Ien01显示eno网卡塞(1秒间隔)1.2.7no:显示tcpip参数设置noa:显示tcpip所有参数当前设置no-otcp_keepalivetime=7200000设置tcp_keepalivetime等于3600000秒n
10、od恢复默认值注:该方法在重启后失效1.2.8其它命令检查文件系统df-k检查设备lsdev-C检查物理卷lspv检查交换区lsps-a检查配置lscfg-vp检查软件lslpp-l甲类优选#检查用户who第第22章章AIXAIX系统管理日常工作系统管理日常工作(LV(LV篇篇)2.1IBMAIX系统管理的日常工作系统管理员对小型机系统的正确管理是系统稳定运行的保障,作为系统管理员应注意以下几个方面:2.1.1开关机步骤在系统管理员控制下进行正确的操作。(第5章有专门介绍)2.1.2用户组及用户管理2.1.3文件系统维护发现文件系统已满,应及时删除无用文件或扩大文件系统。查看文件系统使用率命令
11、:dfk,查看%Used和%IusedFilesystem1024-blocksFree%UsedIused%IusedMountedon/dev/hd4327682018039%207013%/dev/hd22293760123098447%330456%/usr/dev/hd9var327681583252%3675%/var/dev/hd3327682330029%1102%/tmp/dev/hd132768313845%721%/home/dev/informixlv52428819906063%35213%/home/informix注意系统文件系统中的/var/tmp使用率不要超过
12、90甲类优选#2.1.4系统日常管理系统管理员最好用smit来进行系统管理。Smit是以菜单方式工作的工具包,它包括了日常管理工作的所有命令,操作简便。2.1.5系统备份备份是保护用户数据不丢失的重要手段。一般系统备份的要求如下:A.每一台机器的操作系统至少有一个全备份。B.每天备份用户数据。C.操作系统配置修改后重新备份操作系统。(系统备份方法在第六章专门介绍)2.1.6定时清洗磁带机可以每月定时清洗一次,将清洗带插入磁带机,清洗完毕后会自动退出磁带。当磁带机需要清洗时,磁带机左边第一个起绿色指示灯会亮。2.1.7定时检查设备指示灯状态RS6000小型机出现硬件故障时,系统前面板上会亮一个橙
13、色的告警灯。液晶面板上面会有显示错误代码2.1.8简单故障的判断详细信息见“第二部分:故障处理指导书”2.1.9熟悉ibmaix操作系统2.2关于IBMAIX的逻辑卷管理IBMAIX存储管理的五个基本概念:甲类优选#物理卷PhysicalVolume,称为PV:指物理上硬盘,一个硬盘就是一个PV,名字为HDISK0、HDISK1。物理分区(PhysicalPartitions):物理卷被划分成大小一样的物理分区PPs逻辑卷组LogicalVolumeGroup,称为VG:一个VG包含整数个PV,可理解为一个大硬盘。逻辑卷LogicalVolume,称为LV:相当于对大硬盘进行逻辑分区,一个VG
14、里可有若干个LV,对用户讲,LV上的数据是连续的,但PV上的数据可能是分散的。逻辑分区(LogicalPartitions):每个LV有若干逻辑分区(LPs)组成,每个逻辑分区至少有一个PV组成。文件系统FileSystem:在逻辑卷的基础上,可建立文件系统JFS,然后MOUNT到一个目录下,这样就可以文件存取的方式来使用这块硬盘了。当然,您也可以不建文件系统,而直接把LV当作裸设备,以TRUNK方式来存取数据,许多数据库都是用这种方式存取数据。LVM的关系如下图:Terms-SummaryTerms-SummaryVolumeGroupLV1LV2LV2LV1LV2LV1LV2PVPhysi
15、calVolumes(disks)LogicalView=VGwithmanyLVscontainingPPsfromparticularPVsLV2PPPhysicalPartition(smallestchunkofdisktypically8,16or32MB)LV-LogicalVolume(oldUNIXpartition)甲类优选#2.3LVM命令一般采用smit命令可对PV、VG、LV、JFS等进行图形化管理,命令如下:smitlvm屏幕显示如下:AddaLogicalVolumeLogicalvolumeNAMEscratch*VOLUMEGROUPnametestvg*Num
16、berofLOGICALPARTITIONS64#PHYSICALVOLUMEnameshdisk1hdisk2hdisk3+LogicalvolumeTYPEjfsPOSITIONonphysicalvolumemiddle+RANGEofphysicalvolumesminimum+MAXIMUMNUMBERofPHYSICALVOLUMES#touseforallocationNumberofCOPIESofeachlogical2+partitionMirrorWriteConsistency?yes+Allocateeachlogicalpartitioncopyyes+onaSEP
17、ARATEphysicalvolume?RELOCATEthelogicalvolumeduringyes+reorganization?LogicalvolumeLABELMAXIMUMNUMBERofLOGICALPARTITIONS512#EnableBADBLOCKrelocation?yes+SCHEDULINGPOLICYforreading/writingparallel+logicalpartitioncopies甲类优选#EnableWRITEVERIFY?no+FilecontainingALLOCATIONMAPStripeSize?64K行命令:.lsvg:查看vg名字
18、查看vg详细信息:lsvg查看vg内的LVs:lsvg-l查看vg内的PV:lsvg-p查看激活的VG:lsvgo.lspv:查看物理卷组pg名字查看PV详细信息:lspvhdiskN查看PV内的LVslspv-lhdiskN查看PV内的PP:lspv-phdiskN.lslv:查看LV的信息查看LV名字:lsvg-l查看LV详细信息:lslv查看PV内的LVs:lslv-l查看PV内的PP:lslv-p查看镜像的LV:lslv-m第第33章章AIXAIX系统管理日常工作系统管理日常工作(关键参数检查篇关键参数检查篇)3.1AIO参数检查#lsattr-Elaio0甲类优选#minserver
19、sXMINIMUMnumberofserversTruemaxservers80MAXIMUMnumberofserversTruemaxreqs4096MaximumnumberofREQUESTSTruekprocprio39ServerPRIORITYTrueautoconfigavailableSTATEtobeconfiguredatsystemrestartTruefastpathenableStateoffastpathTrueMaxServers=10*numberofdisksMinServers=MaxServers/2其中MaxServers最大为80可用命令#smitt
20、yaioChange/ShowCharacteristicsofAsynchronousI/O修改相应的值。3.2磁盘阵列queue_depth参数检查假设DATAVG的RAID盘为hdisk2#lsattr-Elhdisk2pvid00019081a0dc91ea0000000000000000PhysicalvolumeidentifierFalqueue_depth8QueuedepthTruequeue_depth值设置为7133硬盘个数可用命令#chdevlhdisk2aqueue_depth=x修改,但VG必须为VARYOFF状态。3.3用户参数检查#smittychlicense
21、修改MaximumnumberofFIXEDlicenses为10#lsattr-Elsys0|grepmaxuproc甲类优选#maxuproc200MaximumnumberofPROCESSESallowedperuserTrue用#smittychgsys修改利用lsattr-Elsys0检查maxuproc,minpout,maxpout等参数的大小。maxuproc为每个用户的最大进程数,当应用涉及大量的顺序读写而影响前台程序响应时间时,可考虑将maxpout设为33,minpout设为16,利用smittychgsys来设置。3.4激活SSAFast-WriteCache利用sm
22、ittyssafastw来激活每一个逻辑盘hdiskn的Fast-WriteCache:选择硬盘后,把EnableFast-Write一项改为Yes后回车即可。对于OPS必须关闭,对于GAILOVER或单机必须打开。3.5IO参数设置HighwatermarkforpendingwriteI/Osperfile(maxpout)和LowwatermarkforpendingwriteI/Osperfile它们缺省值为0,在双机环境中一般应设Highwatermark为33,Lowwatermark为24,这两个参数可用smittychgsys来设置。3.6syncddaemon的数据刷新频率该
23、值表示刷新内存数据到硬盘的频率,缺省为60,一般可改为20,也可根据实际情况更改。该参数通过vi/sbin/rc.boot更改,其中一行如下:nohup/usr/sbin/syncd60/dev/null2T临时;U未知永久性的错误应引起重视C分类:H硬件;S软件;O用户;U未知#errpt-dH列出所有硬件出错信息#errpt-dS列出所有软件出错信息#errpt-ajERROR_ID列出详细出错信息#errpt-aj0502f666-ERROR_ID用大小写均可例LABEL:SCSI_ERR1ID:0502F666Date/Time:Jun1922:29:51SequenceNumber:
24、95MachineID:123456789012NodeID:host1Class:HType:PERMResourceName:scsi0ResourceClass:adapterResourceType:hscsiLocation:00-08甲类优选#VPD:选高级诊断AdvanceDiagnostic)选问题诊断ProblemDetermination)或选系统检查SystemVerification)(选PD会对系统错误记录进行分析)diag运行后会给出SRN代码故障设备名称及百分比地址代码等对于PCI机型应在系统报错7天之内运行diag程序对出错记录里的sense数据进行分析2.7其
25、他用于收集系统信息的命令lsdev-C系统设备信息#lsdev-Ccdiskhdisk0Available00-06-00-2,045GB16BitSCSIDiskDrivehdisk1Available00-06-00-1,045GB16BitSCSIDiskDrivehdisk2Defined00-06-00-4,016BitSCSIDiskDrivelspv查看物理卷信息#lspvhdisk00007821160af3d76rootvghdisk1000782117f571294rootvghdisk20000000045c45bdedatavglsvg查看卷组信息甲类优选#lsvgda
26、tavgVOLUMEGROUP:datavgVGIDENTIFIER:0000000055e2458bVGSTATE:activePPSIZE:4megabyte(s)VGPERMISSION:read/writeTOTALPPs:2169(8676megabytMAXLVs:256FREEPPs:1(4megabytes)LVs:3USEDPPs:2168(8672megabytOPENLVs:2QUORUM:2TOTALPVs:1VGDESCRIPTORS:2STALEPVs:0STALEPPs:0ACTIVEPVs:1AUTOON:yesMAXPPsperPV:2032MAXPVs:16
27、#lsvg-lrootvgrootvg:LVNAMETYPELPsPPsPVsLVSTATEMOUNTPOINThd5boot111closed/syncdN/Alv00jfs511021closed/stale/ibmcxxlv01jfs111open/syncd/cics_regionslv02jfs441open/syncd/var/mqmlslpp查看文件组信息#lslpp-L|grep23100020devicespci23100020rte4327CIBMPCI10/100EthernetAdapt看某个文件组是否已安装如以太网卡驱动也用于查询补丁程序的版本lsattr查看设备参数
28、设置#lsattr-Elent2busio0 x7fffc00BusI/OaddressFalse甲类优选#busintr9BusinterruptlevelFalseintr_priority3InterruptpriorityFalsetx_que_size512TRANSMITqueuesizeTruerx_que_size256RECEIVEqueuesizeTruerxbuf_pool_size384RECEIVEbufferpoolsizeTruemedia_speed10_Half_DuplexMediaSpeedTrueuse_alt_addrnoEnableALTERNATE
29、ETHERNETaddressTruealt_addr0 x000000000000ALTERNATEETHERNETaddressTrueip_gap96Inter-PacketGapTruelscfg查看VPD信息VirtualProductData)#lscfg-vlssa1DEVICELOCATIONDESCRIPTIONssa130-68IBMSSAEnhancedRAIDAdapter(14104500)PartNumber097H0645FRUNumber097H0645-备件号SerialNumberC8217227ECLevel0000F20825ManufacturerIB
30、M053ROSLevelandID7201-微码版本LoadableMicrocodeLevel04DeviceDriverLevel00DisplayableMessageSSA-ADAPTERDeviceSpecific(Z0)DRAM=032DeviceSpecific(Z1)CACHE=0DeviceSpecific(Z2)000000062955dab2DeviceSpecific(YL)P2-I7AccessaRootVolumeGroupAccessthisvolumegroupandstartashellbeforemountingthefilesystems格式化文件系统日志
31、(jfslog)#/usr/sbin/logform/dev/hd8检查修复文件系统#fsck-y/dev/hd1/home文件系统#fsck-y/dev/hd2/usr文件系统#fsck-y/dev/hd3/tmp文件系统#fsck-y/dev/hd4/文件系统#fsck-y/dev/hd9var/var文件系统用exit命令退出文件系统会自动mount起来重建bootimage#lslvmhd5找出bootimage所在的硬盘如hdisk0#bosbootad/dev/hdisk0#bootlistmnormal/dev/hdisk0重建启动顺序表重启动系统#shutdown-Fr如上述步
32、骤不奏效用系统备份带恢复系统甲类优选#如备份带不能恢复用诊断光盘DiagnosticCDROM检查是否坏硬盘3.5CDE图形界面挂死CDE运行时不要更改网络参数如主机名和IP地址更改网卡设置请先退出CDE图形环境选择命令行方式登录在字符界面下更改如CDE已经挂死远程telnet登录找出所有dt有关的进程用kill命令杀掉#ps-ef|grepdt#killPID检查当前主机名#hostnametscf50查看主机名是否对应有效的IP地址#netstat-i|greptscf50tr0*1500918540tscf5050604902824700更改主机名或IP地址使主机名与当前有效的IP地址存
33、在对应关系#smittytcpip重新启动CDE界面#/etc/rcdtHACMP环境下可把主机名alias到127001上#cat/etc/hosts127001_loopbacklocalhosttscf50#loopback(lo0)name/addressbvg3.6系统dump发生在系统崩溃时AIX会做dump(系统内存的快照)甲类优选#此时机器会显示闪动的888102xxx0cx代码0c9系统dump进行中0c9状态可能会维持超过2分钟不要关电和按reset,等待dump做完0c0dump成功完成这时可以断电重起0c2手动启动dump功能0c4dump设备空间不足只有部分信息保存下
34、来0c5不明原因导致dump失败一般dump是由于软件出错引起(888-102-207除外)机器通常可以重启重启时可能提示用户插入磁带拷贝dump文件不要选择退出这样会丢失重要的故障信息dump的有关设置估算系统dump的大小在系统最繁忙时内存使用最多#sysdumpdev-e0453-041Estimateddumpsizeinbytes:53477376#lsps-aPageSpacePhysicalVolumeVolumeGroupSize%UsedActivepaging00hdisk0rootvg480MB1yeshd6hdisk1rootvg544MB1yes当前的设置#sysdu
35、mpdev-lprimary/dev/hd6-dump的主设备secondary/dev/sysdumpnullcopydirectory/var/adm/ras1%ping自己网卡地址(ip地址)ping其它机器地址如不通在其机器上用diag检测网卡是否有问题在同一网中subnetmask应一致7.2网络配置的基本方法(1)如需修改网络地址主机名等一定要用chdev命令#chdev-linet0ahostname=myhost#chdevlen0anetaddr=9324058anetmask=2552552550_(2)查看网卡状态#lsdevCcif(3)确认网络地址#ifconfige
36、n0(4)启动网卡#ifconfigen0up(5)_配置路由有两种方式加入路由甲类优选#永久路由#chdevlinet0-aroute=_104700_,_9324059_临时路由#routeadd1047129324059用命令netstat-rn查看路由表第第88章章HACMPHACMP环境下的排错环境下的排错在一般情况下,HACMP软件很少需要手工干预,但一旦有问题发生,诊断和恢复的技巧是很重要的需要能很快地断定问题然后运用你对HACMP的理解来恢复HACMP的正常运作一般地,HACMP环境下的排错包括:了解问题的存在判断问题的出处解决问题8.1了解问题的存在您可以通过以下途径了解到一
37、个CLUSTER环境下出现了问题最终用户的投诉,他们无法访问应用程序控制台上出现一些HACMP的信息应用服务无法访问最终用户的抱怨通常预示CLUSTER出现了问题他们无法正常执行应用或是无法登录到系统我们必须采集到详细的信息以判断到底那里出现了问题是否有错误的信息提示?如果可能的话,让用户重复步骤以确定那里是错误的开始您也可以在自己的系统上重复要知道用户应用不可用并不代表HACMP有问题问题可能出现在应用程序本身或是它的启动或终止脚本出现了问题因此应用程序本身的排错也应是HA排错的一部分2控制台上出现一些HACMP的信息在HACMP启动,终止或出错时,控制台上会出现一些HACMP的信息,同时也会写入相应的文件中甲类优选#8.2判断问题的出处当错误出现时,我们应尝试发现
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 施工方案制定审批程序(3篇)
- 水果话题活动方案策划(3篇)
- 泵站浆砌砖施工方案(3篇)
- 清理垃圾杂物施工方案(3篇)
- 电解钢板隔断施工方案(3篇)
- 礼堂婚礼活动方案策划(3篇)
- 米多实体营销方案(3篇)
- 英超抽奖活动方案策划(3篇)
- 装修施工方案简单文库(3篇)
- 跨年鱼竿活动策划方案(3篇)
- 2026年辽宁省铁岭市部分学校中考二模九年级历史试卷(含答案)
- 场地回填石渣施工方案(3篇)
- 2026年一级注册建筑师之建筑材料与构造模考模拟试题一套附答案详解
- 2026年危险废物突发事故应急演练方案
- 2026年北京市昌平区高三二模英语试卷(含答案)
- 2026年大学生志愿服务西部计划题库
- 2026年禁毒人员笔试试题及答案
- 人教版七年级数学下册93一元一次不等式组应用题课件(25张)
- 湖北省鄂州市2025-2026学年九年级下学期4月份中考模拟练习语文试题(含答案)
- 2026八年级劳动国家质量监测考试卷含答案
- 第19课《登勃朗峰》课件 统编版语文八年级下册
评论
0/150
提交评论