B小型机日常维护手册_第1页
B小型机日常维护手册_第2页
B小型机日常维护手册_第3页
B小型机日常维护手册_第4页
B小型机日常维护手册_第5页
全文预览已结束

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、IBM P750小型机日常维护手册 服务器硬件运行状态检查1 .当服务器处于启动和正常工作状态时,其前面板上的状态灯(与电源灯并排)和各 硬盘的状态灯(一排小灯,与各硬盘位置一一对应)应显示为绿色。2 .当服务器的状态灯出现 橙黄色时,说明有硬件告警,此时要检查访器的电源、接 线、硬盘等。如果有硬件故障则需要立即进行更换和更正,如果查不出具体问题, 则需要联系相关专家进一步诊断。3 .当硬盘工作正常时,与各硬盘对应的硬盘灯会呈绿色,如无读写,则绿灯一直亮, 如该硬盘有读写操作,则绿灯会不规则闪烁,当硬盘损坏时,则硬盘状态灯将熄灭, 或者呈闪烁状态:以13秒的频率有规律地、不停地闪烁。如果发现有

2、服务器硬件状态灯不正常的情况,请及时联系我公司工程师,以便及时进 行诊断并解决故障。HMC硬件管理平台)管理与操作HMC勺两种访问途径:1、在机房直接通过显示器和键盘进行管理维护等相关操作2、通过web远程访问,登录HMC wel理界面,访问地址为:1、登录HMC浏览器访问连接HM(J,首页界面如下图所示。点击下图所示链接,进入 HMC佥证登录界面。输入用户名与口令,登录HMC用户名:hscroot口令:成功登录到HMCT理界面如下图所示。2、注销HMC在 HMC console 右上角有(hscroot | help | log off)链接,单击 log off ,会出现如下图所示注销界面

3、:选才? Log off ,系统返回到HMC5J始登录界面状态。3、重启HMC左边导航栏中选择 ? HMC Management ? shut down or Restart ,如下图所示, 对HMCS行正常重启及关机操作。请谨慎对HMCS行关机和重启操作!4、状态栏功能状态栏位于HMC&下角位置,如下图所示,负责监S并反映管理系统资源状态和HMC状态。单击每个图标状态可以列出详细状态,你可以查到更详细的帮助信息: :非法操作,如果任何被管理的主机执行了非法操作,这个图标将会变亮!:黄灯警告,如果任何被管理的主机有错误并有黄灯被点亮,这个图标也将会变亮IS:报错日志:日志中有报错信息,这个图标

4、将会变亮,此项与匕:摘要,摘要中会将有用信息做统计并显示在工作栏中。5、 Service Management导航栏中Service Managemen跟大的管理功能给用户日常维护提供了更简单直观的界 面,如下图所示,但日平时最常用的子项是 ManageServiceable Events ,如下图步骤可以对 HMCT管理 的设备进行日常错误及时直观的观察,以确保旧M小型机能正常工作,下图就是基本的操作方法图示:Service Management?Manage Serviceable Events6、 Service Plans-分区管理与操作如何查看小型机资源配置:如上图红色标注所示,选中

5、所需查看主机(备注:请不要同时选中多台主机及多个分区),在下拉菜单中选中“ Properties ”,打开参数窗口,通过“ Properties ”可以查看主机运行状态,CPU内存,I/0等重要硬件系统参数,如下图所示。同理,在分区区域中先中每分区后的 Properties选项,便可以直观方便的掌握分区状 态和资源配置信息。如何开关机及激活分区:关机。开机。Operation项中主要包含小型机及分区开关机,及消除报警灯这两项功能,如虽要对小 型机下电操作,请先将图15中的分区Deactivate (建议:最好在操作系统中按照正常 流程将操作系统shutdown),最后再将主机power off

6、 。注意:非特殊情况,无专业人员指导,严禁进行开关机操作!手动消除黄灯警告如下两图所示, Operations 中 LED status ,及 Deactivate Attention LED两项中所指,针对不同分区或主机所报出的警告黄灯,进行特定的消除黄灯操作。如何打开控制终端(Terminal Window )在HMCt对分区操作系统进行操作,可以通过分区下拉菜单Console Window-?OpenTerminal Window对选中分区进行操作,如图所示,操作界面如同 telnet界面。在HM。同一分区只允许打开一个 Terminal Window如试图打开第二个窗口,系统提 示如图

7、17所示界面。AIX系统日常维护1、查看系统的错误记录很重要,应该定期查看,如发现有硬件(HD类型的报错,应该及时关注。在系统运行时,一些系统错误会记录在 errlog 中,其中有些错误还会在终端上显示。检查错误日志可用以下命令:#errpt | more查看系统所有的记录IDENTIFIER TIMESTAM P T C RESOURCE_NAME DESCRIPTIONerrdemonERROR LOGGING TURNED ONerrdemonERROR LOGGING TURNED OFFclstrmgr OPERATOR NOTIFICATION其中IDENTIFIER为错误编号,当

8、需要检查详细信息时常会用到。TIME STAMPS时间标签,它记录的是出错时间,其格式:月月日日时时分分年年T为Type ,它记录的是错误类型P :为永久错误, T :为临时错误。引起注意C为Class,它记录的是错误种类,如H : HardwareS : SoftwareO : Errloger command messagesU : undeterminedRESOURCE_NAME错误来源DESCRIPTION 为错误描述#errpt -aj 查看系统详细记录内容其中IDENTIFIER为错误编号,如 #errpt -aj#errpt -dH查看系统所有的硬件出错记录2、日常检查服务器状

9、态的项目及其相关命令运行lsdev命令配以各种参数,#lsdev -C - H - S a#lsdev - Cc processor#lsdev - Cc memory#lsdev - Cc disk#lsdev -Cc adapter | grep ent#lsdev -Cc adapter | grep scsi#lsdev -Cc adapter | grep ssa所列各种设备状态都应为Available。列出系统中可用设备。列出系统中的所有CPU列出系统中的所有内存列出系统中的所有硬盘列出系统中的所有网卡列出系统中的所有列出系统中的所有SCSI 卡。SSA卡。lspv命令#lspv#

10、lspv hdiskn显示系统中可用的PM显示hdiskn的具体信息。#lsdev - Cc pdisk显示磁盘阵列的硬盘的具体信息。lsattr 命令# lsattr - E lsvg命令#lsvg#lsvg rootvg#lsvg - o-l mem0 列出系统中内存 mem0勺大小,列出系统中所有的vg0列出rootvg的详细信息。列出激活的vg本项目中内存有4GBoslevel#oslevelnetstat#netstat命令命令in显示操作系统版本信息。显示系统中各网卡的配置。可查看网卡的IP配置好了没有。diag命令 通过运行# diag trouble found“No命令运行硬

11、件诊断程序检测主机内所有硬件,检测结果为 ”显示各部分工作正常。lsps查看页面空间lsps -a查看PAGING SPACE使用情况,如果使用率超过 70%就需要采取措施。查看LV (卷)状态lsvg - o | lsvg - il | grep - i stale 查看有无stale 的Iv ,如果输入该命令之 后有输出结果,就需要采取措施查看mail# mail ,查看有否发给root用户的错误报告(mail)。3、检查文件系统查看有没有“满”的文件系统。文件系统满可导致系统不能正常工作,尤其是 AIX的 基本文件系统。如/ (根文件系统)满则会导致用户不能登录。# df -k (查看A

12、IX的基本文件系统)Filesystem 1024-blocks Free %Used Iused %Iused Mounted on/dev/hd4 245761452 95%2599 22% /dev/hd261440028068 96% 22967 15% /usr/dev/hd9var 8192/dev/hd3167936/dev/hd1163844540 45%64932%/var157968 6%891%/tmp5332 68%140235%/home除/usr文件系统,其他文件系统都不应太满,一般不超过80%4、性能监控与调优通过topas来观察topas能够将系统的全局信息,包

13、括 CPU内存、磁盘、网络、文件系统、事件队歹h 文件等信息,排列在一个统一的界面上进行展示。# topasTopas Monitor for host:localhostEVENTS/QUEUES FILE/TTYWed Feb 22 10:42:00 2017 Interval:2 Cswitch Syscall WritechCPU User% Kern% Wait% Idle%ReadsWritesTtyoutForksIgetsNetwork BPS I-Pkts O-Pkts B-In B-Out Execs Runqueue Dirblk WaitqueueDisk Busy%

14、BPS TPS B-Read B-Writ PAGING Real,MB Faults % CompFileSystem BPS TPS B-Read B-Writ Steals PgspIn % Client PgspOutName PID CPU% PgSp OwnerPageInSPACEPageOutSize,MBSios % UsedReadchRawinNameiMEMORY% NoncompPAGING% FreeNFS (calls/sec)SerV2 WPARActivCliV2 WPARTotalSerV3Press:h-helpCliV3q-quitSerV4通过命令 v

15、mstat 1 来观察 .kthr memory page faults cpur b avm fre re pi po fr sr cy in sy cs us sy id wa命令解析:vmstat命令的输出可以反映系统整体运行状况,包括cpu、内存、虚拟页面、系统进程和系统调用情况。检查CPU否为瓶颈,分别检查CPU勺四项数值和kthr的两项数值.检查ME皿否为瓶颈,分别检查Memory勺两项数值和Page的六项数值.通过命令sar - mu - P ALL来观察。命令解析:sar可以用来收集反映系统运行状况,在这里主要是查看CPU勺运行状况, CPia否负载均衡,是否存在分配不均的情况

16、。通过命令 ps gv | more 来观察。PID TTY STAT TIME PGIN SIZE RSS LIM TSIZ TRS %CPU %MEM COMMAND0- A 4:20 7 12 14516 xx 0 14504 swapper1- A 1:33 103 78952 79044 32768 25 36 /etc/init命令解析: ps 可以用来查看进程的当前状态。在这里通过参数的配搭,可以观察目前正在运行的进程所耗的时间,CPU和memory量.其中,CPUfe示进程所占用的CPUR源 情况,MEMI示进程所占用的内存情况。主要检查是否有标示为 的僵尸进程 耗用系统资源,以及informix 数据库的 oninit 进程的系统消耗情况。通过命令iostat 1- d hdiskX 观察磁盘在机器上用dd命令进行磁盘阵列的写操作校验,与此同时用 iostat 1- d hdiskX观察磁盘。Disks:% tm_act Kbps tps Kb_read Kb_wrtn命令解析 : iostat 可以用来查看系统的 I/O 的输入输出情况,在这里主要查看阵列上的硬盘的每秒读写量,同时估算磁盘阵列读写速度。通过命令netstat

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论