服务器运维管理手册_第1页
服务器运维管理手册_第2页
服务器运维管理手册_第3页
服务器运维管理手册_第4页
服务器运维管理手册_第5页
已阅读5页,还剩2页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

XXXX有限公司

服务器运维管理手册

XXXX有限公司

运维服务部

2012/8/30

一、文档简介

本文档根据桑菲消费通信服务器硬件设备与系统应用管理需求,针对日常维护

内容进行技术归类于总结,描述具体操作步骤与操作方法,积累服务潜事件处

理能力,使之服务运维能力更为主动可控。

二、文档目的

标准服务器故障处理方法指引,服务器管理知识库积累。

三、文档范围

服务器硬件故障判断与标准处理操作

服务器系统日常性能检测与标准检测

四、事件处理流程

五、具体操作说明

1)服务器硬件管理

1.检查与故障判断:

服务器硬件的主动检查方式主要分三种:

设备面板指示灯检查

硬件系统日志检查

第三方工具检查

(一)面板指示灯检查

IBM服务器上面有,电源指示灯,硬盘/IDE设备活动指示灯,网卡指示灯,系统

过热报警灯.硬盘槽还有硬盘指示灯。HP服务器上面指示灯一般为UID,内部和

外部健康灯,其他就是电源网口灯了,DELL的机种有的上面有风扇,内

存,CPU,指示灯情况,图标都是很直观的,其它服务器与IBM,HP的差不多。

图示说明

详细描述:

(二)系统日志检查

检查内容|

硬件历史异常报错信息

计算机管理二〉系统工具->事件查看器,查看系统日志

重点关注:红色高危事件信息、日常频繁硬件报错信息二

备注:查看硬件历史异常故障情况,分析硬件性能与使用生命周期

(三)第三方检测工具检查

检查内容

硬件历史异常报错信息

HP诊断工具:

打开开始----程序----HPSystemTools---HPInsightDiagnosticsonline

EditionforWindows----IIPInsightDiagnosticsonlineEditionfor

Windowso

DELL诊断工具:

第三方硬件设备诊断工具

IBM诊断工具:

IBMSystemsDirector、IBMSystemsDirectorActiveEnergyManager、IBM

ServorGuido

相关图解:

进入诊断网页,在第一选项卡Survey中,上部有2个下拉项,左侧选择

Advanced,右侧选择All,会显示出更多硬件信息,点击右下的Save按钮保

存。

此界面可以看到服务器所有硬件信息。

2.硬件设备变更操作标准:

判断并确定最快恢复时间

判断是否有做冗余设置

判断是否需要关机操作

磁盘设备检测并确定阵列信息,确定有做数据备份

是否对其它关联应用有影响

制定问退方案,保证数据与应用的可.用性

设备变更操作

设备兼容性测试

应用系统运行测试

设备变更后正式应用

3.相关巡检记录单:

备注:《服务器信息列表》《服务器指示灯巡检表》

2)服务器系统管理

服务器系统管理主要分为:

Windows系统管理

Linux系统管理

1.Windows系统管理

L1.磁盘空间使用

计算机管理一一磁盘管理

磁盘空间使用率是否已经到达80%

1.2.进程监控

任务管理器-一进程

查看进程的CPU使用率和内存使用率是否超阀值

1.3.CPU性能

任务管理器一一性能

查看CPU最高峰值与一般使用率是否超阀值

L4.内存性能

任务管理器一一性能

查看内存最高峰值与一般使用率是否超阀值

存使用率是否超过70%

J:或者其他定义阀值,

1.5.网络查看

任务管理器一一联网

检查是否能正常访问站点页面

1.6.日志

记录错误报警信息

一应用程序日志

由应用程序或者系统程序记录的事件

一安全性日志

查看有效和无效的登录尝试事件,以及资源使用相关的事件

---系统日志

Windows系统组件记录的事件

2.Linux系统管理

L1.平均负载(uptime)

描述:

uptime命令过去只显示系统运行多久.现在,可以显示系统运行多久、当前有多少的用户登

录、在过去的1,5,15分钟里平均负载时多少。

1.2.磁盘空间使用率(df-h)

描述:

Filesystem文件系统Size文件系统容量Used文件系统已经使用的容量Use%文件系统

使用百分比Mountedon挂载的目录

1.3.进程监控(ps-efIgrepjava)

查看应用程序启动进程数是否正常

L4.内存监控(free—m)

描述:

total:总计物理内存的大小used:已使用多大free:可用有多少

shared:多个进程共享的内存总额buffers/cciched:磁盘缓存的大小。

第三行(-/+buffers/cached):

used:已使用多大。free:可用有多少.

1.5.CPU占用率(top)

描述:

top提供一个当前运行系统实时动态的视图,也就是正在运行进程。在默认情况下,CPU

使用率最高的任务排在第一行,并每5秒钟刷新一次。

1.6.I/O监控(vmstat210)

process:

-r:等待runtime的进程数・b:在不可打断的休眠状态下的进程数

memory:

-swpd:虚拟内存使用量(KB)-free:闲置内存使用量(KB)

-buff:被当做buffer使用的内存量(KB)

swap:

-si:swap到磁盘的内存量(KBps)-so:从磁盘swap出去的内存量(KBps)

10:

-bi:每秒读取的块数(blocks/s)-bo:每秒写入的块数(blocks/s)

系统:

in:每秒中断数,包括时钟中断cs:每秒上下文切换数。

CPU(以百分比表示):

us:用户进程执行时间(usertime)sy:系统进程执行时间(systemtime)

id:空闲时间(包括10等待时间)wa:等待10时间

1.7.日志系统

---系统日志(cat/var/1og/messages|grep'Jul23'Igreperror)

记录报警信息

-硬件启动日志(dmesg|greperror)

记录系统启动错误信息

一一应用系统日志

服务器各个应用的日志系统,比如:

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论