服务器常规维修与判断方法_第1页
服务器常规维修与判断方法_第2页
服务器常规维修与判断方法_第3页
服务器常规维修与判断方法_第4页
服务器常规维修与判断方法_第5页
已阅读5页,还剩7页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、服 务 器 故 障 排 除 方 法PC 作为服务器维修人员需要了解一些服务器故障恢复的基本知识does not work at al本文主要分三部分,第一部分讲的是服务器故障排除的基本原则性问题。第二部分讲述了一些服务器硬件故障排除的实例。第三部分讲述了一些服务器软件故障排除的实例第一部分 服务器故障排除的基本原则性问题一、服务器开机无显示应怎么办-火;零地电压?检查电源指示灯,如果亮,正常吗?按下电源开关时,键盘上指示灯亮吗?风扇全部转动吗?是否更换过显示器,更换另一台显示器。去掉增加内存去掉增加的CPU去掉增加的第三方I/O 卡检查内存和CPU 插的是否牢靠Clear CMOS更换主要备件

2、,如系统板,内存和CPU二、服务器故障排错的基本原则是什么尽量恢复系统缺省配置a:硬件配置:去除第三方厂商备件和非标配备件;b:资源配置:清除CMOS,恢复资源初始配置;c: BIOS,F/W,驱动程序:升级最新的BIOS,F/W 和相关驱动程序;d: TPL:扩展的第三方的I/O 卡属于该机型的硬件兼容列表(TPL)吗?从基本到复杂a:系统上从个体到网络:首先将存在故障的服务器独立运行,待测试正常后再接入网络运行,观察故障现象变化并处理。b:硬件上从最小系统到现实系统:指从可以运行的硬件开始逐步到现实系统为止。c: 软件上从基本系统到现实系统:指从基本操作系统开始逐步到现实系统为止。交换对比

3、a:在最大可能相同的条件下,交换操作简单效果明显的部件;b: 交换NOS 载体,既交换软件环境;c:交换硬件,既交换硬件环境;交换整机,既交换整体环境;三、服务器故障排除需要收集哪些信息? 服务器信息:机器型号2.(S/N: 如:NC00075534)Bios 版本 卡,内存,CPU, 阵列级别安装什么操作系统及版本(Winnt 4, Netware, Sco, 故障信息在POST时,屏幕显示的异常信息?报警声和BEEP CODESNOS?Events Log 文件确定故障类型和故障现象:开机无显示;上电自检阶段故障;安装阶段故障和现象;操作系统加载失败;系统运行阶段故障;第二部分 服务器硬件

4、故障处理几例硬件故障是指服务器硬件出现异常而导致的各类错误。由于服务器构成比较复杂,因4500 (如果遇到相似现象,也需要具体问题具体分析,不要盲目套用)4500256M 内存,使用一个PIII XEON 500 2M 高速缓存的处理器。开机后没有任何显示,但系统日志上提示了一条CPU 0 伏的信息,系统指示灯三灯不停在闪烁(指示灯三灯闪烁是服务器的另一种报警方式,我会在文后说明。这种错误一般是处理器电压调节模块CPU 出错或CPU 与CPU 板块接触不CPU 板块出错,这时情况就比较复杂了,必须经过认真慎重的思考。因CPU 板块在整个服务器中,占有举足轻重的地位,如果它出错服务器是会报致命错

5、误CPU 5%把CPU 调换在另一CPU CPU 板块坏。这时,取出CPU 仔细擦拭金手指,以及CPU 板块中与CPU 接触的地方后,开机依然无显示。相对处理器坏的情况来说处理器电压模块4500 中取下一个处理器电压模块,安装在此服务器中。开机后,服务器依然没有任何显示,系统日志上依然提示CPU 0 伏的信息,系统指示灯三灯依然不4500 中取下一个CPU 安装后,开机正常。总结:在服务器的维修中,线索都会显得扑朔迷离,一般来说不可能一次就可以准确地判断器出错后,必须一步一步解决,没有捷径可言。又如:4200 开机不显示,发现开机时系统日志没有任何信息,且系统指示灯不CTRL+M 不能检测到硬

6、盘。硬盘在别的服务器上是正常的,因此立即清除此服务器的 CMOS,但依然不正常。BIOSBIOS 后也不能解决问题。又检查硬盘笼子和I/O 板(输入输出板块)有问题。但就在这个时候,我发现在I/O 去除此网卡后服务器就一切正常。硬件故障并不单单指硬件有问题,它也指硬件之间不兼容。因为服务器的正常运作需用能发挥服务器性能的元件(上例中的旧式网卡即使正常也会严重影响服务器性能样才不会发生莫明其妙的故障。3200 4500 的网卡是采用的INTEL 82559 INTEL 82559 的网卡。过了几天,他打电话给我说,他的新网卡不能INTEL 82559 网INTEL 82559 网卡安装到机器要避

7、免硬件故障发生频率,服务器管理人员必须注意服务器的使用环境完全正常。比较重要的服务器必须在恒温、恒湿的环境;电压也要符合,不仅要采用 UPS,还必须接13程。工作人员必须严格执行操作流程。一般情况来说,服务器维修人员对于硬件故障只要有丰富的经验都能很快找出故障所在,如果不能解决就必须迅速与服务器的售后服务中心 8008108888 联系。第三部分 服务器常见软故障解决思路与实例服务器软件故障是在服务器故障中占有比例最高的部份,约占70%,解决的过程必须更加深思熟虑。导致服务器出现软件故障的原因有很多,最常见的是服务器BIOS 版本太低、服务器的管理软件或服务器的驱动程序有 BUG、应用程序有冲

8、突及人为造成的软件故障。下面分别举例说明各类软件故障的维修方法。3500 服务器,配置为双PIII 500 521K 高速缓存的CPU512M 内存。(VRoltage Module (VRM) over/under-voltage 2.88V/03500 VRM 错。就在一筹莫展的时候,维修工程师带来了最新的CPU 管理板(CPU Management Control)的固件(FIRMAR,于是升级了CPU管理板块的FIRMARE 后,服务器恢复立即正常。1) 用软盘启动计算机,然后插入firmware 软盘并运行上面的相关文件cabrill;2)系统刷新BM(主板控制器和HS(热插拔背板控

9、制器 3)(通常为2;4)(通常为; ) 如果回答有两个电源,系统询问服务器是否有辅助风扇即在第三个电(冗余电源的位置上 (通常为;6)然后系统询问是否重写BMC kerneluse area(通常为)然后系统询问是否输入一个asset tag;(通常为)7)最后系统询问在刷新后是否要重新启动系统(通常为。这种升级方法也适合刷新系统BIOS等,命令的参数不同以及更新 BIOS 明。任何一款服务器的 及BIOS 都会有不同的因为BUG 在所难免所以我们不能错误地认为服务器的BIOS 程序就很完善,而应该经常更新服务器的 及只是在升级之前应该小心谨慎错误的升级方法将会导致严重的果。BUG 第一时间

10、内开发出新的程序,客户只需要及时更新这些程序就可以避免这类故障。当服务器的软件故障为此类时,表现的现象也不尽相同。一般来说,管理程序 BUG 占用率变高,无法正常使用某些功能等;驱动程序的BUG 会WINDOWS NT4 为例,就首先在管理统速度变慢是正常的(特别是磁盘I/O 方面。服务器的维护人员就应该经常在服务器网站上下载最新的管理工具程序及驱动程序。这样会减少很大一部份软件故障的发生。敏锐的观察力。SQL SERVER N 次NT SQL SERVER 2000光盘引起了工程师的怀疑,工程师让他拿出了SQL SERVER安装,结果还是不行。在安装的过程中,没有出现丝毫错误,可就 Windata是用户自己编一切正常。对于此类软件故障,操作员最好先查看有关的日志,看看系统中是否有可疑的进程。SQL 除的重点就是结束可疑进程。还有一种软件故障

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论