




已阅读5页,还剩44页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
2 Inspurgroup 服务器日常维护及常见故障排除方法 2 I 主要内容 故障维修注意事项常见故障处理及调试 2 I 故障维修注意事项 服务器故障排错的基本原则服务器硬件维护注意事项关于最小化和还原出厂配置 2 I 服务器故障排错的基本原则 1 尽量恢复系统缺省配置a 硬件配置 去除第三方厂商备件和非标配备件 b 资源配置 清除CMOS 恢复资源初始配置 c BIOS F W 驱动程序 升级最新的BIOS F W和相关驱动程序 d TPL 扩展的第三方的I O卡属于该机型的硬件兼容列表 TPL 吗 2 从基本到复杂a 系统上从个体到网络 首先将存在故障的服务器独立运行 待测试正常后再接入网络运行 观察故障现象变化并处理 b 硬件上从最小系统到现实系统 指从可以运行的硬件开始逐步到现实系统为止 c 软件上从基本系统到现实系统 指从基本操作系统开始逐步到现实系统为止 3 交换对比a 在最大可能相同的条件下 交换操作简单效果明显的部件 b 交换NOS载体 既交换软件环境 c 交换硬件 既交换硬件环境 d 交换整机 既交换整体环境 2 I 服务器硬件维护注意事项 只有合格的技术人员才可以对主板进行设置系统电源开关 系统前面板上的直流电源开关并不能关闭系统电源的交流输入 系统中尚有8mA的伺服电流 在设置之前 必须拔下系统交流电源电缆系统外界设备 必须拔下系统外接网线和Modem等外接设备 否则可能会对人员或设备造成意外伤害静电释放和静电释放保护措施 静电释放会对主板 硬盘 板卡和系统的其它部件造成损害 在您要对系统硬件进行设置时 最好在防静电环境下进行 一端接地 静电释放和板卡持拿 因为板卡上的芯片对静电特别敏感 持拿板卡必须小心 只能接触主板的边沿 当板卡暂时不用时 必须把它放回专用的防静电袋中 芯片朝上放在接地平台上机箱盖 为了系统正常散热和空气流通 在系统上电前一定要安装机箱盖 否则会对系统部件造成损害 机架式服务器要特别注意 2 I 硬件维修注意事项 确保在机箱和主板之间不存在短路把和主板相连接的线缆断掉 包括键盘和鼠标移走所有的外插板卡安装一颗CPU 确保安装牢固 连接机箱扬声器连线和电源指示灯LED连线到主板检查主板等部件的跳线设置是否正确 2 I 关于最小化和还原出厂配置 遇到复杂问题时 需要进行机器的最小化操作来进行问题定位 笼统的讲 最小化指单cpu 单内存或双内存 根据主板要求决定 主板 电源接显示器开机测试 其他的板卡 跳线等都去掉 但由于机型的差异 通过一些案例分析 我们真正做到最小化了么 还原到出厂配置要求保证原厂的部件 去掉用户自己扩配的部件 甚至要求bios版本的还原 2 I 排除非浪潮部件干扰非常重要 硬件故障并不单单指硬件有问题 它也指硬件之间不兼容 因为服务器的正常运作需要各部件之间的大力协调 建议大家在采购各元件时 都采用同一品牌原装的 并且要采用能发挥服务器性能的元件 上例中的旧式网卡即使正常也会严重影响服务器性能 这样才不会发生莫明其妙的故障 2 I 外设故障不可小看 这些外设部件往往是最容易被忽略的 但这些故障会被引起以下故障 蓝屏 切换器导致开机报错 键盘导致开机报警 鼠标线缆被老鼠咬了 键盘故障显示器 安装as4 6死机 安装其他系统没问题 必要时要替换测试 2 I 主要内容 故障维修注意事项常见故障处理及调试 2 I 常见故障处理及调试 硬盘相关故障开机无显机器不加电意外重启风扇故障前面板状态灯相关说明系统相关故障数据读写缓慢网络相关故障 2 I 硬盘相关故障 硬盘无法识别1 检测不到硬盘2 可检测到硬盘数量不正确开机自检硬盘报错检测到硬盘时报错 smarterror或diskI Oerror硬盘亮红灯阵列中硬盘频繁掉线 2 I 硬盘相关故障 硬盘检测问题 硬盘无法识别问题可从以下几个方面考虑1 重新拔插硬盘电源及数据线缆 注意是否有接触不良的问题 2 更换硬盘至原先可正常检测到的槽位 如果仍然检测不到则可能存在硬盘损坏故障 3 可检测到硬盘数量不正确实的情况要注意先确定bios中是否设置了正确的参数 然后再排除上述1 2问题 4 硬盘背板故障 5 磁盘控制器可能存在故障 2 I 硬盘相关故障 硬盘检测问题 Sata硬盘的识别问题更多表现在bios设置上 例如NF190 NF280G2 NF190Ebios中相关sata参数设置 2 I 硬盘相关故障 硬盘检测问题 例如NF190D NF280Dbios中相关sata参数设置 2 I NF190D NF280DESB2SATA 3种模式 Compatible AHCI HostRaid 2 I NF190D NF280DSATARAID 关于SATAHostRAID有如下限制 RAID 0Min2drives max4drives RAID 1Min2drives max2drives RAID 10Min4drives max4drives thesamelimitationwithSCSIHostRAID 2 I NF190D NF280DSATA CompatibleMode IDE0Mas IDE0Sla SATA0 SATA2orSATA1 SATA3 支持Windows Linux nodriverrequiredEnhanceIDEMode IDE0Mas IDE0Sla SATA0 SATA1 SATA2 SATA3 支持Windows nodriverrequiredEnhanceMode AHCIorRAIDenabled IDE0Mas IDE0Sla SATA0 SATA1 SATA2 SATA3 SATA4 SATA5 driverisrequired 2 I 硬盘相关故障 开机自检硬盘报错 检测到硬盘时报错 smarterror diskI Oerror或预期错误1 使用现有的硬盘控制器校验硬盘 2 出现此类报错时背板或主板也是故障原因但几率较小 2 I 磁盘相关故障 硬盘亮红灯 很多机器背板有硬盘故障检测功能 如硬盘亮红灯一般意味着硬盘掉线 背板检测到硬盘存在故障隐患 此时可以从raid卡配置界面中查看硬盘的状态 如果处于非掉线状态 需要安装对应的管理软件 从管理软件中查看是否有磁盘mediaerror 有一点需要强调 硬盘亮红灯并不一定意味着硬盘掉线 2 I 硬盘相关故障 硬盘掉线 对于硬盘频繁掉线的故障 首先校验硬盘是否有坏道 如确定有坏道建议立即更换而不是通过其他修正的方法经过校验确认硬盘没有坏道 但此硬盘频繁掉线 同样需要更换硬盘 然后依次考虑背板 主板或raid卡 数据线 终结器故障 2 I 常见故障处理及调试 硬盘相关故障开机无显机器不加电意外重启风扇故障前面板状态灯相关说明系统相关故障数据读写缓慢网络相关故障 2 I 开机无显的维护思路 ClearCMOS检查供电环境 零 火 零 地电压 检查电源指示灯 如果亮 正常吗 按下电源开关时 键盘上指示灯亮吗 风扇全部转动吗 是否更换过显示器 更换另一台显示器 去掉增加内存去掉增加的CPU去掉增加的第三方I O卡检查内存和CPU插的是否牢靠主板是否有显示屏蔽的跳线更换主要备件 如主板 内存和CPU 2 I 开机无显 清cmos NF190 NF280G2清cmos方法 用跳线帽将跳线2的b c短接 保持5秒钟 重启机器使设置生效 关掉机器 将跳线帽接回原先位置即可 2 I 开机无显 清cmos NF190D NF280D清cmos方法 用金属物体 如小螺丝刀 将JBT1的两个脚点短接即可 2 I 开机无显 内存最小化 单条内存插法 1 NF280G2 NF190单内存插在靠近主板边缘的A1或B1槽位2 NF190D NF280D单内存插在靠近主板内部的DIMM1A槽位上主板power开关跳线位置 NF280D NF190D 2 I 常见故障处理及调试 硬盘相关故障开机无显机器不加电意外重启风扇故障前面板状态灯相关说明系统相关故障数据读写缓慢网络相关故障 2 I 主机不加电 确定外插电源线是否正常 更换电源线测试清cmos 最小化拔插相关部件在确定外部电源没有问题的情况下 将电源单独取出 插上电源线后短接电源24针插座的绿 黑接口 看电源风扇是否转动来确认电源故障 台达的一些电源有空载保护机制 不能通过此方法进行测试 还有一些电源有节电功能 必须在电源内部温度达到一定阀值才启动风扇 如NP110D共享工程机器 所以也不能用此方法测试 更换主板测试 依照现场更换情况定位最终故障 2 I 常见故障处理及调试 硬盘相关故障开机无显机器不加电意外重启风扇故障前面板状态灯相关说明系统相关故障数据读写缓慢网络相关故障 2 I 意外重启 查看bios相关日志及系统日志考虑相关因素如果是蓝屏重启 可查看dump日志进行分析与系统有关 重装系统内存和主板是导致硬件蓝屏的主要原因 可对内存进行校验 或对内存进行最小化测试 2 I 关于系统蓝屏故障的分析 关于windbgDump文件的生成 及设置Windbg设置如何分析dump文件具体案例分析 2 I 关于windbg 什么是windbg微软在DDK和SDK中提供的一个调试工具 既能调试驱动程序也能调试应用程序 同时可以对系统进行调试 对于蓝屏后产生的dump文件也有很强大的分析能力 帮助我们找到在蓝屏发生的最后一刻 系统在执行什么操作 Windbg下载 2 I Dump文件生成 当一个核心态错误发生的时候 windows缺省的方式是产生一个带有报错代码的蓝屏 有三种类型的dump文件 完全内存转储核心内存转储最小内存转储 2 I Windbg设置 Symbolfilepath1 下载并安装2 直接连接到微软网站SRV d temp 2 I 案例分析讲解 杀毒软件原因瑞星 天网等杀毒软件或防火墙软件 驱动问题硬件故障实例 河北省沧州市计生委207990484NF380D接网线蓝屏stop 0 x000000FC f78ae884 2fbf0963 f78ae7f0 00000000 100s重启 不接网线运行正常 使用winDbg分析结果 Probablycausedby BlackDrv sys BlackDrv 11c6 安装了BlackICE 黑冰 防火墙 卸载后正常 2 I 常见故障处理及调试 硬盘相关故障开机无显机器不加电意外重启风扇故障前面板状态灯相关说明系统相关故障数据读写缓慢网络相关故障 2 I 风扇相关故障 风扇转速问题 1 一些机型有针对不同操作系统的降速调节软件如NF190 NF280G22 可通过修正bios中相关参数实现自动调节降速如NF280D NF190D3 也可通过bios修改来实现对风扇转速的控制如NP370D NF280风扇故障会造成内部温度过高 出现cpu过热而使系统自动断电的情况 可从bios监控页面查看风扇转速或查看bios事件日志是否有相关信息 高端机型机箱风扇本身有状态指示灯 当风扇本身异常时灯状态会有变化 如NF520D 正常状态下风扇指示灯为绿色 故障时会变为橙红色 预示风扇可能存在异常 有时风扇故障可能由槽位或其他因素引起 所以对于多个冗余风扇的情况下 尽可能现场交换风扇测试确定可能性原因 2 I 风扇故障 NF190D NF280D硬件监控及风扇参数调整 BIOS风扇限速 6000转风扇 4500转 1 Disable FANatfullspeed 2 1U 3 pin fanvoltagecontrolledto9V 10V 12V 3 2U 3 pin fanvoltagecontrolledto8V 9V 10V 清cmos或恢复bios默认值后要修改回正确的参数 2 I 常见故障处理及调试 硬盘相关故障开机无显机器不加电意外重启风扇故障前面板状态灯相关说明系统相关故障数据读写缓慢网络相关故障 2 I 关于故障指示灯 首先要明确状态灯的不同含义 比如服务器的网卡 有两个状态灯 一个为绿色 加电后常亮 代表网卡通电 另外一个是网络连接状态灯 不亮代表处于10m连同状态 绿色代表100m连接状态 红色代表千兆连接状态 闪烁代表正在进行数据交换 高端服务器一般都有系统状态指示灯 不同机器指示灯含义是不同的 如NF180正常情况下是绿色 系统异常时表现为红色 而NF500正常情况下是绿色常亮 非紧急故障状态为绿色闪烁 紧急故障情况下是橙色常亮 根据不同状态的变化 系统在报警的同时也进行日志记录 此时可参考系统日志 bmc日志灯进行问题的诊断和分析 2 I 前面板状态灯说明 NF190 NF280G2前面板状态灯NF190D NF280D前面板状态灯 2 I 常见故障处理及调试 硬盘相关故障开机无显机器不加电意外重启风扇故障前面板状态灯相关说明系统相关故障数据读写缓慢网络相关故障 2 I 系统相关故障 系统不能正常启动1 可能是系统本身故障 重装系统测试2 查看系统相关日志和启动信息 测试相关部件分区不能挂载1 挂载设备是否正确连接 是否工作正常 2 系统相关参数是否设置正确 3 硬盘为只读时需要进行单独格式化后重新挂载 系统安装问题1 驱动制作不正常或驱动错误导致安装系统时蓝屏或找不到硬盘2 由于一些机型对传统ide通道的颠覆 在linux系统安装时需要添加引导参数 并且在安装后修改相应文件 如NP120D2 NF190D2 NF290D23 对系统安装版本的要求 有些芯片组要求安装windows2003必须是集成sp1的 windows2000必须是集成sp4的 否则安装时蓝屏 而象NF500必须在windows2003系统安装时保证没有外插hba卡 否则安装过程中提示找不到光盘 4 oem2003光盘在系统安装时需要添加的驱动和普通2003系统光盘需要的驱动是不一样的 要将驱动软盘文件目录中加新目录 OEM TEXTMODE将驱动拷贝进入此目录 2 I 常见故障处理及调试 硬盘相关故障开机无显机器不加电意外重启风扇故障前面板状态灯相关说明系统相关故障数据读写缓慢网络相关故障 2 I 导致数据读写缓慢的原因 1 硬盘掉线 后台正在rebuild 或raid阵列正在进行一致性校验 2 病毒导致 从任务管理器看出 cpu占用率达100 一般与蠕虫类病毒严重占用系统资源有关 3 磁盘控制器驱动问题 使磁盘性能不能得到稳定发挥或存在bug 导致读写缓慢 4 数据库相关 数据库优化或程测试序有问题 导致程序执行时不能正常获取相关信息 表现为硬盘读写慢 5 硬件故障 包括硬盘 背板 线缆和硬盘控制器 6 raid卡设置相关 磁盘性能参数是否已经设置到最优化 使
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 惊蛰节气课件
- 情景式对联窍门课件
- 大学秋季迎新活动方案
- 2026届陕西省西安市第六十六中学高二化学第一学期期中预测试题含解析
- 杨梅促销方案
- 美团员工试题及答案
- 幼儿园散学典礼的活动方案
- java三层框架面试题及答案
- 幼儿园电工面试题及答案
- 红与黑考试题及答案
- 2025年蛟川书院分班测试题及答案
- 飞机数字孪生与预测性维护集成
- 2025《煤炭购销合同》
- 2025年行政执法证考试必刷题库与答案
- 基孔肯雅热防控知识考试试题含答案
- 2025年机关事业单位技能资格考试-文秘资料技师历年参考题库含答案解析(5卷套题【单项选择题100题】)
- 吉林化工(危险化学品)、医药企业电气设备设施安全隐患排查指南
- 劳动用工考试试题及答案
- 护理消毒液的配置
- 2025年职业指导师(四级)考试模拟试题汇编与模拟试题解析
- 2025年全新公安基础知识题库(含答案)
评论
0/150
提交评论