服务器日常维护及常见故障排除方法_第1页
服务器日常维护及常见故障排除方法_第2页
服务器日常维护及常见故障排除方法_第3页
服务器日常维护及常见故障排除方法_第4页
服务器日常维护及常见故障排除方法_第5页
已阅读5页,还剩45页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

Inspurgroup服务器日常维护及常见故障排除方法2023/1/29主要内容故障维修注意事项常见故障处理及调试2023/1/29Inspurgroup故障维修注意事项服务器故障排错的基本原则服务器硬件维护注意事项关于最小化和还原出厂配置2023/1/29Inspurgroup服务器故障排错的基本原则1.尽量恢复系统缺省配置

a:硬件配置:去除第三方厂商备件和非标配备件;

b:资源配置:清除CMOS,恢复资源初始配置;

c:BIOS,F/W,驱动程序:升级最新的BIOS,F/W和相关驱动程序;

d:TPL:扩展的第三方的I/O卡属于该机型的硬件兼容列表(TPL)吗?2.从基本到复杂

a:系统上从个体到网络:首先将存在故障的服务器独立运行,待测试正常后再接入网络运行,观察故障现象变化并处理。

b:硬件上从最小系统到现实系统:指从可以运行的硬件开始逐步到现实系统为止。

c:软件上从基本系统到现实系统:指从基本操作系统开始逐步到现实系统为止。3.交换对比

a:在最大可能相同的条件下,交换操作简单效果明显的部件;

b:交换NOS载体,既交换软件环境;

c:交换硬件,既交换硬件环境;

d:交换整机,既交换整体环境2023/1/29Inspurgroup服务器硬件维护注意事项只有合格的技术人员才可以对主板进行设置系统电源开关:系统前面板上的直流电源开关并不能关闭系统电源的交流输入,系统中尚有8mA的伺服电流,在设置之前,必须拔下系统交流电源电缆系统外界设备:必须拔下系统外接网线和Modem等外接设备,否则可能会对人员或设备造成意外伤害静电释放和静电释放保护措施:静电释放会对主板、硬盘、板卡和系统的其它部件造成损害,在您要对系统硬件进行设置时,最好在防静电环境下进行(一端接地)静电释放和板卡持拿:因为板卡上的芯片对静电特别敏感,持拿板卡必须小心,只能接触主板的边沿。当板卡暂时不用时,必须把它放回专用的防静电袋中,芯片朝上放在接地平台上机箱盖:为了系统正常散热和空气流通,在系统上电前一定要安装机箱盖,否则会对系统部件造成损害,机架式服务器要特别注意2023/1/29Inspurgroup硬件维修注意事项确保在机箱和主板之间不存在短路把和主板相连接的线缆断掉,包括键盘和鼠标移走所有的外插板卡安装一颗CPU(确保安装牢固)连接机箱扬声器连线和电源指示灯LED连线到主板检查主板等部件的跳线设置是否正确2023/1/29Inspurgroup关于最小化和还原出厂配置遇到复杂问题时,需要进行机器的最小化操作来进行问题定位,笼统的讲,最小化指单cpu、单内存或双内存(根据主板要求决定)、主板、电源接显示器开机测试,其他的板卡、跳线等都去掉。但由于机型的差异,通过一些案例分析,我们真正做到最小化了么?还原到出厂配置要求保证原厂的部件,去掉用户自己扩配的部件,甚至要求bios版本的还原。2023/1/29Inspurgroup排除非浪潮部件干扰非常重要硬件故障并不单单指硬件有问题,它也指硬件之间不兼容。因为服务器的正常运作需要各部件之间的大力协调。建议大家在采购各元件时,都采用同一品牌原装的,并且要采用能发挥服务器性能的元件(上例中的旧式网卡即使正常也会严重影响服务器性能),这样才不会发生莫明其妙的故障2023/1/29Inspurgroup外设故障不可小看这些外设部件往往是最容易被忽略的,但这些故障会被引起以下故障:

蓝屏-切换器导致

开机报错-键盘导致

开机报警-鼠标线缆被老鼠咬了!!!-键盘故障

显示器-安装as4.6死机,安装其他系统没问题。必要时要替换测试2023/1/29Inspurgroup主要内容容故障维修修注意事事项常见故障障处理及及调试2023/1/5Inspurgroup常见故障障处理及及调试硬盘相关关故障开机无显显机器不加加电意外重启启风扇故障障前面板状状态灯相相关说明明系统相关关故障数据读写写缓慢网络相关关故障2023/1/5Inspurgroup硬盘相关故障障硬盘无法识别别1.检测不到硬盘盘2.可检测到硬盘盘数量不正确确开机自检硬盘盘报错

检测测到硬盘时报报错:smarterror或diskI/Oerror硬盘亮红灯阵列中硬盘频频繁掉线2023/1/5Inspurgroup硬盘相关故故障:硬盘盘检测问题题硬盘无法识识别问题可可从以下几几个方面考考虑1.重新拔插硬硬盘电源及及数据线缆缆,注意意是否有接接触不良的的问题。2.更换硬盘至至原先可正正常检测到到的槽位,,如果仍然然检测不到到则可能存存在硬盘损损坏故障。。3.可检测到硬硬盘数量不不正确实的的情况要注注意先确定定bios中是否设置置了正确的的参数,然然后再排除除上述1.2问题。4.硬盘背板故故障。5.磁盘控制器器可能存在在故障。2023/1/5Inspurgroup硬盘相关故故障:硬盘盘检测问题题Sata硬盘的识别别问题更多多表现在bios设置上,例例如NF190/NF280G2/NF190Ebios中相关sata参数设置

2023/1/5Inspurgroup硬盘盘相相关关故故障障::硬硬盘盘检检测测问问题题例如如NF190D/NF280Dbios中相相关关sata参数数设设置置

2023/1/5InspurgroupNF190D/NF280DESB2SATA3种模模式式::Compatible、AHCI、HostRaid2023/1/5InspurgroupNF190D/NF280DSATARAID关于SATAHostRAID有如下限限制:RAID-0Min2drives,max4drives.RAID-1Min2drives,max2drives.RAID-10Min4drives,max4drives.thesamelimitationwithSCSIHostRAID2023/1/5InspurgroupNF190D/NF280DSATACompatibleMode:IDE0Mas,IDE0Sla,SATA0,SATA2orSATA1,SATA3,支持Windows,Linux,nodriverrequiredEnhanceIDEMode:IDE0Mas,IDE0Sla,SATA0,SATA1,SATA2,SATA3,支持Windows,nodriverrequiredEnhanceMode(AHCIorRAIDenabled):IDE0Mas,IDE0Sla,SATA0,SATA1,SATA2,SATA3,SATA4,SATA5,driverisrequired.2023/1/5Inspurgroup硬盘相相关故故障::开机机自检检硬盘盘报错错检测到到硬盘盘时报报错::smarterror、diskI/Oerror或预期期错误误1.使用现现有的的硬盘盘控制制器校校验硬硬盘。。2.出现此此类报报错时时背板板或主主板也也是故故障原原因但但几率率较小小。2023/1/5Inspurgroup磁盘相相关故故障--硬盘盘亮红红灯很多机机器背背板有有硬盘盘故障障检测测功能能,如如硬盘盘亮红红灯一一般意意味着着硬盘盘掉线线、背背板检检测到到硬盘盘存在在故障障隐患患,此此时可可以从从raid卡配置置界面面中查查看硬硬盘的的状态态,如如果处处于非非掉线线状态态,需需要安安装对对应的的管理理软件件,从从管管理软软件中中查看看是否否有磁磁盘mediaerror,有一一点需需要强强调,,硬盘亮亮红灯灯并不不一定定意味味着硬硬盘掉掉线。2023/1/5Inspurgroup硬盘相关故故障-硬盘盘掉线对于硬盘频频繁掉线的的故障,首首先校验硬硬盘是否有有坏道,如如确定有坏坏道建议立立即更换而而不是通过过其他修正正的方法经过校验确确认硬盘没没有坏道,,但此硬盘盘频繁掉线线,同样需需要更换硬硬盘,然后后依次考虑虑背板、主主板或raid卡、数据线线、终结器器故障。2023/1/5Inspurgroup常见见故故障障处处理理及及调调试试硬盘盘相相关关故故障障开机机无无显显机器器不不加加电电意外外重重启启风扇扇故故障障前面面板板状状态态灯灯相相关关说说明明系统统相相关关故故障障数据据读读写写缓缓慢慢网络络相相关关故故障障2023/1/5Inspurgroup开机机无无显显的的维维护护思思路路ClearCMOS检查查供供电电环环境境,,零零-火;;零零-地电电压压??检查查电电源源指指示示灯灯,,如如果果亮亮,,正正常常吗吗??按下下电电源源开开关关时时,,键键盘盘上上指指示示灯灯亮亮吗吗??风风扇扇全全部部转转动动吗吗??是否否更更换换过过显显示示器器,,更更换换另另一一台台显显示示器器。。去掉掉增增加加内内存存去掉掉增增加加的的CPU去掉掉增增加加的的第第三三方方I/O卡检查查内内存存和和CPU插的的是是否否牢牢靠靠主板板是是否否有有显显示示屏屏蔽蔽的的跳跳线线更换换主主要要备备件件,,如如主主板板,,内内存存和和CPU2023/1/5Inspurgroup开机无显-清cmosNF190/NF280G2清cmos方法:用跳线帽将跳跳线2的b-c短接,保持5秒钟;重启机机器使设置生生效;关掉机机器,将跳线线帽接回原先先位置即可。。

2023/1/5Inspurgroup开机无显-清清cmosNF190D/NF280D清cmos方法:用金属物体((如小螺丝刀刀)将JBT1的两个脚点短短接即可。

2023/1/5Inspurgroup开机机无无显显--内内存存最最小小化化单条条内内存存插插法法::1.NF280G2/NF190单内内存存插插在在靠靠近近主主板板边边缘缘的的A1或B1槽位位2.NF190D/NF280D单内内存存插插在在靠靠近近主主板板内内部部的的DIMM1A槽位位上上主板板power开关关跳跳线线位位置置::NF280D/NF190D:

2023/1/5Inspurgroup常见见故故障障处处理理及及调调试试硬盘盘相相关关故故障障开机机无无显显机器器不不加加电电意外外重重启启风扇扇故故障障前面面板板状状态态灯灯相相关关说说明明系统统相相关关故故障障数据据读读写写缓缓慢慢网络络相相关关故故障障2023/1/5Inspurgroup主机机不不加加电电确定定外外插插电电源源线线是是否否正正常常,,更更换换电电源源线线测测试试清cmos、最最小小化化拔插插相相关关部部件件在确确定定外外部部电电源源没没有有问问题题的的情情况况下下,,将将电电源源单单独独取取出出,,插插上上电电源源线线后后短短接接电电源源24针插插座座的的绿绿、、黑黑接接口口,,看看电电源源风风扇扇是是否否转转动动来来确确认认电电源源故故障障。。((台台达达的的一一些些电电源源有有空空载载保保护护机机制制,,不不能能通通过过此此方方法法进进行行测测试试,,还还有有一一些些电电源源有有节节电电功功能能,,必必须须在在电电源源内内部部温温度度达达到到一一定定阀阀值值才才启启动动风风扇扇,,如如NP110D共享享工工程程机机器器,,所所以以也也不不能能用用此此方方法法测测试试))更换换主主板板测测试试,,(依依照照现现场场更更换换情情况况定定位位最最终终故故障障))2023/1/5Inspurgroup常见故故障处处理及及调试试硬盘相相关故故障开机无无显机器不不加电电意外重重启风扇故故障前面板板状态态灯相相关说说明系统相相关故故障数据读读写缓缓慢网络相相关故故障2023/1/5Inspurgroup意外重重启查看bios相关日日志及及系统统日志志考虑虑相关关因素素如果是是蓝屏屏重启启,可可查看看dump日志进进行分分析与系统统有关关,重重装系系统内存和和主板板是导导致硬硬件蓝蓝屏的的主要要原因因,可可对内内存进进行校校验,,或对对内存存进行行最小小化测测试2023/1/5Inspurgroup关于系系统蓝蓝屏故故障的的分析析关于windbgDump文件的的生成成,及及设置置Windbg设置如何分分析dump文件具体案案例分分析2023/1/5Inspurgroup关于windbg2023/1/5InspurgroupDump文件生成成当一个核核心态错错误发生生的时候候,windows缺省的方方式是产产生一个个带有报报错代码码的蓝屏屏。有三种类类型的dump文件:完全内存存转储核心内存存转储最小内存存转储2023/1/5InspurgroupWindbg设置Symbolfilepath1,下载并并安装2,直接连连接到微微软网站站SRV*d:/temp2023/1/5Inspurgroup案例分析讲解解杀毒软件原因因瑞星,天网等等杀毒软件或或防火墙软件件。驱动问题硬件故障实例:

河北北省沧州市计计生委207990484NF380D接网线蓝屏stop:0x000000FC(f78ae884,2fbf0963,f78ae7f0,00000000)100s重启,不接网网线运行正常常。使用winDbg分析结果:Probablycausedby:BlackDrv.sys(BlackDrv+11c6)安装了BlackICE(黑冰)防火墙,卸载载后正常2023/1/5Inspurgroup常见故障处理理及调试硬盘相关故障障开机无显机器不加电意外重启风扇故障前面板状态灯灯相关说明系统相关故障障数据读写缓慢慢网络相关故障障2023/1/5Inspurgroup风扇相关故障障风扇转速问题题:1.一些机型有针针对不同操作作系统的降速速调节软件如如NF190/NF280G2

2.可通过修正bios中相关参数实实现自动调节节降速如NF280D/NF190D

3.也可通过bios修改来实现对对风扇转速的的控制如NP370D/NF280风扇故障会造造成内部温度度过高,出现现cpu过热而使系统统自动断电的的情况,可从从bios监控页面查看看风扇转速或或查看bios事件日志是否否有相关信息息。高端机型机箱箱风扇本身有有状态指示灯灯,当风扇本本身异常时灯灯状态会有变变化,如NF520D,正常状态下下风扇指示灯灯为绿色,故故障时会变为为橙红色,预预示风扇可能能存在异常。。有时风扇故障障可能由槽位位或其他因素素引起,所以以对于多个冗冗余风扇的情情况下,尽可可能现场交换换风扇测试确确定可能性原原因。2023/1/5Inspurgroup风扇故障NF190D/NF280D硬件监控及风风扇参数调整整:BIOS风扇限速(6000转风扇----4500转)(1)Disable:FANatfullspeed(2)1U(3-pin):fanvoltagecontrolledto9V,10V,12V.(3)2U(3-pin):fanvoltagecontrolledto8V,9V,10V.清cmos或恢复bios默认值后要修修改回正确的的参数2023/1/5Inspurgroup常见故故障处处理及及调试试硬盘相相关故故障开机无无显机器不不加电电意外重重启风扇故故障前面板板状态态灯相相关说说明系统相相关故故障数据读读写缓缓慢网络相相关故故障2023/1/5Inspurgroup关于故故障指指示灯灯首先要要明确确状态态灯的的不同同含义义,比比如服服务器器的网网卡,,有两两个状状态灯灯,一一个为为绿色色,加加电后后常亮亮,代代表网网卡通通电,,另外外一个个是网网络连连接状状态灯灯,不不亮代代表处处于10m连同状状态,,绿色色代表表100m连接状状态,,红色色代表表千兆兆连接接状态态,闪闪烁代代表正正在进进行数数据交交换。。高端服服务器器一般般都有有系统统状态态指示示灯,,不同同机器器指示示灯含含义是是不同同的,,如NF180正常情情况下下是绿绿色,,系统统异常常时表表现为为红色色,而而NF500正常常情情况况下下是是绿绿色色常常亮亮,,非非紧紧急急故故障障状状态态为为绿绿色色闪闪烁烁,,紧紧急急故故障障情情况况下下是是橙橙色色常常亮亮。。根据据不不同同状状态态的的变变化化,,系系统统在在报报警警的的同同时时也也进进行行日日志志记记录录,,此此时时可可参参考考系系统统日日志志、、bmc日志志灯灯进进行行问问题题的的诊诊断断和和分分析析。。2023/1/5Inspurgroup前面面板板状状态态灯灯说说明明NF190/NF280G2前面面板板状状态态灯灯NF190D/NF280D前面面板板状状态态灯灯

2023/1/5Inspurgroup常见见故故障障处处理理及及调调试试硬盘盘相相关关故故障障开机无显显机器不加加电意外重启启风扇故障障前面板状状态灯相相关说明明系统相关关故障数据读写写缓慢网络相关关故障2023/1/5Inspurgroup系统相相关故故障系统不不能正正常启启动1.可能是是系统统本身身故障障,重重装系系统测测试2.查看系系统相相关日日志和和启动动信息息,测测试相相关部部件分区不不能挂挂载1.挂载设设备是是否正正确连连接??是否否工作作正常常?2.系统相相关参参数是是否设设置正正确??3.硬盘为为只读读时需需要进进行单单独格格式化化后重重新挂挂载。。系统安安装问问题1.驱动制制作不不正常常或驱驱动错错误导导致安安装系系统时时蓝屏屏或找找不到到硬盘盘2.由于一一些机机型对对传统统ide通道的的颠覆覆,在在linux系统安安装时时需要要添加加引导导参数数,并并且在在安装装后修修改相相应文文件,,如NP120D2/NF190D2/NF290D23.对系统统安装装版本本的要要求,,有些些芯片片组要要求安安装windows2003必须是是集成成sp1的,windows2000必须是是集成成sp4的,否否则安安装时时蓝屏屏,而而象NF500必须在在windows2003系统安安装时时保证证没有有外插插hba卡,否否则安安装过过程中中提示示找不不到光光盘。。4.oem2003光盘在系统统安装时需需要添加的的驱动和普普通2003系统光盘需需要的驱动动是不一样样的,要将将驱动软盘盘文件目录录中加新目目录:$OEM$/TEXTMODE将驱动拷贝贝进入此目目录2023/1/5Inspurgroup常见故障处处理及调试试硬盘相关故故障开机无显机器不加电电意外重启风扇故障前面板状态态灯相关说说明系统相关故故障数据读写缓缓慢网络相关故故障2023/1/5Inspurgroup导致数据读读写缓慢的的原因1.硬盘盘掉掉线线,,后后台台正正在在rebuild,或或raid阵列列正正在在进进行行一一致致性性校校验验。。2.病毒毒导导致致,,从从任任务务管管理理器器看看出出,,cpu占用用率率达达100%,,一一般般与与蠕蠕虫虫类类病病毒毒严严重重占占用用系系统统资资源源有有关关。。3.磁盘盘控控制制器器驱驱动动问问题题,,使使磁磁盘盘性性能能不不能能得得到到稳稳定定发发挥挥或或存存在在bug,导导致致读读写写缓缓慢慢。。4.数据据库库相相关关,,数数据据库库优优化化或或程程测测试试序序有有问问题题,,导导致致程程序序执执行行时时不不能能正正常常获获取取相相关关信信息息,,表表现现为为硬硬盘盘读读写写慢慢。。5.硬件件故故障障,,包包括括硬硬盘盘、、背背板板、、线线缆缆和和硬硬盘盘控控制制器器。。6.raid卡设设置置相相关关,,磁磁盘盘性性能能参参数数是是否否已已经经设设置置到到最最优优化化??使用磁盘性能能工具进行对对磁盘读写性性能进行测试试,如io-meter或hd-tune等,评估磁盘盘性能优劣。。2023/1/5Inspurgroup数据读写缓慢慢针对LSISATA/SCSIraid卡配置多块硬硬盘时出现的的数据读写缓缓慢问题的说说明:RAID卡进行一次写写操作需要以以下过程:首首先是控制器器和缓存之间间进行数据的的通信,然后后缓存再将数数据写入硬盘盘,完成一次次写操作。RAID卡写策略分为为两种:writeback、writethrough。写策略设置置为writeback时,当控制器器的缓存接收收到一次交易易的数据后,,控制器发出出传输完成的的信号给host主机,之后缓缓存和硬盘进进行数据的通通讯,完成写写的结束。而而设置writethrough时,只有当硬硬盘接收到一一次交易的数数据后控制器器才可以发送送传输完成的的信号给host主机。相比较较而言,前者者的效率更高高,之前的Firmware无法使用writeback策略,导致写写性能很低,,升级至新的的Firmware后,writeback策略可以正常常使用,极大大的提升了RAID卡的性能,并并提高了系统统的稳定性。。2023/1/5Inspurgroup常见故障处理理及调试硬盘相关故障障开机无显机器不加电意外重启风扇故障前面板状态灯灯相关说明系统相关故障障数据读写缓慢慢Usb光驱问题网络相关故障障2023/1/5Inspurgroup网络相关故故障主要表现为为网卡不通通,不能正正常连接或或有严重丢丢包现象,,时通时断断1.查看网卡灯灯是否正常常,一般情情况下插上上网线后网网卡灯亮。。2.如果灯不亮亮,更换网网线测试,,其他机器器上正常的的网线,在在此机器上上是否正常常?3.网卡网络配配置是否正正确?4.系统原因,,重装操作作系统。5.直连线测试试是确定网网络硬件是是否有问题题的主要方方法。2023/1/5Inspurgroup谢谢大家!2023/1/5Inspurgroup9、静夜夜四无无邻,,荒居居旧业业贫。。。1月-231月-23Thursday,January5,202310、雨中黄叶叶树,灯下下白头人。。。20:56:2020:56:2020:561/5/20238:56:20PM11、以我我独沈沈久,,愧君君相见见频。。。1月-2320:56:2020:56Jan-2305-Jan-2312、故人江海海别,几度度隔山川。。。20:56:2020:56:2020:56Thursday,January5,202313、乍见翻疑梦梦,相悲各问问年。。1月-231月-2320:56:2020:56:20January5,202314、他乡乡生白白发,,旧国国见青青山。。。05一一月月20238:56:21下下午20:56:211月-2315、比不了了得就不不比,得得不到的的就不要要。。。一月238:56下午午1月-2320:56January5,202316、行动出成果果,工作出财财富。。2023/1/520:56:2120:56:2105January202317、做前,能能够环视四四周;做时时,你只能能或者最好好沿着以脚脚为起点的的射线向前前。。8:56:21下下午8:56下下午20:56:211月-239、没有失败,,只有暂时停停止成功!。。1月-231月-23Thursday,January5,202310、很多多事情情努力力了未未必有有结果果,但但是不不努力力却什什么改改变也也没有有。。。20:56:2120:56:2120:561/5/20238:56:21PM11、成成功功就就是是日日复复一一日日那那一一点点点点小小小小努努力力的的积积累累。。。

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论