Linu操作系统硬件稳定性指南_第1页
Linu操作系统硬件稳定性指南_第2页
Linu操作系统硬件稳定性指南_第3页
Linu操作系统硬件稳定性指南_第4页
Linu操作系统硬件稳定性指南_第5页
已阅读5页,还剩2页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

Linux操作系统硬件稳定性指南〔转载整合〕CPU和内存疑难问题解答Linux确,即使是世界上最稳定的操作系统也不会对您有什么帮助。本文中,DanielRobbins将告知您如何诊断和修复CPU问题,并告知您如何测试RAM缺陷。通过学习本文,您将学Linux系统到达尽可能好的的稳定性。在Linux世界中,我们中的很多人已患病过令人深恶痛绝的硬件问题之苦。很多人曾经配置了一台Linux机器、安装了最宠爱的分发软件、编译并安装了一些附加应用程序并误、数据毁坏、硬锁定、还是丧失数据其结果都是一样的--硬件故障使通常状况下牢靠的LinuxCPU和RAM问题--在缺陷部件造成一些严峻的破坏之前就允许更换它们。假设您正患病不稳定问题并且猜测该问题与硬件有关CPU和内存以确CPU和内存测试仍不失为一个好方法。在测试CPU可放心,系统是符合标准的。CPU问题假设您有一个格外糟糕的CPU,您的机器可能无法引导Linux或仅运行几分钟便被锁CPU是有缺陷的。但更多的是一些不易检测到的微小的CPUCPU不稳定问题可通过“考验”CPU来触发--给CPU测试CPU的一些方法。当听说测试CPU稳定性的最好方法之一是Linux内建的--惊异。gcc编译器是测试一般CPU稳定性的一个很好的工具,内核编译将充分使用gcc。通过在/usr/src/linux名目创立并运行下面的脚本可以对您的机器进展industrial-strength内核编译压力测试:cpubuild脚本#!/bin/bash makedep while[“foo“=“foo“] do makecleanmake-j2bzImage if[$?-ne0] then echoOUCHOUCHOUCHOUCHexit1 fi done--一些CPU有断断续续的小故障,使得它们在95%的时间里顺当地编译内核,但又不时地使内核编译崩溃。通常状况下,这是由于在处理器加热到肯定温度〔在该温度下处理器变得不稳定〕之前可能进展了5个或更多内核编译。在上面的脚本中,留意调整-j选项,使紧跟它的数字等于系统中CPU的数目加1;“2“,双处理器使用“3“-j选项告知make程序行平行编译内核,确保在编译每个源文件后总有至少一个gcc进程预备就绪--确保CPU承受的压力到达最大。假设下午不预备使用Linux机器,请连续运行此脚本并让机器重编译内核几个小时。可能的CPU问题假设脚本持续几个小时运行顺当,庆贺您!您的CPU已经通过了第一个测试。但是,上述脚本可能会意外死掉。如何知道是CPU有问题而不是其它的问题呢?假设gcc发出CPU有问题:gcc:Internalcompilererror:programcc1gotfatalsignal11这时,CPU有三种可能的状态:假设您输入“makebzImage“重进展内核编译,并且编译器死在同一文件上,请连续一遍遍输入“makebzImage“。假设试了大约十次之后,编译进程连续死在此特定文件上,〔很少〕gcc编译器错误引起的,该错误是由此特定的源文件而不是有问题的CPU触发的。但是,这些天gcc很稳定,那么这种状况发生的可能性很小。假设您输入“makebzImage“重进展内核编译,并且稍后得到另一个信号11,那么您的CPU很可能快要无法使用了。假设您输入“makebzImage“CPUCPU〔CPU使用超过肯定时间后会变热,可能进展过几次内核编译后能到达此临界点〕,CPU故障才不时地显露出来。抢救CPU假设您的CPUCPU根本没什么问题--可能只是冷却不当。您可以检查以下内容:您的CPU风扇是否已插上?它是否能相对地避开灰尘?通电时风扇确实旋转〔并以适当的速度旋转〕吗?CPU上固定好了吗?在CPU和散热片之间有导热胶吗?您的机器通风状况足够好吗?外套。然后,用指尖留神地测试散热片的温度。假设特别地热,那么很可能您的散热片/风扇组合相对于您的特定CPU--CPU尚未患病任何永久性损坏并且仍旧可发挥作用。最终CPU测试内核编译测试是测试CPUCPU测试方法,或许您期望使用。我将这种方法保存到最终,是由于假设CPU只粗略地冷却过,这CPU--那些您期望确保即使CPU负载到达极限也能轻松处理的系统。假设您的CPU已经过适当地冷却,将会通过这个测试,假设没通过,则需要进一步冷却。要执行“最终“CPU测试,所做的第一件事是转到Lm_sensors页〔请参阅参考资料〕并下载lm_sensors软件包。源tarball包含各种内核模块,这些模块结合了几乎已内建在全部当今主板上的安康监视功能。一旦正确安装了软件包并且装载〔使用prog/detect/sensors-detect脚本指出装入哪些模块消灭在/proc/sys/dev/sensorsCPUCPU和主板sensors-detect脚原来指出引导时装入哪些模块。一旦装入了lm_sensorsCPU够实时观看CPU负载和温度而无须重复地在/proc/sys/dev/sensors中“cat“文件。出于这gkrellm〔请参阅参考资料gkrellm应CPU使用状况、主板温度设置和其它一些事情:gkrellm正在运行还有其它与lm_sensors兼容的图形监视软件包可用;您会觉察在lm_sensorshome主页的“链接“局部上,列出了很多这种软件包。最终一步预备步骤是下载cpuburn程序〔请参阅参考资料〕。这个便利的小程序使用机器指令的手工组合为您的特定CPU施加最大的压力--甚至比重复的内核编译的压力还P5和P6AMDK6的特别版本。一旦已将cpuburntarball解包,请读README文件;它说明如何编译所包含的cpuburn小程序。root启动cpuburn程序。然后,观看CPU温度读数上升并变稳,让cpuburn保持运行大约一个小时。假设重复这些步骤而且CPU温度持续上升到特别高的温度〔160华氏度左右将被认为是“特别”高〕,那么您的CPU冷却系统需要大的调整。假设机器崩溃或锁定,或cpuburn进程死掉,那么您的CPU冷却需要改进--或者可能您的特定CPU只是简洁地不符合“标准”。您可以使用CPUcpuburn程序,恢复正常操作。内存测试拥有一个完全牢靠的CPURAM芯片也很重要。有些人认为SIMMS和DIMMS永久不会坏,从不需要测试。不幸的是,这种想法是错误的--坏的内存格外普遍,我们都需要留意内存问题。另有一些人认为假设可能有坏的RABIOS内存检查会检测出全部的RAMBIOS内RAM,所以不要让BIOS检查给您一种安全的错觉。坏内存病症好的,这里有一个坏的RAM,或许现在正在您的机器里面。这里有一些警告迹象指出RAM:当同时装载大量的程序时,不时有某个程序无明显缘由地死掉。不时地,翻开一个文件时,显示文件被毁坏。假设稍后翻开,文件看起来又好了。当抽取tarball(“tarxzvf“)tar频频报告tarball时targzip和bzip2上。假设您正经受类似这样的问题,可能是系统RAM有缺陷。您将确定要使用以下方法测试您的RAM。即使您没有经受过这种问题,好好地测验一下系统的RAM仍不失为一个好方法,可确保您将来不会被意外的RAM突发问题所困扰。下面是测试方法。memtest86我们很幸运,有一个安装在可启动软盘上的基于Linux的优秀的内存测试程序。它的名称为memtest86〔请参阅参考资料猎取该程序〕载tarball。然后,将档案解包并构建二进制磁盘映象:#tarxzvfmemtest86-2.5.tar.gz#cdmemtest86-2.5#make然后,将一张3.5英寸空白磁盘插入到软盘驱动器,并输入:#makeinstall仅几秒钟后,就会有一个得意的小内存测试程序在您的3.5英寸磁盘上,预备被引导。--在上床前〔或离开工作时〕开头测试是一个好方法。要开头测试,请将开工作时〕开头测试是一个好方法。要开头测试,请将3.5英寸磁盘放在驱动器中重引导您的机器。当系统引导时,memtest86程序将马上启动:memtest86正在测试开发机器上的RAM。主要的内存突发问题〔比方“死亡”位〕将在几秒钟内检测出来。由特定位模式触发的故障〔不幸的是这种故障相当普遍可能几个小时也无法检测出来,但最终应当会检测出来。memtest86一检测到缺陷位,就将在屏幕底部显示一条消息--测试将连续。当早上翻开监视器时,您会觉察测试已完成,假设在屏幕上看不到任何警告信息,那么RAM确定是好的。但是,假设您连续遇到“坏内存病症”局部列出的问题,那么您的RAM可能有突发性问题〔这种问题很少发生〕,RAM。解决RAM问题我期望您全部的RAM都运行良好。然而,假设不幸您的RAM有问题,可能没有全部坏掉--您仍可以实行一些措施来“修复”坏的RAM。首先我建议您查看BIOS安装程序BIOS安装程序有称为“Turbo方式”的内存选项--明显,假设您启用了一些与此类似的选项,则应当禁用此选项。还有可能您的BIOS内存定时设置得不正确--您可以尝试调整它们〔CAS设置memtest86看看这些问题是否已解决。假设内存测试照旧觉察错误,那么此时您应当找到错误的SIMM或DIMM并将其从您的机器中除去。假设您安装了多个内存模块,那么您要仅安装一个模块〔或假设您有SIMMS,则可以安装两个模块〕并运行memtest86。轮番测试全部的模块后,您能够确定有缺陷的模块--不必将好的内存模块也扔到废物堆里。驱动程序、IRQPCI等待时间LinuxLinux上最稳定的操作系统,也不能发挥其优越之处。在本文中,DanIElRobbins共享他在NVIDIATNT图形卡使用NVIDIA的加速驱动程序在Linux下工作方面的经受。如同IRQ和PCI等待时间计时器问题-可以使用这些技术,来确保系统不会经受死锁、不全都行为或数据丧失。不稳定性的诸多缘由稳定性问题通常不是由有缺陷的硬件所引起的成这类问题。当我试图在Linux下让我的帝盟ViperV550〔一种基于NVIDIATNT芯片的AGP图形卡〕使用NVIDIA自己的加速驱动程序时,就开头了这方面的经受。NVIDIA有它们自己的LinuxNVIDIA、SGI和VALinux的合作结晶。与包括在Xfree864.0中的标准的仅2DNVIDIA3DOpenGL1.2为实现,而不只是Mesa的增加版。所以,总而言之,假设您有基于NVIDIA的图形卡,则这些加速驱动程序是您期望使用的最终转变成一次极佳的学习经受,至少可以这么说。在安装完加速LinuxNVIDIA〔请参阅本文后面的参考资料Xfree86,开头摆布全部3D应用程序,现在,有应当有的精彩加速。到那时为止,以前我必需重引导到WindowsNT才能利用3D加速。现在,虽然我不介意NT,但必需重引导才能使用3DLinux而重引导机器Linux3D机器死锁了。鼠标完全一动不动,屏幕冻结,并且必需重引导系统。是图形卡配置不当呢?或者可能是驱动程序有问题-是它不宠爱基于VIAKT133芯片的Athlon主板问题的过程。虽然,您所遇到的问题不肯定与这完全一样,但我用来诊断和〔大多数〕解决问题的步骤在本质上是大同小异的,并且也可应用到很多不同类型的Linux硬件问题。首先,硬件ViperV550好象在WindowsNTLinuxV550确实极烫,它的OEM散热片似乎来不及散热。死锁和图形卡不够冷却的事实合在一起说服我转向PCPowerandCooling〔请参阅参考资料〕,为我的V550购置了一个迷你集成的散热片/风扇。所以,在我收到VideoCool后,将显示卡上的OEM散热片去掉〔造成质保无效〕,清洁TNT芯片,然后将VideoCool固定在芯片上。结果呢?显示卡不烫了,但死锁仍旧存在。我从这段特别的经受所吸取的教训是-假设一开头就确定系统冷却充分工作站和效劳器凉快运行的极佳理由。既然已经考虑了发热问题,我知道死锁问题不太可能由特别的硬件引起,并且开头查看其它地方。驱动程序-以及可能的解决方案?我对NVIDIA驱动程序本身是否是问题所在,有点半信半疑。幸运的是,版本的驱动程序刚刚公布,所以我马上升级,期望它能解决稳定性问题。圆满的是,它没有,在上的#nvidia频道,我与其他人争论之后,觉察

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论