




已阅读5页,还剩35页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
BENET3.0第二学期课程,第五章系统故障分析与排查,理论部分,2,课程回顾,如何判断一个文件是否存在?如何进行整数变量的四则运算?if语句从结构上分为哪几类?for、while、until在循环流程上有何区别?,3,技能展示,熟悉常见的日志文件及分析方法会解决常见的启动登录类故障会解决常见的软件包安装类故障会解决常见的文件系统、磁盘类故障熟悉常见的系统性能监控方法,4,本章结构,日志分析及管理,主要日志文件,修复文件系统,日志文件分析,磁盘资源耗尽故障,日志管理策略,系统启动类故障排除,文件系统、磁盘类故障排除,MBR扇区故障,/etc/inittab文件丢失,rpm数据库损坏,缺少*.so类文件,软件包类故障排除,检测硬盘坏道,无法卸载已挂载设备,查看CPU负载,查看系统性能状况,查看内存使用情况,GRUB引导故障,/etc/fstab文件丢失,遗忘root用户的密码,磁盘I/O性能监控,系统故障分析与排查,5,日志分析及管理,日志的功能用于记录系统、程序运行中发生的各种事件通过阅读日志,有助于诊断和解决系统故障日志文件的分类内核及系统日志由系统服务syslog统一进行管理,日志格式基本相似用户日志记录系统用户登录及退出系统的相关信息程序日志由各种应用程序独立管理的日志文件,记录格式不统一,6,日志分析及管理,日志保存位置默认位于:/var/log目录下主要日志文件介绍内核及公共消息日志:/var/log/messages计划任务日志:/var/log/cron系统引导日志:/var/log/dmesg邮件系统日志:/var/log/maillog用户登录日志:/var/log/lastlog、/var/log/secure、/var/log/wtmp、/var/run/utmp,7,内核及系统日志,由系统服务syslogd统一管理软件包:sysklogd-1.4.1-39.2主要程序:/sbin/klogd、/sbin/syslogd配置文件:/etc/syslog.conf,rootlocalhost#grep-v#/etc/syslog.conf|grep-v$*.info;mail.none;authpriv.none;cron.none/var/log/messagesauthpriv.*/var/log/securemail.*-/var/log/maillogcron.*/var/log/cron,设备类别.日志级别,消息发送位置,8,内核及系统日志,日志消息的级别0EMERG(紧急):会导致主机系统不可用的情况1ALERT(警告):必须马上采取措施解决的问题2CRIT(严重):比较严重的情况3ERR(错误):运行出现错误4WARNING(提醒):可能会影响系统功能的事件5NOTICE(注意):不会影响系统但值得注意6INFO(信息):一般信息7DEBUG(调试):程序或系统调试信息等,数字越小,表示优先级越高、问题越严重,9,rootlocalhost#tail-5/var/log/messagesSep1411:22:44localhostkernel:sdb:cachedataunavailableSep1411:22:44localhostkernel:sdb:assumingdrivecache:writethroughSep1411:22:44localhostkernel:sdb:sdb1Sep1411:23:37localhostkernel:VFS:Cantfindext3filesystemondevsdb1.Sep1416:54:48localhostNetworkManager:starting.,内核及系统日志,日志记录的一般格式,10,用户日志分析,保存了用户登录、退出系统等相关信息/var/log/lastlog:最近的用户登录事件/var/log/wtmp:用户登录、注销及系统开、关机事件/var/run/utmp:当前登录的每个用户的详细信息/var/log/secure:与用户验证相关的安全性事件分析工具who、w、user、last、ac,11,程序日志分析,由相应的应用程序独立进行管理Web服务:/var/log/httpd/access_log、error_log代理服务:/var/log/squid/access.log、cache.log、squid.out、store.logFTP服务:/var/log/xferlog分析工具文本查看、grep过滤检索、Webmin管理套件中查看awk、sed等文本过滤、格式化编辑工具Webalizer、Awstats等专用日志分析工具,12,日志管理策略,及时作好备份和归档延长日志保存期限控制日志访问权限日志中可能会包含各类敏感信息,如账户、口令等集中管理日志便于日志信息的统一收集、整理和分析杜绝日志信息的意外丢失、恶意篡改或删除,13,日志管理策略,应用示例:调整syslogd服务设置,建立集中管理的日志服务器将客户机B中crond服务产生的日志消息,自动发送到服务器A的/var/log/cron文件中,rootlocalhost#vi/etc/sysconfig/syslogSYSLOGD_OPTIONS=-r-x-m0,rootlocalhost#vi/etc/syslog.confcron.*,14,修复MBR扇区故障,故障原因病毒、木马等造成的破坏不正确的分区操作、磁盘读写误操作故障现象找不到引导程序,启动中断无法加载操作系统,开机后黑屏解决思路应提前作好备份文件以RHEL5安装光盘引导进入急救模式从备份文件中恢复,15,修复MBR扇区故障,应用示例:1.备份MBR扇区数据ddif=/dev/sdaof=/backup/sda.mbr.bakbs=512count=12.模拟MBR被破坏的故障ddif=/dev/zeroof=/dev/sdabs=512count=13.RHEL5光盘引导,进入急救模式boot:linuxrescue4.从备份文件中恢复MBR扇区ddif=/tempdir/sda.mbr.bakof=/dev/sdabs=512count=1,16,修复GRUB引导故障,故障原因MBR中的GRUB引导程序遭到破坏grub.conf文件丢失、引导配置有误故障现象系统引导停滞,显示“grub”提示符解决思路尝试手动输入引导命令进入急救模式,从备份中恢复grub.conf向MBR扇区中重建grub程序,17,修复GRUB引导故障,应用示例1:在“grub”提示符后,手动输入引导命令成功进入系统后,恢复或重建grub.conf配置文件,grubroot(hd0,0)grubkernel/vmlinuz-2.6.18-8.el5roroot=/dev/VolGroup00/LogVol00rhgbquietgrubinitrd/initrd-2.6.18-8.el5.imggrubboot,rootlocalhost#cd/boot/grub/rootlocalhost#cpgrub.conf.bakgrub.conf,从备份文件恢复,18,修复GRUB引导故障,应用示例2:进入急救模式,从备份文件中恢复grub.conf文件向MBR扇区中重建GRUB程序,sh-3.1#chroot/mnt/sysimagesh-3.1#cd/boot/grub/sh-3.1#cpgrub.conf.bakgrub.confsh-3.1#grub-install/dev/sda,19,/etc/inittab文件丢失,故障原因inittab文件被误删除,或者存在配置错误故障现象启动中提示“.INIT:Noinittabfilefound”系统停滞,无法完成初始化解决思路进入急救模式,从备份文件中恢复或者,在急救模式中重新安装initscripts软件包rpm-ivh-replacepkgsinitscripts-8.45.14.EL.i386.rpm,20,/etc/fstab文件丢失,故障原因fstab文件被误删除,或者存在配置错误故障现象启动中提示“./etc/fstab:Nosuchfileordirectory”系统停滞,无法完成初始化解决思路进入急救模式,手动查找并挂载根分区查找逻辑卷:lvmvgscan激活指定的逻辑卷:lvmvgchange-ay/dev/VolGroup00恢复或重建fstab配置文件,21,遗忘root用户的密码,故障原因遗忘root用户的密码故障现象无法进行需要root权限的管理操作若没有其他可用帐号,将无法登录系统解决思路引导进入单用户模式,然后重设密码grubkernel.single或s或1或进入急救模式,然后重设密码,22,小结,请思考:Linux系统中最常用的公共日志文件是什么?负责管理内核日志的系统服务是什么?如何进入单用户模式?使用RHEL5光盘引导时,如何进入修复模式?如何向MBR中重建GRUB程序?,23,软件包类故障rpm数据库损坏,故障原因非正常关机、误删除运行中的程序文件RPM数据文件被误写或删除故障现象不能正常查询rpm包信息无法安装、升级或卸载软件包等解决思路重建RPM数据库rpm-rebuilddb或rpm-initdb,24,软件包类故障缺少*.so类文件,故障原因软件正常运行所需要的依赖包没有安装系统找不到依赖包的*.so共享链接库故障现象无法正常编译、安装或运行软件报错提示“缺少.so文件”解决思路确认已安装能提供相应*.so共享库的软件包添加库文件搜索路径,并更新缓存,rootlocalhost#vi/etc/ld.so.conf/usr/local/mysql/lib/mysqlrootlocalhost#ldconfig,25,修复损坏的文件系统,故障原因非正常关机、突然断电、设备读写失误等文件系统的超级块(super-block)信息被破坏故障现象无法向分区中读取或写入数据启动后提示“Giverootpasswordformaintenance”解决思路根据提示输入root口令,进入修复状态使用fsck命令进行修复,26,修复损坏的文件系统,应用示例:模拟对/dev/sdb1分区的破坏操作ddif=/dev/zeroof=/dev/sdb1bs=512count=4检查是否能挂载该分区报错:mount:youmustspecifythefilesystemtype对/dev/sdb1分区进行修复fsck-ytext3/dev/sdb1再次挂载该分区,27,磁盘资源耗尽故障,故障原因磁盘空间已被大量的数据占满,空间耗尽虽然还有可用空间,但文件数i节点耗尽故障现象无法写入新的文件,提示“:设备上没有空间”部分程序无法运行,甚至系统无法启动解决思路清理磁盘空间,删除无用、冗余的文件转移或删除占用大量i节点的琐碎文件进入单用户模式、急救模式进行修复为用户设置磁盘配额,28,无法卸载已挂载的设备,故障原因需要卸载的设备正在被使用故障现象无法卸载设备,提示“.deviceisbusy”解决思路将工作目录切换到挂载点以外退出正在使用该设备的程序或使用fuser命令找出相关进程,并终止该进程,rootlocalhostmnt#fuser-mv/media/cdromUSERPIDACCESSCOMMAND/media/cdrom:root3297.c.bashrootlocalhostmnt#fuser-k/media/cdrom,29,检测硬盘中的坏道,故障原因磁盘设备中存在坏道(逻辑的或物理的)故障现象部分文件无法正常访问,提示文件损坏新建立的分区无法完成格式化访问磁盘设备时死机,磁盘发出异常声响解决思路检测硬盘中是否存在坏道mkfs-text3-c/dev/sdb1或badblocks-sv/dev/sdb1修复硬盘,或更换新的硬盘,30,系统性能监控查看CPU负载,执行uptime命令运行时间,登录用户数,CPU平均负载查看/proc/loadavg文件CPU平均负载,活动进程数/总数,最近进程的PID,rootlocalhost#uptime05:33:11up7:22,2users,loadaverage:0.04,0.09,0.08rootlocalhost#cat/proc/loadavg0.150.030.014/8425697,31,系统性能监控查看内存使用情况,vmstat命令报告系统虚拟存储使用情况,包括内存使用信息free命令显示系统的物理内存和交换空间的使用情况,rootlocalhost#vmstatprocs-memory-swap-io-system-cpu-rbswpdfreebuffcachesisobiboincsussyidwast0003042802708414584400298100720029800rootlocalhost#freetotalusedfreesharedbufferscachedMem:515600211320304280027264145852-/+buffers/cache:38204477396Swap:104856801048568,32,系统性能监控磁盘I/O性能监控,iostat命令用于查看系统磁盘I/O统计信息由软件包sysstat-7.0.0-3.el5.i386.rpm提供sysstat还提供了mpstat命令,用于显示进程负载信息,rootlocalhost#iostat-dkt5Linux2.6.18-8.el5(localhost.localdomain)2009年05月24日Time:16时17分49秒Device:tpskB_read/skB_wrtn/skB_readkB_wrtnsda1.2815.126.5416718372314sdb0.8311.951.9513218221526dm-02.4014.956.5416532572312dm-10.010.040.004560hdc0.020.070.007460,rootlocalhost#mpstatLinux2.6.18-8.el5(localhost.localdomain)2009年05月25日05时18分11秒CPU%user%nice%sys%iowait%irq%soft%steal%idleintr/s05时18分11秒all0.450.021.933.080.020.070.0094.431010.03,33,本章结构,日志分析及管理,主要日志文件,修复文件系统,日志文件分析,磁盘资源耗尽故障,日志管理策略,系统启动类故障排除,文件系统、磁盘类故障排除,MBR扇区故障,/etc/inittab文件丢失,rpm数据库损坏,缺少*.so类文件,软件包类故障排除,检测硬盘坏道,无法卸载已挂载设备,查看CPU负载,查看系统性能状况,查看内存使用情况,GRUB引导故障,/etc/fstab文件丢失,遗忘root用户的密码,磁盘I/O性能监控,系统故障分析与排查,BENET3.0第二学期课程,第五章系统故障分析与排查,上机部分,35,实验案例:日志管理及系统故障修复,需求描述基于
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 公司线上祭奠活动方案
- 公司时装创意秀活动方案
- 公司秋游白交祠策划方案
- 公司收心活动方案
- 公司活动演讲活动方案
- 公司班组文化活动方案
- 公司群众文体活动方案
- 公司职工团日活动方案
- 公司特色活动策划方案
- 公司注册选址策划方案
- 小学生数学逻辑推理题100道及答案解析
- 2023年上海市普通高中学业水平合格性考试地理试题及答案
- 基本气象要素
- 食品安全规章制度模板打印
- 2024年永平县小升初全真数学模拟预测卷含解析
- 2002版《水利工程施工机械台时费定额》
- 山东省菏泽市鄄城县2023-2024学年七年级下学期7月期末英语试题
- 国家开放大学本科《会计实务专题》形考作业一至四试题及答案
- 安徽省合肥市庐阳区2022-2023学年五年级下学期期末科学试卷
- 国家开放大学《土地利用规划》本章自测参考答案
- 外卖安全法律知识讲座
评论
0/150
提交评论