下载本文档
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、Kdump 简介kdump 是在 linux 系统、死锁或者死机的时候用来转储内存运行参数的一个工具和服务。如果系统一旦那么正常的内核就没有办法工作了。而仅仅从硬件日志和系统的 message 日志并不够分析和确认故障的原因,在这个时候将由 kdump 产生一个用于 capture 当前运行信息的内核,该内核会将此时的内存中的所有运行状态和数据信息收集到一个 dump core 文件中以便于后线工程师分析原因,一旦内存信息收集完成,系统将自动重启。本文介绍常用的 linux 系统 rhel 6 和suse11 的 kdump 配置。一、rhel 6 Kdump1,进bios 关闭服务器的 AS
2、RASR 简介Automatic Server Recovery (ASR) 服务器自动恢复功能。当操作系统出现 性故障时,ASR 特性可以使服务器自动重启。比如出现蓝屏,ABEND,内核 等。当调用系统管理驱动程序(也叫做健康驱动程序),一个系统自动防故障装置计时器,当操作系统运行正常,ASR 计时器会不断被重置,以保证计时器正确的设置。当操作系统后,计时器不能被重置,时间到达设置的阀值后即重新启动服务器。由于将内存的dump core 文件写到硬盘中需要30 分钟甚至更长的时间,为了保证dump 文件的完整, 所以需要将 ASR 功能关闭。2,升级hpsa 驱动至最新hpsa 驱动版本早于
3、 3.0.0-1 会导致 dump 不能正常收集。3,检查 kexec 工具是否安装:执行# rpm -qa |grep kexec 显示Kexec-tools-2.0.0-145.e16.x86_64 为已安装如未安装,在系统盘中找到该工具包执行安装。4,修改 kdump 配置文件:4.1 执 行 # vim /etc/kdump.conf修改压缩值: 将以下字段添加到 kdump.conf 文件中core_collector makedumpfile -d 31 -c -message -level 1并去掉 /var/crash 前面的#4.2 在/etc/sysctl.conf 中增加
4、以下字段kernel.panic_on_io_nmi = 1 kernel.sysrq = 1kernel.panic = 10kernel.panic_on_oops = 1kernel.unknown_nmi_panic = 1kernel.panic_on_unrecovered_nmi = 15,修改启动参数,执行 vim /boot/grub/grub.conf ,在内核行的末尾添加 nmi_watchdog=0 crashkernel=512M 。例:下面是一个带有 kdump 选项的/boot/grub/grub.conf# grub.conf generated by anac
5、onda # Note that you do not have to rerun grub after making changes to this file # NOTICE: You have a /boot partition. This means that#all kernel and initrd paths are relative to /boot/, eg. #root (hd0,0)#kernel /vmlinuz-version ro root=/dev/mapper/VolGroup-LogVol01 #initrd /initrd-generic-version.i
6、mg#boot=/dev/sda default=0 timeout=5splashimage=(hd0,0)/grub/splash.xpm.gz hiddenmenutitle Red Hat Enterprise Linux (2.6.32-131.0.15.el6.x86_64) root (hd0,0)kernel /vmlinuz-2.6.32-131.0.15.el6.x86_64 ro root=/dev/mapper/VolGroup-LogVol01 rd_LVM_LV=VolGroup/LogVol01 rd_LVM_LV=VolGroup/LogVol00 rd_NO_
7、LUKS rd_NO_MD rd_NO_DM LANG=zh_CN.UTF-8 KEYBOARDTYPE=pc KEYTABLE=us nomodeset crashkernel=auto rhgb quiet nmi_watchdog=0 crashkernel=512Minitrd /initramfs-2.6.32-131.0.15.el6.x86_64.img6, 执行 chkconfig kdump on,使 kdump 服务开机自动运行。7,重启系统,内核参数在启中加载,所以配置完成必须重启一次。8,测试 kdump 配置是否成功echo c /proc/sysrq-trigger
8、执行完此命令,系统重启后会在/var/crash 下生成 dump core 文件。生成时间 30 分钟至 60 分钟,具体时间和具体环境有关。如果 hang 机时没能触发 dump,可在 ilo3/4 的界面中 Diagnostics 选择 Generate NMI to system 手工触发。二、SUSE 11Kdump1,进bios 关闭服务器的 ASR2, 检查并安装以下三个工具包kernel-kdump, kdumpkexec-tools3,kdump 配置与 rhel 基本类似:3.1 , 执 行 # vim /etc/kdump.conf修改压缩值: KDUMP_DUMPLEV
9、EL=15注:默认为 0 也就是不压缩,最大压缩比的值为 31,suse 官方推荐使用 153.2 , 在/etc/sysctl.conf 中增加以下字段kernel.sysrq = 1kernel.panic = 10kernel.panic_on_oops = 1kernel.unknown_nmi_panic = 1kernel.panic_on_unrecovered_nmi = 1kernel.panic_on_io_nmi = 14, 修改启动参数,vim /boot/grub/menu.lst在内核行的末尾添加 nmi_watchdog=0 crashkernel=128M关于
10、crashkernel 的值,和内存大小相关,配置时参考 suse 官方给的参数。Memory crashkernel= 0 - 12 GB 128M 13 - 48 GB 256M 49 - 128 GB 512M 129 - 256 GB 1G *(896M, 768M or 512M)5,执行 chkconfig kdump on,使 kdump 服务开机自动运行。6,重启服务器。7,测试方式与 rhel 6 相同。echo c /proc/sysrq-trigger 或者在 ilo 中使用手动触发。三、网卡 dump网卡 dump 收集需要相应网卡的 dump 脚本。以下nx_nic(nc375i)网卡为例:脚本文件:nx_nic_fw_hang_linux_dump.zip1. 确认网卡驱动已正确安装 ,#lsmod | grep nx_nic2. 解压,#tar -xvzf nx_nic_fw_hang_mon_tool_linux.tgz3. 进入解压后的目录#cd nx_nic_fw_hang_mon_tool_linux4. 运行脚本#./nx_nic_mon.sh 中需
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 护理交接班制度
- 药物外渗的循证护理实践
- 食管结核患者的护理要点
- 门诊护理健康教育策略
- 骨质疏松护理中的健康教育
- 心脏支架术后居家护理要点
- 教招案例分析试题及答案
- “十五五”发展规划专项试题及答案
- 教案-单元五任务2 蜜橘推广-静态模板
- 磁头研磨工安全强化测试考核试卷含答案
- 2026供应链管理行业平台模式物流创新合作竞争力评估分析报告文档
- 2026安徽合肥高新区招聘社区工作者96人笔试参考题库及答案解析
- 2024版《建设工程工程量清单计价标准》解读课件
- 2026年高校图书馆采编岗面试题库
- 广东省深圳市2026届高三下学期第二次调研考试数学试卷(含答案)
- 学堂在线 中国传统装饰 章节测试答案
- 2025年乌兰察布市社区工作者招聘考试真题及答案
- 对外投资合作国别(地区)指南-新加坡(2025年版)
- 污水处理设施运维服务投标方案(技术标)
- 比亚迪集团所属行业分析报告
- 2026年关于鲁迅资料的测试题及答案
评论
0/150
提交评论