




已阅读5页,还剩16页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
IBM服务器日志收集大全目 录一、DSA日志收集方法21、DSA介绍22、下载DSA文件23、在系统下安装IPMI Driver 和mapping layer34、在系统下运行DSA Portable版35、用DSA boot光盘收集日志46、DSA日志需要关注的细节4二、BMC日志收集方法41、BMC介绍42、连接BMC53、设置BMC的IP地址54、在笔记本上安装SM bridge 软件65、运行SM Bridge收集日志66、SM Bridge 的其它应用67、用Service console 收集BMC日志78、关于日志的注意事项89、BMC日志查看8三、RAID日志81、Raid日志介绍82、在系统下收集support. zip日志93、SMR7.12以下版本收集日志104、用Support CD 收集阵列日志115、收集UART日志116、用Dumplog收集日志12四、RSA日志12五、SPINT日志14六、MM日志14七、系统日志161、windows OS日志162、收集Memory dump16八、其它特殊服务器日志17一、DSA日志收集方法1、DSA介绍IBM DSA(Dynamic System Analysis)是动态系统分析的简称,它是用来收集及分析系统信息,并用来做故障分析的一个工具。其主要收集的信息有: 详细的硬件信息 VPD及固件信息 SCSI设备数据及阵列配置信息 系统、应用、安全等日志信息 系统信息及安装的应用及补丁 设备驱动程序及服务 性能数据及运行的详细程序DSA当前共分为便携版、安装版、预启动版三个版本。其中便携式和安装版需要在系统下运行,且系统需要安装IPMI驱动。预启动版可以用来直接启动服务器在系统没有启动的情况下收集信息,但其不能收到详细的系统信息。2、下载DSA文件BootableDSA下载/systems/support/supportsite.wss/docdisplay?lndocid=SERV-DSA&brandind=5000008#intellistationDSA安装版(for windows)/systems/support/supportsite.wss/docdisplay?lndocid=MIGR-5075325&brandind=5000008DSA Portable版本(for windows)/systems/support/supportsite.wss/docdisplay?lndocid=MIGR-5075327&brandind=5000008DSA Portable 版本(for Linux)/systems/support/supportsite.wss/docdisplay?lndocid=MIGR-5075328&brandind=5000008DSA 安装版(for Linux)/systems/support/supportsite.wss/docdisplay?lndocid=MIGR-5075326&brandind=50000083、在系统下安装IPMI Driver 和mapping layer 注:如果不能进入系统,请忽略此步骤。/systems/support/supportsite.wss/docdisplay?lndocid=MIGR-5069608&brandind=5000008IPMI(Intelligent Platform Management Interface)即智能平台管理接口,他是一种开放标准的硬件管理理接口规则.定义了了嵌入式管理子系统进行通信的特定方法.他的工作是b通过专用芯片或控制器(服务管理器或基板管理器BMC),并不依赖服务器的处理器,bios,操作系统来工作.只需要在服务器在开机状态下,其就可以工作.我们可以通过他进行以下工作: 通过系统的串行端口或BMC专用端口来进行访问 故障日志记录和 SNMP 警报发送 访问系统事件日志 (System Event Log ,SEL) 和传感器状况 控制包括开机和关机 独立于系统电源或工作状态的支持 用于系统设置、基于文本公用程序和操作系统控制台的文本控制台重定向注:下面的几种收集方法中,我们只需要用一种方法对DSA进行收集。不过我们建议,如果系统能够正确运行收集系统中DSA日志,如果系统不能启动才考虑用引导光盘收集日志。4、在系统下运行DSA Portable版由于现在主流两大系统,Linux和Windows。在Windows下:直接运行DSA Portable程序文件,运行完成后系统会自动在c:/IBMsupport目录下生成一个XML文件,将此XML文件发送给IBM工程师进行解析。对于此程方法我们生成的文件自己不能阅读,我们可以通过下面方法生成网页文件,并且自己可能对其进行阅读和分析。进入CMD模式。找到DSA Portable文件,并加参数-v进行运行。运行完成后会在c:/ibmsupport目录下生成DSA的网页文件和XML文件。在Linux下:A:以root用户登录linuxB:进入linux 的shell.C:插入带有刚从网上下载的DSA文件的USB设备到服务器.D:执行 fdisk l确定刚插入的USB设备名如:fdisk -l/dev/sda2 * 1 65 507489+ b win95 FAT32.这设备名为: /dev/sda2E:将USB设备加载到linux系统.mount /dev/sda2 /mnt注:当使用不同的USB设备时,将看到不同的USB设备名.请根据具体情况确定设备名.F:从USB设备copy DSA程序到临时目录.cp /mnt/ibm_utl_dsa_2.10.12-portable_rhel3_i386.bin /tmpG:如果你系统没有临时目录,请执行下面命令创建.mkdir /tmp H:增加DSA文件的可执行权限cd /tmpchmod +x ibm_utl_dsa_2.10.12-portable_rhel3_i386.binI:在DSA文件所在目录运行DSA程序. ie: ./ibm_utl_dsa_2.10.12-portable_rhel3_i386.binJ:等待DSA文件执行完成,一个新文件将生成在 /var/log/IBM_SUPPORT目录下. 将此目录下的文件发送给IBM技术支持中心.5、用DSA boot光盘收集日志用刚下载的DSA光盘引导服务器,待运行完毕后,系统会提示相应选项,插入移动设备后输入copy命令。服务会自动检测USB设备。当服务器检测到可用的USB设备后,选择你需要保存日志的USB设备。完成后系统会自动将DSA运行结果copy到USB设备。6、DSA日志需要关注的细节二、BMC日志收集方法1、BMC介绍BMC(Baseboard Management Controller),是IBM x服务器主板上的系统管理芯片,用于监控和记录服务器各部件的状态。此芯片即使服务器没有开机,只要插上电源线就开始工作。所以理论上,只要机器可以加电,就可以收集BMC日志。注:我们收集BMC日志需要即收集用SMBridge收集到的日志,同时需要收集用Service console 收集到的日志。2、连接BMC收集BMC日志需要准备笔记本电脑1台,交叉网线1根。通过笔记本和服务器的第一网口用网线直接相连。思考:BMC的连接原理是什么?3、设置BMC的IP地址BMC的默认IP地址为7,但对于有一部分新机型,其地址已经被改变,需要用下面方法更改BMC地址。用F1进入BIOS并进入下面路径进行设置地址:Advanced Setup- Baseboard Management Controller (BMC) Settings - BMC Network Configuratio不同版本的设置界面略有不同。我们打开界面后,通过上面界面设置IP地址和相关网络信息。4、在笔记本上安装SM bridge 软件/systems/support/supportsite.wss/docdisplay?lndocid=MIGR-64636&brandind=5000008下载好SM Bridge 后,在笔记上使用默认安装即可。安装完成后,将笔记本的IP地址设置为和BMC的地址相同的网段。我们以0为例。5、运行SM Bridge收集日志进入命令行,并进入SM Bridge的安装目录,默认目录为C:/program/OSA。运行下面命令:smbridge -ip 7 -u USERID -p PASSW0RD sel get bmclog.txt注:7这里是BMC的地址,如果客户有更改,请根据实际情况进行更改。USERID是BMC的默认用户名。其可能通过BIOS更改。PASSW0RD这是BMC此用户的默认密码。其不0rd是零,不是。bmclog.txt是将日志保存在名为bmclog.txt的文件中。此名字可以根据实际需要更改。收集成的日志主要会以下格式存在:1=1970/01/01 00:00:02,#169Chassis,State Asserted2=1970/01/01 00:00:06,#1Power Unit,Power off/down (deassertion event)3=1970/01/01 00:00:12,#96Drive Slot,Device Inserted/Device Present4=1970/01/01 00:00:12,#98Drive Slot,Device Inserted/Device Present5=1970/01/01 00:00:14,#95Drive Slot,Device Inserted/Device Present6、SM Bridge 的其它应用Valid Subcommands:identify - controls the identification LED on front panel of server.power - controls the power options of server (i.e. shutdown).sel - performs operations with the System Event Log (SEL).sysinfo - displays general system information related to the server and BMC.Basic Usage Examples:1. Display general system info of remote server using LAN connection: smbridge -ip 00 -u root -p calvin sysinfo2. Display general system info of remote server using serial connection: smbridge -com 1 -baud 19200 -flow cts -u root -p calvin sysinfo smbridge -com ttyS0 -baud 19200 -flow cts -u root -p calvin sysinfo7、用Service console 收集BMC日志A:从下面地址下载Server Console工具/systems/support/supportsite.wss/docdisplay?lndocid=MIGR-63877&brandind=5000008:按第到第5部设置好相关参数,并直接双击Service console工具运行。:在第一个文档框里输入BMC的IP地址:在UserName里输入BMC的用户名(默认为USERID),在Password一栏中输入BMC密码(默认为PASSW0RD)。:点击Logon后,Service console将与BMC进行链接,等链接通后在最下面的文本显示框中将显示Connected字样。如果没有链接成功请检查第一到第五步骤。F:点击DumpSEL并在弹出窗口中输入需要保存的文件名。并点击保存即可收集到Service console日志8、关于日志的注意事项 在做服务之前建议收集一份BMC日志 在问题没有得到定位时不能清除BMC日志 在更换新主板后必须清除日志9、BMC日志查看如果用SMBridge收集的日志,它将会以明文的形式存在,即我们可以一条一条的读他的信息,从字面意思去分析日志报错信息。如果是用Service console收集到的日志,它是以十六进制形式存在,我们没有办法解析,我们可以通过发给CAG和LSG传到IBM内网进行解析。三、RAID日志1、Raid日志介绍RAID卡保存着机器I/O子系统最主要的日志,是I/O子系统故障日志收集的重点。在收集RAID日志前,请工程师按照RAID卡的型号到以下链接中确认并准备相应的Support CD和Application CD(Mega RAID 10 Series & Mega RAID 8480卡只有Support CD,此CD不能引导启动,只是传统意义上的Application CD),及USB软驱1个,软盘若干,U盘1个对于Raid日志,我们需要同时收集support. zip和Uart日志。2、在系统下收集support. zip日志A:在系统下安装Server Raid Manager,并登入SM主界面。在主界面上输入系统的用户名和密码。B:在管理器的目录树上选择你需要收集日志的控制器主机C: 在目录树窗口里面选中本地系统(Local System),然后点击右键,在弹出的菜单上面选择保存支持归档(Save archiving support)(如果你需要收集的日志为非本地系统的,如DS400,你需要选择相应的网络主机系统)注:如果收集失败,也可以去SRM程序安装的目录下,直接拷贝出Controller Config.txt, Controller Logs.txt, RaidEvt.log, RaidEvtA.log等日志文件3、SMR7.12以下版本收集日志对于SM7.12以下版本将弹出以下窗口我们需要在Actions菜单下执行Save printable configuration and event logs菜单,并从Server Raid Manager的安装目录下拷出raid*.log文件。4、用Support CD 收集阵列日志如果我们不能进入系统,可以通过Support CD启动服务器然后进入类似上面的管理界面,并用上面的方法收集日志,这里保存日志与上面不同的时,需要我们插入软盘或盘,系统会将日志保存在软盘或优盘上。这里不做详细介绍。5、收集UART日志UART日志是实验室需要分析的日志我们一般可以通过通过两种方式收集.即:系统下收集和通过Support CD启动收集.系统下收集:A:进入CMD模式B:进入Server Raid manager的安装目录.并找到arcconf.exe这个文件.C:执行下面命令: arcconf getlogs 1 uart uart.log注:uart.log是我们需要保存的日志文件名.用Support CD启动服务器收集:A:用Support CD启动服务器并用进入管理界面.B:用鼠标将窗口拖开流出空白区域.C:在空白处点击左健并按住Ctrl健.D:在弹出菜单中选择XTerm并进入相应的linux shell用usb floppy收集uartrootbootcd#fdisk -l *你会发现eg:/dev/sda为你的usb floppy*rootbootcd#mount /dev/sda /floppy *你可以尝试进入/floopy目录下面去看一下,是不是所使用软盘的内容,但一般建议使用空软盘*rootbootcd#arcconf getlogs 1 uart /floppy/uart.log *收集日志命令行*rootbootcd#umount /floppy *如果提示/floopy busy,请退出/floopy目录后再执行umount /floopy * 用U盘收集uartrootbootcd#fdisk -l *你会发现eg:/dev/sdc为你的U盘*rootbootcd#mount /dev/sdc /mnt *你可以尝试进入/mnt目录下面去看一下,是不是U盘里面的内容。*rootbootcd#arcconf getlogs 1 uart /mnt/uart.log rootbootcd#umount /mnt *如果提示/mnt busy,请退出/mnt目录后再执行umount /mnt *6、用Dumplog收集日志Dumplog是用来收集7及以下阵列卡的阵列日志./jct01004c/systems/support/supportsite.wss/docdisplay?brandind=5000008&lndocid=MIGR-4UD223下载此文件后进入CMD模式,并找到Dumplog所在目录并运行下面方法:dumplog 2 raid2.txt注:raid2.txt是输出log文件. 2为控制器的ID.四、RSA日志1、准备一台终端(有网卡和windows操作系统的机器都可以),通过网线直接连接到Remote Supervisor Adapter II上的网口2、配置终端的IP和 Remote Supervisor Adapter II的IP在同一网段,建议配置IP 30,Remote Supervisor Adapter II的默认IP是25,(这个IP也可以根据需求更改)3、打开终端的IE窗口,在地址栏中输入Remote Supervisor Adapter II的默认IP:25登陆Remote Supervisor Adapter II,在登陆界面上面输入用户名和密码。Remote Supervisor Adapter II的默认IP:25默认用户名:USERID默认口令:PASSW0RD 4、登陆Remote Supervisor Adapter II的管理界面,在左手边的窗口中选择MonitorsSystem StatesEvent Log,5、选择Save Logs as Text File,保存事件日志。注:如果RSA卡默认地址被修改,可以进入BIOS的advanced选项对RSA地址进行修改。或通过RSA卡的复位按钮进行复位。五、SPINT日志注:SPINT是工厂对Machine check进行分析的工具,如果日志中有报Machine check错误及未知的系统硬件错误,我们必须收集SPINT让工厂对故障进行分析.如:1. RSA log WARN SERVPROC Machine check asserted for Card or Link - SPINT, CPU Card, CPU CardERR SERVPROC Machine check asserted SPINT, North Bridge2. BMC log#200System Event,Undetermined system hardware failure#199System Event,Undetermined system hardware failure保存邮件里面Spint(此工具参阅附件) 工具文件到电脑中,通过rawrite.exe制作Spirnt 工具软盘1. 重启服务器,F1进入POST/BIOS setup utility设置先从软盘启动2. 使用该软盘启动服务器3. 针对X366和X3800的服务器4. 执行命令:X366DMP 99*SP(建议以服务器的系列号命名),等待命令执行完成5. 针对X460和X3950的服务器6. 执行命令:X366DMP 99*SP(建议以服务器的系列号命名),等待命令执行完成7. 在软盘上面输入 Type 99*SP.TXT |more确认是不是有内容8. 使用ZIP的格式发送日志给IBM 工程师六、MM日志刀片管理模块(MM或者AMM)的默认IP地址是25,默认用户名USERID,密码PASSW0RD。数字0而不是字母O。通过IE浏览器打开25,输入用户名和密码后,即可进入界面。注:MM和AMM左边的内容栏有些不同。我们在AMM中需要那保存那些日志选择菜单中“文件”- “另存为”- 文件类型选择“Web档案,单一文件(*.mht)”,按照信息类型输入文件名,点击保存即可。Monitor下面的System Status、Event Log、LEDs、Fule Gauge、Hardware VPD、Firmware VPD。Blade Tasks下面的 Power Restart、Configuration、Serial Over Lan。I/O Module Tasks下面的Admin/PowerRestart、Configuration(其中每个模块还有各自的子界面,也都要保存下来)。MM Control下面的General Information、Network Interfaces。Service Tools下面的(仅AMM)AMM Status。如下日志需要直接保存成文本格式。Monitor下面的Event Log。打开 Event Log页面,右下角点“Save Log as Text File”,保存即可。Service Tools下面的Service Data。打开 Service Data 页面,在右下角点“Save Service Data”保存即可。七、系统日志1、windows OS日志注意:如果客户机器发生疑似与操作系统、应用软件相关的故障情况时,建议收集OS日志,以便问题快速解决。如果机器可以启动并进入OS,收集OS全套日志,windows平台,要收集系统日志,应用程序日志和安全日志收集方法:右击我的电脑,点击管理选项,点击事件查看器,分别选择系统、应用程序、安全性,右击,另存日志文件到指定目录即可。2、收集Memory dump注意:如果遇到机器非正常的蓝屏、自动重启、宕机等情况的复杂case,建议设定并收集Memory dump。这个文件记录了机器在死机或重启最后瞬间的内存镜像,分析这个日志可能就会很快查找到问题所在。收集日志前,需准备注册表文件2个:NMICrash
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年内分泌科糖尿病临床诊断对策考试答案及解析
- 学校四班级春季教学工作方案
- 2025年康复医学综合治疗方案设计模拟测试答案及解析
- 2025年麻醉科安全操作流程考核答案及解析
- 2025年心电图解读技能应用考核测试卷答案及解析
- 2025年肿瘤放疗放射治疗的副作用模拟测试卷答案及解析
- 新质生产力的哲学与文化思考
- 2025年心血管病学心梗后康复训练考试卷答案及解析
- 江苏新质生产力发展动态
- 新质生产力的核心体现维度
- 数据退役方案
- 山东科学技术出版社小学一年级上册综合实践活动教案
- 2024口腔医学专业考核标准
- 装饰装修工程施工方案完整版
- 大型群众性活动安全许可申请表
- 小学数学人教版-六年级上-第一单元-分数乘法-教材分析
- 2024年新人教版部编本二年级上册美术教学工作计划及教学进度5
- 百融云创风险决策引擎V5产品操作手册
- DL∕T 1281-2013 燃煤电厂固体废物贮存处置场污染控制技术规范
- 《心房颤动诊断和治疗中国指南2023》-抗凝解读
- DZ∕T 0033-2020 固体矿产地质勘查报告编写规范(正式版)
评论
0/150
提交评论