排错方法和流程_第1页
排错方法和流程_第2页
排错方法和流程_第3页
排错方法和流程_第4页
全文预览已结束

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、 网络故障排错 TSHOOT(Troubleshooting)网络管理员的职责: 确保网络高效、稳定和安全的运行。具体内容包括:1. 规范整理网络运行资料,包括:网络拓扑结构图、网络设备目录、互连关系列表、IP地址分配置表、设备配置文件、以及原始设计方案,确保与网络实当前的实际状况保持准确、一致。 (基线数据) 2. 监控网络设备交换机、路由器、防火墙和服务器的运行状态,确保网络按设计要求正常稳定运行。 ( 接口状态,带宽利用率, CPU、内存利用率 )3. 响应各种突发性网络故障,快速准确进行故障定位,并进行有效排错,恢复网络的正常运行。4. 根据企业的发展规划和当前网络的运行状态,制定合适

2、的网络升级规划方案,并施实该方案。网络维护行为主动性网络维护:按照计划(每天、每周、每月)执行任务。 1、2、4故障驱动性: 在收到故障报告后解决问题。 3维护模型1、PPDIOO模型 CISCO生命周期服务准备 规划 设计 (根据需求,进行规划设计)实施(组建)运行(管理、调试)优化(监控网络运行、优化改进)2、FCAPS模型 ISO定义的网络维护模型故障管理、配置管理、记帐管理、性能管理和安全管理。 排错方法和流程现在, 网络的故障排除比过去任何时候都更为重要。随着网络规模的不断扩大,服务的不断增多,网络出现故障的机率以及排错的难度都在不断加大,网络的正常运行也更需要有超强故障排除技能的网

3、络工程师。排错的理论基础: OSI七层参考模型 TCP/IP协议故障排除过程:一、故障报告 ( 医院:病人向医生说明病情,病历本 )来自用户的故障报告一般都缺乏足够的信息,需进一步了解故障情况,并编制一份故障工单。标明:什么时间,什么地点,什么出了问题,故障影响的范围有多大。二、收集症状信息 ( 医生:望、闻、问、切; 化验,CT ) 收集与故障相关的信息,集中精力有针对性地收集适当网络设备(如路由器、交换机、服务器或客户端)的信息,避免花费大量时间收集无用信息。1 询问终端用户问题什么不工作了?什么时间第一次注意到故障?最后一次工作后改变了什么? 2 查看故障 查看设备的指示灯;溶化的绝缘体

4、或烧坏部件的烧焦气味;电缆连接错误;模块和板卡的安装错误。3 命令调试 ping 目标IP,查看连通性。不通, 到哪里可以通? traceroute 跟踪到目标的路径。 sh ip route sh ip ospf neigh debug 三、检查收集到的信息 ( 化验单, CT, B超 )收集到足够多的信息之后,就要检查这些信息。 有效性、全面性。四、分析症状,排除潜在的故障原因 ( 分析病情,排除某些病因 )根据自己的网络知识以及对收集到的信息的理解,开始排除故障的潜在原因。检查完所收集到的信息之后,就可以根据这些数据形成初步推论,其中某些推论能暗示故障的潜在原因,而某些推论则可以排除某些

5、潜在原因。排错方法: (各种方法配合使用) 自下而上:从物理层开始自上而下:从应用层开始 分而治之:用ping界定问题是下三层,还是上四层。(推荐) 跟踪流量路径法:在前往目标的路径中,逐跳进行检测。 能到哪里,不能到哪里? 对比配置法:1、相同的环境,一个设备正常,一个设备故障,则可将两个设备的配置文件和各项参数进行对比;2、当前数据与之前的基线数据进行对比;3、同一链路两端设备的配置进行对比(对等性原则)。 组件替换法:替换后,故障消失,则集中精力解法该故障设备。 应用以前的经验:富有经验的工程师,对某些故障可能会直接确定原因。五、推断根本性故障原因 ( 确定根本性病因 ) 在排除了故障的

6、众多潜在原因之后,就剩下一个或少数几个可能引起故障的根本性原因,此时就可以思考并推断产生故障的最可能原因。六、验证推断,并制定详细的故障解决方案。 ( 开药方 )确定了最可能的故障根源后,需要制定详细的故障解决方案来解决故障。关键点:用文档记录下每个操作步骤,这样不仅可以避免遗漏某些实施步骤,而且在解决方案失效后还可用于实施回退计划。如果方案实施后,仍无解决问题,或产生了新问题,就应该执行回退计划,将网络恢复到先前状态。然后,重新评估之前推断的故障原因,确定故障并制定新的解决方案。在生产性网络中,实施故障解方案有时可能会给其它用户造成临时性网络中断。如果造成的影响大于故障的紧急成程度,则应等到

7、下班后再进行。(例如:1000M主路径down,已自动切换到100M低速路径)七、故障解决 ( 复查 )网络故障得到解决之后,应将故障解决情况报告给当事人,让用户确认故障已消失。 同时,应将解决方案记录到网络文档中。 1. 对网络管理进行改进,避免出现同样的故障。 2. 为故障排错提供经验。 故障排错工具网络维护和故障排错工具:1. IOS命令 R# ping 172.16.8.1 R# tracert 172.16.8.1 R# sh run b route # sh ip int brief # sh ip protocol # sh ip route # debug ip ospf event # sh process cpu # sh process memory2. 日志服务 调试时弹出: console telnet 保存,方便以后查看: 本地存贮(buffer 4096字节) Syslog服务器3. NTP网络时间协议 R 、SW、服务器、PC 全网时间保持一致4. 端口镜像 SPAN 对交换型网络流量进行监控。5. SNMP网络管理服务 通过网络运维管理平台,对CISCO、H3C、服务器 统一进行管理,监控设备的CPU、内存利用率,接口带宽利用率等。 并且可以对设备的配置文件、访问网络的用户

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论