网络运维故障解决思路_第1页
网络运维故障解决思路_第2页
网络运维故障解决思路_第3页
网络运维故障解决思路_第4页
网络运维故障解决思路_第5页
已阅读5页,还剩15页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、网络排错大讲解说明: 首先,真心希望本文可以给需要进行网络排错的朋友带来实际性的帮助, 也希望可以耐心看下去。网络排错对于网络工程师或运维人员甚至对很多人(搞IT的朋友们)都十分重要,因此知道网络排错的一个详细流程以及流程中每一步的原理就显得非常重要了,当网络出现问题时,我们就可以迅速排查出网络问题所在,从而快速解决网络问题。这里要说的网络排错,应该是适合大部分对网络有一定了解的人员的,其实关于网络排错的方法,网络上已经有大部分的资料,但我个人觉得太多都只是停留在文字层面上的,对其中涉及的一些基本原理并没有提及,因此实用性并不大,这里希望写出一篇图文并茂并有一定技术性的网络排错文章给大家,让大

2、家真正掌握一套系统的网络排错方法。本文的一个思路:一、网络排错的必备条件二、网络排错的基本思路三、网络排错详细步骤四、最后重要说明一、网络排错的必备条件为什么还要必备条件?因为这里所讲的网络排错并不仅仅是停留在某一个小小命令的使用上,而是一套系统的方法,如果没有这些条件,我真的不能保证下面讲的这些你可以听得懂,并且能运用到实际当中,所以还是先看看这些基础的条件吧。1.熟悉OSI七层模型与TCP/IP协议栈这应该是网络排错要知道的最基本的知识了。无论是OSI七层模型还是DoD模型,都是用来描述网络通信的一个过程,以让我们对网络数据的发送和接收有一个大致的过程。OSI七层模型对应OSI七层模型的协

3、议,DoD模型对应DoD模型的协议,也就是TCP/IP协议栈。TCP/IP协议栈里面的协议就显得十分重要了,比如DNS、TCP、UDP、IP、ICMP、ARP,这些最基本的应该得知道吧,我们不需要有像TCP/IP协议栈中说得的那么细,但至少,对于这些协议的基本功能我们是必须得要知道的,我想这些就不是我一两名可以说清楚的了,还是那句话,自己百度一下吧。2.了解网络通信的基础设备和其对应的OSI层次像交换机、三层交换机、路由器、防火墙这些最基本的网络设备应该要有些了解,尤其是它们对应的OSI层次以及作用,比如普通的二层交换机对应OSI七层模型中的数据链路层,它可以隔绝冲突域,同时可能通过虚拟局域网

4、技术(VLAN)来隔绝广播域,二层交换机通过二层地址即MAC地址来实现数据帧的转发;再比如路由器,它对应网络层,可以提供路由寻址的功能等等。也许并不需要了解得那么细,但大概的一个过程我想还是应该要知道的。3.了解中小型企业网络的基本架构其实就是要知道上面所说的那些网络设备一般是怎么连接起来的,如果在实际环境中排错,应该就要知道当前网络的一个基本架构情况。这里简单提一下,一般中小型企业网络的基本架构都是这样的:接入层-汇聚层-核心层-网络出口。下面给个图:如果网络环境比较庞大,汇聚层和核心层都会有,像这里的话,就直接没有汇聚层,不过思想是一样的。下面讲的排错其实都是针对用户PC来说明的,事实上,

5、数据中心中的网络排错也是类似的。不管网络环境多么复杂,其实简化下来跟这个都是差不多的。4.知道常用的网络排错命令如果用户使用的是Windows操作系统,那么下面的这些命令就很重要了:ipconfig查看计算机的IP 地址、子网掩码和网关ipconfig/all查看计算机的IP 地址、子网掩码、网关和DNS 地址ping测试主机之间的网络连通性nslookup请求域名对应的IP 地址,并以此测试DNS 地址是否可用tracert -d路由追踪,并且不做反向解析如果使用的是Linux操作系统,那么也有对应的相关命令。其实说到底就是要熟悉你所使用的设备,当然,在实际网络排错的过程中,如果只是为了测试

6、网络通信是否正常,你可以把你自己熟悉的设备换上操作。5.清楚知道网络排错的一个重要原则网络排错,不就是要判断网络哪里出了问题,因此,你就必须要知道数据的走向。所以这个重要的原则是:关注数据的走向。下面讲的网络排错思路其实就是通过追踪数据的走向来一步步缩小网络故障点的,因此,时刻记住这一点非常非常重要!这也是为什么上面需要让你了解中小型企业网络的基本架构了。二、网络排错的基本思路基本思路如下,这跟网上的大多数人写的应该是差不多的。(1)检查物理链路是否有问题(2)查看本机IP地址、路由、DNS的设置是否有问题(3)测试网关或路由器的通畅情况。先测网关然后再测路由器,一级一级地测试(4)测试pin

7、g公网ip的通畅情况(平时要记几个外部IP)(5)测试DNS的通畅情况,可以直接ping网站地址下面的第三部分,就针对上面的基本思路来进行详细的说明。三、网络排错详细步骤 为了更好的讲述网络排错的过程和思路,假设我们有下面的一个网络环境:(说明:虽然是假设,但实际上该网络环境是博主通过GNS3联动虚拟机和真实网络架设起来的,所以是可以真实参考的)下面,我们就以上面这个网络环境为例子,详细介绍我们的网络排错思路,每一步要怎么做,每一步为什么要这样做以及这样做之后我们可以得到什么信息,都会做一个说明。(1)检查物理链路是否有问题这一步是我个人认为在做网络排错时必须要做的第一步!经常会听朋友说,领导

8、的电脑上不了网,需要过去排错,搞了老半天,还发现不了问题,最后在几经绝望之时,竟然发现网线都没接上电脑。这就真的是悲剧了,浪费了很多时间不说,这样的网络排错思路本来就是有错误的。因为也许不是每个人都可以去机房查看交换机的接线情况,所以这一步,我们排查的重点范围就应该放在如下面图所示的地方: 在这一步,下面几点是需要注意排查的:1.确认电脑本身的网卡有没有问题2.确认接的网线有没有问题3.本机所连接的交换机(如果可以去机房查看的话)如果上面这几点排查都没有问题了,那么就是该网络环境中的其他设备问题了。这一范围的排查相对比较简单,因为只涉及到物理链路的连接问题。对于这种测试,可以考虑使用测线器,但

9、个人的建议是,拿一台配置正确的笔记本来做测试也未尝不可。(2)查看本机IP地址、路由、DNS的设置是否有问题上面第一步,物理链路的排查没有问题了,也就是说,电脑接上网线之后,电脑有有反应了,可以识别,但是网络还是不通,来到这一步,就应该先把注意的范围放在电脑的设置上面了。这上步,我们关注的重点是:1.IP地址设置如果采用的是DHCP自动获取的方法,那么这时候只需要看自己本机的设置上有没有开启自动获取IP的设置以及有没有开启相关的服务;如果用的是静态IP,那么就必须要注意IP地址的填写有没有错(一般网络管理人员给的)、IP地址的子网掩码有没有问题(这很重要,对于静态IP,很多人在这里设置错误,建

10、议是,最好把IP地址、VLSM这方面的知识学一下)。一般可以用下面的命令查看:123456789101112C:UsersXpLeafipconfigWindowsIP配置以太网适配器本地连接:连接特定的DNS后缀.:本地链接IPv6地址.:fe80:4cf8:896fIPv4地址.:192.168.2.1子网掩码.:255.255.255.0默认网关.:192.168.2.254相关的设置可以在自己的计算机环境上面查看了。2.路由设置对于服务器、PC,一般是指默认网关的设置了;对于路由器本身或三层交换机,那就是静态路由或动态路由的设置问题了。3.DNS设置主要是要确保所设置的DNS服务器地址

11、到底有没有提供域名解析服务或者是否出现了故障,至于如何判断,后面会给出方法,这里关注的是,你得设置一个正确的DNS服务器地址或可以自动获取。在windows上面你可以通过下面的命令查看:1234567891011121314151617181920212223242526C:UsersXpLeafipconfig/allWindowsIP配置主机名.:XpLeaf-PC主DNS后缀.:节点类型.:混合IP路由已启用.:否WINS代理已启用.:否以太网适配器本地连接:连接特定的DNS后缀.:描述.:Intel(R)PRO/1000MTNetworkConnection物理地址.:00-0C-29

12、-7D-41-E5DHCP已启用.:否自动配置已启用.:是本地链接IPv6地址.:fe80:4cf8:896f:7d55:1432%11(首选)IPv4地址.:192.168.2.1(首选)子网掩码.:255.255.255.0默认网关.:192.168.2.254DHCPv6IAID.:234884137DHCPv6客户端DUID.:00-01-00-01-1C-13-6E-0D-00-0C-29-7D-41-E5DNS服务器.:202.116.145.145202.96.128.86(3)测试网关或路由器的通畅情况。先测网关然后再测路由器,一级一级地测试在上面的网络环境中,在网络通的情况下

13、,我们在电脑上使用命令tracert -d命令,会得到下面的结果:123456789C:UsersXpLeaftracert-d通过最多30个跃点跟踪到180.97.33.108的路由:112ms27ms16ms192.168.2.254276ms107ms126ms172.16.13.3359ms95ms93ms192.168.137.1这里就省略输出了通过这个测试结果,我们可以清楚地知道电脑在访问互联网时,数据的走向情况:根据这个数据走向,我们就可以得到一个重要的思路,就是根据数据走向来检测网络的通畅情况!因此,我们可以分两步:1.先测试电脑到网关192.168.2.254的通畅情况我们可

14、以在自己的电脑上自己ping网关的地址,看是否有响应:123456789101112C:UsersXpLeafping192.168.2.254正在Ping192.168.2.254具有32字节的数据:来自192.168.2.254的回复:字节=32时间=7msTTL=255来自192.168.2.254的回复:字节=32时间=18msTTL=255来自192.168.2.254的回复:字节=32时间=15msTTL=255来自192.168.2.254的回复:字节=32时间=16msTTL=255192.168.2.254的Ping统计信息:数据包:已发送=4,已接收=4,丢失=0(0%丢失

15、),往返行程的估计时间(以毫秒为单位):最短=7ms,最长=18ms,平均=14ms一般这样的判断方法是比较快的,但有时候,无论怎样ping都不能,那么则可能有以下的几种情况:a.网关设备做了禁止ping的设置b.网关接口或网关设备出现故障对于a,一般很少会在这些设备在做ping的限制操作,因为目前很网络设备如路由器或交换机的监控,都是通过ping操作来完成的。ping通192.168.2.254网关后,再ping一下172.16.13.1以确认电脑到整个网关设备都没有问题。对于ping不通的时候,我个人还建议在电脑上执行如下操作:123456789C:UsersXpLeafarp-a接口:1

16、92.168.2.1-0xbInternet地址物理地址类型192.168.2.254cc-03-0a-1c-00-00动态192.168.2.255ff-ff-ff-ff-ff-ff静态224.0.0.2201-00-5e-00-00-16静态224.0.0.25201-00-5e-00-00-fc静态239.255.255.25001-00-5e-7f-ff-fa静态即查看电脑本身有没有获取到网关的MAC的地址,显然,如果没有网关的MAC地址,那也是不可能ping通网关的,在排除了前面电脑设置的问题后,你可以猜测是网关设备出了问题,这时就可以联系网络工程师对网关设备进行测试了。2.测试到其

17、它路由器的通畅情况前面一步没有问题了,也就是电脑到网关通信正常了,再测试网关到出口路由器的通畅情况:这里,我们使用tracert -d命令就可以了:123456789C:UsersXpLeaftracert-d172.16.23.3通过最多30个跃点跟踪到172.16.23.3的路由17ms9ms20ms192.168.2.254292ms79ms89ms172.16.12.2362ms47ms46ms172.16.23.3跟踪完成。当然,如果发现不通,那么则可能是下面的情况:a.网关设备与路由器之间的物理链路问题b.网关设备与路由器之间的设置问题,比如路由协议、接口配置之类的出现上面的情况,

18、那就是网络工程师的问题了,当然,如果你是网络工程师,应该要马上查看一下设备的状态,看是不是设备哪里出现问题了。上面的步骤完成了,假设你的出口路由器设置是没有问题的,比如NAT与默认路由等的设置,那么我们大致可以知道,内网的一个基本通信是正常的(至少你的电脑和出口路由器的通信没问题),我们就要看看电脑到底能不能访问互联网了。(4)测试ping公网ip的通畅情况(平时要记几个外部IP)来到这一步的时候,就说明前面三步是没有问题的,也就是说,本地局域网络的通信是正常的,这时要做的就是判断本地局域网络与外网(公网)之间的通信有没有问题了:这里采取的是直接ping公网地址的方法,是为了排除DNS的影响(

19、万一你的DNS设置又有问题),至于要ping什么样的公网地址,个人建议是,可以ping一些没有禁止ping的公共DNS服务器地址,比如114.114.114.114和8.8.8.8的:123456789101112C:UsersXpLeafping114.114.114.114正在Ping114.114.114.114具有32字节的数据:来自114.114.114.114的回复:字节=32时间=52msTTL=61来自114.114.114.114的回复:字节=32时间=127msTTL=87来自114.114.114.114的回复:字节=32时间=96msTTL=82来自114.114.11

20、4.114的回复:字节=32时间=100msTTL=74114.114.114.114的Ping统计信息:数据包:已发送=4,已接收=4,丢失=0(0%丢失),往返行程的估计时间(以毫秒为单位):最短=52ms,最长=127ms,平均=93ms这样之后,基本上就可以确定网络是没有问题的了。当然,这里并没有提到出口放置防火墙的情况,实际上,思路是一致的,但是,你需要考虑的是,你的访问数据有没有被防火墙给过滤掉,是数据出去的时候过滤了,还是数据回来的时候过滤了?由于还要涉及到防火墙的设置,这里就不再提及了,只是仍要注意这一点就是了。当然,也不排除是ISP那边的问题了,打电话去问问吧。(5)测试DN

21、S的通畅情况,可以直接ping网站地址如题,可以直接ping网站地址,看有没有回显IP地址,至于通不通是另外一回事,只要可以回显IP地址,那么DNS就没有问题了,不过这里仍然要说一下nslookup这个命令,这是一个非常好用的命令,我平常自己在网络排错时,基本上都会用到:12345678910111213141516171819202122232425262728293031C:UsersXpLeafnslookup默认服务器:server1.gdut-Address:202.116.145.145服务器:server1.gdut-Address:202.116.145.145非权威应答:名称

22、:Addresses:180.97.33.107180.97.33.108Aliases:服务器:server1.gdut-Address:202.116.145.145非权威应答:名称:Address:119.147.70.1Aliases:服务器:server1.gdut-Address:202.116.145.145非权威应答:名称:Address:183.56.147.1Aliases:当然也可以像下面这样使用:1234567891011121314151617C:UsersXpLeafnslookup服务器:server1.gdut-Address:202.116.145.145非权威应答:名称:Addresses:180.97.33.108180.97.33.107Alias

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论