ADSL故障处理流程与方法.doc_第1页
ADSL故障处理流程与方法.doc_第2页
ADSL故障处理流程与方法.doc_第3页
ADSL故障处理流程与方法.doc_第4页
ADSL故障处理流程与方法.doc_第5页
已阅读5页,还剩19页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

课程 BA000408 ADSL故障处理流程与方法ISSUE 1.0BA000408 ADSL故障处理流程与方法 ISSUE1.0ISSUE 1.0目 录目 录第1章 故障处理一般流程和常用方法11.1 对维护人员的基本要求11.2 故障处理的一般流程21.2.1 信息收集尽可能详尽地获取各种原始信息41.2.2 判断确定故障的范围与种类51.2.3 定位确定故障的具体原因61.2.4 排除采取适当的措施或步骤清除故障、恢复系统61.3 故障定位的常用方法71.3.1 原始信息分析71.3.2 告警信息分析81.3.3 指示灯状态分析91.3.4 仪器、仪表辅助分析101.3.5 性能统计辅助分析101.3.6 测试 / 环回121.3.7 对比 / 互换131.3.8 倒换 / 复位141.4 华为技术支持的联系方式15第2章 MA5100业务故障处理流程16第3章 MA5100系统故障数据采集19第4章 MA5100软件配置自检表2115BA000408 ADSL故障处理流程与方法 ISSUE1.0第4章 MA5100软件配置自检表第1章 故障处理一般流程和常用方法1.1 对维护人员的基本要求华为公司的综合接入设备MA5100系列产品为运营商提供丰富的接入手段,既可灵活构建智能小区信息平台,也可为企业用户提供专线互联。MA5100系列产品主要包括MA5100、MA5103、MA5105等,在国内及其海外等国家和地区得到大规模应用。因此,如何在系统故障的情况下迅速定位并排除故障,是设备稳定、安全运行的重要保障。为了正确地使用本手册,该系列综合接入设备产品的维护人员应具备以下基本素质:1. 具备专业素质和技能维护人员应做到以下应知应会: 熟悉TCP/IP原理、ATM原理、以太网交换原理等通信专业知识。 熟悉xDSL相关原理,特别是有关ADSL的原理及其业务流程等知识。 熟悉相关国标技术规范。 了解Client/Server、数据库常识等及其计算机网络基础知识。 熟练掌握MA5100系列多业务接入设备的日常操作及计算机基本操作。2. 了解系统和组网维护人员应对本多业务接入设备、网络组网情况非常熟悉:l 熟知MA5100系列产品的硬件结构及性能参数。l 熟知MA5100系列产品在网络中的地位。l 熟知MA5100系列产品在网络中的路由组织。l 熟知交换机与各组网设备所使用的信令或协议。l 熟悉相关的传输设备的网络结构和信道分配。3. 熟悉设备的操作为了提高故障处理的效率,防止误操作,维护人员应持证上岗,并对MA5100系列产品的相关操作流程应十分熟练,部分重大故障的处理建议由通过华为技术有限公司B培以上的人员执行,除此之外,维护人员在对设备进行操作时,还应十分清楚以下内容:l 哪些操作将导致部分或全部业务中断。l 哪些操作将造成设备损坏。l 哪些操作将对计费产生重大影响。l 哪些操作将导致用户投诉。l 有哪些应急或备份的措施。4. 掌握常用仪器、仪表的使用仪器、仪表在交换机的故障处理过程中有着不可替代的作用,它以直观、量化的数据直接反映故障的所在,在迅速进行故障定位、提高故障处理效率的过程中发挥着重要的作用。维护人员应熟练掌握下列仪器、仪表的使用:l 万用表l 光功率计l E10表l ADSL线路仿真仪l ADSL测试仪l SMARTBITSl INTERNET ADVISOR1.2 故障处理的一般流程故障排除模型指合理的,一步一步找出故障原因并解决的总体原则。它的基本思想是系统地将由故障可能的原因所构成的一个大集合缩减(或隔离)成几个小的子集,从而使问题的复杂度迅速下降。此处给出故障排除模型供参考故障现象详细说明搜集相关信息的详细情况分析引起故障的可能原因对每一可能原因制定排除方案实施该方案故障排除了吗?文档记录YN恢复实施方案前的网络状态图1-1 故障排除模型一般情况下,故障处理需经历“信息收集故障判断故障定位排除故障”等四个阶段。在涉及到一个具体故障排除的时候,除了要遵循上节的结构化模型的大原则外,还应该有一些技巧性的方法。1. 分层故障排除法 MA5100接入设备跨越了OSI/ISO模型的下两层,由下向上的排错是很好的想法。l 物理层所要解决的对象:电缆、连接头、跳线、时钟等等。l 数据链路层所关注的:封装的一致性(1483B,IPoA)、链路的是否过度使用等。2. 分块故障排除法用分块法把配置文件分成几个主要部分,逐块进行排除。l 管理员部分(路由器名称、口令、服务、日志)l 端口部分(地址、封装、带宽、度量值开销、认证)l 流量管理部分(接入控制列表、团体)l 带宽之外的接入(主控台、远程登录、拨号)其中,IP路由协议、流量管理3. 分段故障排除法如果MA5100跨越电信部门提供的线路而不能相互通信时,分段排障法是有效的。1.2.1 信息收集尽可能详尽地获取各种原始信息1. 必要性任何一个故障的处理过程都是从维护人员获得故障信息开始,这种故障信息的来源一般有四种途径:l 用户或客户中心的故障申告l 相邻局所维护人员的故障通告l 设备告警系统的告警输出l 日常维护或巡检中所发现的异常在设备系统的日常维护中,前三种途径所提供的故障信息量占绝大多数,但是,在很多情况下,特别是故障信息通过电话反馈时,我们所获取的第一故障信息对故障现象的描述往往是不完整的、不全面的,也是不深刻的,通常不能直接反映问题的本质所在。随着网络规模的扩大,组网情况也日趋复杂,各种内、外部因素的变化和干扰常常对设备的正常运行产生连带影响,使设备的故障成因日趋复杂,同时也增加了故障定位的难度。如果仅仅依靠简单的信息来分析、判断问题,而忽视进一步收集各种相关的原始信息,往往事倍功半甚至寸步难行,它不但使故障判断的范围扩大、难度增加,而且还有可能在分析思路上南辕北辙,以致贻误故障处理时机,给交换机的稳定、安全运行带来严重威胁。2. 实用性尽管设备的许多故障现象的成因十分复杂,但是,从统计学上分析,各种因素同时作用并导致设备发生故障的概率是很小的,也就是说,导致设备故障的成因在某一具体时刻具有单一性。这就使利用排除法迅速定位故障成为可能。如果在故障处理的初期阶段,就注重收集各种相关的原始信息,很多情况下,它可以帮助维护人员大大缩小故障判断的范围,加快定位问题的速度,并提高故障定位的准确性,这对于提高故障处理的时效性,降低设备误操作的风险,以及提高客户满意度等方面都具有积极的意义。3. 维护建议l 维护人员要有收集相关信息的强烈意识,在遇有故障特别是重大故障时,一定要先弄清楚相关情况后再决定下一步的工作,切忌盲目处理。l 维护人员要加强业务学习,特别是相关TCP/IP、ATM系统原理和相关数据通信知识,这样,在故障的情况下才能快速联想,把思路引向问题的焦点。l 在接听故障申告(通告)电话时,维护人员要善于引导,尽量从多方面、多角度提问或询问相关问题。l 维护人员应加强横向、纵向的业务联系,建立与其他局所或相关业务部门(如传输机房等)维护人员的良好业务关系,这对于信息交流、技术求助等都是很有帮助的。1.2.2 判断确定故障的范围与种类在获取故障信息以后,接下来需要对故障现象有一个大致的定义确定故障的范围与种类,这也就是说,需要判断故障发生在哪个范围,是属于哪一类、何种性质的问题。1. 确定故障的范围确定故障的范围就是确定故障处理的方向,也就是说在什么地方、顺着什么思路去查找故障的具体原因。在MA5100多业务接入设备系统中,故障的范围一般是指故障发生的区域,它往往与设备的功能模块重合,这是由设备的模块化设计所决定的。本手册将主要以MA5100系统的功能模块划分来判定故障的范围,全书共分为以下六个系统模块:l ADSL接入系统(包括ADSL线路和数据配置、ADSL网吧、ADSL终端) LAN接入系统(包括LAN专线互联、IP-DSLAM应用) CES电路仿真接入系统 FR帧中继接入系统 IMA接口 告警分析与处理2. 确定故障的种类确定故障的种类(性质)就是确定采用何种方法、何种手段分析问题、解决问题。关于故障的分类,将根据MA5100系统的不同的功能模块,按照通常的思维逻辑采取不同的分类方法进行,具体的情况请见本手册后续各章节的讨论。常用的故障判断方法详见本章第1.3节“故障判断与定位的常用方法”。1.2.3 定位确定故障的具体原因前面提到,尽管导致MA5100系统故障的成因可能十分复杂,但是在统计上和实践上,某一时刻多种因素同时作用导致交换机故障的概率是很小的,也就是说,故障的成因在某一具体时刻具有单一性。故障定位就是“从众多可能原因中找出这个单一原因”的过程,它通过一定的方法或手段分析、比较各种可能的故障成因,不断排除非可能因素,最终确定故障发生的具体原因。准确而快速的定位不仅有利于提高故障处理的时效,而且还可以有效避免因盲目操作设备而导致故障扩大化等人为事故,为采取何种手段或措施排除故障提供指导和参考,是故障处理过程中的重要环节。本章将在下节简要介绍“故障判断与定位的常用方法”。1.2.4 排除采取适当的措施或步骤清除故障、恢复系统在故障原因最终定位以后,就进入了故障处理程序的最后一步排除故障。排除故障是指采取适当的措施或步骤清除故障、恢复系统的过程。如检修线路、更换单板、修改配置数据、倒换系统、复位单板等。有关这方面的操作指导或建议,请参考贵公司的操作规程,或者参考华为公司的相关操作指导,如“单板更换注意事项”、“倒换操作注意事项”、“加电重启注意事项”等。1.3 故障定位的常用方法1.3.1 原始信息分析原始信息是指通过用户故障申告、其他局所故障通告、维护中所发现的异常等所反映出来的故障信息,以及维护人员在故障初期通过各种渠道和方法收集到的其他相关信息的总和,是进行故障判断与分析的重要原始资料。原始信息分析主要用来判断故障的范围、确定故障的种类,在故障处理的初期阶段,为缩小故障判断范围、初步定位问题提供判据。如果维护经验丰富,甚至还可以直接定位故障。【案例】用户在使用ADSL业务过程中,如果业务中断,不能上网,可以按照如下流程进行指导用户收集原始信息,并指导处理。1. 自查方法(一看二查三PING)一看:通过观察Modem的指示灯初步判断故障原因主要是观察Modem指示灯“PWR”、“WLK”、“LLK”的状态来判断故障(本文专指E-TEK Modem),通过一“看”,可以定位如下基本故障:l Modem电源故障l Modem以太网接口故障l Modem线路不能激活故障二查:通过检查计算机当前配置数据、状态判断故障原因通过一“看”,基本能够排除一些初步故障,如果PWR、WLK、LLK指示灯正常,但是业务仍然不能通,继续下面步骤:根据开通时记录的数据,对计算机的配置进行检查(主要包括网关、DNS服务器地址、IP地址及掩码、WINS地址的检查),如果有不同的地方,要修正成开通时的记录。如果数据修正了还不行,进行第三步:三“Ping”三“Ping”:通过Ping/拨号方式检查链路层通断情况,进一步定位问题。这一步检查网络的基本的连接情况,定位是否为接入层设备的问题。对这一步,分两种应用情况:拨号上网模式:通过拨号来检查基本连接情况。静态地址分配模式/动态地址分配:通过Ping命令来检查基本连接情况。【点评】由上述案例可见,通过指导用户从不同角度、层次进行提问和引导,通过用户来收集相关详细信息来解决问题。可见,重视和善于收集原始信息并对之进行有效、充分的分析,可以帮助维护人员少走很多的弯路,往往具有事半功倍的效果。原始信息分析不仅可以用在用户故障的处理上,在其他故障特别是处理MA5100上层网络故障,原始信息的收集就更具有举足轻重的作用。比如,上层汇聚层设备运行是否正常、某些参数的定义是否正确等。1.3.2 告警信息分析告警信息是指MA5100系统告警系统输出的信息,通常以声音、灯光、LED显示、屏幕输出等形式提供给维护人员,具有简单、明了的特点,其中告警信息,包含故障或异常现象的具体描述、可能的发生原因、有哪些修复建议等等,涉及MA5100系统的硬件、链路、系统配置等各个方面,信息量大且全,是进行故障分析和定位的重要依据之一。告警信息分析主要用于查找故障的具体部位或原因,由于MA5100系统输出的告警信息丰富、全面,因此常常可以用来直接定位故障的原因,或配合其他方法共同定位故障的原因,是故障分析的主要手段之一。【案例】2002/04/11 11:15:24 major ADL:Port auto deactivate for defect2002/04/11 11:15:24 major ADL:Port auto deactivate for defect2002/04/11 11:15:24 major ADL:Port auto deactivate for defect2002/04/11 11:15:23 major ADL:Port auto deactivate for defect以上信息说明端口激活后,因线路干扰引起信号失步、帧失步、远端设备功率丢失、噪声容限失步、ATM信元头失步等故障,并在一定时间内不能恢复则产生本告警。【点评】告警信息分析法,定位直观、准确,是MA5100系统故障分析的常用方法之一。1.3.3 指示灯状态分析MA5100系统的每块单板上都有相应的运行、状态指示灯,有的还有功能或特性指示灯,这些指示灯除了直接反映相应单板的工作状况以外,大部分还可反映诸如电路、链路、光路、节点、主备用等的工作状态,是进行故障分析和定位的重要依据之一。 指示灯状态分析主要用于快速查找大致的故障部位或原因,为下一步的处理提供思路。由于指示灯所包含的信息量相对不足,因此,它常常与告警信息分析配合使用。【案例】以最常见的ADLD单板为例,表1-1是ADLD面板指示灯的含义说明。比如: 如果“ALM”灯亮,则说明ADSL线路出现故障。表1-1 ADLD业务板指示灯说明指示灯含义说明RUN运行灯(绿色)指示单板工作状态。运行灯1秒亮/1秒灭周期闪烁表示单板运行正常。ALM告警灯(红色)正常时灭,当检测到线路故障时,告警灯亮。另外,表1-2是系统板MMXA面板指示灯的含义说明。如果如果“ALM”灯亮,则说明系统内部发生异常。表1-2 MMXA系统板指示灯说明指示灯含义说明RUN运行灯(绿色)指示单板工作状态。 运行灯1秒亮/1秒灭周期闪烁表示单板运行正常。ALM告警灯(红色)系统正常时灭,系统内部发生异常时,告警灯亮。ACT主用指示灯(绿色)主用时亮,备用时灭。【点评】维护人员平时应注意加强对单板指示灯含义的学习,以提高故障情况下的快速反应能力。1.3.4 仪器、仪表辅助分析应用仪器、仪表进行故障分析与定位,是MA5100系统故障处理常用的技术手段。它以直观、量化的数据直接反映故障的本质,在ADSL线路分析、电源测试、信令分析、波形分析、误码检测等方面有着广泛的应用。【案例】某网吧用户开通ADSL接入业务后,反映上网速度慢,且有时网页打不开。到现场观察,发现单台机器下载本省信息港软件速度只有13Kbytes,下载外省网站软件只有6-7Kbytes。经检查,排除了MA5100局端设备和ADSL Modem的问题,通过仪器(万用表)测试线路条件,发现线路参数不符合条件,从而导致了用户上网速度慢用万用表或112测量台测试a,b线对地室外交、直流电压应结果为1V以下都属于正常的,另外,还应该满足以下条件:a,b线间电容满足Ca-b150nF,特殊情况最大也不能超过200nF。a线对地电容与b线对地电容的差值不大于5。a,b线间绝缘电阻,以及a,b线对地绝缘电阻应大于5M欧。a,b线间的环路电阻小于1.1K欧。【点评】仪器的关键在于使用方法,维护人员可参考相关仪器的使用说明书,本手册不再赘述。1.3.5 性能统计辅助分析通过MA5100系统提供的许多SHOW查询命令,通过分析其中的数据或状态,可以获得系统现在状态下的性能,以辅助诊断、定位相关的故障,为后续分析提供宝贵的思路。【案例】(1) 查看光口流量MA5100(config)#show cell statistics port(0-4)/(0-15)/(0-31):0/7/0 端口号 光口发送 光口接收 - - - 0 347050 7473832 (2) 查询ACPU的流量:查看ACPU某个指定连接的计数,该计数包括上行的Ingress、Egress计数和下行Ingress、Egress计数,判断信元是否在ACPU上被丢弃了,丢弃的原因可能有:信元头错误,流控丢弃等。MA5100(config)#show cell statistics acpu 0/7 1-32000:3 /通过PVC CID号查询PVC流量 PVC连接号: 3 上行流量中的接收流量(信元): 337569 上行流量中的发送流量(信元): 337569 下行流量中的接收流量(信元): 2910266 下行流量中的发送流量(信元): 2910266MA5100(config)#show vcc statistics 3 /查询结果与上面相同 PVC连接号: 3 上行流量中的接收流量(信元): 355518 上行流量中的发送流量(信元): 355518 下行流量中的接收流量(信元): 2996774 下行流量中的发送流量(信元): 2996774 (3) 查询端口上的流量:通过对某一个端口的流量进行观察,可以判断该端口是否出现了故障。MA5100(config)#show cell statistics actu 0/10 /查询所有端口流量 端口号 接收(UTOPIACellBus) - - - 0 0 0 1 0 0 2 6480683 851171 3 0 0 MA5100(config)#show cell statistics port 0/10/2 /查询一个端口流量 端口号 接收(UTOPIACellBus) - - - 2 6495285 851737 一般来说,这几种流量的查看得方式各有侧重,代表从不同的角度和故障定位方式,但是有时经常需要这些方式结合起来共同分析。分析如下:(1) 光口没有接收流量,表示没有收到上级设备信元,可以检查光口工作是否正常。(2) 有光口接收流量,无ACPU下行接收流量,或者有ACPU上行发送流量,无光口上行发送流量,一般是MMX光口与APC之间有问题,如检查光扣板是否与MMX母板连接是否正确。(3) 有ACPU下行接收流量,而无ACPU下行发送流量, 或者有ACPU上行发送流量,而无ACPU上行接收流量,则可能是APC上发生拥塞,可以将该PVC流控去掉再做测试。(4) ACPU有下行发送流量,而ACTU无接收流量,或者ACTU有发送流量,而无ACPU上行接收流量,则可能是业务单板或者端口问题,可以换另一业务单板或者更换另一端口进行测试。【点评】在实际的故障定位过程中,往往是利用各种性能统计方法交叉应用,互为补充,如本案例中就用到了几种方法,这几种流量的查看方式各有侧重,代表从不同的角度和故障定位方式,但是有时经常需要这些方式结合起来共同分析。可见,熟练掌握、灵活应用各种判断与定位方法,是提高故障处理技能的重要前提。1.3.6 测试 / 环回测试主要是指借助于仪器仪表、软件测试工具等手段,对可能处于故障状态的用户线路、设备等进行相关技术参数的测量,根据测量的结果判断设备是否已经故障或者正处于故障的边缘。环回主要是指采用硬件或软件的方法,对某一传输设备或传输信道采取自发自收(自环)的方法,通过判断自环后传输设备、传输信道、业务状况、信令配合等情况的正常与否,来确定相关硬件设备的状况、软件参数的设置是否正常,是定位传输问题、中继参数设置是否准确等的最常用方法之一。【案例】案例一:MA5100系统ADSL上网用户出现故障,为了定位故障,采用分段故障排除法来判断故障发生在MA5100系统的上层设备还是MA5100系统以下设备。通过用户上级ATM设备PVC环回测试,证明MA5100系统、RTU、传输系统等工作是否正常、MA5100数据配置是否正确。(5) 在MA5100系统内部,在同一块ADSL用户板或者不同的ADSL用户板上,选择两个ADSL端口;(6) 建立这两个ADSL端口到光口的PVC;(7) 在ATM设备将这两条PVC环回;(8) 在这两个端口之间进行互Ping。如果能够互通,基本上可以说明MA5100系统、传输系统等都没有问题,问题发生在MA5100的上层网络设备中。注: 如果身边只有一个RTU,则建立ADSL和NMS到ATM的PVC(如果有LAN板的话,还可以建立VLAN到ATM的PVC)然后在ATM设备中环回。【点评】测试与环回常常配合使用,相得益彰。环回有软件环回与硬件环回之分,软件环回操作简单,使用灵活,但可靠性不如硬件环回。 注意:软件环回有时由于疏忽往往容易忘记取消环回,从而系统的运行带来一定的操作隐患,因此,为了避免此类事件的发生,我们建议维护人员应养成经常记录的习惯1.3.7 对比 / 互换对比是指将故障的部件或现象与正常的部件或现象进行比较分析,查出不同点,从而找出问题的所在,一般适用于故障范围单一的场合。互换是指用备件进行更换操作后,仍然不能确定故障的范围或部位,此时将处于正常状态的部件(如单板、光纤等)与可能故障的部件对调,比较对调后二者运行状况的变化,以此判断故障的范围或部位,一般适用于故障范围复杂的场合。【案例】“用户能打电话不能上网”,通过如下分析对比历史记录和相邻路参数,发现问题l 112测试数据与此前测试的112数据对比,观察是否有变化。主要有a、b线间电容、a、b线对地电阻、a、b线对地电容、环路电阻。l 对比从MA5100设备上读取的该端口的连接参数与上次记录数据的变化,重点是上、下行通道衰减值。l 对比相邻用户的连接参数,尤其是上、下行通道衰减是否有大于5dB的差异,如果有,则可能是线路有问题。【点评】在实际的故障定位过程中,往往是各种方法交叉应用,互为补充,如本案例中就用到了环回、互换、测试、对比等各种方法,可见,熟练掌握、灵活应用各种判断与定位方法,是提高故障处理技能的重要前提。 注意:必须指出的是,互换操作具有一定的风险性,例如,将处于短路状态的单板换到正常的机框后又造成正常机框损坏等,因此,互换方法的使用需要谨慎行事,要以确保不导致新故障为前提1.3.8 倒换 / 复位倒换是指将处于主备用工作方式下的交换设备进行人工切换的操作,也就是说将业务从主用设备上全部转移到备用设备上,对比倒换后系统的运行状况,以确定主用设备是否异常或主备用关系是否协调。复位是指对交换设备的部分或全部进行人工重启的操作,主要用于判断软件运行是否混乱、程序是否“吊死”等软件BUG问题,是不得已采取的极端操作行为。相对于其他方法而言,倒换或复位不能对故障的原因进行精确定位,而且由于软件运行的随机性,倒换或复位后故障现象一般难以在短期内重现,从而容易掩盖故障的本质,给交换设备的安全、稳定运行带来隐患,因此,该方法只能作为一种临时应急措施,在迫不得已的情况下谨慎使用。 注意:对主控类单板的倒换操作一定先执行备份操作,避免系统数据丢失。由于复位操作常常会导致系统业务的中断,甚至可能由于操作不慎而导致系统瘫痪,给系统的日常运营带来严重的负面影响,因此,该操作仅适用于影响范围小、有备份措施或经上级批准操作的场合,一般情况下,不建议使用复位操作来进行故障的定位。1.4 华为技术支持的联系方式如果您在日常维护或故障处理过程中遇到有难以确定或难以解决的问题的时候,或者通过本手册的指导仍然感觉没有把握,您可以通过电话、传真或电子邮件联系华为驻当地办事处的技术支援人员,或直接联系华为公司客户服务中心,我们将为您提供周到的技术支持服务。同时,您在向华为工程师反馈问题的时候,请您注意提供或收集以下信息: 故障局点的详细名称(全称) 联系人姓名、电话号码 故障发生的具体时间 故障现象的详细描述 交换机的主机软件版本 故障后已采取的措施和结果 问题的级别及希望解决的时间华为公司将安排相关人员进行跟踪处理。l 另外,您也可以从华为技术有限公司的技术支持网页上直接获取最新的技术资料,网址是: 。第2章 MA5100业务故障处理流程1. 目的本流程是针对华为公司MA5100设备在运行过程中或者操作过程中可能出现的紧急问题,如设备瘫痪、部分或者全部业务中断、设备不能管理等而制定的操作指导,其目的是在设备发生故障时,提供紧急维护的手段。指导书中同时提供了一些预防措施,使得在故障发生前及时发现故障的苗头,在故障发生后,降低故障对系统的影响。2. 使用对象MA5100设备维护人员。3. 适用场合设备出现紧急问题时,指导设备维护人员进行初步的故障定位与排除。4. 预防措施为保证MA5100稳定运行,尽最大可能减少突发事故,请遵照MA5100日常维护建议及操作指导做好日常维护。5. 应急措施紧急情况界定:为了将紧急情况下的设备故障与日常维护中出现的设备故障相区分,我们特将MA5100系统中的紧急情况界定如下(根据对用户的影响界定): 部分用户故障 全部业务中断6. 应急措施及应急流程在出现紧急情况后,请根据以下图中的MA5100故障处理流程“应急流程”采用相应的应急措施。图2-1 MA5100ADSL业务故障处理流程7. 信息采集与信息记录信息采集与记录的内容可参照1.4.6中的各个步骤的不同要求进行。对紧急处理过程尽可能的详细记录是申请华为公司进一步技术支援的基础,可缩短进一步处理问题的时间。8. 通报和技术支援通过应急流程的处理,不管是否成功排除故障,请尽快与华为公司客服中心联系。华为客服中心热线: TEL8008302118 FAX术支持网站: 技术支持邮箱:S通过紧急处理若未能成功排除故障,请采用电话或传真的方式申请华为公司工程师支援。传真件可采用设备紧急维护通知单的形式。 请将紧急处理中更换的单板类型通知华为公司,并根据维保条款请求提供相应备板。22第3章 MA5100系统故障数据采集如果在故障处理的初期阶段,就注重收集各种相关的原始信息,很多情况下,它可以帮助维护人员大大缩小故障判断的范围,加快定位问题的速度,并提高故障定位的准确性,这对于提高故障处理的时效性,降低设备误操作的风险,以及提高客户满意度等方面都具有积极的意义。以下就有关MA5100系统常见相关原始信息的收集作简要的概述。(主要针对MA5100 V100R003版本的命令,如果涉及到MA5100 V100R002故障信息收集,相关命令请参考R002版本的操作手册)1. 采集系统基本信息显示主机版本 show version 显示单板/端口信息 show board 框号 show board 框号/槽位号显示系统路由表 show routeping 相关ip地址 ping ip-address (与 Radium8750/MA5200 相连的网管网关等)2. 采集ADSL相关信息显示引用模板 show adsl template template index (模板索引)显示流量索引 show traffic all显示故障线路激活参数 show line operation port-id (端口号)显示远端RTU信息 show modem atu-r portid (端口号)显示相关 PVC show pvc slot显示实时PVC流量(连续执行五次) show vcc statistic cid (pvc 索引)3. 采集LANC板相关信息显示 单板VLAN ID信息 show vlan 框号/槽位号显示单板端口VLAN ID 信息 show board 框号/槽位号显示端口实时流量(连续执行五次) show statistics port port-id (端口号)4. 采集光口相关信息显示光口状态 show board 框号/槽位号/端口号显示光口流量(连续执行五次)show cell statistics port 框号 /槽位号 /端口号 5. 采集日志告警记录显示日志 show log 显示告警信息 show alarm record all 6. 有关IMA信息的采集查看版本信息 show version查看单板cpu占用率 show cpu查看IMA配置信息 show ima config查看IMA组参数 show ima group parameter 查看IMA组运行状态 show ima group run-state查看组性能统计状态信息 show ima group performance state查看组性能统计信息 show ima group performance statistic查看链路参数 show ima link parameter查看链路运行状态 show ima link run-state查看链路性能统计状态信息 show ima link performance state查看告警历史记录 show alarm record& 说明:除进行以上的信息收集外,还应注意一下几点:1. 正确描述故障中断时间及恢复时间(如已经恢复)2. 详细描述故障现象及恢复方式(如已经恢复)3. 附上组网图第4章

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论