华为技术培训资料-OptiX PTN 产品故障维护指导书.ppt_第1页
华为技术培训资料-OptiX PTN 产品故障维护指导书.ppt_第2页
华为技术培训资料-OptiX PTN 产品故障维护指导书.ppt_第3页
华为技术培训资料-OptiX PTN 产品故障维护指导书.ppt_第4页
华为技术培训资料-OptiX PTN 产品故障维护指导书.ppt_第5页
已阅读5页,还剩44页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

2019/11/15,OptiX PTN 产品故障维护指导书,Page 2,前言,本课程针对PTN产品维护工程师开发。通过介绍一些故障定位的方法帮助故障维护人员分析定位故障。通过一些典型的故障来阐述常用故障定位方法的应用。,Page 3,学习指南,学习本课程之前,建议先学习PTN产品简单介绍、PTN产品硬件概述、PTN产品软件特性概述、PTN产品开局、调测、PTN业务及组网应用、PTN产品保护特性等课程; 本课程的重点为PTN的日常维护和巡检项目。,Page 4,课程目标,学习完此课程,您应能: 熟悉故障定位的常用方法 能处理一些常见故障,Page 5,内容介绍,第1章 故障处理前的准备 第2章 故障处理基本思路和方法 第3章 PTN设备数据采集介绍 第4章 故障处理案例分析,Page 6,内容介绍,故障处理前的准备 掌握专业技能 熟悉工程组网信息 做好故障现场数据的采集与保存,Page 7,掌握专业技能,熟悉IP网络原理知识 了解告警信号流及告警产生机理 熟悉PTN设备和网管的基本操作 熟悉常用仪表的基本操作,Page 8,熟悉工程组网信息,网络拓扑 业务配置 设备运行状态 工程文档,Page 9,做好故障现场数据的采集与保存,网路拓扑 网管日志 当前和历史告警 黑匣子记录,Page 10,本节我们主要学习了: PTN产品故障定位前的一些准备,为后续的故障分析奠定基础,小结,Page 11,内容介绍,第1章 故障处理前的准备 第2章 故障处理基本思路和方法 第3章 PTN设备数据采集介绍 第4章 故障处理案例分析,Page 12,内容介绍,故障处理基本思路和方法 告警、性能分析法 环回法 替换法 经验处理法 OAM/PING调试法 TRACEROUTE调试法,Page 13,告警、性能分析法,通过设备告警指示灯获取告警信息,一、通过机柜顶部的告警指示灯查看告警 二、通过单板告警指示灯查看告警,设备指示灯仅反映设备当前的运行状态,对于设备曾经出过故障,无法表示 设备指示灯状态只能反映设备告警级别,而不能准确告知具体告警,缺点,适用于设备维护人员配合处理故障时使用,Page 14,告警、性能分析法,通过网管获取告警和性能信息,适用于网管维护人员处理故障使用,全面性,不仅仅是一个站、一块板的故障信息,而且是全网设备的故障信息,详实性,能够获取设备当前存在哪些告警、告警发生时间,以及设备的历史告警;能够获取设备性能事件的具体数值,Page 15,环回法,GE,FE,内环回,外环回,PTN网元设备,SDH,SDH,环回可能导致 其它在用业务中断,软件环回/硬件环回 内环回/外环回 MAC环回/PHY环回,Page 16,环回法,4.初步定位单板问题,“环回法”的步骤:,1.环回业务通道采样,2.画业务路径图,3.逐段环回,定位故障站点,Page 17,环回法,PTN产品对软件环回的支持介绍,Page 18,替换法,适用场合,排除外部设备的问题 故障定位到单站后,排除单站内单板的问题,替换法就是使用一个工作正常的物件去替换一个 被怀疑工作不正常的物件,可替换物件包括线缆、光纤、法兰盘、电源、单板、设备等。,Page 19,经验处理法,适用场合,仅做为应急处理时使用,临时恢复业务,复位单板 单站重启 重新下发配置 将业务倒换到备用通道,该方法不能彻底查清故障原因,除非不得已,建议使用其他方法,Page 20,OAM/PING调试法,适用场合,排除外部设备的问题,OAM或PING用于检测首末节点的网络连接是否可达:链路故障如果可以使用OAM情况下尽量使用OAM进行调试,Page 21,TRACEROUTE调试法,适用场合,将链路故障定位到单站,TRACEROUTE 命令用于测试数据报文从发送主机到目的地所经过的网关,主要用于检查网络连接是否可达,以及分析网络什么地方发生了故障,Page 22,本节我们主要学习了: PTN产品基本故障定位的各种方法,为后续的网路维护及故障定位奠定了基础,小结,Page 23,内容介绍,第1章 故障处理前的准备 第2章 故障处理基本思路和方法 第3章 PTN设备数据采集介绍 第4章 故障处理案例分析,Page 24,内容介绍,PTN设备数据采集介绍 数据采集内容 数据采集方法,Page 25,数据采集内容,常见的告警、性能等信息的采集 文件采集,一般较少用到 日志文件的采集。(PTN记录设备运行情况的黑匣子,可以借此判断设备是否运行正常,常用于故障定位),Page 26,数据采集内容,SCA、CXP单板: ofs1/log/ 和ofs2/log/ 下的全部文件 如果需要取备主控,则取/stdby/ofs1/log/ 和/stdby/ofs2/log/ 下全部文件 如果打开了智能(:cfg-get-itgattrib返回enable),还请取主控板下文件:mfs/log/asonlog.txt和备主控下文件stdby/mfs/log/asonlog.txt EG16、MP1、XCS单板: ofs1/log/ 下的全部文件 PS:在采集数据前,请用Navigator登录到目的网元,下发命令:mon- backup-bb:bid(bid:主控或单板板位号)备份黑匣子;,Page 27,数据采集方法(Navigator),必须手工输入文件名和路径,Page 28,数据采集方法(FTP),Page 29,本节我们主要学习了: PTN产品发生故障时的故障采集内容及方法,为后续网路上发生故障提供有效的定位手段,小结,Page 30,内容介绍,第1章 故障处理前的准备 第2章 故障处理基本思路和方法 第3章 PTN设备数据采集介绍 第4章 故障处理案例分析,Page 31,内容介绍,故障处理案例分析 业务连通性测试 业务中断类故障 丢包类故障 故障案例集,Page 32,业务连通性测试,基本概念 MD (Maintenance Domain): 由单个操作者所控制的一部分网络 MA(Maintenance Association): MD的一部分,用来实现OAM的一个实例(Instance)OAM功能的实现是基于MA的 MD Level: MD的等级,用于区分嵌套的MD,以太网OAM为网络分配了8个维护级别(数值越大,优先级越高) 为客户分配了三个级别: 7, 6, and 5 为服务提供商提供了两个级别: 4 and 3 为运营商分配了三个级别: 2, 1, and 0 MEP (MA End Point) MA的端点,典型的,两个对等的UNI就是其所属MA的两个MEP。 MEP可以发起连通性检测、环回、链路追踪、性能测量等维护管理动作。 MIP (MA Intermediate Point) MA中间点,典型的,两个运行商管理域之间的分解点即可作为MIP。 MIP没有发起维护管理动作的能力,但可对环回和链路追踪进行响应。,Page 33,操作步骤,步骤1:在网元上新建OAM维护域 在T2000网管上选择功能树-以太网OAM管理-以太网业务OAM管理 点击“新建”,创建一个新的OAM维护域,Page 34,操作步骤,输入维护域名和维护域等级(取默认值即可),Page 35,操作步骤,步骤2:新建维护联盟,点击“新建”创建维护联盟 输入维护域名和维护联盟名,并选择要测试的以太网业务(在已创建的业务列表中选择需要测试的以太网业务) CC Test Transmit Period周期设置为3.3ms即可,Page 36,操作步骤,步骤3:新建MEP维护点,点击“新建”创建MEP点 输入维护域和维护联盟名称,选择单板类型、端口和VLAN ID 输入MEP ID(注意:对端MEP ID和本端MEP ID不能相同);若为UNI到NNI,则方向 选择“ingress”,若为UNI到UNI,则方向选择“egress”; 激活CC状态,Page 37,操作步骤,步骤4:管理远端MEP点,点击“新建”管理远端MEP点 输入维护域和维护联盟名称 指定远端MEP ID(注意:远端MEP ID和本端MEP ID不能相同),Page 38,操作步骤,步骤5:进行业务测试 输入远端MEP点MAC地址 点击“开始测试”,Page 39,业务中断类故障,外部原因 供电电源故障 接地故障 环境异常 光纤、电缆故障 人为原因 误操作设置了光路的环回 误操作更改、删除配置数据 设备本身故障 单板失效或性能不好,可能原因,Page 40,丢包类故障,外部原因 光功率问题 接地故障 环境温度 电缆故障 设备外部干扰(瞬时大误码) 人为原因 时钟配置错误 设备本身故障 单板失效或性能不好,可能原因,Page 41,故障案例集,如下网路,从RTA网元上业务,从RTD网元下业务,用户反映该网路部分业务中断,故障现象,RTA,RTB,RTC,RTD,Page 42,故障案例集,1、分析网络拓扑,在这个简单的网络中,根据用户提供的信息分析出如下内容 RTA节点是首节点,RTD节点是末节点,其他节点均为Transit节点 中断部分的业务在RTD节点上属于同一个光口 中断部分的业务在RTA节点也属于同一个光口 RTA节点、RTB节点、RTC节点和RTD节点间均通过GE口相连,定位步骤,Page 43,故障案例集,2、使用OAM或PING命令来确认链路是否正常 使用PING命令后,发现RTA节点至RTD节点的链路不通:确认在这个网络上存在着故障,导致业务不通 3、使用TRANCEROUTE命令来确认所有节点的链路状态 使用TRANCEROUTE逐个节点进行确认,发现从RTA节点到RTC节点都是正常的,但是到RTD节点的TRANCEROUTE时返回异常:确认RTC节点到RTD节点间存在故障,定位步骤,Page 44,故障案例集,4、对RTC节点上和RTD节点相连的GE口使用PHY内环命令 设置内环回后发现业务OK:则排除了RTA节点、RTB节点和RTC节点存在问题,确认在RTC到RTD的链路上或者RTD节点本身存在故障 5、对RTD节点和RTC节点上相连的GE口使用MAC外环命令 设置外环回后发现业务仍然OK:则排除了RTC和RTD链路上的故障,基本上确认是RTD节点本身的故障,定位步骤,Page 45,故障案例集,6、查询网元上相应告警 发现该RTD节点上和RTC节点相连的那块单板上报了hard_bad告警:基本确认由于该单板故障导致业务中断,更换相应单板后业务OK,定位步骤,Page 46,故障案例集,和RTC节点相连的单板上有hard_bad告警,但是为什么只会导致RTD网元上对应单板一个光口的业务中断呢? 因为该hard_bad告警显示的是芯片故障,而正好是该单板的一片芯片产生了故障,另外一片芯片仍然是正常工作的。同时这块芯片对应的业务正好全部发送到

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论