《PTN运行维护篇》word版.doc_第1页
《PTN运行维护篇》word版.doc_第2页
《PTN运行维护篇》word版.doc_第3页
《PTN运行维护篇》word版.doc_第4页
《PTN运行维护篇》word版.doc_第5页
已阅读5页,还剩6页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

PTN 运行维护篇 目目 录录 1.1网络故障处理基本思路和方法3 1.1.1PTN 与 MSTP 告警对比 3 1.1.2常见告警故障处理方法 5 1.1.3以太网业务丢包类故障处理方法 7 1.1.4OAM/PING 调试法7 1.1.5环回逐段定位法 10 1.2PTN 网络例行监控 .11 1.1网络故障处理基本思路和方法 PTN的组网、业务配置愈发复杂,需分组厂商网管尽快做好SDHLike功能。为尽快恢复业务,将 检测的故障点最小化,需了解SDH原理、IP网络原理知识、告警信号流及告警产生机理、PTN设备和网 管基本操作、常用仪表的基本操作,了解网络拓扑,业务配置,设备运行状态。 告警、性能分析法 OAM/PING调试法 环回法 PTN 对于 Tunnel 的故障可用 MPLS OAM 来检测,MPLS OAM 包括 CV/FFD、Ping 和 Traceroute。通过 CV(Connectivity Verification)/FFD(Fast Failure Detection)检测可以检测 LSP 的 连通性。CV 检测和 FFD 检测的过程基本一致,其不同在于 CV 检测发送 CV 报文的频率固定为 1 帧/s 并 且不可设置,而 FFD 检测发送 FFD 报文的频率是可以自行定义的。MPLS Ping/Traceroute 为用户提供了 发现 LSP 错误、并及时定位失效节点的机制。MPLS Ping/Traceroute 使用 MPLS Echo Request 和 MPLS Echo Reply 检测 LSP 的可用性。MPLS Echo Request 中携带需要检测的 FEC(Forwarding Equivalence Class)信息,和其他属于此 FEC 的报文一样沿 LSP 发送,从而实现对 LSP 的检测。 为了更好的理解PTN,我们就把PTN与熟悉的SDH的业务层面告警类比一下,与大家共享。 1.1.1 PTN 与 MSTP 告警对比 对应于业务模型,PTN的告警分为物理层、数据链路层、Tunnel层、PW层、仿真业务层五个层次。 对应SDH的物理层、再生段复用段层、服务层、路径层。上层功能的实现依赖于相邻下层提供的服务。 低层与高层同时有故障产生时,低层故障的消除是处理高层故障的基础,物理层故障引发的告警屏蔽其 它层故障引发的告警。SDH的告警与PTN的最根本的区别在于SDH的告警都是由字节承载上报的,而 PTN告警则是由协议控制上报的;但都有其相似之处,如下图: 服务层 (HO-VC4)(HO-VC4) 路径层 (LO-(LO- VC12)VC12) 物理层 (Fiber)(Fiber) 再生段复 用段层 (SDH) (SDH(SDH开销开销) ) TunnelTunnel层 PW&PW&业务业务 层 物理层 (Fiber)(Fiber) 数据链路 (Etherne(Etherne t)t) 通过物理层或数据链路层提供净荷路径的传送 多元的LO-VC到HO-VC 或者 PWs到PSN tunnels TE/PE之间的净荷传送 净荷封装到对应的 Line/Tunnel 层 物理层以光或电脉冲的方式处理传送 STM-N 帧格式或以太报文通过物理介质传送 E1/E3E1/E3 净荷 CES/ATM/EthernetCES/ATM/Ethernet 净荷 PTNSDH 图 28 PTN 网络与 MSTP 告警对比图 业务模型中,PW可类比VC12、Tunnel类比VC4管道,CES即电路仿真业务就是传统的E1;告警可 划分为业务类告警,系列类通用类告警,下面表格按业务告警,与SDH进行类比,各业务层告警对比: MSTPMSTP告警告警SDHSDH、PTNPTN类类 比结果比结果 PTNPTN告警告警 业务层 (VC12) (ETH/CES/IMA /ATM) TU_AIS T_ALOS UP_E1_AIS DOWN_E1_AIS等 继承了SDH E1、ATM、IM A业务告警的 特点 PW_DOWN T_A LOS TU_AIS_VC12 UP_E1_AIS DOWN_E1_AIS等 PW&业务层 (ETH/CES/IM A/ATM) 服务层 (VC4) HP_SLM HP_UNEQ 继承了服务 层SDH告警, 新增加了 MPLS Tunnel 类告警 MPLS_TUNNEL_LOCV HP_SLM HP_UNEQ Tunnel层 (Tunnel/ PW / MPLS APS) 再生段复用段 层 (开销) B1、B2误码检 测 告警 复用段告警 IMA业务告警 继承了SHD误 码类,复用 段类告警(线 性),增加了 多协议标签 交换(MPLS) 告警,LAG类 告警 B1、B2误码检测 线性复用段告警 IMA业务告警 LAG_DOWN MP_DOWN ETH_APS_LOST ETH_APS_PATH_MISMATCH ETH_APS_SWITCH_FAIL ETH_CFM_MISMERGE 数据链路层 (MLPPP / STM / LAG) 物理层(单板 / ETH端口 /SDH端口/ E1 口) R_LOS ETH_LOS T_ALOS LASER_MOD_ERR ETH_LINK_DOWN 物理层告警 与SDH相同, 完全继承了 SDH光口、 ETH电口、光 口的习惯 R_LOS ETH_LOS T_ALOS LASER_MOD_ERR ETH_LINK_DOWN 物理层(单板 / ETH端/SDH 端口/E1口) 1.1.2 常见告警故障处理方法 CES业务常见告警故障处理方法: 序号告警名称产生原因处理方法 1 T_ALOS E1信号丢失,主要上报在支路 接口板上; 环回E1 2 UP_E1_AIS DOWN_E1_AIS 分别是上行2M信号指示、和下 行2M信号指示,产生原因和SDH 的相同 察看对端是否有 TU_LOP_VC12、T_ALOS 或 TU_AIS_VC12 告警。或者E1 环回方式 3 MPLS_TUNNEL_LOCV MPLS_TUNNEL_LOCV 为Tunnel 连通性丢失告警。连续3 个周 期内没有收到希望的CV/FFD 报 文时出现此告警。产生 g该告 警时,该TUNNEL承载的业务已 中断, 原因1:往往是下层网络异常引 起,例如物理链路故障等,光 模块故障 原因2:网络出现严重的拥塞。 原因原因1 1:物理链路故障。1. 在网管上检查该链路两端网 元是否存在单板或光模块相 关的告警。若存在,消除这 些告警,查看告警是否消除。 2. 若告警未消除,查看光 纤是否故障,更换故障的光 纤。原因原因2 2:网络出现严重 拥塞。1. 选择较大的“CC 测试发送周期”的参数值, 具体操作见本文的创建维护 联盟。2. 检查故障Tunnel 的带宽占用情况,如发现已 满,请增大Tunnel 带宽配 置或消除非法发送大数据量 的根源,查看告警是否消除。 4 TU_AIS_VC12 系统中存在更高阶的告警,如 R_LOS、R_LOF、HP_SLM、AU_AI S 上游站点存在硬件故障告警 交叉板故障 对端站对应通道失效 按照产生原因点,逐步排除; 先看是否有高级别的 R_LOS、R_LOF、HP_SLM、AU _AIS 告警,然后看是否存 在硬件故障支路板?交叉? 最后对端对应通道?需要用 到经验法、替换法等。与 SDH类似 业务中断类常见告警原因:光纤、电缆故障、环境温度、误操作设置了光路的环回、误操作更改、 保护业务配置数据有误。应急处理时优先恢复业务,排除外部设备的问题,将业务倒换到备用通道,复 位单板、单站重启、重新下发配置等。 以太网业务常见告警故障处理方法: 序号告警名称产生原因处理方法 1ETH_LOS 以太网端口连接丢失,可能 原因:以太网端口的电缆或 光纤没有连接好;电缆或光 纤故障;本端网元接收光功 率过低;单板故障。 属于物理层故障类,察看 物理连接,端口、单板故 障;逐一排除。 2MAC_FCS_EXC MAC_FCS_EXC 为MAC 层检测1:检测是否链路出现故障, 到误码越限告警。软件定时 检测MAC 芯片接收字节数和 误码字节数,计算误码是否 超过门限,超过设置越限门 限发出此报警。 维护光纤或网线,查看告 警是否消除。 2:若告警仍未消除,检测 是否存在DOS 攻击等,隔 离DOS 攻击源,查看告警 是否消除。 3.若告警仍未消除,是否 出现配置环路或物理等问 题,解除环路,查看告警 是否消除。 3ETH_LINK_DOWN 以太网连接错误,端口协商 失败;可能原因:端口模式 不一致;电缆光纤连接故障; 单板故障。 对应需要察看和排除端口 协商问题,主要关注端口 模式,端口速率级别。最 后使用替换法检验是否是 硬件故障 4FLOW_OVER 端口接收流量超限告警;可 能原因为实际接收的端口流 量大于设定的端口流量限值。 增加端口带宽。 丢包类故障常见原因:光功率问题、环境温度、数据业务端口协商故障、时钟配置错误、业务流控 配置。可通过查看光功率、RMON、丢包率等性能事件解决。 MPLS保护倒换类告警排除: 倒换告警告警信息故障原因 ETH_APS_TYPE_MISMATCH 保护类型信息不 一致 1、两端配置的 1+1 或 1:1 模式不一致; 2、两端配置的单端或双端倒换的模式不一致; 3、两端配置的恢复式或非恢复式的模式不一 致; ETH_APS_PATH_MISMATCH APS 工作、保护 路径不一致 1、保护组两端设备配置的工作路径、保护路 径不一致; 2、物理链路上存在有错连; ETH_APS_SWITCH_FAIL 保护倒换失败1、倒换失败; ETH_APS_LOST APS 帧丢失1、对方没有配置保护; 2、保护通道业务中断; 1.1.3 以太网业务丢包类故障处理方法 业务丢包、错包的可能原因 端口光功率异常或光功率不稳定,这是最常见的丢包原因 时钟未跟踪,或跟踪源不稳定,会导致周期性丢包 Tunnel下一跳端口IP设置错误(如设置为本端端口,扩容或调整业务时)可 能会导致丢包 网络侧发生拥塞,由于现网基本是轻载状态,拥塞可能性较小 排查业务丢包、错包的思路: 找出与“有问题的业务”走相近链路的业务,看是否有类似问题,以此缩小范 围 业务业务A 业务业务B 网元B 网元A 网元C网元D网元E 1.1.4 OAM/PING 调试法 常用场景:数据业务通断判断 维护中,工作难点主要在于如何能够快速有效地排除故障。在众多的故障中,以“业务不通”最为 常见。应该如何着手解决呢?首先我们将PTN专线业务做成下图所示的分段。 PTN网络关于OAM的规划 主要涉及:MPLS OAM、以太网端口的OAM。适用于故障定位到单站,主要用于检查网络连接是否可 达,以及分析网络什么地方发生了故障。 常用OAM排障步骤1Tunnel OAM 如果业务A有丢包,业务B不丢,则问题应该在网元A与网元C之间 NODEB 接入侧PTN UNI接入侧PTN NNI 透传设备 (PTN,波分设备等) 核心侧PTN NNI核心侧PTN UNI RNC Tunnel配置配置PW配置配置PW配置配置 业务配置业务配置业务配置业务配置 红色标识部分是维护关键区域, 因为这一区域的网元多,外部因素多(光缆,光模块,波分 设备等) , 需考虑业务扩容,业务归属关系调整 排障的主要工具: Tunnel OAM 使用方法:到两侧(接入侧、核心侧)网元查看Tunnel OAM状态 结果分析: 两侧Tunnel OAM状态都是“远、近端可用” - 该区域基本没有问题 Tunnel OAM检测有任何缺陷上报- 根据“LSP缺陷位置”可锁定故障位置 查MPLS_TUNNEL_LOCV告警: 含义:Tunnel链路中断 解决措施:需要检 查Tunnel链路的连通性,发起LSP Ping确认故障节点/链路,并观察Tunnel 链路中其它节点的相关告警信息,需启动OAM功能。 排障步骤2LSP故障位置分析 红框内的LSP缺陷位置指示了问题网元的LSR ID (GCP NODE ID) 在LSP缺陷位置及相邻网元范围内, 进一步排障步骤: 检查光纤原因 检查业务告警 ETH_LINK_DOWN, ETH_LOS, R_LOS等链路异常告警 IN_PWR_ABN等光功率异常告警 HARD_BAD、BUS_ERR、BD STATUS等硬件异常告警 检查配置 源宿节点是否正确 相邻网元的出入标签是否一致 下一条端口IP是否正确 其它可能原因: 源宿节点是否正确 相邻网元的出入标签是否一致 下一条端口IP是否正确 查看各端口收光功率的当前/历史性能是否过低或过高: 有可能端口收光功率接近但未超过阈值,导致无告警上报,所以需要查性能 有可能端口收光功率不稳定,导致当前性能值正常,所以需要查历史性能 下一条端口IP是否正确 查看各NNI端口的设置: ETH OAM的简易操作步骤: 注:只须输入对端UNI端口MAC地址就可以启动测试了,其他参数可用默认 A.两端网元发起LB测试,用于命令触发的连通性检查,对以太网业务执行不 中断业务环回检测(LB),可以检验业务的连通性情况,以便定位和修复故 障。 OAM功能产生的告警概览: MELS OAM MPLS_TUNNEL_LOCV告警含义:Tunnel链路中断 解决措施:需要检查Tunnel链路的连通性,发起 LSP Ping确认故障节点/链路,并观察Tunnel链 路中其它节点的相关告警信息。 Init(初始)状态Ingress端没有使能OAM或者Tunnel链路中断; Available(可用)状态Tunnel状态正常; MPLS 状态 Unavailable(不可用) 状态 Tunnel状态不可用,需要检查Tunnel链路的连通 性,发起LSP Ping确认故障节点/链路,并观察 Tunnel链路中其它节点的相关告警信息 ETH_CFM_LOC告警含义:ETH业务中断 解决措施:需要发起ETH LB进行故障确认,发起 LT进行故障定位;对于MPLS承载的ETH业务,需 要观察MPLS Tunnel的连通性。 ETH_CFM_RDI告警含义:对端检测到ETH业务的告警后的回告指示 解决措施:需要在对端进行告警确认和排查操作; ETH_EFM_DF告警含义:ETH链路发现失败 解决措施:检查两端的ETH Link OAM的配置是否 一致,检查ETH链路的连通性; ETH OAM ETH_EFM_EVENT告警含义: ETH链路存在误码 解决措施:对端网元检测到端口有误码,需要在 对端网元确认其接收链路是否正常; 1.1.5 环回逐段定位法 常用场景:CE

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论