OptiX ASONGCP R1维护和故障处理专题(中级)_第1页
OptiX ASONGCP R1维护和故障处理专题(中级)_第2页
OptiX ASONGCP R1维护和故障处理专题(中级)_第3页
OptiX ASONGCP R1维护和故障处理专题(中级)_第4页
OptiX ASONGCP R1维护和故障处理专题(中级)_第5页
已阅读5页,还剩94页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、2020/6/26,张建立/44957,OptiX ASON GCP R1维护和故障处理专题(中级),前言,基于ASON网络的维护和故障处理,开发此课程。 本课程旨在协助一线工程师掌握ASON网络常见的故障处理和业务紧急恢复方法。,Page 2,学习指南,本课程内容由浅到深,分初级、中级、高级三部分,本胶片为中级部分。 学习本课程之前,建议先学习ASON原理、ASON开局指导等课程; 本部分的重点为ASON的常见故障处理和业务紧急恢复方法。,Page 3,参考资料,OptiX GCP维护专题 故障处理 OptiX GCP系统备份恢复指南 OptiX GCP 残留交叉详解 OptiX GCP 设

2、备问题树 OptiX GCP 灾难恢复方案 OptiX GCP 数据采集指导书,Page 4,课程目标,学习完此课程,您应能: 掌握ASON网络常见故障处理方法 掌握ASON网络故障时智能业务的紧急恢复措施,Page 5,内容介绍,ASON网络常见故障处理 智能业务紧急恢复措施 ASON网络灾难恢复措施 典型案例分析,Page 6,内容介绍,ASON网络常见故障处理 LMP链路故障处理 残留交叉故障处理 智能业务异常降级故障处理,Page 7,LMP链路知识回顾,LMP链路校验步骤: 控制通道校验数据链路连通性校验-TE链路一致性校验,数据链路和TE链路是一一对应的关系,Page 8,LMP链

3、路知识回顾,对智能R1版本,光口数据链路和TE链路与复用段配置的关系 一个光口可以对应一条、两条、三条数据链路和TE链路 一根配置了部分复用段的光纤上存在三条数据链路和TE链路:工作链路、保护链路和无保护链路 每个光口只支持建立一个复用段,不允许对有智能业务的光口进行复用段增加、删除、修改,Page 9,LMP链路不通故障处理,TE链路不通故障处理流程 TE链路不通常见故障原因 TE链路不通故障处理过程 控制通道不通故障处理 数据链路不通故障处理 TE链路不通故障处理,Page 10,TE链路不通故障处理流程,Page 11,TE链路不通常见故障原因,Page 12,LMP链路不通故障处理,T

4、E链路不通故障处理流程 TE链路不通常见故障原因 TE链路不通故障处理过程 控制通道不通故障处理 数据链路不通故障处理 TE链路不通故障处理,Page 13,控制通道不通故障处理判断方法,用命令:lmp-get-ccbyport:0,0查询所有控制通道当前状态信息 判断控制通道校验是否成功的三个条件: 控制通道LMP校验管理开关AdminStatus为AdminUp 控制通道运行状态OperStatus应该为up 正确的远端信息,即NbrNodeID是正确的相邻网元NODE ID,Page 14,控制通道不通故障处理故障原因,Page 15,物理单板故障导致控制通道不通,Page 16,逻辑板

5、未配置或与实际物理板类型不一致,Page 17,光口被设置成不创建控制通道,智能R1B03之后的版本默认对光口速率为155M和622M的光板和非SDH单板(支路板和以太网单板)不创建控制通道,即CreateCCFlag为disable,如果需要在155M和622M的光路上开智能则必须人工设置其使能,Page 18,AdminStatus不正常导致控制通道不通,Page 19,DCC故障导致控制通道不通,Page 20,其他问题导致控制通道不通,Page 21,TE链路不通故障处理,TE链路知识回顾 TE链路不通故障处理流程 TE链路不通常见故障原因 TE链路不通故障处理过程 控制通道不通故障处

6、理 数据链路不通故障处理 TE链路不通故障处理,Page 22,数据链路不通故障处理判断方法,用命令:lmp-get-dbl:0,0查询所有数据链路当前状态信息 数据链路校验通过的判断依据: 数据链路的LMP校验开关AdminStatus为AdminUp 数据链路LMP校验的运作状态OperStatus为up_free 有正确的远端信息。,Page 23,数据链路不通故障处理常见故障原因,Page 24,AdminStatus不正常导致控制通道不通,Page 25,链路两端光口复用段配置不一致,Page 26,TE链路不通故障处理,TE链路知识回顾 TE链路不通故障处理流程 TE链路不通常见故

7、障原因 TE链路不通故障处理过程 控制通道不通故障处理 数据链路不通故障处理 TE链路不通故障处理,Page 27,TE链路校验通过的判断依据: TE链路LMP校验开关AdminStatus为AdminUp TE链路LMP校验运作状态OperStatus为up 有正确的远端信息 注意: TE链路OperStatus出现degraded状态时,标志TE链路曾经是Up的,但现在相邻节点间没有可用的控制通道,发生了TE链路降级。此时原有业务不受影响。须检查控制通道状况,TE链路不通故障处理判断方法,用命令:lmp-get-tel:0,0查询所有TE链路当前状态信息,Page 28,TE链路不通故障处

8、理,Page 29,内容介绍,ASON网络常见故障处理 LMP链路故障处理 残留交叉故障处理 智能业务异常降级故障处理,Page 30,残留交叉故障处理,残留交叉概念 残留交叉产生的原因及分析、存在影响 残留交叉故障处理 常用命令介绍 信令残留交叉处理 时隙预留残留交叉处理 时隙不一致残留交叉处理,Page 31,残留交叉概念,信令残留 指一条智能业务所经过的节点中,本节点的信令数据存在,而相邻节点的信令数据不存在了,而且此时TE链路的时隙状态一致,称之为信令残留。 时隙预留残留 当一条TE链路的一端预留了时隙,而另一端同一个时隙没有做相应的时隙预留,即时隙的状态为空闲的,就会造成TE链路两端

9、的时隙占用状态不一致,形成残留交叉。 时隙不一致残留 由于交叉的存在造成TE链路两端同一个时隙的时隙状态不同,且其中一端的时隙状态为空闲。这种情况我们称为时隙不一致残留。,Page 32,智能业务与三层之间的交互,首节点,网络管理系统,穿通节点,末节点,MPLS层,SC层,实际交叉,Page 33,残留交叉示意图,首节点,网络管理系统,穿通节点,末节点,MPLS层,SC层,实际交叉,Page 34,残留交叉故障处理,残留交叉概念 残留交叉产生的原因及分析、存在影响 残留交叉故障处理 常用命令介绍 信令残留交叉处理 时隙预留残留交叉处理 时隙不一致残留交叉处理,Page 35,残留交叉产生原因,

10、信令残留 更改NODEID,本网元的信令层lsp数据丢失,相邻网元信令残留。 业务降级过程中中间节点复位,起来后下游节点信令数据残留。 数据库异常,本网元恢复老数据,信令数据丢失,相邻网元信令残留。 时隙预留残留 TE链路的时隙预留不一致 时隙不一致残留 业务删除过程中,中间节点掉电重启,中间节点将形成无信令有SC的残留交叉,下游节点或末节点形成有信令有SC的残留交叉。 上面情况,中间节点如果SC层也被删除,又没同步,则产生无信令且无sc数据的残留交叉。 中间节点掉电重启后产生无信令有SC残留交叉 静态交叉残留:异常降级产生,正常降级后人工新建删除静态交叉(离散业务),Page 36,残留交叉

11、产生的情况分析,NE E,NE B,NE A,NE F,NE D,NE C,建立一条从NEA至NED的智能业务,在首节点A下发删除智能业务命令,A网元正常删除,B网元复位,无法处理信令包,故障现象 A-D之间有一条智能业务 首节点A下发智能业务删除命令; 在智能业务删除过程中,B网元主控异常复位; 分析 A:智能业务正常删除,无残留交叉; B:存在SC层残留交叉 C/D:存在残留交叉,在此网元上mpls、sc、itgxc层信息均有,且treetype参数为1,Page 37,残留交叉存在的影响,mpls层信令残缺的影响 当出现mpls层信令残缺,较短时间内业务没有影响,但当节点异常复位重启后或

12、恢复定时器超时(12小时)后业务将异常降级。 当业务在首末节点出现mpls层信令残缺,由于业务没有相应的sc层交叉信息,当业务需要发起重路由时,在sc模块中不能查询到相应的交叉信息,业务将不能成功重路由,从而导致业务中断 。,Page 38,残留交叉存在的影响,时隙预留及时隙不一致导致的残留交叉的影响: 会导致TE链路两端时隙占用状态不一致,进而可能引发智能业务新建不成功、重路由不成功、优化不成功等问题。 对于R1B03之后的版本具有CRANK BACK、残留交叉自动清理等功能,可在较大程度上缓解残留交叉的影响。 残留交叉自动清理机制不会自动清除人工建立或正常降级导致的静态残留交叉,如果人工不

13、进行删除,静态残留交叉会一直存在。,Page 39,残留交叉故障处理,残留交叉概念 残留交叉产生的原因及分析、存在影响 残留交叉故障处理 判断是否存在残留交叉 信令残留交叉处理 时隙预留残留交叉处理 时隙不一致残留交叉处理,Page 40,用命令sc-get-dbl查询一根光纤两端相应链路状态,判断是否存在残留交叉:,:sc-get-dbl:0,0; DATA-BEARING-LINK-LIST If-Index If-Name Local-Bid Local-Pid Remote-If-Index Link_flag Total_Vc4 Usable_Vc4 Available_Vc4 0

14、x4c000007 13 1 0 x4c00003b unprotect 32 31 30 0 x48000007 13 1 0 x4800003b protect 16 0 0 0 x44000007 13 1 0 x4400003b work 16 16 0,:sc-get-dbl:0,0; DATA-BEARING-LINK-LIST If-Index If-Name Local-Bid Local-Pid Remote-If-Index Link_flag Total_Vc4 Usable_Vc4 Available_Vc4 0 x4c00003b 21 1 0 x4c000007 u

15、nprotect 32 28 27 0 x4800003b 21 1 0 x48000007 protect 16 0 0 0 x4400003b 21 1 0 x44000007 work 16 16 0,1,第1个总带宽值不一致就说明链路两端的板子不匹配,这种情况几乎不会出现。 2,第2个为除去主机占用和静态预留带宽后还剩余的带宽值,如果第2个参数不一致就说明链路两端时隙被静态占用或者主机预留的不一致,存在静态残留或时隙预留不一致残留交叉,使用sc-get-vc4state:bid,pid;查看链路两端相应的时隙状态是否一致。 3,如果两端的Usable_Vc4减去Available_VC

16、4的结果不一致就说明存在智能的残留交叉了,同样使用sc-get-vc4state:bid,pid命令查看链路两端对应的时隙状态是否一致。,残留交叉故障处理,Page 41,残留交叉故障处理,如何确定TE链路两端时隙是否一致 使用命令:sc-get-vc4state:bid,pid; 分别查询TE链路本端和对端的时隙状态,核对相同时隙是否同时被占用或同时是空闲的。当TE链路的一端为占用状态,而另一端相应的时隙为空闲,就说明时隙不一致,引起了交叉的残留。 该命令输出格式为: vc4id时隙号 in-direct-state入时隙使用状态: ION_ALLOC:智能业务分配占用ION_RESERVE

17、D:智能业务预留NE_USED:主机业务分配占用FREE:空闲 out-direct-state出时隙的使用状态: ION_ALLOC:智能业务分配占用ION_RESERVED:智能业务预留NE_USED:主机业务分配占用FREE:空闲 或通过命令:sc-get-vc4info:bid,pid,vc4id;(支持全零参数)查询TE链路两端时隙状态。,Page 42,残留交叉故障处理,信令层lsp信息查询 用mpls-get-mlsp/mpls-get-smlsp查询信令层的lsp信息 这两条命令查询结果一一对应,其区别仅仅是返回内容不同,第一个命令是给网管用的接口,第二个命令通过命令行用的多一

18、些.,:mpls-get-smlsp:all LSP SIMPLE INFO INGRESS EGRESS INDEX INST TYPE PROTECTION DIRECTION RRTRCVY POSITION STATUS FLAG FIR_SEC 1.1.1.1 3.3.3.3 2 1 normal_lsp msp bi_direction disable src up normal first 1.1.1.1 3.3.3.3 3 1 normal_lsp reroute bi_direction disable src up normal first 1.1.1.1 3.3.3.3

19、4 1 normal_lsp nopr bi_direction disable src up normal first 1.1.1.1 3.3.3.3 5 1 normal_lsp sncp bi_direction disable src up normal second 1.1.1.1 3.3.3.3 5 2 normal_lsp sncp bi_direction disable src up normal first Total records :5,Page 43,残留交叉故障处理,sc层lsp信息查询 用:sc-get-lspcb-info/:sc-get-lspcb-exinf

20、o可以查询lsp-cb信息 正常情况下,查询出来的SC模块LSP信息和MPLS层的应该一致; 上述两个命令合起来查询的是实质上是一个内容,即lsp-cb信息,第一个显示常用的基本信息,第二个显示扩展信息(EX);,:sc-get-lspcb-info:0.0.0.0,0.0.0.0,0 LSP-CB-INFO tunnel-head tunnel-tail tunnel-id lsp-id lsp-xc-index sec_flag in_ifindex in_label out_ifindex out_label label_flag hw_type 1.1.1.1 3.3.3.3 2 1

21、2 first 0 x4c000006 2 0 x44000002 1 0 x0f 0 x11 1.1.1.1 3.3.3.3 3 1 3 first 0 x4c000006 3 0 x4c000001 64 0 x0f 0 x11 1.1.1.1 3.3.3.3 4 1 4 first 0 x4c000006 4 0 x4c000001 63 0 x0f 0 x11 1.1.1.1 3.3.3.3 5 2 5 first 0 x4c000006 1 0 x4c000002 64 0 x0f 0 x21 1.1.1.1 3.3.3.3 5 1 6 second 0 x4c000006 1 0

22、x4c000001 62 0 x0f 0 x21 Total records :5,:sc-get-lspcb-exinfo:0 LSP-CB-EXINFO lsp-xc-index lspcb_addr sncp_ptr v_sncp_ptr rvs_exist node_flag sonet_rcc sonet_ncc next_hop est_stat rvs_est_stat 2 0 x0643cb28 0000000000 0000000000 1 0 x01 0 1 4.4.4.4 3 3 3 0 x06445ba8 0000000000 0000000000 1 0 x01 0

23、1 2.2.2.2 3 3 4 0 x06450168 0000000000 0000000000 1 0 x01 0 1 2.2.2.2 3 3 5 0 x06473268 0 x06475ce8 0000000000 1 0 x01 0 1 4.4.4.4 3 3 6 0 x06475ce8 0 x06473268 0000000000 1 0 x01 0 1 2.2.2.2 3 3 Total records :5,Page 44,残留交叉故障处理,残留交叉概念 残留交叉产生的原因及分析、存在影响 残留交叉故障处理 常用命令介绍 信令残留交叉处理 时隙预留残留交叉处理 时隙不一致残留交叉

24、处理,Page 45,根据前面mpls-get-smlsp/mpls-get-mlsp查询得到的mpls信息,比较各个节点的结果: 1、当发现一条LSP的信令数据在某节点丢失或者某节点的信令数据多出来时,就为残留下来的信令数据。 2、判断残留下来的信令数据是否存在对应的交叉,并判断交叉所在的时隙是否出现时隙不一致。如出现了时隙不一致,我们把它归属于时隙不一致的残留。 处理方法: 确认此时业务是否正常,若只有信令残留,时隙一致,业务暂时不会有影响 。 因为时隙占用情况一致,残留交叉自动清理机制不会动作,需要使用任意节点降级功能处理,使用:mpls-dbg-del-lsp-anynode/mpls

25、-dbg-del-lsp-local 命令。 网管上使用任意节点降级的功能将残留的信令删除。,残留交叉故障处理信令残留交叉处理,Page 46,判断方法 使用命令:sc-get-reservedvc4:bid, pid, vc4id;查询每一条TE链路的时隙预留情况。再跟TE链路的对端查询的情况进行比较,看是否预留的时隙不一致。 如果TE链路的一端时隙预留状态为NE_RSVD,而TE链路的对端时隙预留状态为NE_UNRSVD,则为时隙预留残留。 处理方法: 对于人工预留不一致,对于R1B03版本,残留交叉自动清理机制不会动作。 使用命令:sc-set-reservedvc4:bid,pid,v

26、c4id,disable;进行预留释放操作,也可以在网管上取消时隙预留。,残留交叉故障处理时隙预留残留交叉处理,Page 47,残留交叉故障处理时隙不一致残留交叉处理,残留交叉自动清理机制: 对于SC异常的智能残留交叉,经过1520分钟,残留交叉自动清理机制将残留交叉降级,再经过1520分钟,将刚才降级的残留交叉删除。 对于异常降级产生的静态残留交叉和有信令且SC层正常的智能残留交叉,1520分钟后直接自动清除,且向上下游同步删除所有残留交叉。 但是对正常降级后或者是手工配置的静态交叉,不能自动清除,必须通过手工删除(命令行或网管删除静态交叉)。,Page 48,时隙不一致残留交叉处理无信令有

27、sc时隙残留,判断方法: 根据前面的查询得到的mpls和sc层的lsp信息,比较查询结果: 1、mpls层的lsp 信息与sc层的lsp信息不能一一对应,存在部分lsp在mpls层没有相关的lsp信息,而在sc层存在相关的lsp信息。 2、若lsp-xc-index为很大的值(4294967290左右),且tree_type参数为0,则为sc残留交叉。 3、利用:cfg-get-itgxc和:cfg-get-itgsncppg查询主机侧生成的相应的智能交叉信息,相应的缺少mpls层的lsp信息的智能业务存在对应的智能交叉。则存在sc层信令残留。 处理方法 等待残留交叉自动清理机制清除,需要30

28、40分钟 使用网管 智能高级维护智能交换控制器维护 中的降级智能交换控制器功能(此功能只会降级本站交叉,不会向上下游同步),将智能残留交叉降级为静态交叉,然后在网管SDH业务配置中删除相应的残留交叉。,Page 49,时隙不一致残留交叉处理有信令有sc时隙残留,判断方法: 使用 :sc-get-vc4state:bid,pid;检查出有时隙不一致的交叉残留。 1、根据前面的查询得到的mpls和sc层的lsp信息,比较查询结果mpls层的lsp 信息与sc层的lsp信息可以一一对应。 2、利用:cfg-get-itgxc和:cfg-get-itgsncppg查询主机侧生成的相应的智能交叉信息,相

29、应的时隙残留存在对应的智能交叉。则此残留交叉为有信令有SC的时隙残留。 处理方法 使用任意节点信令降级功能,网管或者命令行:mpls-degrade-lsp-anynode: ingress,egress,index;将残留交叉降级为普通静态交叉(该功能会向上下游同步,同时降级所有上下游节点的残留交叉) 使用命令行:cfg-del-xc或网管删除相应残留交叉。 等残留交叉自动清理机制自动清除,需要1520分钟,Page 50,时隙不一致残留交叉处理静态交叉残留,判断方法: 1、使用 :sc-get-vc4state:bid,pid;检查出有时隙不一致的交叉残留; 2、且此交叉不在智能的管理之下

30、,状态为NE_USED,则为静态的残留交叉; 处理方法 使用主机的命令:cfg-del-xc;进行删除。 使用网管,通过网元管理器SDH业务配置删除静态交叉。,Page 51,内容介绍,ASON网络常见故障处理 LMP链路故障处理 残留交叉故障处理 智能业务异常降级故障处理,Page 52,智能业务异常降级故障处理,如何确定智能业务异常降级: 智能电路管理示图中智能电路的激活状态为未激活 异常事件中有智能业务异常降级记录 智能业务异常降级后的影响: 底层交叉还在,业务暂时无影响 业务将失去重路由能力,对银级业务,断纤后业务中断,Page 53,智能业务异常降级故障处理,确定智能业务异常降级后的

31、处理方法 确定是否存在信令的残留(按前面残留交叉处理方法) 若存在信令残留采用任意节点降级的方法清理残留信令 如果为11LSP降级则补全SNCP静态业务 在SDH路径管理中找到对应的完整静态业务(若没有先搜索) 将静态业务升级成相应的智能业务 若有多条业务异常降级,分别对每一条业务采用上述方法处理,Page 54,问题,Q1:TE链路不通故障时如何处理? Q2:什么情况下会产生残留交叉? Q3: 对于残留交叉应如何处理? Q4:智能业务异常降级后如何处理?,Page 55,本节我们主要学习了: ASON网络日常维护的主要项目 ASON网络日常维护中的注意事项,小结,Page 56,内容介绍,A

32、SON网络常见故障处理 智能业务紧急恢复措施 ASON网络灾难恢复措施 典型案例分析,Page 57,内容介绍,智能业务紧急恢复措施 总原则和整体流程 准备工作 确认已中断业务 智能业务紧急恢复步骤 业务恢复后的扫尾,Page 58,准备工作,要想快速恢复业务,需要准备: ASON网络的拓扑。 保护子网划分,特别是复用段。 全网业务信息(源宿端口、级别、时隙占用) 整个网络端到端业务和智能业务的对应关系,以上信息对快速恢复业务至关重要,这就需要在日常维护和巡检时注意准确记录以上数据。,Page 59,内容介绍,智能业务紧急恢复措施 总原则和整体流程 准备工作 确认已中断业务 智能业务紧急恢复步

33、骤 业务恢复后的扫尾,Page 60,确认已中断业务,通过下列步骤确认哪些业务已经中断:,全网告警同步 找出影响业务的告警 通过告警查找影响的端到端业务路径 从端到端业务路径查找影响的智能电路 按照上面方法找出所有中断业务,记录业务信息,Page 61,确认已中断业务,全网告警同步当前告警浏览,找出影响业务的告警: R_LOS、AU_AIS 、TU_AIS、UNEQ、RDI、误码过量等。,Page 62,确认已中断的业务,查询告警影响的路径,注:如果业务没有在SDH路径示图中管理,此步骤查询不到。所以,在平时新建智能业务后,需要在SDH路径中搜索,使智能业务在SDH路径管理视图中也能管理。,P

34、age 63,确认已中断业务,记录端到端业务信息并查询相关智能电路,Page 64,确认已中断业务,查询并记录相关智能电路信息(重点关注激活状态),Page 65,确认已中断业务,从智能电路也可跳转到端到端路径,Page 66,内容介绍,智能业务紧急恢复措施 总原则和整体流程 准备工作 确认已中断业务 智能业务紧急恢复步骤 业务恢复后的扫尾,Page 67,智能业务紧急恢复步骤,在智能电路管理示图中,执行全网同步前,将电路信息保存为文件,便于后续对比查找:,Page 68,智能业务紧急恢复步骤,智能电路管理中执行全网同步,对比操作前后智能业务有无变化: 重点关注智能业务总数目,总数目是否有减少

35、。 激活状态有无变化,从正常的激活变为未激活。,Page 69,智能业务紧急恢复步骤,若前面步骤确认中断的智能业务为隧道业务,且此时网络有足够的空余资源,则按照下面步骤恢复: 直接避开原路径创建源宿相同的新SDH服务层路径。 将原来交叉到原智能服务层路径的低阶交叉删除。 重新配置到新SDH服务层路径的低阶交叉,业务恢复。 若前面步骤确认中断的智能业务为隧道业务,且此时网络中已无空余资源,则按照下面步骤恢复: 使用任意节点降级的命令将智能服务层路径降级为静态交叉。 沿原路径一一确认交叉是否完整、正确。 将残缺的交叉补齐,若交叉有错误则更正。,Page 70,智能业务紧急恢复步骤,若前面步骤确认中

36、断的智能业务为普通智能电路,且此时网络有足够的空余资源,则按照下面步骤恢复: 使用清理残留交叉的方法释放源宿端口的交叉时隙。 直接避开原路径创建源宿相同的新SDH电路。 业务恢复 若前面步骤确认中断的智能业务为普通智能电路,且此时网络中已无空余资源,则按照下面步骤恢复: 使用任意节点降级的功能将智能电路降级为静态交叉。 沿原路径一一确认交叉是否完整、正确。 将残缺的交叉补齐,若交叉有错误则更正,使业务恢复。,Page 71,内容介绍,智能业务紧急恢复措施 总原则和整体流程 准备工作 确认已中断业务 智能业务紧急恢复步骤 业务恢复后的扫尾,Page 72,智能业务紧急恢复措施,业务恢复后的扫尾工

37、作: 全网业务完全恢复后,进行整个网络的残留交叉检查和清理。 采集相关数据,分析故障原因,最后排除故障。 使用巡检命令行对全网进行健康性检查。 整个ASON网络稳定后将创建的普通SDH电路升级为对应的智能电路。 按照实际情况选择是否将恢复后的业务优化到原来路径。 处理完成。,Page 73,问题,Q1:在智能业务中断时,首先需要恢复业务还是定位故障? Q2:为何隧道业务的处理步骤相对简单些? Q3: 在网络有充足资源的情况下什么方法可快速恢复业务?,Page 74,本节我们主要学习了: 智能业务中断时的紧急恢复方法 如何新建SDH业务使业务快速恢复 智能业务恢复后需要做哪些工作,小结,Page

38、 75,内容介绍,ASON网络常见故障处理 智能业务紧急恢复措施 ASON网络灾难恢复措施 典型案例分析,Page 76,ASON网络灾难恢复措施,ASON网络系统灾难场景: 主备主控板均硬件故障(相当于主控板被拔除)。 主备主控板数据库均故障,此时网元进入基础BIOS态。 以上两种场景,均需要更换新主控板,下载之前备份的数据库,而数据库下载后又可能产生如下后果: 数据库完全正确,业务正常。(如果之前数据库备份及时)。 数据库部分正确部分错误(如果之前数据库备份不及时,电路信息发生过改变),部分业务受影响。 数据库完全丢失(如果之前没有通过网管进行备份数据库),经过该节点的所有业务受影响。 所

39、以,及时备份数据库非常重要!,Page 77,ASON网络灾难恢复措施,ASON网络系统灾难现象: 故障网元和其他网元无法通讯,控制平面失效,表现为网元在网管上脱管, 此时与该网元相关的TE链路全部降级,但此时所有业务暂时不会有影响。此外,以该节点为中间节点的智能业务可以进行正常的优化或者重路由,以该节点为首/末节点的业务不能进行重路由或者优化。,NEA,NEB,NEC,NED,Page 78,ASON网络灾难恢复措施,若之前备份了数据库则整个操作流程如下: 确认经过该节点的所有业务,进行分类 优化以故障节点为中间节点的业务 更换主控,下载数据库 等待观察,若有业务中断紧急补全交叉或重建静态业

40、务来恢复 清理整个网络的残留交叉,将静态业务升级为智能业务,处理完成。,Page 79,ASON网络灾难恢复措施,发现主控板失效后,首先确认经过该节点的所有业务信息,分为如下三类: 以该节点为中间节点的智能业务。 以该节点为首末节点的智能业务。 经过该节点的所有静态业务。 对如上三类业务,分别如下对待: 以该节点为中间节点的智能业务,直接优化到其他路径。 以该节点为首末节点的智能业务,不能优化,暂时保持现状。 对经过该节点的所有静态业务,确认在该节点的交叉连接。,Page 80,ASON网络灾难恢复措施,然后进行主控板更换操作: 拔出故障主控板。 插入新主控板(注意版本要和原主控板一致),待其

41、正常开工。 设置新主控板的ID、IP、NODE ID和原来主控板一致。(此步骤非常重要,如果有条件可在更换之前就设置好。),Page 81,ASON网络灾难恢复措施,然后进行数据库下载和激活操作: 按照OSN产品数据库包备份与恢复操作指导书下载该网元最新备份的数据库。 注:此步骤至关重要,请务必下载最新备份的网元数据库,对之前从来没有备份过数据库的情形后面会专门介绍。 激活下载的数据库(此时网元会复位,也可通过手动软复位网元激活),等待网元复位重启恢复。,Page 82,ASON网络灾难恢复措施,数据库下载后的观察和处理若数据库完全正确: 若下载的数据库完全正确,业务正常。 此时原来以该网元为

42、中间节点的智能业务在本节点会形成残留交叉,等待3040分钟后,残留交叉自动清理机制可清除这些残留交叉。 检查清理完残留交叉后,故障处理完成。,Page 83,ASON网络灾难恢复措施,数据库下载后的观察和处理若数据库部分正确: 若数据库部分正确部分错误,部分业务受影响。 此时等待该网元重启恢复完成后,若部分业务有中断,则按照前一章的ASON业务紧急恢复措施,对中断的业务采取重建静态业务或补全静态交叉的方法在第一时间使业务得到恢复。 然后完成残留交叉清理等善后工作,待网络稳定后将静态业务升级为相应的智能业务。,Page 84,ASON网络灾难恢复措施,若之前从来没有进行过数据库备份按下面步骤恢复

43、: 确认经过该节点的所有业务,进行分类。 将以该节点为中间节点的业务优化到其他路径。 使用任意节点降级和正常降级功能,将以该节点为首末节点的智能业务在其他节点降级为静态业务。 此时可看作所有经过该节点的业务全部为静态业务,将本节点的所有交叉编成命令行脚本,待更换主控板后下发。 拔出故障单板,插入新主控板,待新主控板正常开工。 设置新主控板ID、IP、NODE ID和原来一致。 下发第4步种准备好的命令行脚本,将本站交叉补全。 按照开局步骤开启本网元的智能特性。 网络稳定后,搜索路径,将静态SDH路径升级为智能业务。,Page 85,问题,Q1:更换新的主控板后可否进行网管下载数据配置操作? Q

44、2:智能网元的NODE ID可以通过下载数据库恢复吗? Q3:若之前从来没有备份过数据库,如何恢复网元数据?,Page 86,本节我们主要学习了: ASON网络灾难恢复措施,小结,Page 87,内容介绍,ASON网络常见故障处理 智能业务紧急恢复措施 ASON网络灾难恢复措施 典型案例分析,Page 88,典型案例分析,某ASON局点组网图如下,Page 89,典型案例分析,现象描述 该ASON网络由4台OSN3500组成全MESH结构,主机版本为5.21.16.12,光纤连接如上图所示。某日用户申告NE2网元脱管,工程师赶赴现场发现NE2的两块主控板指示灯运行均不正常,STAT和PROG灯

45、红色,此时业务运行正常。 问题分析 根据现象可以判断NE2主备主控全坏,此时查询NE1/NE3/NE4和NE2相连的TE链路,均已降级。主控板对于ASON网络来说至关重要,虽然目前业务运行正常,但此时发生断纤、网元复位,业务即会中断,所以需要立即分析处理。,Page 90,典型案例分析,处理过程 在网管智能电路管理示图中使用“过滤”功能,将所有经过该节点的业务分为:以该节点为中间节点的智能业务,已该节点为首节点的智能业务,已该节点为末节点的智能业务,并保存为文件。本例中全网无静态业务。,Page 91,典型案例分析,处理过程 将所有以该节点为中间节点的业务逐条优化到其他路径。 经过了解网元数据库为

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论