华为PTN告警处理规范_第1页
华为PTN告警处理规范_第2页
华为PTN告警处理规范_第3页
华为PTN告警处理规范_第4页
华为PTN告警处理规范_第5页
已阅读5页,还剩19页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

华为PTN告警处理规范1.ETH_LOS告警解释:ETH_LOS为以太网端口连接丢失告警。该告警表示以太网端口接收不到以太网信号。产生原因:以太网端口的电缆或光纤没有连接好。电缆或光纤故障。本端网元接收光功率过低。单板故障。 处理步骤: 检查以太网端口的电缆或光纤是否接好,插紧松脱的电缆或光纤。 检查电缆或光纤是否存在故障,更换故障的电缆或光纤。检查法兰盘或光衰减器是否连接正确,光衰减器的衰减值是否过大。更换上报告警的处理板。若告警未消除,更换对端网元对应的处理板。2MPLS_TUNNEL_LOCV告警解释:MPLS_TUNNEL_LOCV为Tunnel连通性丢失告警。连续3个周期内没有收到希望的CV/FFD报文时出现此告警。 产生原因: PW对端停止CV/FFD。 物理链路故障。 PW对端单板正在复位。 业务接口配置错误。 网络出现严重拥塞。 处理步骤:在网管上查看PW对端是否停止了CV/FFD。在网管上检查该链路两端网元是否存在单板或光模块相关的告警。若告警未清除,查看光纤或电缆是否故障,更换故障的光纤或电缆。在网管上检查对端单板是否上报COMMUN_FAIL告警。若存在,说明对端单板可能正在复位。清除COMMUN_FAIL告警后,查看本告警是否清除。对照网元规划表,在网管上查看业务接口是否配置错误。如果是,重新配置业务接口后,查看告警是否消除。检查故障Tunnel的带宽是否已被完全占用。如果是,增大Tunnel带宽配置或消除非法发送大数据量的根源。查看告警是否清除。3. BD_STATUS 告警解释:BD_STATUS为物理单板离线告警。当用户在网管上配置了逻辑单板而物理子架上却没有插入实际单板时就会上报此告警。产生原因:单板正在硬复位。单板未插上,或单板插上,但与母板接触不良。板间通讯故障。处理步骤: 在网管的“运行态”槽位视图中查看该单板的工作状态是否为蓝色,若是,则该单板处于硬复位状态。等待3至5分钟,该单板的工作状态转成绿色后,查看本告警是否消除。检查相应槽位的单板是否插入。若未插入,请插入相应物理单板,告警将自动清除。检查单板与母板是否接触良好,母板连接器的导针是否歪斜。修正歪斜的导针,重新插拔单板使之与母板良好接触,告警将自动清除。在网管上查询是否上报告警的单板或主控板是否存在HARD_BAD或COMMUN_FAIL告警。若存在,更换上报告警的单板,查看告警是否消除。4. HARD_BAD告警解释:HARD_BAD为硬件故障告警。当单板检测到硬件出现异常且会影响业务运行时,就会上报该告警。 产生原因: 外接电源失效。 单板与母板未良好接触。 单板硬件故障。 若接口板上报HARD_BAD告警,可能是对应的处理板出现故障。 处理步骤: 确保正常电源接入后,查看告警是否清除。 拔出故障单板,确认背板上的导针无异常。重新插入单板,使单板与母板良好接触。 硬复位上报告警的单板,查看告警是否清除。若告警未消除,更换上报告警的单板。 硬复位接口板对应的处理板,参看告警是否清除。5. ETH_LINK_DOWN 告警解释:ETH_LINK_DOWN为网口连接故障告警。该告警表示以太网连接错误,端口协商失败。产生原因:本端网元和对端网元的端口工作模式不一致,造成协商失败。端口内环回。纤缆连接到错误的端口。单板故障。处理步骤:在网管上查看两端网元的以太网端口工作模式是否一致。若不一致,修改设置,使两端的端口工作模式一致后,查看告警是否清除。在网管上查看两端端口是否存在LOOP_ALM告警,若存在,优化清除LOOP_ALM告警后,查看本告警是否清除。对照网元规划表,查看上报告警的端口是否错插了纤缆,造成两端端口工作模式不一致。在网管上查看两端网元的相关单板是否存在HARD_BAD等硬件类告警。若存在,更换存在硬件类告警的单板后,查看本告警是否清除。6. CES_CEBOUND_PKTLOS 告警解释:CES_CEBOUND_PKTLOS为CES业务网络侧报文丢失告警。当网络侧连续丢包超过设置的阈值上限或当连续3s以上没有收到报文,即上报此告警。 产生原因:业务承载层中断。网络侧链路不稳定。 处理步骤:在网管上查询是否存在ETH_LOS、MP_DOWN或PW_DOWN告警。若存在,优先清除ETH_LOS、MP_DOWN或PW_DOWN告警后,查看本告警是否清除。检查并确认电缆或光纤与接口良好连接。7. CES_LOSPKT_EXC告警解释: CES_LOSPKT_EXC为单位时间内CES业务的报文丢包数超过阈值告警。当单板检测到一定周期内(10s),每秒平均帧丢失个数超出上限阈值(缺省为100)时,即上报此告警。产生原因:时钟未同步。CES业务两端网元参数配置不一致。Tunnel或PW带宽配置过低,链路拥塞。电缆、光纤或光模块故障导致链路信号变差或中断。处理步骤:在网管上查询是否存在LTI告警或其它时钟相关告警,导致时钟没有同步,缓冲区入与出速率不一致。若存在,优先清除LTI告警和时钟相关告警后,查看本告警是否清除。在网管上查看CES业务两端网元参数配置是否一致,例如“64K时隙”等。若不一致,修改配置参数,使两端一致。在网管上查看业务所在Tunnel或PW的带宽配置是否过低。如果是,重新为该Tunnel或PW配置较大的带宽,查看告警是否清除。检查并确认电缆或光纤与接口良好连接。8CESPW_REMOTE_LOSPKT 告警解释:CESPW_REMOTE_LOSPKT为CES PW远端丢包告警。当本端网元收到R比特置位为1的报文时,即上报该告警。 产生原因:网络拥塞。物理链路存在错连。 处理步骤:在网管上查看业务所在Tunnel或PW的带宽配置是否过低。如果是,重新为该Tunnel或PW配置较大的带宽,查看告警是否清除。查看物理链路是否存在错连。若存在,修正错误的物理链路后,查看告警是否清除。9. COMMUN_FAIL告警解释:COMMUN_FAIL为单板间通信失效告警。当主控板和其他单板之间的通信中断时就会上报此告警。产生原因:单板处于硬复位状态。单板故障。38M系统时钟故障。电源板故障,造成主控板3.3V电压异常。主控板不在位或故障。主控板的EXT接口直接连接HUB或者交换机。 处理步骤:查看告警,明确与主控板通信失效的单板。在网管的“运行态”槽位视图中查看该单板的工作状态是否为蓝色,若是,则该单板处于硬复位状态。等待3至5分钟,该单板的工作状态转成绿色后,查看本告警是否清除。检查单板是否存在TR_LOC告警,指示单板收到的38M系统时钟故障。若存在,优先清除TR_LOC告警。检查单板是否存在POWER_ABNORMAL告警,指示单板电压异常。若存在,优先清除POWER_ABNORMAL告警。检查单板是否存在HARD_BAD告警,指示单板硬件故障。若存在,硬复位单板后,查看告警是否清除。若告警未清除,更换上报HARD_BAD告警的单板,并查看背板上是否有倒针。10. ETH_APS_LOST告警解释:ETH_APS_LOST告警表示APS帧丢失。当没有从保护通道收到APS帧时出现此告警。产生原因:对端网元未配置APS保护。APS保护组两端配置不一致。APS保护组状态未激活。保护通道业务中断。处理步骤:在网管上查询对端网元是否配置了APS保护。若没有,在对端网元配置与本端网元一致的APS保护组,并使能协议。在网管上查询APS保护组两端配置是否一致。若不一致,修改APS保护组配置,使两端配置一致。检查两端是否都激活了APS保护协议。将已激活的协议状态设置为“禁止”,再重新激活两端的协议状态。检查保护通道是否存在信号丢失或业务质量劣化等告警,如ETH_LOS。存在,优先清除这些告警。11. LSR_NO_FITED告警解释:LSR_NO_FITED为激光器未安装告警。该告警表示光口已使能但光口上没有安装光模块。产生原因:光口使能,但没有安装光模块。光模块或单板故障,监测不到安装的光模块。 处理步骤:查看光口是否安装了光模块。更换上报告警端口的光模块,查看告警是否清除。若告警未清除,更换上报告警的单板,查看告警是否清除。12. LTI 告警解释:LTI为同步时钟源丢失告警。 产生原因:交叉时钟板上外时钟接口接入的外部时钟源丢失。线路时钟源丢失。时钟源被设置为不可自动恢复或被锁定,导致当前跟踪的时钟源丢失时,无法自动倒换到其它时正常钟源上。 处理步骤:在网管上查看是否存在EXT_SYNC_LOS告警。若存在,优先清除EXT_SYNC_LOS告警后,查看本告警是否清除。在网管上查看是否存在ETH_LOS信号丢失类告警,若存在,则优先清除这些告警后,查看本告警是否清除。若告警仍未清除,硬复位交叉时钟板,查看告警是否清除。若告警仍未清除,请更换交叉时钟板,查看告警是否清除。在网管上查看时钟源是否被设为不可自动恢复,如是,将其设置为自动恢复后,查看告警是否清除。在网管上查看是否存在SYNC_LOCKOFF告警,若存在,优先清除SYNC_LOCKOFF告警后,查看本告警是否清除。13. EXT_SYNC_LOS告警解释:EXT_SYNC_LOS告警表示外部时钟源丢失(Loss of External Synchronous Source)。当系统检测到设备所跟踪的外部时钟源丢失时,就会上报该告警。 产生原因:外部时钟源的配置模式与实际的时钟输入模式不一致。交叉时钟板故障。时钟输入电缆连接不正确。外部时钟源物理接口信号丢失。 处理步骤:在网管上检查外部时钟实际的输入模式与配置的时钟输入模式是否一致。若不一致,重新配置外部时钟源的模式,确保与实际的时钟输入模式均为2MHz或者2Mbit/s后,查看告警是否清除。在网管上查看交叉时钟板是否存在HARD_BAD等硬件类告警。若存在,清除交叉时钟板的硬件类告警,查看告警是否清除。检查时钟输入电缆是否连接正确。检查外部时钟设备的输出信号是否正常。若不正常,更换正常的外部时钟设备后,查看告警是否清除。14. MPLS_PW_LOCV 告警解释:MPLS_PW_LOCV为PW连通性丢失告警。连续3个周期内没有收到希望的CV/FFD报文时出现此告警。 产生原因:PW对端停止CV/FFD。物理链路故障。PW对端单板正在复位。业务接口配置错误。网络出现严重拥塞。 处理步骤:在网管上查看PW对端是否停止了CV/FFD。如果是,重新启动CV/FFD后,查看告警是否清除。在网管上检查该链路两端网元是否存在单板或光模块相关的告警。若存在,优先清除这些告警后,查看本告警是否消除。若告警未清除,查看光纤或电缆是否故障,更换故障的光纤或电缆。在网管上检查对端单板是否上报COMMUN_FAIL告警。若存在,说明对端单板可能正在复位。清除COMMUN_FAIL告警后,查看本告警是否清除。对照网元规划表,在网管上查看业务接口是否配置错误。如果是,重新配置业务接口后,查看告警是否消除。检查故障Tunnel的带宽是否已被完全占用。如果是,增大Tunnel带宽配置或消除非法发送大数据量的根源。查看告警是否清除。15. POWER_FAIL告警解释:POWER_FAIL为电源电池故障告警。该告警表示主控板上的电源状态不正常,如主控板上的电池无电量。产生原因:主控板的跳线连接错误。主控板上的电池无电量。 处理步骤:联系华为工程师,检查主控板的跳线连接是否正确。若不正确,按照正确方式重新连接跳线后,查看告警是否清除。更换上报告警的单板,查看告警是否清除。上述列举的告警是经常发生的告警,详细的处理步骤已经列出,对于其他告警的处理可以参照U2000帮助里面的告警参考。第二章案例分析东莞分组传送网DCNLINK_OVER告警原因及处理案例故障现象:东莞移动分组传送网上,25092_清溪PTNH1_三元里1F网元上报DCNLINK_OVER告警,告警信息如下:原因分析:分析判断可能原因:1、 告警网元DCN端口使能数量太多2、 DCN OSPF到同一网元邻居数量超限3、 DCN OSPF邻居总数超限原因排查:1、 告警网元DCN端口使能数量太多打开25092_清溪PTNH1_三元里1F【网元管理器】-【通信】-【DCN管理】-【端口设置】选择GE端口,将不需要打开DCN的端口都改为禁止。告警并未消除,经询问如果没有连纤但是打开DCN的话,这个样的情况不算在设备计算的OSPF邻居数量中。2、 DCN OSPF到同一网元邻居数量超限从网管topo也可以发现25092_清溪PTNH1_三元里1F与其他站点只有单链路对接,到同一网元邻居的数量不会超限。同时定位信息显示01 ,01代表DCN_OSPF邻居总数超限,02代表DCN OSPF 到同一网元邻居总数超限。如果定位信息里没有显示,那两种可能都有。解决措施:具体操作将25092_清溪PTNH1_三元里1F部分端口DCN通道关闭。经验总结:1, DCNLINK_OVER为DCN OSPF邻居数量越限告警,当主控板检测到网元的DCN OSPF邻居数量超过上限值时,会上报此告警。2, 告警的定位信息中 01表示DCN OSPF 邻居总数超过上限02表示DCN OSPF 到同一网元的邻居总数超过上限3, 对系统的影响如果DCN OSPF邻居数量过多,主控板的CPU占用率变大1) 如果长期超规格运行,可能导致DCN不稳定,主要表现配置、查询响应很慢,容易超时,严重时会出现不定期脱管2) 如果规格严重超限,可能导致DCN路由不稳定,网元大量脱管;严重时CPU100%,甚至会导致网元复位,所带业务中断。4, DCNLINK_OVER门限 为R1及R2C01SPC200情况下为10个, 网关带非网关网元数目门限为64,在R2C01SPC500新版本下,如果换为82SCA主控 DCNLINK_OVER 门限增加到20个(静态网络),同时网关网元带非网关网元数目调整为128.5, 如果无法避免的话,可以考虑DCN绕接方式,即DCN通道使能数目分担,不至于DCNLINK超过门限。当我被上帝造出来时,上帝问我想在人间当一个怎样的人,我不假思索的说,我要做一个伟大的世人皆知的人。于是,我降临在了人间。我出生在一个官僚知识分子之家,父亲在朝中做官,精读诗书,母亲知书答礼,温柔体贴,父母给我去了一个好听的名字:李清照。小时侯,受父母影响的我饱读诗书,聪明伶俐,在朝中享有“神童”的称号。小时候的我天真活泼,才思敏捷,小河畔,花丛边撒满了我的诗我的笑,无可置疑,小时侯的我快乐无虑。“兴尽晚回舟,误入藕花深处。争渡,争渡,惊起一滩鸥鹭。”青春的我如同一只小鸟,自由自在,没有约束,少女纯净的心灵常在朝阳小,流水也被自然洗礼,纤细的手指拈一束花,轻抛入水,随波荡漾,发髻上沾着晶莹的露水,双脚任水流轻抚。身影轻飘而过,留下一阵清风。可是晚年的我却生活在一片黑暗之中,家庭的衰败,社会的改变,消磨着我那柔弱的心。我几乎对生活绝望,每天在痛苦中消磨时光,一切都好象是灰暗的。“寻寻觅觅冷冷清清凄凄惨惨戚戚”这千古叠词句就是我当时心情的写照。最后,香消玉殒,我在痛苦和哀怨中凄凉的死去。在天堂里,我又见到了上帝。上帝问我过的怎么样,我摇摇头又点点头,我的一生有欢乐也有坎坷,有笑声也有泪水,有鼎盛也有衰落。我始终无法客观的评价我的一生。我原以为做一个着名的人,一生应该是被欢乐荣誉所包围,可我发现我错了。于是在下一轮回中,我选择做一个平凡的人。我来到人间,我是一个平凡的人,我既不着名也不出众,但我拥有一切的幸福:我有温馨的家,我有可亲可爱的同学和老师,我每天平凡而快乐的活着,这就够了。天儿蓝蓝风儿轻轻,暖和的春风带着春的气息吹进明亮的教室,我坐在教室的窗前,望着我拥有的一切,我甜甜的笑了。我拿起手中的笔,不禁想起曾经作诗的李清照,我虽然没有横溢的才华,但我还是拿起手中的笔,用最朴实的语言,写下了一时的感受:人生并不总是完美的,每个人都会有不如意的地方。这就需要我们静下心来阅读自己的人生,体会其中无尽的快乐和与众不同。“富不读书富不久,穷不读书终究穷。”为什么从古到今都那么看重有学识之人?那是因为有学识之人可以为社会做出更大的贡献。那时因为读书能给人带来快乐。自从看了丑小鸭这篇童话之后,我变了,变得开朗起来,变得乐意同别人交往,变得自信了因为我知道:即使现在我是只“丑小鸭”,但只要有自信,总有一天我会变成“白天鹅”的,而且会是一只世界上最美丽的“白天鹅”我读完了这篇美丽的童话故事,深深被丑小鸭的自信和乐观所折服,并把故事讲给了外婆听,外婆也对童话带给我们的深刻道理而惊讶不已。还吵着闹着多看几本名着。于是我给外婆又

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论