CNE040607000106 RAN故障处理流程.ppt_第1页
CNE040607000106 RAN故障处理流程.ppt_第2页
CNE040607000106 RAN故障处理流程.ppt_第3页
CNE040607000106 RAN故障处理流程.ppt_第4页
CNE040607000106 RAN故障处理流程.ppt_第5页
已阅读5页,还剩55页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、RAN故障处理,RAN 6.0,现场开局或维护工程师时经常会遇到各种各样的RAN设备调试问题,如何定位问题?如何解决问题?本课程为大家介绍了RAN故障的主要分类和处理流程,前 言,学习完此课程,您将会: 掌握RAN故障处理的流程和方法 掌握RAN设备常见故障的定位方法,目 标,内容介绍,第1章 故障处理的一般流程 第2章 RNC常见故障分析 第3章 NodeB 常见故障分析,故障处理概述,故障处理的一般流程 信息收集 在处理故障前,一般需要收集必要的故障信息 故障判断 在获取故障信息后,需要对故障现象有一个大致的定义,以确定故障的范围与种类 故障定位 故障定位是“从众多可能原因中找出故障原因”

2、的过程 故障排除 故障排除是指采取适当的措施或步骤清除故障、恢复系统的过程。如检修线路、更换单板、修改配置数据、倒换系统、复位单板等,故障处理概述,故障的分类,故障处理概述,故障定位常用手段 查看告警、指示灯和错误提示 RAN设备为每一条告警提供了丰富的告警处理的操作步骤,按照告警处理的详细操作步骤可以排除大部分故障 接口和协议跟踪 业务演示辅助分析 仪器、仪表辅助分析 性能测量辅助分析 测试辅助分析 对比/互换 主备倒换/复位,故障处理概述,当设备出现异常时,而现场又无法及时定位解决,往往需要求助后方技术支持。这就需要现场搜集尽可能多的相关信息,信息越全面,对问题的定位越有利,可以减少定位人

3、员与现场操作人员之间的交互,以便快速定位解决问题。 告警信息 主机错误日志 BAM错误日志 维护台操作日志 自诊断输出信息 单用户的CDR(呼叫数据记录)信息 标准接口信令跟踪消息 数据配置信息,故障处理一般流程,发现故障:多种途径、越早越好 判断故障:确定故障位置、范围、种类 定位故障:确定故障原因 解决故障:清除故障、恢复系统,故障处理一般流程,故障处理一般流程,告警:反映系统的“硬伤” 话务统计:全面的系统监控 用户投诉:越少越好 全面巡检:设备“体检”,发现故障的途径,故障处理一般流程,RNC故障一般是全网性故障,影响多个基站或所有基站 NodeB故障一般只影响本基站覆盖区域或周边基站

4、切换指标 判断是否为NodeB故障的方法 新开局或扩容时,可以通过“替换法”快速定位是否是RNC问题导致NodeB故障 维护期间,除了数据修改发生错误外,其他RNC故障一般不会对单个NodeB造成影响,故障范围判断,故障处理一般流程,RAN侧问题 传输类故障 小区类故障 业务类故障 链路类故障 对接类故障 时钟类故障 天馈类故障,操作维护问题 OMC类故障 加载类故障 网络优化问题 接入类故障 掉话类故障 拥塞类故障 切换类故障,常见故障种类,故障处理一般流程,告警信息分析 包含故障或异常现象的具体描述、可能的发生原因、有哪些修复建议等等,涉及硬件、链路、中继、CPU负荷等RAN的各个方面,是

5、进行故障分析和定位的重要依据之一 指示灯状态分析 反映诸如端口、电路、链路、光路、节点、主备用等的工作状态,常常与告警信息分析配合使用 话务统计分析 定位、解决网络问题(尤其是呼叫问题)最有效的手段,故障定位的常用方法,故障处理一般流程,仪器、仪表辅助分析 以直观、量化的数据直接反映故障的本质 主要仪器有:信令分析仪、误码仪、测试手机、天馈分析仪等 接口跟踪 利用跟踪的结果,常常可以直接得到呼叫失败的原因,找出问题的症结所在,或者从中得到启发,为后续分析提供宝贵的思路 业务测试 判断RAN侧的业务处理功能和相关设备是否正常最直接的方法,故障定位的常用方法,故障处理一般流程,对比/互换 对比:将

6、故障的部件或现象与正常的部件或现象进行比较分析,查出不同点,从而找出问题的所在,一般适用于故障范围单一的场合 互换:将处于正常状态的部件(如单板、光纤,甚至整个基站等)与可能故障的部件对调,比较对调后二者运行状况的变化,以此判断故障的范围或部位,一般适用于故障范围复杂的场合 倒换/复位:只能作为应急措施,迫不得已时谨慎使用 相对于其他方法而言,倒换或复位不能对故障的原因进行精确定位 倒换或复位后,故障现象一般难以在短期内重现,从而容易掩盖故障的本质,给设备的安全、稳定运行带来隐患,故障定位的常用方法,故障处理一般流程,联系华为技术支持热线:8008302118(中国) 0755 2856099

7、8 填写GCRMS问题单 反馈问题的时候,请注意提供或收集以下信息 局点的详细名称(全称) 联系人姓名、电话号码 故障发生的具体时间 故障现象的详细描述 告警文件、接口跟踪文件、话统结果等原始信息 NodeB的软件版本 故障后已采取的措施和结果 问题的级别及希望解决的时间,故障定位的常用方法,小结,故障处理的一般流程 发现故障判断故障定位故障解决故障 故障定位的主要方法 解决一般故障 告警信息分析、指示灯分析 对比/互换 解决复杂故障 话务统计分析、仪器分析 接口跟踪、业务测试 紧急恢复系统 倒换/复位,内容介绍,第1章 故障处理的一般流程 第2章 RNC常见故障分析 第3章 NodeB 常见

8、故障分析,内容介绍,第3章 RNC常见故障分析 3.1 操作维护类故障 3.2 加载类故障 3.3 接口链路类故障 3.4 业务类故障,操作维护类故障,BSC6810操作维护系统组成 操作维护类故障指用户在安装和使用BAM软件、LMT软件过程中发生的故障,操作维护类故障,BAM故障的一般分析思路 当BAM运行正常且各模块启动方式为“自动”的情况下,主用BAM服务器上安全监控管理器应该显示各个模块已启动. 当BAM软件的某些模块状态不正常时,可以通过查看运行日志的方法进行故障定位,各模块运行日志存放在BAM软件安装目录下的Serviceslog中 例:D:WCDMARNCBAMVersionAS

9、ervicesLog 打开各模块的调试窗口,查看调试信息,操作维护类故障Case1,重新安装驱动程序后BAM运行异常 故障现象 BAM软件安装,并且运行正常之后 然后重新安装了网卡的驱动程序,发现BAM程序运行异常 故障定位及处理 安装BAM时记录了安装网卡的标识,这个标识是安装网卡驱动程序时分配的,当BAM程序启动运行时会读取这个网卡标识,并根据网卡标识从网卡中读取IP地址,当重新安装网卡驱动后,网卡的标识会重新分配,这时BAM读取的还是以前的网卡标识,所以找不到网卡,读取IP也就失败 重新安装网卡驱动后,需要使用BAM设置工具更新网卡标识,内容介绍,第3章 RNC常见故障分析 3.1 操作

10、维护类故障 3.2 加载类故障 3.3 接口链路类故障 3.4 业务类故障,内容介绍,第3章 RNC常见故障分析 3.1 操作维护类故障 3.2 加载类故障 3.3 接口链路类故障 3.4 业务类故障,接口链路类故障,Iub接口协议栈结构,接口链路类故障,Iu-CS接口协议栈结构,接口链路类故障,Iu-PS接口协议栈结构,接口链路类故障,光口的扰码开关未打开导致IU接口的信令链路不通 故障现象 某局,RNC版本是BSC6810V200R009ENGC01B065+SP02与CS核心网对接时,SAALLNK不通。当RNC和CS直连时,跟踪SAAL信令,发现只有进RNC的消息,没有出RNC的消息.

11、 故障定位及处理 检查RNC侧和CN侧的光扣板的类型,确定两者是一致的。 直接用光纤连接RNC和MGW,但问题依旧。 检查RNC侧和CN侧的数据配置是一致的。 自环时跟踪SAAL,现象也是只有进RNC的消息,没有出RNC的消息,即4个BGN,一个END。所以可以断定应该是RNC侧的问题。 仔细回想和CN对接的整个过程,当BSC6810V200R009ENGC01B065升级SP01补丁的时候,和CN对接是成功的并可以打通电话。但是当升级SP02补丁后才出现上述描述的问题。所以怀疑SP02补丁是否有限制。 询问研发,才知道当升级SP02补丁的时候承载CS的接口板相应的光口属性中的扰码开关必须是打

12、开的。而查看本RNC的光口属性,扰码开关是关闭的,所以用命令SETOPT修改光口属性中扰码开关为ON,修改完后对接成功可以打通电话。,接口链路类故障,SAAL链路CDVT配置太少导致Iu接口信令链路闪断 故障现象 SAAL链路断了在1s之内又恢复,一天会发生好多次 故障定位及处理 SAAL链路丢包的主要原因有:光纤接头脏、光纤接头连接不好、时钟问题和两端流量配置不一致等;如果丢包严重就会导致SAAL断链,由于设置了紧急验证所以断链后又能马上建链成功,所以就出现了信令链路闪断 由于链路只是单向丢包,所以首先怀疑流量配置问题,检查RNC和CN的流量配置发送流量类型都为RTVBR、峰值速率和平均速率

13、等都相同,只有CDVT配置不一样,CN配置为300000,而RNC配置为10240,CDVT的单位是0.1s,即RNC的CDVT只有1ms,怀疑是ATM信元时延抖动导致链路丢包,把RNC侧的CDVT换成102400(即10ms)后丢包现象消失,问题解决,内容介绍,第3章 RNC常见故障分析 3.1 操作维护类故障 3.2 加载类故障 3.3 接口链路类故障 3.4 业务类故障,业务类故障,BSC6810 光口 匹配 RAB 失败 故障现象 数据配置完成后,RNC和核心网间可以收发信令,但是信令到RAB指派时,RNC响应失败,原因为:iu-transport-connection-failed-

14、to-establish . RNC上有两条告警:HigherOrderPathTraceIdentifierMismatchRegenerationSectionTraceIdentifierMismatch,业务类故障,故障定位及处理 因为信令可以收发,就没有考虑到光口物理配置的问题。但是从RAB指派失败的原因看,问题还是出在传输层。目光返回到RNC的光口告警上。 BSC6800的光口设置用SETOPT命令,只能选择SDH或者sonet. 而6810的SETOPT命令中可以设置J0/J1的格式以及发送内容。 通过与核心网接口格式比对发现:BSC6810的缺省配置是16字节,但是发送内容都是

15、“空”;核心网的J0/J1均为16字节,而发送字为“MGWSDHDEFAULT”。这与BSC6810缺省配置不同。 将OPT格式改为与核心网配置一致后,问题解决。,业务类故障,SAAL链路CDVT配置太少导致Iu接口信令链路闪断 故障现象 某局点需要进行CS域2Gto3G切换,现场使用BSC6810和iDBS。在测试过程中发现切换失败。期间RAN侧没有收到任何切换相关的信令。 故障定位及处理 由于没有收到来自2G的切换信令,问题可能出在GSM侧和核心网侧。现场没有Probe等路测工具进行路测,但核心网使用的是华为G9设备,于是要求核心网同事跟踪了A口、IU口以及其它相关接口的信令. 在A口信令

16、中看到GSM侧上报了handoverrequired,里面包含切换原因值和切换目标LAI与RNCID,但是紧接着核心网回复了handoverrequiredreject,原因值是invalidcell。由此可见GSM侧能够正常触发切换流程,只是在核心网处理过程中被拒绝。在检查handoverrequired内容时发现RNCID错误,因为GSM工程师将十进制RNCID直接用做16进制数值输入。 告知GSM工程师将切换参数中的RNCID进行修改,使2G3G的配置一致,随后2G到3G的切换顺利完成。,内容介绍,第1章 故障处理的一般流程 第2章 RNC常见故障分析 第3章 NodeB 常见故障分析,

17、内容介绍,第3章 NodeB常见故障分析 3.1 传输类故障 3.2 操作维护类故障 3.3 小区类故障,传输类故障,RAN 传输网络,传输类故障,传输电路中断 基站和RNC之间传输环节越多,传输中断可能性越大 传输码不同 如果一方使用CRC4校验,而另一方未使用,则传输不通 传输误码率高,频繁闪断 E1接头接触不良 工程质量问题,会造成传输时有时无,话音质量差,严重时会造成基站传输中断 使用微波、XDSL的基站一般误码率较高,阴雨天气闪断更频繁 传输接地不好,故障现象及常见原因,案例1:传输不通,传输类故障,故障现象 传输不通,E1出现告警 故障处理 可能由单板故障,E1端口故障或者线缆故障

18、引起 1. 检查单板和E1端口的报警信息 DSP BRD DSP E1T1 如果单板故障,更换单板 2. 单板正常但E1仍有报警,先进行本端环回测试 SET E1T1LOP( Loopback Type = LOCAL ) LOP E1T1(RNC) DSP E1T1(NodeB) SET E1T1LOP( Loopback Type = NOLOOP) 如果是E1端口故障,更换单板,故障处理 3. 单板和E1端口正常,仍有报警,此时进行远端环回,并在RNC侧监视 SET E1T1LOP (Loop type=remote) DSP E1T1(RNC) 如果是传输网络故障,请检查传输线路及传输

19、设备,案例1:传输不通,TX,RX,RX,TX,RNC,NodeB,Step 2: Local Loop Back SET E1T1LOP (Loop type=local) DSP E1T1,Step 2: Local Loop Back SET E1T1LOP (Loop type=local) LOP E1T1 (Activate loop) SET E1T1LOP (Loop type=noloop),Step 3: Remote Loopback DSP E1T1,Step 3: Remote Loopback SET E1T1LOP (Loop type=remote),Step

20、1: Check Board and ports DSP BRD DSP E1T1,Step 1: Check Board and ports DSP BRD DSP E1T1,Transport network,传输类故障,内容介绍,第3章 NodeB常见故障分析 3.1 传输类故障 3.2 操作维护类故障 3.3 小区类故障,操作维护类故障,NodeB 提供两种操作维护方式: 近端操作维护方式 远端操作维护方式,背景知识,操作维护类故障,维护人员能够使用LMT以远端和近端方式登录到NodeB,以便对NodeB进行必要的维护操作。主要包括射频通道的校正、时钟源的设置、基站单板的操作维护、基站

21、的版本升级。 远端操作维护指利用NodeB和RNC之间的传输链路,维护人员使用LMT在RNC(BAM)侧登录NodeB。 近端操作维护是指维护人员使用LMT通过网线直接登录到NodeB,维护人员必须事先知道基站近端维护IP地址。,背景知识,操作维护类故障,故障现象 软件升级过程中,软件包下载时间长达几个小时,有时甚至下载失败。,案例1:下载软件包时间太长,有时甚至下载失败,操作维护类故障,故障处理 单击“开始/运行”,输入ping XX.XX.XX.XX,看是否能ping通。 如果是近端维护,推荐使用交叉网线直接连接LMT所在的计算机和NodeB的主控板网口,排除网络质量的干扰。 如果是经由R

22、NC通过IPoA进行维护,则需要检查IPoA带宽是否太小。 (LST IPOAPVC和LST ATMTRF ),案例1:下载软件包时间太长,有时甚至下载失败,操作维护类故障,故障现象 方式1):使用操作维护系统通过IPoA链路登录到基站后,利用MML命令(SET IP)来设置近端维护通道地址,然后利用MML命令(LST IP)来查询近端维护IP地址是否设置成功。 方式2) :利用配置管理系统打开数据配置文件,修改基站属性,将近端IP地址修改成需要设置的地址后重新下载数据配置文件,重新启动基站。,案例2:下载数据配置文件重新启动基站后, 无法使用近端方式登录NodeB,操作维护类故障,故障处理

23、单击“开始/运行”,输入ping XX.XX.XX.XX,看是否能ping通。 如果是近端维护,推荐使用交叉网线直接连接LMT所在的计算机和NodeB的主控板网口,排除网络质量的干扰。 如果是经由RNC通过IPoA进行维护,则需要检查IPoA带宽是否太小。 (LST IPOAPVC和LST ATMTRF ),案例2:下载数据配置文件重新启动基站后, 无法使用近端方式登录NodeB,内容介绍,第3章 NodeB常见故障分析 3.1 传输类故障 3.2 操作维护类故障 3.3 小区类故障,小区类故障,当NodeB侧配置的本地小区资源可用的时候,NodeB将通过资源状态指示或是审计过程将资源状态反馈

24、给RNC,由RNC发起小区建立流程,建立逻辑小区。当逻辑小区建立并可用后,该小区才能提供业务服务。 与小区建立过程相关的因素和条件主要包括如下几点: 1单板工作状态逻辑可用 2传输数据正确配置 3传输链路正确连接 RNC配置的小区建立参数合理 NodeB本地小区配置参数正确,背景知识,背景知识,小区类故障,小区类故障,故障现象 逻辑小区无法建立,在NodeB操作维护系统,通过MML命令查询到本地小区资源可用,NCP、CCP的状态均正常 在NodeB操作维护系统使用MML命令ADT RES请求RNC下发资源审计,RNC下发资源审计命令,但是不下发CELL SETUP REQUEST消息,案例1:

25、NodeB状态正常,但RNC不下发CELL SETUP REQUEST消息, IUB口无RNC的小区建立消息,小区类故障,故障处理 查看NodeB的审计消息中上报的最大下行功率是否小于RNC配置的值。 在NodeB的操作维护系统,通过MML命令(DSP CELL)查看该小区的本地小区号是否和RNC协商的一致。,案例1:NodeB状态正常,但RNC不下发CELL SETUP REQUEST消息, IUB口无RNC的小区建立消息,小区类故障,故障现象 RNC下发CELL SETUP REQUEST消息 NodeB上报CELL SETUP RESPONSE消息 之后RNC 下发两条COMMON TR

26、ANSPORT CHANNEL SETUP REQUEST消息 收到NodeB上报的两条COMMON TRANSPORT CHANNEL SETUP RESPONSE消息后,RNC没有下发SYSTEM INFORMATION UPDATE REQUEST消息,而是下发CELL DELETION REQUEST消息 从NodeB侧和RNC侧观察,此刻均无告警,案例2:NodeB上报小区及公共传输信道建立响应后, RNC删除小区,小区类故障,故障处理 在NodeB操作维护系统使用MML命令(LST AAL2PATH)获得AAL2PATH的配置数据。 将NodeB的AAL2 PATH的配置数据与RNC侧的配置数据进行比较,把不一致的数据修改为一致。 检查NodeB和RNC之间配置了AAL2的E1/T1或STM1物理端口连接是否正确。如果有错则需要重新对接。 检查NodeB的ALCAP配置的ATM物理地址是否同RNC侧的相应配置数据一致,如果不一致则修改为一致。,案例2:NodeB上报小区及公共传输信道建立响应后, RNC删除小区,小区类故障,故障现象 3812E机柜做室内分布,属于异频同覆盖,功放为38W。两个小区的最大发射功率在RNC和基站上均配置为430,结果加载脚本后导致该站第二个小区无法

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论