常见网络故障分析_第1页
常见网络故障分析_第2页
常见网络故障分析_第3页
常见网络故障分析_第4页
常见网络故障分析_第5页
已阅读5页,还剩27页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

常见网络故障分析一、衡量网络优劣的标准基于市场与客户感知的判断基于网络指标的判断市场

网络

目标:确保客户感知

174A与B通话,A驻留的小区是上行质差小区,则B听不清楚A的话音,A听得清B的话音上行质差下行质差A与B通话,A驻留的小区是下行质差小区,则A听不清B的话音用户A

用户B喂,喂,听不清….上行质差小区

用户A喂,喂,听不清….用户B下行质差小区用户A喂,喂,听不见啊….

175用户B上行失步小区上行失步A与B通话,A驻留的小区是上行行质差小区,则A听不间B的话音,B听的见A的声音,形成假单通现象。

一、衡量网络优劣的标准—客户感知1、客户语音感知主要问题表征影响用户感知有六大因素,其中的四种因素与网络相关。

176速率低时延长没信号连不上掉线多覆盖因素结构因素容量传输

IDC内容源终端

一、衡量网络优劣的标准—客户感知2、客户上网感知主要问题表征177信号只有2格怎么没有5G信号呢怎么打电话断断续续WLAN怎么总掉线

怎么回事,上网还这么慢信号问题、语音质量和数据业务一、衡量网络优劣的标准—客户感知3、客户投诉主要问题表征目标值排名摸底成绩排名第一期成绩排名71718目标值排名摸底成绩排名第一期成绩排名--26178网络质量满意度80.07

78.7079.50

78.4675.9876.58全网-0.6第一期表现目标值摸底表现网络质量成绩排名2.362.850.901.00-0.1全网摸底表现第一期表现网络质量感知领先度网络质量领先度排名未达标

一、衡量网络优劣的标准—客户感知(指标类)全网及网络满意度较摸底均呈现明显下降趋势,而网络满意度及领先度均低于全网水平,且排名靠后,整体表现不理想。目标值排名摸底成绩排名第一期成绩排名14148179流量客户满意度流量客户成绩排名:74.7275.0073.6772.5475.4173.39+2.02全网目标值摸底表现第一期表现86.38流量提醒流量资费76.60手机上网流量客户各环节分数

68.73客户对手机上网不满意的原因1.0%手机性能网络稳定性

网络信号24.8%13.9%33.7%上传/下载速度

接入速度26.7%

一、衡量网络优劣的标准—客户感知(指标类)全网及流量客户较摸底均有所提升,流量客户满意度高于全网2.02pp,并且排名靠前,整体优于全网水平。手机上网满意度仍是目前流量客户最不满意项目。集团考核关键指标2014年6月2014年7月环比(%)LTE下载速率((M)29.332.19.56%GSM语音质量98.3498.27-0.07%WLAN端到端接入成功率(%)98.3897.66-0.72%手机上网类指标全网7月情况我省7月情况对比全网PDP激活成功率(不含用户原因)99.40%99.57%0.17%SGSNPool间RAU更新成功率98.67%98.09%-0.58%忙时Radius计费请求成功率99.38%99.92%0.54%语音类指标全网7月情况我省7月情况对比全网GSM无线接通率99.60%99.44%-0.16%GSM无线掉话率0.50%0.49%-0.01%CSMT呼叫回落成功率(CSFB)96.81%97.22%0.41%CSMT呼叫寻呼成功率(CSFB)97.21%97.39%0.18%互联网指标全网7月情况我省7月情况环比(%)流量本网率92.80%90.63%-2.17%流量综合疏通成本(万/G)8.28.60.40故障类指标全网7月情况我省7月情况环比(%)2G小区退服率(‰)3.2503.6380.3885G(TD)小区退服率(‰)3.6073.253-0.354180一、衡量网络优劣的标准—网络指标集团通报考核中涉及十六大项目,约70项指标。我省指标在全国排名在中等水平,故障类指标在全国排名在最后。性能统计KPI指标181

2G网络测试

5G网络测试

5G网络测试

WLAN测试

语音业务测试

数据业务测试

移动GSM/TD-S/TD-LTE测试

电信CDMA/FDD-LTE测试联通GSM/WCDMA/FDD-LTE测试

主城区/一般城区/郊区/乡镇测试

室外/室内测试

按网络分按承载业务分

按运营商分按测试场景分DT即路测(驱车测试):是指借助仪表/测试手机以及测试车辆等工具,沿着特定的线路进行无线网络参数/运行和话音质量指标的现场测试,一般用于室外测试。CQT即定点测试:是指借助仪表/测试手机,在指定地点做拨打测试,对无线网络参数/运行和话音质量指标现场测试,一般用于室内测试。

一、衡量网络的标准-网络指标测试指标

DT(驱车)/CQT(定点)测试是网络优化工作中最常用的手段,它可以模

拟客户去全面、真实、快速地发现网络问题。通过开展测试工作,可客观评估地

市分公司网络质量,及时的掌握现场网络情况,测试内容包括以下几方面:1821、覆盖率=满足覆盖条件的采样点数/总采样点数×100%指标意义:该指标是对道路网络信号覆盖情况的评估,基站投入不足、建站位置不合理等情况都可以通过该指标反映出来。2、全程成功率=接通率*(1-掉话率)接通率=接通次数/起呼次数×100%掉话率=掉话次数/接通次数×100%指标意义:该指标是对主被叫之间端到端接通、掉话情况的评估,直接反映客户语音业务的可接入性和呼叫保持性,是对网络资源配置、无线干扰、路由区划分、切换关系等一系列网络情况的反映,也是客户感知的直接体现。3、语音质量=语音质量好的采样点(加权)数/总采样点数×100%举例:

GSM

RxQual话音质量=[RxQual(0级)+RxQual(1级)+RxQual(2级)+RxQual(3级)]×1+[RxQual(4级)+RxQual(5级)+RxQual(6级)]×0.7/(总采样点数)×100%指标意义:该指标是通话过程中语音质量清晰的评判,能反映客户对网络语音质量的感知,与网络干扰水平直接相关,同时与网络覆盖、切换性能、半速率开启有一定关联。一、衡量网络的标准-网络指标常见测试指标举例183211098665333221000010

5201525四星故障次数78

7871574027

30

2422

1916

15

15997

0注:四星故障:1、同一地区2G、5G、5G基站,同时中断100个基站

2、满足省内或集团重大故障。

三星故障:1、同一地区2G、5G、5G基站,同时中断40个基站。

2、传输省干、国干光缆中断

3、有重大隐患的故障5040302010807060三星故障次数

二、网络感知差的原因—故障影响

2013年1月-2014年1月,全省共发生1326起重要故障,其中四星故障有79起,三星故障有517起。昭通、曲靖、昆明故障次数较多。659

623

561

55218470794905426620001000

0300040005000600070008000

2026

1668

1665

1004

878

457

393

233

185昭

丽通

江中断基站个数518446397199200100

0300400500600昭通昆明曲靖普洱106大理

99文山

95红河76保山

75迪庆54怒江42临沧41版纳40丽江36德宏29楚雄

9玉溪业务中断时长(小时)业务中断时长(小时)平均业务中断时长(小时)141小时

二、网络感知差的原因—故障影响

2013年1月-2014年1月,1326起重要故障中有865起影响业务,累计影响27276个基站中断(平均每站中断0.57次)、3860个AP下线,业务影响时长为2265小时,其中省内重大故障累计影响6773个基站中断、

3860个AP下线,业务影响时长为387小时,话务量损失为209839erl,经济损失为79.88万元。

昭通、昆明、曲靖基站中断个数较多;昭通、昆明、曲靖业务中断时长较长。185客户感知

语音

打得通

听得清

不掉话

数据

能上网

时延小

速度快

不掉线网络能力和质量

覆盖容量效益

可靠、安全性

和稳定性

网络性能质量关键点

规划建设

维护

优化

多网协同二、网络感知差的原因—规划建设优化影响

什么是好的网络?

刘爱力副总裁:

“四分规划、三分建设、两分维护、一分优化”覆盖不足基站偏离

话务区覆盖过远深度覆盖

不足覆盖不合

理越区覆盖

(>700

)重叠覆盖(重叠覆

盖>4)超高站(>50

米)

超近站(<100

米)网络结构是指网络中基站、天线等设备的摆放位置,主要涉及到最小站间距、天线挂高等基础物理信息。主要评估指标是

弱覆盖不足、过覆盖、重叠覆盖、超高站、超近站等。良好的网络基础结构要求:连续覆盖率>98%;MR弱覆盖比例<5%;城区四超(覆盖不合理)比例<5%

186

二、网络感知差的原因—规划建设优化影响1、整网网络质量关键点—网络结构

网络结构187

<4%)187系统负荷整网无线资源

使用效率LAC负荷(安全门限80%)

PCU/ABIS负荷(安全门限

70%)BSC/RNC负荷

(安全门限

80%)超闲小区超忙小区T/G话务占比

低重度回流超闲小区:GSM(每线话务量<0.15erl且单时隙承载效率<3),TD(话务量<1erl且数据流量<5MB)超忙小区:GSM(无线资源利用率>90%),TD(码资源利用率>60%)T/G话务占比低小区:TD话务量/(GSM话务量+TD话务量)<5%重度回流小区:2G高倒流小区:由3/5G终端且已换卡用户日均产生流量超过200M的GSM小区5G高倒流小区:由5G终端且已换卡用户日均产生流量超过200M的TDS小区

小区性能质差小区黑点(解

决率>80%)

低接通小区黑点(解决率>80%)室分小区弱覆盖整

治(弱覆盖占比高掉话率黑点(解

决率>80%)2、整网网络质量关键点—系统负荷和性能二、网络感知差的原因—规划建设优化影响稳定性可靠性安全性

关注两大问题点:长历时告警:一级告警持续8小时;二级告警持续24小时;三级告警持续72小时。高频闪断小区:每日中断20次以上,每月闪断天数大于等于5天。

关注小区退服率:城区小区退服率低于0.1%,农村小区退服率低于0.3%

关注每网元告警量:做到故障判断准确、维护目标准确、处置方法准确、人员职责明确,确保先于客户发现问题,故障时长可控,压缩故障处理时长,降低故障对客户感知的影响。(健康标准:2014年四季度预计达到以下水平:GSM/TD/LTE/WLAN分别为:基准值0.70/0.60/0.70/0.12;挑战值0.50/0.50/0.50/0.10)

关注负荷实时调整:开展BSC(PCU)\RNC负荷集中分析、管理工作:集中分析,明确流程,多维评估,规范实施。

关注作业计划执行:落实作业计划的执行情况,开展预防预检工作,消灭安全隐患,杜绝重大故障的发生。

188

目标:建成两大能力

业务的保障能力:告警少,退服少,故障历时

短。

客户投诉的快速解决能力:开展预防预检工

作,先于客户发现问题;加强告警整治全面管

理,避免导致故障由小变大,引发客户感知。手段:

狠抓基础维护,梳理各级维护职责,确保维护工作落地;

开展预防预检,落实一线维护人员维护职责,重点关注作业计划执行。

二、网络感知差的原因—规划建设优化影响3、整网网络质量关键点—网络维护

网络维护工作是保障网络质量的关键点,评价网络维护质量的标准就是稳定性、可靠

性、安全性;网络维护的目标就是建成业务的保障能力和客户投诉的快速解决能力。1891、网络问题包括:(无线网)规划问题、工程建设问题、维护故障问题、参数问题;核心网问题等2、手机问题包括:手机问题、sim卡问题等3、客户问题包括:客户使用不当导致的问题等……三、常见问题隔离度不满足与其它系统天线隔离度不满足要求,互相干扰风险高。

垂直隔离

度不足

20cmG网天线受广告牌部分遮挡G网天线受广告牌部分遮挡天线受遮挡天线部分受遮挡将影响覆盖效果。

LTE与TDS天

线未受遮挡

三、常见问题-网络规划问题天线位置设计不合理问题

这两根抱杆应该建

在这里解决措施:天面改造

190191三、常见问题-网络规划问题美化天线普遍存有高度不足,安装密集隔离度不足,覆盖优化调整困难,难以发挥覆盖性能的问题。高度不足,导致覆盖受限,优化调整困难美化天线设计/使用问题解决措施:规划设计时充分考虑天线选型的合理性;拆除美化罩或更换小型天线。GPS安装不合规GPS净空要求不满足。接地卡扣安装不负荷规范造成安全隐患。一条馈线未接入。

三、常见问题-工程建设问题施工工艺问题

该GPS南面近距

离有建筑遮挡,解决措施:严格单站验收质量,避免带病入网。

192

三、常见问题-工程建设问题施工时方位角/下倾角设置错误

小区天线方位角与设计不符,未能达到有效覆盖,且被遮挡。

未考虑内置下倾,机械下倾角符合,但造成实际下倾角过小,影响覆盖

整治方法:根据设计图、结合实际情况整改建设。重点关注设计图中的关键信息实例1:方向角设置错误,导致被广告牌遮挡。实例2:方向角设置错误,导致被房屋遮挡。

实例1:设计倾角为11°,实际为24°实例3:应设倾角为6°,实际机械下倾6°,同时使用内置9°电子倾角的天线。解决措施:严格单验,把握工程优化质量。

193RSRP(dBm)SINR(dB)PDCP下载速率(Mbit/s)PDCP上传速率(Mbit/s)-81.1528.8246.388.79

三、常见问题-维护故障问题

硬件故障

关注点:BBU退服、RRU退服、RRU降质、射频模块告警、光模块告警、驻波告警、链

路不可用告警等。(1)如:用户投诉某区域无5G信号,影响上网。

(2)经查,该站点存在以下硬件告警:a.射频单元光模块收发异常告警b.射频单元交流掉电告警c.射频单元维护链路异常告警d.射频单元维护链路异常告警e.射频单元业务不可用告警f.射频单元业务不可用告警现场判断为:RRU供电异常

(3)故障处理:更换RRU后指标解决措施:梳理重要告警,并纳入监控,并提高维护和硬件故障处理效率。

194195

三、常见问题-参数设置问题CSFB参数和切换门限参数设置不合理问题

1.参数设置导致CSFB异常的案例:

问题:某地市进行iPhone5s的CSFB测试发现问题:

1.

主叫从拨号到接通时延过长(大于30s);

2.

主叫有时回落到5G有时回落到2G;

分析:经参数核查,发现未在LTE侧设置CSFB回落到2G为高优先级。

解决:优先级参数调整后,该问题解决(回落到2G,且时延仅8s)。

2.参数设置导致下载速率低的案例:

问题:某路段覆盖良好但切换频繁,下载速率为29Mbps。

分析:经参数核查,发现其切换门限为2dB,迟滞为320ms。

解决:将切换门限改为6dB,迟滞改为2560ms后,切换次数明显减少,下载速率上升至

39Mbps。解决措施:规范管理参数、明确参数的合理范围和设置要求,并将参数优化调整作为日常工作执行。196251.7154.3120.0188.7

165.30.0300.0200.0100.0400.069.51215.2某站点不同功率设置下平均有效覆盖距离

344.7249.3

240.7

-95dBm-100dBm

某站1小区注:每种功率设置下,寻找三个边界值点取距离平均值

三、常见问题-参数设置问题功率设置过低

功率设置过低将导致覆盖不足,或不能有效覆盖目标区域。

现网站间距普遍为300-500米之间,不考虑穿透损耗时,功率设置建议为

9.5dBm。考虑穿损时,功率设置建议大约为12dBm。RSRP平均

值功率

6平均距离

120.0平均SINR

21.6平均下载速

49.9

-95(考虑穿损)

-100

(不考虑穿

损)

9.5

1215.2

6

9.5

1215.2165.3240.7251.7154.3188.7249.3344.723.218.219.418.721.217.113.948.749.149.247.850.946.734.8解决措施:规范管理参数、明确参数的合理范围和设置要求,并将参数优化调整作为日常工作执行。197

在UE发起网络侧去附着过程时,当遇到有HSS修改签约数据,

HSS给MME下发修改用户数据消息,有可能会触发MME内部异常,造成CPPU单元中模块消息处理异常,出现0004告警,无法正常处理包括CSFB在内的业务,该问题属于诺基亚软件BUG引起,后通过打上NS30PD005补丁解决。

三、常见问题-核心网问题核心网故障导致5G-CSFB用户无法被叫问题

1、故障现象

从6月25日起,陆续有LTE用户投诉在语音呼叫时主叫可以听到回铃或彩铃,但被叫用户侧

无任何响应,从6月30日下午时起,LTE用户投诉量增大,现场测试时发现用户在回落到2、

5G网络后重选LTE网络困难。

2、故障分析

从告警历史中发现YXMME01

CPPU单元上出现大量告警0004

通过查询诺基亚NED,该告警的解释是基于负载保护机制特性,在网元高负荷情况

下将拒绝新增的业务请求,导致被叫接通成功率低。

3、故障定位及解决198

通过业务仿真拨测发现区域用户的DNS解析成功率偏低,同事业务的GET成功率严重偏低。通过端到端的逐段排查,发现诺西核心网在IP地址规划上公网地址严重不足,1个公网地址对应了约9万个私网地址(理论1个公网地址最多可对应约64000个公网地址)。3、故障定位及解决

对核心网公网地址进行扩容,问题解决。随着智能终端的普及,互联网应用的丰富,数据业务对IP地址的资源需求越来越强劲。运维部门需提前做好业务和用户行为分析研究

三、常见问题-核心网问题核心网公网地址不足导致5G上网速率慢问题1、故障现象

6月6日开始,诺基亚PS核心网覆盖出现大量用户投诉反

映5G网络下上网速度慢、业务感知差,其中大量投诉集中在腾讯公司微信相关业务,另

外也存在用户投诉在一定时间内,新浪、淘宝等各类网站访问速度都很慢甚至打不开的

情况,过一段时间又有所好转。

2、故障分析199•从traffica上来看,主要的原因是inter

papu

间RAU失败,失败的原因是0x4F(No_rsp_from_gsn_c)。•意思是在sgsn发出了sgsn

context

request

之后,

在15s(T3*N3)没有收到sgsn

contextresponse的响应,

从而导致RAU的拒绝。35009Countof

CauseCauseOldCgiLacRowLabels0x00x1600x2C0x4F0x8E0x8F0x900x95GrandTotal

1

349

612628847

9

5563

14

965418743、故障定位及解决

该问题在SGSN没有配置修改的情况下问题自动消除,定位是DNS回给SGSN一个不正确的GN口地址,通过优化DNS参数配置解决。

三、常见问题-核心网问题SGSN的PAPU组通讯异常导致2G切5G失败问题

1、故障现象

7月10日下午开始有用户反应在附近不能正常附着到2/5G网络。从实时监控

上来看从7月10日12点左右开始,昆明Pool

6台SGSN的interPapuRausuccrate开始降低。

现场测试发现,用户从5G切换到2G正常,2G切换到5G时不成功,并且不能正常附着,只能重新开

机才能附着到2/5G网。

2、故障分析89.1357.51100

80

60

40

20

0

3、故障定位及解决

造成此次故障的根源为腾讯域名大量500错误导致网关队列拥塞,从而影响Radius鉴权成功率。

可通过WAP网关将修改配置文件,增加队列大小,防止队列堆积过量,规避该问题;同时省公司已协调腾讯公司配合进行彻底解决。

200

三、常见问题-核心网问题

Radius鉴权成功率低导致WAP业务受阻问题

1、故障现象

8月7日凌晨00:53开始,所有GGSN均出现到WAP网关Radius认证失败,由于Radius认证采用异步方式,导致用户频繁PDP激活去激活,产生大量话单,为平常两倍,造成话单堆积,信息中心无法及时取走。

2、故障分析

登陆设备查看,CPU、风扇、运行温度等硬件相关信息无报警。以此可以初步判断设备无硬件故障,imdb数据库运行正常,检查发现网关话单code为500的错误码占比达60%左右。通过对话单分析,得知500错误码对应的SP为。该域名在凌晨0点访问量激增,总请求数从10万次跃升至89.13万次,同时错误码500从0突升至57.51万次。

总请求数(万次)201三、常见问题-手机或SIM卡问题问题现象:反映国行5S不能使用5G问题原因分析:将该客户手机里的USIM卡换到另一台iPhone

5S,另一台iPhone

5S可以使用5G网络,分析发现是由于该客户苹果5S手机运营商版本15.5未更新导致。问题定位:手机软件版本问题解决方法:更新运营商版本至15.7及以上即可(如右图)。苹果5S手机运营商版本未更新导致不能使用5G网络问题问题现象:某领导使用三星Note2不能使用5G。原因分析:换另一张卡可用5G。问题定位:USIM卡问题解决状态:已定位并解决(BOSS前台重新开通卡数据)。公司内某领导使用三星Note2不能使

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论