LTE业务速率问题定位优化指南_第1页
LTE业务速率问题定位优化指南_第2页
LTE业务速率问题定位优化指南_第3页
LTE业务速率问题定位优化指南_第4页
LTE业务速率问题定位优化指南_第5页
已阅读5页,还剩44页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

LTE切换问题定位专家指南秘密TIME\@"yyyy-M-d"2012-10-16华为机密,未经许可不得扩散第页产品名称ProductName密级ConfidentialityLeveleNodeB秘密产品版本ProductVersionTotal46pages共46页BasedonV100R005LTE业务速率问题定位优化专家指南拟制:PreparedbyLTE网络分析部日期:Date2012-08-15审核:Reviewedby日期:Date审核:Reviewedby日期:Date批准:Grantedby日期:Date

华为技术有限公司版权所有侵权必究

修订记录Date日期RevisionVersion修订版本SectionNumber

修改章节ChangeDescription修改描述Author作者2012-08-301.0初稿完成张军1528362012-10-162.0据第一次检视意见修改张军152836

目录概述 41 路测类业务速率问题分析 41.1 路测类数据分析的一般套路 41.2 路测数据具体分析 61.2.1 特定场景的异常规律排查 61.2.2 维度一:覆盖和干扰水平分析 71.2.3 维度二:空口编码效率分析 91.2.4 维度三:资源利用率分析 151.3 调度信息的TTI级别分析 201.3.1 PDSCH解调结果ACK/NACK的上行反馈通道的可靠度分析 201.3.2 L1上行和L2上下行调度的时序关系 211.3.3 L2下行调度主要信息 221.3.4 上行调度的主要信息 241.4 其它核查项 252 话统类业务速率问题分析 252.1 商用网络数据分析的一般套路 252.2 业务速率的三个话统指标 272.3 话统数据具体分析 272.3.1 特定参数排查和信息收集 282.3.2 维度一:覆盖和干扰水平分析 282.3.3 维度二:空口编码效率分析 312.3.4 维度三:资源利用率分析 352.4 按三个维度进行问题的细化分析 383 其他补充 443.1 如何同步分析ENBLog和UE侧Log 443.2 通过工参信息判断站点覆盖 44概述网络业务速率是LTE网络最重要的指标之一,反映了终端用户在网络中的下载、上传数据的感受。通过提炼业务速率分析的一般方法,提高对网络业务速率的分析能力。业务速率问题的常见形式是:吞吐量问题和用户速率问题。业务速率问题常见场景包括:路测场景(含实验室测试)的业务速率性能和商用网络的业务速率性能。路测类业务速率问题分析路测类数据分析的一般套路对于路测业务速率问题,我们重点关注单用户速率的分析方法。在EPF调度算法下,多用户的路测问题,通过一定的推算,绝大部分可以转化为单用户问题分析。究其根本,EPF算法保障用户的公平性和差异性。如果是相同业务,不同用户之间遵循RB等比例分配的公平算法;如果是不同业务,GBR总是优先保证,而NonGBR业务之间遵循RB按优先级权重因子进行比例分配的原则。针对上述流程,描述如下:1)吞吐量曲线是否正常,及判断标准,参考《LTE业务速率通用指南》进行判断,或者依据验收标准进行判断;2)如果不达标,首先要检查覆盖水平,如果覆盖水平太差,需要进行RF优化,提升覆盖;3)分析吞吐量曲线:吞吐量曲线是信号质量和吞吐量的关系曲线,反映了在一定信号质量下,能够达到的吞吐量水平。信号质量VS吞吐量的趋势线,反映了覆盖干扰、编码效率、PRB利用率等诸多因素的综合作用。因此对于位于趋势线下方的异常点,需要进行识别分析。4)根据《LTE业务速率通用指南》的方法识别异常点,简单来说,就是位于趋势线下方的异常点,表现为:高SINR,低MCS。5)异常点特征识别:具体可以参考1.2.1等已知场景的识别。对于未知场景,需要结合流程,分析这些异常点的共同特征,进一步提炼复现场景。6)如果这些异常点都集中在某些特别小区,需要对TOP小区进行进一步的分析,处理的思路详见1.2节的分析流程。路测数据具体分析路测基本的数据分析,下行采用SINRVsThroughput曲线,上行采用Pathloss(orRSRP)VsThroughput。通过对比路测曲线和基线曲线(或典型局点曲线水平,具体参考《LTE业务速率定位和优化通用指南》)差异,判断当前网络的业务速率是否符合预期。根据吞吐量曲线对比分析,找出异常点,进一步深入分析。图:下行THPVsSINR曲线路测数据的深入分析,首先要发现吞吐量曲线的异常点,此处可以参考《LTE业务速率定位和优化通用指南》的一般方法,根据预设值条件(高SINR,低吞吐量的点,定义为异常点),筛选出异常点。分析步骤为“特定场景排查+3个通用维度”。三个维度分别为:覆盖和干扰、空口编码和资源利用率。具体思路如下。特定场景的异常规律排查特定场景的排查受限要根据《LTE业务速率定位和优化通用指南》的一般方法,筛选出吞吐量奇点。对于筛选出来的问题奇点,需要去排查这些问题奇点的共性。这些场景通常包括:1)传输受限站点;2)切换导致SINRVsTHP曲线出现异常点;3)特定流程(比如重建、掉话)导致的吞吐量出现异常点;等等。1)传输受限站点,只要采样点足够多,通过SINRVsThroughput曲线,可以做初步分析;对于传输受限的站点,从趋势图上去看,高SINR下THP保持较低水平(SINR越高,吞吐量维持在一个较低的水平)。2)特定流程导致的吞吐量异常通常通过时序图去分析。时序图包括:PCI和Throughput(或DLGrant/RBNumber)的时序图,L3信令流程和Throughput(或DLGrant/RBNumber)的时序图,进行初步的判断。特别,对于L3流程和吞吐量的时序关系,需要回到原始数据中,根据吞吐量异常点前后发生的L3事件来判断是否和流程强相关。案例1:加拿大站点传输受限导致部分站点吞吐量上不去。在加拿大Bell前期达标验收过程中,吞吐量曲线如下趋势,从图中可以明显看出,SINRVsThroughput曲线,有大量异常点的吞吐量和SINR没有明显同步上升关系,可以判断为传输受限,可以根据此让一线进行定点的峰值复测。案例2:eAccess切换导致流量掉低从关键事件和吞吐量(或资源利用率/调度次数)的时序关系分析。在eAccess局点搬迁过程中,从PCI和DLGrant时序图可以看出,DLGrant掉低的点,都伴随着S1切换过程(PCI变化)。因此将焦点锁定在切换过程中,PDCP缓存数据量的变化。场景明确后,通过镜像复现,结合切换过程中PDCP的数据转发机制进行排查,缩小问题分析范围,快速找到优化方案。维度一:覆盖和干扰水平分析下行覆盖和干扰评估下行覆盖采用SINR的PDF或CDF图形进行评估。如果SINR的分布较差,需要从RF优化的角度去提升SINR的分布,使之符合RF的验收要求。下行SINR的测量值一般有多个:AntennaPortSINR表示某个单天线口的SINR测量值,AVGSINR表示多个天线口SINR的合并平均值,而RANK1和RANK2的SINR是考虑了RANK解调算法后对信道的测量信噪比。TestUE提供AVGSINR和RANK1/2SINR,而高通芯片提供AntennaPortSINR。一般情况下,我们采用AVGSINR(TestUE)或者各个天线口算术平均SINR(高通商用芯片)作为比较的标准。图:路测SINR分布PDF和CDF图形下行覆盖决定了小区空口的频谱效率。对于下行,SINR综合表征了覆盖和干扰水平。SINR的水平从根本上决定了小区能够达到的频谱效率(吞吐量=频谱效率*资源利用率)。不同网络中,在SINR分布接近的情况下,Throughput的曲线趋势图是有可能存在差别的,在空口编码效率分析中再详细介绍。上行覆盖和干扰评估上行覆盖采用UE测量到的下行导频的RSRP(或路损Pathloss=下行RSRP-导频功率)作为覆盖的评估标准。UE测量到的RSRP是UE接收到的服务小区的下行导频RS信号质量,因此RSRP实际反映的是下行路损情况。一般情况认为,下行路损和上行路损是一致的。根据协议定义,RSRP是UE所有天线口接收到的RSRP的最大值(比如:2天线,以天线口Port0和Port1测量的最大值作为下行测量到的RSRP)。而UE的实际上行发送数据仅在天线口Port0上发送,因此,上行实际路损应该根据UE发射主极上测量到的RSRP来折算。因此,在路测中:1)要保证UE的各个接收天线测量的路损是基本平衡的;2)上行覆盖计算以天线0(主极天线)的测量RSRP计算为准;图:路测RSRP分布PDF和CDF图形对于上行,RSRP(或者Pathloss)不能综合表征覆盖和干扰水平,RSRP指示表征了有用信号接收水平。上行的干扰是在ENB侧进行测量的,对于UE侧来说,没有测量的数据。因此上行的干扰水平,需要根据ENB侧的干扰水平话统进行综合分析(L.UL.Interference.Avg和L.UL.Interference.Max),具体参考2.3.1章节。单用户路测中,如果网络中只有单用户,除外部干扰源外,不存在系统内上行干扰。单用户路测中,可以认为没有干扰,噪声主要是底噪。维度二:空口编码效率分析下行空口编码效率分析下行采用SINRVsMCS的方式评估空口编码效率。空口编码效率实际是三方面综合作用的结果:本小区信号质量、干扰水平和ENB内部算法选择MCS过程。图:路测SINRVsMCS的分布图空口编码效率问题分析,首先需要筛选异常点。根据《LTE业务速率定位和优化通用指南》,异常点定义为SINR很高,但是MCS很低的点,集中分布在趋势线的下方。SINR到MCS的映射流程可以简单表述如下:上述流程简单描述如下:1)UE测量导频SINR,通过一定SINR量化算法(取决UE实现),得到4bit的CQI上报值;UE测量的是导频SINR,但是实际数据发送的RE位置和导频RE位置是不一致的。导频SINR不能完全反映数据解调SINR。一般,网络越重载,干扰分布越均衡,导频SINR和数据解调SINR一致性越好。2)ENB根据UE上报的4bitCQI通过一定的经验公式量化成TBS索引(简单理解为MCS索引,两者是一致的);3)ENB根据用户下行数据解调的结果ACK/NACK进行CQI调整,维持CQI调整量(目前CQI调整维护3路。CQI调整量简单理解成MCS调整量,两者是一致的)。由于下行数据的ACK/NACK的反馈依赖于上行PUCCH或者PUSCH链路,因此上行链路的可靠性也需要关注。4)确定用户调度的MCS值。上述编码效率过程中,SINR到MCS的映射,一般出现的问题如下:1)CQI调整算法的问题CQI/MCS是闭环调整的,因此即使UE对信道的估计不准,导致ENB初选的MCS不准确,是可以通过有限次的CQI闭环调整来达到收敛目标值的。CQI到MCS的调整流程关键事件触发:1)UE上报了新的CQI;2)ENB收到一个ACK/NACK,触发CQI调整量的累积;如果出现IBLER不收敛目标值的情况,就需要定位CQI调整算法的问题。此类问题较为简单,通过获取小区跟踪,分析CQI调整的详细过程。这个地方重点关注CQI调整量的维护,如果ENB收到一个ACK,会累加0.1/9阶,如果ENB收到一个NACK,会减少1/9阶。一般多分析几个连续TTI就能够看出CQI调整的趋势是否正确。这个地方需要注意的是,如果反馈的是DTX,ENB并不会根据DTX来进行MCS调整。收到DTX,ENB侧走重传流程,但并不会进行MCS的调整。2)ACK/NACK反馈通道的问题下行数据的ACK/NACK需要通过上行链路进行反馈。因此上行链路的可靠性影响ENB统计到的ACK/NACK数量。ACK/NACK的反馈有2个通道,PUCCH和PUSCH,也就是常说的控制信道方式和随路方式。上行反馈通道的可靠度分析:ACK/NACK在不同反馈通道上报的数量和结果,可以在L1基带进行统计。在每种反馈通道上,NACK统计到的比例应该收敛到目标值10%。通过分析每种信道上ACK/NACK的比例,确定是否某种特定信道或者格式的ACK/NACK反馈存在问题,细化问题场景。具体方法参考13.1章节的L1TTI数据分析。如果某个特殊反馈格式的NACK比例不收敛,需要分析相应信道的可靠度。案例:X局点,统计分析发现,高SINR低MCS异常点,控制信道上反馈的NACK比例较高日本X局点,通过分析上行L1的NACK比例分布,发现控制信道上上报的NACK误码率远远高于10%,进一步分析UE侧Log,发现ENB解调到NACK时,UE侧实际反馈的是ACK,因此锁定PUCCH的发射功率异常。进一步分析PUCCH功控行为,发现PUCCH功率抬升过大,导致对邻区PUCCH干扰增大。通过规避方法,降低PUCCH信道发射功率过高造成的PUCCH信道间干扰。从而改善了上行ACK/NACK反馈的可靠度。3)导频信道和数据信道的差异也容易造成SINR高但MCS低的问题。UE测量的是导频SINR,但是实际数据发送的RE位置和导频RE位置是不一致的。导频RE的SINR不能完全反映数据RE解调的SINR。一般,网络越重载,干扰分布越均衡,导频SINR和数据解调SINR一致性越好。一般此种情况在定点测试容易出现,表现为高SINR低MCS。这种情况下,需要通过RF优化去调整覆盖和干扰。分析定位UE侧数据信道RE受到的干扰,可以通过TestUE接入后空载(只接入,不做业务),进行采数分析。TestUE接入后空采FPGA数据,可以将每个子载波(频域)和符号(时域)上的信号干扰情况分析出来。案例:X局点,某些路测段,高SINR低MCS非常明显,定点稳定复现加拿大某局点,出现高SINR低MCS,分析干扰,数据信道上有强烈的异站干扰,而导频上几乎没有干扰。在网络初期,由于邻区主要是导频干扰,容易造成导频和数据信道干扰水平不一致。通过干扰特征分析,本小区导频SINR很高,实际数据解调能力很差,导致MCS降阶。上行空口编码效率分析上行采用RSRP(orPathloss)VsMCS的方式评估空口编码效率。由于上行路测中,很难获得基站侧测试的SINR,通过主极的RSRP或路损Pathloss去做横坐标。同时,上行由于功率有限,因此,上行的功控行为,对RSRPVsMCS曲线性能影响很大。根据功率计算公式,不同的和RB组合,得到的吞吐量性能差异大。一般情况下,开环功控在中远点的MCS会高于闭环,但是开环MCS(由P0+f(i)决定)偏高,导致RB分配个数在中远点受限,反而吞吐量不如闭环。因此,一般路测中使用演进型闭环功控。这里,我们只讨论闭环单用户的路测,假定RB的分配符合下图,也就是说在近中远点(RSRP>-120dbm)仍然保持最大RB利用率(最大RB利用率=小区带宽-PUCCH-PRACH,同时符合235原则),UE发射功率达到最大。图:演进型闭环功控下,2次路测结果的上行RSRP和RB/发射功率的趋势图在上述RB和UE发射功率分布下,我们定义上行的异常点为:低RSRP(或Pathloss)低MCS的点。图:演进型闭环功控下,2次路测结果的MCSVsRSRP图统计异常点的用户:RB数目、发射功率或者UE的PHR上报、MCS,如下表所示,分析思路如下:结合上面的流程,分析低RSRP低MCS情况,简述如下:1)如果在远点MCS低,但是UE功率没有达到最大,需要分析功控行为导致的MCS偏低。通过抓取小区跟踪(或UE侧TTI数据)来分析功控调整行为,比如UE漏检PDCCH,导致TPC命令收不到,上行测量异常等。2)上行干扰导致的MCS偏低这里的干扰可以是系统内干扰或者系统外干扰。一般情况下,出现某个特定小区普遍存在低PL低MCS的现象,小区干扰是重点排查的对象(干扰可以结合话统、频谱扫描等手段,参考射频通用指南)。案例:Canada局点,低PL时无法达到峰值。近点当上行SINR测量值高于上门限(xxdb?),如果受到干扰,根据NACK会进行SINR调整,MCS出现降阶。但是由于SINR测量值已经高于上门限,因此功控不会去发送TPC命令字让UE抬升功率。这样出现干扰场景下,低PL下无法达到峰值。3)上下行路损不平衡导致的MCS偏低UE是依靠下行路损来估算上行路损,以及进行发射功率计算的,实际上,当上下行传输径不一致时,上下行路损存在差异。案例:Canada局点,上下行路损不平衡,出现低PL低MCS的异常点通过分析发现,同一个地点,保证RSRP测量不变,改变天线朝向,吞吐量有较大的差异。经过分析,下行路损比上行路损小,依据下行路损来计算UE的MCS偏低。这种情况主要表现为,小区没有受到干扰,但是仍然出现低PL低MCS。4)UE漏检PDCCH导致MCS降阶,需要终端配合分析由于C板是不支持上行DTX的检测,因此上行PUSCH只有2种状态,ACK和NACK。如果UE漏检了PDCCH,UE自然不会在ULGrant授权的PUSCH上发送数据,这样当L2通过管理帧指示L1去解调数据时,没有收到UE的数据,检测为NACK。PDCCH漏检,主要还是要解决PDCCH链路可靠度以及UE侧PDCCH解调性能的问题,参考节分析。详细的PDCCH漏检原因,需要终端侧Log一起分析。5)上行PUSCH解调结果ACK/NACK反馈通道PHICH异常导致的上行低PL低MCS。由于上行PUSCH的数据解调结果ACK/NACK是通过下行信道PHICH来反馈的。目前还没有发现此类问题。维度三:资源利用率分析ENB每次调度的数据量由(MCS,RB)的组合确定。资源利用率决定可以达到的吞吐量。资源利用率从两个方面考虑,PDCCH调度次数和每次调度RB数目。一般情况下,路测数据是通过Prob导出。TestUE,RB数目是1s的累加值,商用终端是1s中的抽样值。 TestUE的平均RB=PDCCH调度次数*每次PDCCH调度RB数/1000ms;高通芯片1s的抽样值也能一定程度上反映每次调度的RB数。为了将“每次调度RB数目”和“PDCCH调度次数”进行解耦,我们一般分析两个维度:PDCCH调度次数和RB数。图:E392路测的RB利用率(5M=25RB)的CDF图下行PDCCH调度授权不足图:E392两次路测的PDCCH调度次数统计如果是调度次数不足,会影响到统计时间段内的PRB资源利用率:下行调度授权是通过PDCCH进行授权的。因此,如果出现下行调度次数不足,首先可以去看看ENB侧的调度授权和UE侧收到的调度授权个数是否一致。1)如果是ENB侧调度授权不足,首先要排查是不是多个用户的影响。同时需要排查1.2.1章节的特定场景排查。其他情况,一般都是流程问题或产品问题,比如HARQ进程处理错误(HARQ进程号的基本知识参考1.3.4章节),需要抓取小区跟踪进行TTI级别的分析。案例:X局点,下行HARQ进程挂死,导致调度次数不足。通过分析小区下行调度,发现HARQ=7的进程号一直没有调度,经过分析为HARQ进程异常挂死,导致调度次数为7/8*1000=875次。案例:T局点,UE进入下行GAP异频测量,导致调度次数不足。通过分析ENB侧调度,发现进入40ms内,10ms无法进行下行调度,和GAP配置一致。2)如果是ENB侧调度授权充足,而UE侧收到调度授权较少。由于下行是自适应重传,因此判定为UE漏检PDCCH。如果是UE漏检PDCCH,需要查看出问题状态时,PDCCH链路的可靠度。PDCCH链路的可靠性从两个方面衡量,PDCCH符号数和CCE聚合级别。PDCCH符号数越大,CCE聚合级别越高,PDCCH链路的可靠度越高。PDCCH链路受到的干扰来自邻区,特别是同站邻区的导频必定会干扰到本小区的PDCCH符号。PDCCH符号受到的干扰可以通过UE接入后空载采数的方法来分析PDCCH符号受到的干扰,参考章节的案例。改善PDCCH链路可靠性,可以通过优化PDCCH参数来提高PDCCH的抗干扰性能:固定CFI=3,打开PDCCH外环调整算法。案例:X局点,同站干扰导致的PDCCH漏检,调度次数不足1000。通过对比ENBTTI调度信息和UE侧QXDMLog,发现测试点,ENB下发PDCCH后,UE没有收到。进一步对UE接入后空载采数发现,同站邻区干扰严重,导致PDCCH漏检,需要优化网络覆盖。3)如果是ENB侧调度授权充足,而UE侧会丢弃收到的PDCCH授权。这种情况是由于上行链路异常,导致UE上行链路上反馈的PDSCH的ACK被错检成DTX/NACK。如果错检成NACK,会伴随高SINR低MCS的空口编码异常,参考节的分析思路。如果错检成DTX,DTX是不会导致导致MCS降阶的,但是会导致PDSCH数据包的重传。由于UE已经已经正确接受了该MAC数据,从高通芯片来看,UE将接受到的PDCCH丢弃。此类问题,需要采集ENB和UE侧调度数据联合分析。对于上行反馈链路的异常,还是可以参考章节的分析方法。下行RB利用率不足如果PDCCH调度授权不足,优先根据章节的方法,排查PDCCH调度授权不足的原因。我们这里讨论的RB利用率不足,主要考虑在PDCCH调度授权充足的情况下,每次调度的PRB数量不足。下行RB利用率理论上只和RLC缓存数据量有关,同时排除掉:系统消息、同步信道功率偏置过大等影响RB分配和利用率的因素。其他情况分析如下:1)重点排查1.2.1章节的特定场景。这些场景都可能导致RLC缓存数据量不足。2)排除PDCCH调度次数不足导致的RB利用率不足,参考章节的分析方法。3)其他情况,基本上都是产品问题导致的RB资源分配Bitmap异常,需要抓取小区下行调度详细跟踪分析。(一般要注意0号子帧和5号子帧等特殊子帧,这些子帧上有同步和广播消息,可能会存在处理错误)案例:A国X局点,资源分配流程异常,导致RBBitmap最后一个RBG无法分配。通过小区跟踪发现,在特定子帧上出现RB分配不满,正好是最后一个RBG无法分配。上行PDCCH上ULGrant授权不足首先要理解统计到的ULGrant的含义。由于上行默认采用非自适应重传,只有在用户重传冲突(碰上PRACH等)的情况下,ENB才会对于重传数据下发新的ULGrant。因此,在统计UE侧的上行调度授权次数的时候,需要考虑两部分:1)UE明确收到的ULGrant次数,这部分包括新传加上自适应重传的ULGrant次数;2)UE通过非自适应重传发送数据的机会,也就是非自适应重传的ULGrant次数(ENB不会显式下发ULGrant)。UE非自适应重传ULGrant次数可以近似用“误码率*初传调度次数”来衡量。这个地方的误码率应该包括多次重传,可直接统计UE重传的次数(需要看UE侧是否支持上报,TestUE支持)。如果无法获取准确重传次数信息,可以近似认为非自适应重传的次数=“IBER的目标值*初传次数”。如果是单用户,那么如果UE显式收到的ULGrant次数为910次左右,那么加上重传10%的误码,那么重的调度次数在910+91=1000次左右。根据ENB统计和UE侧统计到的ULGrant次数,进一步分析:1)如果是ENB侧调度授权不足(UE侧和ENB侧统计一致,且包含了重传),首先要排查是不是多个用户的影响。同时需要排查1.2.1章节的特定场景排查。调度授权触发条件包括:SR、预调度和BSR状态。如果用户有SR上报、预调度周期到、或者BSR状态不为空,都会触发一次调度。SR和预调度都是周期性事件(除非预调度周期为1ms),如果是满调度,必须依靠UE上报BSR。如果调度授权不足,需要采集小区上行调度。我们看一下小区跟踪的BSR状态维护情况。如果是由于BSR为空导致的PDCCH调度不足,需要从UE上报BSR(缓存区状态)以及ENB维护BSR,进行进一步分析。其他情况,可能是产品处理异常。图:L2小区上行TTI跟踪信息2)ENB侧调度授权充足,UE侧漏检PDCCH,导致PDCCH调度次数不足。此时,必然伴随着ENB侧大量的上行数据CRC错。漏检一次初传PDCCH,会导致一次初传后面的4次重传都会出现CRC错(上行一般是非自适应重传),这个特征可以从IFTS或者小区跟踪中明显看到,导致MCS降阶。因此,UE侧漏检PDCCH会伴随着“上行空口编码效率的降低”。如果是UE漏检PDCCH,需要查看出问题状态时,PDCCH链路的可靠度。PDCCH链路的可靠性从两个方面衡量,PDCCH符号数和CCE聚合级别。PDCCH符号数越大,CCE聚合级别越高,PDCCH链路的可靠度越高。PDCCH符号受到的干扰可以通过UE接入后空载采数的方法来分析PDCCH符号受到的干扰,参考章节的案例。改善PDCCH链路可靠性,可以通过优化PDCCH参数来提高PDCCH的抗干扰性能:固定CFI=3,打开PDCCH外环调整算法。上行RB利用率不足图:演进型闭环功控下,2次路测结果的上行RSRP和RB利用率的趋势图上行的RB利用率和功控行为强行关,Power=P0+aPL+10lgM+f(i)。从公式中可以看出,UE优先的发射功率必须在上行功率谱密度(P0+f(i))和RB个数M之间取得均衡。这里我们仅讨论单用户的RB利用率,单用户仅在远点会缩RB。我们定义该点为RB收缩门限(远点SINR=-1左右搜索如图,5M带宽,远点RSRP=-120左右),而在此门限之前,也就是说UE不是在极远点,ENB会尽量分配多的RB数,保证单用户移动吞吐量曲线的最优。RB分配过程中,功控模块、调度模块都会限制RB数目。实际调度RB数,是两者的最小值。功控模块根据上行测量SINR来收缩RB数,调度模块根据BSR限制RB数。1)首先需要排查上行SINR信号,看功控分配的RB数。采集小区上行调度,观察调整后的SINR,如果SINR低于下门限,根据调整后的SINR会收缩RB数。2)其次根据BSR信息看上行RB分配。调度模块根据数据量和频谱效率来分配RB数目。采集小区上行调度,分析用户BSR状态。如果是由于BSR太小导致的RB数目分配过小,需要从UE上报BSR(缓存区状态)以及ENB维护BSR,进行进一步分析。一般BSR太小,都是因为UE缓存数据不足导致。调度信息的TTI级别分析PDSCH解调结果ACK/NACK的上行反馈通道的可靠度分析PDSCH解调结果ACK/NACK的反馈通道分为2种,PUCCH和PUSCH(又称为UCI格式)。当下行调度的时刻没有上行调度时,PDSCH的数据解调结果通过PUCCH反馈;当下行调度时刻同时有上行调度时,PDSCH的数据解调结果通过PUSCH反馈,也就是UCI格式。按照如下规则统计PUCCH和PUSCH上每种格式的NACK比例,汇总成下图供分析(下图为示例)。如果是单码字,L1反馈的格式为F1A/F2A。如果是双码字,L1反馈的格式为F1B/F2B。下图依次为控制信道和随路UCI上的ACK/NACK反馈数据。(图中只截取了F1A作为说明,F1B/F2B未有截图,咨询一下对应版本的基带维测,以当前版本维测信息为准)控制信道上,码字分开统计,比如ACK_INF00表示单码字的ACK反馈,0表示NACK,1表示ACK,2表示DTX。随路UCI的ACK反馈,ACK_Data表示成二进制4个bit,前2个bit表示码字0,后2个bit表示码字1。00表示NACK/01表示ACK/10表示DTX。图:PUCCH上反馈的单码字ACK/NACK情况图:PUSCH上反馈的单码字ACK/NACK情况L1上行和L2上下行调度的时序关系1)L1UP和L2下行PDSCH反馈ACK/NACK的时序关系。L2下行调度通过PDCCH告诉UE,同时L2也需要通过管理帧指示L1基带在4个TTI后去解调PDSCH数据UE解调后的ACK/NACK反馈。当然,如同1.3.1所示,反馈通道可以是PUSCH,也可以是PUCCH,取决于同一时刻上行调度的情况。假定L2下行TTI调度时刻是TTI0,那么L1基带去解调此次PDSCH的上行ACK/NACK需要在4TTI之后(TTI0+4)收到反馈。分析L1UP和L2的时序关系,主要是分析ENB内部管理帧行为没有错误。同时,通过L1的信号质量,包括信号测量RSRP和底噪Np,可以判断出此次上行反馈链路的可靠度。2)L1UP和L2上行PUSCH的时序关系由于L2是通过管理帧通知L1解调上行数据。我们假定L2的调度是TTI0,那么在L1相差4个TTI(TTI0+4)就可以对UE发送的PUSCH数据进行解调(有CRC结果)。分析L1UP和L2上行的时序关系,主要是分析ENB内部管理帧行为没有错误。同时,通过L1的信号质量,包括信号测量RSRP和底噪Np,可以判断出此次上行链路的可靠度(如果能量水平接近低噪,可能是UE没有发数)。注:从这个地方也可以看出,L2上下行调度时序是对齐的。如果在TTI0有上行调度和下行调度,那么TTI0+4,L1上行会在随路上同时解调PDSCH的ACK/NACK反馈,同时也要解调PUSCH数据。由于PUSCH和随路ACK/NACK是不同的编码方式,是独立解调的;如果在TTI0只有下行调度,那么TTI0+4上,L1上行会在控制信道PUCCH上解调PDSCH的ACK反馈。L2下行调度主要信息L2下行调度信息主要是去看:CQI上报、MCS选择、RB数目、HARQ进程号、CFI信息等主要信息。1)CQI到MCS的映射是否匹配,主要是看CQIOri和TB_Mcs之间是不是有较大的差距。这里的CQIOri是UE上报的原始4bit(0~15),因此映射到MCS=2*CQI-4(经验公式),如果映射后的MCS很低,我们就需要统计NACK的数量,为什么会有较大的负向调整量(等效来说,为什么有很多NACK)。2)对于NACK的分布分析:需要去看HARQ进程ACK/NACK结果,是不是集中在某些特殊子帧、特殊的HARQ进程号、比如特定码字双码字或者单码有大量CRC、特殊的RB和MCS的组合等,找到了这些错误规律,实际上找到了问题代码走读的方向。L2看到的ACK/NACK分布可以结合1.3.1的L1上行链路的可靠性结合起来分析。LTE有8个HARQ进程(HARQ进程号0~7)。当前调度中HARQ进程号反应的是“上次ACK”情况。具体来说,需要根据HARQ进程号去找上次调度的数据(如上图中,红色行的HARQ进程号=5,上次的ACK反馈为NACK。那么我们就需要找统一HARQ进程号的上次调度的数据。向上找同一HARQ进程号,且TTI间隔大于8的调度信息,结果为蓝色所示。也就是说,蓝色行的数据解调结果为NACK。3)资源分配RB数目。L2当前可以允许发送的数据量为MaxDataPermit(重传为0),实际发送的数据量为TBS大小。分配RB数目=缓存数据量(RLC缓存MAC看不到)/MCS对应的频谱效率。如果是缓存数据量不足导致的RB分配较少,从TT数据去看有一定的规律可供参考:调度的子帧号不连续,一般表现为一段时间有连续调度,一段时间没有调度;连续调度TTI时间,最后一个TTI可能RB分配不足。如下,数据量不足,(935,5/6/7)子帧连续调度,直到(936,3)才开始下一次调度。最后一次调度RB数目可能分不满。4)PDCCH链路的可靠度参考上图,还可以看到CFI和PDCCH的聚合级别。分析PDCCH的链路可靠性,CFI值越大,PDCCH聚合级别越高,PDCCH链路可靠度越大。结合HARQ去分析PDCCH链路可靠性。首先统计DTX概率,如果DTX的概率大于0.5%,我们认为PDCCH链路的可靠性差,需要分析PDCCH链路的情况。CFI越小,PDCCH聚合级别越低,对应的HARQ状态为DTX数量很多,我们就可以认为PDCCH链路可靠性太低。通过固定PDCCH的CFI符号数和打开PDCCH外环调整来提高PDCCH链路性能。上行调度的主要信息L2上行调度信息主要是去看:调度用户类型、SINR测量、MCS选择、RB数目、HARQ进程号、CFI信息等主要信息。1)上行SINR调整,以及MCS映射过程。MCS选择是根据测量到的SINR和SINR调整量两部分决定SinrFinal。如果是测量到的SINR很低(包括DmrsSinr和SrsSinr),需要根据上行L1UP去看测量的信号质量(含测量RSRP和噪声干扰水平Np)。如果SINR调整量很大,需要分析SinrAdj的分布规律。2)通过用户调度类型,分析PUSCH数据错CRC分布规律。因为上行采用非自适应重传,因此从L2来看,当前的用户调度类型如果是HARQ类型用户,那么向前8TTI就是该用户的上次传输,而且上次传输的PUSCH是CRC错误的。图:不支持自适应HARQ的GCT终端的连续PUSCH数据解调错误常见的SINR调整量很大负值,或者说有大量CRC错误,最好是结合L1UP的数据一起分析。集中在如下场景:商用终端SRS子帧及前后子帧高概率出现CRC错,和商用终端的功率转换处理有关;当CQI或者ACK/NACK碰上PUSCH数据(此时码率会抬升),高概率出现CRC错,和商用终端数据发送能力有关;RB起始位置有规律,可能是上行受到了窄带干扰;和用户类型有关,可能是终端或者ENB的处理上有问题,比如终端不支持自适应HARQ调度,导致重传全错。案例:Yota局点,打开上行Comp之后,上行有大量CRC错。通过TTI数据分析,发现90%以上的CRC错都集中在一个TTI,而且初传错重传必然错。这种CRC错集中在一个TTI的,极有可能是管理帧处理或者规格上的错误,后分析发现,是基带超规格丢弃数据。其它核查项参考《LTE业务速率定位和优化通用指南》,进行问题的初步排查,这里只简单列举:1、进行故障、告警和操作日志的分析和排查2、参数核查,按照“参数核查通用指南”进行参数核查3、查看版本RN进行已知调度和功控问题分析4、排查传输限制话统类业务速率问题分析商用网络数据分析的一般套路话统类业务速率问题,是通过ENB的话统信息来分析网上用户的速率感知问题。对于商用网上业务速率性能问题,基本分析步骤如下:首先要确定计算公式定义的正确性,此处直接参考《LTE性能指标参考》;确定问题范围,是全网问题还是TOP小区/站点问题。筛选TOP小区/站点是必须的动作,一方面缩小问题范围,一方面获取待分析的目标小区。针对TOP小区/站点,可以比较一下TOP小区/站点和非TOP小区/站点的参数配置、传输等差异性;确定问题场景,根据问题场景,有针对性的提炼算法变更、版本变更以及KPI变化规律,通过理论分析缩小问题排查的范围;KPI关联分析,通过KPI关联分析,确定三个维度是否存在变化或者异常。三个维度从调度出发,梳理了业务速率相关的KPI指标;通过TOP小区的性能数据跟踪进行进一步的分析。性能数据更加深入到TTI级别的调度过程分析,通过梳理各模块的功能和性能流程,需找问题触发场景和影响;镜像复现分析。通过分析提炼业务速率的相关特征,更好的在镜像上进行问题复现,能复现就能定位。业务速率的三个话统指标业务速率目前只关注三个话统指标。第一关注的是网络发送的数据量,也就是吞吐量volume(单位bits)。第二关注的是小区频谱效率(或者定位为小区满RB速率)。分别定义为:下行满载吞吐率(Mbps)=L.Thrp.bits.DL*系统PRB数目/L.ChMeas.PRB.DL.Used.Avg/话统统计周期(s)/1000/1000;上行满载吞吐率(Mbps)=L.Thrp.bits.UL*系统PRB数目/L.ChMeas.PRB.UL.Used.Avg/话统统计周期(s)/1000/1000;第三关注的是用户感知速率(从空口角度去看用户的端到端速率),是小区级的用户速率,不是小区速率。分别定义为:下行用户速率(Mbps)=L.Thrp.bits.DL/L.Thrp.Time.DL/1000上行用户速率(Mbps)=L.Thrp.bits.UL/L.Thrp.Time.UL/1000。这里面可以关注一下L.Thrp.Time.DL的统计方式,我司3.0SPC460之前,Time_HW是我司的时长定义,Time_E是协议定义方式。3.0SPC460之后,我司遵循协议定义方式(我司实现和协议还略有区别,可以不用太关注)。从这里面可以看出,我司3.0SCP460定义的L.Thrp.Time大于协议定义方式。上行L.Thrp.Time.UL的统计方式,以DMAC收到ULSCH数据,组包到RLC->PDCP进行打点统计。因此,可以理解上行L.Thrp.Time.UL反映的完全是空口的调度时延,而不是PDCP统计的上行缓存时延(按照理解,上行缓存时延应该是BSR非空的时延)。话统数据具体分析首先需要根据话统定义,看看每个参与计算的Counter具体含义和统计方法,常见指标可以参考《LTE业务速率问题定位通用指南》。由于很多Counter在客户文档上描述比较粗轮廓,必要时需要找模块开发人员对统计方法进行确认。话统类业务速率问题分为两类:1)用户感知速率、小区频谱效率或业务吞吐量发生变化,包括上升或者下降。这里的发生变化,是指这些业务相关KPI指标,在网络升级或者其他网络参数或者特性调整后,产生变化,在时间上具有突变性或者缓慢变化性;2)用户级感知速率,或者小区级频谱效率低。这里的用户级感知速率或者小区级频谱效率低,指该网络的KPI指标一直处于较低的水平,需要通过分析进行优化,在时间上不具备突然变化性。对于业务速率的变化,一般还是从全网层面分析:覆盖、空口编码效率、资源利用率三个维度。通过全网层面的分析,找到业务变化的关键因素(覆盖、空口编码效率、资源利用率)。这些因素变化,可以通过TOP小区的TTI级别的小区跟踪,进一步深入分析。特定参数排查和信息收集如下这些场景会导致用户感知速率或者小区频谱效率低或者变化:1)传输参数配置不合理,包括传输带宽配置、传输MTU配置等。2)核心网的开户信息和套餐业务配置,需要分析套餐的资费情况和限速原理(一般限速在核心网实施);3)分成组网策略,特别是异频和异系统组网,组网策略对于每个载波的业务速率影响较大;维度一:覆盖和干扰水平分析下行覆盖和干扰评估下行覆盖采用UE上报的CQI进行评估。CQI是量化值,即使不同UE对CQI的测量和量化算法不一致,CQI还是能够反映网络覆盖的一个相对水平。上报平均CQI可以用如下公式计算:AVGCQI=sum(L.ChMeas.CQI.DL.N*N)/sum(L.ChMeas.CQI.DL.N)(N=0/1/2/3…/15)图:城区覆盖(TNL2600)和广覆盖网络(TNL900)的CQI分布PDF图如果CQI上报比较低,说明网络覆盖较差或者干扰较大。由于LTE的干扰来自邻区,因此邻区的干扰可以通过测量到邻区的导频RSRP来定性判断。对于TOP站点CQI上报比较低,可以通过MRSig日志分析,是本小区服务电平太低(弱覆盖),还是邻区强干扰。图:MR测量结果,分析TOP小区的用户覆盖和干扰情况MR是UE测量上报服务小区的RSRP和强干扰邻区的RSRP。通过周期性选择小区中用户配置最强邻区RSRP上报,获取小区中用户的信道质量分布。上图的解读如下:1)如果本小区上报的RSRP分布较差,也就是上图中的弱覆盖小区,需要通过调整本小区的覆盖范围来增强覆盖。2)如果是本小区上报的RSRP分布较好,而邻区的RSRP也很好,就是上图中的强干扰小区,需要优化本小区和邻区的覆盖来改善信号质量。3)如果本小区上报的RSRP分布较差,而邻区的RSRP也较差,应该是部分用户处于边缘切换区,需要增强用户覆盖;通过MR分析,不仅可以区分用户分布规律,对于强干扰小区,还可以通过MR指导强干扰小区的PCI信息,为进一步的RF调整提供方向。下行的覆盖评估还涉及RANK上报,当前版本ENB不处理RANK,采用UE上报的RANK进行调度。一般情况下,RANK2的比例越高,覆盖水平越好。RANK对吞吐量的贡献,可以通过分析RANK1和RANK2调度的PRB比例来统计,话统指标为L.ChMeas.MIMO.PRB.CL(或OL).RankX。这里的RANK是实际调度的RANK比例,而不是上报的RANK比例。因此,这里的RANK比例更加准确的反映了当前空口实际下发数据的用户RANK比例分布情况。总结:下行覆盖和干扰主要是通过,CQI分布、RANK调度比例和MR上报来获取。覆盖优化的方法,主要还是通过RF调整来优化。通过空口的信号分析,可以挑选出待优化的TOP小区,给RF优化调整的TOP小区。通过优化TOP小区来优化网络指标。上行覆盖和干扰评估上行覆盖通过MR来评估本小区RSRP的分布,参考章节MR的原理。RSRP反映了本小区的导频覆盖情况,根据导频覆盖情况,我们就可以估算出路损的分布(路损=服务小区RSRP-导频功率配置)。图:MR测量结果,分析TOP小区的用户覆盖和干扰情况上行干扰通过话统指标L.UL.Interference.Avg和Max来分析干扰的平均值和最大值。由于采样统计的原则,指标的对非持续干扰以及窄带干扰的评估能力还有待改进。通过MR和干扰话统,已经能较好的评估上行覆盖。上行覆盖和干扰综合衡量体现,从ENB侧来看,最终的载体是上行调度MCS。上行MCS的选择是根据上行测量SINR来选择的,但是由于SINR没有话统统计,我们可以用调度MCS来衡量上行的信干比。图:城区覆盖(TNL2600)和广覆盖网络(TNL900)的调度MCS分布PDF图注:MCS中,29/30/31是重传(29还包括CQIOnly调度),商用终端,由于UE能力的限制,不支持上行64QAM调度方式,因此最高MCS=24。如果低阶MCS较多,需要借助于MR分析覆盖,借助话统分析干扰,确定问题的根本原因。如果是覆盖RSRP较差,需要通过下倾角和优化小区覆盖范围进行优化;如果是干扰较大,可以通过关闭预调度,小区RF调整来优化。结论:上行覆盖和干扰主要是通过MR上报本小区的RSRP,调度MCS分布和干扰话统来获取。覆盖优化的方法,主要还是通过RF调整来优化。通过空口的信号分析,可以挑选出待优化的TOP小区,给RF优化调整的TOP小区。通过优化TOP小区来优化网络指标。维度二:空口编码效率分析下行空口编码效率1)下行空口编码效率通过CQI到MCS的映射来反映,表征在当前信道质量下ENB侧调制编码方式的选择。一般的经验公式中,MCS=2CQI(4bitCQI)-4。图:城区覆盖(TNL2600)和广覆盖网络(TNL900)的CQI上报和调度MCS分布PDF图下行MCS统计中,不包含公共信令的调度统计次数(paging,系统消息等),但包含TA命令字、信令SRB的低阶调度MCS统计。在MCS的分布图中,可以看到MCS=0和MCS=1的比例较高。在不影响平均MCS统计的情况下,我们可以把MCS=0和MCS=1的调度次数去掉,估算出真实信道下的数据调度MCS值。除了上述的MCS分布PDF图形,一般还考虑平均MCS,采用如下公式计算:AVGMCS=sum(L.ChMeas.PDSCH.MCS.N*N)/sum(L.ChMeas.PDSCH.MCS.N)(N=0/1/2…/28)2)编码效率的另外一个衡量因素是:误码率。误码率可以通过几个维度去统计。第一种方式是,通过话统中,第一次重传的TBS块个数除以初传的TBS块个数,而残留误码率通过多次重传的TBS个数除以初传的TBS个数。公式如下(以QPSK为例):IBLER=(L.Traffic.DL.SCH.QPSK.ErrTB.Ibler)/(L.Traffic.DL.SCH.QPSK.TB);RBLER=(L.Traffic.DL.SCH.QPSK.ErrTB.Rbler)/(L.Traffic.DL.SCH.QPSK.TB);第二种统计反映误码率的方式是,通过调度的MCS=29/30/31的重传次数和比例来反映。一般都采用第一种统计方式。注:误码率的上升不一定伴随着编码效率的降低,但是可以认为误码率的变化会带来MCS的变化,作为网络变化的一个点来分析。误码率上升,伴随着重传次数的增加,有效初传次数的较少;同时,误码率的上升,使得MCS选择更激进。是重传降低了频谱效率,还是重传合并增益提升了频谱效率,不可一概而终。从现网数据来看,QPSK的误码率低于10%,因为下行调度对于切换、信令以及上行同步命令字TA,进行了保守处理,导致QPSK的初传误码率低。64QAM的误码率略大于10%,是因为64QAM的采样点较少(可以认为网络中高阶调制的UE比例较小),往往通过HARQ合并能够1-2次重传解对,CQI调整算法调整的机会减少,误码率不能很好的收敛到目标值。图:IBLER和RBLER分布(左轴是RBLER,右轴是IBLER)下行空口编码效率分析,就是分析MCS和误码率的变化,分析MCS变化的趋势,并根据小区TTI级别跟踪来深入分析MCS变化的合理性。案例:Yota升级3.0后,MCS=6的比例升高,导致下行数据分包通过分析MCS的变化趋势,发现MCS=6的比例在升级3.0后升高,抓取TTI级别数据待发数据量66bytes,从CQI模块获取的Itbs=6,结果进入预留模式,预留RB数为1,TBS(6,1)对应的TBSIZE明显高于其附近的值,其对应码率已超过1。提案中规定其用于上行,如果用于下行调度,会导致如果使用6阶TBS索引查表给用户分配1个RB后,由于会超码率导致TBS索引降至5阶(MCS=6),从而导致包分片增加。上行空口编码效率1)上行测量的SINR没有办法输出,因此上行编码效率通过MR分布和MCS分布来分析。上行平均MCS的计算公式和下行一致,不统计重传的MCS=29/30/31。参考,如果通过MR数据获得的RSRP分布很好,而MCS很低,需要通过干扰话统来分析本小区的干扰变化情况。图:城区覆盖(TNL2600)和广覆盖网络(TNL900)的调度MCS分布PDF图2)上行编码效率的另外一个衡量因素是:误码率。实际商用网中,误码率收敛水平并不是目标值。由于对于SR调度,收敛的目标值为1%,而实际商用网络中,大部分用户的上行调度都是SR调度。因此,会导致初传误码率收敛水平低于目标值。误码率可以通过几个维度去统计。第一种方式是,通过话统中,第一次重传的TBS块个数除以初传的TBS块个数,而残留误码率通过多次重传的TBS个数除以初传的TBS个数。上行误码率的计算公式可参考下行的格式。第二种统计反映误码率的方式是,通过调度的MCS=29(注意29还包括CQI_Only调度)/30/31的重传次数和比例来反映。一般都采用第一种统计方式。QPSK的用户收敛水平较为接近目标值。因为QPSK用户为远点用户,远点用户TBS较小,数据分包的可能性增大,调度的机会增多,只要SR一次无法传完所有的缓存数据,后续的Happy用户调度就会较好的收敛到目标值。16QAM如果用于SR调度,TBS较大,能够一次传完SR请求数据量的机会大,因此收敛水平远低于10%。上行空口编码效率分析,就是分析MCS和误码率的变化,分析MCS变化的趋势,并根据小区TTI级别跟踪来深入分析MCS变化的合理性。案例:Yota打开ULComp后,低阶MCS增加,重传MCS抬升分析话统,MCS0的比例有较大的提升(08/01和08/02是打开ULCMP的数据),重传MCS增加,平均MCS降低。进一步抓取TTI数据分析,发现ULComp打开后,上行超规格丢弃上行数据,导致CRC大量错。维度三:资源利用率分析这里面的空口资源指PRB资源利用率和PDCCH符号的利用率。前者是数据信道PDSCH和PUSCH占用的PRB资源,后者是控制信道上调度授权所占用的资源。上下行PRB资源利用率PRB利用率在话统指标中可以直接获取(L.ChMeas.PRB.DL.Used.Avg、L.ChMeas.PRB.UL.Used.Avg、L.ChMeas.PRB.PUCCH.Avg)。上行数据占用PRB资源,需要用总的PRB个数L.ChMeas.PRB.UL.Used.Avg减去PUCCH占用的PRB个数L.ChMeas.PRB.PUCCH.Avg(实际中还应该减去PRACH占用的RB数目,PRACH占用RB数目而已用PRACH周期进行计算,PRACH固定占用6RB),得到PUSCH数据占用的PRB数目。PRB利用率和数据量以及空口信道质量有关:PRB个数=数据量/MCS对应的频谱效率。MCS越低,传输相同数据量需要的PRB数越多。数据量越大,相同MCS,需要的PRB越多。PRB利用率和PDCCH利用率(参考下章节)有关。由于PDCCH是盲检测,当PDCCH利用率过高,不同用户分配PDCCH的位置存在冲突的概率增大,导致调度PDCCH授权无法下发。PDCCH无法下发,自然就不能给用户分配PDSCH/PUSCH资源,造成PRB利用率低。在实际商用网络中,判断PDCCH是否可能存在瓶颈,一是根据PDCCH资源的利用率,另外一个方面可以根据有待发数据的用户数来判断L.Traffic.User.DLData(ULData).Avg,如果有数据待发的用户数越多,PDCCH受限的可能性越大(还没有经验门限,和小区带宽、用户分布有关,一般上下行同时调度>10个,PDCCH受限的可能性会增大)。对于PRB资源利用率,常见的问题场景如下:1)PRB资源利用率低,导致小区吞吐量低;一方面需要分析传输参数配置和用户套餐信息,是否限制了数据源;另外一方面需要采集小区跟踪,分析用户行为;2)PRB资源利用率高,导致小区拥塞;一方面需要分析用户数,是否小区用户数过多;另外一方面,需要分析空口的频谱效率,具体参考2.4章节。PDCCH资源利用率PDCCH利用率,需要关注PDCCH符号数(话统L.ChMeas.PDCCH.SymNum.N,N=1/2/3/4)对MCS的影响,统计PDCCH符号数的分布比例。一方面,PDCCH占用RE资源,影响调度的TBS的码率,码率影响UE侧的解调能力(码率越低,UE侧借条性能越好),UE侧的解调能力实际上就是空口的编码效率MCS。另外一个方面,PDCCH符号数越小,PDCCH信道的可靠度下降(容易受到干扰),ENB侧重传次数会增加,导致误码率的抬升,又损失了频谱效率。因此,PDCCH在编码效率和可靠度之间有平衡。PDCCH利用率,需要关注CCE利用率以及聚合级别(L.ChMeas.CCE.DLUsed和L.ChMeas.CCE.ULUsed)的选择。我们定义CCE利用率和平均聚合级别为:CCE利用率=(L.ChMeas.CCE.ULUsed+L.ChMeas.CCE.DLUsed+L.ChMeas.CCE.CommUsed)/小区带宽可用的CCE最大数目(比如20M带宽为84);DLAVGCCEAL=L.ChMeas.CCE.DLUsed/(L.Traffic.DL.SCH.QPSK.TB+L.Traffic.DL.SCH.16QAM.TB+L.Traffic.DL.SCH.64QAM.TB+L.Traffic.DL.SCH.QPSK.TB.Retrans+L.Traffic.DL.SCH.16QAM.TB.Retrans+L.Traffic.DL.SCH.64QAM.TB.Retrans);ULAVGCCEAL=L.ChMeas.CCE.ULUsed/(L.Traffic.UL.SCH.QPSK.TB+L.Traffic.UL.SCH.16QAM.TB+L.Traffic.UL.SCH.64QAM.TB);注:上行大部分采用非自适应重传,无需重新下发PDCCH,所以重传TB不占用PDCCH资源。在PDCCH外环调整关闭的情况下,PDCCH的聚合级别选择和当前用户的信道质量相关,也就是调整后的MCS相关。MCS越高,PDCCH聚合级别越低。闭环调整关闭的情况下,不关注PDCCH误码{=DTX/(DTX+NACK+ACK)}对聚合级别选择的影响。在PDCCH外环调整打开的情况下,初选的PDCCH聚合级别和当前用户的信道质量有关,也就是调整后的MCS,并根据当前PDCCH误码的情况,调整聚合级别选择门限偏置,保证聚合级别的选择收敛的目标值,保证PDCCH链路的可靠度。注:当前3.0版本还无法准确评估PDCCH的误码率,需求在6.0落地;对于PDCCH资源利用率,常见的问题场景如下:1)PDCCH资源利用率高,导致PDCCH资源分配阻塞,RB利用率低。需要从PDCCH符号数以及CCE利用率去分析。如果PDCCH符号数达到最大(>90%采样点采用最大符号数),同时CCE利用率超过50%,我们就认为PDCCH资源利用率高,控制信道受限。需要进一步分析用户分布以及覆盖,必要时进行扩容;2)PDCCH误码率抬升,PDCCH选择激进,导致频谱效率下降。当前没有办法准确评估PDCCH的误码率。下行调度授权PDCCH误码率可以通过重传的TB块个数来间接统计(6.0版本直接根据话统统计,待版本更新),如果重传误码率抬升L.Traffic.DL.SCH.QPSK/16QAM/64QAM.TB.Retrans,可能是PDCCH误码导致。上行调度授权PDCCH误码率,也会表现为重传的TB块比例上升,同时更明显的表现是残留误码L.Traffic.UL.SCH.QPSK/16QAM/64QAM.ErrTB.Rbler的抬升(上行采用非自适应HARQ,如果初传漏检,UE不知道TBS大小,必然会导致4次重传都不对)。解决方法:由于PDCCH链路可靠度低导致的PDCCH误码率抬升,可以通过外环调整进行优化;同时,也可以通过固定PDCCH符号数为最大,提升PDCCH链路的抗干扰能力。案例:YotaTOP小区PDCCH资源受限,导致RB利用率不满。15M小区,PRB最大可用为75,实际上行PRB利用率不满。PDCCH符号数扩张到最大3,CCE利用率>50%。按三个维度进行问题的细化分析目前商用网话统业务速率问题综合表现为3类问题:小区吞吐量总量异常、小区频谱效率异常,和用户感知速率异常。小区吞吐量总量异常(偏低或者下降)吞吐量偏低,注重优化;吞吐量下降,注重分析变化。两者的分析步骤上略有区别,但是整体思路一致。分析吞吐量变化,在思路上可以聚焦于吞吐量变化前后的:传输变更、核心网变更、用户数变更、算法特性变更。重点介绍空口信道质量的变化对小区吞吐量的影响。由于吞吐量和业务行为强相关,空口较小的变化(MCS变化1-2阶),根据经验对吞吐量总量的影响有限,小区(cluster)吞吐量也能保持稳定。但是如果空口条件发生较大的恶化(MCS变化>=3阶),可能会影响高层的业务行为。比如空口丢包,导致TCP业务困难,TCP数据无法下载;比如MCS变低,导致拥塞小区变多,吞吐量总量下降。分析空口变化对吞吐量的影响,思路如下:优先排查传输及套餐等业务行为变更。可以咨询核心网(核心网对P2P业务、网页业务等有话统统计),分析业务行为的变化。当然,也可以从基站话统分析调度行为上的变化,比如TBS大小的变化、QOS调度行为的变化(AMBR限速等)、传输包长的变化,对高层数据包行为做一些合理的推测。对于VOIP业务的变化,可以参考QCI=1的承载变化,L.Traffic.DRB.QCI.1。空口PDCP的包长,近似用下面的公式估算:下行L.Thrp.bits.DL/sum(L.Traffic.DL.PktDelay.Num.QCI.X)上行L.Thrp.bits.UL/L.Traffic.UL.PktLoss.Tot.QCI.1。如果包长变小,可能是高层业务变化导致。进一步通过采集TTI信息,分析空口MAC调度的包长TBS大小的变化。其他步骤如下:1)需要根据2.2公式去计算小区的空口频谱效率(小区满载RB吞吐量)。2)如果小区的空口频谱效率较低,从覆盖和干扰水平分析,分析空口覆盖水平是否太差(或者有恶化),导致空口频谱效率下降(小区满载RB吞吐量低)。优先从话统分析,下行关注CQI和Rank分布变化,上行关注MCS和干扰水平。对于TOP小区可以采取MR数据进一步分析。如果是覆盖问题或者系统内干扰,需要通过RF进行优化,如果是系统外干扰,转射频通道专题处理;3)如果小区的空口频谱效率较低,从“空口编码效率”分析是否为特性变更或算法变更导致。分析空口编码效率偏低,表现为MCS偏低,或者表现为误码率较高,参考2.3.3章节。挑选TOP小区,抓取小区调度信息(L1UP/L2性能34/50)。分析TOP小区的跟踪,主要还是从CQI调整、上行反馈通道、UE侧干扰测量等进行排查,重点关注误码率产生的根本原因(参考“路测数据分析1.2.3”章节的分析方法)。分析过程中,需要结合特性以及调度行为进行分析,做出合理性的判断。3)如果小区的空口频谱效率较高(或者没有变化),而小区吞吐量偏低,此时关联分析维度“资源利用率分析”,应该表现为PRB利用率低。PRB利用率低的原因可能是用户数增多(参考L.Traffic.User.Avg、L.Traffic.User.DLData.Avg、L.Traffic.User.ULData.Avg),导致PDCCH资源受限。需要分析PDCCH资源利用率是否拥塞(或者资源利用率升高,参考章节)。PRB利用率低的原因还可能是,业务行为变更导致。参考本章节前面的描述。案例:X局点看网,发现大量小区下行业务吞吐量低经过分析,大量小区忙时PRB已经用满,但是满载RB小区速率低。通过CQI和MCS分析,下行编码效率低。通过MR采数进一步分析,业务速率低的小区,UE上报有多个强邻区,且邻区RSRP和本小区RSRP接近,判断为干扰受限小区。需要进行RF优化。案例:Yota局点打开ULComp后,上行吞吐量总量下降了20%。该问题的出现和ENB采用打开新特性强相关。分析话统,打开ULComp后,上行MCS降低,低阶MCS次数增多,重传MCS次数增多,误码率上升。很明显,空口编码效率下降。通过采集小区CellDT,进行TTI分析后发现,打开ULComp后,上行管理帧出错。可见,空口的误码和时延会影响上行的业务行为。小区频谱效率异常(偏低或者下降)小区下行频谱效率低,是典型的空口覆盖和编码效率的问题。1)从覆盖和干扰水平分析,分析空口覆盖水平是否太差(或者有恶化),导致空口拥塞(小区满载RB吞吐量低)。优先从话统分析,下行关注CQI和Rank分布变化,上行关注MCS和干扰水平。对于TOP小区可以采取MR数据进一步分析。如果是覆盖问题或者系统内干扰,需要通过RF进行优化,如果是系统外干扰,转射频通道专题处理;2)如果空口编码效率偏低,分析空口编码效率偏低,表现为MCS偏低,或者表现为误码率较高,参考2.3.3章节。挑选TOP小区,抓取小区调度信息(L1UP/L2性能34/50)。分析TOP小区的跟踪,主要还是从CQI调整、上行反馈通道、UE侧干扰测量等进行排查,重点关注误码率产生的根本原因(参考“路测数据分析1.2.3”章节的分析方法)。分析过程中,需要结合特性以及调度行为进行分析,做出合理性的判断。小区级用户感知速率低用户感知速率的计算参考2.2节。用户感知速率低是比较常见网上问题,还表现为用户投诉。从定义分析,小区级用户感知速率低,不仅和小区空口速率有关,还和小区内用户数有关。用户的空口PDCP统计时长定义在3.0SPC460之前的版本,由于用户感知速率统计的是用户PDCP缓存内数据的等待时长(图中Time_HW定义方式),因此和如下因素有关:1)传输有关,传输包长越小,在PDCP分包发送的可能性增大,因此数据包在PDCP缓存时间越长,用户感知速率越小;2)用户套餐资费有关。主要是用户AMBR限制,会影响空口的调度速率(AMRB限制了空口每秒钟可调度的数据量)。导致数据缓存在PDCP,用户感知速率越小;3)和空口速率有关,空口调度越慢,数据缓存在PDCP的时间就越长,用户感知速率越小;4)和小区用户数强相关,小区业务数越多,统计到PDCP缓存时长越长,用户感知速率越小;5)和小区特性强相关:比如DRX特性,数据在休眠期只能缓存,DRX休眠期越长,统计到PDCP缓存时长

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论