一种新的移动通信网络路测数据的可靠性分析方法_第1页
一种新的移动通信网络路测数据的可靠性分析方法_第2页
一种新的移动通信网络路测数据的可靠性分析方法_第3页
一种新的移动通信网络路测数据的可靠性分析方法_第4页
一种新的移动通信网络路测数据的可靠性分析方法_第5页
已阅读5页,还剩19页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

一种新的移动通信网络路测数据的可靠性分析方法1一种新的移动通信网络路测数据的可靠性分析方法北摘要通过对电子地图、基站信息和无线传播特点的研究,提出了一种移动通信网络路测数据的可靠性分析方法。该方法首先提取对地理单元进行聚类分析的属性,然后采用数据挖掘中BIRCH算法和KMEANS算法对地理单元进行聚类分析。最后,引入抽样理论中的整群抽样和二阶段抽样,给出了分析路测数据可靠性的方法。关键词路测;数据挖掘;BIRCH算法;二阶段抽样;可靠性中图分类号TN911221引言移动通信网络性能评估的常用方法是路测1,2。其步骤如下首先确定测试路线,应覆盖基站的远、近区域,覆盖无线信号的直射区域和非直射区域等;然后在路测路线上按要求的采样速率3,4采集的数据进行分析。路测数据的分析是基于电子地图进行的,电子地图的精度由分辨率决定。以移动台的接收功率指标为例,在地理单元内将符合采样速率的样值进行平均,以平滑快衰落的影响3,4,对路线经过的全部地理单元的接收功率根据简单随机抽样3,4,5,得到移动台接收功率均值及方差等。对于简单随机抽样,比较适用于总体单元数比较少,或者总体的各个单元之间差异比较小的情况。但是,对于移动通信网络总体地理单元数量非常大(以北京市中心城区为例,在地图分辨率是20M20M时,大约有220万个地理单元),不适合采用简单随机抽样;更重要的是,移动通信系统的性能主要受到移动无线信道的制约,移动台接收信号电平变化很大,采用简单随机抽样获取的样本对总体均值进行估计会产生比较大的误差,本文采用将整群抽样与简单随机抽样相结合的二阶段抽样5来完成路测数据的可靠性分析。为了将覆盖区域划分成用于整群抽样的群,首先提取用于划分群的属性,根据该属性,采用BIRCH算法6,7进行聚类分析,完成总体单元的分层;然后分析路测数据样本,完成样本单元的分层;最后结合二阶段抽样(第一阶段整群抽样,第二阶段分层抽样)给出误差分析结果,从而给出了定量计算路测数据样本可靠性的方法。如图1所示。室外BIN的覆盖特征提取BIN覆盖特征分群(BIRCH算法)路测路线样本群分析二阶段抽样的抽样误差分析图1分析流程22地理单元属性提取移动通信网络性能评估是基于电子地图进行的。电子地图上的地理单元称为“BIN”,它的大小由电子地图的分辨率决定。整群抽样的前提就是对移动通信网络的覆盖区域进行群划分。本文采用数据挖掘技术中的BIRCH算法来完成覆盖区域的群划分,聚类分析的对象是电子地图上的地理单元BIN。移动通信系统的性能主要受到移动无线信道的制约8,9。发射机和接收机之间的传播路径非常复杂,不像有线信道那样固定并可预见,难以分析。在发射机发射功率、增益等一定的条件下,移动台的接收信号电平不仅和距离有关系,还受到无线传播路径上的物体(如建筑物、山峰、树木等)的影响,甚至还受到移动台移动速度的影响。正是因为这些原因,其接收信号电平变化很大。电子地图中的某一地理单元BIN的接收信号和为该BIN提供覆盖的基站天线发射功率、天线高度、移动台与基站之间的距离、小区的地形因素、移动台天线的高度、频率等有关。为了简便起见,仅考虑建筑物和距离这两类因素。根据无线传播理论,建筑物会影响无线信号的传播距离,在城区,建筑物比较密集,小区的覆盖半径往往较小,而在郊区,建筑物稀少,小区覆盖半径一般较大。所以,根据小区半径的差异可以大致确定小区内的建筑物的高度、分布等因素的差异,本文采用小区半径R和Q作为地理单元进行聚类分析的属性,Q的定义如下QDR1其中D为地理单元距离基站的距离,R为当前服务基站的覆盖半径。属性Q给出地理单元在小区内的相对位置。3BIRCH算法和聚类分析对于网络中所有的BIN,基站和移动台之间的距离属性可表示成如下统计数据矩阵12IMXXXXX2其中TIIIXQR代表电子地图上某一个地理单元BIN,M为某移动通信网络中所有室外BIN的总数。对X进行聚类分析,可以将具有相同的覆盖属性的BIN划分到同一群中去,得到聚类12,NKKK,其中N为聚类的个数。对于给定的移动通信网络,其覆盖的地理单元BIN的数量庞大,本文采用BIRCH算法进行聚类分析10,11,12。BIRCH算法引入聚类特征和聚类特征树(9CF树)两个概念,它们用于概括聚类描述,借助它们,BIRCH算法在处理大数据集方面得到大量应用。一个聚类特征(CF)是一个三元组,它给出对象子聚类信息的汇总描述,假设一个子聚类中包含M个对象IX,那这个子聚类的CF定义为,CFMLSSS3其中M个点的线性和1MIILSX,数据点的平方和21MIISSX。CF树存储了层次聚类的聚类特征,CF树有两个重要参数分支因子和阈值T。阈值T给出了存储在子树的叶子节点中的子聚类的最大直径(或半径)。这两个参数可以控制CF树的大小规模。BIRCH算法流程如图2所示。聚类特征树随着对象的加入而形成,每个对象3放入离它最近的那个叶结点(类)中,如果放入以后这个类的半径大于阈值T,那么这个叶结点就会被分割。图2BIRCH算法流程其中阶段二和阶段四是可选择的阶段。阶段三的整体聚类是为了得到一个包含数据集主要特性的聚类,可以采用KMEANS算法,本文在对移动通信网络中的室外地理单元进行分析过程中就是在阶段三和阶段四采用KMEANS算法。需要说明的是,移动通信网络的覆盖区域可以简单地划分为室内区域和室外区域。由于路测仅仅是在道路上进行数据抽样,所以路测只能对移动通信网络的室外区域部分进行性能评估。综上所述,移动通信网络中的地理单元采用BIRCH和KMEANS算法进行聚类分析,从而划分成不同的群。一个给定的路测数据样本,是对全部或者部分类型群地理单元的覆盖数据进行抽样。以北京市为例,将网络中的室外地理单元划分成12类,如表1。表1BIRCH分类结果类型QR(KM)类型QR(KM)10732270521020313380511730783590250640692910029225018141103296077061208314表1中的这12类的分类分别覆盖了基站半径不同和基站内相对位置不同的区域,半径的不同,体现了基站所处的位置,如郊区基站和密集城区基站,基站内相对位置的不同则体现了距离基站天线的远近,如天线的近场和远场等。4路测数据的可靠性分析为了研究路测抽样数据样本的可靠性,引入了二阶段抽样。假设总体由N个初级单元(群)组成,每个初级单元又由若干个次级(二级)单元组成。第一阶段抽样是从总体中抽取N级初级单元,第二阶段抽样是从每个被抽中的初级单元(群)中抽取部分次级(二级)单元6,7。/PAPEREDUCN4根据第2部分的分析,将这些地理单元划分成N群。这N群地理单元中分别包含的地理单元数1,2,IMIN是不同的。根据路测数据样本,可以确定路测数据样本所包含的地理单元群数NNN,以及不同群的地理单元中各自包含的具体地理单元数量1,2,IMIN,如图3所示。图3路测数据样本映射关系图在分析路测数据样本中,对于第一阶段和第二阶段抽样均采用简单随机抽样来近似,在构建总体均值的估计量时,采用了等概率抽样的加权估计方法,估计量的具体构成见式46,7。01111IMNNIIJIIJINMYYYMNM4其中,01NIIMM是地理单元总体的总数,0NMMN是各初级单元(群)中所包含的次级单元数的均值,IY是第I个初级单元(群)中次级单元的均值,IJY是第I类初级单元(群)中第J个次级单元的样值。二阶段抽样的样本均值为11111IMNNIIIIJIIJINNMMYYYNMMNM5该样本均值估计量是二阶段抽样总体均值的无偏估计量。IJY是第I类初级单元(群)中第J个次级单元的样值。估计量Y的方差为222212111111NNIIIIIIIINNFMMFVYYYSNNNNMMM6其中1FNN是第一阶段的抽样比例;2IIIFMM是第二阶段的抽样比例;22IS是各初级单元内不同次级单元间的方差。估计量方差的样本估计为2222122111111NNIIIIIIIINNFMMFVYYYSNNNMMM7/PAPEREDUCN522IS为各初级单元内不同次级单元间的方差。从以上分析中可以看到,均值的方差主要由两部分组成,第一部分是由第一阶段中仅抽取不同地理单元群间的方差组成,第二部分则是由不同群内的地理单元的方差的均值组成。根据中心极限定理,大样本时抽样分布近似服从正态分布。对于样本均值,近似服从正态分布,NYVY,对于任意给定常数101AA,样本均值的置信区间为2,YUVYA2YUVYA,其中2UA为标准正态分布的双侧A分位数,VY为样本估计量的标准差。根据式(7),在路测过程中,对不同群的地理单元所抽得的群数N比较小的时候,会在第一阶段抽样过程中引入比较大的方差。在相同置信度要求下,N越小,置信区间越大;N越大,第一阶段抽样引入的误差越小;当NN时,二阶段抽样就变成了分层抽样,第一阶段抽样引入的误差为0。另外需要重点说明的是,根据式(7),如果IM比较大的情况下,第二阶段引入的方差将会很小,而这一点在路测数据中是很容易满足的,所以,路测数据抽样误差就主要由第一阶段的整群抽样引入的。分析指标为CDMA网络的COEI,统计分析数据结果见表2。其中样本1经过的地理单元数为11021个,经过群数为9类;样本2经过的地理单元数为1105个,经过群数为3类。表2样本分析结果样本1样本2均值738DB691DB简单随机抽样标准差00240061均值702DB482DB二阶段抽样标准差043095采用二阶段抽样,样本1的95置信区间为786,618DBDB,样本2的95置信区间为668,296DBDB,样本1的采样点经过的地理单元类型数比较多,样本2的采样点经过的类型数少,是导致二者置信区间相差比较大的原因。对于简单随机抽样,由于路测数据样本单元数一般都很大,均值的方差近似为0。但是这并不意味着简单随机抽样就优于二阶段抽样。对于经过群较多,样点数量较大的样本1,分别采用简单随机抽样和二阶段抽样进行分析,均值接近;对于经过群少,样点数量少的样本2,均值相差很大。样本2仅仅是从3类地理单元中抽取的样本,所以样本2数据对总体的代表性差。引入BIRCH算法,并采用将整群抽样和简单随机抽样相结合的二阶段抽样以后,可以正确、有效地评估移动通信网络的性能。可以更客观的评价不同的路测数据样本的代表性。5结论本文讨论了移动通信网络路测数据的可靠性的分析问题。提出了采用数据挖掘技术的BIRCH算法来完成大数据量的聚类分析,给出了路测数据可靠性的分析方法。通过路测数据的可靠性分析,可以正确评价路测数据样本的代表性,还可以指导测试人员进一步的改进测试路线以更好地评估移动通信网络性能。但是本文在分析移动台覆盖指标时,为分析简便,仅仅根据移动台所属基站的覆盖半径及其相对位置进行聚类分析,实际影响移动台的覆盖指标的因素很多,还需要深入研究。/PAPEREDUCN6参考文献1FEUERSTEIN,MCLAUSIUS,GVENDETTI,DCREWS,DDESIGNANDTESTOFCDMACELLULARSYSTEMA,VTC1994IEEE44TH810JUNE1994PAGES6102SUZUKI,TTAKEUCHI,YFIELDTESTPERFORMANCEOFABASESTATIONTOCANCELWIDEBANDCDMAINTERFERENCEA,VTC2000SPRINGTOKYO2000IEEE51STVOLUME1,1518MAY2000PAGES308312VOL13MICHEL,DRAMASARMA,NGPRSMEASUREMENTMETHODOLOGIESANDPERFORMANCECHARACTERIZATIONFORTHERAILWAYENVIRONMENTA,WCNC2005IEEE,VOLUME3,1317MARCH2005PAGES167016754张健明,杨大成,无线网络规划的误差分析方法J,北京邮电大学学报,2004,273,48525RAVINARASIMHAN,DONALCCOX,ESTIMATIONOFMOBILESPEEDANDAVERAGERECEIVEDPOWERINWIRELESSSYSTEMUSINGBESTBASISMETHODSJ,IEEETRANSACTIONSONCOMMUNICATIONS,VOL49,NO12,DECEMBER20016李金昌,应用抽样技术M,北京科学出版社,20067ZAKKULAGOVINDARAJULU,ELEMENTSOFSAMPLINGTHEORYANDMETHODM,PEARSONEDUCATION,INC,PUBLISHINGASPRENTICEHALL,19998THEODORESRAPPAPORT,WIRELESSCOMMUNICATIONSPRINCIPLESANDPRACTICEM,SECONDEDITION,BEIJING,PUBLISHINGHOUSEOFELECTRONICSINDUSTRY,20049LEEWC,YEHYSONTHEESTIMATIONOFTHESECONDORDERSTATISTICSOFLOGNORMALFADINGINMOBILERADIOENVIRONMENTJIEEETRANSACTIONSONCOMMUNICATIONS1974,2286987310邵峰晶等,数据挖掘原理与算法M,北京中国水利水电出版社,2003年11JIAWEIHAN,MICHELINEKAMBER,DATAMININGCONCEPTSANDTECHNIQUESM,ACADEMICPRESS,200012DUNHAM,MH,DATAMININ

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论