




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、通话数据分析摘要本论文主要是根据题目给出的大量的通信记录数据通过Matlab、Excel、Lindo等工具进行整理分析,从整理的结果中找到需要建立的数学模型。本文中整理出了大量的图表来说明要表达的问题。问题一主要是通过数据的分析,发现所有主叫者的总通话时间呈现对称分布,联系人数主要集中于2到4人之间,为此我们根据这两组数据进行组合来进行对用户分类。其中总通话时间是小于2100认为较短,大于4900认为较长,位于两者之间认为中等。联系人数是小于等于4人认为较少,大于4人认为较多。为此本该将用户分为六类,但是我们发现其中一组的用户数为零。所以最终将用户分为五类:总通话时间较短,联系人数较少的一组有
2、27个用户;总通话时间中等,联系人数较少的一组有161个用户;总通话时间较长,联系人数较少的一组有51个用户;总通话时间中等,联系人数较多的一组有53个用户;总通话时间较长,联系人数较多的一组有8个用户。另外总通话时间较短,联系人数较多的一组有零个用户。问题二主要是根据第一问的用户分类结果利用层次分析法对推出的新业务进行分析。利用层次分析法可求出每一项业务与每一类用户的相关度。选择相关度最大的一类用户作为本项业务的首推人群。解题过程中是以亲情号这一业务为例,利用层次分析法选择首推人群。然后又结合着基站数据对模型进行了一些改进。关键词 通话数据 联系人数 通话时间 层次分析法 Matlab Li
3、ndo 覆盖率问题重述1.1 问题背景通信技术的不断发展拉近了人与人之间的距离。电话作为主要的通信工具之一悄无声息地将我们联系在一起,形成一个巨大的社交网络。这个巨大的社交网络对当前的通信设备和业务提出了更高的要求。如何利用现有的通话记录数据进行概括分析,以便作出合理的决策,进而改善通信设施、拓展新的通信业务,依然是很多通信公司所面临的一个难题。1.2 问题提出附件给出了一家通信公司公布的2009年6月份某地300个用户10天内的通话记录,试完成以下问题。(1)请根据这些通话记录信息建立数学模型以对用户分类。(2)如果需要推出一款新的通信业务,如何合理选择部分用户作为首选推广人群。说明你的理由
4、,并撰写一份不超过两页的给公司经理的建议。(3)该地现有的通信设施(如基站等)建设情况是否合理。如需改进,请给出合理的建议。2 问题分析附件中给出了大量的通信记录的数据,我们必须首先对这些数据进行整理分析,从中找出各组数据之间存在的直接或间接的关系,进而解决下面的问题。2.1 问题(1)分析该问题要求通过对通话记录信息来建立数学模型对用户分类,而附件中给出了主叫者、被叫者、通话时长、主叫者所属基站等数据。通过粗略分析应该从主叫者联系的人数或通话次数以及每个主叫者总的通话时间来进行对用户分类。用这两方面的限制条件来对用户综合分类。2.2 问题(2)分析这一问是针对上面的第一问来提出的。问题要求是
5、需要推出一款新的通信业务,如何合理选择部分用户作为首选推广人群。那么这一人群应该是根据这一业务的适合人群以及用户数量的多少来确定。应该考虑到这一业务的推广空间是否足够大,用户是否足够多。2.3 问题(3)分析该问是考虑现有的通信设施是否合理。题中给出的关于基站的数据应该作为主要的研究对象。必须考虑基站的使用人数以及使用的总时间,从基站的使用状况以及承受能力等方面考虑。如果不合理,在进行改进的时候也应该从这方面入手,尽量使每个基站使用均衡,避免个别基站使用过少而个别基站使用过多的情况发生。可以对使用较少的并且靠近的基站进行合并,在使用较多的基站附近再增加新的基站来减轻原有基站的工作压力。3 基本
6、假设为了对问题的求解进行一定的简化,不过多的考虑更多的无关紧要的因素,减少不可预知的因素(比如人口的变动、通话不均衡)的影响,我们在本问题的求解中作出如下假设:(1)假设此地300个用户保持不变,即这300个用户不会移出本地,也不会增加新的用户。(2)假设这300个人10天内的通话记录信息能反映该地区平时通话状况的总体情况。(3)此地用户打电话的话费标准一样。(4)每个基站的使用总时长没有超过最大的承受能力。(5)每个基站的覆盖范围大体上是半径为8Km的圆形区域。(6)每个基站的实际使用量与其周围的用户数量近似呈正比关系。(7)假设不考虑近距离间的基站的相互干扰。4 符号说明为了在问题的求解中
7、便于叙述,使用了一些符号,在这里对一些符号进行说明:thcs:每个主叫者在10天内打电话的次数;b:每个主叫者在10天内联系的人数;thsj:每个主叫者在10天内打电话的总的时间;A:打电话的时长较短、联系人数较少的用户群;B:打电话的时长中等、联系人数较少的用户群;C:打电话的时长较长、联系人数较少的用户群;D:打电话的时长中等、联系人数较多的用户群;E:打电话的时长较长、联系人数较多的用户群;5 模型的建立与求解5.1 问题(1)的求解利用Matlab对给出的数据进行汇总分析,分别求出了每个主叫者在这10天之内打电话的次数、联系的被叫者数(即联系的人数)、打电话的总的时间。另外还统计了每组
8、联系人数所对应的主叫者的数量以及所对应的主叫者编号。图一表示的是联系的人数与每组所对应的主叫者数量之间的关系。其中横坐标表示的是联系的人数,纵坐标表示的是每一组联系的人数所对应的主叫者的数量。 图一 联系人数与主叫者数量间的关系此图表说明在这300个主叫者中,大部分都是联系二至四个人,一共有230人,真正联系人数很多的主叫者所占的比重很小。将打电话的总的时间进行分段,分为(0,1000)、(1000,2000)、(2000,3000)、(3000,4000)、(4000,5000)、(5000,6000)、(6000,7000)共七个区段,然后统计出每个区段内的主叫者的数量。作出的图表如图二所
9、示,其中横坐标表示各个区段,纵坐标表示主叫者数量。 图二 各时间段内主叫者数量统计图由图二可以看出打电话的总时间位于(2000,5000)时间段内的人数为223人,所占的比重很大。下面的图三表示的是每个主叫者通话的次数(thcs)与总的通话时间(thsj)之间的关系。其中横坐标为thcs,纵坐标为thsj。图三 通话次数与通话总时间之间的关系由上图看出每个主叫者随着通话次数的增加,其总的通话时间也随着增加,两者近似呈线性关系。图四是每个主叫者联系人数与总的通话时间之间的关系图。其中横轴为联系人数(b),纵轴为总的通话时间(thsj)。图四 主叫者联系人数与总的通话时间的关系图该图上反映的情况与
10、图一、图二反映的情况有一定的相似性。从横轴来看,联系的人数多集中于2、3、4。从纵轴来看,打电话的总时间呈现对称分布,并且多集中于2000至4000之间。另外在图的右下角有一片空白区域,即表示在联系人数较多时,打电话的总时间很短的主叫者不存在。因此,我们综合考虑以上各图表所反映出来的信息,主要从每个主叫者在十天内的总通话时间与此主叫者联系人的个数对用户进行分类。分类的基本思想是每个主叫者总通话时间的多少与此主叫者联系人多少的组合。为了得到“时间长短”的量化指标,我们设相应的评语集为很长,较长,中等,较短,很短,一般的认为“较长”所对应的数值为0.7,“较短”所对应的数值为0.3。我们统计出来的
11、主叫者的总的通话时间的最大值为6980,这样根据这一数值就可确定总的通话时间小于2100的就认为较短,大于4900的就认为较长,介于2100到4900之间的就认为通话时间为中等。为了得到“人数多少”的量化指标,我们取0.3为分界值。统计数据中联系人数最多的为14人,所以确定小于等于4人为联系人数较少,大于4人为联系人数较多。根据总通话时间的长短和联系人数的多少来进行分类,初步分为六类,分别是:通话时间较短,联系人数较少;通话时间中等,联系人数较少;通话时间较长,联系人数较少;通话时间较短,联系人数较多;通话时间中等,联系人数较多;通话时间较长,联系人数较多。利用Matlab根据这两个条件进行求
12、解后发现,通话时间较短并且联系人数较多这一类的主叫者的数量为零。这样一共将所有的主叫者分为了五类。具体的分类结果见表一。其中的A、B、C、D、E见符号说明。表一 用户分类结果类别ABCDE主叫者33 62 69 7891 105 109 112 113 141 145 148 175 179 185 189 202 205 208 211 243 248 250 275 276 280 300 16 22 25 28 31 36 45 46 48 50 57 60 63 64 65 68 74 77 79 81 83 84 85 86 89 94 95 96 98 99 100 101 102
13、 106 107 110 114 115 116 117 118 123 126 129 130 131 132 133 134 135 136 138 139 140 142 143 146 147 150 151 152 153 154 155 156 157 163 164 165 166 168 169 171 173 174 177 181 182 183 184 186 188 190 191 192 195 196 197 198 199 201 204 206 207 210 212 213 214 215 216 218 219 220 221 222 223 224 225
14、 226 227 229 231 232 233 234 235 237 238 239 240 241 242 244 245 247 251 252 253 254 256 257 260 261 262 264 265 266 267 268 269 270 271 272 273 274 278 279 281 283 285 288 289 290 291 292 293 294 295 296 298 299 29 39 43 58 59 67 72 73 76 82 88 104 108 111 119 121 122 124 125 127 128 144 149 159 16
15、0 161 167 176 178 180 187 193 194 203 209 217 228 230 236 246 249 255 258 259 263 277 282 284 286 287 297 1 2 3 4 5 6 8 10 11 12 13 14 17 18 19 21 23 24 26 27 30 32 34 35 37 38 40 41 42 44 49 51 52 54 55 56 61 70 71 75 80 87 90 92 93 97 103 120 137 158 162 172 200 7 9 15 20 47 53 66 170人数27 161 5153
16、85.2 问题(2)的求解 问题求解表二 用户分类与推广业务间的关系表用户分类类相关度两大类业务I(与人有关的业务)II(与通话时间有关的业务)A173B75C77D15E17例如四项业务与I和II的相关度分别如下: 1,情侣派:(9,1) 2, 亲情号:(9,1) 3,十元包100分钟长途:(3,7) 4, 长话派,3元/月的功能费。每分钟话费减少。(5,9)利用层次分析法可求的每一项业务与每一类用户的相关度。选择相关度最大的一类用户作为本项业务的首推人群即可!现在以亲情号为例,利用层次分析法选择首推人群。图五 用户群与推出业务间的层次分析图第二层对第一层的对比矩阵M为M=,特征值v=2,归
17、一化的特征向量W=(0.7,0.3)第三层对第二层的对比矩阵N1和N2为N1=,特征值g=5,归一化的特征向量f=(0.30435,0.30435,0.30435,0.04346,0.04346) N2=特征值i=5,归一化的特征向量h=(0.3348,0.1395,0.1931,0.1395,0.1931)最终相关向量为Z=(f,g)W=*=由此可得第一类与目标业务相关度最大,应该作为首推人群。其他相关业务与此类似。只是与准则层的相关系数不同,可以用相同方法求得首推人群。5.2.1 模型改进模型改进后将使用户的分类拓宽,及再添加一个准则主叫者所使用的基站,这样可以使问题更加全面。如此再考虑推
18、广的新业务时,包含了“小区内通话优惠”等业务。 此时再利用层次分析法决策时,准则层需再加一项“偏重于与主叫者所在区域有关的业务”。有附件给的图可主观的将此地区划分为四个区域,在具体讨论即可。 由图六可知:大约1/3的人使用一个基站的概率在80%以上,此部分人可定为固定用户,当开通“小区优惠业务”时,应作为首推人群,当然在第一问用户分类时就要将此部分人划为一类了。图六 固定用户所占比例5.3 问题(3)的求解6 模型评价与改进针对问题一我们只考虑了每个主叫者的通话总时间与联系人数之间的关系,进而对用户进行了分类。只是简单的对用户分为了五类,而没有考虑到利用基站的数据对用户进行分类。这样使问题进行
19、了简单化。如果第一问再根据基站的数据进行分析分类,将会使问题解决得更加完美一些。问题二利用层次分析法对推出的新业务进行分析,然后又对模型进行了一些改进。主要是和问题一相似,又把基站的因素考虑进来,然后使模型更加完善。7 参考文献1 韩中庚,数学建模方法及其应用,北京:高等教育出版社,2005年6月。2 吴建国,数学建模案例精选,北京:中国水利水电出版社,2005年5月。 附录:1、x=importdata(D:workzhujiaozhe.mat); %导入主叫者的数据y=importdata(D:workshijian.mat); %导入通话时间z=importdata(D:workbeij
20、iaozhe.mat); %导入被叫者的数据thcs=zeros(1,300); %设定通话次数矩阵thsj=zeros(1,300); %通话时间矩阵for j=1:6221 for i=1:300 if (x(j)=i) thcs(i)=thcs(i)+1; thsj(i)=thsj(i)+y(j); end endendthcsthsjc=zeros(300,300); %每个主角用户打电话次数统计for s=1:6221 if (c(x(s),z(s)=0) c(x(s),z(s)=1; endendb=zeros(1,300);for t=1:300 for r=1:300 b(t)
21、=b(t)+c(t,r); endendb nihe=zeros(14,1); %每一组打电话次数中主角用户数统计for w=1:14 for i=1:300 if (b(i)=w) nihe(w)=nihe(w)+1; end endendnihesubplot(2,1,1);bar(1:14,nihe)d=zeros(1,7); %打电话的时间分别位于0至1000,1000至2000。之间的用户数的统计for j=1:7 for i=1:300 if (thsj(i)(j-1)*1000) & (thsj(i)=j*1000) d(j)=d(j)+1; end endenddu=1000:
22、1000:7000;subplot(2,1,2);bar(u,d)ab1=; %对用户按时间2100、4900,人数4分组,分六组ab2=;ab3=;ab4=;ab5=;ab6=;h=1;f=1;m=1;n=1;p=1;q=1;for i=1:300 if (thsj(i)=2100) if (b(i)=4900) if (b(i)=4) ab3(m)=i; m=m+1; else ab6(n)=i; n=n+1; end else if (b(i) M=1,7/3;3/7,1M = 1.0000 2.3333 0.4286 1.0000 w,v=eig(M)w = 0.9191 -0.919
23、1 0.3939 0.3939v = 2 0 0 0 N1=1,1,1,7,7;1,1,1,7,7;1,1,1,7,7;1/7,1/7,1/7,1,1;1/7,1/7,1/7,1,1N1 = 1.0000 1.0000 1.0000 7.0000 7.0000 1.0000 1.0000 1.0000 7.0000 7.0000 1.0000 1.0000 1.0000 7.0000 7.0000 0.1429 0.1429 0.1429 1.0000 1.0000 0.1429 0.1429 0.1429 1.0000 1.0000 f,g=eig(N1)f = -0.9417 -0.573
24、5 0.1824 -0.8482 -0.9417 0.2354 -0.5735 0.8204 0.0296 0.2354 0.2354 -0.5735 0.5196 0.5281 0.2354 0.0336 -0.0819 -0.1087 0.0207 0.0336 0.0336 -0.0819 -0.1087 0.0207 0.0336g = 0 0 0 0 0 0 5.0000 0 0 0 0 0 0.0000 0 0 0 0 0 -0.0000 0 0 0 0 0 0 N2=1,3/5,3/7,3/5,3/7;5/3,1,5/7,1,5/7;7/3,7/5,1,7/5,1;5/3,1,5
25、/7,1,5/7;7/3,7/5,1,7/5,1N2 = 1.0000 0.6000 0.4286 0.6000 0.4286 1.6667 1.0000 0.7143 1.0000 0.7143 2.3333 1.4000 1.0000 1.4000 1.0000 1.6667 1.0000 0.7143 1.0000 0.7143 2.3333 1.4000 1.0000 1.4000 1.0000 h,i=eig(N2)h = -0.7022 0.2394 0.7022 -0.6016 -0.6016 0.2926 0.3990 -0.2926 0.4669 + 0.3511i 0.46
26、69 - 0.3511i 0.4096 0.5587 -0.4096 0.0901 - 0.0085i 0.0901 + 0.0085i 0.2926 0.3990 -0.2926 0.4070 - 0.3389i 0.4070 + 0.3389i 0.4096 0.5587 -0.4096 0.0901 - 0.0085i 0.0901 + 0.0085ii = 0 0 0 0 0 0 5.0000 0 0 0 0 0 0.0000 0 0 0 0 0 0.0000 + 0.0000i 0 0 0 0 0 0.0000 - 0.0000i4、问题二模型该进数据主叫者使用基站数使用最多次的基站
27、所使用的次数使用次数最多的基站的序号每个主叫者总的使用基站次数使用最多次的基站使用次数与总的使用基站次数的比值1123112312111111113291120.7542915150.652111140.78571428663811160.5721711310.548387097821211220.545454545922425320.75102131180.722222222112101180.55555555612120112011321313210.6190476191421110210.523809524152187280.6428571431612211221173923150.61
28、831220200.61912112112013113112121511260.5769230772221024170.5882352942321911200.95242111190.57894736825117111712621011190.526315789272158250.628121222112922025320.625302918130.692307692312101130.7692307693221011150.666666667332611100.63421315170.7647058823521515200.753612511251372922160.562538121121
29575757576402724140.54121411190.7368421054221113180.6111111114321915280.6785714294421121150.7333333334521327250.52462241250.964721611310.51612903248119111914931111210.5238095245021215240.55131016240.416666667522618120.55321811300.65422111230.9130434785521327260.55621822190.947368421572101
30、5200.55822223380.5789473685931715360.472222222602820120.6666666676121411160.875622724110.6363636366322311240.9583333336421311160.81256521411200.7661351135167131163116821011180.55555555669341760.6666666677021420230.60869565271119111917221717300.56666666773131213117422011260.7692307697521617270.592592
31、59376128112817731411240.5833333337821016130.769230769792911110.8181818188021611260.6153846158121410240.5833333338222113350.6833121230.521739138421111130.846153846852201220.90909090986364120.58731211230.5217391388130113018911611161902151210.714285714911101101921181181931181118194376120.58333333395210
32、27190.526315789963126160.75971152215198361130.4615384629921211170.705882353100121121110121019130.76923076910221613180.88888888910321118210.52380952410422426360.6666666671051911911062824150.5333333331072819160.510831511310.483870968109111111111102717130.53846153811113011301112251880.625113271120.5833
33、333331142131210.619047619115115171511162171260.653846154117117111711182151260.57692307711921520280.53571428612021111160.687512121811260.69230769212221624300.53333333312321125180.611111111124127127112521811280.6428571431262168220.7272727271272153280.535714286128130113011291181118113031311230.56521739
34、113121822210.85714285713221822200.913321413270.5185185191343927140.64285714313521211150.81362910150.613721611250.6413831111170.6470588241392924170.52941176514021011130.769230769141251160.8333333331421131113114321511240.62514432116320.65625145251180.6251461241241147120112011482711110.6363636361492222
35、1330.66666666715021016200.51513126200.615231011160.625153291170.5294117651541171317115521411200.71562721140.5157118118115821022130.76923076915922011300.66666666716022522270.9259259261612231350.65714285716212512511632722110.6363636361642151230.6521739131651221122116622011260.76923076916722315320.7187
36、516831225260.46153846216921311230.56521739117022523340.73529411817121127180.61111111117221111210.52380952417331115220.51742211230.9130434781751919117622518360.69444444417731422260.53846153817831411260.5384615381791212118021710250.6818131215190.63157894718231511240.6251831181181184292170.529411765185
37、251390.55555555618621322230.565217391187128128118822211230.95652173918915115119021411260.5384615381911282228119221811200.919321422260.53846153819431719290.58620689719521115200.551961151115119721311140.9285714291982116180.61111111119931014190.52631578920021911230.82608695720131411220.6363636362021112
38、211120321422280.520421213180.6666666672051111111120622021210.9523809522072131230.565217391208261790.66666666720922011270.74074074121021027140.7142857142112915110.81818181821231611240.66666666721321125200.5521411911191215121112112161181118121731522280.53571428621812112112193821160.522021524230.65217391322121520170.88235294122221010170.5882352942232151200
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 苏教版数学一年级上学期第6单元测试卷
- 中学生学习心理压力缓解课件
- 浙江省2025年小升初数学专项复习9-圆(含答案)
- 广告设计师作品评价试题及答案
- 产科基础知识试题及答案
- 2024年助理广告师考试突破技巧试题及答案
- 松下集团招聘试题及答案
- 叉车考试题库分析及答案
- 本溪工勤考试题库及答案
- 安安规考试题库及答案
- 决策树在饲料技术推广中的应用研究
- 空管自动化系统的基本组成与功能课件
- 安宁疗护之舒适护理
- 2023年杭州市规划局拱墅规划分局编外人员招考考前自测高频难、易考点模拟试题(共500题)含答案详解
- 品牌国际化对企业出口竞争力和品牌价值的影响研究
- 大模型的因果推理与可解释性
- 《圆柱与圆锥》单元整体教学设计展示
- journal of affective disorders投稿格式要求
- 大白菜收获机的设计
- 卒中后抑郁(PSD)在中国的发病情况及临床管理分析-修改
- 260吨汽车吊地基承载力验算
评论
0/150
提交评论