移动通信数据分析与利用问题(九组)2.doc_第1页
移动通信数据分析与利用问题(九组)2.doc_第2页
移动通信数据分析与利用问题(九组)2.doc_第3页
移动通信数据分析与利用问题(九组)2.doc_第4页
移动通信数据分析与利用问题(九组)2.doc_第5页
已阅读5页,还剩19页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

移动通信数据分析与利用问题(九组:管天彦 王 娟 赵 鹏)摘要 本文通过Eecel将300名用户10天内的通话记录进行处理,再建立K-means聚类模型用SPSS软件将用户分为6类,并依据每类用户特征选择新业务的合适人群;其次通过对30个基站的运行情况分析,对基站的合理化做出了判断,较好的解决了题目中的问题 针对问题一,要求对用户进行分类,经过对数据处理后,将用户的主叫次数,被叫次数,主叫通话时长(以秒为单位),被叫通话时长和夜间通话比例作为5个通话特征变量建立了K-means聚类模型,利用SPSS软件将300个用户经过两次聚类聚为了6类,具体情况见表4。 针对问题二,在问题一中已经明确的将用户聚为6类,我们对分出的6类用户分别做具体详细的分析,并根据每一类的特点,对其推出优质,优先,全方位为理念为公司赢得更多的利益的新通讯业务和以实惠,快捷且不很影响其他通讯业务的经营为主为公司赢得更好的声誉,和品牌效应的新优惠业务,则认为新通讯业务的适合人群为问题一中分出的第一类,第五类和第三类消费能力较高的用户,新优惠业务的适合人群为第一类和第二类夜间通话比例相对较大,人口比例适中的用户。针对问题三,由于本文将每个基站的工作量定义为繁忙指数,并将每个基站的繁忙指数与所有基站的繁忙指数平均值做均衡比较,依据得出的均衡偏差将基站分为严重超负荷,繁忙,正常,较闲置,很闲置这5类繁忙指数区间,从而判断基站建设是否合理。重点解决和调整超负荷,繁忙,和很闲置的这些基站,对于严重超负荷的地区将增加基站或将其工作量分配给周围闲置的基站,对严重闲置的基站拆除,其工作量由周围的基站分担。综合分析后认为在基站28和29之间新增一个基站31,并将基站5,7,19,26拆除其工作量由周围邻近基站分别分担(具体见问题三的解答)。针对问题四,通过对基站建设的合理性分析,我们结合改进成本和改进期间对用户的影响程度,再根据不同的原则对通讯公司作出了两套合理化的方案。方案一是在改变原有的基站数目,增加或减少基站数,其具体方案如上述问题三。方案二是不改变原有基站数目的前提下,根据每个基站其工作量大小,将其基站改成大,中,小,三种型号的基站。经过合理分析,我们认为将基站11,28,29和30改为大型基站,将基站2, 3, 5 ,7 ,8 ,14 ,26改为小型基站,其余基站不做更改,并将方案写成具体建议呈交给移动运营商作参考。关键词 K-means聚类 繁忙指数 均衡比较 SPSS1. 问题的重述现代通信技术的快速发展拉近了人与人之间距离,移动电话现已成为人们生活中不可缺少的用品之一,将我们紧密地联系在一起,使其形成了一个巨大的社交网络。然而,社会的需求对当前的通信设备与通信业务的技术和管理水平提出了更高的要求。对于移动通信运营商来说,如何对现有的通话记录数据进行分析处理、充分合理地利用,以有利于运营商的技术改造、拓展新业务、提高服务水平,为科学合理决策提供决策依据。这也是各移动通信公司所面临的一个重要研究课题。附件1中给出了一家移动通信公司2010年6月记录某地区300个用户10天内的通话数据信息,请分析研究下列问题: (1)对这些通话数据进行分析处理,通过数学建模方法对用户进行合理地分类,并说明其分类特征。(2)移动公司拟针对部分用户推出一项新的通信业务和一项优惠业务,请你们帮助分析公司应如何选择各类用户作为使用对象,给出你们的选择方案,并说明其理由和依据。(3)公司在该地区现有的基站设施情况如附件2所示,请你们分析其设置的合理性,是否需要改进,即是否需要增加或者减少?并说明你们的理由和依据。 (4)结合你们的建模分析结果,给该公司经理写一份不超过一页的建议书。2.问题的分析2.1 问题一的分析对于300 个用户,我们假设这十天的选择是随机的,即题给的300 个人十天的通话信息能够代表他们平时的水平,因此,得到的数据具有可靠性。通信运营商需要通过对自己的客户进行分类和筛选得到重要客户以及潜在重要客户,以此明确要巩固和优化的重要客户以及通过潜在重要客户挖掘更多的重要客户,从而使利润最大化。1)通常一个用户创造的利润与用户的主叫通话时间 有很大的关系,也与被叫用户的通话时间 大的关系;2)考虑到目前市场话费,主叫费用与被叫费用是不同的。如果被叫多,则一般是地位比较高的用户,消费能力强是潜在或者已经是重要客户,因此主叫用户的通话次数和被叫的通话次数 是体现用户重要程度以及该通信运营商业务普及程度的一个重要指标,也是影响利润的重要因素。3)结合问题二考虑,我们将主要对夜间客户推介新的优惠业务,因此我们把夜间通话用户的通话时间占他总的主叫时间的比例定义为故本文选择主叫通话次数 ,被叫通话次数 ,主叫通话时间,被叫通话时间 和用户的夜间通话比例这五组数据作为用户的特征变量进行分类。 由于在所给的数据表里,并没有以上5 个指标的直接数据,因此在建立模型前,需要对原数据进行整理和提取。因此本文利用Excel工作表对各个指标进行提取。提取的数据是一个3005的矩阵。见附表2.2 问题二的分析 通过问题一,我们可以将300为移动通讯用户聚成不同类别,而问题二要求我们为将要推出的两种不同性质的业务选择合适的对象,我们首先要以“企业-客户-双赢”为出发点,确定这两种新业务的特征及适合的人群,再对分出的类分别做详细具体的分析,判断该类人群是否适合作新业务的对象,适合作哪种业务的对象。 对于将要推出的新通讯业务,应该要选择有消费能力的人群,且该类人群所占比例要较大。这种业务应以先进,优质,全面,快捷的服务为理念,这样才能很快占领市场,使得公司赢得更多的利润,提高公司收益和公司各阶层工作人员的积极性。 对于将要推出的新优惠业务,我们不能再以盈利为主要目的,众所周知任何一个企业要想长久而又被支持的生存下去,先进的生产技术,全方位的服务以及对待客户的重要程度都是不可缺少的。因此此项业务应以实惠,快捷的服务为宗旨,尽量满足用户的需求,博得用户的好评,赢得用户的忠诚等。此种业务应选择占有一定比例的人群,但这个比例要相对适中,这样公司既不用花费太多就能获得免费的宣传效果,又可以把更多的经力,物力用于经营其他盈利更多的通讯业务。通过讨论和对数据的分析,我们认为夜间用户是此项优惠业务的最佳人选。夜间用户不仅比例适中,而且选择这类人群做对象,还可充分利用夜间时段基站承受的工作压力相对较低的情况。2.3 问题三的分析随着通信用户数量的飞速增长,基站尽管已经不停的进行扩容和新建,但是往往还很难满足用户的需求.基站的合理建设对于通信公司的经济效益有着重要的意义. 如果基站的工作量过大,对硬件的需求,管理技术等就越高,这会造成通信公司的维护费用大大增加;如果基站的工作量低于正常水平,则无法最大程度的使用基站衡量基站是否合理,需要看其工作量大小,我们假设每个基站的正常工作能力相同且都处于中等水平。那么基站的实际工作量比正常工作能力的工作量过多或过少都属于不合理。为此,我们可通过数据处理得出每个基站的繁忙指数,即它在10内的总工作量,然后将每个基站的繁忙指数与所有基站的平均繁忙指数做均衡比较,得出均衡偏差。最后根据每个基站的均衡偏差大小,将所有基站的工作繁忙程度划分成不同繁忙指数区间,再根据每个基站所属的繁忙指数区间来判断其是否合理。 对于繁忙指数过高的基站,必定会减少基站寿命,增加公司的维护费用,应将其工作量分担一部分给周围的基站,若不能分担给周围的基站,则在其附近新增一个基站;对于繁忙指数过低的基站,就会造成基站硬件资源,人力资源的浪费,此时应将基站拆除,拆除的基站的工作量应有附近其他工作量不大的基站分担。2.4 问题四的分析问题三已根据基站的工作量等情况来确定各个基站是否合理,我们可根据各基站的合理情况,给出具体的改进方案以使基站达到一个最佳的工作状态同时使通讯运营商的利益达到最大化,并向移动公司提交建议书。由于考虑到拆除和新建基站都是从基站的地理位置进行的改变,这种方案尤其会对拆迁的基站覆盖的网络区域造成极大的影响,而且拆除和新建都会给公司带来极大的经济损失。因此我们还给出了从基站的大小进行改变的方案,以使客户达到较高的满意度,也可减少公司对基站改进的成本。3.模型的假设及符号说明3.1 模型的假设(1)300位用户能够基本反映本地区的客户的情况。(2)300 个客户的情况能够总体反应30 个基站的使用情况。(3)假设基站与基站之间相互独立,没有任何的相互干扰情况,且一次通话仅需要一个基站,不受两个通话人距离的影响。(4)假设现在所有的基站的承受能力几乎相同,且处在中等水平。(5)30 个基站均为全天工作,没有间断(6)在同一个地点的基站覆盖范围相同3.2 符号的说明 用户的主叫通话时间 用户的被叫通话时间 用户的主叫次数 用户的被叫次数 用户在夜间通话的时间占他主叫总通话时间的比例 第个基站的繁忙指数,即10天内的工作量 第个基站的均衡偏差4.模型的建立和求解4.1 问题一的模型建立和求解4.1.1 模型的建立(K均值聚类模型)在问题一中,300 名客户即为300 个样品,则每个样品有6 个指标(分别为:客户编号,主叫时间,主叫次数,被叫时间,被叫次数,23:00-6:00闲时主被通话比)。由于之前并没有对类似这300 个样品有比较清晰的分类,即事先没有相关的客户类别,因此本文认为采用聚类分析对300 个样品进行分类是合理的。同时因为样品量超过可以进行系统聚类分析的容量(200),因此本文选用动态聚类分析中常用的Kmeans聚类法对300个样品进行分类。其原理和主要算法如下:1.K-均值聚类是按照一定方法选取一批聚类中心,让样品向最近的聚类中心聚集,形成初始分类,然后按照最近距离原则不断修改不合理分类,直至合理为止的一种快速聚类方法。2.算法:Kmeans算法采用迭代更新的方法:在每一轮迭代中,依据k个聚类中心将周围的点分别组成k个簇,而后重新计算每个簇的质心(即簇中所有点的平均值,也就是几何中心)将被作为下一轮迭代的参考点。迭代使的选取的参考点越来越接近真实的簇质心,所以目标函数越来越小,聚类效果越来越好。 输入:聚类个数k,以及包含 n个数据对象的数据库。 输出:满足方差最小标准的k个聚类。 处理流程:(1)从 n个数据对象任意选择 k 个对象作为初始聚类中心;(2)循环(3)到(4)直到每个聚类不再发生变化为止(3)根据每个聚类对象的均值(中心对象),计算每个对象与这些中心对象距离,并根据最小距离重新对相应对象进行划分;(4)重新计算每个(有变化)聚类的均值(中心对象)本文中动态聚类法的基本思想是:选择一批凝聚点(即一个初始的分类),让样品按某种原则向凝聚点凝聚,对凝聚点进行不断的修改或迭代,直至分类比较合理或迭代稳定为止。类的个数K 可以事先指定,也可以在聚类过程中确定。而选择初始凝聚点(或给出初始分类)的一种简单方法是采用随机抽选(或随机分割)样品的方法。故模型建立的步骤如下: 第一步,将上面的5个指标看着描述每个客户的5个原始特征,每个客户就可以看成是5维空间的点,可以用特征向量来表示。由于的原始数据的数量级和单位不相同,故在作为特征向量之前,应该先对其进行标准化处理。这里采用z-score标准化(也叫标准差标准化),经过处理的数据符合标准正态分布,即均值为0,标准差为1,其转化函数为: 其中为所有样本数据的均值,为所有样本数据的标准差。第二步,将标准化后的变量导入SPSS软件,利用其中的K均值聚类分析对300个用户进行聚类。聚类时依次计算每个样品到个聚类中心的距离(欧氏距离),经过反复迭代直到把每个样品分到指定的类别中。其中: 4.1.2问题一得求解结果利用SPSS软件在聚类中我们尝试了将用户分成不同个数的类别,以选择最优,最合理的分类方法。下面我们以第一次聚类中聚为4类和聚为6类的结果作说明。表1 不同类别数目的聚类结果第一次聚4类的结果第一次聚类为6的结果类别案例数类别案例数1212211823931283102452415102654从第一次聚类中可以看出聚为6类的效果显然比聚类4类的结果好,它的类别与类别间的案例数目划分更为合理,所以我们决定采用聚为6类的方法。但无论聚为4类还是6类,都不难看出,有极特殊的两三个用户他们使用移动通讯的频率或通话时长和其他用户有显著差异。那么该用户对应的变量在聚类过程中就是几个孤立的点,其通话次数和通话时长甚长或甚短,他们的距离与其他相比甚远或甚近,因此很可能对其他点得聚类产生影响。我们考虑将这3个孤立排除在外单独比较,再把剩余的点重新聚为4类,再将这3个特殊点中,两个通话时长甚长的归为第5类,通话时长甚短的归为第6类综上所述,第一次聚类,第二次聚类的最终结果如下:表2 6类最终结果表聚类123456主叫次数21.3076915.4035127.6990316.5306118.52被叫次数62.435911.9824613.6310713.03061210.51主叫时间3949.8212776.6675036.8933010.3983209232被叫时间11350.772179.56124742379.12238828.5234夜间通话比0.1274280.2248580.1186210.0555650.1663710.775862主被比例0.3479781.2739572.0359311.265340.0826450.991453整理300名用户的分类情况如下表:表3 用户分类情况表类别123456合计个数39571039821300我们对这六类人群使用移动通讯特征分别作如下描述:第一类:打电话和接电话都多,接电话的次数和时间是接电话的3倍左右;第二类:打电话和接电话都叫少,打电话和接电话次数和时间相当,时常在夜间23:00-06:00打电话;第三类:打电话特别多,接电话较少,打电话的次数和时间是接电话的2倍左右;第四类:打电话和接电话都少,打电话的次数和时间略比接电话多,很少在夜间打电话;第五类:打电话较多,接电话极多,这类人群也极少;第六类:几乎不与他人通讯联系,这类人只有个别特例。其中每个用户应属的类别见下表;表4 每一类包含的用户类别用户编号12,3,4,7,8,9,11,12,13,14,15,16,18,19,20,21,23,24,27,34,35,38,41, 42,49,51,52,53,54,61,70,71,75,87,92,93,103,137,172;26,25,26,28,31,37,44,64,65,69,78,84,95,100,101,105,106,112,11,115,130,132,134,140,142,145,146,147,150,152,156,158,163,164,171,175,184,185,196,199,202,204,210,213,220,225,226,241,245,248,250,251,261,262,275,293,295;329,36,39,43,45,46,47,50,55,58,59,63,66,67,72,73,74,76,77,80,81,82,83,88,90,104,108,111,116,118,119,121,122,124,125,126,127,128,133,143,144,149,159,160,161,162,165,166,167,168,169,170,174,176,177,178,180,182,186,187188,190,191,193,194,200,203,209,212,215,217,224,227,228,230,233,235,236,238,246,247,249,252,254,255,256,258,259,260,263,272,277,278,281,282,284,286,287,290,294,296,297;410,17,22,30,32,33,40,48,56,57,60,62,68,79,85,86,89,91,94,96,97,98,99,102,107,109,110,114,117,120,123,129,131,135,136,138,139,141,148,151,153,154,155,157,173,181,183,189,192,195,197,198,201,205,206,207,208,211,214,216,218,219,221,222,223,229,231,232,234,237,239,240,242,243,244,253,257,264,265,267,268,269,270,271,273,274,276,279,280,283,285,288,289,291,292,298,299,300;51,5;6179.4.2 问题二的模型的建立和求解4.2.1 问题的准备公司要推出一项新的通讯业务和一项优惠业务,合理选择业务对象是至关重要的。本文考虑将要推出的新的通讯业务要使公司尽量盈利,提高公司收益和公司各阶层工作人员的积极性。其选择的推广对象应满足以下条件:1. 该类人群有较高的消费需求和消费能力。2. 该类人群所占比例相对较大。 条件1保证了新推出的业务能被迅速有效的被接受,条件2则保证了该项业务再推出后能获得足够的利益。对于将要推出的优惠业务,本文考虑不以盈利为主要目的,而要尽量照顾用户的习惯和需求,为他们提供方便优惠的业务,以博得用户的好感与信任,最终达到双赢目的。经过多方考虑我们认为推出夜间通讯的优惠业务,其选择的推广对象应满足以下条件:1. 该类人群时常在夜间打电话。2. 该类人群所占比例相对适中。条件1保证了新推出的优惠业务迅速有效的被接受,并获得好的口碑,条件2则保证了公司可以不用花太多的经力,物力在此项优惠业务,而是投身于盈利更多的其他业务。 根据问题一的结果,已得到每类用户的通讯习惯,特征,也能在一定程度上反映出用户的消费水平,下面我们对每类用户进行分析,寻找适合的新通讯业务和优惠业务的合适推广群体。表5 第一类用户各项指标用户类别主叫次数被叫次数主叫时间被叫时间夜间通话比主被比例个数第一类21.362.43949.811350.70.12740.34839这类用户打电话,接电话的次数和通话时长都相当可观,说明其消费需求和能力较高,再看被叫次数和时间远多于主叫次数和时间,反映出他很可能是商业界或大企业中的重要人物,社会地位较高,交流范围广,通讯是其事业重要的一部分,其消费能力也是相对较高的水平,因此是新通讯业务的合适人选。另外这类用户夜间打电话也有一定的比例,可能是工作繁忙所致,如果在花更多的钱获得更便捷,周到的服务后也能享受到廉价的优惠业务,心里会更加平衡,对移动公司有更高的满意度,甚而向周围广泛的交往圈推广,对公司品牌的推广是又很大积极意义的,因此,我们也把他们作为优惠业务的合适群体。表6 第二类用户各项指标用户类别主叫次数被叫次数主叫时间被叫时间夜间通话比主被比例个数第二类15.4122776.72179.60.22491.27457这类用户打电话接电话都少,想必是平时需要通讯的事不多,或者消费能力不是很高,对其推广新的通讯业务意义不大。但其夜间通话比例相对较高,且这类人群的比例适中,若对他们推行新的优惠业务是相当合适的选择。价廉物美的优惠业务不仅能增加他们对移动公司的信任,还能刺激他们的通讯消费,并向亲朋好友介绍此种实惠的业务。所以无论是主观原因还是客观原因导致他们通讯较少,向他们推广优惠业务都是很好的选择,这也是增加公司知名度的可行方法。表7 第三类用户各项指标用户类别主叫次数被叫次数主叫时间被叫时间夜间通话比主被比例个数第三类27.713.65036.924740.11862.036103这类用户打电话时间和次数很多,接电话时间却较少,而且打电话是接电话的两倍左右,可见此类用户是非常热心的用户,对待周围的群体热心,大方,很少会在乎电话费用。或者属于身份地位不高但要处理许多事务,不得不随时联系他人的群体。这两种群体有着共同的特征,经济地位或许不高,但实际通讯消费较多,向他们推广新的通讯业务是非常合适的。且这类人群所占比例很大,对公司创收起着很大的作用。表8 第四类用户各项指标用户类别主叫次数被叫次数主叫时间被叫时间夜间通话比主被比例个数第四类16.5133010.42379.10.05561.265398这类用户打电话接电话的通讯的次数和时间都很少,并且也不常在夜间打电话,对其推广新的通讯业务和优惠业务对公司都无多大意义。因此,我们认为对此类用户不推介任何业务。表9 第五,六类用户各项指标用户类别主叫次数被叫次数主叫时间被叫时间夜间通话比主被比例个数第五类18.5210.5320938828.50.16640.08262第六类212322340.77590.99151第五类和第六类用户均属于特殊的个别用户,由于其人数极少,在推广新业务是我们根据其通讯特征将其划分到上述的四类用户中加以考虑。第五类用户主叫时间长,被叫时间极长,且有在夜间打电话的习惯,我们将其归到前面所述的第一类客户中,既对其推广新的通讯业务,又对其推介优惠业务。第六类客户恰好相反,属于几乎不通讯的用户,我们将其和第四类客户看作一类,不对他推介任何业务。综上所述,第一类,第二类,第三类用户为推广业务的主要对象。其中新的通讯业务对第一,三类用户都大加推广,这些群体既然相应的消费需求和消费能力,又占有较大的人群比例,且交往范围广,对公司的经济利润,和潜在的品牌价值都有很大的促进作用。新的优惠业务则主要对第一类和第二类群体加以推广,他们时常在夜间通话,且人群所占比例适中,是非常合适的选择。对体现移动通讯公司以客户是上帝为理念,尽量满足用户需求的经营宗旨做了很好的诠释,这对建立公司的良好形象与创造受欢迎的品牌效应是极为有意义的。4.2.2问题二求解通过分析,我们把将要推出的业务和对应的对象列入下表:表10 新业务及对象表对象通讯特征新通讯业务第一类(包含第五类)打电话,接电话都多第三类打电话多,接电话少新优惠业务第一类打电话,接电话都多,夜间通话比例较大,人群比例适中第二类打电话接电话都较少,夜间通话比例较大,人群比例适中理由与依据:随着移动通信市场日益激烈的竞争,客户服务质量已成为企业的核心竞争力,移动通讯公司必须以客户为中心,获得较高的客户满意度和忠诚度,才能在竞争中立于不败之地。因此,服务好客户是实现企业利润和可持续发展的重要保障之一。向客户推出新的业务便是吸引客户和宣传品牌的重要方法之一。但是,不同的客户有不同的通讯需求,消费能力和消费习惯等,我们应根据不同客户的不同通讯特征,向其推介既适合他又对公司有益的不同业务。题中明确说明将要推出的一项是新通讯业务,一项是新优惠业务。我们认为新通讯业务,即向客户推出一项新的“优质,优先,全方位”服务的业务,它能为公司带来非常可观的经济效益。新优惠业务,即新的“优惠,适用”的服务,它不以经济利益为首要目的,但却是根本目的。因为它更多的是从用户的角度考虑,以使用户对公司有更多的信赖与忠诚,使公司建立更好的品牌效应。而我们知道,品牌效应就是潜在的经济利益!考虑“公司客户双赢”这一强劲的关系纽,我们认为:(一)新的通讯业务应主要对消费需求和消费能力较高或实际消费很多的人群推广。首先这类人群自身的特征就决定了他们是为公司的创收的主力军,通过对300为移动用户的通讯情况进行分析(我们假设300为用户是随机选择的,具有强代表性),这类人群业务繁忙,社会地位不一定高,但很稳定,周边对其征求意见的人群也多。通讯是他们与他人保持联系和适应快节奏生活不可缺少的工具,因此对于新推出的通讯业务,他们必能更快的接受并加以推广,这正是公司推出新业务的首要愿望:快速占领市场。其次,这类人群对新业务的品质,快捷等也有这更高的要求,例如无线上网,手机发邮件等是他们处理业务的常用工具。所以对新推出的高品质的通讯业务,他们必定是最早关注的,而且,他们的交往范围广,通讯网的覆盖范围也广,当知道有优质的新业务推出时就会向能触及到的社会圈大力推介,这就达到了公司的进一步愿望:打响知名度。(二)新的优惠业务主要应主要向时常在夜间打电话,但人群比例相对适中的人群推介。首先,选择夜间用户可以充分利用各基站的承受的工作量相对较低的情况,保证基站的工作效率和安全性,同时网络速度更快,赢得用户更高的满意度。其次,夜间用户比例适中,公司可以花很少的成本就可获得很好的宣传效果,又可将更多的资源用于经营其他营利更多的业务,这样公司赢得了很好的口碑,建立了良好的企业形象而又尽可能多的增加了收益,才是真正的双赢。再者,这类人群不用在乎其是否有较高的消费能力,只要他时常在夜间打电话,便可作为推介的对象。如果是打电话多,消费能力较高的,公司首先会向其推介新的通讯业务,那么如果他在花更多的钱得到技术领先的业务服务后,还能享受到廉价的优惠服务,心里必定会有更高的满意度,也会对移动公司更加忠诚,支撑着企业的可持续发展。如果是消费能力相对弱,但常在夜间通讯的用户,此种优惠业务就能很好的刺激他的消费,虽然优惠业务公司没有太大的盈利空间,但薄利多销的道理大家都懂得,在不影响公司运营其他业务的情况下未尝不是一种很好的营销方式。另外优惠业务对公司知名度的影响是不可估量的。4.3 问题三的模型建立和求解4.3.1 模型的建立经过相关资料查得基站的定义:即公用移动通信基站是无线电台站的一种形式,是指在一定的无线电覆盖区中,通过移动通信交换中心,与移动电话终端之间进行信息传递的无线电收发信电台。 基站由移动通信经营者申请设置。 本问是对基站设置的合理性作出判断,我们判断基站的合理性是以基站的繁忙指数来决定的,而基站的繁忙指数可以认为由基站每天接受呼叫次数(即主叫者通过该基站通话的次数)来象征。其表达式为:一方面基站的繁忙指数直接体现了其工作量,可以得到每个基站的运行量,为更好的区分出各个基站的超负荷,正常水平和闲置的情况,以此对基站的工作量重新进行合理的安排。我们将各个基站的繁忙指数与30个基站的平均繁忙指数(均衡状态)作比较,并将其定义为均衡偏差。其表达式为: 若: 则该基站的繁忙指数高于所有基站的平均繁忙水平; 则该基站的繁忙指数低于所有基站的平均繁忙水平。再得出每个基站的均衡偏差后,依据均衡偏差的大小将所有的基站划分为很闲置,较闲置,正常,繁忙,严重超负荷等5个繁忙指数的区间,并确定每个基站所属的繁忙指数的区间范围。最后,根据给个基站所属繁忙指数区间的情况,将繁忙指数高的基站,即超负荷的基站的工作量分担给周围闲置的工作站,若周围的基站无法为其分担的,则再建一新基站;将繁忙指数很低的基站去除,将其工作量分给周围的基站。另一方面,某些基站可能繁忙指数不高,但是受用人数还是相当多,也体现了其一定的重要性,因此在出现一些闲置的情况下是不能进行拆除的。通过重新分配,使各个基站发能够合理的发挥起作用。4.3.2 问题三结果分析:通过Excel对数据的统计和处理,得到30个基站的繁忙指数划分区间如下:繁忙指数范围等级表示具体意义0-100A很闲置101-200B较闲置201-300C正常301-500D繁忙500以上E严重超负荷其中每个基站所属繁忙指数区间如下表所示:表11 30个基站所属繁忙指数区间统计表基站编号繁忙指数繁忙等级基站编号繁忙指数繁忙等级1 231C16250C251A17134B321A18104B490A1998A59A20150B6103B21140B766A22445D871A23127B9147B24121B10135B25139B11658E2629A12109B27107B13250C28608E1461A29800E15374D30632G图1 各基站使用情况表 图中颜色表示基站繁忙情况,说明如下:浅绿很闲置,鲜绿较闲置,橙色正常,绿色繁忙,深蓝色严重超负荷 通过以上对30个基站繁忙指数的统计与划分,充分直观的体现了基站建设的不合理性。主要问题存在各个基站的使用量不均衡,导致一部分基站严重闲置,例如5,26号基地,工作量几乎接近于0,这种设备过于闲置的现象,会导致设备无法最大程度的发挥其作用,就会造成硬件资源,人力资源的浪费,也会增加公司的费用,但有一部分处于严重的超负荷状态,如11,28,29,30号基站工作量已经超过平均工作量的两倍,这种信息交换过于频繁,就有可能导致信息的堵塞,通信混乱,引起用户对移动公司的不满,而且超负荷的工作量会对硬件的需求,管理技术等就越高,这会造成通信公司的维护费用大大增大,也会提高设备的老化速度。 考虑到每个设备承受的工作量是相同的但每个设备的繁忙指数不同,以每个基站的平均工作量作为衡量该基站建设的是否合理的标准,则根据以上数据可知基站1,13,16设计的比较合理,无需对这些基站进行调整。 因此需要进行调整的是那些超负荷的基站和那些闲置的基站,一般认为在一个地区的工作站量达到均衡的最佳状态,即上图中某些地区的颜色应该趋于同一种颜色。 由以上数据可得到两个高话务区,该地区由基地11,28,29,30组成,其繁忙指数高于600,视为严重超负荷地区,另一个地区是由基地15和22组成,其繁忙指数为350-450之间,视为一般超负荷地区,还有,一个闲置的地区,该地区由基站2,3,4,57,8,14,19,26组成,其繁忙指数低于100。因此在改进的时候需要分别对这三个地区的“问题”基站进行调整,使其达到均衡的最佳状态。 总的来说,该通信公司的基站大部分工作量处于均衡的状态,能够满足服务需求,但是第四类和第五类基站均处于比较严重的超负荷的工作状态,同时,第一类基站处于严重的闲置状态,但其余的大部分基站的建设都处于合理情况,并且没有出现通话拥挤或者比较夸张地不起作用的情况,所以要对有问题的基站建设还有待改善,减轻超负荷的基站的工作量,增加闲置工作站的工作量,使各个工作站都达到均衡的最佳状态。综上,在基站28-29之间应增加一个新的基站31,以缓解基站28和29的工作压力,而对于闲置地区中的基站5,7,19,26拆除,将其工作量分担给周围的基站。其拆除和新建情况见下图:图2 基站调整示意图4.4 问题四的解答尊敬的通讯公司高层领导:通过对该公司30个基站建设合理性的分析后,我们小组为该公司基站的拆除和重建情况提出了方案。由于考虑这种方案的成本较高,对用户的影响较大,又提出改进基站本身的大小的另一种方案。 方案一:对第一地区中的30号基站,其工作量属于超负荷的基站,而且周围基站2,3处于严重的闲置状态,这样的布局不仅使基站30的压力大,服务过于繁忙,基站中的硬件设备的承受能力受到挑战,而且周围基站2,3处于严重的闲置状态,没有发挥其应有的作用,造成了资源的浪费,造成这种现象的原因可能是安排基站时对服务对象的考虑不周,解决这个问题的方法是将基站30的工作量分配给周围的闲置基站2和3,这样既减少了基站30的工作量又使基站2,3充分发挥了其作用。对于基站11,28,29这三个超负荷的基站,他们覆盖的服务区处于城市地带,这些城市的手机用户对通信的要求较高,过多的基站处于超负荷状态很可能会导致基站的系统趋于崩溃,给通信运营带来了风险。而且这三个地区的客户对通话的需求特别的高,所以合理的增加基站是解决客户需求的最迫切的需求,所以建议在基站28,29附近增加一个基站,从而分担这两个基站的工作量,对于基站11,其周围基站14和10处于不同程度的闲置,因此可以将其超额的部分工作两分配到这两个基站里。 对于地区二那些繁忙的基站15和22,这两个基站的工作量超过均衡工作量的一倍左右,而且其周围还有部分比较闲置的基站,为了使各个基站尽量发挥起作用,从而减少高负荷工作量,增加闲置基站的工作量,所以将基站15的工作量部分分配给基站12,将基站22超额的工作量分配给距离较近的基站21和25,从而使各个基站达到均衡的最佳状态。 对于地区三,那些过于闲置的基站,其工作量接近于0,这些地区的信号需求不强,这些基站可能设置在比较偏僻的农村,农村的通话需求比较小,所以可以将其去掉,其工作量由周围的基站承担,这样可以减少公司的费用,也可以节省资源,所以去掉基站5,其工作量由周围闲置的基站4和6,将基站7去掉,由基站8,9 负责其工作量,将基站26去掉,由基站23,24,25三个基站共同承担其工作量,去掉基站19,由基站18,17共同承担起工作量,这样处理减少了资源的浪费,又增加了那些比较闲置工作站的工作量,会减少基站的压力,也可以充分利用现有资源,使通讯运营更加流畅。方案二: 考虑到通讯设施有可能已覆盖整个服务区,去掉任何一个,会导致某个地方的通讯受阻,所以就不能拆除任何一个工作站,只能改变其基站的大小,这样就不会使处于客户高需求的地带的基站工作压力过大,也不会使客户需求低的基站过于闲置。所以本小组建议将繁忙指数高于500的基站(基站11,28,29,30)改成大型基站,减轻其工作压力,防止过多的工作量导致服务繁忙,通讯受阻。将繁忙指数低于100的基站(基站2,3,4,5,7,8,26)改为小型基站,从而减少拆除和新增基站的大量花费,减少公司的支出。对于基站4和基站19,其繁忙指数虽然低于100,但也达到了90以上,为减少改进成本也可考虑不改。其余的繁忙指数在100-500之间的基站,其承载的工作量处于中等或接近中等水平,对于这些基站不做更改。 三个有志青年 *年*月*日5.模型的优缺点及结果分析5.1 模型的优缺点:优点:(1)问题一中,我们使用Kmeans快速聚类,根据不同的数据形式可以自定义的对数据进行分类 (2)结合实际通讯资费标准,做了以分钟为通话时间单位的聚类 (3)聚类中为防止孤立点对分类的影响,将其单独考虑,多次聚类(4)考虑实际经济效益对基站的改进提供了两种改进方案缺点 (1)我们没有把距离较远的客户间打电话的漫游费用考虑进去(2)由于没有实际调查该地区的现状(主要是通信资费和人口密集度等情况),结果可能有一定偏差5.2 改进方向:5.2.1问题一的扩展在此题中给出的通话时间长均是以秒为单位,但无论从经验还是实际情况,我们都能知道移动公司的收费方案均是以分钟计时的。若按分计费则在同一分钟内1秒的收费和60秒的收费是一样的。例如5分零1秒是按照6分钟收费的。而按照秒计算则在同一分钟内1秒的收费和60秒的计费差异则较大。这两种收费方案反应出的消费者通讯情况可能有所差异。因此,为了使数据能更加反应客户通信情况,我们将消费者的通信时长转化为分钟计费下的通信时长再次利用spss对其进行聚类分析。转化方式是将以秒为单位的时间除以60,除出的结果有整数,也有小数。对于整数,考虑为该用户在该次通话中时间掌控的恰到好处,避免了未打满一分钟却要支付一分钟费用的情况。对于小数,我们取上整,即5分零1秒记为6分钟。同问题一,我们首先将300各用户聚为6类,结果第一类中只有7个成员,这些用户时通话次数和时间都明显高于其他用户的特殊几个用户,因此我们将他们单独考虑,进行第二次聚类。第二次聚类中出现了一个几乎不使用移动通讯工具的用户单为一类,我们也讲他单独考虑进行第三次聚类。这三次聚类情况如下表所示: 表11折合为分钟后的三次聚类情况表第一次聚类第二次聚类第三次聚类类别个数类别个数类别个数17131129235212221173753132346341184123567521653最后分类结果如下表所示:表12 折合分钟后的聚类结果表:类别123456主叫次数16.103515.07725.39125.52820.1432被叫次数47.8289.33356.52213.049119.4291主叫时间57.76752.76191.1393.56172.5714被叫时间167.4533.376199.8345.959420.864夜时比例0.10250.11240.1420.12440.12260.75主被比例0.34411.58080.4562.0360.17241人数291172312371通过三次聚类后的情况表可以发现,以秒为单位计算的时间长的聚类结果与以分钟为单位聚类的结果有所差异但又大体相似。相似:第一,两种不同情况聚类的第五类和第六类的通话情况都明显区别于其他用户,通话时间甚多或甚少,但这两种人群都只有极特殊的几个。第二,两种聚类情况,都是以打,接电话次数和时间次数都少,打电话多于接电话的人群(此处第二类对应问题一中的第四类)和打电话的次数与时间多,接电话的次数与时间少的人群(此处的第四类对应问题二中的第三类)占了较大的比例。第三,两种聚类情况中达电话次数和时间较少,接电话次数和时间较多的人群比例与主被之间的比例相当,主动通话时间均是被动通话时间的34%左右区别:以秒为时间单位聚类的结果中的第二类打,接电话的次数和时间都很少,但夜间通话比例相对较大,在所取样本中占57人。而在以分钟为时间单位聚类中夜间通话人群的比例都无明显差别,因此这类人群的一部分被归为了此处的第二类,另一部分派生出新的一类(此处第三类)。这类人群的通话特征是打电话次数和时间多,接电话次数和时间趋于中等水平。综上,无论是以秒为时间单位的聚类还是以分钟为时间单位的聚类均能反应出不同用户的通话特征,这也验证了我们模型的合理性,而且本问中考虑了将用户的夜间通话时间的比例作为通话的一个特征变量,因此选择以秒为时间单位的聚类方式更为合理有效。5.2.2 模型的扩展若能够获知该地区的地理信息及各种通话资费标准则可以考虑漫游资费,并且经统计发现某些用户存在多次通话,使用基站不同的情况。我们可以根据基站的地理信息判断这些用户通话时的漫游情况,同时考虑到长途和漫游情况会使问题更接近于实际。参考文献1.沈恒范,概率论与数理统计教程,高等教育出版社,2006年2.袁新生,LINGO和Excel在数学建模中的应用,北

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论