下载本文档
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、一、假如你是某移动运营商的数据分析师,结介用戸通话行为数据,通过数据分析 为用户推荐相应套餐或者结合用户现有套餐优化套餐,提供个性化套餐,从而对客户进 行精准营销,增加客户粘性。运营商收集到的数据包含下列字段;变量名称变量标签Customer_ID用户编号Peak_mins工作日上班时间电话时长OffPeak_mins工作日下班时间电话时长Weekend_mins周末电话时长International_mins国际电话时长Total_mins总通话时长average_mins平均每次通话时长根据客户行为数拯,进行数据的预处理(可以自行根据现有变量构造新变量进行分 析),预处理之后选择适合变量进
2、行分析,分析算法自行选择,写出分析思路和过程, 通过数据分析对客户进行细分,并为运营商提供客户精准营销的相关建议。(请写出分 析的流程并刻画最后细分之后的客户的特点和相应的营销建议)。K-Means拯类的步骤:1. 确泄所有聚类变量(聚类因子):2. 数据预处理(分类变量数值化、处理缺失值、分析是否存在共线性等,若 只有两个变量共线则用比值法,较多变量共线用主成分分析进行降维);3. 确定聚类个数并用处理后的聚类因子进行聚类分析(若未说明则需要尝试 不同的聚类个数3, 4, 5, 6, 7,从中选择平均轮廓系数较大且结果易于分析解 释的模型);4. 分析聚类效果和聚类结果(类中心点和每个类等)
3、:5. 结合实际情况分析每类的意义等。(聚类分析处理共线性时不能宜接删除,可用比值替代或主成分分析等来消除共线性)案例分析:观察数据类型,检査数据是否具有缺失值。数据类型为数值型.原始数据没有缺失值。我们把数据导入DATAHOOP平台,在展示分析中进行异常值分析。分析结果如下表:Peak_minsOffPeak_minsWeekend_mins上四分 位1382. 1426. 82574.875中间值1030. 2274. 0544.4下四分 位700.2154. 42525. 05异常值 个数655International_ minsTotal_minsaverage_mins上四分 位3
4、89. 031781. 34.2075中间值294.0751370. 852. 73下四分 位221. 22751094. 9252. 1异常值 个数131136由上面可以得到异常值的个最多的具有36个,在数据总体样本中占比比较大。所以不处理异常值,这些异常值有可能是数据中一些特殊的类。进行相关系数矩阵分析,分析得到的相关系数矩阵如下:Pe ak_min sOffPeak_minsWeekend_minsInternat ional_minsTo tal_mi nsaverage_minsPeak_mins10. 1210. 14480. 691509115-o.o367OffPeak. mi
5、ns012110. 02170. 262041250. 0094Weekend, mins014480. 024710. 128202006-0. 1066Internat ional mins069150. 2620. 1282107123-o.o34Total_mins094150. 44250. 20060. 71231-o.o364average_ mins_0“03670. 0094-0. 1066-0 034_0.03641观察相关系数矩阵中有一个相关系数为0. 9415,该系数比较大。所以我们要处理,我们用比值替换法(把两个变虽做比,得到的比值替换其中的一个变量)。我们在数据中重
6、新Peak mins插入一列为議方丽得到他们的变量比值,替换Peak.mins变量。得到新的变量,我们把新的数据导入DATAHOOP中求出相关系数矩阵:OffPeak_minsWee kend_mi nsIntern ational_mi nsTo tal_mi nsave rage_mi nsPeak_mins/TotalminsOffPeak. mins10.02470. 262044250.0091-0.4771Weekend. mins0.024710. 128202006-o.10660.0079Internat ional mins0.2620. 1282107123_00340.
7、3939Total_mins0.44250.20060. 71231_003640. 4492average mins0.0091-o.1066-0 034-o 036410. 0116Peak_min s/Total mins-o.17710.00790. 3939044920.01161得到的相关系数矩阵中的相关系数没有大于0.85,所以解决了共线性。我们可以直接 进行K-Means聚类。聚类的参数在有聚类的个数为5,进行标准化,初始中心点选择的次数 要大,最大迭代次数也要大。然后进行K-Means聚类,运行结果如下:平均轮廊系数:0. 2467该平均轮廊系数是比较小,平均轮廓系数越接近于
8、1越好。实际案例里而我们有可能我 们得不到太大的轮廓系数,聚类效果是不明显。聚类不是太明显,但聚类是有区别的。我们 研究该聚类的区别。类 别类中心点坐标样 本个数0-06972-0.00146-0. 10973-o.o8154-0. 159090. 7866691910. 46-0.01.431. 29-o.o0.4789196497189653804435232552-o.o-0.5-0.5-0.4364-0. 1183111675393887125248071630. 720. 23-0.2-0. 1-0. 1-0.8175108178375106895918273017A-13-0.9-
9、21-2.3-0.4-1.825470568922298705092630152我们得到上面表格的类中心点坐标是经过我们标准化的,我们还原成原来的数据。得到原始的分类,然后求每一类的平均值,总结如下表:Peak.minsOffPeak. minsTeekend_ minsInterna*ional_minsTotal_minsaveragemin30106S.376300. 131753. 96551315. 54131122. 4733. 59957911305.872319. 061157. 77315366. 63261712.7063. 59213721078.467300. 9101
10、52. 69453314. 9911132.1024. 00S1223106S.291300. 633953. 96811315. 95931122. 8933. 602067452.695239. 37S6118. 2343215.56027110. 30812. 785261对类进行特征分析:0类:总通话(Total mins)较长,卜-班通话时间(Offpeak mins)最长,上班通话时 间(Peak mins)比较长,命名为中端客户:1类:总通话(Total mins)长,上班通话时间(Peakmins)长,周末通话时间(Weekend mins)较长,国际通话时间(International mins)长,命名为髙端用户;2类:总通话(Total mins)较长,上班通话时间(Peak mins)仅次于第一类,周末 通话时间(Weekend mins)居中,国际通话时间(International m
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 沥青购销合同
- 购买商品合同
- 2026年吉林铁道职业技术学院单招职业倾向性考试题库必考题
- 消防器械考试题目及答案
- 2025-2030民办儿童哲学课程市场启蒙需求分析及对话式教学与教师培养机制报告
- 2025-2030民办云计算培训市场现状及发展路径分析报告
- 2025-2030民办中小学课后服务行业发展趋势与风险评估报告
- 2025-2030民办中小学校运营成本与收益平衡研究报告
- 2025-2030民办中小学教育行业轻量化扩张模式与区域布局策略报告
- 2025-2030民办中小学国际交流项目运营效果评估报告
- 甘肃新媒体管理办法
- 智慧ICU建设与配置全流程标准(2024版)
- 机动车辆合格证管理办法
- 心源性猝死死亡病例讨论
- 心理宣教活动方案
- 高级餐厅大堂经理职务聘任合同范本
- IATF16949内审员培训资料
- 美团公司人事管理制度
- 设备缺陷闭环管理制度
- 2025至2030年中国眼部护理行业市场发展态势及未来趋势研判报告
- 生产线平衡法应用培训
评论
0/150
提交评论