




已阅读5页,还剩7页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
数据挖掘实验报告数据挖掘实验报告 姓名 段雯娟姓名 段雯娟 学号 学号 专业 会计学专业 会计学 一 实验目的一 实验目的 1 学习和了解数据挖掘的基础知识 学会使用 SPSS Clementine11 1 软件 进行数据挖掘分析 2 使用软件利用多项 Logistic 回归对电信业客户数据进行分析 找出电信 服务使用模式和客户个人特征之间的关系 为单个预期客户定制服务使用模式 3 掌握数据挖掘过程的一般流程 二 实验环境二 实验环境 系统环境 Windows 7 软件环境 SPSS Clementine11 1 软件简介 作为一个数据挖掘平台 Clementine 结合商业技术可以快速建 立预测性模型 进而应用到商业活动中 帮助人们改进决策过程 强大的数据 挖掘功能和显著的投资回报率使得 Clementine 在业界久负盛誉 同那些仅仅着 重于模型的外在表现而忽略了数据挖掘在整个业务流程中的应用价值的其它数 据挖掘工具相比 Clementine 其功能强大的数据挖掘算法 使数据挖掘贯穿业 务流程的始终 在缩短投资回报周期的同时极大提高了投资回报率 三 实验数据三 实验数据 本实验所采用的数据是电信客户资料记录 名为 telco sav 的数据 该数据 包含 11 个字段 1000 条记录 这些字段是 region 地区 age 年龄 marital 婚姻状况 address 地址 income 收入 ed 教育程度 employ 行业 retire 退休 gender 性别 reside 居住地 和 custcat 客户类别 其中客户类别中 1 代表基本服务 2 代表电子服务 3 代 表附加服务 4 代表全套服务 四 实验步骤与分析过程四 实验步骤与分析过程 1 从数据源中选择 SPSS 文件 拖入工作框 如图 1 然后编辑附加数据 如图 2 图 1 图 2 2 添加 类型 节点 如图 3 并对节点进行编辑 如图 4 将值为 0 和 1 的 变量设为标志字段 但是性别设为集合字段 将客户类别字段的方向设置为输 出 其他字段的方向都设为输入 图 3 图 4 3 添加过滤节点 如图 5 并对其进行编辑 选取所需要的字段 region age marital address income ed employ retire gender reside c ustcat 将其他字段过滤掉 如图 6 图 5 图 6 4 添加 Logistic 节点进行建模 如图 7 并对节点进行编辑 如图 8 9 10 图 7 图 8 图 9 图 10 5 执行当前流 如图 11 该模型 custcat 就会添加到右边的模型选项板中 如 图 12 图 11 图 12 6 浏览生成的模型 结果如图 13 14 15 16 17 18 所示 图 13 说明 1 基本服务为参照类 结果包括 3 个回归方程 2 1 0 04901 0 1477 0 02635 0 6764 4 0 9709 3 1 508 2 2 17 1 0 03685 1 3 1 1 551 0 08447 0 05133 0 4647 4 0 6729 3 0 7185 2 0 5556 1 0 02157 2 4 1 0 1806 0 2576 0 0424 0 5843 4 1 453 3 1 959 2 3 762 1 0 02184 3 其中 分别表示选择基本服务 电子服务 附加服务 全套 1 2 3 4 服务的概率 表示选择电子服务概率与选择基本服务概率之比的自然对数 2 1 从方程中可以看出 选择电子服务概率与选择基本服务概率之比的自然对数 选择附加服务概率与选择基本服务概率之比的自然对数 选择全套服务概率与 选择基本服务概率之比的自然对数都与 address 地址 employ 行业 reside 居住地 成正比 选择电子服务概率与选择基本服务概率之比的自然对 数 选择全套服务概率与选择基本服务概率之比的自然对数与教育各个等级都 成反向关系 且教育水平越高 对它们的影响越小 选择附加服务概率与选择 基本服务概率之比的自然对数则与教育各个等级成正向关系 图 13 图 14 图 15 图 14 和 15 是各个字段的统计变量 总共有 1000 组数据 图 16 图 16 中的显著水平都小于 0 05 说明四个变量与因变量的线性关系是显著 的 因此模型可用 图 17 图 17 中似然比检验的显著水平小于 0 05 说明模型的拟合优度较好 图 18 图 18 是模型的错判矩阵 说明对实际使用基本服务的客户的预测的正确率 是 45 9 对实际使用电子服务的客户的预测的正确率是 4 6 对实际使用附 加服务的客户的预测的正确率是 47 3 对实际使用全套服务的客户的预测的 正确率是 56 8 模型总的预测正确率为 39 9 说明模型在识别全套服务客 户时表现优异 而在识别电子服务客户时表现很差 如果想提高预测电子服务 中客户的准确性 可能需要再找到一个预测变量来识别此类客户 如果电信
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 吉林省江源县2025年上半年公开招聘辅警试题含答案分析
- 湖南省澧县2025年上半年公开招聘辅警试题含答案分析
- 黑龙江省肇源县2025年上半年公开招聘辅警试题含答案分析
- 福建省闽清县2025年上半年公开招聘辅警试题含答案分析
- 江西省修水县2025年上半年公开招聘辅警试题含答案分析
- 安徽省庐江县2025年上半年公开招聘辅警试题含答案分析
- 关于家乡环保状况的社会调查报告
- 妇科医学科普课件
- 湖南省永州市一中2025-2026学年高三上学期开学检测语文试题(解析版)
- 二零二五年绿色酒店特色餐饮项目承包合同
- 2025年度运输业安全生产知识竞赛试题(附答案)
- 光伏居间的合同8篇
- GB/T 45418-2025配电网通用技术导则
- 医疗风险防控培训课件
- 机械设计部绩效考核制度
- 诊疗规范培训课件
- 《KANO模型培训》课件
- 复苏室患者的交接流程
- DB21-T 2523-2015矿山地质环境恢复治理规程
- 新能源集控中心建设方案
- 《中国老年糖尿病诊疗指南(2024版)》解读课件
评论
0/150
提交评论