商务智能实验9报告.doc_第1页
商务智能实验9报告.doc_第2页
商务智能实验9报告.doc_第3页
商务智能实验9报告.doc_第4页
商务智能实验9报告.doc_第5页
已阅读5页,还剩3页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

数据挖掘与商务智能实验实 验 报 告实验题目: 分类分析:决策树 姓名: 王俊 学号: 201430850164 指导教师: 张大斌 实验时间: 2016.11.10 2016年 11 月 12 日 实验9 分析类型:决策树一、 实验目的(1) 了解和熟悉SPSS Modeler及其相关知识;(2) 掌握SPSS Modeler工具建立CHAID决策树的方法;(3) 学会运用SPSS CHAID决策树进行相关的内容分析。二、 实验内容 本实验以电信客户数据(文件名为Telephone.sav)为例,数据中包含的变量x1到x15分别是:居住地、年龄、婚姻情况、家庭月收入(百万)、受教育程度、性别、家庭人数、基本服务累计开通月数、是否申请无线转移服务、上月基本费用、上月限制性免费服务项目的费用、无线服务费用、是否电子支付、客户所申请的服务套餐类型和是否流失。本节的分析是在基本分析的基础上进行的,具体的CHAID算法如下所示:三、 实验步骤与结果 步骤1 创建CHAID数据流 (1)通过“statistic文件”节点读入文件名为Telephone.sav的数据。 (2)数据流中添加“分区”节点,将样本集划分为训练集和测试集,如图9-1所示。 (3)选择建模模块中的“CHAID(C)”节点,将其连接到数据流的恰当位置。步骤2 设置具体参数 (1)右击鼠标,在“构建选项”-“基本(B)”,选择数的生长算法为Exhaustive CHAID。 自定义最大树状图深度为5,如图9-2所示。 (2)其他相关参数默认设置。 步骤3 结果运行 实验结果如图9-3所示。 CHIAID首先确定开通月数为最佳的分组变量,将其分为3组,开通月数小于等于5的,开通月数大于31和开通月数大于5小于30的。按照一层一层进行分组,但很快会发现其中某些推理规则没有太大的参考价值。例如,对于开通月数大于31个月的用户,无论是否采用电子支付方式,年龄如何,婚姻如何,最终的结果都是未流失。这种情况于该算法的剪枝方式有一定的联系。4、 实验分析与扩展练习实验分析:对于CHAID算法,SPSS Modeler如何进行交互方式建模?答:在进行交互建模时候,以下这些参数的调整都会对建模的结果造成一定的影响:A. 数据分区中的训练和测试分区以及设置随机种子B.相关CHAID参数设置中的树生长算法选择和最大树状图深度设置C.相关CHAID参数设置中的成长规则D.相关CHAID参数设置中的整体设置D.相关CHAID参数设置中的高级设置的分割和合并五、结论与讨论(重点)通过这次实验,我总结一下知识点:1.决策树算法的优点如下:(1)分类精度高;(2)生成的模式简单;(3)对噪声数据有很好的健壮性。因而是目前应用最为广泛的归纳推理算法之一,在数据挖掘中受到研究者的广泛关注。 2.CHAID的一般步骤:(1.)属性变量的预处理(2.)确定当前分支变量和分隔值属性变量的预处理:(1)对定类的属性变量,在其多个分类水平中找到对目标变量取值影响不显著的分类,并合并它们; (2)对定距型属性变量,先按分位点分组,然后再合并具有同质性的组;(3)如果目标变量是定类变量,则采用卡方检验(4)如果目标变量为定距变量,则采用F检验每对预测分类的评估,以确定最显著差异的因变量。由于这些合并步骤,通过计算修正邦费罗尼p值来合并交叉表。3.CHAID算法优点:(1)可产生多分枝的决策树(2)目标变量可以定距或定类(3)从

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论