




全文预览已结束
下载本文档
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
给大家拜个晚年!这年也过完了,又要开始工作了!本想春节期间写写博客,但不忍心看到那么多的祝福被顶下去,过节就过个痛快的节日,不写了!直接上开心网,结果开了个“老友面馆”都经营到18级了!还是蛮开心的,但是我决定了从今天开始就不再玩了!今天我们来说说分类决策树的应用和操作!主要包括CHAID&CRT,是非常好用和有价值的多变量分析技术, CHAIDChi-squared Automatic Interaction Detector卡方自交互侦测决策树 CRTClassification Regression Tree分类回归树; CHAID和CART是最有名的分类树方法,主要用于预测和分类。在市场研究中经常用于市场细分和客户促销研究,属于监督类分析技术。其中,树根节点是独立变量-因变量,例如:使用水平、购买倾向、用户或非用户、客户类型、套餐类别、细分类别等。子节点基于独立变量和其他分类变量(父节点),按照卡方显著性不断划分或组合为树状结构。预测变量一般也是非数量型的分类变量。 CHAID最常用,但独立变量只能是分类变量,也就是离散性的,CRT可以处理数量型变量,有时候二者结合使用。CHAID和CRT都可以处理非数量型和定序性变量。 分类树方法产生真实的细分类别,这种类是基于一个独立变量得到的一种规则和细分市场。也就是说,每一个树叶都是一个细分市场。 下面我们通过一个案例来操作SPSS软件的分类决策树模块 假设我们有一个移动业务数据,包含有客户的性别、年龄、语音费用、数据费用、客户等级、支付方式和促销套餐变量。我们现在期望能够得到针对不同的促销套餐来分析“客户画像”,这样有利于针对性的促销!也就是不同套餐客户特征描述! 因变量是促销套餐,其它是预测变量或自变量! 我们看到,首先要求我们定义变量的测量等级并定义好变量变标和值标!因为,CHAID和CRT具有智能特性,也就是自交互检验和自回归能力,所以对变量测量尺度要求严格! 为什么说变量测量等级重要呢?例如,我们有个变量叫学历(1-初中、2-高中、3-大专、4-本科、5-硕士以上),如果我们设定为定序变量,则决策树可以自动组合分类,但无论如何都是顺序组合,也就是说可能(1-初中、2-高中、3-大专)为一类,(4-本科、5-硕士以上)为一类,但绝对不会把1和5合并一类;如果我们定义为名义变量,则可以任意学历组合为某类了! 基本原理:基于目标变量(独立变量)自我分层的树状结构,根结点是因变量,预测变量根据卡方显著性程度不断自动生成父节点和子节点,卡方显著性越高,越先成为预测根结点的变量,程序自动归并预测变量的不同类,使之成为卡方显著性。程序根据预先设定的树状水平数停止。最后每一个叶结点就是一个细分市场。当预测变量较多且都是分类变量时,CHAID分类最适宜。 预测变量大部分都是人口统计资料,使研究者很快就可以找出不同细分市场特征。传统的交互分析对多维交叉表和归并类是一项繁重的工作。 首先,我们确定因变量后,放入其它自变量。接下来,我们要选择CHAID的验证和条件参数!一般来讲:我们主要设定父节点和子节点的数量,以及规定树状结构的水平数,如何生长!分类树将根据设定参数决定树的增长和停止!通常,我们考察总的样本量大小,父节点是子节点的两倍,当然如果设定的太小,树会非常茂盛,得到很多非常小的细分市场,可能没有实际营销意义!树的水平数也是同样道理!其它还有很多参数可以设定,比如分割样本,错误分类成本,利润等,分类决策树可以直接输出结果和SPSS语法或SQL语法规则!(略)因为树比较大,看不清楚,我们需要在树查看器中分析!从查看器中我们可以看到,客户等级最显著,也最重要,首先跑上来!针对低端客户,账单支付方式重要,对于预付话费的人来讲,数据业务小于50.73的主要是Y类套餐!这样我们就可以看到这个类别的特征了!最后的分类预测正确分类84.4%。下面是生成的SQL语法规则:UPDATE SET nod_001 = 4, pre_001 = 5, prb_001 = 0.974026 WHERE (客户等级 IS NULL) OR 客户等级 2 AND 客户等级 3)
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 汇丰银行AI面试题库:金融科技领域求职必 备
- 2025质量管理体系注册审核员题库(附含参考答案)
- 国有企业干部岗位选拔面试题库
- 检维修安全培训考试及答案
- 逻辑学考题及答案
- 高级编程技能必 备面试题与答案解析
- 面试经验分享:新兴事务面试题与解答
- 校园职场成长路:职业领域新面试题解答
- 职场竞争力提升之路:解读面试题目的精神内涵与实践方法
- 银行慰问发言稿
- 2025反洗钱知识试题题库及参考答案
- 百级无尘室管理办法
- 糖尿病专科护士培训大纲
- 泪道阻塞的护理教学查房
- 铁路四电工程课件
- 初中数学“大单元整合教学”策略的思考论文
- 演艺管理专业考试2025年试卷及答案
- 高标准农田建设改造提升项目初步设计
- 肾积水伴输尿管结石护理常规
- 电仪考试试题及答案简单
- 2024年 浙江省公务员考试行测真题试题含答案
评论
0/150
提交评论