版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、统计分析、数据挖掘与商业智能应用研究小组统计分析、数据挖掘与商业智能应用研究小组判别分析判别分析 discriminant 报告人:解明明报告人:解明明指导教师指导教师:谢邦昌谢邦昌日期:日期:2007年年11月月统计分析、数据挖掘与商业智能应用研究小组统计分析、数据挖掘与商业智能应用研究小组主要内容主要内容判别分析介绍判别分析介绍fisher判别判别bayes判别判别逐步判别逐步判别案例分析案例分析统计分析、数据挖掘与商业智能应用研究小组统计分析、数据挖掘与商业智能应用研究小组判别分析介绍判别分析介绍 判别分析是指对分类因变量的建模,依据是因变量与一个或多个解释变量的关系。 主要目的是识别一
2、个个体所属的类别。统计分析、数据挖掘与商业智能应用研究小组统计分析、数据挖掘与商业智能应用研究小组模型的假设模型的假设 判别分析模型有如下的假设: l如果假设满足,尤其是在样本量比较小的情况下,clementine能给出更好的结果。 解释变量间不存在多重共线性。解释变量间不存在多重共线性。 对于一个解释变量其均值和方差不相关。对于一个解释变量其均值和方差不相关。 在不同组间两个变量的相关系数是不变的。在不同组间两个变量的相关系数是不变的。 每一个解释变量的值服从正态分布。每一个解释变量的值服从正态分布。统计分析、数据挖掘与商业智能应用研究小组统计分析、数据挖掘与商业智能应用研究小组fisher
3、判别-4-20246-4-3-2-10123fisher判别的思想是投影,将k组p维数投影到某一个方向,使得他们的投影组与组之间尽可能的分开。统计分析、数据挖掘与商业智能应用研究小组统计分析、数据挖掘与商业智能应用研究小组bayes判别bayes判别的统计思想是:假定对研究的对象已有一定的认识,常用先验概率分布来描述这种认识,然后我们取得一个样本,用样本来修正已有的知识(先验概率分布),得到后验概率分布,各种统计推断都通过后验概率分布来进行。将这种思想用于判别分析,就得到贝页斯判别。统计分析、数据挖掘与商业智能应用研究小组统计分析、数据挖掘与商业智能应用研究小组案例分析 假设有一个电信供应商已
4、经根据客户业假设有一个电信供应商已经根据客户业务的使用情况将他们分为了四个组别。务的使用情况将他们分为了四个组别。如果人口统计学数据可以用来预测客户如果人口统计学数据可以用来预测客户的组别的话,我们就可以为潜在的客户的组别的话,我们就可以为潜在的客户定制用户化的服务。定制用户化的服务。统计分析、数据挖掘与商业智能应用研究小组统计分析、数据挖掘与商业智能应用研究小组 这四个组别分别为这四个组别分别为:统计分析、数据挖掘与商业智能应用研究小组统计分析、数据挖掘与商业智能应用研究小组 双击来源选项板(双击来源选项板(sourcessources)中的)中的spssspss节节点,数据流区域即可出现点
5、,数据流区域即可出现spssspss节点节点。统计分析、数据挖掘与商业智能应用研究小组统计分析、数据挖掘与商业智能应用研究小组 数据流区域(数据流区域(stream canvasstream canvas)中双击)中双击spssspss节点,在节点,在import file import file 中选择我们中选择我们所要分析的数据。所要分析的数据。统计分析、数据挖掘与商业智能应用研究小组统计分析、数据挖掘与商业智能应用研究小组 在收藏夹(favorites)选项板或字段操作选项板(field ops)中双击类型(type)节点,来检查是否所有的变量的类型都被正确的定义。统计分析、数据挖掘与商
6、业智能应用研究小组统计分析、数据挖掘与商业智能应用研究小组 由于由于custcatcustcat是我们要预测的变量,在方是我们要预测的变量,在方向(向(directiondirection)里我们选为输出()里我们选为输出(outout)统计分析、数据挖掘与商业智能应用研究小组统计分析、数据挖掘与商业智能应用研究小组 由于本案例关注的是人口统计学变量,所以我们增加一个过滤(filter)节点,单击annotations将其重命名。统计分析、数据挖掘与商业智能应用研究小组统计分析、数据挖掘与商业智能应用研究小组 根据分析目的,我们只选择region, age, marital, address,
7、 income, ed, employ, retire, gender, reside和 custcat这几个变量。统计分析、数据挖掘与商业智能应用研究小组统计分析、数据挖掘与商业智能应用研究小组 从模型选项(modeling)加入判别分析(dicriminant)的节点。并在annotations中改名为“判别分析”。统计分析、数据挖掘与商业智能应用研究小组统计分析、数据挖掘与商业智能应用研究小组 在判别分析中点模型键(model),并在方法(method)中选逐步判别(stepwise)。统计分析、数据挖掘与商业智能应用研究小组统计分析、数据挖掘与商业智能应用研究小组 在专家(expert
8、)键中,选择expert,单击输出(output),选择如左图所示的选项。统计分析、数据挖掘与商业智能应用研究小组统计分析、数据挖掘与商业智能应用研究小组 选择执行(选择执行(executeexecute)后,在右上角点)后,在右上角点models,models,双击双击custatcustat,在数据流区域变出,在数据流区域变出现改节点,双击改节点便可以查看结果。现改节点,双击改节点便可以查看结果。统计分析、数据挖掘与商业智能应用研究小组统计分析、数据挖掘与商业智能应用研究小组 这张表格展示了逐步判别中每次进入分析的变量,可见最后模型只选择了3个变量。统计分析、数据挖掘与商业智能应用研究小组
9、统计分析、数据挖掘与商业智能应用研究小组 逐步判别可以自动帮我们选择变量。但逐步判别可以自动帮我们选择变量。但是如果我们对于数据有一定的经验知道是如果我们对于数据有一定的经验知道哪些变量是重要的,选择逐步判别就是哪些变量是重要的,选择逐步判别就是很不明智的,因为这样选出来的变量可很不明智的,因为这样选出来的变量可能除了统计意义外,没有任何的实际意能除了统计意义外,没有任何的实际意义。义。统计分析、数据挖掘与商业智能应用研究小组统计分析、数据挖掘与商业智能应用研究小组由右边第一张表可见前两个线性判别函数可以解释大部分的变异第二张表是四个组标准化后均值的位置。统计分析、数据挖掘与商业智能应用研究小组统计分析、数据挖掘与商业智能应用研究小组 右表为标右表为标准化的典准化的典型判别函型判别函数的系数。数的系数。统计分析、数据挖掘与商业智能应用研究小组统计分析、数据挖掘与商业智能应用研究小组 右图是右图是输出的输出的领域图。领域图。它给出它给出了预测了预测变量和变量和组别间组别间的关系。的关系。统计分析、数据挖掘与商业智能应用研究小组统计分析、数据挖掘与商业智能
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 护理核心制度要点精讲
- 2026年大学大一(经济学基础实训)弹性理论应用阶段测试试题及答案
- 2026年大学大一(机械电子工程)机电系统故障诊断阶段测试题及答案
- 摄像岗位方向分析
- 急诊科护理急救技能培训与演练
- 房颤患者护理沟通技巧
- 护理团队沟通:建立有效桥梁
- 护理礼仪与医院文化
- 护理管理学自考应试技巧
- 护理学导论护理沟通技巧
- 反歧视艾滋病培训
- 膈下脓肿护理查房
- 《形象塑造》课件
- 渠道开发与维护课件
- 养老行业从业人员健康管理制度
- Unit 3 On the Move单词讲解 课件高中英语外研版(2019)必修第二册
- 养鹅专业技术工作总结报告
- 20S121生活热水加热机组(热水机组选用与安装)
- 小班数学活动《宝宝送物品》课件
- (高清版)DZT 0388-2021 矿区地下水监测规范
- 《护理疑难病例讨论》课件
评论
0/150
提交评论