已阅读5页,还剩7页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
数据仓库与数据挖掘技术第6章 决策树方法6.1信息论的基本原理6.1.1信息论原理6.1.2互信息的计算1. 定义2. 出现概率3. 条件概率4. 子集概率5. 子集条件概率6. 信息熵7. 互信息6.2常用决策树算法6.2.1ID3算法1. 基本思想图6-1ID3决策树2. 主算法图6-2ID3算法流程3. 建树算法4. 实例计算6.2.2C4.5算法1. 信息增益比例的概念2. 连续属性值的处理3. 未知属性值的处理4. 规则的产生5. 案例计算图6-3天气结点及其分支图6-4C4.5算法形成的决策树6.3决策树剪枝6.3.1先剪枝6.3.2后剪枝6.4由决策树提取分类规则6.4.1获得简单规则图6-5决策树6.4.2精简规则属性6.5利用SQL Server 2005进行决策树挖掘6.5.1数据准备6.5.2挖掘模型设置6.5.3挖掘流程图6-6选择数据挖掘技术图6-7选择数据源视图图6-8指定表类型图6-9指定定型数据图6-10指定列的内容和数据类型图6-11完成数据挖掘结构的创建6.5.4挖掘结果分析图6-12挖掘得到的“次级”决策树图6-13挖掘得到的依赖关系图图6-14“余额”结点的依赖关系图图6-15与“余额”结点链接强度最强结点示意图6.5.5挖掘性能分析图6-16列映射图图6-17属性“次级”的预测提升图习题61. 概率分布0:0625;0:0625;0:125;0:5的熵是多少?2. 汽车保险例子。假定训练数据库具有两个属性: 年龄和汽车的类型。年龄序数分类。汽车类型分类属性。类L: 低(风险),H: 高(风险)。使用ID3算法做出它的决策树。3. 简述ID3和C4.5算法之间的异同。4. 简述决策
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 小学二年级数学100以内三数加减混合运算能力测验训练题
- 小学喜报文字模板 范文大全
- 2023年养老院管理制度培训(五篇)
- 2024年03月江苏无锡商业职业技术学院招考聘用高层次人才44人笔试参考题库后附答案详解
- 2024年03月安徽省直事业单位2024年度统一笔试公开招考1487名工作人员笔试参考题库附带答案详解
- 2024年03月四川省泸州市纳溪区2024年上半年事业单位公开考试招考47名工作人员笔试参考题库附带答案详解
- 2024年03月全国工商联直属单位2024年度面向社会公开招考4名工作人员笔试参考题库附带答案详解
- 2024年02月陕西省延安市事业单位2024年公开招考(募)414名工作人员笔试参考题库附带答案详解
- 2024年02月福建省连江县2024年公开招聘170名参聘教师1253笔试参考题库后附答案详解
- 2024年02月湖北省黄冈市市直事业单位2024年统一公开招聘64名工作人员笔试参考题库后附答案详解
- 小学数学五年级下册第二单元《长方体(一)》作业设计
- 高建华惠普的战略规划十步法课件
- 坏账准备计提比例规定及账务处理
- 海洋生态系统服务功能评估-第1篇
- 如何提升家宽装维满意度
- 银行机构金融消费权益保护知识培训课件
- 公司人员结构分析报告
- 交通运输年终工作总结汇报
- 加速康复外科中国专家共识及路径管理指南
- 幼儿园科学活动区角设计
- 电瓶车棚改造方案
评论
0/150
提交评论