数据仓库与数据挖掘技术第六章决策树.doc_第1页
数据仓库与数据挖掘技术第六章决策树.doc_第2页
数据仓库与数据挖掘技术第六章决策树.doc_第3页
数据仓库与数据挖掘技术第六章决策树.doc_第4页
数据仓库与数据挖掘技术第六章决策树.doc_第5页
已阅读5页,还剩7页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

数据仓库与数据挖掘技术第6章 决策树方法6.1信息论的基本原理6.1.1信息论原理6.1.2互信息的计算1. 定义2. 出现概率3. 条件概率4. 子集概率5. 子集条件概率6. 信息熵7. 互信息6.2常用决策树算法6.2.1ID3算法1. 基本思想图6-1ID3决策树2. 主算法图6-2ID3算法流程3. 建树算法4. 实例计算6.2.2C4.5算法1. 信息增益比例的概念2. 连续属性值的处理3. 未知属性值的处理4. 规则的产生5. 案例计算图6-3天气结点及其分支图6-4C4.5算法形成的决策树6.3决策树剪枝6.3.1先剪枝6.3.2后剪枝6.4由决策树提取分类规则6.4.1获得简单规则图6-5决策树6.4.2精简规则属性6.5利用SQL Server 2005进行决策树挖掘6.5.1数据准备6.5.2挖掘模型设置6.5.3挖掘流程图6-6选择数据挖掘技术图6-7选择数据源视图图6-8指定表类型图6-9指定定型数据图6-10指定列的内容和数据类型图6-11完成数据挖掘结构的创建6.5.4挖掘结果分析图6-12挖掘得到的“次级”决策树图6-13挖掘得到的依赖关系图图6-14“余额”结点的依赖关系图图6-15与“余额”结点链接强度最强结点示意图6.5.5挖掘性能分析图6-16列映射图图6-17属性“次级”的预测提升图习题61. 概率分布0:0625;0:0625;0:125;0:5的熵是多少?2. 汽车保险例子。假定训练数据库具有两个属性: 年龄和汽车的类型。年龄序数分类。汽车类型分类属性。类L: 低(风险),H: 高(风险)。使用ID3算法做出它的决策树。3. 简述ID3和C4.5算法之间的异同。4. 简述决策

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论