




已阅读5页,还剩4页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1 判定树基本观念 2 分类与回归树 CART 分类与回归树 ClassificationAndRegressionTrees CART CART算法是建构判定树时最常用的算法之一 自从1984年布里曼 L Brieman 与其同僚发表这种方法以来 就一直机械学习实验的要素 3 分类与回归树 CART 找出起始的分隔 用来评估一个分隔数的衡量标准是分散度 diversity 对于一组数据的 分散度指标 indexofdiversity 有多种计算方式 不论哪一种 分散度指标很高 表示这个组合中包含平均分配到多个类别 而分散度指标很低则表示一个单一类别的成员居优势 4 分类与回归树 CART 找出起始的分隔 最好的分隔变量是能够降低一个数据组的分散度 而且降得最多 换言之 我们希望以下这个式子最大化 分散度 分隔前 分散度 分隔后左边子集合 分散度 分隔后右边子集合 三分种分散度衡量法 min P c1 P c2 2P c1 P c2 P c1 logP c1 P c2 logP c2 5 分类与回归树 CART 计算每个节点的错误率 每一个叶部如今都分配到一个类别以及一个错误率 回顾前图 图中选取了从根部到标示为 女性 的叶部路径 该节点是一个叶部节点 表示找不到任何分隔变量可以显著的降低其分散性 然而 这并不表示所有祗达这个叶部的资料都属于同一类 使用简单机率的定义 我们可以看到11个叶部中有9个是正确分类 这告诉我们 以这个训练组而言 抵达这个节点的资料是女性的机率为0 818 相对的 这个叶部的错误率1 0 818就是0 812 6 分类与回归树 CART 计算整个判定树的错误率 整个判定树的错误率是所有叶部错误率的加权总数 每一个叶部的错误率乘上数据抵达叶部的机率 分配到资料的比例 加起来的总数就是整个判定树的错误率 7 分类与回归树 CART 8 分类与回归树 CART 9 分类与回归树 CART 将代价列入考虑 我们讨论至此 只使用错误率作为评估一个分支树良莠的依据 然而 在许多应用上 错误分类的代价依数据类别不同而有异 当然在医疗诊断上 一个错误的阴性诊断 negative 也许会比错误的阳性诊断 positive 伤害更大 在进行癌症抹片检查时 误诊为性也许只会带来更多的检查 但误诊为阴性却
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 建筑轻质材料成本效益比研究报告
- 制定企业员工福利方案操作指南
- 客餐厅水电施工方案模板
- 陶瓷认证企业案例分析报告
- 物流企业仓储管理规范与优化方案
- 教培妇女节营销方案
- 2024版小学六年级语文期中考试模拟试卷
- 酒店客户关系管理系统建设方案
- 初一数学期末复习题集与解析
- 农业企业团建活动策划方案
- (高清版)DB12∕T 934-2020 公路工程资料管理技术规程
- 深度解析Palantir介绍
- 木方回收合同6篇
- 《探寻抗日战争历史》课件
- 2025年第三届药膳大赛(选拔赛)理论知识考试题(附答案)
- 玻璃幕墙维修保养施工方案
- 亲子关系断绝协议书范文模板
- 包装行业安全防范总结
- 临床骨筋膜室综合征护理业务学习
- 2025年南充房地产市场分析报告
- 午托机构安全协议书
评论
0/150
提交评论