版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
人工智能技术与应用9.决策树课程概况—基本情况PART01决策树算法决策树的概念树的组成衡量标准决策树的概念决策树(DecisionTree)的概念:树模型(
tree):
决策树:从根节点开始一步步走到叶子节点(决策)所有的数据最终都会落到叶子节点,既可以做分类也可以做回归。谁爱玩电脑游戏:
先按年龄分,再按照性别分
先找分类性强的特征
怎么选择分类的特征树的组成树的组成:根节点:第一个选择的节点非叶子节点与分支:中间过程叶子节点:最终的决策结果分类问题中决策树的叶子节点是类别,其它节点是属性。树的组成决策树的训练与测试算法训练阶段:
从给定的训练集构造一棵树。从根节点开设选择特征,如何进行特征切分测试阶段:
根据构造的树模型,从上到下,把数据输入执行一遍难点:一旦构造好了决策树,那么分类或者预测任务就很简单了,只需要走一遍就可以了,那么难点就在于如何构造出来一颗树,这就没那么容易了,需要考虑的问题还有很多。树的组成如何切分节点(选择节点)问题:
根节点的选择该用那个特征,如何切分缺点:我们的目标应该是根节点就像一个老大似的能更好的切分数据(分类的效果更好),根节点下面的节点自然就是二当家了。复杂度与样本呈线性关系:
每次更新质心需要和每个样本点进行计算目标:
通过一种衡量标准,来计算通过不同特征进行分支选择后的分类情况,找出来最好的那个当成根节点,以此类推。衡量标准衡量标准-信息熵节点选择的标准右图有两个分类结果,第一个结果明显要好于第二结果,直观的表述就是第一个分类很”纯,蓝色和黄色点直接分成了两类,第二种分类很乱,蓝色的点和黄色的点混杂在一起。信息熵表述(样本集合)”乱”和”纯”的程度,数据”乱”包含的数据信息要
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 26年非霍奇金淋巴瘤基因检测实操
- 口才教育教案
- 教育技术发展与应用概述
- 文化商业空间设计
- 工作检讨流程
- 少儿茶之源启蒙文化课
- 健康护理教育
- 2026儿科水痘护理查房解读
- 民宿设计策略
- 风湿免疫科硬皮病皮肤护理建议
- 腹腔镜食管裂孔疝修补术七步法 2025解读
- 2024-2025学年广东省广州市海珠区六年级下册期末语文检测试题(部编版)附答案
- 港口防台风安全知识培训课件
- 山东科技大学《概率论与数理统计》2024-2025学年第一学期期末试卷
- GB/T 755-2025旋转电机定额与性能
- 贵州省六盘水市2024-2025学年高一下学期期末质量监测物理试卷(PDF版无答案)
- 银行案件防控培训资料
- 智联招聘测评题库及答案
- 物业sop管理制度
- (完整版)钢结构厂房施工组织设计(含土建)
- CJ/T 107-2013城市公共汽、电车候车亭
评论
0/150
提交评论