2.3 使用决策树进行分类教学设计高中信息技术人教中图版2019选修4 人工智能初步-人教中图版2019_第1页
2.3 使用决策树进行分类教学设计高中信息技术人教中图版2019选修4 人工智能初步-人教中图版2019_第2页
2.3 使用决策树进行分类教学设计高中信息技术人教中图版2019选修4 人工智能初步-人教中图版2019_第3页
2.3 使用决策树进行分类教学设计高中信息技术人教中图版2019选修4 人工智能初步-人教中图版2019_第4页
2.3 使用决策树进行分类教学设计高中信息技术人教中图版2019选修4 人工智能初步-人教中图版2019_第5页
全文预览已结束

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

2.3使用决策树进行分类教学设计高中信息技术人教中图版2019选修4人工智能初步-人教中图版2019设计意图一、设计意图紧扣课本决策树分类核心内容,通过生活实例(如垃圾分类、疾病诊断)引入,帮助学生理解分类问题本质;引导学生经历“特征选择—节点划分—决策路径”的构建过程,掌握决策树的基本原理与应用方法;结合课本案例,培养学生逻辑推理与数据分析能力,体会人工智能解决实际问题的价值,符合高中生认知水平与学科核心素养要求。核心素养目标分析二、核心素养目标分析培养学生信息意识,感知分类问题中的信息价值,理解决策树工具的应用场景;发展计算思维,通过特征选择、节点划分等过程,掌握抽象建模与算法设计方法;提升数字化学习与创新,运用课本案例实践决策树构建,解决实际问题;树立信息社会责任,体会分类技术的应用价值与伦理影响,形成负责任态度。重点难点及解决办法三、重点难点及解决办法重点:决策树核心概念、构建步骤(特征选择—节点划分—决策路径)及分类原理,源于课本对决策树定义与流程的明确要求;难点:特征选择标准(如信息增益)的理解与应用逻辑,源于学生抽象思维不足。解决方法:通过课本“动物分类”案例简化特征选择,用流程图可视化构建过程;小组合作完成课本“疾病诊断”决策树实践,结合讨论突破难点,强化逻辑应用。教学资源准备1.教材:确保每位学生备有《人工智能初步》(人教中图版2019选修4)教材,重点研读2.3节内容。

2.辅助材料:准备决策树构建流程图、课本“动物分类”“疾病诊断”案例图片及决策树动态演示视频。

3.实验器材:配置计算机教室,安装Python(含Scikit-learn库)或Excel等决策树构建工具。

4.教室布置:设置分组讨论区,配备白板或互动屏,便于小组协作绘制决策树草图。教学实施过程1.课前自主探索

教师活动:发布预习资料(课本2.3节决策树定义、动物分类案例),设计问题“决策树如何实现分类?”“案例中如何选择第一个特征?”。监控学生提交的预习笔记(如对“信息增益”的疑问)。

学生活动:阅读教材,标记特征选择步骤,提交思维导图(梳理决策树基本结构)及疑问(如“信息增益如何计算?”)。

方法/资源:自主学习法+在线平台,共享预习资料。

作用:铺垫决策树构建步骤(重点),暴露特征选择难点。

2.课中强化技能

教师活动:用垃圾分类案例导入,讲解特征选择标准(结合课本“疾病诊断”案例,对比“体温”“咳嗽”的信息增益),组织小组合作绘制“动物分类”决策树,解答“如何确定最优特征”疑问。

学生活动:听讲思考特征选择逻辑,小组讨论特征依据,动手绘制决策树草图,提问“信息增益值越大是否一定最优?”。

方法/资源:讲授法+实践活动法+合作学习,用流程图可视化构建过程。

作用:突破特征选择难点,强化构建步骤重点。

3.课后拓展应用

教师活动:布置作业“设计‘学生成绩分类’决策树”,提供Scikit-learn工具教程,反馈作业时点评特征选择合理性。

学生活动:用工具实践,反思“我的特征选择是否优于课本案例?”。

方法/资源:自主学习法+反思总结法,延伸难点应用。

作用:巩固重点,深化难点理解。教师随笔Xx知识点梳理1.决策树的基本概念

决策树是一种监督学习算法,用于解决分类和回归问题,本节重点分类任务。其本质是从根节点到叶节点的路径对应一组分类规则,通过特征判断将样本划分到不同类别。教材定义:决策树是一个树形结构,包括根节点(代表全体样本)、内部节点(代表特征判断)、叶节点(代表类别标签)、分支(代表特征取值)和决策路径(样本从根到叶的判断路径)。例如,课本“动物分类”案例中,根节点为“是否有毛发”,分支为“是/否”,叶节点分别为“哺乳动物”“其他”。

2.决策树的构建原理

决策树构建的核心是“递归划分”,即选择最优特征将数据集划分为子集,使子集纯度(同类样本占比)最高。教材强调两个关键步骤:特征选择和节点划分停止条件。

(1)特征选择标准:信息增益。信息熵是衡量数据不确定性的指标,公式为H(D)=-Σpilog₂pi(pi为第i类样本比例)。信息增益=划分前熵-划分后加权熵,选择信息增益最大的特征作为划分依据。例如,课本“疾病诊断”案例中,计算“体温”“咳嗽”等特征的信息增益,选择“体温”作为根节点特征,因划分后熵减少最多。

(2)停止条件:节点样本属于同一类别、节点样本数小于阈值、树深度达到限制或信息增益小于阈值(教材明确为“无特征可划分”或“纯度足够”)。

3.决策树的构建步骤(教材流程)

(1)数据准备:收集标注数据,选择特征(离散或连续,教材案例均为离散特征,如“是否产卵”“血象”)。

(2)选择最优特征:计算各特征的信息增益,选最大者作为根节点。

(3)划分数据集:按特征取值划分子集,生成子节点。

(4)递归构建:对每个子节点重复步骤(2)(3),直到满足停止条件。

(5)剪枝处理:教材提到“防止过拟合”,包括预剪枝(划分前判断是否继续,如子集样本数<5停止)和后剪枝(生成树后剪减无效子树),但本节以预剪枝为主,案例中“动物分类”树深度不超过3层。

4.教材核心案例解析

(1)案例1:动物分类(课本P35-36)

-特征:是否有毛发、是否会飞、是否产卵(3个离散特征)。

-信息增益计算:以“是否有毛发”为例,划分前数据集D有10个样本(哺乳动物6、鸟类4),熵H(D)=-0.6log₂0.6-0.4log₂0.4≈0.971;划分后“有毛发”子集D1(6哺乳动物,熵0),“无毛发”子集D2(4鸟类,熵0),加权熵=0.6×0+0.4×0=0,信息增益=0.971-0=0.971,为最大值,故选为根节点。

-决策树结构:根节点“是否有毛发”,“是”分支直接到叶节点“哺乳动物”;“否”分支进入内部节点“是否会飞”,“是”到“鸟类”,“否”到“其他动物”(如鱼类)。

(2)案例2:疾病诊断(课本P37)

-特征:体温(正常/发烧)、咳嗽(是/否)、血象(正常/升高)。

-信息增益计算:数据集D有20个样本(流感8、普通感冒12),H(D)=-0.4log₂0.4-0.6log₂0.6≈0.971;“体温”划分:“发烧”子集D1(流感7、感冒1,熵=-0.875log₂0.875-0.125log₂0.125≈0.544),“正常”子集D2(流感1、感冒11,熵≈0.439),加权熵=0.4×0.544+0.6×0.439≈0.485,信息增益=0.971-0.485=0.486,最大,故为根节点。

-决策路径:“体温=发烧+咳嗽=是→流感”,“体温=发烧+咳嗽=否→普通感冒”,“体温=正常+血象=升高→流感”,“体温=正常+血象=正常→普通感冒”。

5.决策树的应用场景

教材强调决策树适用于“特征与类别关系明确、需可解释性强的分类任务”,具体场景包括:

(1)分类任务:垃圾邮件分类(特征:是否含“免费”、发件人地址等)、图像分类(特征:像素值、纹理等)。

(2)决策支持:医疗诊断(辅助医生判断疾病,如课本案例)、风险评估(贷款审批,特征:收入、征信等)。

(3)教育应用:学生学习情况分类(特征:作业完成率、考试成绩等,输出“优/良/中/差”)。

6.决策树的优缺点

(1)优点:教材明确“可解释性强”(规则直观易懂,如“体温=发烧→流感”)、无需特征缩放(离散/连续特征可直接使用)、能处理多分类问题(无需二分类扩展)、对缺失值有一定容忍度(可用多数类填充)。

(2)缺点:容易过拟合(教材指出“树过深会导致对噪声敏感”,如“动物分类”中若增加“体长”特征,可能将“体长<10cm”误判为独立类别)、对噪声敏感(异常样本可能影响节点划分)、偏向取值较多的特征(如“血象”有3个取值,信息增益可能被高估)。

7.决策树的评估指标

教材提到“分类效果需用指标量化”,本节核心指标为准确率(Accuracy)=(正确分类样本数/总样本数)×100%,如“疾病诊断”案例中,若测试集20个样本正确18个,准确率90%。补充指标:精确率(Precision,正例预测准确率)、召回率(Recall,正例覆盖比例),教材虽未展开公式,但案例中“流感”类的精确率=7/8=87.5%(预测流感8例,实际7例正确),召回率=7/8=87.5%(实际流感8例,预测正确7例)。

8.决策树在人工智能中的地位

教材指出“决策树是基础分类算法,属于监督学习,与聚类(无监督)、回归(预测连续值)并列”。其作为“白盒模型”(决策过程透明),区别于神经网络等“黑盒模型”,是可解释AI(XAI)的重要组成部分,也是集成学习(如随机森林、提升树)的基础,例如随机森林通过多棵决策树投票提升分类准确率,教材在拓展部分提及。

9.与其他算法的关联

教材对比决策树与K近邻(KNN):决策树基于特征划分,KNN基于距离计算;决策树生成模型(直接学习规则),KNN实例学习(存储训练样本)。对比朴素贝叶斯:决策树无需特征独立假设,贝叶斯需特征独立;决策树树形结构,贝叶斯概率图模型。

10.实践操作要点

教材上机实践要求:使用Excel或Python(Scikit-learn库)构建决策树,关键步骤包括数据加载(如CSV文件)、特征选择(用sklearn.feature_selection)、模型训练(DecisionTreeClassifier参数:max_depth控制深度,criterion='entropy'指定信息增益)、可视化(export_graphviz)。例如,“动物分类”数据中,需将“是否有毛发”等文本特征转换为数值(如“是”=1,“否”=0),再输入模型训练。教师随笔Xx重点题型整理1.题目:课本“动物分类”案例中,数据集包含10个样本(哺乳动物6个,鸟类4个),特征“是否有毛发”的划分结果为“有毛发”对应6个哺乳动物,“无毛发”对应4个鸟类,计算该特征的信息增益。(熵计算公式:H(D)=-Σpilog₂pi)

答案:H(D)=-0.6log₂0.6-0.4log₂0.4≈0.971;划分后子集熵均为0,信息增益=0.971-0=0.971。

2.题目:根据“疾病诊断”案例特征(体温:正常/发烧,咳嗽:是/否),绘制以“体温”为根节点的决策树结构(假设“发烧”分支下“咳嗽=是”为流感,“咳嗽=否”为普通感冒;“正常”分支下全为普通感冒)。

答案:根节点“体温”,分支“发烧”→内部节点“咳嗽”,“是”→叶节点“流感”,“否”→叶节点“普通感冒”;分支“正常”→叶节点“普通感冒”。

3.题目:设计一个“学生成绩分类”决策树,特征包括“作业完成率”(高/低)、“考试成绩”(及格/不及格),类别为“优秀/合格/不合格”,说明最优特征选择及理由。

答案:最优特征为“考试成绩”,因“及格”样本多为“优秀/合格”,“不及格”样本多为“不合格”,信息增益最大,能快速划分数据集。

4.题目:简述决策树构建的递归划分步骤,并说明“动物分类”案例中停止条件。

答案:步骤:选择最优特征→划分数据集→递归构建子树;停止条件:节点样本属同一类别(如“有毛发”节点全为哺乳动物)。

5.题目:决策树在医疗诊断中易过拟合,结合课本“疾病诊断”案例,说明预剪枝策略。

答案:限制树深度(如不超过3层),或当节点样本数少于5时停止划分,避免因噪声特征(如“血象”)生成无效分支。板书设计八、板书设计

①决策树核心概念

根节点:全体样本

内部节点:特征判断

叶节点:类别标签

分支:特征取值

决策路径:分类规则

②构建原理与步骤

信息熵:H(D)=-Σpilog₂pi

信息增益:划分前熵-划分后加权熵

递归划分:选择最优特征→划分数据集→子树构建

停止条件:节点纯度足够、样本数不足、树深度限制

③教材案例与应用

动物分类:特征选择(是否有毛发、是否会飞)

疾病诊断:特征选择(体温、咳嗽、血象)

预剪枝:限制深度、子集样本数阈值

评估指标:准确率(正确分类样本数/总样本数)反思改进措施九、反思改进措施

(一)教学特色创新

1.生活案例驱动教学,用课本"动物分类""疾病诊断"等贴近学生生活的例子,降低决策树抽象概念理解难度。

2.工具实践融合理论,结合Python(Scikit-learn)或Excel工具,让学

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论