版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
《用机器学习解决问题》教学课件2025-2026学年|清华大学版A版(新教材)初中信息技术八年级下册温故知新:机器学习大家族监督学习有“老师”指导,模型的训练数据必须是带标签的。模型通过学习输入和对应标签之间的映射关系来进行预测。💡比喻:就像做有标准答案的练习题,让机器学习解题规律。无监督学习没有“老师”指导,训练数据不带标签。模型需要自主从海量数据中挖掘内在结构、模式或相似性。🧩比喻:就像整理杂乱的房间,把相似的东西自动归类放在一起。强化学习通过智能体与环境不断交互来学习。模型根据每次动作的反馈(奖励或惩罚)来调整策略,最终实现长期收益最大化。🎮比喻:就像玩电子游戏,通过不断试错和积分奖惩,最终找到通关秘籍。❓互动时刻:结合刚才的比喻,谁能概括一下这三者最核心的区别?校园里的烦恼:垃圾去哪儿了?现状:混投现象严重尽管校园内设置了分类垃圾桶,但由于意识不足或嫌麻烦,垃圾混投、乱扔现象仍随处可见,资源回收价值大打折扣。痛点:人工分拣效率低依靠保洁人员或志愿者进行人工二次分拣,不仅费时费力,增加了校园的运营成本,也很难做到实时、准确的分类。思考:技术能否破局?面对这样的难题,我们能不能利用学到的编程、AI识别等技术,设计一个“智能助手”,来帮助解决校园垃圾分类的问题?挑战:让机器学会垃圾分类💡核心问题面对校园垃圾分类问题,我们能不能用机器学习来实现自动分类、精准预测?如果可以,机器要完成这个任务,需要经历哪些步骤呢?Step01·数据收集“收集很多垃圾的照片!”Step02·模型训练“让机器去学习这些照片!”Step03·效果测试“测试一下它学得怎么样!”今天的任务:用机器学习解决问题大家的思路非常清晰!今天,我们就以身边最常见的场景——“校园垃圾分类”为例,带大家一起拆解,如何将抽象的机器学习技术,转化为解决实际问题的有效工具。核心实战案例:校园垃圾分类从生活场景出发,探索AI的落地应用✨本节课目标:掌握从“发现问题”到“技术解决”的全链路思维揭秘:机器学习解决问题的“六步曲”💡核心逻辑:数据是基础·模型是核心·评估是关键·应用是目的01.问题定义明确业务目标,将复杂的实际问题转化为机器学习算法可处理的数学问题。02.数据收集从数据库、公开数据集、日志文件等来源获取与问题强相关的高质量数据。03.数据预处理进行数据清洗、去噪、特征提取与转换,为模型训练准备标准化输入。04.模型训练选择合适的算法(如分类、回归),利用训练数据学习规律,生成模型参数。05.模型评估使用独立的测试数据集验证模型,通过准确率、召回率等指标衡量性能。06.模型应用与优化将模型部署到生产环境解决实际问题,并根据反馈持续迭代优化算法。流程解析:数据是基础为什么说数据是基础?机器学习模型通过学习海量数据,才能从中发现并总结出客观规律。数据≈模型的“食物”+“教材”如果数据有问题会怎样?❌数据不全:模型无法学到完整的知识,有“知识盲区”。❌质量太差:模型学到错误的规律,导致最终预测结果出错。💡互动思考如果我们在训练模型时,
只给它看晴天拍摄的垃圾照片,
它能在晚上准确识别出垃圾吗?流程解析:模型是核心,评估是关键模型是核心模型是通过学习海量数据后形成的“专家系统”,它能根据全新的输入信息,快速推理并做出精准预测。评估是关键模型训练完后,效果好不好、准不准?需要通过“考试”来检验真实能力。可以说,评估就是模型的“期末考试”。🤔互动思考为什么不能只让模型做“练习”(训练),还要让它做“考试”(评估)?流程解析:应用是目的应用是目的我们训练模型的最终目的,是让它在真实世界中发挥作用,解决实际问题,让技术真正落地并产生价值。持续优化迭代模型在应用中会遇到新问题与边缘场景。我们需要收集新数据、重新训练,形成闭环,持续优化模型表现,让它变得更“聪明”。关键结论:这六个环节环环相扣,缺一不可,共同构成了用机器学习解决问题的完整生命周期,也是一个不断螺旋上升的过程。Step1:问题定义—明确我们要做什么案例目标识别校园垃圾所属的类别(可回收物、厨余垃圾、有害垃圾、其他垃圾),让机器“看懂”垃圾图片,实现自动分类预测。问题类型这是一个典型的监督学习任务。具体到任务细分,属于:图像多分类任务互动思考Q:为什么垃圾分类属于监督学习?💡答案提示:
因为我们拥有大量“垃圾图片”(数据特征),同时也知道每一张图片对应的“垃圾类别”(标签)。就像有一位老师带着标签来指导机器进行学习。Step2:数据收集—为模型准备“教材”01/收集什么?带标签的垃圾图片数据•特征:图片包含的像素颜色与形状信息。
•标签:人为定义的垃圾类别,如“塑料瓶-可回收物”。02/收集多少?数据数量越多,效果越好在合理范围内,海量的数据样本是提升模型性能的基石。丰富的数据量能帮助模型学习更多特征,从而有效提升其预测的准确性与泛化能力。03/收集哪里的?场景越丰富,鲁棒性越强应覆盖不同拍摄角度、光照条件、摆放方式和杂乱的背景。多样化的训练场景能帮助模型适应现实生活中的各种复杂环境,减少识别盲区。数据收集的渠道与伦理01数据来源校园实地拍摄在校园内进行素材拍摄,获取一手真实场景数据,需注意合规拍摄。公开数据集使用权威机构或平台发布的公开数据集,确保数据来源合法合规。02信息社会责任严禁拍摄到同学的面部、姓名等
个人隐私信息!在数据收集与使用的全过程中,请严格遵守相关法律法规与道德规范,
时刻将保护个人隐私放在首位。Step3:数据预处理——净化“教材”原始数据往往是“脏乱差”的,就像混杂着泥土和杂质的食材,需要我们先整理、清洗才能使用。清洗前:剔除杂质❓做什么?主动识别并删除模糊不清、物理破损、重复上传以及明显无效的图片数据,剔除一切干扰项。清洗&筛选保留高价值·去除低质量清洗后:纯净可用💡为什么做?避免AI模型“吃进”错误、无意义或重复的信息,防止模型学习到错误的特征,从而保证最终训练出的模型准确性和鲁棒性。数据预处理:数据标注核心步骤02:数据标注做什么?给每张清洗后的图片,明确地打上类别标签。比如框出“香蕉皮”,并打上“厨余垃圾”的标签。为什么?这是监督学习的关键环节。通过人工标注,我们让模型建立“特征-标签”对应关系,从而学会识别未知数据。数据预处理:数据划分STEP03将清洗后的数据集科学拆分,为模型训练做准备70%训练集(TrainingSet)模型学习的“教材”。用来让算法理解数据中的规律、特征与模式,是构建模型的核心基础。30%测试集(TestSet)检验效果的“考试卷”。使用模型从未接触过的全新数据,来客观评估模型在真实场景下的预测能力。🤔互动思考:为什么必须严格划分训练集和测试集?只用训练集不行吗?💡答案提示:只用训练集就像是“刚学完课文马上做课后题”,成绩不能代表真实水平。只有用模型从未“见过”的测试集来检验,才能排除“死记硬背”的干扰,反映出模型举一反三的泛化能力。Step4:模型训练—让机器开始“学习”01/选择模型根据任务类型,挑选合适的“大脑”。在图像分类中,我们通常会选择卷积神经网络(CNN),它能像人眼一样自动识别图片中的特征。02/开始训练把整理好的训练集数据“喂”给模型,点击开始。模型将自主分析海量数据,寻找“垃圾图片”与“具体类别”之间的内在规律。训练的本质:寻找规律海量刷题的“超级学霸”模型训练的过程,就像一个不知疲倦的超级学霸,在海量的练习题(数据集)中不断练习和总结。特征提取与关联它会自动分析图片的关键特征(颜色、形状、纹理、大小等),并在计算中尝试将这些特征与对应的“正确答案”(标签)建立稳定的逻辑关联。从具体案例中归纳规律“如果一个物体是细长的、透明的、圆柱形,且表面光滑,那它大概率是塑料瓶,应该归类为可回收物。”最终“毕业”产出分类模型具备预测能力的AI程序Step5:模型评估—给模型“考试”01/用什么考?使用之前特意划分出来的、模型在训练过程中从未见过的数据——也就是测试集(TestSet)。这就像老师出题,绝不会出平时做过的原题,才能真正检验学习效果。02/考什么?把测试集中的图片一张一张输入给“训练好的模型”,让它进行预测。我们将它的预测结果与图片原本的真实标签进行对比,来判断它答对了多少,答错了多少。03/核心指标:准确率计算公式:准确率=(正确分类图片数÷总测试图片数)×100%意义解读:准确率是衡量模型泛化能力最直观的指标。数值越高,代表模型学得越好,对新图片的预测越准。案例分析:我们的模型考了多少分?测试集总数100张图片样本正确分类数92张精准识别模型识别准确率92%(92/100)结论:综合表现优异,模型分类效果良好!💡互动思考:如果模型把“纸巾”(其他垃圾)错误识别为“厨余垃圾”,准确率会上升还是下降?这说明了什么?提示:准确率会下降。这说明模型在处理特征相似、易混淆的垃圾类别时,仍存在识别短板,需进一步优化算法或扩充训练样本。Step6:模型应用与优化—让模型走向世界01模型应用将评估合格的AI模型,部署到真实的生产或生活设备中,解决实际问题。💡应用案例:校园智能垃圾分类箱当有垃圾投入时,箱内摄像头实时拍照→AI模型极速识别垃圾种类→自动控制机械装置,将垃圾精准投入对应分类桶中。02模型优化持续迭代·越用越聪明模型上线后,并不是“一劳永逸”的,而是一个持续成长的过程:1.数据收集:收集模型在实际使用中遇到的“难识别”、“误判”的垃圾图片,形成新的训练数据集。2.模型更新:定期使用新增的高质量数据重新训练模型,修复识别漏洞,不断提升分类准确率。核心环节回顾问题定义核心任务:明确目标、类型关键要点:确定监督/无监督/强化学习类型,找准问题切入点数据收集核心任务:获取带标签数据关键要点:保证数据数量充足、场景覆盖全面,并做好隐私保护工作预处理核心任务:清洗、标注、划分数据集关键要点:数据质量是决定最终模型效果上限的关键因素模型训练核心任务:选择合适模型,学习数据规律关键要点:高质量的训练集是模型学习的核心素材,直接影响能力构建模型评估核心任务:测试模型效果、计算各项准确率指标关键要点:利用测试集客观检验模型的泛化能力和真实解决问题的能力应用优化核心任务:模型上线部署落地,持续迭代提升关键要点:收集用户反馈,根据真实环境数据持续优化,灵活适配新场景小组任务:设计简易垃圾分类模型方案问题定义明确你们小组的任务目标,具体拆解垃圾分类问题的类型(如二分类/多分类任务),以及希望模型解决校园里的哪一类具体痛点。数据收集规划数据来源:是拍摄校园实景图,还是从公开数据集获取?明确样本数量要求,以及要收集哪些垃圾类别(如可回收、厨余等)。数据预处理讨论如何清洗收集到的图像(如去噪、统一尺寸),以及如何对图片进行分类标注,确保模型训练数据的准确性。模型评估确定衡量模型效果的核心指标:例如用“准确率”看模型分类正确的比例,或“召回率”衡量识别特定垃圾的能力。⏱小组讨论时间:10分钟|请确定最终发言人汇报方案框架合作探究,集思广益教师指导巡视观察教师在教室内巡视,密切观察各小组讨论情况,关注讨论进度与氛围。难点引导重点引导学生思考“如何划分训练集和测试集”、“如何设计评估指标”等核心难点。明确分工提醒小组内明确角色分工,指定记录员负责整理思路,发言人负责成果展示。成果展示,共同进步小组展示方案随机抽取2-3个小组,由发言人自信地展示本组的设计思路与最终解决方案。互评与提问其他小组认真聆听,针对方案细节进行现场提问与客观评价,共同探讨优化空间。总结与点评教师进行总结点评,肯定方案中的亮点,指出存在的不足,并补充相关关键知识点,深化理解。思考:机器学习还能解决哪些校园问题?打开思路,探索无限可能学习了垃圾分类的案例后,让我们把目光投向更广阔的校园生活。试着想一想:在教学辅导、科研管理、宿舍生活、食堂服务、图书馆借阅、运动健康等场景中,有哪些问题让你觉得“如果有个智能帮手就好了”?大胆想象,让算法为校园生活赋能!案例:学生出勤预测场景描述学校根据历史数据,整合天气状况、具体日期、课程安排等多维信息,建立模型来预测次日各班级的预计出勤人数,辅助教学资源的合理调度与配置。机器学习类型:监督学习(回归任务)▍输入特征:天气(晴/雨)、星期几、是否有重要/核心课程等。▍预测标签:各班级的实际出勤人数(数值型结果)。案例:校园人流量统计场景描述在教学楼、食堂等高频使用区域,通过智能分析捕捉到的人流高峰时段和分布情况,为学校合理进行食堂窗口开放、设施资源调配、以及课间休息时间优化提供数据支撑,避免拥堵。机器学习类型:无监督学习(聚类分析)▌核心特征:基于监控摄像头捕捉到的实时人群位置坐标信息进行计算。▌分析目标:让算法自动将离散的个体聚合成不同群体,量化分析区域人流密度,识别聚集热点。案例:智能错题推荐📖场景描述在日常学习场景中,系统能自动分析学生的历史错题记录,精准识别薄弱知识点,并结合学生的能力水平,个性化推荐最匹配的同类练习题和知识点讲解,形成“练习-分析-巩固”的学习闭环。🤖机器学习类型:监督学习(推荐系统)•输入特征:错题所属的知识点ID、题型类别、错误频次、学生历史答题准确率分布等。•目标标签:推荐的知识点ID或具体的题目ID,本质是预测“最适合该生当前水平的学习内容”。课堂练习:知识大闯关01机器学习解决问题的第一步是?A.数据收集B.问题定义(正确答案)C.模型训练02通常,我们将数据集按什么比例划分为训练集和测试集?A.7:
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 股骨干骨折患者康复训练的激励机制
- 2026年基于数字孪生的监护仪状态评估
- 胰腺癌患者的太极练习
- 2026年消防报警控制器生产技术现状
- 2026年物业员工食堂管理与伙食改善措施
- 2026年高空作业恶劣天气应急处理指南
- 视频剪辑2026年影视特效服务合同
- 2026年资产收益协议合同条款
- 2026年开展警械使用与管理规范培训
- 汽车零部件回收协议
- 2026中国航空发动机产业发展现状与技术突破路径研究报告
- 12.2跨学科实践:制作简易杆秤课时练习(含答案)八年级下册物理人教版 (2024)
- 2026浙江省绿电直连政策及新能源就近消纳价格政策解读
- 2026年及未来5年市场数据中国智能水杯行业市场深度研究及发展趋势预测报告
- 急性胰腺炎的综合治疗方案
- 新一轮千亿斤粮食产能提升行动方案全文
- 2026浙江事业单位统考嘉兴市招聘107人考试参考题库及答案解析
- 物业保安服务工作方案范文
- 《2023版CSCO小细胞肺癌诊疗指南》
- 肾内科学科建设发展规划
- 2026年当辅警笔试题库及一套完整答案
评论
0/150
提交评论