版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第2章
机器学习人工智能通识基础1.机器学习基本概念2.机器学习与人工智能的关系3.机器学习的主要分支4.机器学习项目实施指南目录Contents机器学习基本概念01导航软件的进化从最短路线到智能规划机器学习初体验0102机器学习让计算机从数据中学会决策,如电商推荐商品、医疗辅助诊断,改变了传统依赖死板规则的模式。导航系统从单纯依据最短路线到能分析交通数据和用户习惯,预测拥堵,动态规划路线,这背后是机器学习技术的支撑。机器学习定义0201现实应用举例电商推荐:分析你的浏览/购买记录,推荐你喜欢的商品;医疗诊断:通过学习大量病例数据,辅助医生识别疾病。从数据中学习是一种通过数据让机器“学会”规律的技术。它不需要人工明确指令,而是通过一系列的概念和步骤,使机器能自动地分析、预测和决策。数据、模型和算法数据的作用算法的价值数据是学习素材,决定模型能“看到”多少信息。没有数据,机器无法学习。算法是学习策略,决定模型如何从数据中学习。算法是模型如何学习的“路线图”。模型是思维框架,提炼数据中的规律。模型是对规律的数学表达,用于预测结果。模型的功能一个学生刚开始学习分辨“猫”和“狗”,他需要看到成百上千张“猫”和“狗”的图片,才能识别出它们的不同特征。如果一个学生想学习数学加法,老师可能会给他一个公式“a+b=c”。这个公式帮助他理解如何将两个数字相加。一个水果分拣员通过观察水果的颜色和形状来判断其种类,他先看颜色,红色可能是苹果;接着看形状,圆形的可能是苹果,长条的可能是香蕉。数据:机器学习的眼睛数据形式多样,包括数字、文本、图像、视频等。垃圾邮件分类器需分析大量邮件,识别出“广告语、多链接”等特征。0102数据为机器提供了“学习素材”,是机器学习的源泉。数据越丰富、越准确,模型学到的知识就越全面,因此数据是机器学习中最核心的资源。数据的形式数据的重要性模型:机器的大脑模型是对规律的数学表达,用于预测结果。房价预测模型可根据面积、地段等因素输出价格。模型的定义比喻:学生学加法公式“a+b=c”,机器模型同样依赖公式进行推理。模型的作用算法:学习的策略01算法的定义算法是模型如何学习的“路线图”。水果识别=决策树(颜色→形状→分类)。02算法的影响比喻:学生解题方法不同,算法决定学习路径。特征:决定成败的关键信息特征是数据中最有用的部分,是模型识别规律的“线索”。预测电影票房要考虑导演、演员、上映档期等。特征的定义比喻:评估比赛结果要看球员状态、天气、对手。特征的重要性训练:从反复试错中学会预测训练是模型“学习规律”的过程,通过不断尝试减少预测误差。AI学骑车,一开始总摔倒,不断调整后才能掌握平衡。训练的含义比喻:学生做题—>错题分析—>改正提升。训练的方法泛化:是否真正“学懂了”?01泛化是模型应对新数据的能力,是评估是否“学到本质”的标准。学生考试题型稍变就不会做=模型过拟合。02泛化的定义比喻:死记硬背不能应付灵活题,模型要“理解而不是背答案”。泛化的重要性测试与验证:实战检验模型效果测试的目的测试阶段检验模型是否能处理新数据。厨师学习做菜,最终还是看顾客是否满意。验证的作用比喻:模拟考试检验是否真正掌握知识点。损失函数:模型的错题本损失函数的作用损失函数衡量预测值与真实值之间的误差。学生做题错了,老师指出错误位置=机器的“评分标准”。损失函数的类型常见类型:均方误差(MSE)、交叉熵等。超参数调优:调好“火候”才能烘焙成功超参数是在训练前设定的,会影响模型表现。学习率太高→模型跳跃、震荡。超参数的定义比喻:烘焙时温度/时间设错,结果会糊或夹生。调优的方法正则化:防止死记硬背的“提醒器”正则化的功能正则化用于防止模型过拟合,通过惩罚复杂度来增强泛化。学生不能只记一道题的答案,而要学解题方法。正则化的应用比喻:画家不能死临摹,要掌握通用技法才能创作新作品。机器学习与人工智能的关系02AI的智能来源,从“学习”开始人工智能(AI)正逐渐走进我们的生活。你用的音乐App、导航App、语音助手背后,都有AI的身影。它们为什么越来越懂你?——靠的是机器学习(MachineLearning)!机器学习是AI的大脑AI=感知+决策+推理ML=AI自主学习与优化的基础AI类型传统规则使用机器学习导航手动设定路径学习路况做预测音乐推荐固定分类用户行为分析三种AI“人格”,让智能更真实思考一下假如你是智能冰箱,你会学什么?学习主人的饮食习惯(牛奶几天喝完?鸡蛋多久用完?)主动提醒:下次采购前发出通知,甚至生成购物清单!机器学习如何让AI“从小孩变超人”给AI宠物设计“学习清单”如果你拥有一个AI宠物机器人,它需要学会哪些技能?记住你喜欢什么时候散步判断你开心/生气的语气预测天气并提醒穿衣机器学习的主要分支03你知道AI的“学习门派”吗?一位顾客进入超市,他的购物路径、购买偏好、与货架的交互都在被AI记录。如何预测他要买什么?如何决定货品摆放?靠的不是一种算法,而是五种学习策略的协作。五大主流学习方式一览看懂未来——监督学习的本领💳一笔信用卡交易在秒级内被拒绝,是AI系统识别为可能的“欺诈交易”
📊系统依据历史标注数据,学习“特征→标签”的关系,实现精准判断无监督学习:揭示隐藏模式👤每位顾客都有独特的购物习惯,但平台如何发掘潜力客户?
🏷️这些顾客没有“标签”,没法直接分类……
👉无监督学习出场!通过分析购物数据,平台可以:自动将顾客划分为“高价值客户”“潜力客户”“普通客户”发现新产品组合、优化推荐系统提升转化率和客户满意度聚类:像帮学生分组,不告诉你哪个是好学生,但从表现中自动看出“学习风格相似”的同学归为一组降维:像整理旅行行李,从100样东西里挑出最重要的10件打包出发!强化学习:决策的智者半监督与自监督学习:标签稀缺的解决方案多种学习方式如何协同?现代城市的交通管理,需要更聪明的系统来预测拥堵、优化红绿灯、识别异常情况。单一学习方式难以全面解决问题,五大学习分支协同工作,助力城市畅行!机器学习项目实施指南04项目背景你刚结束一节漫长的高等数学课,饥肠辘辘地走向食堂,结果却发现长龙排到门口——每个人都在等待一份热腾腾的饭菜。这不仅让你的胃倍感煎熬,也让整个食堂效率低下。有没有一种方法,能够提前预测高峰时段,让食堂窗口根据预测合理分配资源,减少学生排队时间?
机器学习七部曲定义问题收集和处理数据选择算法构建模型训练模型评估模型部署模型并持续优化机器学习七部曲——定义问题1.预测目标(输出)需要预测每天的高峰时段(如某一时间段食堂需要的最大窗口数)2.输入数据(特征)影响食堂高峰时段的因素,比如学生课程表、天气状况、食堂菜品受欢迎程度和时间信息等3.核心问题通过分析这些数据特征,找到隐藏的规律,让模型能够预测每一天的高峰时段和排队人数机器学习七部曲——收集和处理数据在食堂排队预测中,需要收集哪些数据?机器学习七部曲——收集和处理数据需要做哪些方面的预处理?4312确保数据质量的关键步骤。获取数据后,可能会发现缺失值、异常值或格式混乱的情况。数据检查特征工程不同特征的数据范围可能存在较大差距,为了避免某些特征对模型产生过大影响,需要将数据调整到相同的量级。数据标准化将数据分为训练集和测试集是模型训练的重要一步。数据分割数据预处理提炼出对模型更有用的信息。机器学习七部曲——选择算法选择机器学习算法就像一场“选美大赛”,你需要从众多候选者中挑选出最适合解决问题的“冠军”。根据食堂排队预测的需求,可以得出以下结论:
如果数据简单且对解释性要求高,选择线性回归小姐。
如果需要清晰的逻辑决策并适配复杂数据,选择决策树先生。
如果追求高精度和稳健性,随机森林小姐是最佳选择。
如果数据维度高且允许较长训练时间,可以考虑支持向量机先生。机器学习七部曲——构建模型模型构建的过程是将选定的算法具体化,并将其应用于实际数据中的步骤。将通过分析输入特征(如时间、天气、课程安排等)与预测目标(如排队人数)之间的线性关系来进行构建。会结合多个决策树,每棵树根据不同的数据子集和特征进行独立训练。构建一个树状结构。树的每一个节点都代表一个特征(如时间段、天气等),每个分支对应不同的条件判断,而最终的叶子节点则给出预测结果。通过在高维空间中构造一个超平面来分隔不同类别的数据。机器学习七部曲——训练模型训练集:包含大部分的历史数据(例如,过去几周的数据)。用于训练模型,让模型学习哪些特征(比如时间段或菜单吸引力)会导致高峰时段。测试集:包含一小部分未参与训练的数据(例如,上周的数据)。用于检验模型的性能,看看它是否能够准确预测这些数据中的排队人数。1.准备训练数据机器学习七部曲——训练模型2.模型学习设置目标目标函数是模型的指南针,用来衡量预测效果,比如用均方误差(MSE)计算预测值与实际值的差距。模型通过减少误差,逐步提升预测能力。目标可以定义为预测每天每个时段的排队人数,可以通过收集以下数据来实现这个目标:时间段(如早、中、晚餐时间)天气(晴天、雨天可能影响排队人数)课程表(某些课后排队人数较多)历史排队人数(时间段内的平均排队人数)机器学习七部曲——训练模型2.模型学习防止过拟合和欠拟合机器学习七部曲——训练模型2.模型学习调节超参数超参数是模型训练前需要设定的参数(与模型参数不同,后者由数据学习得到)。学习率:控制梯度下降步长。如果太大,可能导致训练震荡;太小则收敛过慢。正则化强度:决定模型对过拟合的抑制力度。模型复杂度参数(如神经网络的层数、树模型的最大深度)。调节超参数的常用方法:网格搜索:尝试所有可能的参数组合。随机搜索:随机采样一部分参数组合进行评估。贝叶斯优化:根据历史超参数组合的表现智能选择新的组合。机器学习七部曲——训练模型3.循环训练模型输入数据模型初次预测对比真实值调整参数机器学习七部曲——评估模型
食堂管理员已经训练好了一位“神算子模型”,它会基于课程表、天气和历史数据预测每天的排队高峰。但管理员心中有疑问:“它预测得准不准?如果12:30高峰人数预测错了怎么办?”“这个模型真的能让食堂更高效吗?”选择评估指标评估过程分析评估结果输入测试数据,如某天的
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2026宁海社工面试题及答案
- 2026皮革行业面试题目及答案
- 2026企划助理的面试题及答案
- 2026清华面试题库及答案
- 2026人民武装面试题库及答案
- 2026软件评测面试题目及答案
- 2026商务变现面试题及答案
- 2026深联电路面试题目及答案
- 2026十二届刻字展面试题及答案
- 2026年宁波街道编外考试试题及答案
- 2026年北京市朝阳区中考数学二模试卷(含答案)
- 2025年山东公务员录用考试《申论》真题及答案解析
- 2024人教版(五线谱)一年级音乐下册 第一单元《爱的摇篮》教案
- 2026年初级注册安全工程师《安全生产专业实务(其他安全)》真题试卷(附答案解析)
- 古浪县新堡红湾沟石膏矿矿产资源开发与恢复治理方案
- 500储罐施工方案(3篇)
- 一年级语文趣味练习题集锦
- 胃癌患者术后疼痛管理
- 统编版语文三年级下册第六单元习作:身边那些有特点的人 教学课件
- 《一年级期末总结班会》 课件
- 化工厂安全课件
评论
0/150
提交评论