人工智能与未来 课件 4.4 机器学习_第1页
人工智能与未来 课件 4.4 机器学习_第2页
人工智能与未来 课件 4.4 机器学习_第3页
人工智能与未来 课件 4.4 机器学习_第4页
人工智能与未来 课件 4.4 机器学习_第5页
已阅读5页,还剩46页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

Algorithm第4章

算法2035主讲:王红梅4.14.24.34.4算法那些事算法概述搜索算法机器学习目录CONTENTS4.5神经网络与深度学习扩展:循环神经网络4.6哎呦,我的妈呀机器能学习,你信吗?它怎么学呀!

需要先谈谈人工智能、机器学习、神经网络和深度学习之间的关系人工智能机器学习深度学习神经网络人工智能是一个很大的概念

人工智能、机器学习、神经网络和深度学习之间的关系研究人工智能要用到各种数学算法,统称为机器学习贝叶斯网络神经网络决策树支持向量机等人工智能机器学习深度学习神经网络神经网络是其中的一种方法

人工智能、机器学习、神经网络和深度学习之间的关系神经网络是一种用多层结构来模拟人脑神经网络的一种方法。人工智能机器学习深度学习神经网络

人工智能、机器学习、神经网络和深度学习之间的关系当神经网络的层数非常多时就称深度学习。这么看来,机器学习还是基础。人工智能机器学习深度学习神经网络

小智去图书馆借书,用校园卡一刷,屏幕上竟跳出几本他心仪已久的人工智能书籍。小智惊讶不已,他尚未查询,计算机如何知晓他的需求?原来,这是图书馆新引入的基于机器学习算法的智能推荐系统。该系统通过分析学生的借阅历史、网络搜索行为等数据,预测其兴趣和需求,从而提供个性化书籍推荐。机器竟然也能像人类一样学习?4.4.1什么是机器学习?4.4.2机器怎么学习?4.4.3机器学习的类别4.4.4机器学习应用实例:KNN4.4.5机器学习的实际应用场景讨论:人类是怎么学习(广义的学习)和并实践的呢讨论:人类是怎么学习(广义的学习)和并实践的呢而机器学习方法不同于前面的算法的地方就是要计算机通过归纳法从数据中发现规律解决问题。人类学习新知的方法演绎法归纳法如前面讲的冒泡排序算法和搜索算法正是利用逻辑演绎的方法,配合计算机的计算能力开发出来的。过往经验规律归纳输入新问题预测未来历史数据模型训练输入新数据预测未来属性4.4.1什么是机器学习?

反馈改进历史数据模型训练输入新数据预测未来属性4.4.1什么是机器学习?

改进机器学习的关键在于从大量的数据中发现一个“模型”,并通过它来模拟现实世界事物间的关系,从而实现预测或判断的功能。建立这个模型的过程就是学习。4.4.2机器怎么学习?

如:利用一个人的身高(自变量x1)、体重(自变量x2)数据预测他所穿的鞋的尺码(因变量y)问题。自变量:称作特征值或者特征变量因变量:称作目标变量或者标签

4.4.2机器怎么学习?

机器学习,就是在已知数据集的基础上,通过反复的计算,选择最贴切的函数去描述数据集中自变量(x1,x2)和因变量y之间的关系的过程。如果机器通过所谓的训练找到了一个函数,对于已有的1000个人的身高、体重数据,它都能够根据这些特征,大致推断出他穿鞋的对应尺码。那么,再给另一批人的身高、体重数据,就很有希望用同样的函数(模型)推断出这另一批人所穿鞋的对应尺码。此时,已有的1000组身高、体重数据叫作训练数据集。另一批身高、体重数据叫作测试数据集。训练数据模型训练输入测试数据输出预测训练就是用算法确定模型参数的过程机器学习通过训练调整参数,减少误差改进4.4.2机器怎么学习?

生活中的模型4.4.3机器学习的类别(按学习方法)

1.监督学习。监督学习利用已知类别的样本(有标记的样本即有答案的样本),训练学习得到一个最优模型参数。是将问题的答案告知计算机,使计算机进行学习并给出模型参数的方法。监督学习的应用场景主要有回归和分类。

实际可以按任务分,按学习方法分,按复杂程度分等特征1特征1特征1特征n特征n特征n··················目标目标目标数据特征标签监督学习算法天气温度风速晴暖强雨冷中晴冷弱享受运动是否是对于天气是否适合运动的预测:分类回归问题通常用来预测一个值,其标签的值是连续的。例如前面根据身高和体重数据预测出对应的鞋的尺码的例子就是监督学习中的回归。此外,预测房价、预测高考录取分数线、预测未来的天气等任何连续性的走势、数值等问题都是回归问题。4.4.3机器学习的类别

1.监督学习:回归。

分类问题是机器学习中的一种常见类型,算法需要将数据划分到一组已定义的类别中。例如,在医学诊断中,分类问题可能是预测患者是否患有特定疾病;在营销领域,分类问题可能是预测客户是否会购买某种产品;在金融领域,分类问题可能是预测客户是否会逾期还贷。4.4.3机器学习的类别

1.监督学习:分类。

4.4.3机器学习的类别

1.监督学习:分类。

将数据分类到两个类别中,叫做二元分类如前面的天气是否适合运动。将数据分类到更多类别,比如10个类别的情况,这样的情况称为多元分类,如超市购买水果,对水果进行识别等。分类是机器学习的经典应用领域,很多种机器学习算法都可以用于分类,包括基础的K近邻算法、经典的逻辑回归算法、以及神经网络、深度学习等。

无监督学习直接接收一堆特征数据作为起点。然后,它会尝试对这些数据进行各种分析,找出数据里隐藏的一些规律或群体。通过这种方式,无监督学习能够逐渐理解这些数据的内在结构和特点。无监督学习的典型应用场景是聚类和降维。4.4.3机器学习的类别

2.无监督学习

讨论:物以类聚,人以群分现象学习的各种社团算不算?聚类问题的目的是将相似的数据聚在一起。例如,通信运营商可以对手机用户的通话行为进行聚类,把喜欢上网的用户聚为一类,喜欢夜间打电话的用户聚为另一类。4.4.3机器学习的类别2.无监督学习:聚类把相似的数据汇总为组的方法叫聚类。

降维,简单来说,就是把一堆有很多特征的数据,想办法用更少的特征来表示,同时还要求保留最主要的信息。

也就是指将高维数据转换为低维数据。

4.4.3机器学习的类别2.无监督学习:降维

降维,简单来说,就是把一堆有很多特征的数据,想办法用更少的特征来表示,同时还要求保留最主要的信息。

也就是指将高维数据转换为低维数据。

4.4.3机器学习的类别2.无监督学习:降维

讨论:生活中降维的例子,你了解的有没有?我们的世界是三维的,拍的照片是二维的。我们的学科体系是复杂和多维的,我们把它转换为一个一个的知识点和实践项目。将大量文字总结成摘要,保留关键信息,减少数据量。在面临复杂决策时,人们可能只关注最重要的几个因素,忽略次要因素。强化学习,在不断尝试中通过奖惩机制来学习如何做出最好决策的方法。4.4.3机器学习的类别3.强化学习

强化学习在游戏、机器人控制、自动驾驶等需要决策和优化长期目标的场景中发挥着重要作用。4.4.3机器学习的类别3.强化学习

监督学习利用已知类别的样本(有标记的样本),训练学习得到一个最优模型。如用于数据分类。无监督学习半监督学习对于没有标记的样本,学习算法直接对输入数据集进行建模,如聚类。试图让学习器自动地对大量未标记数据进行利用以辅助少量有标记数据进行学习。强化学习强化学习通过试错来学习最优的行为策略。系统会根据当前的状态选择一个动作,然后观察环境的反馈(奖励或惩罚),并据此调整策略,以便在未来获得更好的回报。机器学习的类别4.4.3机器学习的类别同一类别的事物通常聚集在一起“人以群分,物以类聚”说的就是这个原理?“近”“邻”K是邻居个数4.4.4机器学习应用实例:KNNKNN(K-NearestNeighbor,K近邻)算法是机器学习算法中最基础、最简单的算法之一,属于监督学习,主要用于分类。(一)KNN的原理B?A?4.4.4机器学习应用实例:KNNKNN算法的核心思想是:如果一个样本在特征空间中的K个最相似(即特征空间中最邻近)的样本中的大多数属于某一个类别,则该样本也属于这个类别。观察这张图,推断A、B两点的颜色和形状?(一)KNN的原理B?A?推测A粉色圆点B绿色方块4.4.4机器学习应用实例:KNN观察这张图,推断A、B两点的颜色和形状?B?A?原因01以A为圆心的区域:粉色圆点多02以B为圆心的区域:绿色方块多(一)KNN的原理4.4.4机器学习应用实例:KNN观察这张图,推断A、B两点的颜色和形状?B?A?(一)KNN的原理4.4.4机器学习应用实例:KNN观察这张图,推断A、B两点的颜色和形状?KNN如何理解“最近”呢?最直观的就是用距离量化“远近”。距离(用d表示)的计算方法有很多种。如对于直线上的距离,平面上的两个点来说,距离可以采用欧式距离进行计算(一)KNN的原理k近邻法步骤:1.计算输入数据与训练数据之间的距离;2.按距离递增排序;3.得到距离输入数据最近的k个训练数据;4.统计k个训练数据的类别频率,按规则确定预测结果。B?A?KNN算法的实现,这里不讲了,学有余力的同学可以自己探索。(二)KNN的实现4.4.4机器学习应用实例:KNN标志型号长(mm)宽(mm)高(mm)价格(万元)略过X00140531740144923浏览X00250871868150041略过X0034032168014509浏览X00443301535188528

推荐?X00845601822164534(三)KNN的实际应用假设某网站发现用户对某些车型的浏览行为如绿色数据所示,那么现在向用户推送X008车型的广告是否会引发用户兴趣?4.4.4机器学习应用实例:KNN标志型号长(mm)宽(mm)高(mm)价格(万元)略过X00140531740144923浏览X00250871868150041略过X0034032168014509浏览X00443301535188528

推荐?X00845601822164534为了简化,此处只考虑价格特征,我们计算X008与其它车型的距离,例如与X001的距离为类似的,可以算出X008与其它所有车型的距离(三)KNN的实际应用4.4.4机器学习应用实例:KNN用户行为型号价格(万元)距离d略过X0012311浏览X002417略过X003925浏览X004286

?X00834选取与被测车辆距离最小的k个点(一般k为奇数,本例k=3)作为分类判断的依据,即图中蓝色部分的3种车型,2种为用户感兴趣的车型,1种为用户无兴趣车型;按简单的少数服从多数原则,可推测车辆X008也是用户感兴趣的车型。(三)KNN的实际应用4.4.4机器学习应用实例:KNN234128934(四)KNN算法的思考讨论:这个图中,C点预测是什么?为什么?4.4.4机器学习应用实例:KNNC?学生可能讨论出新的ideaC?大圈区域

K=94:5,粉色圆点小圈区域k=54:1,绿色方块如何确定C的类别K个近邻?学生可能讨论出新的idea(四)KNN算法的思考讨论:这个图中,C点预测是什么?为什么?4.4.4机器学习应用实例:KNN如果考虑减小KNN算法中k的取值k取1待预测点的分类只依赖于与之最近的点,分类结果随机性

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论