第五机器学习2_第1页
第五机器学习2_第2页
第五机器学习2_第3页
第五机器学习2_第4页
第五机器学习2_第5页
已阅读5页,还剩25页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第五机器学习第1页,共30页。机器学习的发展史机器学习的发展分为4个时期第一阶段是在50年代中叶到60年代中叶,属于热烈时期。第二阶段在60年代中叶至70年代中叶,被称为机器学习的冷静时期。第三阶段从70年代中叶至80年代中叶,称为复兴时期。机器学习的最新阶段始于1986年。2第2页,共30页。机器学习进入新阶段的表现机器学习已成为新的边缘学科并在高校形成课程。综合各种学习方法机器学习与人工智能问题的统一性观点正在形成。各种学习方法的应用范围不断扩大。数据挖掘和知识发现的研究已形成热潮。与机器学习有关的学术活动空前活跃。

3第3页,共30页。5.2机器学习的主要策略和基本结构

机器学习的主要策略按照学习中使用推理的多少,机器学习所采用的策略大体上可分为4种———机械学习、通过传授学习、类比学习和通过事例学习。机械学习传授学习策略类比学习系统通过事例学习策略4第4页,共30页。机器学习系统的基本结构

1.学习系统的基本结构

环境学习知识库执行学习系统的基本结构5第5页,共30页。2.影响学习系统设计的要素影响学习系统设计的最重要因素是环境向系统提供的信息,或者更具体地说是信息的质量。知识库是影响学习系统设计的第二个因素。知识的表示有特征向量、一阶逻辑语句、产生式规则、语义网络和框架等多种形式。6第6页,共30页。机械学习1.机械学习模式机械学习是最简单的学习方法。机械学习就是记忆,即把新的知识存储起来,供需要时检索调用,而不需要计算和推理。它是一种最基本的学习过程。5.3常见的几种学习方法7第7页,共30页。存储计算推导归纳算法与理论机械记忆搜索规则数据化简级别图

Lenat,Hayes-Roth,和Klahr等人于1979年关于机械学习提出一种有趣的观点8第8页,共30页。2.机械学习的主要问题存储组织信息:要采用适当的存储方式,使检索速度尽可能地快。环境的稳定性与存储信息的适用性问题:机械学习系统必须保证所保存的信息适应于外界环境变化的需要。存储与计算之间的权衡:对于机械学习来说很重要的一点是它不能降低系统的效率。7.3机械学习9第9页,共30页。解释学习解释学习过程和算法

1986年米切尔(Mitchell)等人为基于解释的学习提出了一个统一的算法EBG:训练例子操作准则知识库新规则目标概念10第10页,共30页。EBG求解问题的形式可描述于下:给定:(1)目标概念描述TC;(2)训练实例TE;(3)领域知识DT;(4)操作准则OC。求解:训练实例的一般化概括,使之满足:(1)目标概念的充分概括描述TC;(2)操作准则OC。11第11页,共30页。基于事例的学习当无法建立好的模型时,通过记录事例进行学习是一种可取的方法。这时,在信息被应用之前,不对它进行任何处理。采用基于事例的学习方法时,首先,任何时候都可以应用相容启发(consistencyheuristic)方法,把某个预先观察过的事物的特性赋给另一个从未见过的新事物。其次,学会如何应用K-维树迅速地找到特征空间内的最近邻物体。

12第12页,共30页。最近邻物体的寻求(1)快速串行过程以对数次数求得最近邻物体

(2)并行硬件更快求得最近邻物体

13第13页,共30页。定义:决策树是一种表示,是一种语义树。树上,(a)每个节点与一个可能回答集合有关。(b)每个非终叶节点与某个测试有关,该测试把它的可能回答集合分解为对应于不同测试结果的一些子集。(c)每个分支把一个具体的测试结果子集传给另一个节点。定义:

k-维树是一种表示,它是一种决策树,树上,(a)可能回答集合由点组成,其中有个点可能是给定点的最近邻点。(b)每个测试规定一个坐标、一个阈值和一个围绕该阈值的不合点的中性区。(c)每个测试根据每个点处在阈值的哪一边而把点的集合分为两组。14第14页,共30页。基于概念的学习

归纳学习(inductivelearning)是研究最广的一种符号学习(symboliclearning)方法,它表示从例子设想出假设的过程。在进行归纳学习时,学习者从所提供的事实或观察到的假设进行归纳推理,获得某个概念。归纳推理是个从部分到全体,从特殊到一般的推理过程。从应用角度看,归纳学习可分为概念学习、概念聚集和启发学习3种。

15第15页,共30页。概念学习(conceptlearning)研究遵循两条不同的路线,即有两种不同的观点。一种是基于工程方法的概念学习,它从可能的学习机理出发(不管这些机理是否存在于生命组织内),试图试验并确定概念学习的工程方法。另一种是基于认知建模的概念学习,极力开发出人类概念学习的计算理论。本节仅讨论概念学习问题,而且只从工程角度来研究基于概念的学习。概念学习的首要任务在于构造类型定义。在本节中,我们首先讨论类型定义,包括统计定义法和结构定义法,然后研究分类程序。16第16页,共30页。基于类比的学习类比(analogy)是一种很有用的和有效的推理方法,它能够清晰简洁地描述对象间的相似性;同时,它也把某些测试相似性质的任务由演讲者(或教师)转移到听者(或学生)。例如,我说"肖锋像部消防车",还告诉你某些情况。不过,要使用这条信息,你还得确定肖锋在哪些方面像部消防车。

17第17页,共30页。归纳学习(1)枚举归纳(2)联想归纳(3)类比归纳(4)逆推理归纳(5)消除归纳

18第18页,共30页。强化学习强化学习(reinforcementlearning,又称再励学习,评价学习)是一种重要的机器学习方法,在智能控制机器人及分析预测等领域有许多应用.但在传统的机器学习分类中没有提到过强化学习,而在连接主义学习中,把学习算法分为三种类型,即非监督学习(unsupervisedlearning)、监督学习(supervisedleaning)和强化学习.所谓强化学习就是智能系统从环境到行为映射的学习,以使奖励信号(强化信号)函数值最大,强化学习不同于连接主义学习中的监督学习,主要表现在教师信号上,强化学习中由环境提供的强化信号是对产生动作的好坏作一种评价(通常为标量信号),而不是告诉强化学习系统RLS(reinforcementlearningsystem)如何去产生正确的动作.由于外部环境提供的信息很少,RLS必须靠自身的经历进行学习.通过这种方式,RLS在行动-评价的环境中获得知识,改进行动方案以适应环境.19第19页,共30页。强化学习的基本模型和原理20第20页,共30页。5.4基于神经网络的学习神经网络的组成与特性

1.生理神经元的结构与功能21第21页,共30页。2.人工神经元的组成与分类人工神经网络(artificialneuralnets,ANN)或模拟神经网络是由模拟神经元组成的,可把ANN看成是以处理单元PE(processingelement)为节点,用加权有向弧(链)相互连接而成的有向图。其中,处理单元是对生理神经元的模拟,而有向弧则是轴突-突触-树突对的模拟。有向弧的权值表示两处理单元间相互作用的强弱。22第22页,共30页。图中,来自其它神经元的输入乘以权值,然后相加。把所有总和与阈值电平比较。当总和高于阈值时,其输出为1;否则,输出为0。大的正权对应于强的兴奋,小的负权对应于弱的抑制。23第23页,共30页。ANN的数学描述令来自其它处理单元(神经元)i的信息为Xi,它们与本处理单元的互相作用强度为Wi,i=0,1,…,n-1,处理单元的内部阈值为θ。那么本神经元的输入为

而处理单元的输出为

式中,xi为第i个元素的输入,wi为第i个元素与本处理单元的互联权重。f称为激发函数(activationfunction)或作用函数。它决定节点(神经元)的输出。该输出为1或0取决于其输入之和大于或小于内部阈值θ。24第24页,共30页。常用激发函数:25第25页,共30页。1.反向传播网络的结构26第26页,共30页。2.反向传播公式反向传播特性的数学论证是以下列两个概念为依据的:

1)设y为某些变量xi的平滑函数。我们想知道如何实现每个xi初始值的递增变化,以便尽可能快地增大y值,每个xi初始值的变化应当与y对xi的偏导数成正比,即

这个概念称为梯度法(gradientascent)。

(2)设y为某些中间变量xi的函数,而每个xi又为变量z的函数。我们要知道y对z的导数,即

这个概念称为连锁法(chainrule)。

27第27页,共30页。28第28页,共30页。3.反向传播学习算法

(1)选取比率参数r,

(2)进行下列过程直至性能满足要求为止:

①对于每一训练(采样)输入,

(a)计算所得输出。

(b)按下式计算输出节点的值

(c)按下式计算全部其它节点

(d)按下式计算全部

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论