《AI5机器学习》PPT课件.ppt

上传人：y*** IP属地：四川上传时间：2020-03-22 格式：PPT 页数：46 大小：220.51KB 积分：15 举报 版权申诉

已阅读5页，还剩41页未读，继续免费阅读

版权说明：本文档由用户提供并上传，收益归属内容提供方，若内容存在侵权，请进行举报或认领

文档简介

机器学习 MachineLearning Agenda 机器学习概述归纳学习决策树学习基于范例的学习 CBR 解释学习强化学习机器学习概述 1 什么是机器学习学习是使系统在不断重复的工作中对本身能力的增强和改进使得系统下一次完成同样或类似的任务时比上一次更有效即通过对人类学习过程和特点的研究建立学习理论和方法并应用于机器以改进机器的行为和性能 1 学习是一个过程学习是经验积累的过程这个过程可能很快也可能很漫长 2 学习是对一个系统而言这个系统可能是一个计算机系统或一个人机系统 3 学习能够改变系统的性能这只说明对系统性能的改进但是并未限制改进的方法从人工智能的角度看机器学习是一门研究使用计算机获取新的知识和技能提高现有计算机求解问题能力的科学机器学习概述 2 为什么要研究机器学习必要性理解学习的本质和建立学习系统是AI研究的目标之一现有的大多数AI系统都是演绎的没有归纳推理因而不能自动获取和生成知识可行性学习的过程是信息处理的过程这包括直接记忆和经过推理已有工作说明可以实现一定程度的机器学习机器学习概述 3 机器学习的研究目标和困难研究目标通用学习算法通过对人类学习过程的研究探索各种可能的学习算法建立独立于具体应用领域的通用学习算法认知模型研究人类学习机理的认知模型工程目标解决专门的实际问题并开发完成这些任务的工程系统困难学习系统性能的预测更加困难获取知识的本质还是猜想由特定的观察和类比生成的知识不可能证明其正确性机器学习概述 4 学习的一种模型环境外部信息的来源它将为系统的学习提供有关信息知识库代表系统已经具有的知识学习环节系统的学习机构它通过对环境的感知取得外部信息然后经分析综合类比归纳等思维过程获得知识生成新的知识或改进知识库的组织结构执行环节基于学习后得到的新的知识库执行一系列任务并将运行结果报告学习环节以完成对新知识库的评价指导进一步的学习工作是该模型的核心环境学习环节知识库执行环节机器学习概述 5 机器学习的研究大致可以分为三个阶段五六十年代的探索阶段主要受神经生理学生理学和生物学的影响研究主要侧重于非符号的神经元模型的研究主要研制通用学习系统即神经网络或自组织系统主要成果有感知机 Perceptron Friedberg等模拟随机突变和自然选择过程的程序 Hunt等的决策树归纳程序CLS 机器学习概述 6 七十年代的发展阶段由于当时专家系统的蓬勃发展知识获取成为当务之急这给机器学习带来了契机主要侧重于符号学习的研究机器学习的研究脱离了基于统计的以优化理论为基础的研究方法提出了基于符号运算为基础的机器学习方法并产生了许多相关的学习系统主要系统和算法包括 Winston的积木世界学习系统 Michalski基于逻辑的归纳学习系统AQVAL Michalski和Chilausky的AQ11 Quinlan的ID3程序Mitchell的版本空间方法机器学习概述 7 八九十年代至今的鼎盛阶段理论研究和应用研究也有了新的突破机器学习的研究进入了全面的系统化的时期主要成果有一方面传统的符号学习的各种方法已日臻完善 Michalski等将AQ11扩充为一个多功能学习系统AQ15 ID3算法中使用了熵从而使决策树归纳得到了很大的改进科学发现系统BACON开辟了无导师学习的两个重要研究领域神经网络学习在消沉了一段时期后又重新蓬勃发展起来了同时计算机硬件技术的高速发展也为开展大规模和高性能的人工神经网络提供了保障使得基于神经网络的连接学习从低谷走出发展迅猛其中Rumelhart等人提出的BP模型提供了一个训练多层网络的实际可行的方法克服了Perceptron的大部分局限性机器学习概述 8 另一方面机器学习的基础理论的研究越来越引起人们的重视 1984年美国学者Valiant提出了基于概率近似正确性的学习理论 PAC学习对布尔函数的一些特殊子类的可学习性进行了探讨将可学习性与计算复杂性联系在一起并由此派生出了计算学习理论 COLT 我国学者洪家荣教授证明了两类布尔表达式析取范式和合取范式都是PAC不可学习的揭示了PAC方法的局限性 1995年 Vapnik出版了统计学习理论一书对PAC的研究是一种理论性存在性的 Vapnik的研究却是构造性的他将这类研究模型称为支持向量机SVM SupportVectorMachine 机器学习概述 9 机器学习的研究方法按推理策略分类 1 演绎学习是一种常规的逻辑推理方法其推理的过程就是从公理出发经过逻辑变换推导出结论 2 归纳学习环境或教师提供一系列正例和反例通过归纳推理机器将这些例子进行推广产生一个或一组一般的概念描述 3 类比学习利用两个不同领域目标域和源域知识的相似性从源域的知识包括相似的特征和其他特征推断出目标域的相应知识的推理方法 4 基于解释的学习系统已知某个理论及该理论的一个实例通过解释为什么这一实例可以用理论来解决从而产生关于待学概念的一个解释 Agenda 机器学习概述归纳学习决策树学习基于范例的学习 CBR 解释学习强化学习归纳学习 1 归纳学习 InductiveLearning 就是从个别到一般根据某个概念的一系列已知的正例和反例从中归纳出一个一般的概念描述旨在从大量的经验数据中归纳抽取出一般的判定规则和模式是机器学习中最核心最成熟的分支归纳学习也称为经验学习归纳学习依赖于经验数据基于相似性的学习归纳学习依赖于数据间的相似形归纳的操作泛化 Generalization 扩展某假设的语义信息使其能够包含更多的正例特化 Specialization 泛化的相反操作用于限制概念描述的应用范围归纳学习 2 归纳学习的分类和研究领域符号学习有导师学习实例学习导师事先将训练例子经验数据分类正负例子由于它产生规则所以也称为概念学习无导师学习事先不知道训练例子的分类概念聚类机器发现神经网络本质上是实例学习为区别起见称为联结学习学习的计算理论传统的算法复杂性分析概率近似正确性学习研究计算学习理论实例学习 1 基本思想环境提供给系统一些特殊的实例这些例子事先由施教者划分为正例和反例实例学习由此进行归纳推理产生适用于更大范围的一般性知识得到一般的规则它将覆盖所有的正例并排除所有的反例环境提供给学习环境的例子是低水平的信息这是在特殊情况下执行环节的行为学习环节归纳出的规则是高水平的信息可以在一般情况下用这些规则指导执行环节的工作实例学习 2 双空间模型例子空间要考虑的问题示教例子的质量例子空间的组织和搜索方法规则空间要考虑的问题形成知识的归纳推理方法搜索规则空间的方法对规则空间的要求例子空间规则空间选择例子解释例子从例子中提取出用于搜索规则空间的信息也就是把示教例子变换成易于进行符号归纳的形式确定需要哪些新的例子和怎样得到这些例子实例学习 3 按规则空间搜索方法分类数据驱动方法变形空间方法采用统一的形式表示规则和例子改进假设方法例子和规则的表示不统一程序根据例子选择一种操作用该操作修改H中的规则模型驱动方法产生和测试方法针对示教例子反复产生和测试假设的规则利用基于模型的知识产生假设的规则便于只产生可能合理的假设方案示例方法使用规则方案的集合来限制可能合理的规则形式最符合示教例子的规则被认为是最合理的规则实例学习 4 按任务的复杂性划分为学习单个概念由系统提供的某个概念的正例和反例只要求系统归纳出一个概念的描述规则学习多个概念要求归纳出多个相互独立的概念学习执行多步任务执行环节使用一个操作序列去完成任务即执行环节进行任务规划因此归纳出的规则应该是进行任务规划的规则变形空间方法 1 基本思想以整个规则空间为初始的假设规则集合H 根据示教例子中的信息对集合H进行一般化或特殊化处理逐步缩小集合H 最后使H收敛为只含要求的规则规则空间中的偏序关系它是按一般性和特殊性来建立的一种概念之间的关系排序后的变形空间最上面是最一般的规则概念是没有描述的点所有的例子都符合这一概念最下面一行的各点是示教正例对应的概念每个点的概念只符合一个正例变形空间方法 2 假设规则的集合H H是规则空间的子集H中最一般的元素组成的子集称为G集合H中最特殊的元素组成的子集称为S集合在规则空间中 H是G和S中间的一段可以用G和S来表示H变形空间方法初始 G是最上面一个点 S是最下面的直线示教正例 H为整个规则空间搜索过程 G下移 S上移 H逐步缩小结果 H收敛为只含一个要求的概念变形空间方法 3 消除侯选元素算法 1 正规的初始H集是整个规则空间这时S包含所有可能的示教正例最特殊的概念 2 接收一个新的示教例子如果是正例去掉G中不覆盖新正例的概念然后修改S为由新正例和S原有的元素共同归纳出的最特殊的结果如果是反例从S中去掉覆盖该反例的概念然后修改G为由新反例和G原有元素共同特殊化为最一般的结果 3 若G S 且是单元集合则转 4 否则转 2 4 输出H中的概念即G和S 变形空间方法 4 变形空间法的缺点 1 抗干扰能力差变形空间法是数据驱动的方法所有数据驱动的方法都难以处理有干扰的训练例子算法得到的概念应满足每个示教例子的要求所以一个错误的例子会造成很大的影响 2 无法发现析取概念 Agenda 机器学习概述归纳学习决策树学习基于范例的学习 CBR 解释学习强化学习决策树学习 1 决策树通过把实例从根节点排列到某个叶子节点来分类实例叶子节点即为实例所属的分类树上每个节点说明了对实例的某个属性的测试节点的每个后继分支对应于该属性的一个可能值正实例产生正值决策的实例负实例产生负值决策的实例决策树代表实例属性值约束的合取的析取式从树根到树叶的每一条路径对应一组属性测试的合取树本身对应这些合取的析取决策树学习 2 决策树学习 3 ID3算法1 是利用信息论原理对大量样本的属性进行分析和归纳而产生的 2 决策树的根结点是所有样本中信息量最大的属性树的中间结点是该结点为根的子树所包含的样本子集中信息量最大的属性决策树的叶结点是样本的类别值 3 用信息增益即信息论中的互信息来选择属性作为决策树的结点决策树学习 4 熵 entropy 给定有关某概念的正例和负例的集合S 对此BOOLEAN分类的熵为 Entropy S poslog2 pos neglog2 neg pos 和 neg 分别表示S中正例和负例的比例并定义 0log2 0 0如果分类器有c个不同的输出则 Entropy S ci 1pilog2 pi pi表示S中属于类i的比例决策树学习 5 例1 p1 p2 1 2H1 1 2 log2 1 2 1 2 log2 1 2 1例2 p1 1 4p2 3 4H2 1 4 log2 1 4 3 4 log2 3 4 0 81例3 p1 1p2 0H3 1 log21 0 决策树学习 5 实例集合S中属性A的信息增益为 Gain S A Entropy S SV S Entropy Sv v valuesofASv表示S的子集其属性A的值为V 决策树学习 6 思路考察任一个属性计算其熵值对这个特定属性考察根据其不同的属性值分成的若干子集对任意子集考察不同的类别计算其熵值并求和从所有属性中选择熵值最小或增益最大的属性作为当前决策节点归纳偏置 1 成功的归纳主要决定于经验数据先验知识对要学习的概念本质的假定归纳偏置是指学习程序用来限制概念空间或者在这个空间中选择概念的任何标准它是指概念学习中除了正反例子外影响假设选择的所有因素描述假设的语言程序考虑假设的空间按什么顺序假设的过程承认定义的准则即研究过程带有已知假设可以终止还是应该继续挑选一个更好的假设归纳偏置 2 必要性 1 学习空间变得越来越大如果没有一些方法来修剪它们基于搜索的学习就没有实用性 2 归纳泛化自身的本质泛化并不保真归纳偏置 3 归纳偏置的目标是用这样一种方式来限制目标概念集我们既可以有效的搜索集合还可以找到高质量的概念定义可以将概念的质量定义为它们能对不包含在训练实例集合中的物体正确分类的能力归纳偏置不是特定的学习算法的属性而概念表示语言的属性可以包括效率和正确性学习算法搜索概念空间如果这个空间可管理并且包含性能很好的概念则任何合理的学习算法应该能找到这些定义如果空间非常复杂算法的成功完成就会受到限制 Agenda 机器学习概述归纳学习决策树学习基于范例的学习 CBR 解释学习强化学习 CBR 1 人们为了解决一个新问题先是进行回忆从记忆中找到一个与新问题相似的范例然后把该范例中的有关信息和知识复用到新问题的求解之中在基于范例推理 Case BasedReasoning 简称CBR 中把当前所面临的问题或情况称为目标范例 targetcase 而把记忆的问题或情况称为源范例 basecase 粗略地说基于范例推理就是由目标范例的提示而获得记忆中的源范例并由源范例来指导目标范例求解的一种策略 CBR 2 范例 case 范例是一段带有上下文信息的知识该知识表达了推理机在达到其目标的过程中能起关键作用的经验具体来说一个范例应具有如下特性范例表示了与某个上下文有关的具体知识这种知识具有可操作性范例可以是各式各样的可有不同的形状和粒度可涵盖或大或小的时间片可带有问题的解答或动作执行后的效应范例记录了有用的经验这种经验能帮助推理机在未来更容易地达到目标或提醒推理机失败发生的可能性有多大等等 CBR 3 传统的推理观点是把推理理解为通过前因后果链如规则链演绎出结论的一个过程许多专家系统使用的就是这种规则链式的推理方法对于知识易于表示成启发式规则形式的问题来说基于规则的方法比较适合如分类问题和诊断问题等但是人们在遇到一个新的问题的时候一般先是回忆从记忆中找到一个与新的问题相似的案例然后把该案例中的有关信息和知识复用到新问题的求解之中基于范例推理中知识表示是以范例为基础范例的获取比规则获取要容易大大简化知识获取对过去的求解结果进行复用而不是再次从头推导可以提高对新问题的求解效率过去求解成功或失败的经历可以指导当前求解时该怎样走向成功或避开失败这样可以改善求解的质量对于那些目前没有或根本不存在可以通过计算推导来解决的问题如在法律中的判例基于范例推理能很好发挥作用 CBR 4 CBR采用的是和基于规则链推理完全不同的观点在CBR中使用的主要知识不是规则而是范例 case 这些范例记录了过去发生的种种相关情况对CBR来讲求解一个问题的结论不是通过链式推理产生的而是从记忆里或范例库中找到与当前问题最相关的范例然后对该范例作必要的改动以适合当前问题 CBR的基本思想是人们的推理过程是基于特殊的经验而不是一组总的指导原则和其他基于AI的推理方法比较 CBR是通过联想或类比从过去的案例出发把过去的案例和当前面临的问题相比较做出决策的过程问题的解答来自于过去的经验而不是规则这些经验以案例的方式存贮 CBR的过程模型基于范例的推理是一个回忆和调整或回忆和比较的过程在范例推理中范例用于辅助理解和分析情景并用于辅助解决问题我们的日常推理中情景的理解分析和问题的解决过程一般是相辅相成的当我们还没有理解一个问题所处的情景时是不可能解决该问题的另一方面我们又需要通过解决某个问题才能充分理解与它有关的情况我们常常通过采用一些评估方法去检验结果来评价求解结论的好坏同时我们在评估的过程中又需要解决新的问题 Agenda 机器学习概述归纳学习决策树学习基于范例的学习 CBR 解释学习强化学习解释学习 1 实例中进行学习历来是机器学习领域研究的焦点早期的工作基本上局限于归纳学习的范畴相应的研究成果很少或基本没有考虑背景知识对学习过程的影响因此这些方法从根本上来说是以数据为第一位的没有反映出人工智能领域基于知识的研究和发展倾向从20世纪80年代中期开始机器学习研究重点开始由以归纳方法为主的数据密集型学习方法的研究向多样化方法发展开始研究分析方法遗传算法连接学习等其中分析学习利用丰富的领域知识为背景只需要通过分析很少的几个例子通常是一个例子就能将例子泛化为对目标概念的解释通过泛化实例的解释而不是泛化实例自身分析方法主要依赖于演绎推理以产生更有效的问题求解知识如搜索控制知识因此分析学习的主要目的是提高问题的求解效率而不是获取新的概念描述解释学习 2 基于解释的学习是分析学习的主要方式基于解释的学习简称EBL 是将大量的成果汇集在一个统一简单的框架内通过分析为什么实例是某个目标概念的一个具体例子 EBL对分析过程一个解释加以推广剔去与具体例子有关的成分从而产生目标概念的一个描述 EBL的初始状态 DT DomainTheory 包含一组事实和规则用于证明解释训练实例如何满足目标概念 TC TargetConcept 是待学概念的一个非操作性描述 E为目标概念的一个例子 C OperationalityCriterion 是定义在概念描述上的一个二阶谓词用以表示学习得到的目标概念可用哪些基本的可操作的概念表示以使这些知识能用于问题求解活动解释学习 3 基于解释的学习过程可划分为下面两个步

人人文库> 全部分类> 教育资料 > 课件下载

温馨提示

1. 本站所有资源如无特殊说明，都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2. 本站的文档不包含任何第三方提供的附件图纸等，如果需要附件，请联系上传者。文件的所有权益归上传用户所有。
3. 本站RAR压缩包中若带图纸，网页内容里面会有图纸预览，若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 人人文库网仅提供信息存储空间，仅对用户上传内容的表现方式做保护处理，对用户上传分享的文档内容本身不做任何修改或编辑，并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容，请与我们联系，我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

《AI5机器学习》PPT课件.ppt

文档简介

温馨提示

最新文档

评论

《AI5机器学习》PPT课件.ppt

文档简介

温馨提示

最新文档

评论

相关文档