




已阅读5页,还剩70页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
人工智能(ai )人工智能,第7章:机器学习,内容提要,第7章:机器学习系统,1 .机器学习的基本概念,2 .机器学习策略和基本结构,3 .归纳学习,4 .模拟学习,5 .解释学习,6 .神经网络阿法犬通过神经网络学习了所有高水平围棋棋谱,也许是历史上约20万个职业棋谱,得到了如何落在棋盘上的直觉。 相似的深度学习是近年来出现的,现在这个技术也有应用,最简单的例子是通过深度学习来识别猫。 根据这个认识验证,提出了某照片是否有癌细胞,某铁路沿线的轨道是否有磨损,军事作战中,对方的视线是否有坦克等更现实的应用。 谷歌的自动驾驶,其中重要的是识别道路、信号机、路标等,这都是通过深度学习获得的。 阿法犬走在通用学习的道路上。 那个评价函数不是专家揭发的。 作者只是做了基本框架,除了围棋的基本规则,没有事先知识。 可以认为是新生儿的大脑和白纸。 然后,在人类达人对决的3000万局面下直接训练,自动调节其神经网络的参数,使其行为接近人类达人。 这样,阿法犬有着基本的棋感,一看到局面就能知道是好还是坏。 阿法犬的核心技术也包括战略网络的训练和蒙特卡洛检索。 内容提要,第7章:机器学习系统,1 .机器学习的基本概念,2 .机器学习战略和基本结构,3 .归纳学习,4 .模拟学习,5 .解释学习,6 .神经网络学习,8 .其他7 .知识发现,机器学习是人工智能的核心,让机器模拟人学习行为机器学习在科学和工程的很多领域有着非常广泛的应用,如金融分析、数据挖掘、生物信息学、医学诊断等。 在生活常见的智能系统中,电子商务、手写输入、邮件过滤等机器学习算法也广泛应用。 机器人参加人类未来的生活和工作。 机器人的自主学习离不开脸部识别技术。 2015年3月16日,马云在德国参加活动时,向嘉宾展示了为“SmiletoPay”扫脸的技术。 在网络购物后的支付认证阶段,取代了传统的密码,通过扫脸实现了“擦脸支付”。 机器学习的基本概念、机器学习两个学派机器学习:人工智能的重要分支结构具有学习能力的智能系统知识、推论、学习手段:统计、逻辑、代数统计机器学习从大量样本出发,使用统计方法,统计规则监督学习、无监督学习、半监督学习问题:分类、聚类、回归、 机器学习的基本概念,机器学习的定义西蒙(Simon,1983 ) :学习使系统的适应性发生变化,这种变化发现在系统重复同样的工作或类似工作时,能做得更好。 明斯基(Minsky,1985 ) :学习是人们头脑中有用的变化。 学习是有特定目的的知识获取和能力成长过程,其内在行为是知识获取、经验积累、规律发现等,其外部表现是性能改善、环境适应、自我完善等。 机器学习是研究使用机器模拟人的学习活动方法的学科。 机器学习的基本概念,机器学习的任务是基于有限样本集q,估计这个世界w的模型,使这个世界变真。 机器学习的基本概念、机器学习的三要素一致假设:假设世界w和样本集q具有相同性质的机器学习的条件。样品空间划分:将样品集放置在n维空间,寻找决策面(等效关系),将决定了问题的不同对象划分为不交叉的区域。 泛化能力:从有限样本集合得到的规则对学习集以外的数据是否有效。 泛化能力决定了模型对世界的有效性。 内容提要,第七章:机器学习系统,1 .机器学习的基本概念,2 .机器学习战略和基本结构,3 .归纳学习,4 .模拟学习,5 .解释学习,6 .神经网络学习,8 .其他7 .知识发现,机器学习战略和基本结构,机器学习的主要策略:在学习中使用推论机器学习采用的策略大致分为四种机器学习:记忆学习方法,即记忆新知识,根据需要检索呼叫,不需要计算和推论。 示教学习:外部输入知识和内部知识的表达不完全一致,系统在接受外部知识时需要推理、翻译、转换。 类比学习:需要发现当前任务和已知知识的相似点,通过类比提出完成当前任务的方案。 学习:有必要从正例和负例组中分析一般规则,总结,在新的任务中推进、验证、修改规则。 机器学习策略和基本结构、学习系统的基本结构影响学习系统设计的要素环境:环境为系统提供信息的水平(一般化程度)和质量(正确性)知识库:表现能力、容易推论、容易修正、容易扩展知识表示。 内容提要,第七章:机器学习系统,1 .机器学习的基本概念,2 .机器学习战略和基本结构,3 .归纳学习,4 .模拟学习,5 .解释学习,6 .神经网络学习,8 .其他7 .知识发现,归纳学习,归纳学习归纳学习的模式:实验计划流程通过实例空间的探索完成实例的选择,并将这些选择所得到的活动实例提交给说明过程。 说明过程适当地转换实例,将活动实例转换为规则空间的特定概念,以引导规则空间的搜索。 归纳学习、归纳学习(InductionLearning )归纳学习是目前研究最多的学习方法,其学习目的是获得新概念,构建新规则,发现新理论。 根据归纳学习的教师指导的有无,可以将其分为例示学习:提供学习者某个概念的正例和负例,学习者总结整体的概念记述(规则),使该记述符合所有的正例,排除所有的负例。 观察发现学习:概念聚类:按照一定的方式和规范进行分组,总结概念机器发现:从数据和实例中发现新的知识,内容摘要,第7章:机器学习系统,1 .机器学习的基本概念,2 .机器学习策略和基本结构,3 .归纳学习,4 .模拟学习,5 .解释学习, 6 .神经网络学习,8 .除此之外,7 .知识发现,模拟学习类比推理和类比学习方式类比学习(learningbyanalogy )是通过比较类比,即类似的东西而进行的学习。 类比学习利用两个不同领域(源域目标域)的知识的相似性,通过类比从源域的知识(包括相似特征和其他性质)导出目标域的知识,实现学习。 例如,1 .一次也没开过卡车的司机,只要知道开car,就可以完成开卡车的任务。 2 .如果把某人比作消防车,通过观察消防车的行动,可以推测该人的性格。 模拟学习、模拟推理和模拟学习方式的模拟学习系统可以使现有的计算机应用系统适应新的领域,完成未设计的类似功能。类比推理过程:回忆和联想:目前情况的类似情况的选择:选择最类似的情况和相关知识建立对应关系:类似要素间的映射变换:解问题或产生新的知识,类比学习,类比学习研究类型问题解决型的类比学习:在解新问题时,要想起以前是否解了类似问题预测推论型的类比学习传统的类比法:为了不完全确定的推断其他属性因果关系型:已知因果关系S1:A-B,如果有a-a,b有可能满足A-B,内容提要,第7章:机器学习系统,1 .机器学习的基本概念,2 .机器4 .类比学习、5 .解释学习、6 .神经网络学习、8 .其他7 .知识发现、解释学习、解释学习(EBL )解释学习兴起于1980年代中期,基于有任务领域的知识和所学习的概念知识例如,学生基于教师提供的目标概念、其概念的一个例子、领域理论和可操作的标准,首先构建说明该例子满足目标概念的理由的说明,其次,说明作为目标概念普及的满足可操作的标准的充分条件。 解释学习、解释学习过程和算法米切尔提出了解释学习的统一算法EBG,建立了基于解释的摘要过程,通过知识的逻辑表现和演绎推理进行了问题解决。 其一般性的描述,给出了:领域知识DT目标概念TC训练实例TE操作性规范oc :满足oc的TC相关的充分条件,解释学习、EBG算法可以分为两个阶段:1.结构解释:用领域知识演绎,证明给予系统的训练实例为什么是满足目标概念的实例例如,学习的目标概念是“一个物体(Obj1)可以安全地放置在另一个物体(Obj2)上”,即,安全堆叠(Obj1, Obj2)的区域知识被解释为是将一个物体放置在另一个物体上的安全标准来学习,EBG算法可以安全地将x放置在y上,除非区域知识: fragile (y )safe-to-stack (x-y ) : y不容易损坏y)Safe-To-Stack(x,y):x比y轻时,x能够安全地放在y上的Volume(p,v)Density(p table )如果weight (p,15):是桌子,p的重量是15Weight(p1 ), w1 )当87-222222222222652 p2 ) :的重量为w1,p2的重量为w2,w1小于w2时,p1比p2轻,解释学习、EBG算法为Safe-To-Stack(Obj1,obj 获得一般知识:任务:对上一步骤中获得的解释结构进行一般化的处理,获得关于目标概念的一般知识。 方法:将常数转换为变量,去除不重要的信息,只保留解决问题所需的重要信息。 例如,卷(O1,v1)Density(O1, d1)22喀嚓喀嚓喀嚓喀嚓喀嚓喀嚓喀嚓喀嚓喀嚓喀嚓喀嚓喀嚓喀嚓喀嚓6,内容摘要,第7章:机器学习系统,1 .机器学习的基本概念,2 .机器学习战略和基本构造,3 .归纳学习,4 .模拟学习,5 .解释学习,6 .机器学习8 .另外,7 .根据知识发现、神经网络学习、神经生理学研究,脑神经元是学习的基本单位,也是记忆的基本单位。 目前,关于脑的学习和记忆机制的研究有两个学派:化学学派:认为脑学习得到的信息记录在一个生物的大分子上。例如,蛋白质、核糖核酸和神经递质就像遗传信息被记录在DNA (脱氧核糖核酸)上一样。 突触补正学派:可以认为大脑学习得到的信息分布在神经元间的突触结合上。 从神经网络学习、突触修正学派的角度来看,大脑的学习和记忆过程实际上是训练中完成的突触连接权值的修正和稳定过程。 其中,学习表现是突触连接权值的修正,记忆是突触连接权值的稳定。 突触校正假说已经成为人工神经网络学习和记忆机制研究的心理学基础,与其对应的权重校正学派也一直是人工神经网络研究的主流学派。 突触修正学派认为,人工神经网络的学习过程总是调整网络连接权值的过程。 按照学习规则,神经学习可分为Hebb学习、纠错学习、竞争学习、随机学习等。 神经网络学习、Hebb学习Hebb学习的基本思想:神经网络中的一个神经元和与其直接连接的神经元同时处于兴奋状态时,这两个神经元之间的连接强度就会增强,反而应该变弱。 通过Hebb学习进行的连接权重值的调整,表示wij(t 1 )修正一次时刻t的权重值而得到的新的权重值,取正值,被称为学习因子,依赖于每次的权重值的校正量的xi(t )、xj(t )分别表示t时刻的第I个和第j个神经元的状态神经网络学习、纠错学习的基本思想:把神经网络的预期输出与实际输出的偏差作为连接权值调整的参考,最终减少这种偏差。 纠错学习是有领导的学习过程。 最基本的误差修正规则是连接权值的变化与神经元的期望输出和实际输出的差成比例。 其连接权重值的计算式中,yj(t )是神经元j的实际输出的dj(t )是神经元j的期望输出,神经网络学习、竞争学习的基本思想:网络中的某一组的神经元相互竞争响应外界刺激模式的权利,在竞争中获胜随机学习的基本思想:结合随机过程、概率和能量(函数)等概念,调整网络变量,使网络目标函数最大化(或最小化)。 他不仅可以接受减少能量函数(改善了性能)的变化,而且可以接受增加能量函数(性能恶化)的变化。 传感器是单层传感器学习算法单层传感器学习的例子BP网络学习Hopfield网络学习、神经网络学习、单层传感器学习实际上是基于纠错学习规则,使用反复的思想不断调整连接权值和阈值,直到满足结束条件为止的学习算法假设X(k )和W(k )分别通过学习算法第k次的反复来表示输入向量和权重向量,为了方便,将阈值固定为权重向量W(k )的第一分量,“-1”固定为输入向量X(k )的第一分量。 也就是说,W(k )和X(k )分别表示为X(k)=-1,x1(k ),x2(k ),xn(k)W(k)=(k ),w1(k ),w2(k ),wn(k)即x0(k)=-1,w0(k)=(k ) 单层传感器学习是指导者的学习,需要给出想输入样品的输出。 假定样本空间可以分为a、b两种,定义:的功能函数。 如果输入样本属于a类,输出为1,否则输出为-1。 期望输出:如果输入样本为a类,则期望输出为1,否则为-1。 单层传
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年中国铜版纸月历市场调查研究报告
- 2025年中国瓶装奶嘴市场调查研究报告
- 法人连带责任担保书
- 2025年中国家用制冷电器市场调查研究报告
- 2025年中国可折弯灯箱市场调查研究报告
- 车棚租赁与户外广告投放合作协议
- 高端餐饮拆伙协议书及退伙条款详尽规定
- 食品加工车间租赁合同
- 2024年度浙江省二级建造师之二建水利水电实务考前冲刺试卷A卷含答案
- 2025年中国仿皮搏击手套市场调查研究报告
- 2025至2030中国4K和8K超高清电视行业发展趋势分析与未来投资战略咨询研究报告
- 大骨节考试题及答案
- 消防在建工地课件
- 南海课件下载
- 彩钢板围挡施工与拆除一体化服务协议
- 中班安全标识课件
- CSCO恶性血液病诊疗指南(2025)解读
- T/CHTS 20036-2023公路桥梁用硬聚氯乙烯声测管
- 广东省风力发电内蒙古分公司广东能源集团招聘笔试题库2025
- 父亲节你了解你的爸爸吗礼赞父亲学会感恩模板
- 2023-2024学年安徽省合肥市六校联盟高一下学期期末联考地理试题(解析版)
评论
0/150
提交评论