深度学习案例教程 课件3.5 感知机的原理(扩展知识阅读)_第1页
深度学习案例教程 课件3.5 感知机的原理(扩展知识阅读)_第2页
深度学习案例教程 课件3.5 感知机的原理(扩展知识阅读)_第3页
深度学习案例教程 课件3.5 感知机的原理(扩展知识阅读)_第4页
深度学习案例教程 课件3.5 感知机的原理(扩展知识阅读)_第5页
已阅读5页,还剩2页未读 继续免费阅读

付费下载

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

扩展知识阅读-感知机原理

M-P模型

M-P模型是首个模拟生物神经元的结构和工作原理构造出来的一个抽象和简化了的数学模型。它由心理学家沃伦•麦卡洛克(WarrenMcCulloch)和数理逻辑学家沃尔特•皮兹(WalterPitts)在1943年提出并以二人的名字命名。扩展知识阅读-感知机原理

感知机模型

感知机(Perceptron)模型是由美国心理学家弗兰克•罗森布拉特于1957年提出的一种具有单层计算单元的神经网络。该模型旨在建立一个线性超平面来解决线性可分问题。它的基本结构如图所示。表示一个只有两个输入神经元和一个输出神经元的单层感知机结构。

扩展知识阅读-感知机原理

感知机学习机制

与M-P模型的人为设定参数值不同,感知机模型可以通过对样本数据的训练自动获得对参数更新的结果。罗森布拉特教授给出了感知机模型的学习机制,其过程可以概括如下:(1)准备训练样本和初始化权值参数。

(2)加入一个训练样本,并计算实际输出值。

(3)比较实际输出值和期望输出值的大小,如果相同,则参数不变。

(4)对每个训练样本重复步骤(3),直到计算的误差为0或者小于某个指定的值。扩展知识阅读-感知机原理

感知机模型的局限性

这种只有输入层和输出层的感知机模型在发展几年后遇到了一些局限,它仅对线性问题具有分类能力。

为什么感知机只可以解决线性问题?这是由它本身模型设定决定的,根据其线性方程可以分割开两个空间,其中一个空间输出1,另一个空间输出0,而该直线就是二维输入样本空间上的一条分界线。它只能表示由一条直线分割的空间,而对由曲线分割而成的非线性空间却无能为力。为了解决单层感知机模型的线性不可分问题,人们提出了多层感知机模型。扩展知识阅读-感知机原理

多层感知机模型

感知机的局限性就在于它只能表示由一条直线分割的空间。由直线分割而成的空间称为线性空间。线性、非线性这两个术语在机器学习领域很常见,实际上,感知机的绝妙之处在于它可以“叠加层”,形成多层感知机模型(MultilayerPerceptron,MLP)。

单层感知机可以拟合一个超平面y=a1+b2,适合于线性可分的问题,而对于线性不可分的问题则无能为力,例如异或问题。异或问题可以通过多层感知机解决,如图所示。扩展知识阅读-感知机原理

直到20世纪80年代,戴维•鲁姆哈特(DavidRumelhart)和詹姆斯•麦克莱兰(JamesL.McCelland)在1986年发表了《并行分布式处理》,其中对具有非线性连续变换函数的多层感知机的反向传播(BackPropagation,BP)算法进行了详尽的分析。其训练过程使用误差反向传播算法(ErrorBackPropagation),即BP算法。BP算法最早有沃博斯于1974年提出,鲁梅尔哈特等人进一步发展了该理论。BP算法的基本过程如下: (1)前向传播计算:由输入层经过隐含层向输出层的计算网络输出。 (2)误差反向逐层传递:网络的期望输出与实际输出之差的误差信号由输出层经过隐含层逐层向输入层传递。

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论