神经网络基础.ppt

上传人：扣*** IP属地：宁夏上传时间：2019-12-20 格式：PPT 页数：52 大小：618.02KB 积分：18 举报 版权申诉

已阅读5页，还剩47页未读，继续免费阅读

版权说明：本文档由用户提供并上传，收益归属内容提供方，若内容存在侵权，请进行举报或认领

文档简介

第二章神经网络基础本章简单地介绍生物神经元神经元模型人工神经网络模型及其学习算法 2 第二章神经网络基础 2 1生物神经元模型 2 2人工神经元模型 2 3网络拓扑结构类型 2 4人工神经网络模型 2 5神经网络的学习 2 6小结 3 2 1生物神经元模型神经元是脑组织的基本单元是神经系统结构与功能的单元据统计大脑大约包含个神经元每个神经元于大约个其他的神经元相连接构成一个极为庞大而复杂的网络即生物神经元网络生物神经元网络中各神经元之间连接的强弱按照外部的刺激信号做自适应变化而每个神经元又随着所接受的的多个激励信号的综合结果呈现出兴奋与抑制状态大脑的学习过程就是神经元之间连接强度随外部刺激信息做自适应变化的过程大脑处理星系的结果有个圣经元状态的整体效果确定 4 生物神经元基本结构细胞体 cellbody 树突 dendrite 轴突 axon 突触 synapse 每一个神经元都通过突触与其他神经元联系突触的连接强度可随系统受到训练的强度而改变生物神经元结构 5 生物神经元功能兴奋与抑制传入神经元的冲动经整和后使细胞膜电位升高超过动作电位的阈值时即为兴奋状态产生神经冲动由轴突经神经末梢传出传入神经元的冲动经整和后使细胞膜电位降低低于阈值时即为抑制状态不产生神经冲动学习与遗忘由于神经元结构的可塑性突触的传递作用可增强与减弱因此神经元具有学习和遗忘的功能返回 6 2 2人工神经元模型人工神经网络是在现代神经生物学研究基础上提出的模拟生物过程以反应人脑某些特性的计算结构它不是人脑神经系统的真实描写只是特的某种抽象简化和模拟人工神经元是对生物圣经元的一种形式化描述他对生物神经元的信息处理过程进行抽象应用数序语言予以描述对生物神经元的结构与功能进行模拟并用模型图予以表达 7 1943年 mcculloch pitts 麦克洛奇皮兹根据生物神经元的动作原理提出了神经元模型即m p模型经过不断改进形成目前广泛应用的形式神经元模型对于神经元的处理机制该模型在简化的基础上提出以下6点假设进行描述 1 每个神经元都是一个多输入单输出的信息处理单元2 突触分兴奋性和抑制性两种类型3 神经元具有空间整合特性和阈值特性4 神经元输入与输出间有固定的时滞主要取决于突触的延迟5 忽略时间整合作用和不应期6 神经元本身是非时变的即其突触时延和突触强度均为常数 8 人工神经元是对生物神经元的一种模拟与简化它是神经网络的基本处理单元下图显示了一种简化的人工神经元结构它是一个多输入单输出的非线性元件人工神经元结构模型 9 人工神经元输入输出关系可描述为其中xj j 1 2 n 是从其它神经元传来的输入信号wji表示从神经元j到神经元i的连接权值 i为阈值f 称为激发函数或作用函数 2 1 有时为了方便起见常把看成是恒等于1的输入x0的权值这时式 2 1 的和式可写成 10 输出激发函数f 又称为变换函数它决定神经元节点的输出该输出为1或0 取决于其输入之和大于或小于内部阈值函数一般具有非线性特征下面几个图表示了几种常见的激发函数 1 阈值函数见图 a b 当yi取0或1时 f x 为图 a 所示的阶跃函数 11 当yi取 1或1时 f x 为图 b 所示的sgn函数 2 饱和型函数见图 c 12 4 双曲函数见图 d 5 s型函数见图 e 神经元的状态与输入作用之间的关系是在 0 1 内连续取值的单调可微函数称为sigmoid函数简称s型函数当趋于无穷时 s型曲线趋于阶跃函数通常情况下取值为1 13 6 高斯型函数见图 f 在径向基函数构成的神经网络中神经元的结构可用高斯函数描述如下返回 14 2 3网络拓扑结构类型层次型结构互联型结构网络的学习算法将在今后的小节中介绍 15 神经网络的连接模式层内连接本层内部神经元之间的连接可用来加强层内神经元之间的竞争循环连接指神经元到自身的连接用于不断增强自身的激活值使本次的输出与上次的输出相关层间连接指不同层之间的连接这种连接用来实现信号传递可以是前向的也可以是反向的返回 16 2 4人工神经网络模型人工神经网络是以工程技术手段来模拟人脑神经网络的结构与特征的系统利用人工神经元可以构成各种不同拓扑结构的神经网络就神经网络的主要连接形式而言目前已有数十种不同的神经网络模型其中前馈网络和反馈网络是两种典型的结构模型 17 1 前馈神经网络前馈神经网络又称前向网络如下图所示神经元分层排列有输入层隐层亦称中间层可有若干层和输出层每一层的神经元只接受前一层神经元的输入 18 目前大部分前馈网络都是学习网络它们的分类能力和模式识别能力一般都强于反馈网络典型的前馈网络有感知器网络误差反向传播 bp 网络等 19 2 反馈型神经网络反馈神经网络的结构如图所示若总节点神经元数为n 则每个节点有n个输入和一个输出即所有节点都是一样的它们之间都可相互连接 20 hopfield神经网络是反馈网络中最简单且应用广泛的模型它具有联想记忆的功能如果将lyapunov函数定义为寻优函数 hopfield神经网络还可以用来解决快速寻优问题返回 21 2 5神经网络的学习人工神经网络最有吸引力的特点就是它的学习能力学习方法是体现人工神经网络智能特征的主要指标离开了学习算法人工神经网络就失去了自适应自组织和自学习的能力人工神经网络的学习过程就是对它的训练过程所谓训练就是在将由样本向量构成的样本集合输入到人工神经网路的过程中按照一定方式去调整神经元之间的连接权使网络能将样本集的内涵以连接权矩阵的方式存储起来从而使网络在数据输入时可以给出适当的输出 22 目前神经网络的学习方法有多种按有无教师信号来分类可分为有教师学习无教师学习和再励学习等几大类在有教师的学习方式中网络的输出和期望的输出即教师信号进行比较然后根据两者之间的差异调整网络的权值最终使差异变小在无教师的学习方式中输入模式进入网络后网络按照预先设定的规则如竞争规则自动调整权值使网络最终具有模式分类等功能再励学习是介于上述两者之间的一种学习方式 23 有教师学习有教师学习也称有监督学习假设教师和神经网络同时要对从周围环境中抽取出来的训练向量即例子做出判断教师可以根据自身掌握的一些知识为神经网络提供期望响应期望响应一般都代表着神经网络完成的最优动作神经网络的参数可以在训练向量和误差信号的综合影响下进行调整误差信号可以定义为神经网络实际响应与预期响应之差这种调整可以逐步而又反复地进行其最终目的就是要让神经网络模拟教师信号 24 有教师学习 25 利用这种手段教师对环境掌握的知识就可以通过训练最大限度的传授给神经网络当条件成熟时就可以将教师信号排除在外让网络完全自主地应对环境可以采用训练样本的平方误差作为性能测试标准它可以定义为系统的一个带自由参数的函数该函数可以看作一个多维误差性能曲面简称误差曲面后面将要讨论的delta学习算法属于有教师学习它是一种闭环反馈系统但未知的环境不包含在循环中 26 实际误差曲面是所有可能的输入输出的平均有教师学习系统能够处理有用信息根据系统当前的行为计算出误差曲面的梯度误差曲面上任何一点的梯度指的是指向最速下降方向的向量给定一个设计好的算法来使代价函数最小而且有足够的输入输出数据集那么有教师学习往往可以很好地完成诸如模式分类函数逼近等任务 27 无教师学习在无教师学习范例中没有教师监视学习过程即神经网络没有任何例子可以学习无教师学习又可分为两类自组织学习无监督竞争学习 28 无教师学习 29 1 自组织学习即网络的学习过程完全是一种自我学习的过程不存在外部教师的示教也不存在来自外部环境的反馈指示网络应该输出什么或者是否正确自组织学习过程中网络根据某种规则反复地调整连接权以响应输入模式的激励直到网络最后形成某种有序状态也就是说自组织学习是靠神经元本身对输入模式的不断适应抽取输入信号的规律如统计规律一旦网络显现出输入数据的统计特征则网络就实现了对输入特征的编码即把输入特征记忆下来而且在记忆之后当它再出现时能把它识别出来 30 自组织学习能对网络的学习过程进行度量并优化其中的自由参数可以认为这种学习的评价准则隐含于网络内部神经网络的这种自组织特性来源于其结构的可塑性 1 自组织学习 31 2 无监督竞争学习在无监督竞争学习系统中没有外部的教师或则评价来监督学习的过程要求网络学习该度量而且自由参数将根据这个度量来逐步优化为了完成无监督竞争学习规则神经网络包括两层输入层和竞争层输入层接受有用的数据竞争层由相互竞争的神经元组成采用胜者全得的策略具有最大总输入的神经元的输出置1 赢得竞争而被激活其它神经元置0 连接权的调整仅在获胜神经元与输入之间进行其他皆不变 32 再励学习把学习看作试探评价奖或惩过程学习机选择一个动作输出作用于环境之后使环境的状态改变并产生一个再励信号奖或惩反馈至学习机学习机依据再励信号与环境当前的状态选择下一动作作用于环境选择的原则是使受到奖励的可能性增大 33 常用学习规则 hebb规则delta规则最小均方差规则概率式学习规则竞争式学习规则梯度下降规则kohonen 克豪南学习规则逆误差传播规则 34 1 hebb学习规则 hebb学习规则是一种联想式学习方法1949年生物学家d o hebbian基于对生物学和心理学的研究提出了学习行为的突触联系和神经群理论认为突触前与突触后二者同时兴奋即两个神经元同时处于激发状态时它们之间的连接强度将得到加强这一论述的数学描述被称为hebb学习规则hebb学习规则是一种无教师的学习算法它只根据神经元连接间的激活水平改变权值因此这种方法又称为相关学习或并联学习 35 hebb学习规则权向量的调整公式为权值的调整量与输入输出的乘积成正比经常出现的模式对权向量有最大的影响为此 hebb学习规则需预先设定权饱和值以防止输入和输出正负始终一致时出现权值无限制增长学习信号简单的等于神经元的输出 36 hebb学习过程框图 37 2 delta规则最小均方差规则由美国standford大学的windrow教授于60年代提出常用的规则之一改变单元间的连接权重来减小系统实际输出与期望输出之间的误差也称为最小方差规则适用于自适应信号处理非线性系统控制线性系统辨识等 38 39 现在的问题是如何调整权值w 使准则函数最小可用梯度下降法来求解其基本思想是沿着e的负梯度方向不断修正w值直到e达到最小这种方法的数学表达式为其中 40 用表示则有 w的修正规则为上式称为学习规则又称误差修正规则 41 定义误差传播函数为规则实现了e中的梯度下降因此使误差函数达到最小值但学习规则只适用于线性可分函数无法用于多层网络误差反向传播 backpropagation 简写为bp 网络的学习算法称为bp算法是在规则基础上发展起来的可在多层网络上有效地学习 42 概率式学习的典型代表是boltzmann机学习规则它是基于模拟退火的统计优化方法因此又称模拟退火算法boltzmann机模型是一个包括输入输出和隐层的多层网络但隐层间存在互联结构且网络层次不明显由于模拟退火过程要求高温使系统达到平衡状态而冷却即退火过程又必须缓慢地进行否则容易造成局部最小所以这种学习规律的算法收敛速度较慢 3 概率式学习规则 43 boltzmann机的训练过程就是根据规则对神经元i j间的连接权值进行调整的过程式中为学习速率pij表示网络受到学习样本的约束且系统达到平衡状态时第i个和第j个神经元同时为1的概率表示系统为自由运转状态且达到平衡状态时第i个和第j个神经元同时为1的概率 44 调整权值的原则是当时则权值增加否则减少权值这种权值调整公式称为boltzmann机学习规则即当小于一定值时学习结束 45 竞争学习属于无教师学习方式这种学习方式利用不同层间的神经元发生兴奋性联接以及同一层内距离很近的神经元间发生同样的兴奋性联接而距离较远的神经元产生抑制性联接在这种联接机制中引入竞争机制的学习方式称为竞争式学习它的本质在于神经网络中高层次的神经元对低层次神经元的输入模式进行竞争识别 4 竞争式学习规则 46 竞争式学习的思想来源于人脑的自组织能力大脑能够及时地调整自身结构自动地向环境学习完成所需执行的功能而并不需要教师训练竞争式神经网络亦是如此所以又把这一类神经网络称为自组织神经网络 4 竞争式学习规则 47 自组织神经网络要求识别与输入最匹配的节点定义距离为接近距离测度即其中 u为n维输入向量具有最短距离的节点选作胜者它的权向量经修正使该节点对输入u更敏感 48 定义nc 其半径逐渐减少至接近于零权值学习规则为在这类学习规则中关键不在于实节点的输出怎样与外部的期望输出相一致而在于调整权向量以反映观察事件的分布提供基于检测特性空间的活动规律的性能描写 49 5 梯度下降规则 delta规则是梯度下降规则的一个例子学习过程中保持误差曲线梯度下降可能出现局部最小应尽量避免 50 6 其他学习算法 kohonen 克豪

人人文库> 全部分类> 应用文书 > 事务文书

温馨提示

1. 本站所有资源如无特殊说明，都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2. 本站的文档不包含任何第三方提供的附件图纸等，如果需要附件，请联系上传者。文件的所有权益归上传用户所有。
3. 本站RAR压缩包中若带图纸，网页内容里面会有图纸预览，若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 人人文库网仅提供信息存储空间，仅对用户上传内容的表现方式做保护处理，对用户上传分享的文档内容本身不做任何修改或编辑，并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容，请与我们联系，我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

神经网络基础.ppt

文档简介

温馨提示

最新文档

评论

神经网络基础.ppt

文档简介

温馨提示

最新文档

评论

相关文档