神经网络的基本理论.ppt

上传人：n*** IP属地：四川上传时间：2020-03-26 格式：PPT 页数：97 大小：1.26MB 积分：15 举报 版权申诉

已阅读5页，还剩92页未读，继续免费阅读

版权说明：本文档由用户提供并上传，收益归属内容提供方，若内容存在侵权，请进行举报或认领

文档简介

1 第四章神经网络的基本理论 2 模糊控制从人的经验出发解决了智能控制中人类语言的描述和推理问题尤其是一些不确定性语言的描述和推理问题从而在机器模拟人脑的感知推理等智能行为方面迈出了重大的一步模糊控制在处理数值数据自学习能力等方面还远没有达到人脑的境界人工神经网络从另一个角度出发即从人脑的生理学和心理学着手通过人工模拟人脑的工作机理来实现机器的部分智能行为引言 3 人工神经网络简称神经网络 NeuralNetwork 是模拟人脑思维方式的数学模型神经网络是在现代生物学研究人脑组织成果的基础上提出的用来模拟人类大脑神经网络的结构和行为神经网络反映了人脑功能的基本特征如并行信息处理学习联想模式分类记忆等 20世纪80年代以来人工神经网络 ANN ArtificialNeuralNetwork 研究取得了突破性进展神经网络控制是将神经网络与控制理论相结合而发展起来的智能控制方法它已成为智能控制的一个新的分支为解决复杂的非线性不确定未知系统的控制问题开辟了新途径引言 4 神经生理学和神经解剖学的研究表明人脑极其复杂由一千多亿个神经元交织在一起的网状结构构成其中大脑皮层约140亿个神经元小脑皮层约1000亿个神经元人脑能完成智能思维等高级活动为了能利用数学模型来模拟人脑的活动导致了神经网络的研究神经系统的基本构造是神经元神经细胞它是处理人体内各部分之间相互信息传递的基本单元生物神经元 5 单个神经元的解剖图生物神经元每个神经元都由一个细胞体一个连接其他神经元的轴突和一些向外伸出的其它较短分支树突组成 6 轴突功能是将本神经元的输出信号兴奋传递给别的神经元其末端的许多神经末梢使得兴奋可以同时传送给多个神经元生物神经元树突的功能是接受来自其它神经元的兴奋神经元细胞体将接收到的所有信号进行简单地处理后由轴突输出神经元的轴突与另外神经元神经末梢相连的部分称为突触 7 神经元的构成 1 细胞体主体部分包括细胞质细胞膜和细胞核 2 树突用于为细胞体传入信息 3 轴突为细胞体传出信息其末端是轴突末梢含传递信息的化学物质 4 突触是神经元之间的接口 104 105个每个神经元通过树突和轴突神经元之间实现了信息的传递生物神经元 8 神经元之间的联系主要依赖其突触的联接作用这种突触的联接是可塑的也就是说突触特性的变化是受到外界信息的影响或自身生长过程的影响生理学的研究归纳有以下几个方面的变化 1 突触传递效率的变化首先是突触的膨胀以及由此产生的突触后膜表面积扩大从而突触所释放出的传递物质增多使得突触的传递效率提高其次是突触传递物质质量的变化包括比例成分的变化所引起传递效率的变化 2 突触接触间隙的变化在突触表面有许多形状各异的小凸芽调节其形状变化可以改变接触间隙并影响传递效率生物神经元 9 3 突触的发芽当某些神经纤维被破坏后可能又会长出新芽并重新产生附着于神经元上的突触形成新的回路由于新的回路的形成使得结合模式发生变化也会引起传递效率的变化 4 突触数目的增减由于种种复杂环境条件的刺激等原因或者由于动物本身的生长或衰老神经系统的突触数目会发生变化并影响神经元之间的传递效率生物神经元 10 神经元对信息的接受和传递都是通过突触来进行的单个神经元可以从别的细胞接受多个输入由于输入分布于不同的部位对神经元影响的比例权重是不相同的另外各突触输入抵达神经元的先后时间也不一祥因此一个神经元接受的信息在时间和空间上常呈现出一种复杂多变的形式需要神经元对它们进行积累和整合加工从而决定其输出的时机和强度正是神经元这种整合作用才使得亿万个神经元在神经系统中有条不紊夜以继日地处理各种复杂的信息执行着生物中枢神经系统的各种信息处理功能多个神经元以突触联接形成了一个神经网络研究表明生物神经网络的功能决不是单个神经元生理和信息处理功能的简单叠加而是一个有层次的多单元的动态信息处理系统它们有其独特的运行方式和控制机制以接受生物内外环境的输入信息加以综合分折处理然后调节控制机体对环境作出适当的反应生物神经元 11 突触的信息处理生物神经元传递信息的过程为多输入单输出神经元各组成部分的功能来看信息的处理与传递主要发生在突触附近当神经元细胞体通过轴突传到突触前膜的脉冲幅度达到一定强度即超过其阈值电位后突触前膜将向突触间隙释放神经传递的化学物质突触有两种类型兴奋性突触和抑制性突触前者产生正突触后电位后者产生负突触后电位生物神经元 12 神经元具有如下功能 1 兴奋与抑制如果传入神经元的冲动经整合后使细胞膜电位升高超过动作电位的阈值时即为兴奋状态产生神经冲动由轴突经神经末梢传出如果传入神经元的冲动经整合后使细胞膜电位降低低于动作电位的阈值时即为抑制状态不产生神经冲动 2 学习与遗忘由于神经元结构的可塑性突触的传递作用可增强和减弱因此神经元具有学习与遗忘的功能生物神经元 13 以上是从宏观上分析了人脑信息处理特点从信息系统研究的观点出发对于人脑这个智能信息处理系统有如下一些固有特征 1 并行分布处理的工作模式实际上大脑中单个神经元的信息处理速度是很慢的每次约1毫秒 ms 比通常的电子门电路要慢几个数量级每个神经元的处理功能也很有限估计不会比计算机的一条指令更复杂但是人脑对某一复杂过程的处理和反应却很快一般只需几百毫秒例如要判定人眼看到的两个图形是否一样实际上约需400ms 而在这个处理过程中与脑神经系统的一些主要功能如视觉记亿推理等有关按照上述神经元的处理速度如果采用串行工作模式就必须在几百个串行步内完成这实际上是不可能办到的因此只能把它看成是一个由众多神经元所组成的超高密度的并行处理系统例如在一张照片寻找一个熟人的面孔对人脑而言几秒钟便可完成但如用计算机来处理以现有的技术是不可能在短时间内完成的由此可见大脑信息处理的并行速度已达到了极高的程度生物神经元 14 2 神经系统的可塑性和自组织性神经系统的可塑性和自组织性与人脑的生长发育过程有关例如人的幼年时期约在9岁左右学习语言的能力十分强说明在幼年时期大脑的可塑性和柔软性特别良好从生理学的角度看它体现在突触的可塑性和联接状态的变化同时还表现在神经系统的自组织特性上例如在某一外界信息反复刺激下接受该信息的神经细胞之间的突触结合强度会增强这种可塑性反映出大脑功能既有先天的制约因素也有可能通过后天的训练和学习而得到加强神经网络的学习机制就是基于这种可塑性现象并通过修正突触的结合强度来实现的生物神经元 15 3 信息处理与信息存贮合二为一大脑中的信息处理与信息存贮是有机结合在一起的而不像现行计算机那样存贮地址和存贮内容是彼此分开的由于大脑神经元兼有信息处理和存贮功能所以在进行回亿时不但不存在先找存贮地址而后再调出所存内容的问题而且还可以由一部分内容恢复全部内容 4 信息处理的系统性大脑是一个复杂的大规模信息处理系统单个的元件神经元不能体现全体宏观系统的功能实际上可以将大脑的各个部位看成是一个大系统中的许多子系统各个子系统之间具有很强的相互联系一些子系统可以调节另一些子系统的行为例如视觉系统和运动系统就存在很强的系统联系可以相互协调各种信息处理功能生物神经元 16 5 能接受和处理模糊的模拟的随机的信息 6 求满意解而不是精确解人类处理日常行为时往往都不是一定要按最优或最精确的方式去求解而是以能解决问题为原则即求得满意解就行了 7 系统的恰当退化和冗余备份鲁棒性和容错性生物神经元 17 决定神经网络模型性能三大要素为 1 神经元信息处理单元的特性 2 神经元之间相互连接的形式拓扑结构 3 为适应环境而改善性能的学习规则生物神经元 18 4 1人工神经网络模型人工神经网络的数学模型人工神经网络是在结构和功能上对生物神经网络的某种程度的模拟和逼近直观理解神经网络是一个并行和分布式的信息处理网络结构它一般由大量神经元组成每个神经元只有一个输出可以连接到很多其他的神经元每个神经元输入有多个连接通道每个连接通道对应于一个连接权系数 19 一 MP模型MP模型属于一种阈值元件模型它是由美国McCulloch和Pitts提出的最早神经元模型之一 MP模型是大多数神经网络模型的基础人工神经网络基本模型 4 1人工神经网络模型 20 标准MP模型 4 1人工神经网络模型 21 wij 代表神经元i与神经元j之间的连接强度模拟生物神经元之间突触连接强度称之为连接权 ui 代表神经元i的活跃值即神经元状态 xj 代表神经元j的输出即是神经元i的一个输入 i 代表神经元i的阈值函数f表达了神经元的输入输出特性在MP模型中 f定义为阶跃函数激发函数 4 1人工神经网络模型 22 如果把阈值 i看作为一个特殊的权值则可改写为其中 w0i i v0 1为用连续型的函数表达神经元的非线性变换能力常采用s型函数该函数的图像如下图所示 4 1人工神经网络模型 23 4 1人工神经网络模型 24 MP模型在发表时并没有给出一个学习算法来调整神经元之间的连接权但是我们可以根据需要采用一些常见的算法来调整神经元连接权以达到学习目的下面介绍的Hebb学习规则就是一个常见学习算法 Hebb学习规则神经网络具有学习功能对于人工神经网络而言这种学习归结为神经元连接权的变化调整wij的原则为若第i和第j个神经元同时处于兴奋状态则它们之间的连接应当加强即 wij uivj这一规则与条件反射学说一致并已得到神经细胞学说的证实是表示学习速率的比例常数 4 1人工神经网络模型 25 4 2神经网络的定义和特点神经网络是在现代生物学研究人脑组织成果的基础上提出的用来模拟人类大脑神经网络的结构和行为它从微观结构和功能上对人脑进行抽象和简化是模拟人类智能的一条重要途径反映了人脑功能的若干基本特征如并行信息处理学习联想模式分类记忆等定义神经网络系统是由大量的神经元通过广泛地互相连接而形成的复杂网络系统 26 特点 1 非线性映射逼近能力任意的连续非线性函数映射关系可由多层神经网络以任意精度加以逼近 2 自适应性和自组织性神经元之间的连接具有多样性各神经元之间的连接强度具有可塑性网络可以通过学习与训练进行自组织以适应不同信息处理的要求 3 并行处理性网络的各单元可以同时进行类似的处理过程整个网络的信息处理方式是大规模并行的可以大大加快对信息处理的速度 4 分布存储和容错性信息在神经网络内的存储按内容分布于许多神经元中而且每个神经元存储多种信息的部分内容网络的每部分对信息的存储具有等势作用部分的信息丢失仍可以使完整的信息得到恢复因而使网络具有容错性和联想记忆功能 5 便于集成实现和计算模拟神经网络在结构上是相同神经元的大规模组合特别适合于用大规模集成电路实现 4 2神经网络的定义和特点 27 4 3感知器模型感知器是一种早期的神经网络模型由美国学者F Rosenblatt于1957年提出感知器中第一次引入了学习的概念使人脑所具备的学习功能在基于符号处理的数学到了一定程度的模拟所以引起了广泛的关注简单感知器简单感知器模型实际上仍然是MP模型的结构但是它通过采用监督学习来逐步增强模式划分的能力达到所谓学习的目的 28 其结构如下图所示感知器处理单元对n个输入进行加权和操作v即其中 Wi为第i个输入到处理单元的连接权值为阈值 f取阶跃函数 4 3感知器模型 29 感知器在形式上与MP模型差不多它们之间的区别在于神经元间连接权的变化感知器的连接权定义为可变的这样感知器就被赋予了学习的特性利用简单感知器可以实现逻辑代数中的一些运算 Y f w1x1 w2x2 1 与运算当取w1 w2 1 1 5时上式完成逻辑与的运算 4 3感知器模型 30 2 或运算当取wl w2 1 0 5时上式完成逻辑或的运算 3 非运算当取wl 1 w2 0 1时完成逻辑非的运算 4 3感知器模型 31 简单感知器引入的学习算法称之为误差学习算法该算法是神经网络学习中的一个重要算法并已被广泛应用现介绍如下误差型学习规则 1 选择一组初始权值wi 0 2 计算某一输入模式对应的实际输出与期望输出的误差 4 3感知器模型 32 3 如果小于给定值结束否则继续 4 更新权值阈值可视为输入恒为1的一个权值 wi t 1 wi t 1 wi t d y t xi 式中为在区间 0 1 上的一个常数称为学习步长它的取值与训练速度和w收敛的稳定性有关通常不能太大因为太大会影响wi t 的稳定也不能太小因为太小会使wi t 的收敛速度太慢 d y为神经元的期望输出和实际输出 xi为神经元的第i个输入 5 返回 2 重复直到对所有训练样本模式网络输出均能满足要求 4 3感知器模型 33 2 多层感知器如果在输入和输出层间加上一层或多层的神经元隐层神经元就可构成多层前向网络这里称为多层感知器 4 3感知器模型 34 4 4神经网络的分类目前神经网络模型的种类相当丰富已有数十种神经网络模型典型的神经网络有多层前向传播网络 BP网络 Hopfield网络 CMAC小脑模型 ART网络 BAM双向联想记忆网络 SOM自组织网络 Blotzman机网络和Madaline网络等 35 4 4神经网络的分类 1 根据神经网络的连接方式神经网络可分为前向网络反馈网络自组织网络前向网络神经元分层排列组成输入层隐含层和输出层每一层的神经元只接受前一层神经元的输入输入模式经过各层的顺次变换后由输出层输出在各神经元之间不存在反馈感知器和误差反向传播网络采用前向网络形式 36 4 4神经网络的分类反馈网络该网络结构在输出层到输入层存在反馈即每一个输入节点都有可能接受来自外部的输入和来自输出神经元的反馈这种神经网络是一种反馈动力学系统它需要工作一段时间才能达到稳定 Hopfield神经网络是反馈网络中最简单且应用最广泛的模型它具有联想记忆的功能如果将Lyapunov函数定义为寻优函数 Hopfield神经网络还可以解决寻优问题 37 4 4神经网络的分类自组织网络当神经网络在接受外界输入时网络将会分成不同的区域不同区域具有不同的响应特征即不同的神经元以最佳方式响应不同性质的信号激励从而形成一种拓扑意义上的特征图该图实际上是一种非线性映射这种映射是通过无监督的自适应过程完成的所以也称为自组织特征图 38 4 4神经网络的分类 2 从网络的学习方式上划分神经网络可分为有导师学习网络和无导师学习网络有导师学习神经网络又称监督学习 supervisedlearning 网络的输出和期望的输出即导师信号进行比较然后根据两者之间的差异调整网络的权值最终使差异变小 39 4 4神经网络的分类无导师学习神经网络又称无监督学习 unsupervisedlearning 或自组织学习 self organizedlearning 输入模式进入网络后网络按照一种预先设定的规则如竞争规则自动调整权值使网络最终具有模式分类等功能 40 4 4神经网络的分类神经网络分类标准不同方法多样 41 4 5多层前向BP神经网络多层前向神经网络的结构一个输入层一个输出层多个隐层信号沿输入输出的方向逐层传递 42 激活函数必须处处可导一般都使用S型函数使用S型激活函数时BP网络输入与输出关系输入输出 4 5多层前向BP神经网络 43 输出的导数根据S型激活函数的图形可知对神经网络进行训练应该将net的值尽量控制在收敛比较快的范围内 4 5多层前向BP神经网络 44 学习的过程神经网络在外界输入样本的刺激下不断改变网络的连接权值以使网络的输出不断地接近期望的输出学习的本质对各连接权值的动态调整学习规则权值调整规则即在学习过程中网络中各神经元的连接权变化所依据的一定的调整规则 4 5多层前向BP神经网络 45 BP网络的标准学习算法算法思想学习的类型有导师学习核心思想将输出误差以某种形式通过隐层向输入层逐层反传学习的过程信号的正向传播误差的反向传播将误差分摊给各层的所有单元各层单元的误差信号修正各单元权值 46 BP网络的标准学习算法学习过程正向传播输入样本输入层各隐层输出层判断是否转入反向传播阶段若输出层的实际输出与期望的输出教师信号不符误差反传误差以某种形式在各层表示修正各层单元的权值网络输出的误差减少到可接受的程度进行到预先设定的学习次数为止 47 BP网络的标准学习算法网络结构输入层有n个神经元隐含层有p个神经元输出层有q个神经元变量定义输入向量隐含层输入向量隐含层输出向量输出层输入向量输出层输出向量期望输出向量 48 BP网络的标准学习算法输入层与中间层的连接权值隐含层与输出层的连接权值隐含层各神经元的阈值输出层各神经元的阈值样本数据个数激活函数误差函数 49 BP网络的标准学习算法第一步网络初始化给各连接权值分别赋一个区间 1 1 内的随机数设定误差函数e 给定计算精度值和最大学习次数M 第二步随机选取第k个输入样本及对应期望输出 50 BP网络的标准学习算法第三步计算隐含层各神经元的输入和输出 51 BP网络的标准学习算法第四步利用网络期望输出和实际输出计算误差函数对输出层的各神经元的偏导数 52 BP网络的标准学习算法第五步利用隐含层到输出层的连接权值输出层的和隐含层的输出计算误差函数对隐含层各神经元的偏导数 53 BP网络的标准学习算法 54 BP网络的标准学习算法第六步利用输出层各神经元的和隐含层各神经元的输出来修正连接权值 55 BP网络的标准学习算法第七步利用隐含层各神经元的和输入层各神经元的输入修正连接权 56 BP网络的标准学习算法第八步计算全局误差第九步判断网络误差是否满足要求当误差达到预设精度或学习次数大于设定的最大次数则结束算法否则选取下一个学习样本及对应的期望输出返回到第三步进入下一轮学习 57 BP网络的标准学习算法 BP算法直观解释当误差对权值的偏导数大于零时权值调整量为负实际输出大于期望输出权值向减少方向调整使得实际输出与期望输出的差减少 58 BP网络的标准学习算法 BP算法直观解释当误差对权值的偏导数小于零时权值调整量为正实际输出少于期望输出权值向增大方向调整使得实际输出与期望输出的差减少 59 BP神经网络学习算法的MATLAB实现 MATLAB中BP神经网络的重要函数和基本功能 60 BP神经网络学习算法的MATLAB实现 MATLAB中BP神经网络的重要函数和基本功能newff 功能建立一个前向BP网络格式net newff PR S1S2 SN1 TF1TF2 TFN1 BTF BLF PF 说明net为创建的新BP神经网络 PR为网络输入取向量取值范围的矩阵 S1S2 SNl 表示网络隐含层和输出层神经元的个数 TFlTF2 TFN1 表示网络隐含层和输出层的传输函数默认为 tansig BTF表示网络的训练函数默认为 trainlm BLF表示网络的权值学习函数默认为 learngdm PF表示性能数默认为 mse 61 BP神经网络学习算法的MATLAB实现 MATLAB中BP神经网络的重要函数和基本功能tansig 功能正切sigmoid激活函数格式a tansig n 说明双曲正切Sigmoid函数把神经元的输入范围从映射到 1 1 它是可导函数适用于BP训练的神经元 logsig 功能对数Sigmoid激活函数格式a logsig N 说明对数Sigmoid函数把神经元的输入范围从映射到 0 1 它是可导函数适用于BP训练的神经元 62 BP神经网络学习算法的MATLAB实现例2 3 下表为某药品的销售情况现构建一个如下的三层BP神经网络对药品的销售进行预测输入层有三个结点隐含层结点数为5 隐含层的激活函数为tansig 输出层结点数为1个输出层的激活函数为logsig 并利用此网络对药品的销售量进行预测预测方法采用滚动预测方式即用前三个月的销售量来预测第四个月的销售量如用1 2 3月的销售量为输入预测第4个月的销售量用2 3 4月的销售量为输入预测第5个月的销售量如此反复直至满足预测精度要求为止 63 BP神经网络学习算法的MATLAB实现以每三个月的销售量经归一化处理后作为输入P 0 51520 81731 0000 0 81731 00000 7308 1 00000 73080 1390 0 73080 13900 1087 0 13900 10870 3520 0 10870 35200 0000 以第四个月的销售量归一化处理后作为目标向量T 0 73080 13900 10870 35200 00000 3761 创建一个BP神经网络每一个输入向量的取值范围为 0 1 隐含层有5个神经元输出层有一个神经元隐含层的激活函数为tansig 输出层的激活函数为 logsig 训练函数为梯度下降函数即2 3 2节中所描述的标准学习算法net newff 01 01 01 5 1 tansig logsig traingd net trainParam epochs 15000 net trainParam goal 0 01 设置学习速率为0 1LP lr 0 1 net train net P T 64 BP神经网络学习算法的MATLAB实现 BP网络应用于药品预测对比图由对比图可以看出预测效果与实际存在一定误差此误差可以通过增加运行步数和提高预设误差精度业进一步缩小 65 BP神经网络的特点非线性映射能力能学习和存贮大量输入输出模式映射关系而无需事先了解描述这种映射关系的数学方程只要能提供足够多的样本模式对供网络进行学习训练它便能完成由n维输入空间到m维输出空间的非线性映射泛化能力当向网络输入训练时未曾见过的非样本数据时网络也能完成由输入空间向输出空间的正确映射这种能力称为泛化能力容错能力输入样本中带有较大的误差甚至个别错误对网络的输入输出规律影响很小 66 BP算法的基本流程初始化加输入和期望输出计算隐层和输出层的输出迭代次数加1 调节输出层和隐层的连接权值改变训练样板训练样终止迭代终止 No No y y 4 6多层前向BP神经网络 67 4 6多层前向BP神经网络前向网络进一步需研究的问题目标函数存在多个极值点按梯度下降法进行学习很容易陷入局部极小值学习算法收敛速度慢 Sigmaid函数本身存在无穷多闪导数而BP算法只用了一次导数致使收敛速度慢网络隐层节点个数和初始权值的选取尚无理论指导 68 4 7Hopfield神经网络 Hopfield神经网络霍普菲尔德网络是单层对称全反馈网络根据其激活函数的选取不同可分为离散型的霍普菲尔德网络 DiscreteHopfieldNeuralNetwork 简称DHNN 和连续型的霍普菲尔德网络 ContinuousHopfieldNeuralNetwork 简称CHNN DHNN的激活函数为二值型的其输入输出为 0 1 的反馈网络主要用于联想记忆 CHNN的激活函数的输入与输出之间的关系为连续可微的单调上升函数可以取0到1之间的任一实数值主要用于优化计算 69 在反馈网络中如果其激活函数f 是一个二值型的硬函数如图1所示即ai sgn ni i l 2 r 则称此网络为离散型反馈网络如果ai f ni 中的f 为一个连续单调上升的有界函数这类网络被称为连续型反馈网络图2中所示为一个具有饱和线性激活函数它满足连续单调上升的有界函数的条件常作为连续型的激活函数图1DHNN中的激活函数图2CHNN中的激活函数 4 7Hopfield神经网络 70 基本的Hopfield神经网络是一个由非线性元件构成的全连接型单层反馈系统 Hopfield网络中的每一个神经元都将自己的输出通过连接权传送给所有其它神经元同时又都接收所有其它神经元传递过来的信息 Hopfield神经网络是一个反馈型神经网络网络中的神经元在t时刻的输出状态实际上间接地与自己t 1时刻的输出状态有关 4 7Hopfield神经网络 71 反馈型网络的一个重要特点就是它具有稳定状态当网络达到稳定状态的时候也就是它的能量函数达到最小的时候 Hopfield神经网络的能量函数表征网络状态的变化趋势并可以依据Hopfield工作运行规则不断进行状态变化最终能够达到的某个极小值的目标函数网络收敛就是指能量函数达到极小值 4 7Hopfield神经网络 72 Hopfield网络的稳定性可用能量函数进行分析目前人工神经网络常利用渐进稳定点来解决某些问题例如如果把系统的稳定点视为一个记忆的话那么从初态朝这个稳定点的演变过程就是寻找记忆的过程初态可以认为是给定的有关记忆的部分信息如果把系统的稳定点视为一个能量函数的极小点把能量函数视为一个优化问题的目标函数那么从初态朝这个稳定点的演变过程就是一个求该优化问题的过程这样的优点在于它的解并不需要真的去计算而只要构成这种反馈网络适当的设计其连接值和输入就可达到目的 4 7Hopfield神经网络 73 4 7Hopfield神经网络 1 离散型Hopfield网络离散型Hopfield网络的输出为二值型网络采用全连接结构令为各神经元的输出为各神经元与第个神经元的连接权值为第神经元的阈值则有 74 4 7Hopfield神经网络当网络经过适当训练后可以认为网络处于等待状态而对网络给定初始输入x时网络就处于特定的初始状态由此初始状态开始运行可得到网络输出即网络的下一状态然后这个输出状态通过反馈连接回送到网络的输入端作为网络下一级运行的输入信号而该输入信号可能与初始输入信号x不同由这个新的输入又可得到下一步的输出该输出也可能与上一步的输出不同如此下去网络的整个运行过程就是上述反馈过程的重复如果网络是稳定的那么随着多次反馈运行网络状态的变化逐渐减少最后不再变化达到稳态这时由输出端可得到网络的稳定输出 75 能量函数定义为则其变化量为也就是说能量函数总是随神经元状态的变化而下降的 4 7Hopfield神经网络 76 4 7Hopfield神经网络 2 连续型Hopfield网络用模拟电路模仿生物神经网络的特性 77 4 7Hopfield神经网络连续型Hopfield网络连续型Hopfield网络的动态方程 ui为第i个神经元的状态输入 Vi为第i个神经元的状态输出 ij为第i个神经元到第j神经元的连接权 g 为具有连续且单调增性质的神经元激励函数 Ii为施加到第i个神经元的偏置 78 4 7Hopfield神经网络定义能量函数则其变化量 79 4 7Hopfield神经网络其中于是当 ij ji时 80 且当时因此随时间的增长神经网络在状态空间中的轨迹总是向能量函数减小的方向变化且网络的稳定点就是能量函数的极小点连续型Hopfield网络广泛用于联想记忆和优化计算问题 4 7Hopfield神经网络如果把一个最优化问题的目标函数转换成网络的能量函数把问题的变量对应于网络的状态那么Hopfield神经网络就能够用于解决优化组合问题 81 关于连续Hopfield网络有如下结论具有良好的收敛性即从任意非平衡轨迹出发网络将最终收敛于某个平衡状态具有有限个平衡点如果平衡点是稳定的那么它也一定是渐进稳定的渐进稳定平衡点为其能量函数的极小点通过适当的学习该网络能将任意一组正交矢量存储起来作为渐进稳定平衡点连续Hopfield网络的信息存储表现为神经元之间互联的分布式动态存储连续Hopfield网络以大规模非线性连续时间并行方式处理信息其计算时间就是系统趋于平衡点的时间 4 7Hopfield神经网络 82 Hopfield网络的应用 Hopfield网络已成功地用于多个领域应用方式主要有两种联想存取和优化计算不同应用的基本思想可以归纳如下对于特定的问题选择一种合适的表示方法使得神经网络得输出与问题的解对应起来构造神经网络的能量函数使其最小值对应于问题的最佳解由能量函数反推出神经网络的结构由网络结构构造网络让其运行则稳定状态在一定条件下就是问题的解 4 7Hopfield神经网络 83 4 8Hopfield网络在组合优化中的应用组合优化问题就是在给定约束条件下求出使目标函数极小或极大的变量组合问题将Hopfield网络应用于求解组合优化问题就是把目标函数转化为网络的能量函数把问题的变量对应于网络的状态这样当网络的能量函数收敛于极小值时问题的最优解也随之求出 84 TSP问题所谓TSP TravelingSalesmanProblem 问题即旅行商问题是一个十分有名的难以求解的优化问题其要求很简单在n个城市的集合中从某一城市出发访问各城市一次且仅一次后再回到原出发城市要求找出一条最短的巡回路线如果已知城市A B C D 之间的距离为dAB dBC dCD 那么总的距离d dAB dBC dCD 对于这种动态规化问题要去求其min d 的解因为对于n个城市的全排列共有n 种而TSP并没有限定路径的方向即为全组合所以对于固定的城市数n的条件下其路径总数Sn为Sn n 2n n 4 4 8Hopfield网络在组合优化中的应用 85 n 4时的TSP路径图城市数和对应的旅行方案数 4 8Hopfield网络在组合优化中的应用 86 采用连续时间的霍普菲尔德网络模型来求解TSP 开辟了一条解决这一问题的新途径其基本思想是把TSP映射到CHNN上通过网络状态的动态演化逐步趋向稳态而自动地搜索出优化解 TSP的解是若干城市的有序排列任何一个城市在最终路径上的位置可用一个n维的0 1矢量表示对于所有n个城市则需要一个n n维矩阵例如以5个城市为例一种可能的排列矩阵为该矩阵唯一地确定了一条有效的行程路径 C A D B E 4 8Hopfield网络在组合优化中的应用 87 约束条件和最优条件问题的约束条件和最优条件如下 1 一个城市只能被访问一次换位矩阵每行只有一个 1 2 一次只能访问一个城市换拉矩阵每列只有一个 1 3 总共有N个城市换位矩阵元素之和为N 4 求巡回路径最短网络能量函数的最小值对应于TSP的最短路径 4 8Hopfield网络在组合优化中的应用 88 TSP的最优解是求长度dxy为最短的一条有效的路径 2 目标函数f V 1 约束条件g V 约束条件要保证关联矩阵的每一行

人人文库> 全部分类> 教育资料 > 课件下载

温馨提示

1. 本站所有资源如无特殊说明，都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2. 本站的文档不包含任何第三方提供的附件图纸等，如果需要附件，请联系上传者。文件的所有权益归上传用户所有。
3. 本站RAR压缩包中若带图纸，网页内容里面会有图纸预览，若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 人人文库网仅提供信息存储空间，仅对用户上传内容的表现方式做保护处理，对用户上传分享的文档内容本身不做任何修改或编辑，并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容，请与我们联系，我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

神经网络的基本理论.ppt

文档简介

温馨提示

最新文档

评论

神经网络的基本理论.ppt

文档简介

温馨提示

最新文档

评论

相关文档