版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、第第2章章 神经网络控制神经网络控制 2.1 概述概述 2.1.1 生物神经元模型生物神经元模型 2.1.2 人工神经元模型人工神经元模型 2.1.3 人工神经网络模型人工神经网络模型 2.1.4 神经网络的工作方式神经网络的工作方式 2.1.5 神经网络的学习方法神经网络的学习方法 2.1.1生物神经元模型 人脑大约包含人脑大约包含1012个神经元,分成约个神经元,分成约1000种类种类 型,每个神经元大约与型,每个神经元大约与102104个其他神经元个其他神经元 相连接,形成极为错综复杂而又灵活多变的相连接,形成极为错综复杂而又灵活多变的 神经网络。每个神经元虽然都十分简单,但神经网络。每
2、个神经元虽然都十分简单,但 是如此大量的神经元之间、如此复杂的连接是如此大量的神经元之间、如此复杂的连接 却可以演化出丰富多彩的行为方式。同时,却可以演化出丰富多彩的行为方式。同时, 如此大量的神经元与外部感受器之间的多种如此大量的神经元与外部感受器之间的多种 多样的连接方式也蕴含了变化莫测的反应方多样的连接方式也蕴含了变化莫测的反应方 式。式。 从生物控制论的观点来看,神经元作 为控制和信息处理的基本单元,具有下列 一些重要的功能与特性: n 时空整合功能时空整合功能 n兴奋与抑制状态兴奋与抑制状态 n脉冲与电位转换脉冲与电位转换 n动态极性化动态极性化 n结构可塑性结构可塑性 n学习、遗忘
3、和疲劳学习、遗忘和疲劳 n突触延时和不应期突触延时和不应期 2.1.2 人工神经元模型 n人工神经元是对生物神经元的一种模拟人工神经元是对生物神经元的一种模拟 与简化。它是神经网络的基本处理单元。与简化。它是神经网络的基本处理单元。 如图所示为一种简化的人工神经元结构。如图所示为一种简化的人工神经元结构。 它是一个它是一个多输入、单输出多输入、单输出的非线性元件。的非线性元件。 n其输入、输出关系可描述为其输入、输出关系可描述为 n其中,其中, 是从其他神经元传来的是从其他神经元传来的 输入信号;输入信号; 表示从神经元表示从神经元j到神经元到神经元i的的 连接权值;连接权值; 为阈值;为阈值
4、; 称为激发函数称为激发函数 或作用函数。或作用函数。 n j ijiji xwI 1 )( ii Ify ), 2 , 1(njxj ij w i )(f 线性系统 非线性函数 ai1 ai2 a in bi1 bi2 bim wi y1 y2 y n u1 uk um 1 vix i y i m k ikiki n j iji wtubtyatv 11 )()()( 神经元网络的一般模型框架 1)加法器 2)线性动态系统(SISO) 3)静态非线性系统 输出激发函数输出激发函数 又称为变换函数,它决定神经元又称为变换函数,它决定神经元 (节点)的输出。该输出为(节点)的输出。该输出为1或或
5、0,取决于其输入,取决于其输入 之和大于或小于内部阈值之和大于或小于内部阈值 。函数。函数 一般具有一般具有 非线性特性。下图表示了几种常见的激发函数。非线性特性。下图表示了几种常见的激发函数。 1. 阈值型函数(见图(阈值型函数(见图(a),(),(b) 2. 饱和型函数(见图(饱和型函数(见图(c) 3. 双曲函数(见图(双曲函数(见图(d) 4. S型函数(见(型函数(见(e) 5. 高斯函数(见图(高斯函数(见图(f) )(f i )(f 静态非线性系统静态非线性系统 2.1.3 人工神经网络模型 n人工神经网络是以工程技术手段来模拟人工神经网络是以工程技术手段来模拟 人脑神经元网络的
6、结构与特征的系统。人脑神经元网络的结构与特征的系统。 利用人工神经元可以构成各种不同拓扑利用人工神经元可以构成各种不同拓扑 结构的神经网络,它是生物神经网络的结构的神经网络,它是生物神经网络的 一种模拟和近似。就神经网络的主要连一种模拟和近似。就神经网络的主要连 接型式而言,目前已有数十种不同的神接型式而言,目前已有数十种不同的神 经网络模型,其中经网络模型,其中前馈型网络前馈型网络和和反馈型反馈型 网络网络是两种典型的结构模型。是两种典型的结构模型。 1. 前馈型神经网络 n前馈型神经网络,又称前向网络(前馈型神经网络,又称前向网络(Feed forward NN)。如图所示,神经元分层排列
7、,有输入层、隐)。如图所示,神经元分层排列,有输入层、隐 层(亦称中间层,可有若干层)和输出层,每一层的层(亦称中间层,可有若干层)和输出层,每一层的 神经元只接受前一层神经元的输入。神经元只接受前一层神经元的输入。 n从从学习的观点学习的观点来看,前馈网络是一种强有力来看,前馈网络是一种强有力 的学习系统,其结构简单而易于编程;的学习系统,其结构简单而易于编程; n从从系统的观点系统的观点看,前馈网络是一静态非线性看,前馈网络是一静态非线性 映射,通过简单非线性处理单元的复合映射,映射,通过简单非线性处理单元的复合映射, 可获得复杂的非线性处理能力。可获得复杂的非线性处理能力。 n典型的前馈
8、网络有感知器网络、典型的前馈网络有感知器网络、BP 网络、网络、 RBF网络、网络、CMAC网络等。网络等。 2. 反馈型神经网络 n反馈型神经网络(反馈型神经网络(Feedback NN)的结构如图所示。)的结构如图所示。 如果总节点(神经元)数为如果总节点(神经元)数为N,那么每个节点有,那么每个节点有N个个 输入和一个输出,也就是说,所有节点都是一样的,输入和一个输出,也就是说,所有节点都是一样的, 它们之间都可相互连接。它们之间都可相互连接。 n反馈神经网络是一种反馈动力学系统,由于反馈神经网络是一种反馈动力学系统,由于 反馈回路的存在,对神经网络的学习能力和反馈回路的存在,对神经网络
9、的学习能力和 决策都会产生很大影响,因此,该类型需要决策都会产生很大影响,因此,该类型需要 工作一段时间才能达到稳定。工作一段时间才能达到稳定。 n典型的反馈网络有离散的典型的反馈网络有离散的Hopfield网络、连续网络、连续 的的Hopfield网络、网络、Boltzmann机等。机等。 2.1.4 神经网络的工作方式 n工作过程工作过程 第一阶段第一阶段 学习期学习期 计算单元的状态不变,连接权值不断修改计算单元的状态不变,连接权值不断修改 第二阶段第二阶段 工作期工作期 连接权值不变,计算单元不断变化连接权值不变,计算单元不断变化 2.1.5神经网络的学习方法 n学习方法是体现人工神经
10、网络智能特性学习方法是体现人工神经网络智能特性 的主要标志,离开了学习算法,人工神的主要标志,离开了学习算法,人工神 经网络就失去了自适应、自组织和自学经网络就失去了自适应、自组织和自学 习的能力。目前神经网络的学习方法有习的能力。目前神经网络的学习方法有 多种,按有无导师来分类,可分为有教多种,按有无导师来分类,可分为有教 师学习(师学习(Supervised Learning)、无教)、无教 师学习(师学习(Unsupervised Learning)和再)和再 励学习(励学习(Reinforcement Learning)等几)等几 大类。大类。 n在在有教师的学习方式有教师的学习方式中
11、,网络的输出和中,网络的输出和 期望的输出(即教师信号)进行比较,期望的输出(即教师信号)进行比较, 然后根据两者之间的差异调整网络的权然后根据两者之间的差异调整网络的权 值,最终使差异变小。值,最终使差异变小。 n在在无教师的学习方式无教师的学习方式中,输入模式进入中,输入模式进入 网络后,网络按照一预先设定的规则网络后,网络按照一预先设定的规则 (如竞争规则)自动调整权值,使网络(如竞争规则)自动调整权值,使网络 最终具有模式分类等功能。最终具有模式分类等功能。 n再励学习再励学习是介于上述两者之间的一种学是介于上述两者之间的一种学 习方式。习方式。 神经网络中常用的几种最基本的学习方法
12、1. Hebb学习规则学习规则 n两个神经元同时处于激发状态时,它们两个神经元同时处于激发状态时,它们 之间的连接强度将得到加强,这一论述之间的连接强度将得到加强,这一论述 的数学描述被称为的数学描述被称为Hebb学习规则学习规则 nHebb学习规则是一种无教师的学习方法,学习规则是一种无教师的学习方法, 它只根据神经元连接间的激活水平改变它只根据神经元连接间的激活水平改变 权值,因此这种方法又称为相关学习或权值,因此这种方法又称为相关学习或 并联学习。并联学习。 2Delta()学习规则 n规则实现了规则实现了E中的梯度下降,因此使误中的梯度下降,因此使误 差函数达到最小值。但差函数达到最小
13、值。但学习规则只适学习规则只适 用于线性可分函数,无法用于多层网络。用于线性可分函数,无法用于多层网络。 BP网络的学习算法称为网络的学习算法称为BP算法,是在算法,是在 规则基础上发展起来的,可在多网络上规则基础上发展起来的,可在多网络上 有效地学习。有效地学习。 3概率式学习概率式学习 n从统计力学、分子热力学和概率论中关于系从统计力学、分子热力学和概率论中关于系 统稳态能量的标准出发,进行神经网络学习统稳态能量的标准出发,进行神经网络学习 的方式称概率式学习。神经网络处于某一状的方式称概率式学习。神经网络处于某一状 态的概率主要取决于在此状态下的能量,能态的概率主要取决于在此状态下的能量
14、,能 量越低,概率越大。同时,此概率还取决于量越低,概率越大。同时,此概率还取决于 温度参数温度参数T。T越大,不同状态出现概率的差越大,不同状态出现概率的差 异便越小,较容易跳出能量的局部极小点而异便越小,较容易跳出能量的局部极小点而 到全局的极小点;到全局的极小点;T越小时,情形正相反。概越小时,情形正相反。概 率式学习的典型代表是率式学习的典型代表是Boltzmann机学习规则。机学习规则。 它是基于模拟退火的统计优化方法,因此又它是基于模拟退火的统计优化方法,因此又 称模拟退火算法。称模拟退火算法。 4竞争式学习竞争式学习 n竞争式学习属于无教师学习方式。此种学竞争式学习属于无教师学习
15、方式。此种学 习方式利用不同层间的神经元发生兴奋性习方式利用不同层间的神经元发生兴奋性 联接,以及同一层内距离很近的神经元间联接,以及同一层内距离很近的神经元间 发生同样的兴奋性联接,而距离较远的神发生同样的兴奋性联接,而距离较远的神 经元产生抑制性联接。在这种联接机制中经元产生抑制性联接。在这种联接机制中 引人竟争机制的学习方式称为竟争式学习。引人竟争机制的学习方式称为竟争式学习。 它的本质在于神经网络中高层次的神经元它的本质在于神经网络中高层次的神经元 对低层次神经元的输入模式进行竞争识别。对低层次神经元的输入模式进行竞争识别。 神经元网络的特点: 1)非线性)非线性 2 2)分布处理)分
16、布处理 3 3)学习并行和自适应)学习并行和自适应 4 4)数据融合)数据融合 5 5)适用于多变量系统)适用于多变量系统 6 6)便于硬件实现)便于硬件实现 小结: 神经网络三要素:神经网络三要素: 1.神经元(信息处理单元)的特性;神经元(信息处理单元)的特性; 2.神经元之间相互连接的拓扑规则;神经元之间相互连接的拓扑规则; 3.为适应环境而改善性能的学习规则;为适应环境而改善性能的学习规则; 神经网络的分类:神经网络的分类: n按功能:连续型与离散型、确定型与随按功能:连续型与离散型、确定型与随 机型、静态与动态神经网络机型、静态与动态神经网络 n按连接方式:前馈型与反馈型神经网络按连
17、接方式:前馈型与反馈型神经网络 n按逼近特性:全局逼近型与局部逼近型按逼近特性:全局逼近型与局部逼近型 n按学习方式:有监督学习、无监督学习按学习方式:有监督学习、无监督学习 和强化学习神经网络和强化学习神经网络 2.2 前馈神经网络前馈神经网络 2.2.1 感知器网络感知器网络 一、一、MP模型模型 1、结构特点:、结构特点: 具有固定的结构和不变的权值;具有固定的结构和不变的权值; MP模型的权值、输入、输出量均为二值变量;模型的权值、输入、输出量均为二值变量; n2、利用、利用MP模型可以实现任何布尔函数;模型可以实现任何布尔函数; 二、单层感知器网络二、单层感知器网络 n感知器是一个具
18、有单层神经元的神经网络,感知器是一个具有单层神经元的神经网络, 并由线性阈值元件组成,是最简单的前向网并由线性阈值元件组成,是最简单的前向网 络。它比络。它比MP模型更近一步,它的输入量可以模型更近一步,它的输入量可以 是非离散量,权值也可以是非离散量并且可是非离散量,权值也可以是非离散量并且可 以依据所处理的问题进行调整学习而得到;以依据所处理的问题进行调整学习而得到; n单层感知器主要用于模式分类,也可以用于单层感知器主要用于模式分类,也可以用于 基于模式分类的学习控制和多模态控制中;基于模式分类的学习控制和多模态控制中; n单层感知器网络结构如下图所示。单层感知器网络结构如下图所示。 n
19、感知器的设计:感知器的设计: 问题描述:已知一组输入样本模式以及它们所属问题描述:已知一组输入样本模式以及它们所属 的特征,如何找到一条分界线能够对样本按的特征,如何找到一条分界线能够对样本按 规定的属性分类?规定的属性分类? 即:已知即:已知 和和 ,如何找到合适的权值及阈,如何找到合适的权值及阈 值,使感知器的实际输出与期望输出相符?值,使感知器的实际输出与期望输出相符? p x p d 感知器的一种学习算法:感知器的一种学习算法: 1)随机地给定一组连接权随机地给定一组连接权 ; 2)输入一组样本和期望的输出输入一组样本和期望的输出(亦称之为教师信号亦称之为教师信号); 3)计算感知器实
20、际输出计算感知器实际输出 ; 4)修正权值修正权值 5)选取另外一组样本,重复上述选取另外一组样本,重复上述2)4)的过程,)的过程, 直到权值对一切样本均稳定不变为止,学习过程直到权值对一切样本均稳定不变为止,学习过程 结束。结束。 (1)( ) ( )( ) iii W kW kd ky k x ( )y k (0) i W 三、多层感知器:三、多层感知器: 1、单层感知器只能用于解决线性可分问题,对、单层感知器只能用于解决线性可分问题,对 于线性不可分的输入模式,可利用多层感知于线性不可分的输入模式,可利用多层感知 器网络实现;器网络实现; 2、“异或异或”问题;问题; 3、结论:、结论
21、: 适当的设计多层感知器网络可实现适当的设计多层感知器网络可实现任意形状任意形状 的划分。的划分。 n讨论问题:讨论问题: 单层感知器只能解决线性可分问题,主要的原因是否与所选单层感知器只能解决线性可分问题,主要的原因是否与所选 择的择的阈值函数阈值函数有关呢?如果将变换函数换成其他较复杂的非有关呢?如果将变换函数换成其他较复杂的非 线性函数,情况是否会有所变化呢?线性函数,情况是否会有所变化呢? n练习:练习: 1、线性阈值单元的学习:、线性阈值单元的学习: 单变量样本有四个:单变量样本有四个: 假设权值的初值为:假设权值的初值为:2.5,阈值的初值为:,阈值的初值为:1.75 2、建立一个
22、感知器神经网络,使其能够完成、建立一个感知器神经网络,使其能够完成“与与”的功能,利的功能,利 用用 Matlab编程实现。编程实现。 1 1x 3 3x 2 0.5x 4 2x 1d 1d 重要结论重要结论 具有至少一个隐层的多层前馈网络,如果隐层具有至少一个隐层的多层前馈网络,如果隐层 单元足够多,那么,利用扁平激励函数和线性多单元足够多,那么,利用扁平激励函数和线性多 项式集成函数,可以对任意感兴趣的函数逼成到项式集成函数,可以对任意感兴趣的函数逼成到 任意精度任意精度。 扁平激励函数定义:扁平激励函数定义:f : R 0,1 或或-1,1是非减是非减 函数函数, 是。或 1- 1)(l
23、im , 1)(lim ff 扁平激励函数的参数扁平激励函数的参数. 理论证明理论证明: :多层前馈网络是一种通用逼近器多层前馈网络是一种通用逼近器 2.2.2 BP网络 n误差反向传播神经网络,简称误差反向传播神经网络,简称BP网络网络 (Back Propagation),是一种单向传),是一种单向传 播的多层前向网络。播的多层前向网络。 n在模式识别、图像处理、系统辨识、函在模式识别、图像处理、系统辨识、函 数拟合、优化计算、最优预测和自适应数拟合、优化计算、最优预测和自适应 控制等领域有着较为广泛的应用。控制等领域有着较为广泛的应用。 n误差反向传播的误差反向传播的BP算法简称算法简称
24、BP算法,其基本算法,其基本 思想是最小二乘算法。它采用思想是最小二乘算法。它采用梯度搜索技术梯度搜索技术, 以期使网络的实际输出值与期望输出值的误以期使网络的实际输出值与期望输出值的误 差均方值为最小。差均方值为最小。 nBP算法的学习过程由算法的学习过程由正向传播和反向传播正向传播和反向传播组组 成。在正向传播过程中,输入信息从输入层成。在正向传播过程中,输入信息从输入层 经隐含层逐层处理,并传向输出层,每层神经隐含层逐层处理,并传向输出层,每层神 经元(节点)的状态只影响下一层神经元的经元(节点)的状态只影响下一层神经元的 状态。如果在输出层不能得到期望的输出,状态。如果在输出层不能得到
25、期望的输出, 则转入反向传播,将误差信号沿原来的连接则转入反向传播,将误差信号沿原来的连接 通路返回,通过修改各层神经元的权值,使通路返回,通过修改各层神经元的权值,使 误差信号最小。误差信号最小。 1 BP网络权值的网络权值的调整规则调整规则: 基于一阶梯度法的优化方法,有基于一阶梯度法的优化方法,有 权系数应按权系数应按E函数梯度变化的反方向进函数梯度变化的反方向进 行调整,使网络的输出接近期望的输出。行调整,使网络的输出接近期望的输出。 2 1 1 () 2 L kk k EdO 2BP网络的前馈计算网络的前馈计算 1)隐含层各神经元的隐含层各神经元的净输入净输入: 隐含层各神经元的隐含
26、层各神经元的输出输出: 2)输出层各神经元的输出层各神经元的净输入净输入: 输出层各神经元的输出层各神经元的输出输出: 10 MM jjiijjii ii Iw Ow O 10 qq kkjjkkjj jj Iw Ow O 1( ) jj Of I 2( ) kk OfI 3BP网络的权值的调整规则网络的权值的调整规则 1). 输出层权系数的调整输出层权系数的调整 2). 隐含层权系数的调整隐含层权系数的调整 2 ()() kjkj kj kkkk E wO w dOfI 1 1 ()() jiji ji L jkkjj k E wO w wf I 4BP学习算法的计算步骤学习算法的计算步骤
27、1). 初始化初始化:置所有权值为置所有权值为较小的随机数较小的随机数; 2). 提供训练集提供训练集 ; 3). 计算实际输出计算实际输出:计算隐含层、输出层各计算隐含层、输出层各 神经元输出;神经元输出; 4). 计算目标值与实际输出的偏差计算目标值与实际输出的偏差E; 5). 计算计算 6). 计算计算 7). 返回返回“2)”重复计算,直到误差满足重复计算,直到误差满足 要求为止。要求为止。 kj w ji w 5、在使用、在使用BP算法时,应算法时,应注意的几个问题注意的几个问题是:是: n1). 学习开始时,各隐含层连接权系数的初值学习开始时,各隐含层连接权系数的初值 应以设置较小
28、的应以设置较小的随机数随机数较为适宜;较为适宜; n2). 从从BP算法的要求可见,网络中神经元的变算法的要求可见,网络中神经元的变 换函数应选用可微函数,故常用换函数应选用可微函数,故常用sigmoid函数;函数; n3). S型激发函数还有一个重要的特点是它提供型激发函数还有一个重要的特点是它提供 了一种自动增益控制的形式,即对于小信号,了一种自动增益控制的形式,即对于小信号, 输入输入-输出关系曲线陡峭,可让小信号无衰减输出关系曲线陡峭,可让小信号无衰减 的通过,对于大信号,增益减小,可使网络的通过,对于大信号,增益减小,可使网络 无饱和的容纳大信号;无饱和的容纳大信号; 5、在使用、在
29、使用BP算法时,应算法时,应注意的几个问题注意的几个问题是:是: n4). 采用采用S型变换函数时,由于输出层各神经元型变换函数时,由于输出层各神经元 的输出只能趋于的输出只能趋于1或或0,不能达到,不能达到1或或0。在设。在设 置各训练样本时,期望的输出分量置各训练样本时,期望的输出分量dpk不能设不能设 置为置为1或或0,以设置为,以设置为0.9或或0.1较为适宜;较为适宜; n5).S型变换函数随着型变换函数随着|x|的增大梯度下降并趋于的增大梯度下降并趋于 0,这将不利于权值的调整,故应考虑网络的,这将不利于权值的调整,故应考虑网络的 输入,应使输入,应使|x|工作在较小的区域内;工程
30、实际工作在较小的区域内;工程实际 中,在必要时应对网络的输入输出数据做归中,在必要时应对网络的输入输出数据做归 一化处理;一化处理; 5、在使用、在使用BP算法时,应算法时,应注意的几个问题注意的几个问题是:是: n6). 学习速率学习速率的选择,在学习开始阶段,的选择,在学习开始阶段,选选 较大的值可以加快学习速度。学习接近优化较大的值可以加快学习速度。学习接近优化 区时,区时,值必须相当小,否则权系数将产生振值必须相当小,否则权系数将产生振 荡而不收敛。荡而不收敛。 6、BP网络的学习可采用两种方式:网络的学习可采用两种方式: 1) 在线学习在线学习 2) 离线学习或称批处理学习离线学习或
31、称批处理学习 讨论讨论 隐层的数目和节点的数目隐层的数目和节点的数目, ,何谓合适何谓合适? ? 是否收敛到全局最优是否收敛到全局最优?(?(涉及多维误差曲面的不确定涉及多维误差曲面的不确定 性性) ) 3)3)收敛的速度问题。收敛的速度问题。( (涉及隐层节点输出的相互耦合和涉及隐层节点输出的相互耦合和 梯度下降法本身的缺点)梯度下降法本身的缺点) 2.2.3 BP网络学习算法的改进网络学习算法的改进 1多层前向多层前向BP网络的优点:网络的优点: n1). 网络实质上实现了一个从输入到输出的映网络实质上实现了一个从输入到输出的映 射功能,而数学理论已证明射功能,而数学理论已证明它具有实现任
32、何它具有实现任何 复杂非线性映射的功能复杂非线性映射的功能。这使得它特别适合。这使得它特别适合 于求解内部机制复杂的问题;于求解内部机制复杂的问题; n2). 网络能通过学习带正确答案的实例集自动网络能通过学习带正确答案的实例集自动 提取提取“合理的合理的”求解规则,即具有求解规则,即具有自学习能自学习能 力力; 1多层前向多层前向BP网络的优点:网络的优点: n3). 网络具有一定的推广、概括能力;网络具有一定的推广、概括能力; BP算法是全局逼近的方法,故有较好的泛化能力;算法是全局逼近的方法,故有较好的泛化能力; 从函数拟合的角度,从函数拟合的角度,BP网络具有插值功能;网络具有插值功能
33、; n4). BP网络能够实现输入输出的非线性映射关网络能够实现输入输出的非线性映射关 系,但它并不依赖于模型,其输入输出之间的系,但它并不依赖于模型,其输入输出之间的 关联信息关联信息分布地分布地存储与连接权中,因而存储与连接权中,因而BP网络网络 具有较好的具有较好的容错性容错性; 2多层前向多层前向BP网络的问题:网络的问题: 1). BP算法的学习速度很慢;算法的学习速度很慢; 2). 网络训练失败的可能性较大网络训练失败的可能性较大 ; 3). 难以解决应用问题的实例规模和网络规模间的矛难以解决应用问题的实例规模和网络规模间的矛 盾盾 ,这涉及到网络容量的可能性与可行性问题,这涉及到
34、网络容量的可能性与可行性问题, 即学习复杂性问题;即学习复杂性问题; 4). 网络结构的选择尚无一种统一而完整的理论指导,网络结构的选择尚无一种统一而完整的理论指导, 一般只能由经验选定一般只能由经验选定 ; 5). 新加入的样本要影响已学习成功的网络,而且刻新加入的样本要影响已学习成功的网络,而且刻 画每个输入样本的特征的数目也必须相同画每个输入样本的特征的数目也必须相同 ; 6). 网络的预测能力(也称泛化能力、推广能力)与网络的预测能力(也称泛化能力、推广能力)与 训练能力(也称逼近能力、学习能力)的矛盾;训练能力(也称逼近能力、学习能力)的矛盾; 3BP网络学习算法的改进网络学习算法的
35、改进 n1). 增加增加“惯性项惯性项 ” n2). 采用动态步长采用动态步长 n3). 与其他全局搜索算法相结合与其他全局搜索算法相结合 n4). 模拟退火算法模拟退火算法 n目前在神经网络的学习中,基于梯度的目前在神经网络的学习中,基于梯度的 算法都不能从理论上保证收敛结果是全算法都不能从理论上保证收敛结果是全 局最优的。局最优的。 练习:练习: 1.将将BP网络高度抽象成一个神经元,网络高度抽象成一个神经元, (1)(1) (2)(2) 3.00.4 2.00.8 xd xd 求解:权值和阈值。求解:权值和阈值。 2.利用三层利用三层BP网络完成函数逼近。网络完成函数逼近。 ( )sin
36、02f xxx 1 ( )110f xx x 2.2.4 神经网络的训练神经网络的训练 n 可以任意逼近一个紧集上的任意函数这可以任意逼近一个紧集上的任意函数这 一特点是神经网络广泛应用的理论基础。一特点是神经网络广泛应用的理论基础。 但是,在实际应用中,目前尚未找到较但是,在实际应用中,目前尚未找到较 好的网络构造方法,确定网络的结构和好的网络构造方法,确定网络的结构和 权值参数,来描述给定的映射或逼近一权值参数,来描述给定的映射或逼近一 个未知的映射,只能通过学习来得到满个未知的映射,只能通过学习来得到满 足要求的网络模型。足要求的网络模型。 神经网络训练的具体步骤如下神经网络训练的具体步
37、骤如下 1获取训练样本集获取训练样本集 获取训练样本集合是训练神经网络的第一步,也是十分获取训练样本集合是训练神经网络的第一步,也是十分 重要和关键的一步。它包括训练数据的收集、分析、选择重要和关键的一步。它包括训练数据的收集、分析、选择 和预处理等和预处理等 2选择网络类型与结构选择网络类型与结构 神经网络的类型很多,需要根据任务的性质和要求来选神经网络的类型很多,需要根据任务的性质和要求来选 择合适的网络类型。择合适的网络类型。 3训练与测试训练与测试 最后一步是利用获取的训练样本对网络进行反复训练,最后一步是利用获取的训练样本对网络进行反复训练, 直至得到合适的映射结果。直至得到合适的映
38、射结果。 2.3 反馈神经网络反馈神经网络 n反馈网络反馈网络(Recurrent Network),又称自联想记忆网络,又称自联想记忆网络, 其目的是为了设计一个网络,储存一组平衡点其目的是为了设计一个网络,储存一组平衡点,使得,使得 当给网络一组初始值时,网络通过当给网络一组初始值时,网络通过自行运行自行运行而最终收而最终收 敛到这个设计的平衡点上。敛到这个设计的平衡点上。 n反馈网络能够表现出非线性动力学系统的动态特性。反馈网络能够表现出非线性动力学系统的动态特性。 它所具有的主要特性为以下两点:它所具有的主要特性为以下两点: n第一、网络系统具有若干个稳定状态。当网络从某一第一、网络系
39、统具有若干个稳定状态。当网络从某一 初始状态开始运动,网络系统总可以收敛到某一个稳初始状态开始运动,网络系统总可以收敛到某一个稳 定的平衡状态;定的平衡状态; n第二,系统稳定的平衡状态可以通过第二,系统稳定的平衡状态可以通过设计网络的权值设计网络的权值 而被存储到网络中。而被存储到网络中。 2.3 反馈神经网络反馈神经网络 与与BP网络的比较:网络的比较: 1.BP网络是一种前馈神经网络,网络中网络是一种前馈神经网络,网络中没有反馈连接没有反馈连接, 即不考虑输出与输入在时间上的滞后影响;即不考虑输出与输入在时间上的滞后影响; Hopfield网络是一种反馈神经网络,网络中网络是一种反馈神经
40、网络,网络中存在反馈连存在反馈连 接接,所以要考虑输出与输入在时间上的传输延迟;,所以要考虑输出与输入在时间上的传输延迟; 2.BP网络的输出与输入网络的输出与输入仅是一种映射关系仅是一种映射关系; Hopfield网络表示的是网络表示的是一种动态过程一种动态过程,所以要用,所以要用差分方差分方 程或是微分方程程或是微分方程来描述;来描述; 3.BP网络采用网络采用误差均方修正连接权值的方法误差均方修正连接权值的方法,计算过程,计算过程 较长,收敛较长,收敛速度慢速度慢; Hopfield网络采用网络采用Hebb规则规则,设计设计网络连接权,网络连接权,收敛速收敛速 度快度快; 离散离散Hop
41、field网络网络 1. 网络的结构和工作方式网络的结构和工作方式 n离散离散Hopfield网络是一个单层网络,有网络是一个单层网络,有N个神个神 经元节点,每个神经元的输出均接到其它神经元节点,每个神经元的输出均接到其它神 经元的输入。经元的输入。 n各节点没有自反馈,每个节点都附有一个阈各节点没有自反馈,每个节点都附有一个阈 值。每个节点都可处于一种可能的状态(值。每个节点都可处于一种可能的状态(1或或 1),即当该神经元所受的刺激超过其阈值),即当该神经元所受的刺激超过其阈值 时,神经元就处于一种状态(比如时,神经元就处于一种状态(比如1),否则),否则 神经元就始终处于另一状态(比如
42、神经元就始终处于另一状态(比如1)。)。 n网络中每个神经元的工作方式:网络中每个神经元的工作方式: Note:1.当当i=j时,时, ; 2.在在DHNN网络中,变换函数取阈值型函网络中,变换函数取阈值型函 数;数; 1 ( )( ) (1)( ) n iijji j ii S kw x k x kf S k 0 ii w n整个网络有两种工作方式:即异步方式和同整个网络有两种工作方式:即异步方式和同 步方式。步方式。 n1). 异步方式(串行方式)异步方式(串行方式) n2). 同步方式(并行方式)同步方式(并行方式) 1 (1)( ) (1)( ) n iijji j jj x kfw
43、x k x kx kji 1 (1)( ) n iijji j x kfw x ki 2. 稳定性和吸引子稳定性和吸引子 1)对于非线性动态系统:)对于非线性动态系统: a.稳定性是它正常工作的首要问题;稳定性是它正常工作的首要问题; b.吸引子(稳定点):是一种吸引子(稳定点):是一种特殊的平衡点特殊的平衡点,在吸引,在吸引 子的周围若动态品质佳,则设子的周围若动态品质佳,则设 计的非线性系统相对而言好;计的非线性系统相对而言好; 定义定义:若网络的状态:若网络的状态 X 满足满足 ,则称,则称 X 为网络的吸引子;为网络的吸引子; c.吸引域:在吸引域:在多大的范围多大的范围内,网络可以从
44、某一点逐渐内,网络可以从某一点逐渐 收敛到稳定点收敛到稳定点上;上; d.收敛时间:表示系统的动态品质,反馈收敛的快慢;收敛时间:表示系统的动态品质,反馈收敛的快慢; ()Xf WX 2. 稳定性和吸引子稳定性和吸引子 2)Hamming距离:距离: 假设假设 ,则,则 x 与与 y 的的Hamming距离定义为:距离定义为: 3)计算能量函数:)计算能量函数: 异步方式:异步方式: 同步方式:同步方式: , 1, 1 N x y 1 1 ( , ) 2 N Hbb b dx yxy 1 ( )( )( )( ) 2 TT E tXt WX tXt 11 ( )( )(1)( )(1) 22
45、TT E tXt WX tX tX t 2. 稳定性和吸引子稳定性和吸引子 4)定理一:若)定理一:若 且且 ,那么离散,那么离散Hopfield网网 络在络在异步方式异步方式下,下,必收敛于一稳定状态必收敛于一稳定状态; 定理二:若定理二:若 ,那么离散,那么离散Hopfield网络在网络在同步方同步方 式式下,下,必收敛到一稳定状态或周期为必收敛到一稳定状态或周期为2的极限的极限 环环上;上; 定理三:若定理三:若 且且为为非负定非负定,那么离散,那么离散Hopfield 网络网络必收敛到一稳定状态必收敛到一稳定状态; T WW 0 ii W T WW T WW 2. 稳定性和吸引子稳定性
46、和吸引子 5)吸引子的性质:)吸引子的性质: 定理一:若定理一:若X是网络的一个吸引子,且对所有的是网络的一个吸引子,且对所有的 i , ,则,则 也一定是该网络的也一定是该网络的 吸引子;吸引子; 定理二:若定理二:若 是网络的吸引子,则与是网络的吸引子,则与 的的 的的 一定不是吸引子;一定不是吸引子; 推论:若推论:若 是网络的吸引子,且对所有的是网络的吸引子,且对所有的 i, ,则,则 的的 一定不是吸引子;一定不是吸引子; 1 0,0 n iijj j w x X ( )a X ( )a X ( )( ) (,)1 ab H dXX ( )b X ( ) a X 1 0,0 n ii
47、jj j w x ( )( ) (,)1 ab H dXXn ( )b X 2. 稳定性和吸引子稳定性和吸引子 6)吸引域:)吸引域: 定义:若定义:若 是网络的吸引子,对于异步方式,若是网络的吸引子,对于异步方式,若 存在存在一个调整次序一个调整次序可以从可以从X 演变到演变到 ,则,则 称称X 弱弱吸引到吸引到 ; 若对于若对于任意调整次序任意调整次序都可以从都可以从X 演变到演变到 , 则称则称X 强强吸引到吸引到 ; 对于所有对于所有 均有均有X 强(弱)强(弱)吸引到吸引到 , 则称则称 为为 的的强(弱)吸引域强(弱)吸引域; ( )a X ( )a X ( )a X ( )a X
48、 ( )a X ( )a X ( )a X ( ) () a X RX ( ) () a RX 3. 连接权的设计连接权的设计 1)试凑法:)试凑法: 例:设计三个节点的例:设计三个节点的DHNN网络,网络的网络,网络的 所有的状态所有的状态 ,阈值,阈值 ,要求有,要求有 两个不动点:两个不动点: 0,1 1,1 0 1 0 A 1 1 1 B 3. 连接权的设计连接权的设计 2)Hebb规则设计:规则设计: 设给定设给定m个样本个样本 ,采用,采用Hebb 规则(用输入模式作为目标模式)来设计权规则(用输入模式作为目标模式)来设计权 值:值: a.当网络节点的状态当网络节点的状态 时:时:
49、 ( ) (1,2,., ) k xkm 1,1nx ( )( ) 1 , 0, m kk ij k ij xxij W ij 11100 111 11 2 010 111 11001 022 202 220 W 举例: 由3个神经元组成的离散Hopfield网络,有2个基本存 贮器,存贮2个向量1,-1,1和-1,1,-1,设计权 连接矩阵。 按公式: 相应的连接图形如右:相应的连接图形如右: 1 2 022141 202 -1 4 -1 220141 022-14-1 202 1 4 1 220-14-1 WYy WYy 满足匹配条件的固定点或向量计算如下:满足匹配条件的固定点或向量计算如
50、下: 其它点都是不稳定的点,例如,对其它点都是不稳定的点,例如,对1,1,1,和,和 1,1,-1,迭代结果都移向稳定点。,迭代结果都移向稳定点。 对对1,1,1 022101 202 14 -1 220101 WY 对对1,1,-1 02214-1 20210 1 22010-1 WY 此过程可用图 表示如右: 例:设计例:设计DHNN网络,网络节点数网络,网络节点数n=4,所有的,所有的 状态状态 ,阈值均为,阈值均为0,样本数,样本数m=2,分别,分别 为:为: 1,1 (1) 1 1 1 1 T x (2) 1111 T x 3. 连接权的设计连接权的设计 2)Hebb规则设计:规则设
51、计: b.当网络节点的状态当网络节点的状态 时:时: 0,1nx ( )( ) 1 (21)(21), 0, m kk ij k ij xxij W ij n练习:练习: 1.设计设计DHNN网络,网络节点数为网络,网络节点数为n=4,所有的状,所有的状 态态 ,阈值均为,阈值均为0,样本数为,样本数为2,分别为:,分别为:0,1 (1) 1010 T x (2) 0101 T x n4. 联想记忆联想记忆 1).联想记忆功能是联想记忆功能是DHNN网络的一个重要的应用。网络的一个重要的应用。 要实现联想记忆,反馈网络必须具有要实现联想记忆,反馈网络必须具有两个基本条件两个基本条件: a.网络
52、能收敛到稳定的平衡状态,并以其作为样本网络能收敛到稳定的平衡状态,并以其作为样本 的记忆信息;的记忆信息; b.具有回忆的功能,能够从某一残缺的信息回忆起具有回忆的功能,能够从某一残缺的信息回忆起 所属的完整记忆信息;所属的完整记忆信息; 2)DHNN网络网络实现联想记忆的过程分为两个阶段实现联想记忆的过程分为两个阶段: 学习记忆阶段:选择某一设计方法确定合适的权学习记忆阶段:选择某一设计方法确定合适的权 值,使网络记忆期望的稳定平衡值,使网络记忆期望的稳定平衡 点;点; 联想回忆阶段:即是网络的工作过程;联想回忆阶段:即是网络的工作过程; n4. 联想记忆联想记忆 3)DHNN网络的局限性:
53、网络的局限性: a.记忆容量是有限的;记忆容量是有限的; 记忆容量:在网络结构参数一定的条件下,要保记忆容量:在网络结构参数一定的条件下,要保 证联想记忆功能的正确实现,网络所证联想记忆功能的正确实现,网络所 能存储的最大样本数。能存储的最大样本数。 b.当记忆样本较接近时,网络不能始终回忆出正确当记忆样本较接近时,网络不能始终回忆出正确 的记忆;的记忆; c.网络的平衡稳定点并不可以任意设置;网络的平衡稳定点并不可以任意设置; 讨论讨论 HopfieldHopfield网络的工作过程有网络的工作过程有4 4个步骤:个步骤: 1 1)存贮(学习),异步、随机。)存贮(学习),异步、随机。 2
54、2)初始化,加入初始试样,然后移走。)初始化,加入初始试样,然后移走。 3 3)迭代直至收敛)迭代直至收敛 4 4)输出,得到稳定点。)输出,得到稳定点。 有能量函数,保证迭代过程能量的增量为负。有能量函数,保证迭代过程能量的增量为负。 连续连续HopfieldHopfield网络具有同样的性质。网络具有同样的性质。 2.4 随机神经网络随机神经网络 一、引言一、引言 BP神经网络和神经网络和Hopfield网络的共同缺点是:系统不易收敛到全网络的共同缺点是:系统不易收敛到全 局最小,与初始状态的选取有关;局最小,与初始状态的选取有关; 二、模拟退火算法(二、模拟退火算法(Simulated
55、Annealing) 1、Metropolis算法:算法: Begin repeat S=S+S E=E(S)-E(S) Prob=min(1,exp(- E/KbT) if Probrandom(0,1) then S=S until(某特定条件某特定条件) return S End 2)SA算法算法 Begin S=S0 T=T0 repeat S=M-Procedure(S) updata(T) until (find stop criterion) End 说明:说明:a) S应选取在应选取在S的临近解,即扰动不能太大;的临近解,即扰动不能太大; b) updata(T): T(n+1
56、)=(0.80.95)T(n); c) SA以概率为以概率为1收敛于最优解,但收敛速度较慢;收敛于最优解,但收敛速度较慢; 0 三、三、Boltzmann机机 1、BM中的神经元:中的神经元: 1 / (0) 1 (1) 1 n ijjiii j Si T Siw xw p xi e 2、Boltzmann机网络结构和工作方式机网络结构和工作方式 Boltzmann机网络是一个机网络是一个相互连接相互连接的神的神 经网络模型,具有经网络模型,具有对称的连接权系数,即对称的连接权系数,即 wijwji且且wii=0。网络由。网络由可见单元可见单元(Visible Unit)和)和隐单元隐单元(H
57、idden Unit)构成。可见)构成。可见 单元由输入、输出部分组成。每个单元节点单元由输入、输出部分组成。每个单元节点 只取只取1或或0两种状态。两种状态。1代表接通或接受,代表接通或接受,0表表 示断开或拒绝。当神经元的输入加权和发生示断开或拒绝。当神经元的输入加权和发生 变化时,神经元的状态随之更新。变化时,神经元的状态随之更新。 工作方式:工作方式:随机、异步随机、异步 举例:举例: 若初态为若初态为 则则 00.50.4 0.500.5 0.40.50 W 0.1 0.2 0.7 0 01 1 T X 1 2 3 1 1 1 001 010 T T T X X X 0 0.0E 1
58、 0.0E 2 0.7E 3 0.2E 能态相等能态相等 能态高能态高 能态低能态低 1 2 3 1 1 1 001 010 T T T X X X 1 2 3 1 1 1 001 010 T T T X X X 1 2 3 1 1 1 001 010 T T T X X X n与与Hopfield网络相似,网络相似,Boltzmann机的实际运行机的实际运行 也分为两个阶段:也分为两个阶段: 第一阶段是学习和训练阶段,即根据学习样第一阶段是学习和训练阶段,即根据学习样 本对网络进行训练,将知识分布地存储于网络的本对网络进行训练,将知识分布地存储于网络的 连接权中;连接权中; 第二阶段是工作阶
59、段,即根据输入运行网络第二阶段是工作阶段,即根据输入运行网络 得到合适的输出,这一步实质上是按照某种机制得到合适的输出,这一步实质上是按照某种机制 将知识提取出来。将知识提取出来。 几点说明:几点说明: 1. 由于由于BM是随机网络,在能量极小点附近,系是随机网络,在能量极小点附近,系 统也统也不会停止在某一固定状态不会停止在某一固定状态; 2. 由于神经元的状态是按概率取值的,所以以上由于神经元的状态是按概率取值的,所以以上 分析只是从分析只是从概率上概率上说网络的能量总的趋势是说网络的能量总的趋势是 朝减小的方向演化,但有些步可能按小概率朝减小的方向演化,但有些步可能按小概率 取值,从而使
60、能量增加,这对跳出局部极小取值,从而使能量增加,这对跳出局部极小 点是有好处的。这也是点是有好处的。这也是BM与与DHNN最主要最主要 的不同点;的不同点; 3. 为了能演化到全局极小点,通常采用模拟退火为了能演化到全局极小点,通常采用模拟退火 的方法;的方法; 2.5 局部逼近神经网络局部逼近神经网络 一、引言一、引言 1.全局逼近网络:全局逼近网络: 若网络的一个或多个权值或自适应可调参数在输入若网络的一个或多个权值或自适应可调参数在输入 空间的每一个点对任何一个输出都有影响,则称神经空间的每一个点对任何一个输出都有影响,则称神经 网络为全局逼近神经网络;网络为全局逼近神经网络; 由于对于
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 建筑垃圾生态化利用研究方案
- 城市排水管网运行管理方案
- 2025至2030生鲜零售供应链效率提升与损耗控制研究报告
- 2025-2030中国新式茶饮市场营销模式与未来投资商机盈利性研究报告
- 码头泊位施工方案(3篇)
- 潮汕聚会活动策划方案(3篇)
- 假期咖啡活动策划方案(3篇)
- 老年酒店活动策划方案(3篇)
- 亲自捞鱼活动策划方案(3篇)
- 班级踏春活动方案策划(3篇)
- 送货方案模板(3篇)
- 2025年湖南省中考数学真题试卷及答案解析
- 学前教育论文格式模板
- DB32/T 3518-2019西兰花速冻技术规程
- 架空输电线路建设关键环节的质量控制与验收标准
- 装修敲打搬运合同协议书
- 《世界经济史学》课件
- 重生之我在古代当皇帝-高二上学期自律主题班会课件
- 膀胱切开取石术护理查房
- GB/T 45355-2025无压埋地排污、排水用聚乙烯(PE)管道系统
- 四川省绵阳市2024届中考数学试卷(含答案)
评论
0/150
提交评论