



版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、BP神经网络算法原理:输入信号 xi 通过中间节点(隐层点)作用于输出节点,经过非线形变换,产生输出信号 yk ,网络训练的每个样本包括输入向量x 和期望输出量 d ,网络输出值y 与期望输出值 d 之间的偏差,通过调整输入节点与隐层节点的联接强度取值wij 和隐层节点与输出节点之间的联接强度Tjk 以及阈值,使误差沿梯度方向下降, 经过反复学习训练,确定与最小误差相对应的网络参数(权值和阈值) ,训练即告停止。此时经过训练的神经网络即能对类似样本的输入信息, 自行处理输出误差最小的经过非线形转换的信息。变量定义:设输入层有 n 个神经元,隐含层有p 个神经元 , 输出层有 q 个神经元输入向
2、量: xx1 , x2 ,L , xn隐含层输入向量:hihi1, hi2 ,L , hi p隐含层输出向量:hoho1 , ho2 ,L ,hop输出层输入向量:yiyi1, yi2 ,L , yiq输出层输出向量:yoyo1, yo2 ,L , yoq期望输出向量 :dod1, d2 ,L , dq输入层与中间层的连接权值:wih隐含层与输出层的连接权值:who隐含层各神经元的阈值: bh输出层各神经元的阈值:bo样本数据个数 :k1,2,Lm激活函数 : f误差函数: e1 q(do (k )yoo (k ) 22 o1精选文库算法步骤:Step1. 网络初始化。给各连接权值分别赋一个区
3、间(-1 , 1)内的随机数,设定误差函数 e ,给定计算精度值和最大学习次数 M。Step2. 随机选取第 k 个输入样本x( k)x1( k ), x2 (k),L, xn (k ) 及对应期望输出do ( k)d1 (k ), d2 ( k),L , dq (k)Step3. 计算隐含层各神经元的输入nhi h ( k)wih xi (k )bhh1,2,L , p和输出i1hoh (k)f (hih (k ) h 1,2, L , p及输 出层各 神经元的输入pyio (k )whohoh (k) bo o 1,2,L q 和输出 yoo ( k)f ( yio (k ) o1,2,
4、L, ph 1Step4. 利用网络期望输出和实际输出,计算误差函数对输出层的各神经元的偏导数 o (k ) 。e e yiowhoyio whopyio ( k)(hwhohoh (k) bo )hoh (k)whowhoe( 1 q(do ( k) yoo (k) 22 o1( do (k )yioyio(do (k)yoo ( k)f ( yio (k ) o (k )Step5. 利用隐含层到输出层的连接权值、输出层的差函数对隐含层各神经元的偏导数h (k ) 。eeyioo ( k) hoh (k )whoyiowhoeehi h (k)wihhi h ( k) wihnhih (k
5、 )(wih xi (k ) bh )i1xi( k)wihwihyoo (k ) yoo (k )o ( k) 和隐含层的输出计算误-2ehi h (k )精选文库( 1 q(do ( k) yoo (k) 2 )hoh (k )2 o1hoh (k )hih (k )( 1q(do ( k)f( yi o (k ) 2 )hoh (k)2 o1hoh (k )hi h (k)( 1q(do (k)f(pwho hoh (k ) bo )2 )hoh (k)2 o1h 1hoh (k)hi h ( k)qhoh (k )( do (k ) yoo ( k) f ( yi o (k) who(
6、k )o 1hihq(o (k )who ) f ( hih ( k) h (k )o1Step6. 利用输出层各神经元的o (k ) 和隐含层各神经元的输出来修正连接权值who (k ) 。who (k )eo (k)hoh (k)whowhoN 1whoNo (k )hoh (k)Step7. 利用隐含层各神经元的h (k ) 和输入层各神经元的输入修正连接权 wih ( k) 。wih (k)eehih ( k)wihhih (k)h (k) xi ( k)wihwihN 1wihNh (k ) xi (k)Step8. 计算全局误差。1m qyo ( k) 2E(do (k)2m k
7、1 o1Step9. 判断网络误差是否满足要求。 当误差达到预设精度或学习次数大于设定的最大次数,则结束算法。否则,选取下一个学习样本及对应的期望输出,返回到第三步,进入下一轮学习。-3精选文库算法流程图:网络初始化输入 x ,根据网络的状态方程计算网络输出y计算全局误差:1m qE22m(do (k ) yo ( k)k 1 o 1YESENOYES达到最大学习次数NO修改权值:训练完成w NwN 1(k) x(k )参数确定:确定了网络层数、每层节点数、传递函数、初始权系数、学习算法等也就确定了BP网络。确定这些选项时有一定的指导原则,但更多的是靠经验和试凑。1. 样本数据采用 BP 神经
8、网络方法建模的首要和前提条件是有足够多典型性好和精度高的样本。而且,为监控训练(学习)过程使之不发生“过拟合”和评价建立的网络模型的性能和泛化能力,必须将收集到的数据随机分成训练样本、检验样本(10%以上)和-4精选文库测试样本( 10%以上) 3 部分。2. 输入 / 输出变量一般地,BP网络的输入变量即为待分析系统的内生变量 (影响因子或自变量) 数,一般根据专业知识确定。 若输入变量较多,一般可通过主成份分析方法压减输入变量,也可根据剔除某一变量引起的系统误差与原系统误差的比值的大小来压减输入变量。输出变量即为系统待分析的外生变量(系统性能指标或因变量) ,可以是一个,也可以是多个。一般
9、将一个具有多个输出的网络模型转化为多个具有一个输出的网络模型效果会更好,训练也更方便。3. 数据的预处理由于 BP 神经网络的隐层一般采用Sigmoid 转换函数,为提高训练速度和灵敏性以及有效避开Sigmoid 函数的饱和区,一般要求输入数据的值在01 之间。因此,要对输入数据进行预处理。一般要求对不同变量分别进行预处理,也可以对类似性质的变量进行统一的预处理。如果输出层节点也采用Sigmoid 转换函数,输出变量也必须作相应的预处理,否则,输出变量也可以不做预处理。但必须注意的是,预处理的数据训练完成后,网络输出的结果要进行反变换才能得到实际值。再者,为保证建立的模型具有一定的外推能力,最
10、好使数据预处理后的值在0.2 0.8 之间。标准化:d ddmindmaxdmin4. 隐层数一般认为,增加隐层数可以降低网络误差,提高精度,但也使网络复杂化,从而增加了网络的训练时间和出现“过拟合 (overfitting) ” 造成网络的性能脆弱, 泛化能力 (generalization ability) 下降。 Hornik 等早已证明:若输入层和输出层采用线性转换函数,隐层采用 Sigmoid 转换函数,则含一个隐层的 MLP网络能够以任意精度逼近任何有理函数。显然,这是一个存在性结论。在设计 BP 网络时可参考这一点,应优先考虑 3 层 BP网络(即有 1 个隐层)。输入层隐含层输
11、出层x1yz-T1111x2y2z 2-T22xNyN 2wzN3-w1TNihhj3N3图 三层 BP网络的拓扑结构5. 隐层节点数-5Emin 值取得较大时则相反。精选文库在 BP 网络中,若隐层节点数太少,网络可能根本不能训练或网络性能很差;若隐层节点数太多,虽然可使网络的系统误差减小,但一方面使网络训练时间延长,另一方面,训练容易陷入局部极小点而得不到最优点,也是训练时出现“过拟合”的内在原因,但是目前理论上还没有一种科学的和普遍的确定方法。为尽可能避免训练时出现“过拟合”现象,保证足够高的网络性能和泛化能力,确定隐层节点数的最基本原则是:在满足精度要求的前提下取尽可能紧凑的结构, 即
12、取尽可能少的隐层节点数。因此,合理隐层节点数应在综合考虑网络结构复杂程度和误差大小的情况下用节点删除法和扩张法确定。6. 传递函数图 BP 网络常用的传递函数BP网络的传递函数有多种。 Log-sigmoid型函数的输入值可取任意值,输出值在0 和 1 之间; tan-sigmod 型传递函数 tansig的输入值可取任意值,输出值在-1 到+1之间;线性传递函数 purelin的输入与输出值可取任意值。 BP网络通常有一个或多个隐层,该层中的神经元均采用sigmoid 型传递函数,输出层的神经元则采用线性传递函数,整个网络的输出可以取任意值。7. 学习率学习率影响系统学习过程的稳定性。 大的
13、学习率可能使网络权值每一次的修正量过大,甚至会导致权值在修正过程中超出某个误差的极小值呈不规则跳跃而不收敛;但过小的学习率导致学习时间过长,不过能保证收敛于某个极小值。所以,一般倾向选取较小的学习率以保证学习过程的收敛性(稳定性) ,通常在 0.01 0.8 之间。8. 网络的初始连接权值BP算法决定了误差函数一般存在 (很)多个局部极小点, 不同的网络初始权值直接决定了 BP 算法收敛于哪个局部极小点或是全局极小点。因此,要求计算程序必须能够自由改变网络初始连接权值。由于 Sigmoid 转换函数的特性,一般要求初始权值分布在 -0.5 0.5 之间比较有效。10收敛误差界值Emin在网络训
14、练过程中应根据实际情况预先确定误差界值。误差界值的选择完全根据网络模型的收敛速度大小和具体样本的学习精度来确定。当Emin 值选择较小时,学习效果好,但收敛速度慢,训练次数增加。如果网络模型的性能和泛化能力:训练神经网络的首要和根本任务是确保训练好的网络模型对非训练样本具有好的泛化能力(推广性) ,即有效逼近样本蕴含的内在规律,而不是看网络模型对训练样本的拟合能力。 判断建立的模型是否已有效逼近样本所蕴含的规律,主要不是看测-6精选文库试样本误差大小的本身, 而是要看测试样本的误差是否接近于训练样本和检验样本的误差。非训练样本误差很接近训练样本误差或比其小,一般可认为建立的网络模型已有效逼近训
15、练样本所蕴含的规律,否则,若相差很多(如几倍、几十倍甚至上千倍)就说明建立的网络模型并没有有效逼近训练样本所蕴含的规律, 而只是在这些训练样本点上逼近而已,而建立的网络模型是对训练样本所蕴含规律的错误反映。算法的特点:1. 非线性映照能力。神经网络能以任意精度逼近任何非线性连续函数。在建模过程中的许多问题正是具有高度的非线性。2. 并行分布处理方式。在神经网络中信息是分布储存和并行处理的,这使它具有很强的容错性和很快的处理速度。3. 自学习和自适应能力。神经网络在训练时,能从输入、输出的数据中提取出规律性的知识,记忆于网络的权值中,并具有泛化能力,即将这组权值应用于一般情形的能力。神经网络的学
16、习也可以在线进行。4. 数据融合的能力。神经网络可以同时处理定量信息和定性信息,因此它可以利用传统的工程技术(数值运算)和人工智能技术(符号处理)。5. 多变量系统。神经网络的输入和输出变量的数目是任意的,对单变量系统与多变量系统提供了一种通用的描述方式,不必考虑各子系统间的解耦问题算法的缺点:收敛速度缓慢;容易陷入局部极小值;难以确定隐层数和隐层节点个数。算法的改进:1. 利用动量法改进 BP算法标准 BP算法实质上是一种简单的最速下降静态寻优方法,在修正w k 时,只按照第 k 步的负梯度方向进行修正,而没有考虑到以前积累的经验,即以前时刻的梯度方向,从而常常使学习过程发生振荡,收敛缓慢。
17、动量法权值调整算法的具体做法是:将上一次权值调整量的一部分迭加到按本次误差计算所得的权值调整量上, 作为本次的实际权值调整量,即:w nE nw n1其中:为动量系数,通常0 0.9 ;学习率,范围在0.001 10 之间。这种方法所加的动量因子实际上相当于阻尼项,它减小了学习过程中的振荡趋势,从而改善了收敛性。动量法降低了网络对于误差曲面局部细节的敏感性,有效的抑制了网络陷入局部极小。2. 自适应调整学习速率标准 BP算法收敛速度缓慢的一个重要原因是学习率选择不当, 学习率选得太小,收敛太慢;学习率选得太大,则有可能修正过头,导致振荡甚至发散。可采用下图所示的自适应方法调整学习率。-7精选文库调整的基本指导思想是:在学习收敛的情况下,增大,以缩短学习时间;当偏大致使不能收敛时,要及时减小,直到收敛为止。3. 动量 - 自适应学习速率调整算法采用动量法时, BP算法可以找到更优的解;采用自适应学习速率法时, B
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 初级社会工作者考试的逐步解析试题及答案
- 新版中级社会工作者考试碰撞试题及答案
- 系统分析师考试学习小组试题及答案
- 合理膳食试题及答案
- 洞见未来中级社会工作者考试试题及答案
- 糖酒公司库房管理制度
- 房地产垂直业务管理制度
- 初级社会工作者考试的高频试题及答案
- 林业收支业务管理制度
- 建立学校健康管理制度
- 2023-2024学年湖北省恩施市小学数学四年级下册期末点睛提升考试题
- 2023-2024学年浙江省衢州市初中语文七年级下册期末提升试题
- 广州市人力资源和社会保障局事业单位招聘工作人员模拟检测试卷【共500题含答案解析】
- GB/T 7735-2016无缝和焊接(埋弧焊除外)钢管缺欠的自动涡流检测
- GB/T 2013-2010液体石油化工产品密度测定法
- GB/T 19879-2005建筑结构用钢板
- FZ/T 62033-2016超细纤维毛巾
- 室内燃气规范试题
- 家用电器行业全球空调市场系列(东南亚篇):空调市场蕴藏发展潜力中国品牌持续发力
- 长城腾翼C30汽车全车配件价格表
- 《大数据安全技术》课程教学大纲
评论
0/150
提交评论