




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、3/6/20221第第4章章 BP网络网络 主要内容主要内容: BP网络的构成网络的构成隐藏层权的调整分析隐藏层权的调整分析 Delta规则理论推导规则理论推导算法的收敛速度及其改进讨论算法的收敛速度及其改进讨论 BP网络中的几个重要问题网络中的几个重要问题 重点:重点:BP算法算法 难点:难点:Delta规则的理论推导规则的理论推导 3/6/202224.1 概述概述 1、BP算法的出现算法的出现非循环多级网络的训练算法非循环多级网络的训练算法UCSD PDP小组的小组的Rumelhart、Hinton和和Williams1986年年独立地给出了独立地给出了BP算法清楚而简单的描述算法清楚而
2、简单的描述1982年,年,Paker就完成了相似的工作就完成了相似的工作1974年,年,Werbos已提出了该方法已提出了该方法2、弱点、弱点:训练速度非常慢、局部极小点的逃离问题、:训练速度非常慢、局部极小点的逃离问题、算法不一定收敛算法不一定收敛3、优点:、优点:广泛的适应性和有效性。广泛的适应性和有效性。3/6/202234.2 基本基本BP算法算法 4.2.1 网络的构成网络的构成 神经元的网络输入:神经元的网络输入:neti=x1w1i+x2w2i+xnwni神经元的输出:神经元的输出:netenetfo11)()1 ()()1 (1)(22ooooeenetfnetnet3/6/2
3、0224输出函数分析输出函数分析 0.5f (net)0.25o0 11(0,0.5)net(0,0)oneteo11应该将应该将net的值尽量控制在收敛比较快的范围的值尽量控制在收敛比较快的范围内内可以用其它的函数作为激活函数,只要该函数可以用其它的函数作为激活函数,只要该函数是处处可导的是处处可导的3/6/20225网络的拓扑结构网络的拓扑结构x1o1输出层输出层隐藏层隐藏层输入层输入层x2o2omxnW(1)W(2)W(3)W(L)3/6/20226网络的拓扑结构网络的拓扑结构 BP网的结构网的结构输入向量、输出向量的维数、网络隐藏层输入向量、输出向量的维数、网络隐藏层的层数和各个隐藏层
4、神经元的个数的决定的层数和各个隐藏层神经元的个数的决定实验:增加隐藏层的层数和隐藏层神经元实验:增加隐藏层的层数和隐藏层神经元个数不一定总能够提高网络精度和表达能个数不一定总能够提高网络精度和表达能力力BPBP网一般都选用二级网络网一般都选用二级网络3/6/20227网络的拓扑结构网络的拓扑结构x1o1输出层输出层隐藏层隐藏层输入层输入层x2o2omxnWV3/6/202284.2.2 训练过程概述训练过程概述 样本:样本:(输入向量,理想输出向量输入向量,理想输出向量) )权初始化:权初始化:“小随机数小随机数”与饱和状态;与饱和状态;“不不同同”保证网络可以学。保证网络可以学。1 1、向前
5、传播阶段:、向前传播阶段:(1)从样本集中取一个样本)从样本集中取一个样本(Xp,Yp),将,将Xp输入网络;输入网络;(2)计算相应的实际输出)计算相应的实际输出Op:Op=Fl(F2(F1(XpW(1)W(2)W(L)3/6/202294.2.2 训练过程概述训练过程概述 2 2、向后传播阶段、向后传播阶段误差传播阶段:误差传播阶段:(1)计算实际输出)计算实际输出Op与相应的理想输出与相应的理想输出Yp的差;的差;(2)按极小化误差的方式调整权矩阵。)按极小化误差的方式调整权矩阵。(3)网络关于第)网络关于第p p个样本的误差测度:个样本的误差测度:mjpjpjpoyE1221(4) 网
6、络关于整个样本集的误差测度:网络关于整个样本集的误差测度:ppEE3/6/2022104.2.3 误差传播分析误差传播分析 1、输出层权的调整、输出层权的调整wpq= wpq+wpqwpq=qop=fn (netq)(yq-oq)op=oq(1-oq) (yq-oq)op wpqANpANq第第L-1层层第第L层层wpq3/6/2022112 2、隐藏层权的调整、隐藏层权的调整 ANpANqANhvhppk-11kwp1wpqqkwpmmk第第k-2层层第第k层层第第k-1层层3/6/2022122 2、隐藏层权的调整、隐藏层权的调整pk-1的值和的值和1k,2k,mk 有关有关不妨认为不妨认
7、为pk-1通过权通过权wp1对对1k做出贡献,做出贡献,通过权通过权wp2对对2k做出贡献,做出贡献,通过权通过权wpm对对mk做出贡献。做出贡献。pk-1= fk-1(netp) (wp11k+ wp22k+ wpmm k)3/6/2022132 2、隐藏层权的调整、隐藏层权的调整vhp=vhp+vhp vhp=pk-1ohk-2 =fk-1 (netp)( wp11k+ wp22k+ wpmmk)ohk-2=opk-1(1-opk-1)( wp11k+ wp22k+ wpmmk)ohk-2ANpANqANhvhppk-11kwp1wpmqkwpqmk第第k-2层层第第k层层第第k-1层层3
8、/6/2022144.2.4 基本的基本的BP算法算法 样本集:样本集:S=(X1,Y1),(,(X2,Y2),),(,(Xs,Ys) ) 基本思想基本思想 :逐一地根据样本集中的样本逐一地根据样本集中的样本(Xk,Yk)计算出实际输计算出实际输出出Ok和误差测度和误差测度E1,对,对W(1) ,W(2) ,W(L)各各做一次调整,重复这个循环,直到做一次调整,重复这个循环,直到Ep do 4.1 E=0; 3/6/202216算法算法4-1基本基本BP算法算法 4.2 对对S中的每一个样本(中的每一个样本(Xp,Yp):): 4.2.1 计算出计算出Xp对应的实际输出对应的实际输出Op; 4
9、.2.2 计算出计算出Ep; 4.2.3 E=E+Ep; 4.2.4 根据相应式子调整根据相应式子调整W(L); 4.2.5 k=L-1; 4.2.6 while k0 do 根据相应式子调整根据相应式子调整W(k); k=k-1 4.3 E=E/2.0 3/6/2022174.3 算法的改进算法的改进 1、BP网络接受样本的顺序对训练结果有较大网络接受样本的顺序对训练结果有较大影响。它更影响。它更“偏爱偏爱”较后出现的样本较后出现的样本2、给集中的样本安排一个适当的顺序,是非常给集中的样本安排一个适当的顺序,是非常困难的。困难的。3、样本顺序影响结果的原因:样
10、本顺序影响结果的原因:“分别分别”、“依依次次” 4、用用(X1,Y1),(,(X2,Y2),),(,(Xs,Ys)的)的“总效果总效果”修改修改W(1) ,W(2) ,W(L)。w(k)ij=p w(k)ij3/6/202218算法算法4-2 4-2 消除样本顺序影响的消除样本顺序影响的BP算法算法 1 for k=1 to L do1.1 初始化初始化W(k);2 初始化精度控制参数初始化精度控制参数;3 E=+1;4 while E do 4.1 E=0;4.2 对所有的对所有的i,j,k: w (k)ij=0; 3/6/2022194.3 对对S中的每一个样本(中的每一个样本(Xp,Y
11、p):):4.3.1 计算出计算出Xp对应的实际输出对应的实际输出Op;4.3.2 计算出计算出Ep;4.3.3 E=E+Ep;4.3.4 对所有对所有i,j根据相应式子计算根据相应式子计算p w (L)ij;4.3.5 对所有对所有i,j: w (L)ij= w (L)ij+p w (L)ij;4.3.6 k=L-1;4.3.7 while k0 do 对所有对所有i, ,j根据相应式子计算根据相应式子计算p w (k)ij; 对所有对所有i, ,j: w (k)ij= w (k)ij+p w (k)ij; k=k-1 4.4 对所有对所有i,j,k
12、:w (k)ij= w (k)ij+ w (k)ij;4.5 E=E/2.0 3/6/202220算法算法4-2 分析分析 较好地解决了因样本的顺序引起的精度问较好地解决了因样本的顺序引起的精度问题和训练的抖动问题题和训练的抖动问题 收敛速度:比较慢收敛速度:比较慢 偏移量:给每一个神经元增加一个偏移量偏移量:给每一个神经元增加一个偏移量来加快收敛速度来加快收敛速度 冲量冲量:联接权的本次修改要考虑上次修改联接权的本次修改要考虑上次修改的影响,以减少抖动问题的影响,以减少抖动问题 3/6/202221算法算法4-2 分析分析冲量设置冲量设置 Rumelhart等人等人1986年年 wij=jo
13、i+wij wij为上一次的修改量,为上一次的修改量,为冲量系数,一般可为冲量系数,一般可取到取到0.9 Sejnowski与与Rosenberg ,1987年年 wij=(1-) )joi+wij) wij也是上一次的修改量,也是上一次的修改量,在在0和和1之间取值之间取值 3/6/2022224.4 算法的实现算法的实现 主要数据结构主要数据结构WH,m输出层的权矩阵;输出层的权矩阵;Vn,H输入(隐藏)层的权矩阵;输入(隐藏)层的权矩阵;om输出层各联接权的修改量组成的向量;输出层各联接权的修改量组成的向量;hH隐藏层各联接权的修改量组成的向量;隐藏层各联接权的修改量组成的向量;O1隐藏
14、层的输出向量;隐藏层的输出向量;O2输出层的输出向量;输出层的输出向量;(X,Y)一个样本。一个样本。 3/6/202223算法的主要实现步骤算法的主要实现步骤 用不同的小伪随机数初始化用不同的小伪随机数初始化W,V;初始化精度控制参数初始化精度控制参数;学习率;学习率 ; 循环控制参数循环控制参数E=+1;循环最大次数;循环最大次数M;循环次数控制参数循环次数控制参数N=0; while E & N0,此时,此时wij0取取ijwEE0wij3/6/202231ijjjijwnetnetEwE而其中的而其中的kkkjjownet所以,所以,iijkkkjijjowowwnet最速下降
15、法,要求最速下降法,要求E的极小点的极小点3/6/202232ijijkkkjjijjjijonetEwownetEwnetnetEwE令令jjnetE所以所以wij=joi为学习率为学习率最速下降法,要求最速下降法,要求E的极小点的极小点3/6/202233ANj为输出层神经元为输出层神经元 oj=f(netj) 容易得到容易得到 )net(fnetojjj)net(foEnetooEnetEjjjjjjj从而从而3/6/202234)()(22()21(21212jjjjjjjjmkkkjoyoyooyooyoEANj为输出层神经元为输出层神经元3/6/202235所以,所以,)net(f
16、 )oy(jjjj故,当故,当ANj为输出层的神经元时,它对应为输出层的神经元时,它对应的联接权的联接权wij应该按照下列公式进行调整:应该按照下列公式进行调整:ijjjijijijijo)oy)(net(fwowwANj为输出层神经元为输出层神经元3/6/202236ANj为隐藏层神经元为隐藏层神经元 jjjjjnetooEnetE)net(fnetojjj)net(foEjjjm1k2kk)oy(21E函数3/6/202237ANj为隐藏层神经元为隐藏层神经元netk= hHlllkow1hH1kjkkj)onetnetE(oEjkjHlllkjkwoowoneth1oio2o1oHhne
17、tk是是 oj下一级的神下一级的神经元的网络输入经元的网络输入oj3/6/202238ANj为隐藏层神经元为隐藏层神经元hhH1kjkkH1kjkkjwnetEonetnetEoE hH1kjkkjwoEkknetE3/6/202239ANj为隐藏层神经元为隐藏层神经元)net(fw)net(foEjH1kjkkjjjh)net(fwjH1kjkkjh3/6/202240ANj为隐藏层神经元为隐藏层神经元ijH1kjkkijo )net(fwwhijH1kjkkijijo)net(fwwwh3/6/2022414.6 几个问题的讨论几个问题的讨论 收敛速度问题收敛速度问题 局部极小点问题局部极
18、小点问题 逃离逃离/避开局部极小点避开局部极小点:修改修改W、V的初值的初值并不是总有效。并不是总有效。逃离逃离统计方法;统计方法;Wasserman,1986将将Cauchy训练与训练与BP算法结合起来,可以在保证算法结合起来,可以在保证训练速度不被降低的情况下,找到全局极小点。训练速度不被降低的情况下,找到全局极小点。 3/6/2022424.6 几个问题的讨论几个问题的讨论 网络瘫痪问题网络瘫痪问题 在训练中,权可能变得很大,这会使神经元的在训练中,权可能变得很大,这会使神经元的网络输入变得很大,从而又使得其激活函数的网络输入变得很大,从而又使得其激活函数的导函数在此点上的取值很小。根据相应式子,导函数在此点上的取值很小。根据相应式子,此时的训练步长会变得非常小,进而将导致训此时的训练步长会变得非常小,进而将导致训练速度降得非常低,最终导致网络停止收敛练
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 宁波幼儿师范高等专科学校《汽车车身电控与技术》2023-2024学年第二学期期末试卷
- 山西能源学院《当代建筑史》2023-2024学年第二学期期末试卷
- 西北农林科技大学《基础法语听力(2)》2023-2024学年第二学期期末试卷
- 合肥科技职业学院《地质与地球科学》2023-2024学年第二学期期末试卷
- 曲靖师范学院《游戏创作基础与实践》2023-2024学年第二学期期末试卷
- 江苏城乡建设职业学院《教师语言训练》2023-2024学年第二学期期末试卷
- 昆明工业职业技术学院《自动控制系统课程设计》2023-2024学年第二学期期末试卷
- 山东旅游职业学院《检测技术实验》2023-2024学年第二学期期末试卷
- 西安工程大学《数据分析与应用》2023-2024学年第二学期期末试卷
- 许昌学院《工业机器人基础操作与编程实训》2023-2024学年第二学期期末试卷
- 汽车路试协议书
- 聘请名誉顾问合同协议
- 2025年河南高一学业水平合格考模拟地理试卷试题(含答案详解)
- 《危险化学品企业安全生产标准化规范》专业深度解读与应用培训指导材料之6:5管理要求-5.6 设备完整性(雷泽佳编制-2025A0)
- 市场调查与分析(完全)
- 临床专业考试试题及答案
- 2024年黑龙江帕弗尔能源产业管理有限公司高校毕业生招聘笔试真题
- 初中家长学校父母课堂课件与教案
- 2025年软件设计师模拟试卷:操作系统与计算机网络核心知识点精讲
- 裸眼3D研究报告裸眼3D项目商业计划书(2025年)
- 计算机组成原理练习题(含参考答案)
评论
0/150
提交评论