BP神经网络的改进和MATLAB实现ppt课件

上传人：闯*** IP属地：广东上传时间：2020-04-23 格式：PPT 页数：61 大小：1.66MB 积分：25 举报 版权申诉

已阅读5页，还剩56页未读，继续免费阅读

版权说明：本文档由用户提供并上传，收益归属内容提供方，若内容存在侵权，请进行举报或认领

文档简介

改进BP神经网络与MATLAB实现江西师范大学2012 6 11 1 BP神经网络的概述2 BP神经网络的标准训练学习3 在MATLAB软件上运行几个程序4 基于Levenberg Marquardt算法的学习优化阻尼最小二乘法 5 基于蚁群算法的初始权值优化6 经过4和5优化后的仿真试验发动机性能趋势分析和故障诊断中的应用 7 总结多元函数图示一元函数 X R 二元函数 x y o R f D f 三元函数 x y z o R f X X I 矩形的面积S x y 长方体体积V x y z 多元函数图示 x R 多元函数及其图形多元函数及其图形 BP神经网络模型激活函数必须处处可导一般都使用S型函数使用S型激活函数时BP网络输入与输出关系输入输出 BP神经网络模型输出的导数根据S型激活函数的图形可知对神经网络进行训练应该将net的值尽量控制在收敛比较快的范围内网络结构输入层有n个神经元隐含层有p个神经元输出层有q个神经元变量定义输入向量隐含层输入向量隐含层输出向量输出层输入向量输出层输出向量期望输出向量输入层与中间层的连接权值隐含层与输出层的连接权值隐含层各神经元的阈值输出层各神经元的阈值样本数据个数激活函数误差函数第一步网络初始化给各连接权值分别赋一个区间 1 1 内的随机数设定误差函数e 给定计算精度值和最大学习次数M 第二步随机选取第个输入样本及对应期望输出第三步计算隐含层各神经元的输入和输出第四步利用网络期望输出和实际输出计算误差函数对输出层的各神经元的偏导数第五步利用隐含层到输出层的连接权值输出层的和隐含层的输出计算误差函数对隐含层各神经元的偏导数第六步利用输出层各神经元的和隐含层各神经元的输出来修正连接权值第七步利用隐含层各神经元的和输入层各神经元的输入修正连接权第八步计算全局误差第九步判断网络误差是否满足要求当误差达到预设精度或学习次数大于设定的最大次数则结束算法否则选取下一个学习样本及对应的期望输出返回到第三步进入下一轮学习 BP算法直观解释情况1的直观表达当误差对权值的偏导数大于零时权值调整量为负实际输出大于期望输出权值向减少方向调整使得实际输出与期望输出的差减少 BP算法直解释情况2的直观表达当误差对权值的偏导数小于零时权值调整量为正实际输出少于期望输出权值向增大方向调整使得实际输出与期望输出的差减少梯度下降法一无约束优化的古典分析法无约束优化问题可表示为minf x1 x2 xn xi R i 1 2 n如果令x x1 x2 xn T 则无约束优化问题为minf x x Rn 关于f x 当x x 时 f x 是一条曲线当x x1 x2 T时 f x1 x2 是一个曲面当x x1 x2 x3 T时 f x1 x2 x3 是一个体密度或类位势函数当x x1 x2 xn T时 f x1 x2 xn 是一个超曲面设函数f x f x1 xn 对所有变元都有一阶与二阶连续偏导数则称n个一阶偏导数构成的n维列向量为f x 的梯度记作称满足 f x0 0的点x0为函数f x 的驻点或临界点称n2个二阶偏导数构成的n阶对称矩阵为函数f x 的海森 Hessian 矩阵记为H x 或 2f x 综上所述多元函数f x f x1 x2 xn 的一阶导数是它的梯度 f x 二阶导数是它的Hessian矩阵 2f x 在最优化方法的讨论中这是两个常用的概念定理最优性条件设n元函数y f x 对所有变元具有一阶及二阶连续偏导数则x0是f x 极小点的充分条件为 f x0 0 2f x0 0 正定而x0是f x 极大点的充分条件为 f x0 0 2f x0 0 负定事实上如果设 x x1 xn T 则利用多元函数的泰勒展开式我们有其中R为 x的高阶无穷小即R o x 2 于是当x0为函数f x 的驻点时可以得到于是当 xi i 1 n 足够小时上式右端的正负号完全由二次型 xT 2f x0 x决定从而完全由Hessian矩阵 2f x 的正负定性决定注记微积分中求一元函数和二元函数极值的方法是这个定理的特例二无约束优化的梯度下降法对于无约束优化问题minf x 1 x x1 x2 xn T Rn如果f x 可微根据古典分析的方法可利用 f x 0 2 求驻点然后再利用Hessian矩阵 2f x 来判定这些驻点是否极小值点从而求出无约束优化问题 1 的最优解但是用古典分析的方法求解无约束优化问题 1 实际上是行不通的这是由于 1 实际应用中相当数量的函数f x 不具有解析性故非线性方程组 f x 0无法形成 2 即使形成了方程组 f x 0 由于它是一个n元非线性方程组因而求它的解与解决原问题一样地困难 3 即使求得了 f x 0的解x 但由于最优性条件不被满足或者难于验证因此仍无法确定x 是否为 1 的解例如有些曲面有许多甚至无穷多极大值和极小值则无法验证最优性条件鉴于上述种种原因对于 1 的求解通常采用一些比较切合实际行之有效的数值算法最常用的是迭代算法搜索算法迭代算法的基本思想是从一个选定的初始点x0 Rn出发按照某一特定的迭代规则产生一个点列 xk 使得当 xk 是有穷点列时其最后一个点是 1 的最优解当 xk 是无穷点列时它有极限点并且其极限点是 1 的最优解设xk Rn是某迭代算法的第k轮迭代点而xk 1 Rn是第k 1轮迭代点记xk 1 xk kpk这里 k R称为步长 pk Rn称为搜索方向在 k和pk确定之后由xk Rn就可以确定xk 1 Rn 各种不同迭代算法的差别在于选择 k和pk 特别是pk 的方法不同使用最广泛的一类是下降算法它每迭代一次都是目标函数值有所下降即f xk 1 f xk 在下降算法中 1 搜索方向pk有多种选择方式不同的选择形成不同的下降算法如梯度下降法也叫最速下降法共轭梯度法牛顿法阻尼牛顿法拟牛顿法等但无论哪种下降法 pk的选择都有一个一般的原则既要使它尽可能地指向极小值点又不至于花费太大的使计算代价 2 步长的选择也有多种不同方式最常用的方式是寻找最优步长即求单变量极值问题的最优解 k R 梯度下降法最速下降法早在1847年法国数学家Cauchy就曾提出这样的问题从任一给定点x0 Rn出发沿着哪个方向f x 的函数值下降最快这个问题从理论上已经得到解决就是沿着在该点的负梯度方向 f x 的函数值下降最快这就是梯度下降法的理论依据梯度下降法的迭代步骤1 给定初始点x0 Rn 允许误差 0 并令k 0 2 计算pk f xk 3 检验是否满足收敛性判别准则 pk 若满足判别准则则停止迭代得到点x xk 否则进行4 4 单变量极值问题的最优解 k R 5 令xk 1 xk kpk k k 1返回2 例用梯度下降法求解minf x 2x12 x22 解 1 取初始点x0 1 1 T 计算得p0 f x0 4x01 2x02 T x1 1 x2 1 4 2 T由于所以f x0 p0 2 1 4 2 1 2 2 再求解单变量极值问题得 0 5 18 于是x1 x0 0p0 1 9 4 9 T 2 计算得p1 f x1 4x11 2x12 x11 1 9 x12 4 9 4 9 8 9 T所以故再求解单变量极值问题得 1 5 12 于是x2 x1 1p1 2 27 2 27 T 3 计算得p2 f x2 8 27 4 27 如此继续下去直到满足收敛准则为止该问题的最优解为x 0 1 T f x 0 如图所示梯度下降法是求解无约束优化问题的最基本的算法它在最优化方法中占有重要地位梯度下降法的优点是计算量小存储变量少对初始点要求不高缺点是 f x 仅仅反映了函数在点x处的局部性质对局部来说是最速的下降方向但对整体求解过程并不一定使函数值下降的最快另外梯度下降法收敛速度慢特别是在极小值点附近梯度下降法适用于寻优过程的前期迭代或作为间插步骤当接近极值点时宜选用其它收敛快的算法在MATLAB上实现的几个例子属于解析型的算法有梯度法又称最速下降法这是早期的解析法收敛速度较慢牛顿法收敛速度快但不稳定计算也较困难共轭梯度法收敛较快效果较好变尺度法这是一类效率较高的方法等等 BP网络的训练函数例一利用三层BP神经网络来完成非线性函数的逼近任务其中隐层神经元个数为五个样本数据例二利用三层BP神经网络来完成非线性函数的逼近任务其中隐层神经元个数为五个样本数据些论文对BP神经网络的训练学习过程进行改进用LM Levenberg Marquardt 算法对BP神经网络的训练学习进行改进它是使用最广泛的非线性最小二乘算法它是利用梯度求最小大值的算法形象的说属于爬山法的一种它同时具有梯度法和牛顿法的优点当很小时步长等于牛顿法步长当很大时步长约等于梯度下降法的步长这个的变动有时候像阻尼运动一样所以LM算法又叫阻尼最小二乘法牛顿法的几何意义 x1 x2 牛顿法也称为切线法基本思想在极小点附近用二阶Taylor多项式近似目标函数进而求出极小点的估计值雅克比矩阵雅克比矩阵的定义很广泛只要是向量间微积分运算过程中所涉及的包含偏微粉的行列式都可以叫雅克比矩阵如果说的更精确点的话雅克比矩阵可以认为是两个向量空间中对应的映射关系想要了解雅克比矩阵首先要了解两个向量空间的关系及将初始向量空间的基矢量表示为末尾向量空间的基矢量的函数然后通过求导既可以知道雅克比矩阵的具体形式了基于蚁群算法神经网络中权值和阈值的初始化仿真试验收敛速度问题局部极小点问题逃离避开局部极小点修改W V的初值并不是总有效逃离统计方法 Wasserman 1986 将Cauchy训练与BP算法结合起来可以在保证训练速度不被降低的情况下找到全局极小点 23 04 2020 57 网络瘫痪问题在训练中权可能变得很大这会使神经元的网络输入变得很大从而又使得其激活函数的导函数在此点上的取值很小根据相应式子此时的训练步长会变得非常小进而将导致训练速度降得非常低最终导致网络停止收敛稳定性问题用修改量的综合实施权的修改连续变化的环境它将变成无效的步长问题BP网络的收敛是基于无穷小的权修改量步长太小收敛就非常慢步长太大可能会导致网络的瘫痪

人人文库> 全部分类> 教育资料 > 课件下载

温馨提示

1. 本站所有资源如无特殊说明，都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2. 本站的文档不包含任何第三方提供的附件图纸等，如果需要附件，请联系上传者。文件的所有权益归上传用户所有。
3. 本站RAR压缩包中若带图纸，网页内容里面会有图纸预览，若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 人人文库网仅提供信息存储空间，仅对用户上传内容的表现方式做保护处理，对用户上传分享的文档内容本身不做任何修改或编辑，并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容，请与我们联系，我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

BP神经网络的改进和MATLAB实现ppt课件

文档简介

温馨提示

最新文档

评论

BP神经网络的改进和MATLAB实现ppt课件

文档简介

温馨提示

最新文档

评论

相关文档