BP神经网络原理及应用

上传人：文*** IP属地：广东上传时间：2020-03-28 格式：DOC 页数：13 大小：984.50KB 积分：12 举报 版权申诉

免费预览已结束，剩余8页可下载查看

 下载本文档

版权说明：本文档由用户提供并上传，收益归属内容提供方，若内容存在侵权，请进行举报或认领

文档简介

1 13 BP 神经网络原理及应用神经网络原理及应用 1 人工神经网络简介人工神经网络简介 1 1 生物神经元模型生物神经元模型神经系统的基本构造是神经元神经细胞它是处理人体内各部分之间相互信息传递的基本单元据神经生物学家研究的结果表明人的大脑一般有个神经元每个神经元都由一个细胞体一个连接其他神经元的轴突 1011 1010 和一些向外伸出的其它较短分支树突组成轴突的功能是将本神经元的输出信号兴奋传递给别的神经元其末端的许多神经末梢使得兴奋可以同时送给多个神经元树突的功能是接受来自其它神经元的兴奋神经元细胞体将接受到的所有信号进行简单地处理后由轴突输出神经元的树突与另外的神经元的神经末梢相连的部分称为突触 1 2 人工神经元模型人工神经元模型神经网络是由许多相互连接的处理单元组成这些处理单元通常线性排列成组称为层每一个处理单元有许多输入量而对每一个输入量都相应有一个相关联的权重处理单元将输入量经过加权求和并通过传递函数的作用得到输出量再传给下一层的神经元目前人们提出的神经元模型已有很多其中提出最早且影 2 13 响最大的是 1943 年心理学家 McCulloch 和数学家 Pitts 在分析总结神经元基本特性的基础上首先提出的 M P 模型它是大多数神经网络模型的基础 1 1 1 n i jijij xwftY 式 1 1 中 j 为神经元单元的偏置阈值为连接权系数对于激发状态 ji w 取正值对于抑制状态取负值 n 为输入信号数目为神经元输出 ji w ji w j Y t 为时间 f 为输出变换函数有时叫做激发或激励函数往往采用 0 和 1 二值函数或形函数 1 3 人工神经网络的基本特性人工神经网络的基本特性人工神经网络由神经元模型构成这种由许多神经元组成的信息处理网络具有并行分布结构每个神经元具有单一输出并且能够与其它神经元连接存在许多多重输出连接方法每种连接方法对应一个连接权系数严格地说人工神经网络是一种具有下列特性的有向图对于每个节点存在一个状态变量 xi 从节点 i 至节点 j 存在一个连接权系数 wji 对于每个节点存在一个阈值 j 对于每个节点定义一个变换函数对于最一般的情况 jijij fx wij 此函数取形式 jjiij i fw x 1 4 人工神经网络的主要学习算法人工神经网络的主要学习算法神经网络主要通过两种学习算法进行训练即指导式有师学习算法和非指导式无师学习算法此外还存在第三种学习算法即强化学习算法可把它看做有师学习的一种特例有师学习有师学习算法能够根据期望的和实际的网络输出对应于给定输入间的差来调整神经元间连接的强度或权因此有师学习需要有个老师或导师来提供期望或目标输出信号有师学习算法的例子包括规则广义规则或反向传播算法以及 LVQ 算法等 3 13 无师学习无师学习算法不需要知道期望输出在训练过程中只要向神经网络提供输入模式神经网络就能够自动地适应连接权以便按相似特征把输入模式分组聚集无师学习算法的例子包括 Kohonen 算法和 Carpenter Grossberg 自适应共振理论 ART 等强化学习如前所述强化学习是有师学习的特例它不需要老师给出目标输出强化学习算法采用一个评论员来评价与给定输入相对应的神 2 BP 神经网络原理神经网络原理 2 1 基本基本 BP 算法公式推导算法公式推导基本 BP 算法包括两个方面信号的前向传播和误差的反向传播即计算实际输出时按从输入到输出的方向进行而权值和阈值的修正从输出到输入的方向进行 1 a1 ki w ij w L a k a q i 1 x j x M x 1 o k o L o 输出变量输入变量输入层隐含层输出层图 2 1 BP 网络结构 Fig 2 1 Structure of BP network 图中 j x 表示输入层第 j 个节点的输入 j 1 M ij w 表示隐含层第 i 个节点到输入层第 j 个节点之间的权值 i 表示隐含层第 i 个节点的阈值 x 表示隐含层的激励函数 ki w 表示输出层第k个节点到隐含层第 i 个节点之间的权值 i 1 q k a 表示输出层第 k 个节点的阈值 k 1 L x 表示输出层的激励函数 4 13 k o 表示输出层第k个节点的输出 1 信号的前向传播过程隐含层第 i 个节点的输入 neti 1 M iijji j netw x 3 1 隐含层第 i 个节点的输出 yi 1 M iiijji j ynetw x 3 2 输出层第 k 个节点的输入 netk 111 qqM kkiikkiijjik iij netw yaww xa 3 3 输出层第 k 个节点的输出 ok 111 qqM kkkiikkiijjik iij onetw yaww xa 3 4 2 误差的反向传播过程误差的反向传播即首先由输出层开始逐层计算各层神经元的输出误差然后根据误差梯度下降法来调节各层的权值和阈值使修改后的网络的最终输出能接近期望值对于每一个样本 p 的二次型误差准则函数为 Ep 2 1 1 2 L pkk k ETo 3 5 系统对 P 个训练样本的总误差准则函数为 2 11 1 2 PL pp kk pk ETo 3 6 根据误差梯度下降法依次修正输出层权值的修正量 wki 输出层阈值的修正量 ak 隐含层权值的修正量 wij 隐含层阈值的修正量 i ki ki w E w k k E a a ij ij E w w i i E 3 7 输出层权值调整公式 ki k k k kki k kki ki w net net o o E w net net E w E w 3 8 输出层阈值调整公式 kkk k kkkkkk netonetEEE a anetaoneta 3 9 5 13 隐含层权值调整公式 iii ij ijiijiiij netynetEEE w wnetwynetw 3 10 隐含层阈值调整公式 iii i iiiiii netynetEEE netynet 3 11 又因为 11 PL pp kk pk k E To o 3 12 i ki k y w net 1 k k net a i j ij net x w 1 i i net 3 13 11 PL pp kkkki pk i E Tonetw y 3 14 i i i net net y 3 15 k k k o net net 3 16 所以最后得到以下公式 11 PL pp kikkki pk wTonety 3 17 11 PL pp kkkk pk aTonet 3 18 11 PL pp ijkkkkiij pk wTonetwnetx 3 19 11 PL pp ikkkkii pk Tonetwnet 3 20 6 13 结束参数初始化最大训练次数学习精度隐节点数初始权值阈值初始学习速率等批量输入学习样本并且对输入和输出量进行归一化处理计算各层的输入和输出值计算输出层误差 E q E q 修正权值和阈值 Yes N Yes 开始图 2 2 BP 算法程序流程图 Fig 2 2 The flowchart of the BP algorithm program 2 2 基本基本 BP 算法的缺陷算法的缺陷 BP 算法因其简单易行计算量小并行性强等优点目前是神经网络训练采用最多也是最成熟的训练算法之一其算法的实质是求解误差函数的最小值问题由于它采用非线性规划中的最速下降方法按误差函数的负梯度方向修改权值因而通常存在以下问题 1 学习效率低收敛速度慢 2 易陷入局部极小状态 7 13 2 3 BP 算法的改进算法的改进 2 3 1 附附加加动动量量法法附加动量法使网络在修正其权值时不仅考虑误差在梯度上的作用而且考虑在误差曲面上变化趋势的影响在没有附加动量的作用下网络可能陷入浅的局部极小值利用附加动量的作用有可能滑过这些极小值该方法是在反向传播法的基础上在每一个权值或阈值的变化上加上一项正比于前次权值或阈值变化量的值并根据反向传播法来产生新的权值或阈值变化带有附加动量因子的权值和阈值调节公式为 1 1 kwmcpmckw ijjiij 1 1 kbmcmckb iii 其中 k 为训练次数 mc 为动量因子一般取 0 95 左右附加动量法的实质是将最后一次权值或阈值变化的影响通过一个动量因子来传递当动量因子取值为零时权值或阈值的变化仅是根据梯度下降法产生当动量因子取值为1 时新的权值或阈值变化则是设置为最后一次权值或阈值的变化而依梯度法产生的变化部分则被忽略掉了以此方式当增加了动量项后促使权值的调节向着误差曲面底部的平均方向变化当网络权值进入误差曲面底部的平坦区时 i将变得很小于是从而防止了的出现有助于使网络 1 kwkw ijij 0 ij w 从误差曲面的局部极小值中跳出根据附加动量法的设计原则当修正的权值在误差中导致太大的增长结果时新的权值应被取消而不被采用并使动量作用停止下来以使网络不进入较大误差曲面当新的误差变化率对其旧值超过一个事先设定的最大误差变化率时也得取消所计算的权值变化其最大误差变化率可以是任何大于或等于 1 的值典型的取值取 1 04 所以在进行附加动量法的训练程序设计时必须加进条件判断以正确使用其权值修正公式训练程序设计中采用动量法的判断条件为 E k 为第 k 步误差平方和 mc mc95 0 0 其它 1 04 1 1 kEkE kEkE 2 3 2 自自适适应应学学习习速速率率对于一个特定的问题要选择适当的学习速率不是一件容易的事情通 8 13 常是凭经验或实验获取但即使这样对训练开始初期功效较好的学习速率不见得对后来的训练合适为了解决这个问题人们自然想到在训练过程中自动调节学习速率通常调节学习速率的准则是检查权值是否真正降低了误差函数如果确实如此则说明所选学习速率小了可以适当增加一个量若不是这样而产生了过调那幺就应该减少学习速率的值下式给出了一个自适应学习速率的调整公式 E k 为第 k 步误差平方 7 0 05 1 1 k k k k 其它 04 1 1 1 kEkE kEkE 和初始学习速率 0 的选取范围可以有很大的随意性 2 3 3 动动量量自自适适应应学学习习速速率率调调整整算算法法当采用前述的动量法时 BP 算法可以找到全局最优解而当采用自适应学习速率时 BP 算法可以缩短训练时间采用这两种方法也可以用来训练神经网络该方法称为动量自适应学习速率调整算法 2 4 网络的设计网络的设计 2 4 1 网网络络的的层层数数理论上已证明具有偏差和至少一个 S 型隐含层加上一个线性输出层的网络能够逼近任何有理数增加层数可以更进一步的降低误差提高精度但同时也使网络复杂化从而增加了网络权值的训练时间而误差精度的提高实际上也可以通过增加神经元数目来获得其训练效果也比增加层数更容易观察和调整所以一般情况下应优先考虑增加隐含层中的神经元数 2 4 2 隐隐含含层层的的神神经经元元数数网络训练精度的提高可以通过采用一个隐含层而增加神经元数了的方法来获得这在结构实现上要比增加隐含层数要简单得多那么究竟选取多少隐含层节点才合适这在理论上并没有一个明确的规定在具体设计时比较实际的做法是通过对不同神经元数进行训练对比然后适当地加上一点余量 2 4 3 初初始始权权值值的的选选取取由于系统是非线性的初始值对于学习是否达到局部最小是否能够收敛及训练时间的长短关系很大如果初始值太大使得加权后的输入和 n 落在了 S 型激活函数的饱和区从而导致其导数f n 非常小而在计 9 13 算权值修正公式中因为当 f n 时则有这使得 nf 0 0 从而使得调节过程几乎停顿下来所以一般总是希望经过初始加0 ij w 权后的每个神经元的输出值都接近于零这样可以保证每个神经元的权值都能够在它们的 S 型激活函数变化最大之处进行调节所以一般取初始权值在 1 1 之间的随机数 2 4 4 学学习习速速率率学习速率决定每一次循环训练中所产生的权值变化量大的学习速率可能导致系统的不稳定但小的学习速率导致较长的训练时间可能收敛很慢不过能保证网络的误差值不跳出误差表面的低谷而最终趋于最小误差值所以在一般情况下倾向于选取较小的学习速率以保证系统的稳定性学习速率的选取范围在 0 01 0 8 之间 3 BP 神经网络的应用神经网络的应用现给出一药品商店一年当中12 个月的药品销售量单位箱如下 2056 2395 2600 2298 1634 1600 1873 1487 1900 1500 2046 1556 训练一个 BP 网络用当前的所有数据预测下一个月的药品销售量有两种方法实现一种是编写matlab 程序一种是使用 nntool 工具箱 3 1 matlab 程序实现程序实现我们用前三个月的销售量预测下一个月的销售量也就是用1 3 月的销售量预测第 4 个月的销售量用 2 4 个月的销售量预测第 5 个月的销售量如此循环下去直到用9 11 月预测 12 月份的销售量这样训练 BP 神经网络后就可以用 10 12 月的数据预测来年一月的销售量实现程序如下 p 2056 2395 2600 2395 2600 2298 2600 2298 1634 2298 1634 1600 1634 1600 1873 1600 1873 1478 1873 1478 1900 1478 1900 1500 1900 1500 2046 t 2298 1634 1600 1873 1487 1900 1500 2046 1556 10 13 pmax max p pmax1 max pmax pmin min p pmin1 min pmin for i 1 9 归一化处理 p1 i p i pmin1 pmax1 pmin1 end t1 t pmin1 pmax1 pmin1 t1 t1 net newff 0 1 0 1 0 1 7 1 tansig logsig traingd for i 1 9 net trainParam epochs 15000 net trainParam goal 0 01 LP lr 0 1 net train net p1 i t1 i end y sim net 1500 2046 1556 y1 y pmax1 pmin1 pmin1 如果神经网络的训练函数使用trainlm 则仿真步骤会很少但需要较大的系统内存经预测来年一月的销售量 y1 为1 4848e 003箱每次运行后的结果可能不同 3 2 nntool 神经网络工具箱的使用神经网络工具箱的使用 1 在 matlab 7 4 命令窗口键入 nntool 命令打开神经网络工具箱如图 2 点击 Import 按钮两次分别把输入向量和目标输出加入到对应的窗口 Inputs 和 Targets 中有两种可供选择的加入对象点击 Import 后可以看见一种是把当前工作区中的某个矩阵加入另一种是通过 mat 文件读入 11 13 3 点击 New Network 按钮填入各参数以最常用的带一个隐层的 3 层神经网络为例说明下面没有列出的参数表示使用默认值就可以了例如 Network Type 为默认的 BP 神经网络 i Input Range 这个通过点击 Get From Input 下拉框选择你加入的输入向量便可自动完成当然也可以自己手动添加 ii Training Function 最好使用 TRAINSCG 即共轭梯度法其好处是当训练不收敛时它会自动停止训练而且耗时较其他算法 TRAINLM TRAINGD 少也就是收敛很快如果收敛的话而且 Train Parameters 输入不多也不用太多的技巧调整一般指定迭代次数结果显示频率和目标误差就可以了详见下文 iii Layer 1 Number of Neurons 隐层的神经元个数这是需要经验慢慢尝试并调整的大致上由输入向量的维数样本的数量和输出层 Layer2 的神经元个数决定一般来说神经元越多输出的数值与目标值越接近但所花费的训练时间也越长反之神经元越少输出值与目标值相差越大但训练时间会相应地减少这是由于神经元越多其算法越复杂造成的所以需要自己慢慢尝试找到一个合适的中间点比如输入是 3 行 5000 列的 0 9 的随机整数矩阵在一开始选择 1000 个神经元虽然精度比较高但是花费的训练时间较长而且这样神经网络的结构与算法都非常复杂不容易在实际应用中实现尝试改为 100 个再调整为 50 个如果发现在 50 个以下时精度较差则可最后定为 50 个神经元等等 iv Layer 1 Transfer Function 一般用 TANSIG 当然也可以 LOGSIG 即表示隐层输出是 1 1 之间的实数与 LOGSIG 相比范围更大 v Layer 2 Number of Neurons 输出层的神经元个数需要与输出的矩阵

人人文库> 全部分类> 专业文献 > 医学资料

温馨提示

1. 本站所有资源如无特殊说明，都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2. 本站的文档不包含任何第三方提供的附件图纸等，如果需要附件，请联系上传者。文件的所有权益归上传用户所有。
3. 本站RAR压缩包中若带图纸，网页内容里面会有图纸预览，若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 人人文库网仅提供信息存储空间，仅对用户上传内容的表现方式做保护处理，对用户上传分享的文档内容本身不做任何修改或编辑，并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容，请与我们联系，我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

BP神经网络原理及应用

文档简介

温馨提示

最新文档

评论

相关文档