




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、第五章 突触动力学:有监视学习神经网络的分类按网络构造分为:反响网络和前馈网络;按学习方式分为:监视学习和非监视学习。本章主要论述前馈网络的监视学习算法,包括感知器算法、最小均方误差算法和反向传播BP 算法。本章论述了监视学习是对未知平均误差层的随机近似,即给定察看得到的随机矢量样本对:1122( ,),(,),(,)mmx yxyxy要估计一个未知函数:f : xy,并且使期望误差函数EJ最小。误差定义为期望特性与实践特性之差。第五章 突触动力学:有监视学习输出隐层输入节点计算单元上图即为前馈神经网络的构造表示图。各神经元接受前一级输入,并输出到下一级,无反响。输入、输出节点称为可见层,其他
2、中间层称为隐层。第五章 突触动力学:有监视学习 当现有的先验知识不完全时,就需求学习。学习的方式取决于这一先验信息不完全的程度。在监视学习过程中,假设知未来学习系统的期望呼应,并且运用期望值与实践值的差值即学习系统的误差去修正系统的行为。而在非监视学习中是不了解学习系统的期望呼应的。 神经网络经过向环境获取知识并改良本身性能。普通是按某种预定的度量调理本身的参数如权值随时间逐渐到达的。第五章 突触动力学:有监视学习 监视学习有时也叫有教师学习,“教师在这里要对一组给定的输入提供应有的输出结果。这组知的输入输出数据就称为训练样本集。学习系统如以下图:环境教师学习系统实际响应误差信号应有响应描述环
3、境状态的信号+-第五章 突触动力学:有监视学习 非监视学习不存在外部教师,学习系统完全按照环境所提供数据的某些统计规律来调理本身参数或构造这是一种自组织过程,以表示外部输入的某种固有特征,如聚类。 学习算法主要有: 1、Hebb学习算法:( )( ),( )kjkjwnFynxn2、竞争学习算法:(),( )0jjikjc xwwn,3、误差纠正学习算法假设神经元 j 获胜假设神经元 j 失败第五章 突触动力学:有监视学习1、有监视函数估计 神经网络引进的函数估计的概念为:知随机样本矢量对11,),(,)mmxyxy(,要从这些样本中估计出产生这些样本矢量对的函数 ,即:f下面从不同角度分析监
4、视学习::fxy其中: nixxR是输入空间piyyR是输出空间f是要估计的泛函所采用的方法为是使一个未知期望的误差函数( )E J也叫目的函数最小化。第五章 突触动力学:有监视学习2、作为有效条件的有监视学习 有效条件强化呼应(Operant conditioning reinforce responses)。条件聚类强化了刺激,例如,一个生物体学会了一刺激呼应对: SR,那么在条件刺激 S中加一个条件B进展学习,即:(& )()BSRBSR或这样不断强化刺激,直到输入 B 时反响为 R。这样就有:BR也就是学会了一条规那么。这样的例子如巴普洛夫条件反射实验。第五章 突触动力学:有监视学习3
5、、用知的类隶属度作为随机方式学习的有监视学习 方式:定义为方式空间 的一个点; nR时变方式:空间nR中的一条轨迹线;映射 :0 ,nxTR定义了从时间区间0, T到方式空间nR中单点的映射。概率密度( )p x为方式 x 在nR中的分布的一种描画方式类:为空间nR的子集如今的义务是用知的样本(1), (2)xx及方式类,估计( )p x第五章 突触动力学:有监视学习定义:0,1nsIR 是集合S的指示函数:1( )0sxSIxxS指示函数指出了方式 x 的类隶属度。假设 S 是将nR映射到0,1而不是0,1,那么 S 就是一个延续的或者说多值的模糊的集合,即方式 x 以不同的程度隶属于不同的
6、类。 假设将方式样本空间nR分为 k 个不相交的子集:12nkijRDDDDDij且如果第五章 突触动力学:有监视学习那么类概率密度为:()()iiiDDPDpxd xEIE为求期望值,且有:1()1kiiPD 有监视和无监视方式学习的区别依赖于已有的信息以及学习系统如何利用它。在两种情况下系统都不知道( )p x假设知道确定的类,并且学习系统利用了这些信息,那么方式学习就是监视学习。假设不知道或没用类隶属度指示函数,那么方式学习就是非监视的。第五章 突触动力学:有监视学习监视随机竞争学习定律:先看噪声随机竞争学习定律:() ( )jjijjmSyS xmn由于上式没有运用类成员信息校正突触矢
7、量,所以是非监视学习。监视随机竞争学习定律为:( )()jjjjjjmrx Syxmn加强函数为:jijDDijrII奖励正确的方式分类1,惩罚错误的方式分类为1。第五章 突触动力学:有监视学习4、作为随机逼近的有监视学习 随机逼近用知的随机梯度J来估计未知的梯度( )E J,运用的方法是离散随机梯度下降迭代算法:1kkkkmmcJ是网络第kmk次迭代的衔接强度向量,kJ是与km有关的梯度。由于样本(,)kkxy是随机的,所以kJ是随机的,kkJm 是 机 的是随机的。 随机逼近阐明,适宜的有监视学习是渐进最优学习。当学习终了时,知道的仅是( , )p x y的一些函数的部分极小点。学习算法有
8、感知器、LMS和BP算法。第五章 突触动力学:有监视学习 学习速率系数的两个限制条件,使其衰减不快不慢:11kkc 、不 快21kkc2 、不慢kc衰减得越慢,学习得越快;kc衰减得越快,遗忘学过的方式信息越少。例如1/kcR就满足上述要求。 因该指出,大部分监视神经网络算法都可化为随机近似。第五章 突触动力学:有监视学习一、感知器学习算法 感知器模型如以下图:11x2xnx1y2y3y 感知器是一种双层神经网络模型,一层为输入层,另一层具有计算单元,可以经过监视学习建立方式判别才干。第五章 突触动力学:有监视学习 双层感知器模型只能用于处理线性可分问题。感知器学习定律指出感知器在有限次迭代中
9、可分别一个线性可分的方式集。 对于两类问题的分类来说,线性可分行性可以了解为:假设存在w和使得( )s gn()Tf xiw x那么称 f 是线性可分函数。如以下图所示的XOR函数就不是线性可分函数:-11-11(-1,+1)(-1,-1)(+1,-1)(+1,+1)第五章 突触动力学:有监视学习 下面推导感知器学习算法,设输入方式和权向量都是 k 维的:1kTiiiYsign X Msignx m经过学习希望到达:xD时10TYX M 即要求xD时10TYX M 即要求取学习的目的函数为:()(,)2TTDM XM X IJ M X取微分:第五章 突触动力学:有监视学习1()2TDJX si
10、gn M XX IM代入 1()2kkkkTkkkDkkkMMcJcMXIXsign M X所以有:100kkkkkkkkkMc XM XMMM X若若上式即为感知器的学习算法。第五章 突触动力学:有监视学习二、LMS算法 LMS算法也是一种梯度下降算法。与感知器的算法不同的是它采用的准那么函数是均方误差函数:2222() 2 TkkkkTTTkkkkkkkkE eE dM XE dE d X MM E X XMe定义输入自相关矩阵TkkE X XR,相互关矢量kkE d XP,代入上式,对 M 求偏导并令其为零,解得最优均方误差突触矢量*1MPR。第五章 突触动力学:有监视学习然而,通常是不
11、知道 R 和 P 的。用丈量值2ke估计2kE e,估计梯度下降算法得:21kkkMkMMce22Mkkkee X 由于最后得LMS算法为:12kkkkkMMc e X收敛域区间为:1100( )nccTrace R或第五章 突触动力学:有监视学习下面举一个例子: 样本:单变量样本4个,用线性阀值单元131,3xx第一类 d=1230.5,2xx 第二类 d= -1思索阀值后变量增广到2维:123410.532,1111yyyy 假设学习系数选c=0.25,那么有学习算法:1( )( )sgn( ) ( ) ( )2TM kd kMk y ky k01x 1x0m1mod选取初值:(0) 2.
12、5,1.75TM 计算步骤为:输入1(1)sgn(2.5 ,1.75)11o 1y第五章 突触动力学:有监视学习12(1)(1)2 ,(1)12doM 2.511.5(2)1.7512.75M 输入2y0.5(2)sgn( 1.5, 2.75)1,(2)(2)211(3)(2)(2)1.75odoMMy 输入3y3(3)sgn( 1,1.75)1,(3)(3)212(4)2.75odoM 第五章 突触动力学:有监视学习如此下去,最后结果为:3,0.75TM 三、反向传播(BP)算法 多层网络可以处理非线性可分问题,但由于隐层的存在使得学习比较困难,限制了多层网络的开展。反向传播 的出现处理了这
13、一困难。工作信号误差信号 BP算法中有两种信号,任务信号向前传播,是输入和权值的函数;误差信号是实践输出和应有输出差值,由输出端开场逐层向后传播。第五章 突触动力学:有监视学习 反向传播算法中常采用梯度法修正权值,为此要求输出函数可微,通常采用Sigmoid函数作为输出函数。iioijmjokjkm正向算法:()jijiijjnetm oof net对输出层:21()2jjjEdy为了简化,定义部分梯度:jjEnet第五章 突触动力学:有监视学习于是有:jjiijjijnetEEomnetm修正量为:(1)( )( )ijjiijijijmcomtmtmt 假设节点 j 是输出单元,那么:()
14、()jjjjjjjyEdyfnetynet 假设节点 j 不是输出单元,那么节点 j 对后层的全部节点都有影响,因此运用链式法那么有:第五章 突触动力学:有监视学习()jkjkjkjjkjkjkonetEEnetnetonetmfnet对于Sigmoid函数有:21( )1( )(1)(1)xxxyf xeefxyye综合起来,反向传播算法步骤如下:1选取权系数初始值。2反复下述过程直至收敛。第五章 突触动力学:有监视学习1、从前向后各层计算各单元输出:1 / (1)jji jiin e tjn e tmooe2、对输出层计算j()(1)jjjjjdo oo3、从后向前计算各隐层j(1)jjj
15、jkkkoom4、计算并保管各权值修正量:( )(1)ijijjimtmtco5、修正权值:(1)( )( )ijijijmtmtmt 第五章 突触动力学:有监视学习 上述算法的学习速率系数选择很重要,c 大那么收敛快,过大那么能够引起不稳定。 c 小可防止振荡,但收敛速度变慢。处理这一矛盾的最简一方式是参与“动量项,即:(1)( )ijjijjm tmtcy 权值修正量可以表示为: 权值修正量学习步长 部分梯度 单元的输入信号 训练网络时有两种方式,一种是每输入一个样本修改一次权值;另一种是批处置方式,即待全部样本全输入后计算总的平均误差。第五章 突触动力学:有监视学习 BP 网络存在的问题
16、:1网络麻木景象 ,即进入S型紧缩函数的饱和区;2能够进入部分最小,初始随机加权的大小,对局部最小影响很大。 为了提高收敛速度采用的方法有:参与动量项、高阶导数的利用、共轭梯度法、递推最小二乘法等。 可以采用遗传算法GA处理部分最小问题。 只含一个隐层的前馈网络是一个通用的函数逼近器,它阐明一个隐层曾经足够了,但能够并不是最好的。逼近一样维数的函数,两个隐层的网络能够比单个隐层所需隐单元数少得多。第五章 突触动力学:有监视学习 步长 c 对收敛性的影响很大,而且对于不同的问题其最正确值相差也很大,常可以在0.1到3之间试探,且对加复杂的问题用较大的值,动量项的值可以在0.9到1之间选择。 输入、输出层的单元数往往由问题本身决议,如作方式判别时输入单元数是特征维数,输出单元数是类数。但隐层的决议是较复杂的问题。 反向传播算法直接用于多于三层的前馈网络时,堕入部分极小点而不收敛的能够性较大。第五章 突触动
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025贵州瓮安县平定营镇人民政府招聘公益性岗位人员考前自测高频考点模拟试题附答案详解
- 2025广西玉林市慈善总会公开招聘2人考前自测高频考点模拟试题带答案详解
- 2025辽宁鞍山市千山区公益性岗位招聘1人考前自测高频考点模拟试题及一套参考答案详解
- 2025甘肃金昌市金川区教育系统引进高层次和急需紧缺人才招聘12人(第二批)模拟试卷附答案详解(模拟题)
- 2025内蒙古选聘自治区特邀行政执法社会监督员考前自测高频考点模拟试题及参考答案详解1套
- 2025年西藏自治区烟草专卖局(公司)应届高校毕业生招聘29人模拟试卷及完整答案详解一套
- 2025安徽理工大学第一附属医院第二批紧缺岗位招聘14人模拟试卷及答案详解一套
- 2025年威海市环翠区卫生健康局所属事业单位公开招聘工作人员42人考前自测高频考点模拟试题及答案详解(网校专用)
- 2025安徽芜湖前湾集团有限公司选聘2名考前自测高频考点模拟试题及完整答案详解一套
- 2025江苏苏州工业园区青剑湖小学后勤辅助人员招聘1人模拟试卷附答案详解(模拟题)
- 《道路勘测设计》课件-第三章 平面设计
- 档案库房管理暂行办法
- 客运公司团建活动方案
- 学堂在线 英文科技论文写作与学术报告 期末考试答案
- 护理安全警示教育案例
- 青少年心理健康知识教育主题班会50
- 车辆损坏和解协议书
- 《围城》介绍课件
- 2025承包商入厂安全培训考试试题及完整答案(全优)
- 零基预算改革解读
- 2024年国家体育总局事业单位招聘笔试真题
评论
0/150
提交评论