专题二:神经网络.ppt_第1页
专题二:神经网络.ppt_第2页
专题二:神经网络.ppt_第3页
专题二:神经网络.ppt_第4页
专题二:神经网络.ppt_第5页
已阅读5页,还剩43页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、人工神经网络建模专题,Artificial Neural Network,1,生物神经元之间的相互连接从而让信息传递的部位披称为突触(Synapse)。突触按其传递信息的不同机制,可分为化学突触和电突触、其中化学突触占大多数,其神经冲动传递借助于化学递质的作用。生物神经元的结构大致描述如下图所示。,2,3,什么是神经网络模型?,定义一:神经网络,有时也称作多层感知器(MLPs),本质上是人脑处理信息方式的简化模型。它通过模拟大量相互连接的简单处理单元工作,这些处理单元好像神经元的抽象化版本。 定义二:神经网络是指用大量的简单计算单元(即神经元)构成的非线性系统,它在一定程度上模仿了人脑神经系统

2、的信息处理、存储及检索功能。 定义三:一个神经网络是一个由简单处理元构成的规模宏大的并行分布式处理器。天然具有存储知识和使之可用的特性。神经网络在两个方面与人脑相似: 1.神经网络获得的知识是从外界环境中学习得到的。 2.互连神经元的连接强度,即突触权值,用于储存获取的知识。,4,5,多层感知器 如果在输入和输出层间加上一层或多层的神经元(隐层神经元),就可构成多层前向网络,这里称为多层感知器。 这里需指出的是:多层感知器只允许调节一层的连接权。这是因为按感知器的概念,无法给出一个有效的多层感知器学习算法。,6,上述三层感知器中,有两层连接权,输入层与隐层单元间的权值是随机设置的固定值,不被调

3、节;输出层与隐层间的连接权是可调节的。,7,1.2激活(传递)函数的取法,在Matlab工具箱里包括了许多激活(传递)函数。在“Transfer Function Graphs”中可以找到它们的完全列表 函数名 功 能 purelin 线性传递函数 hardlim 硬限幅递函数 hardlims 对称硬限幅递函数 satli 饱和线性传递函数 satlins 对称饱和线性传递函数 logsig 对数S 形传递函数 tansig 正切S 形传递函数 radbas 径向基传递函数 compet 竞争层传递函数,8,9,1.3、网络结构以及工作方式,从连接方式看NN主要有两种网络拓扑结构: 前馈型网

4、络:结点分为输入单元和计算单元 反馈型网络:所有结点都是计算单元 NN的工作过程主要分为两个阶段: 第一阶段:学习期,此时个计算单元状态不变,各连线上的权值可通过学习来修改 第二阶段:工作期,此时各连接权值固定,计算各单元状态变化,10,网络结构:前馈型神经网络,两个或更多的上面所示的神经元可以组合成一层,一个典型的网络可包括一层或者多层。我们首先来研究神经元层。 单层神经元网络 有R输入元素和S个神经元组成的单层网络如下图所示,n1=net.IW1,1*p+net.b1,11,多层神经元网络,上面所示的网络有R1个输入,第一层有S1个神经元,第二层 有S2个神经元,12,中间层的输出就是下一

5、层的输入。第二层可看作有S1个输入,S2个神经元和S1xS2 阶权重矩阵W2 的单层网络。第二层的输入是a1,输出是a2,现在我们已经确定了第二层的所有向量和矩阵,我们就能把它看成一个单层网络了。其他层也可以照此步骤处理。多层网络的功能非常强大。例、一个两层的网络,第一层的转移函数是曲线函数,第二层的转移函数是线性函数,通过训练,它能够很好的模拟任何有有限断点的函数。这种两层网络集中应用于“反向传播网络”。注意:我们把第三层的输出a3标记为y。我们将使用这种符号来定义这种网络的输出。,13,神经网络模型节点,神经网络模型的学习过程(A) 模型的特点1、有指导的学习2、前馈网络3、反向传播算法(

6、B)可变参数1、隐含层的数目2、学习效率3、动态常量4、停止准则,14,神经网络模型节点,神经网络的主要特点 并行分布处理并行结构和并行实现,适于实时和动态处理 非线性映射可以处理非线性问题 适应和集成适用于复杂、大规模和多变量系统,可以在线 运行和定性定量分析 自学习训练可以解决数学模型和规则难以解决的问题 Clementine中神经网络的特有功能: 敏感度分析:以辅助解释神经网络结果 修剪和验证:以避免过度训练 动态网络 :自动找出合适的网络结构设计,15,神经网络模型节点,神经网络模型的主要功能 分类(Cl) 预测(Pr) 控制(Ct) 函数拟合(Ft) 神经网络的不足: 模型为黑匣子,

7、得到的结果不易解释 模型可能会出现过拟合的情况 结果可能是局部最小值,而非全局最优值,16,1.4创建网络,newp 创建感知器网络 newlind 设计一线性层 newlin 创建一线性层 newff 创建一前馈 BP 网络 newcf 创建一多层前馈 BP 网络 newfftd 创建一前馈输入延迟 BP 网络 newrb 设计一径向基网络 newrbe 设计一严格的径向基网络 newgrnn 设计一广义回归神经网络 newpnn 设计一概率神经网络 newc 创建一竞争层 newsom 创建一自组织特征映射 newhop 创建一 Hopfield 递归网络 newelm 创建一 Elman

8、 递归网络,17,1.5数据结构:影响网络仿真的输入数据结构的格式,静态网络中的同步输入仿真:,例1,18,动态网络中的异步输入仿真:当网络中存在延迟时,顺序发生的输入向量就要按一定的序列输入网络。为了演示这种情况,我们以一个有延迟的简单网络为例。,19,动态网络中的同步输入仿真,如果我们在上例中把输入作为同步而不是异步应用,我们就会得到完全不同的响应。这就好象每一个输入都同时加到一个单独的并行网络中。在前一个例子中,如果我们用一组同步输入,我们有: p1=1, p2=2,p3=3, p4=4 这可用下列代码创建: P =1 2 3 4; 模拟这个网络,我们得到: A = sim(net,P)

9、 A = 1 2 3 4,20,在某些特定的情况下,我们可能想要在同一时间模拟一些不同序列的网络响应。这种情况我们就要给网络输入一组同步序列。比如说,我们要把下面两个序列输入网络: p(1)=1, p(2)=2,p(3)=3, p(4)=4 p(1)=4, p(2)=3,p(3)=2, p(4)=1 输入 P应该是一个细胞数组,每一个数组元素都包含了两个同时发生 的序列的元素。 P = 1 4 2 3 3 2 4 1; 现在我们就可以模拟这个网络了: A = sim(net,P); 网络输出结果将是: A = 1 4 4 11 7 8 10 5 可以看到,每个矩阵的第一列是由第一组输入序列产生

10、的输出序列,每个矩阵的第二列是由第二组输入序列产生的输出序列。这两组序列之间没有关联,好象他们是同时应用在单个的并行网络上的。,21,前面的讨论中,不论是作为一个同步向量矩阵输入还是作为一个异步向量细胞数组输入,模拟的输出值是一样的。 在训练网络时,这是不对的。当我们使用adapt函数时,如果输入是异步向量细胞数组,那么权重将在每一组输入提交的时候更新(就是增加方式);如果输入是同步向量矩阵,那么权重将只在所有输入提交的时候更新(就是批处理方式)。,22,1.6训练方式,两种不同的训练方式(1)增加方式:每提交一次输入数据,网络权重和偏置都更新一次;(2)在批处理方式中:仅仅当所有的输入数据都

11、被提交以后,网络权重和偏置才被更新. 增加方式(应用于自适应网络和其他网络) 虽然增加方式更普遍的应用于动态网络,比如自适应滤波,但是在静态和动态网络中都可以应用它。,23,静态网络中的增加方式,用增加方式来训练静态同步仿真中的例1,这样每提交一次输入数据,网络权重和偏置都更新一次。 在此我们用函数adapt,并给出输入和目标序列:假定我们要训练网络建立以下线性函数: t=2p1+p2 . 我们的输入是: 目标输出是: t1=4,t2=5 ,t3=7 ,t4=7 首先用0初始化权重和偏置。为了显示增加方式的效果,先把学习速度也设为0。 net = newlin(-1 1;-1 1,1,0,0)

12、; net.IW1,1 = 0 0; net.b1 = 0; 为了用增加方式,我们把输入和目标输出表示为以下序列: P = 1;2 2;1 2;3 3;1; T = 4 5 7 7;,24,用增加方式训练网络: net = newlin(-1 1;-1 1,1,0,0); net.IW1,1 = 0 0; net.b1 = 0; P = 1;2 2;1 2;3 3;1; T = 4 5 7 7; net,a,e,pf = adapt(net,P,T); 由于学习速度为0,网络输出仍然为0,并且权重没有被更新。错误和目标输出相等。 a = 0 0 0 0 e = 4 5 7 7 如果我们设置学习

13、速度为0.1,我们就能够看到当每一组输入提交时,网络是怎么调整的了。 net.inputWeights1,1.learnParam.lr=0.1; net.biases1,1.learnParam.lr=0.1; net,a,e,pf = adapt(net,P,T); a = 0 2 6.0 5.8 e = 4 3 1.0 1.2,25,2、BP神经网络,2.1、概述 BP网络是采用Widrow-Hoff学习算法和非线性可微转移函数的多层网络。一个典型的BP网络采用的是梯度下降算法,也就是Widrow-Hoff算法所规定的。backpropagation就是指的为非线性多层网络计算梯度的方法

14、。现在有许多基本的优化算法,例如变尺度算法和牛顿算法。神经网络工具箱提供了许多这样的算法。 一个经过训练的BP网络能够根据输入给出合适的结果,虽然这个输入并没有被训练过。这个特性使得BP网络很适合采用输入/目标对进行训练,而且并不需要把所有可能的输入/目标对都训练过。为了提高网络的适用性,神经网络工具箱提供了两个特性-规则化和早期停止。,26,2.2、基础 网络结构 1)常用的前馈型BP网络的转移函数有logsig,tansig有时也会用到线性函数purelin。当网络的最后一层采用曲线函数时输出被限制在一个很小的范围内,如果采用线性函数则输出可为任意值。如果需要也可以创建其他可微的转移函数。

15、 2)在BP网络中,转移函数可求导是非常重要的,tansig、logsig和purelin都有对应的导函数dtansig、dlogsig和dpurelin。为了得到更多转移函数的导函数,可以输入tansig(deriv) ans = dtansig,27,网络构建和初始化,训练前馈网络的第一步是建立网络对象。 函数newff建立一个可训练的前馈网络。 net = newff(PR,S1 S2.SNl,TF1 TF2.TFNl,BTF,BLF,PF) 这里需要4个输入参数。 第一个参数是一个RxS1的矩阵以定义R个输入向量的最小值 和最大值。 第二个参数是一个每层神经元个数的数组。 第三个参数是

16、包含每层用到的转移函数名称的细胞数组。 最后一个参数是用到的训练函数的名称。,28,例、创建一个二层网络,它的输入是两个元素的向量,第一层有四个神经元,第二层有三个神经元。第一层的转移函数是tan-sigmoid,输出层的转移函数是linear。 输入向量的第一个元素的范围是-1到2,输入向量的第二个元素的范围是0到5,训练函数是traingd。 net=newff(-1 2; 0 5,4,3,tansig,purelin,traingd); 这个命令建立了网络对象并且初始化了网络权重和偏置,因此网络就可以进行训练了。,29,在训练前馈网络之前,权重和偏置必须被初始化。初始化权重和偏置的工作用

17、命令init来实现。net = init(net); 对前馈网络来说,有两种不同的初始化方式经常被用到:initwb和initnw。1)initwb函数根据每一层自己的初始化参数(net.inputWeightsi,j.initFcn)初始化权重矩阵和偏置。前馈网络的初始化权重通常设为rands,它使权重在-1到1之间随机取值值,这种方式经常用在转换函数是线性函数时。2)initnw通常用于转换函数是曲线函数。它根据Nguyen和WidrowNgWi90为层产生初始权重和偏置值,使得每层神经元的活动区域能大致平坦的分布在输入空间。它比起单纯的给权重和偏置随机赋值有以下优点:(1)减少神经元的浪

18、费(因为所有神经元的活动区域都在输入空间内)。(2)有更快的训练速度(因为输入空间的每个区域都在活动的神经元范围中)。,30,初始化函数被newff所调用。因此当网络创建 时,它根据缺省的参数自动初始化。 init不需要单独的调用。可是我们可能要重新初始化权重和偏置或者进行自定义的初始化。例如,我们用newff创建的网络,它缺省用initnw来初始化第一层。如果我们想要用rands重新初始化第一层的权重和偏置,我们用以下命令: net.layers1.initFcn = initwb; net.inputWeights1,1.initFcn = rands; net.biases1,1.ini

19、tFcn = rands; net.biases2,1.initFcn = rands; net = init(net);,31,网络模拟(SIM),用函数sim 模拟一个网络。 sim 接收网络输入p,网络对象net,返回网络输出a,这里是simuff用来模拟上面建立的带一个输入向量的网络。 p = 1;2; a = sim(net,p) a = -0.1011 (用这段代码得到的输出是不一样的,这是因为网络初始化是随机的。) 例、调用sim来计算一个同步输入3向量网络的输出: p = 1 3 2;2 4 1; a=sim(net,p) a = -0.1011 -0.2308 0.4955,

20、32,增加模式训练法(ADAPT),现在我们就可以开始训练网络了。当然我们要指定输入值和目标值如下所示: p = -1 -1 2 2;0 5 0 5;t = -1 -1 1 1; 如果我们要在每一次提交输入后都更新权重,那么需要将输入矩阵和目标矩阵转变为细胞数组。每一个细胞都是一个输入或者目标向量。 p = num2cell(p,1); t = num2cell(t,1); 现在就可以用adapt来实现增加方式训练了: net,a,e=adapt(net,p,t); 训练结束以后,就可以模拟网络输出来检验训练质量了。 a = sim(net,p) a = -0.9995 -1.0000 1.0

21、001 1.0000,33,带动力的梯度下降(LEARDGDM) 批处理训练方式 批处理梯度下降法(TRAINGD) 带动量的批处理梯度下降法( 批处理训练方式 TRAINGDM),34,例1、蠓虫分类问题,1、蠓虫分类问题 生物学家试图对两种蠓虫(Af与Apf)进行鉴别,依据的 资料是触角和翅膀的长度,已经测得了9支Af和6支Apf的数 据如下: Af: (1.24,1.27),(1.36,1.74), (1.38,1.64),(1.38,1.82),(1.38,1.90),(1.40,1.70),(1.48,1.82),(1.54,1.82),(1.56,2.08); Apf: (1.14

22、,1.82),(1.18,1.96),(1.20,1.86),(1.26,2.00),(1.28,2.00),(1.30,1.96). (i)根据如上资料,如何制定一种方法,正确地区分两类蠓虫。 (ii)对触角和翼长分别为(1.24,1.80),(1.28,1.84)与(1.40,2.04)的3个标本,用所得到的方法加以识别。 (iii)设Af是宝贵的传粉益虫,Apf是某疾病的载体,是否应该修改分类方法。,35,问题分析:要求依据已知资料(9支Af的数据和6支Apf的数据)制定一种分类方法,类别是已经给定的(Af或Apf)。我们将9支Af及6支Apf的数据集合称之为学习样本。2 多层前馈网络为

23、解决此问题,考虑一个其结构如下图所示的人工神经网络,输入层,输出层,中间层 (隐层),36,以s = 1,2,15,分别表示学习样本中的15个样品,对样品s而言,对任何一组确定的输入I_ks(k=1,2)隐单元j 的输入是相应的输出状态是网络的最终输出是,37,对于任何一组确定的输入 ,输出是所有权的函数。 如果我们能够选定一组适当的权值,使得对应于学习样本中任何一组Af样品的输入,输出为(1,0) ,对应于Apf的输入数据,输出为(0,1),那么蠓虫分类问题实际上就解决了。因为,对于任何一个未知类别的样品,只要将其触角及翅膀长度输入网络,视其输出模式靠近(1,0)亦或(0,1),就可能判断其

24、归属。当然,有可能出现介于中间无法判断的情况。 现在的问题是,如何找到一组适当的权值,实现上面所设想的网络功能。,38,39,4、蠓虫分类问题求解,clear p1=1.24,1.27;1.36,1.74;1.38,1.64;1.38,1.82;1.38,1.90; 1.40,1.70;1.48,1.82;1.54,1.82;1.56,2.08; p2=1.14,1.82;1.18,1.96;1.20,1.86;1.26,2.00 1.28,2.00;1.30,1.96; p=p1;p2; pr=minmax(p); goal=ones(1,9),zeros(1,6);zeros(1,9),o

25、nes(1,6); subplot(1,2,1) plot(p1(:,1),p1(:,2),h,p2(:,1),p2(:,2),o) subplot(1,2,2) net=newff(pr,3,2,logsig,logsig); net.trainParam.show = 10; net.trainParam.lr = 0.05; net.trainParam.epochs = 3000; net.trainParam.goal = 1e-10; net = train(net,p,goal); x=1.24 1.80;1.28 1.84;1.40 2.04; y0=sim(net,p) y=

26、sim(net,x),40,例2、人口预测以下是从北京统计年鉴中得到的 1980-2010年的北京城近郊区户籍人口统计结果作为样本数据,建立人工神经网络模型,预测、2011年的北京城近郊区户籍人口,41,北京市人口数统计表:,42,数据处理后的样本数据:,43,%样本训练 net=newff(minmax(p),6,1,tansig,purelin,trainlm);%建立网络 inputWeights=net.IW1,1;%当前输入层权值和阈值 inputbias=net.b1; layerWeights=net.LW2,1;%当前网络层权值和阈值 layerbias=net.b2;,44,%网络参数设置 net.performFcn=mse; net.trainParam.show = 20; net.trainParam.goal = 1e-5; net.trainParam.epochs =1000; net.trainParam.lr=0.15; net.trainParam.mc=0.9;,45,net=train(ne

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论