神经网络及应用第二章人工神经网络基础

上传人：t*** IP属地：河南上传时间：2020-04-16 格式：PPT 页数：47 大小：496KB 积分：15 举报 版权申诉

已阅读5页，还剩42页未读，继续免费阅读

版权说明：本文档由用户提供并上传，收益归属内容提供方，若内容存在侵权，请进行举报或认领

文档简介

第2章人工神经网络基础生物神经网络基础人工神经元模型人工神经网络模型神经网络学习 2 1生物神经网络基础 2 1 1生物神经元的结构 2 1生物神经网络基础神经元在结构上细胞体树突轴突和突触4部分组成1 细胞体 Cellbody 神经元的主体由细胞核细胞质和细胞膜3部分构成细胞膜对细胞液中的不同离子具有不同的通透性使得膜内外存在离子浓度差从而出现内负外正的静息电位 2 1生物神经网络基础 2 树突 Dendrite 从细胞体向外延伸出许多突起的神经纤维其中大部分突起较短其分支多群集在细胞体附近形成灌木丛状这些突起称为树突神经元靠树突接受来自其他神经元的输入信号相当于细胞体的输入端3 轴突 Axon 由细胞体伸出的最长的一条突起细而长用来传出细胞体产生的输出电化学信号相当于细胞体的输出端 2 1生物神经网络基础 4 突触 Synapse 神经元之间通过一个神经元的轴突末梢和其他神经元的细胞体或树突进行通信连接这种连接相当于神经元之间的输入输出接口称为突触每个神经元大约有103 105个突触多个神经元以突触连接即形成神经网络 2 1生物神经网络基础 2 1 2生物神经元的信息处理机理1 信息产生神经元的三种状态无信号输入时电位差 70mV 静息电位细胞膜状态极化状态 Polarization 神经元状态静息状态静息电位向正偏移细胞膜状态去极化 Depolarization 神经元状态兴奋状态 2 1生物神经网络基础静息电位向负偏移细胞膜状态超极化 Hyperpolarization 神经元状态抑制状态神经脉冲的产生过程膜电位超过阈值电位 55mV 神经细胞活性细胞细胞的兴奋过程膜电位自发地急速升高在1ms内比静息膜电位上升100mV左右此后膜电位又急速下降回到静止的值产生一个宽度为1ms 振幅为100mV的电脉冲又称神经冲动之后慢慢下降到 55mV 这段时间约为数毫秒称为不应期 2 1生物神经网络基础 2 信息的传递与接收神经脉冲信号沿轴突传向其末端的各个分支从脉冲信号到达突触前膜到突触后膜电位发生变化有0 2ms 1ms的时间延迟称为突触延迟神经元间的突触联系大部分是在出生后由于给予刺激而成长起来的正是由于各神经元之间的突触连接强度和极性有所不同并可进行调整由此人脑才具有学习和存储信息的功能 2 1生物神经网络基础 3 信息整合单个神经元可以与上千个或更多其他的神经元轴突末梢形成突触连接接受从各个轴突传来的脉冲输入这些输入可到达神经元的不同部位输入部位不同对神经元影响的权重也不同在同一时刻产生的刺激所引发的膜电位变化大致等于各单独刺激引起的膜电位变化的代数和空间整合各输入脉冲抵达神经元的先后时间也不一样由一个脉冲引起的突触厚膜电位很小但在其持续时间内有另一脉冲相继到达时总的突触后膜电位增大时间整合 2 1生物神经网络基础一个神经元接受的信息在时间和空间上常呈现出一种复杂多变的形式需要神经元对它们进行积累和整合加工从而决定其输出的时机和强度正是神经元这种整合作用才使得亿万个神经元在神经系统中有条不紊夜以继日地处理各种复杂的信息执行着生物中枢神经系统的各种信息处理功能 2 2人工神经元模型 2 2 1神经元的建模人工神经网络中神经元常被称为处理单元或节点 1943年心理学家McCulloch和数学家W Pitts的M P模型的6个假定 1 每个神经元都是一个多输入单输出的信息处理单元 2 神经元输入分兴奋性输入和抑制性输入两种类型 3 神经元具有空间整合特性和阈值特性 4 神经元输入与输出间有固定的时滞主要取决于突触延迟 5 忽略时间整合作用和不应期 6 神经元本身是非时变的即其突触时延和突触强度均为常数 2 2人工神经元模型神经元模型示意图 2 2人工神经元模型许多输入信号 xi 同时输入神经元j 对每个输入都有一个加权系数wij 称为权重值其正负模拟了生物神经元中突触的兴奋和抑制其大小则代表了突触的不同连接强度组合输入信号的总和值相应于生物神经元的膜电位神经元激活与否取决于某一阈值电平即只有当其输入综合超过阈值时神经元才被激活并发放脉冲否则神经元不会产生输入信号 oj表示神经元输出而输出与输入之间的关系由函数f表示 2 2人工神经元模型 2 2 2神经元的数学模型令xi t 表示t时刻的神经元j接受的来自神经元的输入信息 oj t 表示t时刻神经元j的输出信息则神经元j的状态可以表示为 2 2人工神经元模型简单起见将突触时延取为单位时间输入总和常称为神经元在t时刻的净输入用下式表示表现了神经元j的空间整合特性而未考虑时间整合当时神经元才能被激活 oj t 1 与xi t 之间的单位时差代表所有的神经元具有相同的恒定的工作节奏 2 2人工神经元模型将时间t省略我们得到 2 2人工神经元模型 2 2 3神经元的变换函数执行对该神经元所获得的网络输入的变换也可以称为激活函数激励函数活化函数常用的变换函数 1 阈值型变换函数单极性阈值型变换函数 2 2人工神经元模型双极性阈值型变换函数2 非线性变换函数实数域R到 0 1 闭集的非减连续函数最常用的非线性变换函数是sigmoid函数简称S型函数其特点是函数本身及其导数都是连续的 x 2 2人工神经元模型单极性S型变换函数双极性S型变换函数 2 2人工神经元模型 3 分段线性变换函数单极性分段性线性变换函数双极性分段性线性变换函数 f x 1 0 1 0 x xc 0 2 2人工神经元模型 4 概率型变换函数输入输出关系是不确定的用一个随机函数来描述其输出为1或者0的概率设神经元输出为1的概率为该变换函数输出状态与热力学中的波尔兹曼 Boltzmann 分布类似因此也称为热力学模型 2 3人工神经网络模型 2 3 1网络拓扑结构类型1 层次型结构a 单纯型层次网络结构b 输出层到输入层有连接的层次网络结构c 层内有互联的层次网络结构 2 3人工神经网络模型 2 互联型结构a 全互联型每个节点均与所有其他节点相连b 局部互联型每个节点只与其临近的节点有连接c 稀疏连接型网络中的节点只与少数相距较远的节点相连 2 3人工神经网络模型 2 3 2网络信息流向类型1 前馈型网络输入层隐层隐层输出层2 反馈型网络 2 4神经网络学习 2 4 1网络学习算法的一些基本概念人工神经网络的功能特性由功能特性由其连接的拓扑结构和连接权值决定神经网络能够通过对样本的学习训练不断改变网络的链接权值以及拓扑结构以使网络的输出不断地接近期望的输出这一过程称为神经网络的学习或训练其本质是可变权值的动态调整改变权值的规则称为学习规则或学习算法亦称训练规则或训练算法 2 4神经网络学习神经网络的学习算法分为1 有导师学习也称为有监督学习采用纠错规则在学习训练过程中需要不断地给网络成对提供一个输入模式和一个期望网络正确输出的模式称为教师信号将神经网络的实际输出同期望输出进行比较根据差错的方向和大小按一定的规则调整权值当网络可以对各种给定输入均能产生所期望的输出时结束训练 2 4神经网络学习 2 无导师学习也称无监督学习不断地给网络提供动态输入信息网络根据其特有内部结构和学习规则调整权值在输入信息中发现可能存在的模式和规律通过这种自组织过程实现自动分类有时神经网络所解决问题的先验信息很少甚至没有这种情况下无导师学习就显得更有实际意义 2 4神经网络学习 1990年日本著名神经网络学家Amari提出了一种神经网络权值调整的通用学习规则权向量Wj在t时刻的调整量 Wj t 与t时刻的输入向量X t 和学习信号r的乘积成正比 2 4神经网络学习用数学式表达为为正数称为学习常数决定了学习速率基于离散时间调整时不同的学习规则对r Wj X dj 有不同的定义从而形成各种各样的神经网络 2 4神经网络学习 2 4 2Hebb学习规则基于等神经元i与神经元j同时处于兴奋状态时两者的连接强度应增加学习信号简单地等于神经元的输出权向量调整公式为分量的调整 2 4神经网络学习 Hebb学习规则需要预先设置权饱和值以防止输入和输出正负始终一致时出现权值无约束增长权值初始化对Wj 0 赋予零附近的小随机数Hebb学习规则是一种纯前馈无导师学习该规则至今仍在各种神经网络模型中起着重要作用 2 4神经网络学习例题2 1设有4输入单输出神经元网络其阈值T 0 学习率 1 3个输入样本向量和初始权向量分别为X1 1 2 1 5 0 T X2 1 0 5 2 1 5 T X3 0 1 1 1 5 T W 0 1 1 0 0 5 T 解设变换函数为双极性离散函数f net sgn net 权值调整步骤为 1 输入第一个样本X1 计算净输入net1 并调整权向量W 1 net1 W 0 TX1 1 1 0 0 5 1 2 1 5 0 T 3W 1 W 0 sgn net1 X1 1 1 0 0 5 T 1 2 1 5 0 T 2 3 1 5 0 5 T 2 4神经网络学习 2 输入第二个样本X2 计算净输入net2 并调整权向量W 2 net2 W 1 TX2 2 3 1 5 0 5 1 0 5 2 1 5 T 0 25W 2 W 1 sgn net2 X2 2 3 1 5 0 5 T 1 0 5 2 1 5 T 1 2 5 3 5 2 T 2 输入第三个样本X3 计算净输入net3 并调整权向量W 3 net3 W 2 TX3 1 2 5 3 5 2 0 1 1 1 5 T 3W 3 W 2 sgn net3 X3 1 2 5 3 5 2 T 0 1 1 1 5 T 1 3 5 4 5 0 5 T可以看出当变换函数为符号函数且 1时 Hebb学习规则的权值调整将简化为权向量加或减输入向量 2 4神经网络学习当变换函数为双极性连续函数权值调整步骤如上 1 2 2 4神经网络学习 3 比较两种权值调整结果可以看出两种变换函数下的权值调整方向是一致的但采用连续变换函数时权值调整力度减弱 2 4神经网络学习 2 5 3离散感知器学习规则1958年美国学者FrankRosenblatt首次定义了一个具有单层计算单元的神经网络结构称为感知器 Perceptron 学习信号等于神经元期望输出教师信号与实际输出之差感知器采用了符号变换函数 2 4神经网络学习权值调整公式为分量的调整只适用于二进制神经元初始权值可取任意值是一种有导师学习该规则对于神经网络的有导师学习具有极有重要的意义 2 4神经网络学习 2 5 4连续感知器学习规则规则 1986年认知心理学家Mclelland和Rumelhart在神经网络训练引入了规则亦称为连续感知器学习规则学习信号权值调整公式为分量的调整 2 4神经网络学习推导定义神经元输出和期望输出之间的平方误差为欲使误差E最小 Wj应与误差的负梯度成正比可得权值调整计算式学习规则可推广到多层前馈网络中权值可初始化为任意值 2 4神经网络学习 2 5 5最小均方学习规则 Widrow Hoff规则 1962年 BernardWidrow和MarcianHoff提出了Widrow Hoff学习规则又称最小均方学习规则 LMS 学习规则为权值调整公式为分量的调整 2 4神经网络学习如果在学习规则中假定神经元变换函数为则有因此LMS学习规则可以看成是学习规则的一个特殊情况该学习规则与神经元采用的变换函数无关学习速度较快且有较高的精度权值可初始化为任意值 2 4神经网络学习 2 5 6相关学习规则学习信号权值调整公式为分量的调整要求权值初始化为零 2 4神经网络学习 2 5 7胜者为王学习规则 Winner Take All 是一种竞争学习规则用于无导师学习将网络的某一层确定为竞争层对于一个特定的输入X 竞争层的所有p个神经元均有输出相应其中响应值最大的神经元j 为在竞争中获胜的神经元即只有获胜神经元才有权调整其权向量Wj 调整量为 2 4神经网络学习由于两个向量的点积越大表明两者越近似所以调整结果是使Wj 进一步接近当前输入X 这样下次出现与X相像的输入模式时上次获胜的神经元更容易获胜从而竞争层各神经元所对应的权向量被逐渐调整为输入样本空间的聚类中心有时以获胜神经元为中心定义一个获胜邻域除获胜神经元调整权之外邻域内的其他神经元也程度不同地调整权值权值一般初始化为任意值并进行归一化处理 2 4神经网络学习常用学习规则一览表 2 4神经网络学习本章小结神经元的数学模型6点假设模型示意图解析表达式变换函数神经网络的连接方式前馈层次型输入输出有反馈的前馈层次型前馈层内互连型反馈全互连型反馈局部互连型等神经网络的学习方式几种

人人文库> 全部分类> 教育资料 > 中学教育

温馨提示

1. 本站所有资源如无特殊说明，都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2. 本站的文档不包含任何第三方提供的附件图纸等，如果需要附件，请联系上传者。文件的所有权益归上传用户所有。
3. 本站RAR压缩包中若带图纸，网页内容里面会有图纸预览，若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 人人文库网仅提供信息存储空间，仅对用户上传内容的表现方式做保护处理，对用户上传分享的文档内容本身不做任何修改或编辑，并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容，请与我们联系，我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

神经网络及应用第二章人工神经网络基础

文档简介

温馨提示

最新文档

评论

神经网络及应用第二章人工神经网络基础

文档简介

温馨提示

最新文档

评论

相关文档