[医学]神经网络与MATLAB仿真-(1).ppt

上传人：油*** IP属地：浙江上传时间：2020-04-18 格式：PPT 页数：145 大小：2.75MB 积分：35 举报 版权申诉

已阅读5页，还剩140页未读，继续免费阅读

版权说明：本文档由用户提供并上传，收益归属内容提供方，若内容存在侵权，请进行举报或认领

文档简介

神经网络与MATLAB仿真 1 Outline 1 人工神经网络简介2 神经网络的特点及应用3 神经网络模型4 神经网络的学习方式 1 人工神经网络简介人工神经网络 ArtificialNeuralNetwork ANN 通常简称为神经网络是一种在生物神经网络的启示下建立的数据处理模型主要通过调整神经元之间的权值来对输入的数据进行建模最终具备解决实际问题 1 人工神经网络简介单层感知器结构人工神经网络的可塑性表现于其连接权值都是可调整的它将一系列仅具有简单处理能力的节点通过权值相连当权值调整至恰当时就能输出正确的结果网络将知识存储在调整后的各权值中这一点是神经网络的精髓 2 神经网络的特点及应用 1 自学习和自适应性给神经网络输入新的训练样本网络能够自动调整结构参数改变映射关系2 非线性性人工神经元处于激活或抑制状态表现为数学上的非线性关系 3 鲁棒性与容错性局部的损害会使人工神经网络的运行适度减弱但不会产生灾难性的错误 4 计算的并行性与存储的分布性每个神经元都可以根据接收到的信息进行独立运算和处理人工神经网络具有强大的模式识别和数据拟合能力 2 神经网络的特点及应用 1 模式分类需要提供已知样本2 聚类不需要提供已知样本 3 回归与拟合相似的样本输入在神经网络的映射下往往能得到相近的输出 4 优化计算寻找一组参数组合使由该组合确定的目标函数达到最小值 5 数据压缩将数据保存于连接权值中 3 神经网络模型单层网络单层感知器线性网络多层网络其他网络前向网络 BP 径向基网络自组织网络等反馈网络 Hopfield网络 Elman网络等本书共介绍了单层感知器线性网络 BP网络径向基网络自组织竞争网络反馈网络随机神经网络等神经网络模型 4 神经网络的学习方式 1 有监督学习有教师学习训练样本对应一个教师信号 2 无监督学习无教师学习网络只接受一系列的输入样本而对该样本应有的输出值一无所知 1 Hebb学习规则权值的调整量与输入前一神经元输出值和后一神经元输出值的乘积成正比 2 纠错学习规则权值的调整量与误差大小成正比 3 随机学习规则 Boltzmann机事实上就是模拟退火算法 4 竞争学习规则只有一个获胜神经元可以进行权值调整其他神经元的权值维持不变体现了神经元之间的侧向抑制单神经元网络神经元模型图中为神经元的内部状态为阈值为输入信号为表示从单元到单元的连接权系数单神经元模型可描述为通常情况下取即图7 1单神经元模型常用的神经元非线性特性有以下四种 1 阈值型图7 2阈值型函数 2 分段线性型图7 3分段线性函数 3 Sigmoid函数型图7 4Sigmoid函数单层感知器 Outline 1 单层感知器的结构2 单层感知器的学习算法3 感知器的局限性4 单层感知器应用实例 1 单层感知器的结构单层感知器属于单层前向网络即除了输入层和输出层之外只拥有一层神经元节点感知器 perception 的原理相对简单是学习其他复杂神经网络的基础由单个神经元组成的单层感知器只能用来解决线性可分的二分类问题典型使用场景将其用于两类模式分类时就相当于在高维样本空间中用一个超平面将样本分开 Rosenblatt证明如果两类模式线性可分则算法一定收敛 1 单层感知器的结构输入是一个N维向量其中的每一个分量都对应于一个权值隐含层的输出叠加为一个标量值随后在二值阈值元件中对得到的v值进行判断产生二值输出 1 单层感知器的结构二维空间中的超平面是一条直线在直线下方的点输出 1 在直线上方的点输出1 分类面 2 单层感知器的学习算法在实际应用中通常采用纠错学习规则的学习算法将偏置作为一个固定输入输入权值 2 单层感知器的学习算法 1 定义变量和参数 X为输入 y为实际输出 d为期望输出 b为偏置 w为权值 2 初始化 n 0 将权值向量设置为随机值或全零值 3 激活输入训练样本对每个训练样本指定其期望输出 d 4 计算实际输出 2 单层感知器的学习算法 5 更新权值向量 6 判断若满足收敛条件算法结束若不满足 n自增1 转到第3步继续执行误差小于某个预先设定的较小的值两次迭代之间的权值变化已经很小设定最大迭代次数M 当迭代了M次之后算法就停止迭代条件的混合使用防止出现算法不收敛现象 2 单层感知器的学习算法确定学习率不应当过大以便为输入向量提供一个比较稳定的权值估计不应当过小以便使权值能够根据输入的向量x实时变化体现误差对权值的修正作用粗准焦螺旋和细准焦螺旋的类比自适应学习率 3 感知器的局限性单层感知器无法解决线性不可分问题只能做近似分类感知器的激活函数使用阈值函数输出值只有两种取值限制了在分类种类上的扩展如果输入样本存在奇异样本网络需要花费很长的时间感知器的学习算法只对单层有效 4 单层感知器应用实例 1 手算2 使用工具箱函数坐标点的二类模式分类问题二维平面坐标系中存在一系列坐标点已知部分坐标点属于第一类部分坐标点属于第二类求新坐标点的类别 4 单层感知器应用实例 4 单层感知器应用实例定义 n 0 2 P 91 12 40 5 15 84511 9 d 0 1 0 0 0 1 P ones 1 6 P 4 单层感知器应用实例 2 初始化将权值和偏置初始化为零 w 0 0 0 3 第一次迭代 v w P 输出层的输入 y hardlim v 计算网络的输出根据调整权值 e d y 误差 ee mae e 计算误差的平均绝对差 w w n T y P 调整w 4 单层感知器应用实例 4 第二次迭代重复以上的步骤 v w P y hardlim v e d y ee mae e 误差不为零 w w n T y P 均匀分布元素的方差 4 单层感知器应用实例 5 第三次迭代重复以上步骤 v w P y hardlim v e d y ee mae e w w n T y P 5 单层感知器应用实例 6 第四次迭代 v w P y hardlim v e d y ee mae e w w n T y P perception hand m误差为零权值w不再更新得到的分类超平面为 4 单层感知器应用实例 2 使用工具箱函数用到的函数 newptrainsimperception fcn m 程序 perception hand m 清理 1 定义变量定义输入期望输出clear clccloseall n 0 2 学习率w 0 0 0 P 9 1 12 4 0 5 15 8 4 5 11 9 d 0 1 0 0 0 1 期望输出P ones 1 6 P P P 111111 91 12 40515 845119 2 显示要分类的点figure subplot 2 1 1 显示待分类的点和分类结果plot 9 12 40 15 4511 o holdon plot 1 5 8 9 axis 13 6 10 16 legend 第一类第二类 title 6个坐标点的二分类 3 初始化w 0 0 0 4 第一次迭代计算V和y值v w P vy hardlim v 实际输出y y是实际输出与期望输出d不一致需要根据误差d y调整权值和偏置e d y eee mae e eew w n d y P w v 000000y 111111e 10 1 1 10 ee 0 6667w 0 80005 0000 7 0000 5 第二次迭代根据第一次迭代更新的w向量的值计算V和y值v w P vy hardlim v 实际输出ye d y eee mae e ee 可以发现实际输出与期望输出仍然不一致还需要再次调整w向量w w n d y P w v 150 800060 2000 88 8000 55 8000 77 8000 38 8000y 010000e 000001 ee 0 1667w 0 60006 0000 5 2000 6 第三次迭代根据第一次迭代更新的w向量的值计算V和y值v w P vy hardlim v 实际输出ye d y eee mae e ee 可以发现 mae值与前一次迭代相比没有变化但是v值已经有了更新继续调整权值和偏置w w n d y P w v 132 600047 0000 93 4000 50 6000 57 8000 17 4000y 010000e 000001 ee 0 1667w 0 40007 0000 3 4000 7 第四次迭代v w P vy hardlim v 实际输出ye d y eee mae e ee 可以发现程序在第四次迭代时就已经取得正确的结果 mae值为0 此时算法就收敛了由于mae值为0 因此即使继续更新w向量其值也保持不变 w w n d y P w v 114 400033 8000 98 0000 45 4000 37 80004 0000y 010001e 000000 ee 0 w w n d y P ww 0 40007 0000 3 4000 程序在第4次迭代时就已经取得了正确的结果 mae值为零此时算法就收敛了由于mae值为零因此继续更新w向量其值也保持不变显示figure subplot 2 1 1 显示待分类的点和分类结果plot 9 12 40 15 4511 o holdon plot 1 5 8 9 axis 13 6 10 16 legend 第一类第二类 title 6个坐标点的二分类 x 13 2 6 y x w 2 w 3 w 1 w 3 plot x y holdoff 总程序 perception hand m 清理clear clccloseall n 0 2 学习率w 0 0 0 P 9 1 12 4 0 5 15 8 4 5 11 9 d 0 1 0 0 0 1 期望输出P ones 1 6 P MAX 20 最大迭代次数为20次训练i 0 while1v w P y hardlim v 实际输出更新e d y ee i 1 mae e if ee i 1 0 001 判断disp wehavegotit disp w break end 更新权值和偏置w w n d y P if i MAX 达到最大迭代次数退出disp MAXtimesloop disp w disp ee i 1 break endi i 1 end 显示figure subplot 2 1 1 显示待分类的点和分类结果plot 9 12 40 15 4511 o holdon plot 1 5 8 9 axis 13 6 10 16 legend 第一类第二类 title 6个坐标点的二分类 x 13 2 6 y x w 2 w 3 w 1 w 3 plot x y holdoff subplot 2 1 2 显示mae值的变化x 0 i plot x ee o s sprintf mae的值迭代次数 d i 1 title s 线性神经网络 Outline 1 线性神经网络的结构2 LMS学习算法3 LMS算法中学习率的选择4 线性神经网络与感知器的对比5 线性神经网络实现直线拟合6 线性神经网络应用实例与 1 线性神经网络的结构线性神经网络最典型的例子是自适应线性元件 AdaptiveLinearElement Adaline 线性神经网络与感知器的主要区别在于感知器的传输函数只能输出两种可能的值而线性神经网络的输出可以取任意值其传输函数是线性函数线性神经网络在收敛的精度和速度上较感知器都有了较大提高但由于其线性运算规则它也只能解决线性可分的问题 1 线性神经网络的结构线性神经网络在结构上与感知器网络非常相似只是神经元传输函数不同 1 线性神经网络的结构若网络中包含多个神经元节点就能形成多个输出这种线性神经网络叫Madaline网络 Madaline可以用一种间接的方式解决线性不可分的问题方法是用多个线性函数对区域进行划分然后对各个神经元的输出做逻辑运算 1 线性神经网络的结构线性神经网络解决线性不可分问题的另一个方法是对神经元添加非线性输入从而引入非线性成分这样做会使等效的输入维度变大 2 LMS学习算法 LMS算法与感知器网络的学习算法在权值调整上都基于纠错学习规则但LMS更易实现因此得到了广泛应用成为自适应滤波的标准算法也称为规则采用均方误差作为评价指标是输入训练样本的个数线性神经网络学习的目标是找到适当的使得误差的均方差最小只要用对求偏导再令该偏导等于零即可求出的极值显然必为正值因此二次函数是凹向上的求得的极值必为极小值 2 LMS学习算法误差表示为求导误差等于期望输出实际输出求导代入有权值的修正值正比于当前位置上的梯度 2 LMS学习算法 1 定义变量和参数 2 初始化给向量赋一个较小的随机初值 3 输入样本计算实际输出和误差 4 调整权值向量 5 判断算法是否收敛若满足收敛条件则算法结束否则跳转到第3步重新计算 3 LMS算法中学习率的选择学习率越小算法的运行时间就越长算法也就记忆了更多过去的数据因此学习率的倒数反映了LMS算法的记忆容量大小 1996年Hayjin证明只要学习率满足下式 LMS算法就是按方差收敛的输入向量自相关矩阵的最大特征值一般不可知用矩阵的迹代替迹就是主对角线元素之和 3 LMS算法中学习率的选择自相关矩阵的主对角线元素就是各输入向量的均方值故在感知器学习算法中曾提到学习率随着学习的进行逐渐下降比始终不变更加合理反比例函数指数式下降搜索收敛方案 4 线性神经网络与感知器的对比网络传输函数感知器传输函数是一个二值阈值元件而线性神经网络的传输函数是线性的这就决定了感知器只能做简单的分类而线性神经网络还可以实现拟合或逼近学习算法 LMS算法得到的分类边界往往处于两类模式的正中间而感知器学习算法在刚刚能正确分类的位置就停下来了从而使分类边界离一些模式距离过近使系统对误差更敏感 5 线性神经网络实现直线拟合对于一些离散的数据点从中找到这些点的规律就做一条直线穿过尽可能多的点使得这些数据和直线上所的估计的点的方差最小找到的这条直线就是拟合直线该直线代表了数据之间的线性规律清理clear clccloseall 定义数据P 5 5 输入 11个标量Pd 3 P 7 drandn state 2 d d randn 1 length d 1 5 期望输出加了噪声的线性函数d P ones 1 length P P P加上偏置Plp lr 0 01 学习率MAX 150 最大迭代次数ep1 0 1 均方差终止阈值ep2 0 0001 权值变化终止阈值初始化w 0 0 循环更新fori 1 MAXfprintf 第 d次迭代 n i e d purelin w P 求得误差向量ms i mse e 均方差ms i if ms i ep1 如果均方差小于某个值则算法收敛fprintf 均方差小于指定数而终止 n break end dW lp lr e P 权值调整量if norm dW ep2 如果权值变化小于指定值则算法收敛fprintf 权值变化小于指定数而终止 n break endw w dW 用dW更新权值end 显示fprintf 算法收敛于 nw f f MSE f n w 1 w 2 ms i figure subplot 2 1 1 绘制散点和直线plot P 2 d o title 散点与直线拟合结果 xlabel x ylabel y axis 6 6 min d 1 max d 1 x1 5 2 5 y1 w 1 w 2 x1 holdon plot x1 y1 subplot 2 1 2 绘制均方差下降曲线semilogy 1 i ms o xlabel 迭代次数 ylabel MSE title 均方差下降曲线 6 线性神经网络应用实例与网络的训练中共需确定3个自由变量而输入的训练向量则有4个因此可以形成一个线性方程组由于方程的个数超过了自变量的个数因此方程没有精确解只有近似解用伪逆的方法可以求得权值向量的值 P 0 0 1 1 0 1 0 1 P ones 1 4 P d 0 0 0 1 pinv P d 6 线性神经网络应用实例与手算定义 P 0 0 1 1 0 1 0 1 P ones 1 4 P 包含偏置的输入向量 d 0 0 0 1 期望输出向量初始化 w 0 0 0 权值向量初始化为零向量 lr maxlinlr P 根据输入矩阵求解最大学习率 MAX 200 最大迭代次数根据经验确定 fori 1 MAX fprintf 第 d次迭代 n i v w P 求出输出y v disp 线性网络的二值输出 yy y 0 5 将模拟输出转化为二值输出以0 5为阈值e d y 误差m i mse e 均方误差fprintf 均方误差 f n m i dw lr e P 权值向量的调整量fprintf 权值向量 n w w dw 调整权值向量end 6 线性神经网络应用实例与 plot 0 0 1 0 1 0 o holdon plot 1 1 d x 2 2 2 y 1 5 x plot x y axis 0 5 2 0 5 2 xlabel x ylabel ylabel title 线性神经网络用于求解与逻辑 legend 0 1 分类面 6 线性神经网络应用实例与得到的分类超平面为使用工具箱函数 and linearlayer m 线性网络与感知器的对比线性网络得到的分类面大致位于两类坐标点的中间位置而感知器得到的分类面恰好穿过其中一个坐标点线性神经网络鲁棒性强优于感知器 6 线性神经网络应用实例与添加非线性输入 6 线性神经网络应用实例异或运行xor linearlayer m 6 线性神经网络应用实例异或使用Madaline 两个神经元运行xor madaline m 第6章BP神经网络 Outline 1 BP神经网络的结构2 BP网络的学习算法3 设计BP网络的方法4 BP神经网络的局限性5 BP神经网络应用实例 1 BP神经网络的结构 BP神经网络是包含多个隐含层的网络具备处理线性不可分问题的能力误差反向传播算法 ErrorBackPropagtion BP 解决了多层神经网络的学习问题是一种多层前向网络又叫多层感知器 BP网络是前向神经网络的核心部分也是整个人工神经网络体系中的精华广泛应用于分类识别逼近回归压缩等领域在实际应用中大约80 的神经网络模型采取了BP网络或BP网络的变化形式 1 BP神经网络的结构网络由多层构成层与层之间全连接同一层之间的神经元无连接包含一个多多个隐层可以实现复杂的映射关系 1 BP神经网络的结构 BP网络的传递函数必须可微 BP网络一般使用Sigmoid函数或线性函数作为传递函数 Sigmoid函数是光滑可微的函数在分类时它比线性函数更精确容错性较好将输入从负无穷到正无穷的范围映射到0 1或 1 1区间内具有非线性的放大功能 Log SigmoidTan Sigmoid 1 BP神经网络的结构误差反向传播误差信号反向传播修正权值时网络根据误差从后向前逐层进行修正反馈神经网络输出层的输出值又连接到输入神经元作为下一次计算的输入如此循环迭代直到网络的输出值进入稳定状态为止在本书后面的章节中会专门介绍反馈神经网络包括Hopfield网络 Elman网络等 BP神经网络属于多层前向网络工作信号始终正向流动没有反馈结构 BP网络采用误差反向传播算法 Back PropagationAlgorithm 进行学习在BP网络中数据从输入层经隐含层逐层向后传播训练网络权值时则沿着减少误差的方向从输出层经过中间各层逐层向前修正网络的连接权值 2 BP网络的学习算法 BP学习算法的原理与LMS算法比较类似属于最速下降法最速下降法最速下降法可以求某指标目标函数的极小值若将目标函数取为均方误差就得到了LMS算法对于实值函数如果在某点处有定义且可微则函数在该点处沿着梯度相反的方向下降最快因此使用梯度下降法时应首先计算函数在某点处的梯度再沿着梯度的反方向以一定的步长调整自变量的值当步长足够小时反复迭代求得函数最小值 2 BP网络的学习算法最速下降法实例求函数的最小值根据梯度值可以再函数中画出一系列的等值线或等值面在等值线或等值面上函数值相等梯度下降法相当于沿着垂直于等值线方向向最小值所在位置移动 2 BP网络的学习算法 1 目标函数必须可微 2 如果最小值附近比较平坦算法会在最小值附近停留很久收敛缓慢之字形下降 3 对于包含多个极小值的函数所获得的结果依赖初始值算法有可能陷入局部极小值点而没有达到全局最小值点 BP神经网络来说由于传递函数都是可微的因此能满足最速下降法的使用条件 2 BP网络的学习算法最速下降BP法隐含层传递函数为Sigmoid函数输出层传递函数为线性函数 1 工作信号正向传播2 误差信号反向传播权值调整量学习率局部梯度上一层输出信号 2 BP网络的学习算法当输出层传递函数为线性函数时输出层与隐含层之间权值调整的规则类似于线性神经网络的权值调整规则 BP网络的复杂之处在于隐含层与隐含层之间隐含层与输入层之间调整权值时局部梯度的计算需要用到上一步计算的结果前一层的局部梯度是后一层局部梯度的加权和因此 BP网络学习权值时只能从后向前依次计算串行方式在线方式网络每获得一个新样本就计算一次误差并更新权值直到样本输入完毕随机输入样本不容易陷入局部最优陷阱批量方式离线方式网络获得所有的训练样本计算所有样本均方误差的和作为总误差容易并行化速度快 2 BP网络的学习算法动量BP法在标准BP算法的权值更新阶段引入动量因子使权值修正值具有一定惯性本次权值的更新方向和幅度不但与本次计算所得的梯度有关还与上一次更新的方向和幅度有关 1 如果前后两次计算所得的梯度方向相同得到的权值较大可以加速收敛过程 2 如果前后两次计算所得梯度方向相反则说明两个位置之间可能存在一个极小值可以得到一个较小的步长更容易找到最小值点而不会陷入来回振荡 2 BP网络的学习算法学习率可变的BP算法当误差以减小的方式趋于目标时说明修正方向是正确的可以增加学习率当误差增加超过一定范围时说明前一步修正进行地不正确应减小步长并撤销前一步修正过程拟牛顿法牛顿法具有收敛快的优点但需要计算误差性能函数的二阶导数计算较为复杂拟牛顿法只需要知道目标函数的梯度通过测量梯度的变化进行迭代收敛速度大大优于最速下降法拟牛顿法有DFP方法 BFGS方法 SR1方法和Broyden族方法 3 设计BP网络的方法 1 网络层数对于大部分应用场合单个隐含层即可满足需要2 输入层节点数输入层节点数取决于输入向量的维数如果输入的是的图像则输入向量应为图像中所有的像素形成的4096维向量如果待解决的问题是二元函数拟合则输入向量应为二维向量 3 隐含层节点数较多的隐含层节点数可以带来更好的性能但可能导致训练时间过长经验公式 BP网络的设计主要包括网络层数输入层节点数隐含层节点数输出层节点数及传输函数训练方法训练参数的设置等几个方面样本数输入层结点数 3 设计BP网络的方法输出层神经元的个数同样需要根据从实际问题中得到的抽象模型来确定在模式分类问题中如果共有n种类别则输出可以采用n个神经元也可以将节点个数设计为个表示最小的不小于的整数由于输出共有4种情况因此采用二维输出即可覆盖整个输出空间 00 01 10和11分别表示一种类别输出层神经元个数传递函数的选择一般隐含层使用Sigmoid函数而输出层使用线性函数如果输出层也采用Sigmoid函数输出值将会被限制在0 1或 1 1之间 3 设计BP网络的方法训练方法的选择使用LM算法收敛速度最快均方误差也较小 LM算法对于模式识别相关问题的处理能力较弱且需要较大的存储空间模式识别问题使用RPROP算法能收到较好的效果SCG算法对于模式识别和函数逼近问题都有较好的性能表现初始权值的确定通常将初始权值定义为较小的非零随机值经验值为权值输入端连接的神经元个数 3 设计BP网络的方法确定以上参数后将训练数据进行归一化处理并输入网络中进行学习若网络成功收敛即可得到所需的神经网络 4 BP神经网络的局限性 BP网络具有实现任何复杂非线性映射的能力特别适合求解内部机制复杂的问题但BP网络也具有一些难以克服的局限性 1 需要的参数较多且参数的选择没有有效的方法隐含层结点个数 2 容易陷入局部最优 3 样本依赖性如果样本集合代表性差矛盾样本多存在冗余样本网络就很难达到预期的性能 4 初始权重敏感性训练的第一步是给定一个较小的随机初始权重由于权重是随机给定的 BP网络往往具有不可重现性 5 BP神经网络应用实例实现二值逻辑异或学习率为0 6 动量因子为0 8 默认最大迭代次数为1000次采用手算实现基于BP网络的异或逻辑训练时采用批量训练的方法训练算法使用带动量因子的最速下降法 main xor m 6 BP神经网络应用实例分类面 x y 清理clearallclcrandn state 2 参数eb 0 01 误差容限eta 0 6 学习率mc 0 8 动量因子maxiter 1000 最大迭代次数初始化网络nSampNum 4 nSampDim 2 nHidden 3 nOut 1 w 2 rand nHidden nSampDim 1 2 b 2 rand nHidden 1 1 2 wex w b W 2 rand nOut nHidden 1 2 B 2 rand nOut 1 1 2 WEX W B 数据SampIn 0 0 1 1 0 1 0 1 1 1 1 1 expected 0 1 1 0 训练iteration 0 errRec outRec fori 1 maxiter 工作信号正向传播hp wex SampIn tau logsig hp tauex tau 1 ones nSampNum 1 HM WEX tauex out logsig HM outRec outRec out err expected out sse sumsqr err errRec errRec sse fprintf 第 d次迭代误差 f n i sse 判断是否收敛iteration iteration 1 ifsse ebbreak end 误差信号反向传播 DELTA和delta为局部梯度DELTA err dlogsig HM out delta W DELTA dlogsig hp tau dWEX DELTA tauex dwex delta SampIn 更新权值ifi 1WEX WEX eta dWEX wex wex eta dwex elseWEX WEX 1 mc eta dWEX mc dWEXOld wex wex 1 mc eta dwex mc dwexOld enddWEXOld dWEX dwexOld dwex W WEX 1 nHidden end 显示figure 1 grid nRow nCol size errRec semilogy 1 nCol errRec LineWidth 1 5 title 误差曲线 xlabel 迭代次数 x 0 2 05 1 2 xx yy meshgrid x fori 1 length xx forj 1 length yy xi xx i j yy i j 1 hp wex xi tau logsig hp tauex tau 1 HM WEX tauex out logsig HM z i j out endend figure 2 mesh x x z figure 3 plot 0 1 0 1 LineWidth 2 holdonplot 0 1 1 0 o LineWidth 2 C h contour x x z 0 5 b clabel C h legend 0 1 分类面 title 分类面径向基函数网络 Outline 1 径向基神经网络的两种结构2 径向基神经网络的学习算法3 径向基神经网络与多层感知器的比较4 概率神经网络5 广义回归神经网络6 径向基网络应用实例 1 径向基神经网络的两种结构 Broomhead和Lowe根据生物神经元具有局部响应的原理将径向基函数引入到神经网络中很快 RBF网络被证明对非线性网络具有一致逼近的性能在不同行业和领域逐步得到了广泛应用由三层构成的前向网络第一层为输入层节点个数等于输入的维数第二层为隐含层节点个数视问题的复杂度而定第三层为输出层节点个数等于输出数据的维数隐含层是非线性的采用径向基函数作为基函数从而将输入向量空间转换到隐含层空间使原来线性不可分的问题变得线性可分输出层则是线性的径向基网络概率神经网络广义回归网络模式分类和函数逼近 1 径向基神经网络的两种结构径向基函数有多种形式其中最为常用的是高斯函数输入层隐含层输出层线性 1 正则化网络是一个通用逼近器这意味着只要有足够多的隐含节点它就可以以任意精度逼近任意多远连续函数 2 给定一个未知的非线性函数f 总可以选择一组系数使得网络对f的逼近是最优的 1 径向基神经网络的两种结构正则化网络的一个特点就是隐含节点的个数等于输入训练样本的个数因此如果训练样本的个数N过大网络的计算量将是惊人的从而导致过低的效率甚至根本不可实现解决的方案是用Galerkin方法来减少隐含层神经单元的个数此时求得的解是较低维数空间上的次优解这就是广义网络在实际应用中一般都采用广义径向基函数网络 2 径向基神经网络的学习算法确定隐含层结点中心隐含层中基函数的标准差网络权值隐含层到输出层所选取的中心之间的最大距离 n为隐含节点的个数随机选取固定中心自组织选取中心有监督选取中心正交最小二乘法网络权值可以采用伪逆法G为隐含层输出 d为输出层的期望输出 3 径向基神经网络与多层感知器的比较径向基神经网络是三层网络输入层隐含层输出层只有一个隐含层而多层感知器则可以有多个隐含层径向基神经网络的隐含层和输出层完全不同隐含层采用非线性函数径向基函数作为基函数而输出层采用线性函数两者作用不同径向基神经网络的基函数计算的是输入向量与基函数中心之间的欧式距离两者取差值再取欧几里德范数而多层感知器的隐单元的激励函数则计算输入向量与权值的内积多层感知器对非线性映射全局逼近径向基函数局部逼近 4 概率神经网络概率神经网络 ProbabilisticNeuralNetworks PNN 在模式分类问题中获得了广泛应用概率神经网络可以视为一种径向基神经网络在RBF网络的基础上融合了密度函数估计和贝叶斯决策理论在某些易满足的条件下以PNN实现的判别边界渐进地逼近贝叶斯最佳判定面贝叶斯通过先验概率求后验概率 4 概率神经网络第一层为输入层用于接收来自训练样本的值将数据传递给隐含层径向基层每一个隐含层的神经元节点拥有一个中心该层接收输入层的样本输入计算输入向量与中心的距离最后返回一个标量值求和层把隐含层中属于同一类的隐含神经元的输出做加权平均输出层取求和层中最大的一个作为输出的类别概率神经网络由输入层隐含层求和层和输出层组成 4 概率神经网络 PNN网络的优点训练容易收敛速度快从而非常适用于实时处理可以实现任意的非线性逼近用PNN网络所形成的判决曲面与贝叶斯最优准则下的曲面非常接近只要有充足的样本数据概率神经网络都能收敛到贝叶斯分类器没有BP网络的局部极小值问题扩充性能好网络的学习过程简单增加或减少类别模式时不需要重新进行长时间的训练学习 5 广义回归神经网络广义回归神经网络 GeneralRegressionNeuralNetwork GRNN 是径向基网络的另外一种变形形式广义回归网络以径向基网络为基础因此具有良好的非线性逼近性能与径向基网络相比训练更为方便广义回归神经网络尤其适合解决曲线拟合的问题在MATLAB中newgrnn函数可以方便的实现GRNN网络 6 径向基网络应用实例异或问题RBF网络曲线拟合 6 径向基网络应用实例异或问题输入层为两个神经元输出层为一个神经元隐含层定位两个神经元1 显然问题是对称的因此假定输出单元的两个权值相等即w1 w2 w2 输出单元拥有一个偏置b 以保证网络具有非零均值的输出值两个隐含层结点的中心 t1 1 1 T t2 0 0 T 6 径向基网络应用实例输入数据 0 0 1 0 0 1 1 1 gji表示第j个输入向量与第i个隐含节点的中心的距离 x 0 0 0 1 1 1 1 0 输入向量 t 0 1 0 1 隐含节点的中心 z dist x t 计算输入向量到中心的距离 G radbas z 将算得的距离输入到径向基函数中 G相当于径向基层的输出再加上偏置b 1 形成矩阵 G G ones 4 1 加上偏置 d 0 1 0 1 期望输出 w inv G G G d 求权值向量 d 0 1 0 1 T w w w b T 采用以下公式求解w 最终 w 2 5027 2 5027 2 8413 T 计算实际输出 Y G w 计算实际输出 6 径向基网络应用实例忽略第三列偏置第一行是第一个输入向量 0 0 T在隐含层的输出其余行以此类推表示为坐标的形式 RBF网络的隐含层经过高斯函数的运算将原向量空间中的四个点映射为隐含层空间中的三个点原空间中四个点线性不可分而在新的空间中却可由一条直线正确地分成两类一些解释 6 径向基网络应用实例 xor hand m 清理clearallcloseallclc 输入输入向量x 0 0 0 1 1 1 1 0 隐含节点的中心t 0 1 0 1 6 径向基网络应用实例计算网络计算输入向量到中心的距离z dist x t 将算得的距离输入到径向基函数中G radbas z 加上偏置G G ones 4 1 6 径向基网络应用实例期望输出d 0 1 0 1 求权值向量w inv G G G dG 计算实际输出Y G w 6 径向基网络应用实例 RBF网络曲线拟合输入18个样本点将隐含节点个数设为18 其中心就是输入的x值期望输出为相对应的y值这样网络中有一个输入节点一个输出节点 18个隐含节点手算 curve filt hand buid m训练curve filt

人人文库> 全部分类> 教育资料 > 幼儿教育

温馨提示

1. 本站所有资源如无特殊说明，都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2. 本站的文档不包含任何第三方提供的附件图纸等，如果需要附件，请联系上传者。文件的所有权益归上传用户所有。
3. 本站RAR压缩包中若带图纸，网页内容里面会有图纸预览，若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 人人文库网仅提供信息存储空间，仅对用户上传内容的表现方式做保护处理，对用户上传分享的文档内容本身不做任何修改或编辑，并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容，请与我们联系，我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

[医学]神经网络与MATLAB仿真-(1).ppt

文档简介

温馨提示

最新文档

评论

[医学]神经网络与MATLAB仿真-(1).ppt

文档简介

温馨提示

最新文档

评论

相关文档