




免费预览已结束,剩余96页可下载查看
下载本文档
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第四章反馈型神经网络 第四章反馈型神经网络 4 1概述4 2离散型Hopfield神经网络4 3连续型Hopfield神经网络4 4Hopfield网络的应用实例4 5Boltzmann机4 6双向联想记忆网络4 7海明网络 4 1概述 4 1 1前馈型与反馈型神经网络的比较4 1 2反馈型神经网络模型 4 1 1前馈型与反馈型神经网络的比较 1 前馈型神经网络只表达输入输出之间的映射关系 实现非线性映射 反馈型神经网络考虑输入输出之间在时间上的延迟 需要用动态方程来描述 反馈型神经网络是一个非线性动力学系统 2 前馈型神经网络的学习训练主要采用BP算法 计算过程和收敛速度比较慢 反馈型神经网络的学习主要采用Hebb规则 一般情况下计算的收敛速度很快 并且它与电子电路有明显的对应关系 使得网络易于用硬件实现 3 前馈型神经网络学习训练的目的是快速收敛 一般用误差函数来判定其收敛程度 反馈型神经网络的学习目的是快速寻找到稳定点 一般用能量函数来判别是否趋于稳定点 4 两者都有局部极小问题 4 1 2反馈型神经网络模型 一 网络结构图4 1单层全反馈型神经网络结构 输入输出关系为 j 1 2 n 4 1 1 二 网络状态 1 轨迹经过一段时间t t 0 后不会再延伸 而永远停留在X t0 t 状态 这时称网络收敛到一个稳定点或平衡点 在一个反馈网络中 可能存在有多个稳定点 根据不同的情况 这些稳定点可分为 渐近稳定点Xe 不稳定的平衡点Xf 网络的解 网络的伪稳定点 2 轨迹为环状 称为极限环 3 如果X t 的轨迹在某个确定的范围内变化 但既不重复又不能停下来 状态变化为无穷多个 而轨迹也不发散到无穷远 这种现象成为混沌 Chaos 4 如果X t 的轨迹随时间一直延伸到无穷远 此时状态发散 而系统的输出也发散 三 网络的设计要求 1 网络的稳定性 2 网络的稳定点 3 稳定点的吸引域 4 2离散型Hopfield神经网络 4 2 1离散型Hopfield神经网络模型4 2 2网络的稳定性定理4 2 3网络权值的学习4 2 4网络的稳定性实验4 2 5联想记忆 4 2 1离散型Hopfield神经网络模型 一 网络结构DHNN的结构是一个单层结构的全反馈网络 有n个节点 W是一个n n的对称零对角权值矩阵 为n维阈值向量 每个节点可处于两个可能的状态之一 即1或 1 假设各节点的外加输入Ii 0 i 1 2 n 令Xi t 表示t时刻节点i的状态 则节点i的下一个状态由下面算式决定 网络的状态向量为X t 1 1 n 且wii 0 i 1 2 n 二 网络的工作方式 1 串行 异步 工作方式任一时刻t 只有某一个节点i 随机地或确定性地选择 依据 4 2 1 和 4 2 2 式变化 而其余n 1个节点的状态保持不变 即 2 并行 同步 工作方式任一时刻t 所有的节点都依据式 4 2 1 和 4 2 2 改变状态 即 三 网络的状态若网络从一个初态X t0 出发 经过一个有限时刻t 网络的状态不再发生变化 即 则称网络是稳定的 这时所有的节点输出不再变化 网络稳定在某一状态 4 2 2网络的稳定性定理 Hopfield定义了一个网络的能量函数 由于Xi Xj只可能为1或者为 1 wij Ii有界 i j 1 2 n 所以能量函数E也是有界的 一 串行方式定理4 1当网络工作在串行方式下 满足wij wji wii 0 i j 1 2 n 则能量函数单调下降 且网络必定稳定 证明 对于DHNN网络的任一个节点i 它的输出变化可能为 根据串行方式的定义 每个时刻只有一个节点发生变化 若第i个节点变化 而其它的节点不变 根据公式 4 2 7 可得 因为wij wjiwii 0所以 因为因此当Hi t 0时 Xi 0 E 0当Hi t 0时 Xi 0 E 0所以网络无论在什么条件下都能保证 E 0 这样就保证了网络的稳定性和收敛性 定理4 2当网络工作在串行方式下 满足wij wji wii 0 i j 1 2 n 则能量函数单调下降 且网络必定稳定 证明 对于DHNN网络的第i个节点发生变化 因为wij wji 且wii 0则 由于wii 0 且 Xi与Xi t 1 是同号的 即能保证 E 0 这样就保证了网络的稳定性和收敛性 一 并行方式定理4 3当网络工作在并行方式下 满足wij wji 则网络或者收敛于一个稳定点 或者收敛于极限环为2的一个周期解 证明 在并行工作方式时 其能量函数可以用下式表示 可以写成矩阵的形式 由于在H t 中的每个分量Hi t 与在X t 1 中每个分量Xi t 1 同号 因而成立 所以 E 0 现在考虑在稳定点的情况 即 E 0的情况 若X t X t 1 X t 1 则 E 0 且网络达到稳定 若X t X t 1 X t 1 则 E 0 且网络到达周期为2的极限环 证毕 推论 1 如果W为一个正定矩阵 Ii 0 对所有的i成立 则 网络必定达到稳定收敛 2 如果W为一个负定矩阵 Ii 0 对所有的i成立 则 网络周期振荡 极限环为2 4 2 3网络权值的学习 一 外积型网络权值的学习方法网络待记忆的学习样本有N个 XK K 1 2 N XK Rn 其每个分量为XiK i 1 2 n 利用已知需要存储的样本来设计n个节点间的连接权值 如节点i和j间的连接权值为 其中 为一个正常数 初始化时wij 0 当每输入一个样本时 在权值上加修正量wij t 1 wij t XiKXjK 当第K个样本XiK和XjK同时兴奋或同时抑制时 XiKXjK 0 当XiK和XjK一个兴奋一个抑制时 XiKXjK 0 用Hebb规则修正权值可以满足wij wji的条件 从而使得网络在串行工作方式时保证收敛 在并行工作时系统或者收敛 或者出现极限环为2的振荡 把公式写成矩阵的形式 取 1 对于需要记忆的样本XK K 1 2 N 权值为 由于这里 U是一个单位矩阵 所以 4 2 16 因此 Hebb规则能够满足wii 0 wij wji的条件 网络能够收敛于稳定点 二 稳定点的讨论 1 如果待记忆的样本是两两正交 即对于样本XK K 1 2 N Xi Xj为XK中的任意两个不同的样本 且满足 Xi T Xj 0 i j 对所有的i和j成立 在节点的输出为Xi 1 1 的情况下 当二个n维样本向量的各个分量中有n 2个是相同的 另n 2个是相反的 就能满足这两个向量正交 用上面的外积法所得到的权值进行迭代计算 在输入样本中任取一个样本XK作为初始输入 可得 4 2 17 只要满足n N 则sgn WXK XK 则XK为网络的一个稳定点 2 如果N个样本XK K 1 2 N 不是两两正交 其连接权值依据Hebb规则求得 在N个样本中任选一个样本XK作为初始输入 通过上式可求得新的输出XK sgn WXK 取XK 的第j个分量 4 2 18 式中 设nj为零均值的随机变量 Xik Xjk Xik 1 1 而nj的方差 2 N 1 n 对于非正交的学习样本 如果满足 则网络仍可收敛到其记忆样本上 4 2 4网络的稳定性实验 假定网络由n个节点构成 在时刻t 网络的状态可用全部节点的输出值组成的n维向量X t X1 t X2 t Xn t 来表示 且Xi t 1 1 假定网络是串行工作方式 节点间是对称结合的权植矩阵 在时刻t 任意节点i的输入信号加权和为 网络状态变化 遵循下面规则 从网络n个节点中随机地选取节点i 计算节点i的Hi t 值 根据Hi t 值更新节点i的输出Xi t 1 if Hi t 0 Xi t 1 1ElseXi t 1 1 i以外的节点j j i 输出不变化 Xj t 1 Xj t 返回 4 2 5联想记忆 一 联想记忆的原理 1 自联想记忆 Auto AM 设在学习过程中存入N个样本XK K 1 2 N 若输入X XK V 其中XK是N个样本之一 V是偏差项 可能是噪声 图形的缺损或畸变等 要求输出为Y XK 即使之复原 2 他联想记忆 Hetero AM 规定两组样本之间有一定的对应关系XK YK K 1 2 N 例如 XK代表某人的照片 YK代表某人的姓名 使用时 若输入X XK V 要求输出为Y YK 二 联想记忆的学习设网络有n个节点 且每个节点的输出只能取0或者1 分别表示抑制和兴奋状态 学习过程中wij的调整原则是 若i和j两个节点同时处于兴奋状态 那么它们之间的连接应加强 即 0具体的实现是使用外积规则 对于给定的一组输入样本XK K 1 2 N 外积规则可以表示为 I是单位矩阵 可以用下面步骤完成 置W 0 输入XK K 1 2 N 对所有的连接对 i和j 令 4 2 21 下面讨论上述方法的合理性 假定各个输入样本是正交的 且n N 4 2 22 所以sgn WX1 X1 可见X1是一个稳定状态 4 3连续型Hopfield神经网络 4 3 1网络结构和数学模型4 3 2网络的稳定性分析 4 3 1网络结构和数学模型 若定义网络中第i个节点的输入ui 输出为vi 那么输入输出的关系为 4 3 1 其中 n为网络的节点数 状态转移函数为Sigmoid型函数 一般常用或者网络工作方式分为异步 同步和连续更新三种方式 与离散型Hopfield网络相比 多了一种连续更新方式 即网络中所有节点的输出都随时间连续变化 图4 7利用运算放大器实现的神经元 图4 8连续型Hopfield网络结构 对图4 7的神经元 根据克希荷夫定律可写出下列微分方程 不难看出 图4 8网络的数学模型可以用n个式 4 3 2 所表示的非线形方程组来描述 4 3 2网络的稳定性分析 Hopfield将图4 8网络的能量函数E定义为 定理4 4假定神经元转移特性函数f 存在反函数f 1 并且是单调连续递增函数 同时网络结构对称 即Tij Tji Tii 0 那么沿系统的运行轨迹有dE dt 0 当且仅当dvi dt 0时 dE dt 0 i j 1 2 n 证明 由式 4 3 3 和 对某个特定的j有 由于网络的对称性和式 4 3 2 那么式 4 3 5 可写为 将式 4 3 6 代入式 4 3 4 得因为f 1 单调递增和Cj 0 因此只有对于所有的j满足时 才有 证毕 下面讨论Tij和wij的关系 若式 4 3 2 不考虑外加电流Ii 并将等式两边同乘以Rj 那么有 令 i RiCi wij TijRi 那么式 4 3 8 变为 i模拟神经元的输出时间特性 在网络稳定后 由 4 3 9 式可得 这与 4 3 1 的定义相一致 只不过阈值 i 0 下面对网络的能量公式给予讨论 任选一个节点i 且只有i的状态变化 则能量的变化量为 当 并且 vi 0时 E 0 系统可趋于稳定 当 并且 vi 0时 E 0 系统可趋于稳定 对于节点i有 vi f ui 和ui f 1 vi 为了方便起见 假定转移函数为线形函数 即vi f ui ku则有ui f 1 vi vi k 当k 也即神经元增益趋向无穷时 ui vi k 0 所以在能量公式 4 3 11 中可略去项 这时能量公式为 当外部流入神经网络的电流Ii为0时 能量函数还可化简为 4 4Hopfield网络的应用实例 4 4 1用于求解TSP问题4 4 2用于求解货流问题 4 4 1用于求解TSP问题 TSP问题亦称邮递员路径问题 其内容为 假定有n个城市A B C 已知其相互间距离为dAB dBC dCA 问题是寻找一条合理的闭合路径 此路径经过每个城市 且仅经过一次 并返回到起始城市 要求总的路径 d dAB dBC dCA 为最短 在给定n的条件下 闭合路径的数目为k n 1 2 其算式为 设C为出发点 它表示路径的顺序为C A E B D C 在此矩阵中各行各列只能有一个元素为1 其余都是零 否则它就是一个无效路径 如果用下标x y表示城市 i表示第几次访问 即x y A B C D E i 1 2 3 4 5 图中表示了一条有效路径 其路径的长度为 图4 9用矩阵表示TSP问题的访问顺序 针对有效路径 构造行约束条件 其中A 0为常数 E1保证当矩阵的每一行不多于一个1时 其值达到最小E1 0 构造列约束条件 其中B 0为常数 E2保证当矩阵的每一列不多于一个1时 其值达到最小E2 0 构造全局约束条件 其中C 0为常数 E3保证当矩阵中1的个数恰好为n时 E3达到最小E3 0 定义路径的长度为 其中dxy表示城市x到城市y的距离 vxi表示矩阵中第x行第i列的元素 其值为1时 表示第i步访问城市x 为0时 表示第i步不访问城市x E4取极小值时对应最佳路径 因此 网络的能量函数为 将式 4 4 1 和标准能量函数公式 4 3 13 相比可得到节点i和节点j之间的导纳值为 其中 i j和 x y定义为 偏流为 Ixi Cn 将式 4 4 2 和 4 4 3 代入网络状态方程 4 3 2 中 得到 当网络节点输出为连续型时 当网络节点输出为离散型时 选择合适的A B C D u0和初始值uxi 1 n 按上式迭代直至收敛 下面介绍一种改进的算法 为了简化能量函数 式 4 4 1 中的第三项仅在网络输出为全零时才起作用 否则前面两项已经保证了第三项的成立 如果前两项改为 则第三项可以省去 于是能量函数为 由于行和列的对称性 取B A 第四项由式 4 4 1 的 vy i 1 vy I 1 两项简化为vy i 1一项仍能满足约束条件的要求 由导出网络的动态方程 网络权值与外部输入电流为 Ixi 2A算法步骤如下 置t 0 A 1 5 D 1 读入n个城市之间的距离dx y x y 1 2 n 由式 4 4 7 计算权值Txi yj和输入偏置Ixi 赋予uxi t 的初始值为接近于0的随机数 x i 1 2 n 计算vxi t x i 1 2 n 取u0 0 02 利用动态方程计算 uxi t x i 1 2 n 根据一阶欧拉公式计算uxi t 1 x i 1 2 n 取 t 0 5 如果系统达到平衡状态 则终止 否则返回 4 4 2用于求解货流问题 图4 10货流问题 如图所示 求解货流问题的描述如下 设有m个货源 每个货源存量为Sx x 1 2 m 向n个用户供货 每个用户需要量为Dy y 1 2 n Cxy为从x运到y单位货物所需要费用 问题是求一个供应方案fxy 使满足各用户需要且总费用最小 1 二进制法 这是最常用的方案 用log2 N 1 位表示数N 数空间与神经元空间是一一对应的 这种方法节省神经元数量 但容错性差 尤其当表示最高位的状态错误时 误差最大 2 简单求和法 用处于激活状态的神经元数目之和表示数 则表示数N最少要用N个神经元 数空间和神经元空间是一对多的 这种方法不经济 但容错性好 3 分组求和法 综合上两种方法 把q位数分成 组 每组M位 q M 组内用简单求和法表示 则任何一数都可写成例如 对q 6 K 2 M 3 则5可表示为100100 即41 1 0 0 40 1 0 0 5或010001 001010 100001等 若用 1 1 n表示 则在上式中加一负项 现在来解货流问题 可以把该问题转化为在约束条件下求的最小值 设单位费用矩阵及存需矩阵已知 分别如表4 1 4 2 流量矩阵如表4 3 用q个神经元表示整个矩阵中每个元素 以示流量fxy 所以总共要N qmn个神经元表示整个流量矩阵 每个神经元状态vx y i有三个下标 x y表示神经元所属矩阵元素 i表示它在该元素中的位置 表4 1单位费用矩阵Cxy 表4 2存需矩阵 表4 3流量矩阵 采用分组求和法表示数 目标函数为 式中 A B C D皆为正的系数 第一项是使状态变量vxy二值化 由于函数形式为F v 1 2v 2 0 v 1 当v 0和v 1时达到最小 第二项是存量约束 第三项是需量约束 第四项是使总费用最小 网络的能量函数可表示为 其中Txy k 1 M i x y k 1 M i 表示在流量矩阵中的第xy元素的位于 k 1 M i 的神经元与第x y 元素位于 k 1 M i 的神经元间连线强度 令I与E的对应项相等可得其中 xx 为 函数 4 5Boltzmann机 4 5 1Boltzmann机的网络模型4 5 2模拟退火算法 4 5 1Boltzmann机的网络模型 一 网络结构Boltzmann机是一种有反馈的相互结合型网络 假定网络由n个节点构成 任意一个节点i的输出为 vi t 0 1 且假定节点之间的连接权植矩阵是对称的 即 wij wji wii 0 当节点i的输入 发生变化时 将引起输出vi t 1 的更新 这种更新在各节点之间是以异步方式进行的 并且以概率Pi值来决定vi t 1 在此规定vi t 1 为1的概率Pi为 将式 4 5 2 代入式 4 5 1 得到 图4 14节点的输出受温度T的影响 T 二 网络能量网络的能量函数定义为 根据式 4 5 3 给定的概率 考查vi t 1 更新为1时 网络能量的变化为 由上式可知 当ui t 0时 网络能量将减少或不变 且ui t 0时 概率Pi大 相反 ui t 0时 网络的能量增加或不变 且ui t 0时 概率Pi小 总之 Boltzmann机允许网络状态以小的概率往能量大的方向迁移 这样做的目的是使网络能量函数能够收敛于全局最小点 三 Boltzmann机网络状态变化规则 从n个节点中随机地选取节点i 计算节点i 1 i n 的输入ui t 以概率Pi来决定i的输出vi t 1 其它节点不变化 返回 4 5 2模拟退火算法 一 Boltzmann分布Botlzmann分布函数是关于状态能量的函数 4 5 6 4 5 7 S Geman和D Geman曾证明 如果按下式条件降低温度 网络的状态一定会收敛于能量最小点的状态 4 5 8 其中 t是状态规则的变化次数 C是一常数 二 Boltzmann机的学习算法 a 自我回忆型 b 相互回忆型图4 17Boltzmann机的学习算法 下面介绍自我回忆型算法 假定可视节点集的状态为Va 节点数为n 则Va 0 1 n 同样 隐节点集的状态设为Hb 节点数为m 则Hb 0 1 m 其中a b为状态号 P Va 为可视节点集所希望的分布函数 即外部模式的概率分布 网络全部节点的平衡分布为QW Va Hb W表示网络参数 网络状态 Va Hb 的能量用EW Va Hb 表示 则Qw Va Hb 能够用下面的Boltzmann分布给出 可视节点集的状态分布函数QW Va 为 此时 所希望的分布P Va 和网络所实现的分布QW Va 间的差异用G W 来表示 G W 称为Kullback信息量 表示分布函数间的距离 对于任何QW Va G W 0 当P Va QW Va 时 G W 0成立 因而网络的学习过程相当于求G W 的极小值 而G W 又由W值决定 W的微小变化量 W的变化使G W 的变化量为 为一小正常数 设 G W 一定减小 即 因而 W从给定的初始值开始 使用式 4 5 14 不断地修正 将使G W 趋于极小值 在式 4 5 14 中G对W的偏微分 由下式给出 将这写式子代入 4 5 14 能求出节点间权植的修正量 Boltzmann机的学习算法可归纳为 用概率P Va 固定可视节点集的各节点输出值为Va 隐节点集的状态更新到温度T时的平衡状态 全部节点对 i和j 在平衡状态时 计算同时输出为1的次数nij 使可视节点集也更新 全部节点的状态更新到温度T时的平衡状态 全部节点对 i和j 在平衡状态时 计算同时输出为1的次数nij 反复执行 至 计算nij 和nij 的平均值来作为Pij 和Pij 对全部节点间的权植按下式修正 返回 图4 18 可视节点和隐节点各有两个状态 学习的目的是实现可视节点集合所希望的分布 给出VO为1的概率 图4 18实验用的Boltzmann机 4 6双向联想记忆网络 一 网络结构设输入层有n个节点 X 1 1 n 输出
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 森林防火知识现场培训会课件
- 安全锁定专项培训
- 梭伦改革教学课件
- 2025年互联网公司产品经理招聘面试模拟题及答题技巧
- 桥梁涵洞基本知识培训课件
- 2025年事业单位医疗岗位招聘笔试模拟题及解析
- 2025年吉林省长春市中考历史试卷(含答案与解析)
- 2025年初学会计实务操作手册与常见问题解答
- 2025年医院行政岗位招聘笔试模拟卷及答案公布
- 辽宁省瓦房店市第三高级中学2026届化学高二第一学期期中预测试题含解析
- 基于BIM技术的全过程协同与管理课件
- 《正确测量血压》课件
- 2024年学位与研究生教育工作总结
- 推广服务合同范例
- 《分红保险的魅力》课件
- 住建局条文解读新规JGJT46-2024《施工现场临时用电安全技术标准》
- 叉车装卸货合同范例
- 电力设备运行与维护管理手册
- 工程审计课程设计
- 附件2:慢病管理中心评审实施细则2024年修订版
- 食品安全制度管理目录
评论
0/150
提交评论