




已阅读5页,还剩6页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
题目:循环网络及其应用基于Boltzmann机网络1. 网络结构 伯尔兹曼机网络(Boltzmann machines,BM)在网络结构方面与Hopfield神经网络类似,网络采取有教师的学习方法,每一个神经元之间对称的反馈互联,即各对神经元之间的传输权重系数是对称的:,。但是,两者之间在运行原理方面有根本区别。(1)Hopfield网络的神经元的结构功能,及其在网络中的地位是一样的。BM中一部分神经元与外部相连,可以起到网络的输入、输出功能,或者严格的说可以受到外部条件的约束;而另一部分神经元则不与外部相连,因而属于隐单元;BM是具有隐单元的反馈互联网络。(2)神经元的状态为0或1的概率取决于相应的输入。(3)学习与工作原理有其独特之处。BM网络的神经元特性取概率阈值模型,如图1所示。对于第号神经元,它的全部输入信号的总和为,可表示如下 (1)或者 (2)神经元的输出为,只能取1或0,取1的概率由下式决定 (3) (4)式(3)就是我们熟悉的Sigmoid形式,但是前面分析中常用的参数改用了字母,并且称之为温度,这与在BM的分析中将与热力学类比有关,在不同的温度下随的变化如图2所示,温度参数在BM神经网络的搜索过程中起重要的作用。 图1 BM神经元结构图2 BM神经元的特性2训练方法2.1 状态更新算法(1)网络初始化给初始状态赋-1,1之间的随机数,设定起始温度和目标温度值。(2)求解内部状态 从N个神经元中随机选取一个神经元,根据下式求解出神经元的输入总和,即内部状态。 (5) (6)(3)更新神经元状态 根据下面的公式更新神经元的状态: (7) (8)(4) 除i外的神经元的输出状态保持不变,即除i外的神经元的状态由下面公式求解得出: 。 (9)(5) 令 ,按照下式计算出新的温度参数: (10)(6) 第(5)步计算出的温度参数是否小于目标温度,小于目标温度则算法结束,否则返回(2),进入下一轮计算。2.2 注意事项(1)概率阀值的确定方法在网络初始化时按经验确定,或在运行过程中选取一个0,0.5之间均匀分布的随机数。(2)网络权值的确定方法(3)在每一温度下达到热平衡的条件(4)降温方法通常采用指数降温,即 为加快网络收敛速度,也可采用一个倍乘小于1的降温系数的办法。3相关问题算法BM神经元网络的运行:最佳解的模拟退火法搜索模拟退火算法是最优化处理理论和方法的一个方面,并不是在BM网络中所专有的,恰恰相反,正是由于上述的网络概率状态对参数的强烈依赖使我们自然地想到,在网络的运行过程中应先高后低以便能够在搜索速度和搜索精度两个方面得到好处,快熟而又精确地获得全局最优解。就像在所有的自适应运算中对迭代步长的处理那样。而作为热处理工艺的模拟退火方法也将工件高温加热,然后慢慢冷却,所追求的物理目的就是将工件的微观物质结构在高温下进行充分的扰动、而在降温的进程中生成微观晶格有序化的低能量状态,共同的理论思想使二者走到了一起,也是热力学理论引入信息处理领域的最初尝试和成功范例。模拟退火算法(Simulated Annealing,SA)它由Metropolis于1953年提出,是最优化处理算法中的一种改进的蒙特卡罗方法、包括Metropolis算法和退火过程(Annealing Procedure,AP)组成。S Kirkpatrick(1983)和V Cerny(1985)进一步发展和应用了这一方法。方法的概要是,首先在高温下进行搜索,由于此时各状态出现概率相差不大,系统可以很快进入“热平衡状态”,是一种快速找到系统概率的低能区的“粗搜索”过程。随着温度逐渐降低,各状态出现概率的差距逐渐被扩大,搜索精度不断提高。最后以一较高置信度达到网络能量函数的全局最小点。简要说明如下。(1)Metropolis抽样过程Metropolis算法是模拟退火算法的基础。它假定随机变量在某一时刻的状态为,在另一时刻状态为。假设这种状态的转移满足对称条件。令表示系统从状态转移至状态所引起的能量差。如果0,算法按概率操作结果随机决定兑现或放弃这一转移。概率操作的方法很多,其中取随机数的方法很简单。随机生成一个在0,1区间内均匀分布的随机数,如果。则兑现这种转移,否则拒绝这种转移。反复迭代,达到系统当前温度下的热平衡(能量最小)。这个过程称作Metropolis抽样过程。(2)退火过程退火过程就是降温过程。即在Metropolis抽样过程中将温度缓慢降低,通过参数的变化使系统状态收敛于全局最小能量处。参数的选择对于算法最后的结果有很大的影响。初始温度和终止温度设置的过低或过高都会延长搜索时间。降温步骤太快,往往会漏掉全局最优点,使算法收敛至局部最优点。叫我降温步骤太慢,则会大大延迟搜索全局最优点的计算时间,从而难以实际应用。模拟退火的算法,得到许多研究者从不同角度和方面进行大量的研究,得到了广泛的应用。在BM网络中为了达到最优搜索结果,更是对模拟退火算法的应用与实现进行了充分的研究,而其中的一个重要问题就是温度降低策略。Kirkpatrick等进行了大量的研究,并给出了一些有用的原则。初始温度:选取足够高的,保证存在所有可能的转移状态。温度下降策略:有不同降温策略,例如 此处是一小于却接近与1的常数。例如可在0.8至0.99之间取值。另外如 终止温度:如果在连续的若干个温度下没有可接受的新状态,算法结束。BM网络的运行采用了模拟退火算法,具体步骤如下:设BM网络具有个神经元,其中个为显见神经元,个为隐见神经元;号神经元的连接权值为。请特别注意,这里讨论的是网络工作阶段的运行问题。是已训练的最优权值。第一步:网络初始化。设定初始温度、终止温度、神经元输出取1的概率阈值。第二部:逐一调整每一个神经元的状态。首先,在温度条件下,随机选取网络中的一个神经元,计算神经元的净输入 若即能量差0,由前述分析知,取1降低网络能量,故兑现之u,取。若即能量差0,则按概率取值。先计算取1概率 若,取,若,取。然后,判断网络是否是一个局部稳态,若是,则转入第三步,降低温度,实施退火;若不是一个局部稳态,则反复随机选取另一个神经元重复本步过程,直到达到一个局部稳态。第三步:模拟退火。重新逐一调整每一神经元的状态。按等策略降低系统温度,重复第二步工作。第四步:终止。条件终止:如果在连续的若干个温度下没有可接受的新状态,算法结束。无条件终止:,算法结束。4BM机的应用介绍BM网络的应用结果的文献相对其它类型的网络少得多,其原因在前面已经提及,主要就是计算工作量太大,限制了应用者的兴趣。但是许多研究者致力于网络模型和计算方法改进的研究,还取得了一些重要进展,在各个技术领域的最优化处理应用也相当的广泛。目前BM机已经广泛应用到图像、声纳、雷达等模式识别领域。下面结合一些实际的应用来具体介绍一下。4.1 BM在最优化计算方面的应用目前已有许多利用BM进行一类复杂决策问题的BM求解实例。本节重点介绍用遗传算法优化的BM机。由于人工神经网络自身具有并行性、鲁棒性等特点,附以一些其他算法,有可能解决目前优化设计领域中存在的一些问题。国内外已有很多学者对此进行了研究,也取得了令人满意的结果。目前BM机已经广泛应用到图像、声纳、雷达等模式识别领域。但是BM机运用模拟退火算法学习理论上能跳出局部最优值而获得全局最优值或者全局最优值的近似值,是一种功能比较强大的网络。但是其各个节点状态的变化是个异步的过程,并且在权值调整时调整量的大小不容易确定。遗传算法是一种并行计算的智能优化算法,并且对于待寻优的函数无连续性、可微性等限制,因而应用范围较广。将遗传算法应用于BM机的学习中,用其并行寻优能力调整BM机的权值变化,实现了不通过复杂的概率统计调整BM机的权值,同样训练出来符合要求的网络。4.1 .1 算法原理BM机学习过程中,在正向学习阶段和反向学习阶段,网络中的自由活动的节点的输出状态按概率: (4-1)进行改变。式中,为网络的温度,为由节点状态的变化而引起的网络能量的变化值。并且经过模拟退火算法不断降低网络的温度,最终使网络达到热平衡状态。当正向学习阶段的网络和反向学习阶段的网络都达到热平衡状态时,统计网络中的任意两个节点同时为1的平均概率,根据概率统为由节点状态的变化而引起的网络能量的变化值。并且经过模拟退火算法不断降低网络的温度,最终使网络达到热平衡状态。当正向学习阶段的网络和反向学习阶段的网络都达到热平衡状态时,统计网络中的任意两个节点同时为1的平均概率,根据概率统计对网络的权值进行调整,其调整公式为: (4-2)BM法中只规定了的值大于0,但是没有给出具体值的求法,同时统率 和 也相当繁琐。遗传算法是一个迭代过程,首先在每次迭代中都保留一候选解,按其解的优劣进行排序,再利用一些遗传算子如交叉和变异等对其进行运算,产生一组新一代的候选解,重复此过程,直到满足某种收敛指标为止。由这个定义可以看出遗传算法的核心所在。因此用遗传法中种群个体之间的竞争寻优的方法调整BM机的权值。4.1 .2 算法的各子步骤的说明 (1)编码应用遗传算法求解的首要问题是对所求问题解的编码。编码表示机制也是进化神经网络的核心问题。在遗传算法中编码方式有多种,各种方式各有利弊,但是二进制编码是一种常用的、方便的编码方式。由于BM机节点的输出状态只有0和1两种形式,因此用二进制编码方式十分方便。所以在编码时选择以各个网络节点状态的输出值为基因值的二进制编码方式。例如,一个染色体的编码方式为01000100,表示一个有8个节点的BM机,其节点的输出状态分别为染色体上的基因值。同时,在对每个染色体编码时产生一个与每一个染色体相对应的神经网络的权值矩阵,用以存储该神经网络的值时,遗传算法结束。(2)适应度函数适应度函数表示子个体适应环境的能力,反应个体在竞争中生存能力的大小。在 BM 机的学习过程中,自由运行期结束后所得的实际输出值和期望的输出值的差别越小,表明该网络越符合要求。因此,取适应度函数值为实际输出值和期望输出值之差绝对值的倒数。当然,实际输出值和期望输出值之差可能为 0 ,这时,根据实际情况取其适应度函数值为一个比其他情况适应度函数值都大的数值。例如实际输出值为0,1,0,期望输出值为 0,0,1,则实际输出值|0-0|+|1-0|=|0-1|=2,则其适应度函数值为 1/2= 0.5 。(3)选择操作采用什么选择方法对遗传算法的性能有很大的影响。在本节中,采取轮盘赌复制法进行选择操作。首先求出目前群体中所有数字串的适应度值,个体依概率: (4-3)被复制到下一代式中为第 为第个染色体的适应度函数值,代表该整体中所有个体的适应度函数值的和。这样适应度高的染色体将有更大的可能进入下一代,适应度低的个体将逐渐被淘汰。(4)交叉操作交叉是遗传算法中最主要的算子,寻优的过程主要是通过交叉来实现的 ,因而其发生的概率应该定得比较大。采用单点交叉的方法,选择两个染色体作为双亲染色体,随机地选择染色体中的一个位置作为交叉点进行交叉,生成两个新的子个体。同时对参与交换个体网络中相应的权值矩阵做交换,产生两个新的络的权值矩阵。例如,两个染色体编码为01001101和01110001,在第4个等位基因处进行交叉操作,交叉后两个染色体分别为01010001和01101101,同时在第4个网络节点处交换两个网络对应的权值。例如两个网络的权值矩阵为和,在第 4个节点处交换后两个网络的对应的权值矩阵变为和。(5)变异操作变异操作的作用主要是在选择操作和交叉操作这两个过程中,对种群中的个体可能丢失的一些有用的遗传因子进行修复和补充,恢复群体基因的多样性,避免种群陷入局部最优解。本文中变异操作是在BM网络达到热平衡状态后以较小的概率随机地改变染色体中某一位的基因的值。如随机地选择一个基因位使其基因值由0变为1或由1变为0 。但是,本算法最终的目的是调节网络的权值,使网络能达到符合期望要求的模式。在交叉操作中只是通过权值矩阵交换操作来改变已有权值矩阵的值,并不能产生新的不同于已有的权值矩阵的值。为了能在遗传算法中引入一些新的权值矩阵的值,对产生变异的染色体的等位基因,调节其对应的网络节点输入输出的权值,例如对所有和该节点相连的边,全部随机地增加一个或者减少一个调整量( 的值随实际的情况而定)。(6)结束条件当达到进化的规定代数或者适应度函数值达到一个满意的值时,遗传算法结束。4.1 .3 算法的步骤以相互回忆型网络为例,其算法步骤如下:步骤 1 产生一个种群个数为 N 的 BM 机网络群体。群体中每个个体染色体的基因由两部分组成,一部分是由确定的输入节点状态值,剩余部分的基因值随机确定。同时每个染色体都有一个所对应的网络的连接权值矩阵,同时设定网络的初始温度和终止温度 ,以及遗传算法的终止条件。步骤 2 让群体中的每个个体的网络进入自由运行期。在该阶段,随机地选取各个非输入的节点,如果节点的输出状态改变后,网络的能量变化小于0,则改变该网络节点的状态,否则按照公式(4-1)中的概率选择是否改变该节点状态的值,若公式(4-1)中的概率小于随机产生的概率,则改变网络节点的状态输出值,否则状态输出值不改变。重复进行该步骤若干次,保证每个网络的节点都被选取过至少一次。步骤3 按照一定的方式降低网络的温度值,如 (4-4)式(4-4)中代表网络降温前的温度,代表网络降温后的温度,代表迭代的次数,重复步骤2。步骤 4重复步骤3,直到网络的温度由初始温度降到规定的一个极小温度,这时停止模拟退火,网络达到一个热平衡状态。步骤 5对达到热平衡状态的群体中的个体按其适应度值的大小进行上述选择、交叉、变异操作。步骤 6重复步骤2、步骤3和步骤4,直至网络达到了规定的学习代数或者适应度函数的值满足要求为止。这时的网络为训练好的符合实际期望值的网络。步骤 7对于一组输入值,用训练好的网络进行预测其输出值的工作。4.1 .4 总结将遗传算法运用到 BM 机的学习过程中,通过遗传算法的个体之间的竞争寻优来调节权值的变化,最终寻找到符合要求的网络权值,训练出符合期望的网络。通过实例验证,可以看到按本文所提算法学习所得到的网络预测天气的准确率并不一定高于BM机,但是可以省略掉BM机在学习时统计实际输入输出模式和进行权值调整时系数的确定等过程。本方法经过足够多代的进化过程能确定符合要求的网络的权值。当然由于引入种群,增加了一定的计算量,这是本方法的一个不足之处。4.2BM在语音识别方面的应用本节重点介绍BM网络识别英语中包含11个稳定元音 等的单词和短语。元音识别建立在前文介绍的典型BM网络结构和典型学习方法之上,由于对短语的识别要考虑前后文之间的约束,因此进一步构建了有限状态机环节。我们仅对元音识别的BM的基本情况作一简要介绍。1.输入语音的预处理和特征提取。依据人的元音发音时的声频参数,输入语音的采样率10KH ,12 bit量化;语音信号帧长为10 ms;对每一帧语音左FFT,得到128点的信号离散功率谱,对各进行高频家重、对数压缩、幅度归一化,最终变成4 bit量化的128维输入权向量。对于模式识别类的应用,特征提取和特征向量的构建是基础,必须仔细进行,因为它对网络工作能力的发挥具有关键意义,对BM网络也不例外。2.网络结构方案。第一种方案是取128个输入神经元,每个神经元4 bit离散取值,对应128维4 bit量化的输入空间;第二种方案是取16行128列 =2048个神经元,每个神经元0/1取值,每列对应128维输入向量,依据输入向量每一维的取值,置对应神经元状态为“1”。注意,两种方案都能有效表达128维4 bit量化输入向量对BM输入层的约束,但是第一方案偏离了BM网络神经元为阈值模型的基本假设,因此对,的计算要作修正;第二方案的输入层变成方阵,网络连接要复杂许多。因此两种方案的识别能力有明显差异。隐层神经元为40个神经元。接收来自输入神经元的输出并向每一个输出神经元提供输入。隐层自身各对神经元充分互连接。3.学习算法(1)128个输入神经元始终受到输入矢量的钳制。(2)8个输出神经元的状态在学习态中受到每个元音对应编码的钳制;在自由态则不受钳制。(3)网络在工作态,只有128个输入神经元受钳制。(4)无论是学习还是工作,BM网络采用同步方式,这就是说在每一个运行节拍上网络中所有不受钳制的神经元同时进行状态转移,以节省运行时间。下面介绍学习算法的其它一些细节考虑。(1)模拟退火程序。网络从一个初始温度开始进行搜索,然后以0.85的因子进行降温,即依次取 的温度进行搜索,直到降温至时,认为网络进入稳态。(2)系数的调整。调整算法采取固定步幅方案。当时,当时,。是一
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 公司环境与安全培训课件
- 行政人事转正工作总结
- 卤菜店铺转让合同6篇
- 新农村建设工作总结
- 《祖国在我心中》课件
- 2025建筑施工租赁合同范本
- 解读义务教育均衡发展
- 第二季度护理工作总结
- 广东省肇庆市德庆县2022-2023学年高三上学期期中考试地理题库及答案
- 广东省汕头市金平区2023-2024学年高二上学期第二次月考思想政治试题及答案
- (2025年标准)教师定岗协议书
- 8 回忆鲁迅先生(课件)语文统编版2024八年级上册
- 2025年蜀道投资集团有限责任公司招聘笔试备考题库附答案详解(达标题)
- 美术基础 课件 第1、2章 美术简介;素描
- 2025年廉价航空行业研究报告及未来发展趋势预测
- 新能源企业盈利能力分析-以比亚迪股份有限公司为例
- 国家奖学金申请答辩汇报
- 2025年“学宪法讲宪法”知识竞赛题库含答案
- 2024年辽宁省地矿集团招聘真题
- 2025年绿化工技师试题及答案
- 【《基于哈佛分析框架的爱尔眼科公司财务分析(数据图表论文)》13000字】
评论
0/150
提交评论