我的人工神经网络-10 非确定方法课件

上传人：辅*** IP属地：江苏上传时间：2022-09-19 格式：PPT 页数：63 大小：1.69MB 积分：38 举报 版权申诉

已阅读5页，还剩58页未读，继续免费阅读

版权说明：本文档由用户提供并上传，收益归属内容提供方，若内容存在侵权，请进行举报或认领

文档简介

1、第10章非确定方法 10.1 基本的非确定学习算法 10.2 模拟退火算法 10.3 Cauchy学习 10.4 相关的几个问题第10章非确定方法确定的方法前几章所给方法的共同特征非确定的方法生物神经网络按照概率运行别称统计方法（Statistical Method）。既可以用于学习，又可以用于运行 10.1 基本的非确定学习算法基本思想从所给的网络中“随机地选取一个联接权”，对该联接权提出一个“伪随机调整量”，当用此调整量对所选的联接权进行修改后，如果“被认为”修改改进了网络的性能，则保留此调整；否则放弃本次调整。 10.1 基本的非确定学习算法基本数据结构样本集：S= (X1,Y1

2、),(X2,Y2),(Xs,Ys)输入向量：X=(x1，x2，xn)理想输出向量：Y=(y1，y2，ym)L层： W(1) ，W(2) ，W(L) 10.1 基本的非确定学习算法拓扑结构 x1o1输出层隐藏层输入层x2o2omxnW(1) W(L)W(2)算法10-1 基本统计学习算法7 用修改后的W(1) ，W(2) ，W(L)重新计算X对应的实际输出O；8 求出网络关于Y，O的误差测度E；9 如果EE，则保留本次对W(1) ，W(2) ，W(L)的修改，否则，根据概率判断本次修改是否有用，如果认为有用，则保留本次对W(1) ，W(2) ，W(L)的修改，如果认为本次修改无用，则放弃它；1

3、0 重复上述过程，直到网络满足要求。算法10-1 基本统计学习算法目标函数（Objective Function）误差测度函数：实际输出与理想输出方差和计算量从W(1) ，W(2) ，W(L)中随机地选择wij 共有nH1+H1H2+H2H3+HM-1m个“变量”可供选择伪随机数伪随机数发生器来产生wij(p)；按照所谓的“能量”函数的分布去计算它逃离局部极小点联接权修改量太小：落到A点后很难逃离太大：导致在A、B两点来回抖动解决办法控制联接权修改量的大小：权修改量由大变小允许暂时变坏修改量的大小和网络的“能量”相关模拟退火 ABD逃离局部极小点DBA10.1 模拟退火算

4、法及模型算法的提出模拟退火算法最早的思想由Metropolis等（1953）提出，1983年Kirkpatrick等将其应用于组合优化。算法的目的解决NP复杂性问题；克服优化过程陷入局部极小；克服初值依赖性。 10.1.1 物理退火过程10.1 模拟退火算法及模型物理学方面的模拟退火概念固体物理中，金属结构的稳定程度对应着一个能量函数。当温度高时，原子的运动不稳定，能量函数较高。如果用淬火的方式骤然降温，能量函数就会进入一个局部极小。 10.1.1 物理退火过程10.1 模拟退火算法及模型物理学方面的模拟退火概念所谓退火，是近似一种双极限过程：极限一：当温度有改变时，经过

5、无穷大时间后，系统可以进入稳态；极限二：温度以无穷小的速度趋进于绝对零度； 10.1.1 物理退火过程10.1 模拟退火算法及模型物理退火过程加温过程增强粒子的热运动，消除系统原先可能存在的非均匀态；等温过程对于与环境换热而温度不变的封闭系统，系统状态的自发变化总是朝自由能减少的方向进行，当自由能达到最小时，系统达到平衡态；冷却过程使粒子热运动减弱并渐趋有序，系统能量逐渐下降，从而得到低能的晶体结构。 10.1.1 物理退火过程10.1 模拟退火算法及模型数学表述在温度T，分子停留在状态r满足Boltzmann概率分布 10.1.1 物理退火过程10.1 模拟退火算法及模型数学表

6、述在同一个温度T，选定两个能量E1E2，有在同一个温度，分子停留在能量小的状态的概率比停留在能量大的状态的概率要大。 10.1.1 物理退火过程010.1 模拟退火算法及模型数学表述若|D|为状态空间D中状态的个数，D0是具有最低能量的状态集合：当温度很高时，每个状态概率基本相同，接近平均值1/|D|；状态空间存在超过两个不同能量时，具有最低能量状态的概率超出平均值1/|D| ；当温度趋于0时，分子停留在最低能量状态的概率趋于1。能量最低状态 10.1 模拟退火算法及模型 Metropolis准则（1953）以概率接受新状态固体在恒定温度下达到热平衡的过程可以用Monte Ca

7、rlo方法（计算机随机模拟方法）加以模拟，虽然该方法简单，但必须大量采样才能得到比较精确的结果，计算量很大。 10.1.1 物理退火过程10.1 模拟退火算法及模型 Metropolis准则（1953）以概率接受新状态若在温度T，当前状态i 新状态j 若Ej=randrom0,1 s=sj; Until 抽样稳定准则满足；退温tk+1=update(tk)并令k=k+1； Until 算法终止准则满足；输出算法搜索结果。 10.1.3 模拟退火算法的基本思想和步骤10.1 模拟退火算法及模型定义马尔科夫性（无后效性）：由时刻t0系统或过程所处的状态，可以决定系统或过程在时刻t0所处的状

8、态，而无需借助于t0以前系统或过程所处状态的历史资料。马尔科夫性过程分布函数的描述：X(tn-1)=xn-1,即：PX(tn)=xn|x(t1=x1),X(t2)=x2,.,X(tn-1)=xn-1=PX(tn)=xn|X(tn-1)=xn-1, xnR. 10.2.1 马尔科夫链10.2 模拟退火算法的马氏链描述定义 10.2.1 马尔科夫链10.2 模拟退火算法的马氏链描述定义一步转移概率： n步转移概率：若解空间有限，称马尔可夫链为有限状态；若，称马尔可夫链为时齐的。 10.2.1 马尔科夫链10.2 模拟退火算法的马氏链描述模拟退火算法对应了一个马尔可夫链模拟退火算法：

9、新状态接受概率仅依赖于新状态和当前状态，并由温度加以控制。若固定每一温度，算法均计算马氏链的变化直至平稳分布，然后下降温度，则称为时齐算法；若无需各温度下算法均达到平稳分布，但温度需按一定速率下降，则称为非时齐算法。分析收敛性 10.2.2 模拟退火算法与马尔科夫链10.3 模拟退火算法关键参数和操作的设计原则产生的候选解应遍布全部解空间方法在当前状态的邻域结构内以一定概率方式（均匀分布、正态分布、指数分布等）产生 10.10.1 状态产生函数10.3 模拟退火算法关键参数和操作的设计原则 (1)在固定温度下，接受使目标函数下降的候选解的概率要大于使目标函数上升的候选解概率； (2)随

10、温度的下降，接受使目标函数上升的解的概率要逐渐减小； (3)当温度趋于零时，只能接受目标函数下降的解。方法具体形式对算法影响不大一般采用min1,exp(-C/t) 10.10.2 状态接受函数10.3 模拟退火算法关键参数和操作的设计收敛性分析通过理论分析可以得到初温的解析式，但解决实际问题时难以得到精确的参数；初温应充分大；实验表明初温越大，获得高质量解的机率越大，但花费较多的计算时间； 10.10.3 初温10.3 模拟退火算法关键参数和操作的设计方法（1）均匀抽样一组状态，以各状态目标值得方差为初温；（2）随机产生一组状态，确定两两状态间的最大目标值差，根据差值，利用一定

11、的函数确定初温；（3）利用经验公式。 10.10.3 初温10.3 模拟退火算法关键参数和操作的设计时齐算法的温度下降函数（1），越接近1温度下降越慢，且其大小可以不断变化；（2），其中t0为起始温度，K为算法温度下降的总次数。 10.10.4 温度更新函数10.3 模拟退火算法关键参数和操作的设计时齐算法常用的Metropolis抽样稳定准则（1）检验目标函数的均值是否稳定；（2）连续若干步的目标值变化较小；（3）按一定的步数抽样。 10.10.5 内循环终止准则10.3 模拟退火算法关键参数和操作的设计常用方法（1）设置终止温度的阈值；（2）设置外循环迭代次数；（3

12、）算法搜索到的最优值连续若干步保持不变；（4）概率分析方法。 10.10.6 外循环终止准则模拟退火组合优化法目标函数能量函数人工温度T一个初值较大的数依据网络的能量和温度来决定联接权的调整量（称为步长）。与金属的退火过程（Annealing）非常相似模拟退火组合优化法基本思想随机地为系统选择一个初始状态wij(p)，在此初始状态下，给系统一个小的随机扰动wij(p)，计算系统的能量变化E=E(wij(p)+wij(p)-E(wij(p) 若 E0 then2.10.1 按均匀分布在0,1区间取一随机数r；2.10.2 按Boltzmann分布计算接受本次调整的概率：P(E( wij(p

13、) +wij(p) ) = 2.10.3 if P(E( wij(p) +wij(p) )r then 转2.2；算法10-2 模拟退火算法2.7 用 wij(p) +wij(p) 代替 wij(p) ；2.8 if 样本集中还有未被选用的样本 then 转 2.1；3 判断在此温度下，检验Metropolis抽样是否稳定。如不稳定，则直接转2；4 降低温度T；5 如果T足够小，则结束，否则，转2。算法10-2 模拟退火算法算法的第2步原则上应该对每一个样本调整每一个权，调整的顺序是随机的；温度T的降低 T=T 叫做冷却率，一般情况下可以在0.8，0.9之间取值 Geman(1984年)：

14、温度下降必须与时间的对数成反比，网络最终才能收敛到全局极小点算法10-2 模拟退火算法T的初值T0 T0= E(w (h) )；即：取初始系统目标函数（能量）的值 T0=z E(w (h) )。即：取初始系统目标函数（能量）值的若干倍按照经验给出算法10-2 模拟退火算法调整量wij(p)的计算可以根据Boltzmann分布或者Gaussian分布来计算。也可以用其它的方法。下面讨论按Gaussian分布进行计算的方法。我们取如下形式的Gaussian分布函数。简洁起见，用符号w代替符号wij(p)： p(w)= 10.5 模拟退火算法的实现与应用 10.5.1 30城市TSP问题（d

15、*=4210.741 by D B Fogel） TSP Benchmark 问题 41 94;37 84;54 67;25 62; 7 64;2 99;68 58;71 44;54 62;83 69;64 60;18 54;22 60;83 46;91 38;25 38;24 42;58 69;71 71;74 78;87 76;18 40;13 40;82 7;62 32; 58 35;45 21;41 26;44 35;4 5010.5 模拟退火算法的实现与应用算法流程 10.5.1 30城市TSP问题（d*=4210.741 by D B Fogel） 10.4 模拟退火算法的改进模拟

16、退火算法的优点质量高；初值鲁棒性强；简单、通用、易实现。模拟退火算法的缺点由于要求较高的初始温度、较慢的降温速率、较低的终止温度，以及各温度下足够多次的抽样，因此优化过程较长。 10.4.1 模拟退火算法的优缺点10.4 模拟退火算法的改进改进的可行方案（1）设计合适的状态产生函数；（2）设计高效的退火历程；（3）避免状态的迂回搜索；（4）采用并行搜索结构；（5）避免陷入局部极小，改进对温度的控制方式；（6）选择合适的初始状态；（7）设计合适的算法终止准则。 10.4.2 改进内容10.4 模拟退火算法的改进改进的方式（1）增加升温或重升温过程，避免陷入局部极小；（2

17、）增加记忆功能（记忆“Best so far”状态）；（3）增加补充搜索过程（以最优结果为初始解）；（4）对每一当前状态，采用多次搜索策略，以概率接受区域内的最优状态；（5）结合其它搜索机制的算法；（6）上述各方法的综合。 10.4.2 改进内容10.4 模拟退火算法的改进改进的思路（1）记录“Best so far”状态，并即时更新；（2）设置双阈值，使得在尽量保持最优性的前提下减少计算量，即在各温度下当前状态连续 m1 步保持不变则认为Metropolis抽样稳定，若连续 m2 次退温过程中所得最优解不变则认为算法收敛。 10.4.3 一种改进的模拟退火算法10.4 模拟退火算

18、法的改进改进的退火过程（1）给定初温t0，随机产生初始状态s，令初始最优解s*=s，当前状态为s(0)=s，i=p=0；（2）令t=ti，以t，s*和s(i)调用改进的抽样过程，返回其所得最优解s*和当前状态s(k)，令当前状态s(i)=s(k)；（3）判断C(s*)m2? 若是，则转第(6)步；否则，返回第(2)步；（6）以最优解s*作为最终解输出，停止算法。 10.4.3 一种改进的模拟退火算法10.4 模拟退火算法的改进改进的抽样过程（1）令k=0时的初始当前状态为s(0)=s(i)，q=0；（2）由状态s通过状态产生函数产生新状态s，计算增量C=C(s)-C(s)；（3）

19、若CC(s)? 若是，则令s*=s，q=0；否则，令q=q+1。若C0，则以概率exp(-C/t)接受s作为下一当前状态；（4）令k=k+1，判断qm1? 若是，则转第(5)步；否则，返回第(2)步；（5）将当前最优解s*和当前状态s(k)返回改进退火过程。 10.4.3 一种改进的模拟退火算法10.5 模拟退火算法的实现与应用初始温度的计算 for i=1:100 route=randperm(CityNum); fval0(i)=CalDist(dislist,route); end t0=-(max(fval0)-min(fval0)/log(0.9); 10.5.1 30城市TSP问题（d*=4210.741 by D B Fogel） 10.5 模拟退火算法的实现与应用状态产生函数的设计（1）互换操作，随机交换两个城市的顺序；（2）逆序操

人人文库> 全部分类> 行业资料 > 医学制药

温馨提示

1. 本站所有资源如无特殊说明，都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2. 本站的文档不包含任何第三方提供的附件图纸等，如果需要附件，请联系上传者。文件的所有权益归上传用户所有。
3. 本站RAR压缩包中若带图纸，网页内容里面会有图纸预览，若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 人人文库网仅提供信息存储空间，仅对用户上传内容的表现方式做保护处理，对用户上传分享的文档内容本身不做任何修改或编辑，并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容，请与我们联系，我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

我的人工神经网络-10 非确定方法课件

文档简介

温馨提示

最新文档

评论

我的人工神经网络-10 非确定方法课件

文档简介

温馨提示

最新文档

评论

相关文档