工程应用数学-智能算法_第1页
工程应用数学-智能算法_第2页
工程应用数学-智能算法_第3页
工程应用数学-智能算法_第4页
工程应用数学-智能算法_第5页
已阅读5页,还剩51页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、智能算法(Intelligent Algorithm)2主要内容主要内容q人工神经网络(Artificial Neural Network,ANN)q模拟退火(Simulated Annealing,SA)q遗传算法(Genetic Algorithm,GA)3生物神经元及神经网络生物神经元及神经网络神经元对信息的接受和传递都是通过突触来进行的。单个神经元可以从别神经元对信息的接受和传递都是通过突触来进行的。单个神经元可以从别的细胞接受多个输入。由于输入分布于不同的部位,对神经元影响的比例的细胞接受多个输入。由于输入分布于不同的部位,对神经元影响的比例( (权重权重) )是不相同的。另外,各突

2、触输入抵达神经元的先后时间也不一祥。是不相同的。另外,各突触输入抵达神经元的先后时间也不一祥。因此,一个神经元接受的信息,在时间和空间上常呈现出一种复杂多变的因此,一个神经元接受的信息,在时间和空间上常呈现出一种复杂多变的形式,需要神经元对它们进行积累和整合加工,从而决定其输出的时机和形式,需要神经元对它们进行积累和整合加工,从而决定其输出的时机和强度。正是神经元这种整合作用,才使得亿万个神经元在神经系统中有条强度。正是神经元这种整合作用,才使得亿万个神经元在神经系统中有条不紊、夜以继日地处理各种复杂的信息,执行着生物中枢神经系统的各种不紊、夜以继日地处理各种复杂的信息,执行着生物中枢神经系统

3、的各种信息处理功能。多个神经元以突触联接形成了一个神经网络。信息处理功能。多个神经元以突触联接形成了一个神经网络。4一、人工神经网络一、人工神经网络q什么是人工神经网络?什么是人工神经网络?它就是在对大脑的生理研究的基础上,它就是在对大脑的生理研究的基础上,用模拟生物神经元的某些基本功能元件(即人工神经元),用模拟生物神经元的某些基本功能元件(即人工神经元),按各种不同的联结方式组织起来的一个网络。按各种不同的联结方式组织起来的一个网络。q其其目的目的在于模拟大脑的某些机理与机制,实现某个方面的功在于模拟大脑的某些机理与机制,实现某个方面的功能,可以用在模仿视觉、模式识别、函数逼近、模式识别、

4、能,可以用在模仿视觉、模式识别、函数逼近、模式识别、分类和数据压缩等领域,是近年来人工智能计算的一个重要分类和数据压缩等领域,是近年来人工智能计算的一个重要学科分支。学科分支。q人工神经网络有多种形式,其中反向传播人工神经网络人工神经网络有多种形式,其中反向传播人工神经网络(Back-Propagation Artificial Network, 简称简称BP网络网络)是一种广是一种广泛使用的神经网络模型,它充分体现了人工神经网络的特点。泛使用的神经网络模型,它充分体现了人工神经网络的特点。BP网络是一种对非线性可微分函数进行权值训练的多层网络,网络是一种对非线性可微分函数进行权值训练的多层网

5、络,在人工神经网络的实际应用中,在人工神经网络的实际应用中,8090的人工神经网络的人工神经网络模型是采用模型是采用BP网络或它的变化形式。网络或它的变化形式。 51.1 BP神经网络神经网络q神经元的结构神经元的结构 神经元是人工神经网络的基本处理单元,它一般为多输入神经元是人工神经网络的基本处理单元,它一般为多输入/单输出的非单输出的非线性元件。神经元输出除受输入信号的影响外,还受神经元内部其它线性元件。神经元输出除受输入信号的影响外,还受神经元内部其它因素的制约,因此在人工神经元的建模中,常常加一额外输入信号,因素的制约,因此在人工神经元的建模中,常常加一额外输入信号,称为偏差称为偏差(

6、bais),并取值为,并取值为1。 输入分量输入分量权值分量权值分量 神经元的输出神经元的输出 偏差权值偏差权值 激活函数激活函数 输入分量通过与它相乘的权值分量输入分量通过与它相乘的权值分量相连,求和后与偏差权值共同构成相连,求和后与偏差权值共同构成激活函数的输入激活函数的输入 。 )(1bpwfajrjj6偏差偏差神经元的输出为:神经元的输出为: )(1bpwfajrjj偏差偏差b被简单地加在被简单地加在jrjjwp1上,作为激活函数的一个输入分量。上,作为激活函数的一个输入分量。偏差的重要作用,它使得激活函数的图偏差的重要作用,它使得激活函数的图形可以左右移动,这样可增加网络解决形可以左

7、右移动,这样可增加网络解决问题的能力。问题的能力。 7激活函数激活函数q激活函数具有模拟生物神经元的非线性特性。激活函数具有模拟生物神经元的非线性特性。Sigmoid函数:函数:双曲正切双曲正切tanh函数:函数:xexf11)(xxxxeeeexf)(SigmoidSigmoid函数和双曲正切函数和双曲正切tanhtanh函数都是单调上升函数,函数都是单调上升函数,其极值分别为其极值分别为0 0、1 1和和1 1、1 1,且都是可微的。,且都是可微的。 8激活函数的一阶导数激活函数的一阶导数q在在BP神经网络训练算法中,要用到激活函数的一阶导数。神经网络训练算法中,要用到激活函数的一阶导数。

8、Sigmoid函数的导数:函数的导数:双曲正切双曲正切tanh函数的导数:函数的导数:)(1)(11111)(xfxfeexfxx)(11)(22xfeeeexfxxxxq由此可以看出,由于激活函数的特点,用神经网络计算时,由此可以看出,由于激活函数的特点,用神经网络计算时,需对输入和输出的值进行调整。需对输入和输出的值进行调整。激活函数是采用激活函数是采用Sigmoid函数时,输入和输出的值应函数时,输入和输出的值应在在0,1之间;之间;激活函数是双曲正切激活函数是双曲正切tanh函数时,输入和输出的值范函数时,输入和输出的值范围则在围则在1,1之间。之间。91.2 BP网络的模型结构网络的

9、模型结构 qBP网络是一种在输入层和输出层之间具有一层或多层隐层的网络是一种在输入层和输出层之间具有一层或多层隐层的网络模型,而其典型的结构为有一隐层、包含输入层和输出网络模型,而其典型的结构为有一隐层、包含输入层和输出层的三层网络模型。典型层的三层网络模型。典型BP网络的结构示意图如下:网络的结构示意图如下:网络的输入模式网络的输入模式向量为向量为P,有,有r个个输入神经元,对输入神经元,对应输入模式向量应输入模式向量的每个元素。的每个元素。 隐层内有隐层内有s1个神个神经元,对应隐层经元,对应隐层输出是输出是a1。 网络的输出为网络的输出为a2,有有s2个神经元,个神经元,而目标输出为而目

10、标输出为T。 三层三层BPBP神经网络不同层神经元之间实现权重连接,神经网络不同层神经元之间实现权重连接,而每层内各个神经元之间不连接。而每层内各个神经元之间不连接。10BP网络的四个计算过程网络的四个计算过程q输人模式由输入层经隐含层向输出层的输人模式由输入层经隐含层向输出层的“模式正向传播模式正向传播”过程;(神经元的激活过程;(神经元的激活值从输入层经隐含层向输出层传播,在输值从输入层经隐含层向输出层传播,在输出层各神经元获得网络响应。)出层各神经元获得网络响应。)q网络实际输出与希望输出的误差信号由输网络实际输出与希望输出的误差信号由输出层经隐含层向输入层逐层修正连接权和出层经隐含层向

11、输入层逐层修正连接权和阂值的阂值的“误差反向传播误差反向传播”过程;过程;q由由“模式正向传播模式正向传播”过程与过程与“误差反向传误差反向传播播”过程的反复交替进行的网络学习训练过程的反复交替进行的网络学习训练过程;过程;q网络全局误差趋向极小的学习收敛过程。网络全局误差趋向极小的学习收敛过程。(网络对输入模式响应的正确率也不断增(网络对输入模式响应的正确率也不断增加。加。 ) 11BP网络的计算过程的简单描述(网络的计算过程的简单描述(1) rijbijijbwpwfa1) 11( 111, 2 , 1sj11)212(22sjkbjkjkbwawfa2, 2 , 1skq模式正向传播过程

12、模式正向传播过程隐含层中第隐含层中第j个神经元的输出为:个神经元的输出为:输出层中第输出层中第k个神经元的输出为:个神经元的输出为:q误差反向传播过程误差反向传播过程定义误差函数为:定义误差函数为: 212)2(21skkkatE神经网络学习的过程就是通过调整权值,使误差神经网络学习的过程就是通过调整权值,使误差E E最小,最小,此时可利用最速下降法求权值及误差的反向传播。此时可利用最速下降法求权值及误差的反向传播。 12BP网络的计算过程的简单描述(网络的计算过程的简单描述(2)隐含层中第隐含层中第j个神经元的输出的权值变化为:个神经元的输出的权值变化为:jkkkjkkkjkjafatwaa

13、EwEw12)2(22222 2)2(222fatwaaEwEwkkkbkkkbkb对第对第i个输入到隐含层中第个输入到隐含层中第j个神经元输出的权值变化为:个神经元输出的权值变化为:ikjskkkjijjkkjijipfwfatwaaaaEwEw 122)2(111221121122)2(112221 fwfatwaaaaEwEwkjskkkjbjjkkjbjb修正后的新权重调整为:修正后的新权重调整为: pnpnpWWW1称为学称为学习系数,习系数,值在值在0,10,1之间。之间。 13加快加快BP网络训练速度的方法网络训练速度的方法 qBP网络得到了广泛的应用,但也存在自身的不足与限制,

14、主网络得到了广泛的应用,但也存在自身的不足与限制,主要表现在网络训练需较长时间和网络有可能达到局部最小。要表现在网络训练需较长时间和网络有可能达到局部最小。据此,据此,BP网络有各种改进方法,以加快训练速度,避免陷入网络有各种改进方法,以加快训练速度,避免陷入局部极小。局部极小。q主要的改进方法有:主要的改进方法有: 增加动量项,以平滑权的变化,一种常用形式是:增加动量项,以平滑权的变化,一种常用形式是: )(11npnppnpnpWWWWW为动量因子,值在为动量因子,值在0,10,1之间,之间,n n为迭代次数。为迭代次数。 采用二阶学习算法。前面的基于函数梯度的算法属于一阶采用二阶学习算法

15、。前面的基于函数梯度的算法属于一阶算法,缺点就是在极值点附近收敛速度慢。采用二阶算法,算法,缺点就是在极值点附近收敛速度慢。采用二阶算法,如牛顿法、共轭梯度法等,将有较快的收敛速度。如牛顿法、共轭梯度法等,将有较快的收敛速度。 模拟退火法等。模拟退火法等。 141.4 BP神经网络计算(神经网络计算(1) q网络的层数:网络的层数: 在运用在运用BP神经网络时,神经网络时,最多采用的是具有一层或两层隐层的网络最多采用的是具有一层或两层隐层的网络。 具有偏差和至少一个具有偏差和至少一个S型隐层的网络,可以近似任何函数,这已成为设型隐层的网络,可以近似任何函数,这已成为设计计BP神经网络的原则。神

16、经网络的原则。 网络计算精度的提高,可以通过采用一个隐层,而网络计算精度的提高,可以通过采用一个隐层,而增加隐层神经元数增加隐层神经元数的方法来获得,这也就是通常用一隐层、包含输入层和输出层的三层的方法来获得,这也就是通常用一隐层、包含输入层和输出层的三层BP网络模型的原因。网络模型的原因。q神经元数:神经元数: 输入和输出的神经元数可以根据需要求解的问题和数据所表示的方式输入和输出的神经元数可以根据需要求解的问题和数据所表示的方式来确定。问题确定后,输入层与输出层的神经元数也就随之定了。来确定。问题确定后,输入层与输出层的神经元数也就随之定了。 隐层神经元数的选择有较广的范围:隐层神经元数的

17、选择有较广的范围: 当隐层神经元数较少时,误差下降到一定程度后会变化很小;当隐层神经元数较少时,误差下降到一定程度后会变化很小; 当隐层神经元数过多时,不仅网络训练时间长,还会出现过拟合问题,降当隐层神经元数过多时,不仅网络训练时间长,还会出现过拟合问题,降低神经网络的预测功能。低神经网络的预测功能。 通常隐层神经元数的选择原则是:在能解决问题的前提下,再通常隐层神经元数的选择原则是:在能解决问题的前提下,再加上加上1到到2个神经元个神经元以加快误差的下降速度即可。以加快误差的下降速度即可。15BP神经网络计算(神经网络计算(2)q初始权值的选取初始权值的选取 权重初始值的选取,对网络训练学习

18、是否达到局部最小,是否能够收权重初始值的选取,对网络训练学习是否达到局部最小,是否能够收敛以及训练时间的长短有很大的关系。敛以及训练时间的长短有很大的关系。 如果初始权值太大,使得加和后的值落在激活函数的饱和区,从而导如果初始权值太大,使得加和后的值落在激活函数的饱和区,从而导致激活函数的导数非常小,在计算权值修正时,调整值接近零,网络致激活函数的导数非常小,在计算权值修正时,调整值接近零,网络的学习训练几乎处在停止状态。的学习训练几乎处在停止状态。 所以一般总是希望经过初始权值计算后每个神经元的输出值都接近零,所以一般总是希望经过初始权值计算后每个神经元的输出值都接近零,这样可以保证每个神经

19、元的权值都能在激活函数变化最大之处进行调这样可以保证每个神经元的权值都能在激活函数变化最大之处进行调节。节。 一般来说,一般来说,初始权值取初始权值取-1,1之间的随机数之间的随机数是较好的选择。是较好的选择。 16BP神经网络计算(神经网络计算(3)q学习速率学习速率学习速率决定每一次循环训练中所产生的权值变化量。学习速率决定每一次循环训练中所产生的权值变化量。大的学习速率可能导致系统的不稳定;大的学习速率可能导致系统的不稳定;但小的学习速率导致较长的训练时间,可能收敛很慢,不过能保证网络但小的学习速率导致较长的训练时间,可能收敛很慢,不过能保证网络的误差值不跳出误差表面的低谷而最终趋于最小

20、误差值。的误差值不跳出误差表面的低谷而最终趋于最小误差值。所以在一般情况下,倾向于选取较小的学习速率以保证系统的稳定性。所以在一般情况下,倾向于选取较小的学习速率以保证系统的稳定性。学习速率的选取范围在学习速率的选取范围在0.010.8之间之间。在一个神经网络的计算过程中,使网络经过几个不同的学习速率的训在一个神经网络的计算过程中,使网络经过几个不同的学习速率的训练,通过观察每一次训练后的误差平方和的下降速率来判断所选定的练,通过观察每一次训练后的误差平方和的下降速率来判断所选定的学习速率是否合适。学习速率是否合适。如果误差平方和下降很快,则说明学习速率合适如果误差平方和下降很快,则说明学习速

21、率合适若误差平方和出现振荡现象,则说明学习速率过大。若误差平方和出现振荡现象,则说明学习速率过大。对于每一个具体网络都存在一个合适的学习速率。但对于较复杂网络,对于每一个具体网络都存在一个合适的学习速率。但对于较复杂网络,在误差曲面的不同部位可能需要不同的学习速率。为了减少寻找学习在误差曲面的不同部位可能需要不同的学习速率。为了减少寻找学习速率的训练次数以及训练时间,比较合适的方法是采用变化的学习速速率的训练次数以及训练时间,比较合适的方法是采用变化的学习速率,使网络的训练在不同的阶段自动设置不同学习速率的大小。率,使网络的训练在不同的阶段自动设置不同学习速率的大小。 171.3 BP神经网络

22、计算程序神经网络计算程序BATCHNET简介简介qBATCHNET是一个是一个 BP神经网络计算的神经网络计算的DOS程序,程序由程序,程序由batchnet.exe和和weights.exe两个可执行文件构成。两个可执行文件构成。 batchnet为网络训练和预测程序,激活函数为为网络训练和预测程序,激活函数为Sigmoid函数,输入输出函数,输入输出样本值范围为样本值范围为0,1。 weights程序产生初始权值。程序产生初始权值。q批处理程序批处理程序demo.bat batchnet -e10 d1.0e-5 demo.run 说明:说明:-e10 -e10 表示网络每迭代表示网络每迭

23、代1010步后显示误差;步后显示误差;-d1.0e-5 -d1.0e-5 表示网络训练误差;表示网络训练误差;demo.run demo.run 求解问题的网络参数文件,由求解问题的网络参数文件,由batchnetbatchnet调用,调用,文件名可改,但扩展名文件名可改,但扩展名runrun不能变不能变。 18BP神经网络计算程序神经网络计算程序BATCHNET简介简介q网络参数文件网络参数文件demo.run的格式的格式 4train.out train.err train.pat weights.wts train.wts 100 1000 9 4 2 0.15 0.075test.ou

24、t test.err test.pat train.wts test.wts 166 1 9 4 2 0.15 0.075train.out train.err train.pat train.wts train.wts 100 1000 9 4 2 0.15 0.075test.out test.err test.pat train.wts test.wts 166 1 9 4 2 0.15 0.075 NumfOut fErr fPat fWts fWtso nPats nIter nInp nHid nOut eta alphaNum 运行次数,本例为运行次数,本例为4; fOut 网络

25、计算结果输出文件,输出;网络计算结果输出文件,输出; fErr 网络计算误差文件,输出;网络计算误差文件,输出;fPat 训练学习样本文件,输入;训练学习样本文件,输入;fWts 问题的初始权值文件,输入,由程序问题的初始权值文件,输入,由程序weights产生;产生;fWtso 训练后的权值文件,输出;训练后的权值文件,输出;nPats 训练样本数,本例为训练样本数,本例为100;nIter 训练迭代次数,本例为训练迭代次数,本例为1000;nInp 输入层神经元数目,本例为输入层神经元数目,本例为9;nHid 隐层神经元数目,本例为隐层神经元数目,本例为4;nOut 输出层神经元数目,本例

26、为输出层神经元数目,本例为2;eta 学习速率,本例为学习速率,本例为0.15;alpha 动量因子,本例为动量因子,本例为0.075。 表示用表示用BPBP神经网络先对神经网络先对100100对输对输入输出样本进行学习训练入输出样本进行学习训练10001000次,次,预测预测166166个样本一次,然后继续个样本一次,然后继续学习训练学习训练10001000次后再进行一次预次后再进行一次预测。测。BatchnetBatchnet如只计算一次,则如只计算一次,则不对连接权重进行更新。不对连接权重进行更新。 19BP神经网络计算程序神经网络计算程序BATCHNET简介简介q程序程序weights

27、的运行的运行 :weights int_num nInp nHid nOut ran_wts 说明:说明:int_num int_num 任一任一6 6位整数;位整数;nInp nInp 输入层神经元数目;输入层神经元数目;nHid nHid 隐层神经元数目;隐层神经元数目;nOut nOut 输出层神经元数目,这输出层神经元数目,这3 3个参数同个参数同runrun程序中的程序中的相一致;相一致;ran_wts ran_wts 初始权值取值范围,实数初始权值取值范围,实数1.1.表示取值范围表示取值范围在在-1,1-1,1之间。之间。 Weights 123456 9 4 2 1.020BP

28、神经网络计算程序神经网络计算程序BATCHNET简介简介q训练样本文件训练样本文件fPat的格式:的格式: 说明:说明:In_pat In_pat 样本的输入;样本的输入;Out_pat Out_pat 对应的样本输出;对应的样本输出;Id Id 对应的样本标号;对应的样本标号; In_pat Out_pat Id0.363636 0.191667 0.7 0.75 0.666667 0.531225 0.0898333 0.0504219 0.6844341 0 12345670.327273 0.187501 0.733333 0.75 0.8 0.531038 0.0819442 0.0

29、504219 0.8010571 0 1234567 21例题例题q例题:合成烯胺中副产品的抑制(例题:合成烯胺中副产品的抑制(P249) 在在TiCl4的存在下,的存在下,3,3-二甲基二甲基-2-丁酮和吗啉合成吗啉烯胺过程中会有一副丁酮和吗啉合成吗啉烯胺过程中会有一副产物。由于很难用精馏的方法将这副产物同产物烯胺分离,故需尽量抑制产物。由于很难用精馏的方法将这副产物同产物烯胺分离,故需尽量抑制副产品的生成,为此,进行了下面一系列正交实验研究。实验条件见表副产品的生成,为此,进行了下面一系列正交实验研究。实验条件见表1,实验的设计和产率的结果见表实验的设计和产率的结果见表2。请分析实验结果,

30、确定如何调节实验条。请分析实验结果,确定如何调节实验条件,使烯胺的产率最大,而同时抑制副产品的生成。件,使烯胺的产率最大,而同时抑制副产品的生成。 因素水平-1.414-1011.414x1:吗啉/酮(mol/mol)3.003.595.006.417.00 x2:TiCl4/酮(mol/mol)0.500.570.750.931.00 x3:反应温度()526080100108归一化水平00.14640.50.8536122实验结果与归一化实验结果与归一化序号x1x2x3y1y21-1-1-141.614.621-1-145.16.73-11-151.726.2411-164.717.75-

31、1-1147.811.961-1157.17.57-11163.026.1811177.811.091.4140066.78.110-1.4140049.522.21101.414070.418.9120-1.414043.98.013001.41466.49.81400-1.41452.417.31500056.513.81600060.012.31700058.612.61800057.213.6x11x21x31y1y20.14750.140.1428570.4160.1460.85250.140.1428570.4510.0670.14750.860.1428570.5170.2620

32、.85250.860.1428570.6470.1770.14750.140.8571430.4780.1190.85250.140.8571430.5710.0750.14750.860.8571430.630 0.2610.85250.860.8571430.7780.110670.08950.2220.510.50.7040.1890.500.50.4390.0800.50.510.6640.0980.50.500.5240.170.5650.130.6000.10.5860.1260

33、.720.136231.4 关于关于ANN的进一步说明的进一步说明q选用合适的学习训练网络样本、优化网络结构、采选用合适的学习训练网络样本、优化网络结构、采用适当的学习训练方法就能得到包含学习训练样本用适当的学习训练方法就能得到包含学习训练样本范围的输入与输出关系。范围的输入与输出关系。q如果用于学习训练的样本不能充分反映体系的特性,如果用于学习训练的样本不能充分反映体系的特性,用用ANN也不能很好的描述与预测体系,所以有也不能很好的描述与预测体系,所以有“垃圾垃圾进,垃圾出;金子进,金子出进,垃圾出;金子进,金子出”之说。之说。q确定性模型的参数回归与确定性模型的参数回归

34、与ANN之类的非确定性模型之类的非确定性模型的不同特点。的不同特点。24确定性模型与非确定性模型的比较确定性模型与非确定性模型的比较q确定性模型的参数回归的特点:确定性模型的参数回归的特点: 自变量与因变量之间有明确的函数关系,具有未知数值的自变量与因变量之间有明确的函数关系,具有未知数值的参数,需要通过自变量与因变量的数据组样本来回归估计,参数,需要通过自变量与因变量的数据组样本来回归估计,而且参数个数通常较少,具有明确的物理意义。而且参数个数通常较少,具有明确的物理意义。qANN之类的非确定性模型的特点:之类的非确定性模型的特点: 无须针对问题提出明确的自变量与因变量之间的函数关系,无须针

35、对问题提出明确的自变量与因变量之间的函数关系,而函数关系用含有众多自由参数的模型回归拟合,但自由而函数关系用含有众多自由参数的模型回归拟合,但自由参数无明确的物理意义。参数无明确的物理意义。q因此,确定性模型回归的主要目标是得到模型的参因此,确定性模型回归的主要目标是得到模型的参数值。而非确定性模型计算的主要目标是得到输入数值。而非确定性模型计算的主要目标是得到输入与输出的关系。与输出的关系。25二、模拟退火法(二、模拟退火法(Simulated Annealing)q人工神经网络方法是用某种目标函数的全局极小作为算法搜人工神经网络方法是用某种目标函数的全局极小作为算法搜索和网络所要达到的目标

36、。在学习或运行过程中,网络的误索和网络所要达到的目标。在学习或运行过程中,网络的误差总是按其梯度下降的方向变化。当梯度趋于零时,网络的差总是按其梯度下降的方向变化。当梯度趋于零时,网络的学习或运行就停止了,所以这种算法往往会陷入局部最小而学习或运行就停止了,所以这种算法往往会陷入局部最小而达不到全局最小。达不到全局最小。q导致网络陷入局部最小的主要原因是网络误差按单方向减少,导致网络陷入局部最小的主要原因是网络误差按单方向减少,没有上升的过程。如果将误差的减少过程由没有上升的过程。如果将误差的减少过程由“总是按梯度下总是按梯度下降的方向变化降的方向变化”改为改为“大部分情况下按梯度下降的方向变

37、大部分情况下按梯度下降的方向变化化”,而有时按梯度上升的方向变化,这样就有可能跳出局,而有时按梯度上升的方向变化,这样就有可能跳出局部最小而达到全局最小部最小而达到全局最小(下图给出了梯度下降法下图给出了梯度下降法(a)和和SA方法方法(b)搜索途径搜索途径)。 模拟退火算模拟退火算法的基本思法的基本思想想 26模拟退火法的起源模拟退火法的起源qSA算法是受金属冷却过程的启发,最早由算法是受金属冷却过程的启发,最早由Metropolis于于1953年提出来的。它灵活有效,能对问题进行全局优化。年提出来的。它灵活有效,能对问题进行全局优化。q金属中原子的能量与温度有关。原子能量高的时候,有能力金

38、属中原子的能量与温度有关。原子能量高的时候,有能力摆脱其原来的能量状态而最后达到一个更加稳定的状态摆脱其原来的能量状态而最后达到一个更加稳定的状态全局极小能量状态。全局极小能量状态。q金属固体进行退火处理时,通常先将它加热熔化,然后逐渐金属固体进行退火处理时,通常先将它加热熔化,然后逐渐降低温度。在凝固点附近,若温度下降的速度足够慢,则固降低温度。在凝固点附近,若温度下降的速度足够慢,则固体物质会形成能量最低的稳定状态。其中的金属粒子都经历体物质会形成能量最低的稳定状态。其中的金属粒子都经历能量由高到低、暂时由低到高、最终趋向低能态的过程。能量由高到低、暂时由低到高、最终趋向低能态的过程。 q

39、在金属的退火过程中,能量的状态分布:在金属的退火过程中,能量的状态分布:kTEexpP(E)P(E)P(E)系统处于具有能量系统处于具有能量E E的状态的状态的概率;的概率;k kBoltzmannBoltzmann常数;常数;T T系统的绝对温度系统的绝对温度(Kelvin)(Kelvin) 27模拟退火优化法模拟退火优化法qSA算法将优化问题与统计物理学中的热平衡问题进行类算法将优化问题与统计物理学中的热平衡问题进行类比,即将统计物理学处理金属固体冷却的热平衡方法用于比,即将统计物理学处理金属固体冷却的热平衡方法用于优化问题。优化问题。 q目标函数目标函数能量函数能量函数q优化参数的状态空

40、间优化参数的状态空间物质的微观状态物质的微观状态 q人工温度人工温度T T一个初值较大的控制参数一个初值较大的控制参数q依据网络的能量来决定控制参数的调整量(称为步长)。依据网络的能量来决定控制参数的调整量(称为步长)。当当T T较大时,目标函数值由低向高变化的可能性较大;而较大时,目标函数值由低向高变化的可能性较大;而T T减小,这种可能性也随之减小。减小,这种可能性也随之减小。q与金属的退火过程(与金属的退火过程(AnnealingAnnealing)非常相似。当控制参数)非常相似。当控制参数T T下降到一定程度时,目标函数将收敛于最小值。下降到一定程度时,目标函数将收敛于最小值。 模拟退

41、火优化算法的基本思想模拟退火优化算法的基本思想28模拟退火优化法模拟退火优化法q计算机模拟某一温度计算机模拟某一温度T下物质体系热平衡状态的方法下物质体系热平衡状态的方法 :Step 1Step 1:随机选择一个初始微观状态随机选择一个初始微观状态i作为当前状态,其相作为当前状态,其相应的能量为应的能量为Ei。Step 2:从状态从状态i作随机扰动,产生一新的状态作随机扰动,产生一新的状态j,其相应的,其相应的能量为能量为Ej,计算能量增量,计算能量增量E E= =Ei Ej。Step 3:如果如果E0,则接受状态,则接受状态j作为当前状态,即作为当前状态,即jiji;若若E0 ,计算基于,计

42、算基于BoltzmannBoltzmann分布函数的比值:分布函数的比值:)/exp(/kTEBBrij其中其中:Boltzmann:Boltzmann分布函数分布函数 kTEiieTZB/)(1ikTEieTZ/)(k为为BoltzmannBoltzmann常数常数 10 r取取(0,1)(0,1)之间的一个随机数之间的一个随机数p,若,若rp,则接受状态,则接受状态j作为当作为当前状态,即前状态,即ji ;否则,保持原来的状态;否则,保持原来的状态i。 29模拟退火优化法模拟退火优化法q从从BoltzmannBoltzmann分布函数的比值分布函数的比值( (即即.15式

43、式) )可看出,可看出,温度高时大,相应温度高时大,相应kT也较大,接受与当前状态能也较大,接受与当前状态能差较大的新状态的概率大;降低温度,差较大的新状态的概率大;降低温度,r较小,只较小,只能接受能差较小的新状态。因此不断降低温度,能接受能差较小的新状态。因此不断降低温度,体系最终能达到能量最低热平衡状态。体系最终能达到能量最低热平衡状态。 Step 4Step 4:重复第二、三步,在大量的能量状态变化后,系重复第二、三步,在大量的能量状态变化后,系统处于能量较低的平衡态。降低温度统处于能量较低的平衡态。降低温度T T再重复上述过程,体再重复上述过程,体系又处在能量更低的平衡态。系又处在能

44、量更低的平衡态。30SA基本算法的步骤与框图基本算法的步骤与框图q首先进行初始化,任意给定初始首先进行初始化,任意给定初始态态X0 ,取参数初值,取参数初值T0 ,计算优化,计算优化目标函数目标函数E0 ,然后按下进行:,然后按下进行: (1)随机产生扰动态)随机产生扰动态Xi,计算,计算E=Ei E0 ;(2)若)若E0 ,转到,转到(4)。否则。否则在在(0,1)之间的一个随机数之间的一个随机数p;(3)若)若exp(E/T) p ,转,转(5) ;(4)用)用Xi代替代替X0 ,E0 +E代替代替E0 ;(5)以某种方式取)以某种方式取Ti T0,如,如 Ti =T0;(6) SA计算过

45、程是否结束,是计算过程是否结束,是就停止,否则就转到就停止,否则就转到(1)。 31SA算法的控制算法的控制SA算法能否达到目标函数的最小值,主要取决于控制参数的算法能否达到目标函数的最小值,主要取决于控制参数的初值是否足够高和其下降得是否慢,因此注意有关控制参数初值是否足够高和其下降得是否慢,因此注意有关控制参数的选取问题。对于参数初值的选取问题。对于参数初值T0 ,常用的处理方法之一是在均,常用的处理方法之一是在均匀地随机抽样匀地随机抽样X0后,取的后,取的E0方差作为方差作为T0 。对于降温策略。对于降温策略Ti =T0 ,01,常取,常取0.85,0.96。qSASA算法的使用可以参考

46、教材算法的使用可以参考教材P257P257(FORTRANFORTRAN程序)程序)q用用SA拟合丙烷丝光沸石体系在拟合丙烷丝光沸石体系在303 K时的吸附平衡数据时的吸附平衡数据和模型。和模型。qGenetic Algorithm and Direct Search Toolbox in MATLAB v2007a (Using the Simulated Annealing and Threshold Acceptance Algorithms) 32三、遗传算法三、遗传算法(Genetic Algorithm) q遗传算法是一种模拟自然选择和遗传的随机搜索算法。它最遗传算法是一种模拟自然

47、选择和遗传的随机搜索算法。它最初由初由Holland在在1975年提出的,研究自然系统的适应过程和设年提出的,研究自然系统的适应过程和设计具有自适应性能的软件。计具有自适应性能的软件。q遗传算法的基本形式是用遗传算法的基本形式是用染色体染色体来表示参数空间的编码,用来表示参数空间的编码,用适应度函数适应度函数来评价染色体群体的优劣,通过来评价染色体群体的优劣,通过遗传遗传操作产生新操作产生新的染色体,并用的染色体,并用概率概率来控制遗传操作。来控制遗传操作。q遗传算法是一种非线性方法,它具有简洁、灵活、高效和全遗传算法是一种非线性方法,它具有简洁、灵活、高效和全局优化的特性,在过程控制、系统诊

48、断、非线性拟合与优化、局优化的特性,在过程控制、系统诊断、非线性拟合与优化、人工智能等工程和研究领域都得到了广泛的应用。人工智能等工程和研究领域都得到了广泛的应用。 33遗传算法基础遗传算法基础q遗传算法是一种迭代算法,它在每一次迭代时都拥有遗传算法是一种迭代算法,它在每一次迭代时都拥有一组解一组解(父代染色体群体父代染色体群体),这组解答最初是,这组解答最初是随机随机生成的。生成的。q在每次迭代时,首先保持解,然后染色体群体经过遗传操作在每次迭代时,首先保持解,然后染色体群体经过遗传操作(选择、杂交、变异等选择、杂交、变异等),生成新的组解,生成新的组解(子代染色体群体子代染色体群体)。每。

49、每个解都由一个目标函数来评价,而且这一过程不断重复,直个解都由一个目标函数来评价,而且这一过程不断重复,直至达到某种形式上的收敛。新的一组解不但可以有选择地保至达到某种形式上的收敛。新的一组解不但可以有选择地保留一些先前迭代中目标函数值高的解,而且可以包括一些经留一些先前迭代中目标函数值高的解,而且可以包括一些经由其它解结合而得的新的解,其子代的数值可以与其父代的由其它解结合而得的新的解,其子代的数值可以与其父代的情况有相当大的差别。情况有相当大的差别。 34符号串表示和遗传操作的设计符号串表示和遗传操作的设计q遗传算法的术语借鉴于自然遗传学遗传算法的术语借鉴于自然遗传学, 遗传物质的主要载体

50、是染遗传物质的主要载体是染色体。在遗传算法中,染色体色体。在遗传算法中,染色体(个体个体)由一串数据或数组构成,由一串数据或数组构成,用来作为问题解的代码。用来作为问题解的代码。q染色体由决定其特性的基因构成,而基因又可以有称为等位染色体由决定其特性的基因构成,而基因又可以有称为等位基因的不同取值。基因的不同取值。q目标函数称为适应度函数,而一组染色体称为群体。目标函数称为适应度函数,而一组染色体称为群体。q遗传算法的一次迭代称为一代。遗传算法的一次迭代称为一代。q遗传算法成功的关键在于符号串表示和遗传操作的设计。遗传算法成功的关键在于符号串表示和遗传操作的设计。 35染色体染色体 q解空间中

51、的每一点都对应一个用由基因表示的染色体。解空间中的每一点都对应一个用由基因表示的染色体。 例如:要确定适应度函数例如:要确定适应度函数f(x,y)的最大值,搜寻空间变量的最大值,搜寻空间变量x和和y为整数,其变化范围是为整数,其变化范围是0-15。这样对应于搜寻空间任何点可。这样对应于搜寻空间任何点可由两基因的染色体来表示:由两基因的染色体来表示: 点(点(2,6)用二进制数有如下的染色体:)用二进制数有如下的染色体: xy260010011036交叉交叉q在两父代的染色体的随机长度位置上,用交叉概率进行后部在两父代的染色体的随机长度位置上,用交叉概率进行后部交换,产生两子代,如下所示:交换,

52、产生两子代,如下所示: 上面的交叉操作称为单点交叉。一般地可以进行多点交叉,上面的交叉操作称为单点交叉。一般地可以进行多点交叉,如下所示:如下所示: 37变异变异q与交叉不同,变异涉及到一染色体个体的一个或多个基因位与交叉不同,变异涉及到一染色体个体的一个或多个基因位的翻转,产生新的基因组合,以通过交叉来获得子代染色体。的翻转,产生新的基因组合,以通过交叉来获得子代染色体。下面的任一方法都可以用来进行变异操作:下面的任一方法都可以用来进行变异操作: 随机选择的基因位数值可以被随机产生的数值替代,这种替代对二进随机选择的基因位数值可以被随机产生的数值替代,这种替代对二进制和非二进制染色体都适用;

53、制和非二进制染色体都适用; 在二进制染色体中,可以对随机选择的基因位进行触发,即在二进制染色体中,可以对随机选择的基因位进行触发,即10或或01。 q可以以概率可以以概率Pm随机选择个体进行变异操作。随机选择个体进行变异操作。 q变异操作的主要优点是使染色体群体中出现各种基因,这样变异操作的主要优点是使染色体群体中出现各种基因,这样遗传算法有在参数解空间找出各种可能的解,避免解的丢失。遗传算法有在参数解空间找出各种可能的解,避免解的丢失。 38有效性检验有效性检验q对于不同的优化问题,有时需要增加检验,确保新子代的染对于不同的优化问题,有时需要增加检验,确保新子代的染色体表示的是参数解空间中的

54、有效点。如考虑由四个基因组色体表示的是参数解空间中的有效点。如考虑由四个基因组成的染色体,每个基因有三个可能的二进制值成的染色体,每个基因有三个可能的二进制值A=01,B=10,C=11。二进制染色体表示组合。二进制染色体表示组合BACA是:是: 1001110110011100如对最后的基因位进行变异操作,产生了如下所示的无效如对最后的基因位进行变异操作,产生了如下所示的无效染色体,因基因值染色体,因基因值00没有定义。没有定义。 q同样,交叉也可能产生有缺陷的染色体操作。克服这些问题同样,交叉也可能产生有缺陷的染色体操作。克服这些问题的方法是采用结构操作,交叉或变异操作针对基因,而不是的方

55、法是采用结构操作,交叉或变异操作针对基因,而不是针对基因位。这样,交叉操作点总能与基因边界相一致,变针对基因位。这样,交叉操作点总能与基因边界相一致,变异操作对整个基因组随机选择新值,确保产生有效染色体。异操作对整个基因组随机选择新值,确保产生有效染色体。如此做的缺点是染色体群体的差异性会受到影响。如此做的缺点是染色体群体的差异性会受到影响。 39基本的遗传算法框图基本的遗传算法框图q初始染色体群体随机产生;初始染色体群体随机产生;q用适应度函数来评价染色用适应度函数来评价染色体个体;体个体;q根据适应度产生繁殖的染根据适应度产生繁殖的染色体个体,适应度好的染色体个体,适应度好的染色体个体其被

56、选择来繁殖色体个体其被选择来繁殖的可能性大;的可能性大;q通过染色体对的交叉和变通过染色体对的交叉和变异操作,产生各自的子代异操作,产生各自的子代繁殖染色体。繁殖染色体。 40基本的遗传算法基本的遗传算法q在遗传算法中,是依据适应度来选择个体进行繁殖的,最适在遗传算法中,是依据适应度来选择个体进行繁殖的,最适合的染色体繁殖的可能性也最大。选择不仅决定由那些个体合的染色体繁殖的可能性也最大。选择不仅决定由那些个体来繁殖,而且还要确定繁殖子代的数目。因此选择的方法对来繁殖,而且还要确定繁殖子代的数目。因此选择的方法对遗传算法的有效性有着重要的作用。遗传算法的有效性有着重要的作用。 qGAGA算法的

57、使用可以参考教材算法的使用可以参考教材P262P262(FORTRANFORTRAN程序)程序)qGenetic Algorithm and Direct Search Toolbox in MATLAB v2006a41Genetic Algorithm Toolbox in MATLABqCalling the Function ga at the Command Linex fval = ga(fitnessfun, nvars, options)fitnessfunfitnessfun is a handle to the fitness function. is a handle t

58、o the fitness function.nvarsnvars is the number of independent variables for the fitness function. is the number of independent variables for the fitness function.optionsoptions is a structure containing options for the genetic algorithm. If you do is a structure containing options for the genetic a

59、lgorithm. If you do not pass in this argument, ga uses its default options.Stepnot pass in this argument, ga uses its default options.Step x Point at which the final value is attainedfval Final value of the fitness functionqUsing the Genetic Algorithm Toolgatool42GATool GUI of MATLAB目标函数目标函数变量数变量数约束

60、条件约束条件图形显示图形显示执行计算执行计算计算结果计算结果计算选项计算选项43Ex1: Unconstrained Minimization Using GAqFunction:qThe function has two local minima:qone at x = 0, where the function value is -1, qthe other at x = 21, where the function value is -1 - 1/e. qSince the latter value is smaller, the global minimum occurs at x =

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论