北邮最优化课件 10使用导数的最优化方法

上传人：伐*** IP属地：宁夏上传时间：2021-11-23 格式：PPT 页数：143 大小：1.28MB 积分：20 举报 版权申诉

已阅读5页，还剩138页未读，继续免费阅读

版权说明：本文档由用户提供并上传，收益归属内容提供方，若内容存在侵权，请进行举报或认领

文档简介

1、帅天平帅天平北京邮电大学数学系email:,tel:62281308, rm:主楼81410，使用导数的最优化方法最优化理论与算法第十章使用导数的最优化方法最速下降法牛顿法共轭梯度法拟牛顿法信赖域法10.1最速下降法10.110.1最速下降法最速下降法考虑无约束问题 min f(x), xrn (10.1.1)其中 f(x)具有一阶连续偏导数。在处理这类问题时，一般策略是，希望从某一点出发，选择一个目标函数值下降最快的方向，沿此方向搜索以期尽快达到极小点，基于这一思想，cauchy于1847年提出了最速下降法。这是无约束最优化中最简单的方法。10.1最速下降法1函数f(x)在点x处沿方向

2、d的变化率可用方向导数表示，当函数可微时有，方向导数( , )( ) (1.2)tdf x df xd 求函数f(x)在点x处下降最快的方向,归结为求min ( ). 1 (1.3)tf xdstd( )( )( ) ( )( ) (1.4)ttf xdf xdf xf xdf x ,schwartz由不等式10.1最速下降法2由上式知.当( ) (1.5)( )f xdf x 时等号成立.故在点x处沿(1.5)所定义的方向变化率最小,即负梯度方向为最速下降方向最速下降方向.注意注意:在不同的尺度下最速下降方向是不同的.10.1最速下降法3最速下降算法最速下降算法最速下降算法的迭代公式为(1)

3、( )( )( )( )( )( )( ) (1.6),().kkkkkkkkkxxddxxdf x 其中是从出发的搜索方向,此处取在点的最速下降方向即 ( )( )( )( )( )( )0 ()() (1.7)minkkkkkkkkxdf xdf xd是从出发沿方向进行一维搜索的步长,即满足10.1最速下降法4算法描述算法描述( )( )( )( )( )( )( )( )( )( )0(1)( )( )1,0,12,()3,()()4,:1,2min knkkkkkkkkkkkkkkkstepxekstepdf xstepdxdf xdf xdstepxxdkkstep给定初始点允许误差

4、置计算搜索方向若停止否则从出发沿进行一维搜索求使得令置转例1.1 用最速下降法求解下列问题2212(1)min ( )21(1,1) ,10tf xxxx初点第一次迭代目标函数f(x)在点x处的梯度124( )2xf xx令搜索方向(1)(1)4()21642 51/10df xd (1)(1),xd1从出发沿方向进行一维搜索求步长即(1)(1)0(1)(1)22min ( )()14141212( )2(14 )(12 )f xdxd 令1( )16(14 )4(12 )0 5/18 (2)(1)(1)11/94/9xxd在直线上的极小点第二次迭代(2)(2)(2)4/9()8

5、/9451/109df xd (2)( )f xx在点处的最速下降方向为(2)(2),:xd从出发沿方向进行一维搜索(2)(2)0(2)(2)22min ( )()1/94/9( 14 )/94/98/9(48 )/9216( )( 14 )(12 )8181f xdxd 令21664()( 14)(12)08181 5 /12(3)(2)(2)212127xxd 得到第三次迭代(3)(3)(3)24()127451/1027df xd (3)( )f xx在点处的最速下降方向为(3)(3),:xd从出发沿方向进行一维搜索(3)(3)0(3)(3)2222min ( )()12142421

6、11227272784( )(14 )(12 )2727f xdxd 令2()0 5 /18此时(4)(3)(3)21/91224/9427243xxd(4)81()524310f x已经满足精度要求,得近似解124243x问题的最优解为x*=(0.0)算法的收敛性算法的收敛性( )( )1.1 ( )( )0 ,.kktheoremf xxf xxxx设是连续可微的实函数,解集合=最速下降法产生的序列含于某个紧集,则序列的每个聚点证明证明:最速下降算法a可表示为合成映射a=md其中d(x)=(x,-f(x),是en en en的映射.每给定一点x,经算法d作用,得到点x和在x处的负梯度(从x

7、出发的方向d).算法m是en en en 映射.每给定一点x及方向d=-f(x),经m作用,即一维搜索,得到一个新点,在这一点,与前面的迭代点相比,具有较小的目标函数值,根据th1.1,当 f(x) 0时,m是闭映射.由于f(x)是连续可微实函数, 故d连续,据th8.1.1推论2,a在x(f(x) 0)处是闭的. 其次,当x时, d=-f(x) 0,则f(x) t d0,因此对于ya(x),有f(y)0,满足1,且对每一个成立定:(1理)2) .kxxx则牛顿法产生的序列收敛于10.2.2 局部收敛性10.2 牛顿法证明:根据(10.2.2)，牛顿算法映射定义为21( )( )( )a xx

8、f xf x (a) ,( )-xxx x 定义解集合令函数=下证(x) 是关于解集合和算法a的下降函数.2121212a( )0,( )( )()( ) ( )( )( ) ( )( )( )() (b)f xyxxf xf xxxxf xf xxf f xxf xf x xx 根据算法的定义及的假设有,( ).xxxxya x令且又令10.2 牛顿法于是可得2121 2( )( )( )( )() (c)yxf xxf xf x xxk kxxxx ( )( )( ),.akkcyxxxxxxx由可知故迭代产生的序列根据定义知是紧集,故迭代产生的序列含于紧集.此外,算法映射在紧集

9、上是闭的.综上,迭代产生的序列必收敛于从而(x) 是关于解集合和算法a的下降函数10.2 牛顿法2202()(),*( *)0,hesse( *)*,hesse( )( )lipschitz,l0,( )( ),k10 2 2*. nnkfcrxf xf xxxg xf xx yrg xg yl xyxx局部收敛定理设函数它在的梯度矩阵正定.若初始点充分靠近并且矩阵满足条件即存在使得有则对,迭代格式(. . )有意义,且迭代点序列以二阶的收敛速度收敛到定定理理10.2 牛顿法当牛顿法收敛时,有下列关系2(1)( ) kkxxc xxc,2是某个常数因此算法至少是阶收敛的.特别的,对于

10、二次凸函数,用牛顿法求解,经一次迭代即达到极小点.设有二次凸函数其中a是对称正定矩阵1( )2ttf xx axb xc10.2 牛顿法先用极值条件求解.令( )0f xaxb得最优解1xa b 下用牛顿法解,任取一初始点x(1)(2)(1)1(1)(1)1(1)1()()xxaf xxaaxba b (2),.xx显然即一次迭代即达极小点定义:若一个算法用于求解严格二次凸函数极小值问题时从任意初始点出发,算法在有限次迭代后可到达函数的极小值点,称此算法具有二次终止性.于是牛顿法具有二次终止性10.2 牛顿法注意,当初始点远离极小点时,牛顿法可能不收敛阻尼牛顿法阻尼牛顿法基本思想:增加了沿牛顿

11、方向的一维搜索.迭代公式为(1)( )( ) kkkkxxd=( )2( )1( )()(),kkkdf xf x k其中为牛顿方向,是由一维搜索所得的步长即满足( )( )( )( )() kkkkkf xdf xd)=min10.2 牛顿法算法(阻尼牛顿法)(0)( )2( )1( )( )( )2( )1( )( )( )( )( )( )( )1,0,1;2,(),()3,(),;, ()()4,: min() () kkkkkkkkkkkkkkstepxkstepf xf xstepf xxdf xf xstepxdf xdf xd 给定初始点允许误差置计算若停止得解否则令从

12、出发沿方向作一维搜索 (1)( )( ) 5,:1,2kkkkxxdstepkk令置转10.2 牛顿法10.2.3 修正牛顿法修正牛顿法例用阻尼牛顿法求解下列问题421122min( )(1)f xxx xx(1)(1)2(1)(0,0) .,hessian001(),()212txf xf x 取初点在该点函数的梯度和阵为牛顿方向(1)2(1)1(1)1()()01021220df xf x 10.2 牛顿法(1)(1),xd从出发沿方向进行一维搜索令(1)(1)4)=16+1f xd ( )= ( 1( )=0=0显然,用阻尼牛顿法不能产生新点, 而点x(1) =(0,0) t并

13、不是问题极小点.可见从x(1)出发,用阻尼牛顿法求不出问题的极小点, 原因在于 hessian 矩阵 2f (x(1)非正定再令10.2 牛顿法考虑 (10.2.2),记搜索方向d(k) = x- x(k) ( )2( )1( )()() (e)kkkdf xf x 阻尼牛顿法所用搜索方向是上述方程的解2( )( )( )()() (d)kkkf xdf x 此处假设逆矩阵存在2( )1()kf x10.2 牛顿法2( )()khessianf x解决矩阵非正定问题的基本思想2( )2( )1( )( )(),( )(): () (f)kkkkkkkf xgdgf xg df x 修正构造一

14、个对称正定矩阵在方程中用取代矩阵( )1( )() (g)kkkdgf x 再沿此方向作一维搜索2( )k?,() (h)i,.kkkkggf xi 如何构造比如可令其中是单位阵是一个适当的正数10.2 牛顿法算法修正牛顿法(0)( )( )( )2( )( )1( )( )( )1,0,0;2,(),(),;step3 3, (),0),()()4,kkkkkkkkkkkkkkkkstepxkstepgf xf xxstepgf xbgeegdbf xstepxd 给定初始点允许误差置计算梯度=若停止得解否则转计算hesse矩阵置矩阵其中为修正矩阵(当正定时它取计算修正牛顿方向从

15、出发沿方向作(精确或( )( )( )( )(1)( )( ): min() () ,:1,2kkkkkkkkkf xdf xdxxdkk非精确)一维搜索令置转10.2 牛顿法000() :rd d|( )()lim()() 0.nf xkxfrxfsxd f xf xf x设在某开集上二阶连续可微,且修正牛顿法的初始点使得的水平集是紧集.若矩阵序列定理全局收敛定满足有界分性理解特,则10.3共轭梯度法1 1 共轭方向与扩张子空间定理共轭方向与扩张子空间定理定义定义10.3.110.3.1 设a是nn对称矩阵,若rn 中的两个方向d 1 和d2满足 (d 1)t ad 2 =0 （10.

16、3.1）则称这两个方向关于a共轭,或称它们关于a正交.(1)(2)( )( )( ),.,a0, ,1,2,. . (10.3.2)ki tjdddkdadiji jkn 若是e 中个方向,它们两两关于共轭,即则称这组方向是a共轭共轭,或称它们为a的的k个共轭方向个共轭方向10.3 共轭梯度法几何意义几何意义设有二次函数1( )()() (10.3.3)2tf xxxa xx其中a是nn对称正定矩阵, x是一个定点.1()()2txxa xxc是以x为中心的椭球面,( )()0 f xa xxa正定,故x是f(x)的极小值点.f(x)的等值面由于10.3共轭梯度法设 x(1)是在某等值面上

17、一点,此面在点x(1)处的法向量(1)(1)()()f xa xx又设d (1)是在该等值面在点x (1)处的一切向量.d (2) = x - x (1)(1)(1)(1)(1),().()0,tdf xdf x显然与正交即于是(1)(2)0tdad 即等值面上一点x(1)处的切向量与由这点指向极小点的向量关于a共轭.10.3共轭梯度法x1x2(1)d(2)d(1)xx10.3共轭梯度法0000011111(),(),()02(),();,()01,3(),)0(0,1,., );1 算算法法共共轭轭方方向向法法ntkkkkkkkknktjxrf xdf xdkf xdxxdf xkndrd

18、gdjkkr步初始化给定初始点计算给定一个搜索方向0,使得0;置步线搜索求解一维极小化问题min若或停止否则转步3步计算共轭方向计算一个非零方向使得(置12 k转步(1)(2)( ),.1.,a1,.03kdddk 设a是n阶对称正定矩阵,是个共轭的非零向量则这个向量组线定理.性无关.10.3共轭梯度法(1)(2)( )(1)(1)(2)( )(1)(2)(1)(1)(1)1( )2a,.,a,.,.,(,1).0 3 2 ttknkkkf xx axb xcndddxrdddxxxxf xxk(扩张子空间定理)设有函数其中是阶对称正定矩阵是共轭的非零向量.以任意的为初

19、始点,依次沿进行一维搜索得到点列则是函数在线性流形上的唯一极小点特别地当定定理理. . . .(1)( )1(1)(2)( ),( ).,(,),.,. knkiiiiknxf xex xdddd时是函数在上的唯一极小点其中是生成的子空间10.3共轭梯度法(1)(1)(1)(1)( ),( ),().kkkf xxf xxxf x证明:由于严格凸要证明是函数在线性流形上的唯一极小点只要证在点,与子空间正交.用归纳法证之,为方便,用g j表示函数f(x)在x(j)处的梯度,即( )() (10.3.6) jjgf x1,kkgk 证明对归纳211,.kg 当由一维搜索的定义知121m

20、n,.mmmmkgg 假设时下证10.3共轭梯度法利用上式可以将 gm+2 和d (i) 的内积写成( )( )( )(1)211 (10.3.8)ii ti tmmmmdgdgdad当i=m+1时,由一维搜索定义,知(1)20 (10.3.9)mtmdg当1im+1时,由归纳假设知( )10 (10.3.10)i tmdg(1)(2)(1),.,a,mddd由于关于共轭则( )(1)=0 (10.3.11)i tmdad由二次函数梯度的表达式和点x(k+1)的定义,有(2)(1)(1)21(1)11() ( 10.3.7) mmmmmmmmgaxa xdbgad10.3共轭梯度法即由10

21、.3.8-11,知( )20 i tmdg21.mmg (1)(1),( ).( ),.kkxf xxf x根据上述证明是在上的极小点由于严格凸故必为此流形上的唯一极小点(1)(2)( )1(1),.,0,.nnnnnkn dddegxe当,是的一组基此时必有从而是函数在上的唯一极小点( )1:10.3.2 tjkthgdjk在的条件下, =0, 推论10.3共轭梯度法上述定理表明,对于二次凸函数,若沿一组共轭方向(非零向量)搜索,经有限步迭代必到达极小点.2 线性共轭梯度法与二次终止性线性共轭梯度法与二次终止性hesteness和stiefel于1952年为解线性方程组而提出基本思想:把

22、共轭性与最速下降法相结合,利用已知点处的梯度构造一组共轭方向,并沿着这组方向进行搜索,求出目标函数的极小点10.3共轭梯度法先讨论对于二次凸函数的共轭梯度法,考虑问题1min( ) (10.3.12)2,ttnf xx axb xcxeac对称正定是常数.求解方法(1)1(1)(1)1(1)(2)(2)2(1)(2)(2)20 () (10.3.13),.,0 xgdf xgdxxggddd首先, 任意给定一初始点,计算出目标函数在该点的梯度,若,则停止计算,否则,令沿搜索得点计算在处的梯度若则利用-和构造搜索方向,再沿搜索.10.3共轭梯度法( )( )( )(1)(1)( )( )(

23、 )( )( )( ) (103.14)()=min ()kkkkkkkkkkkkkxdxdxxdf xdf xd一般地,若已知点和搜索方向, 则从出发,沿进行搜索,得其中步长满足 ( )( )(1)t( )(1)t( )( )()( )()0 (10.3.15) ()0 kkkkkkf xdf xdaxb d记令即k下求的表达式10.3共轭梯度法( )( )t( )( )t( )t( )( )t( )( ()0 ()0 (10.3.16) (10.3.17) kkkkkkkkkkkkka xdb dgaddg ddad(1)1( )(1)1(1)( )(1)( )1k( )0,a +

24、(10.3.18) kkkkkkkkkkf xxggdddddgd计算在处的梯度,若,则停止计算,否则,利用-和构造下一搜索方向并使和关于共轭,按此设想.令10.3共轭梯度法综上分析,在第一个搜索方向取负梯度的前提下,重复使用公式3.14,3.17-3.19就能伴随计算点的增加,构造出一组搜索方向.( )( )(1)( )( )( )1k( )1( )( )(1)(1),+0 (10.3.19) k tk tkk tk tkkk tkkk tkkkdadaddagdaddagdadxd上式两端左乘并令再从出发,沿方向搜索.10.3共轭梯度法定理定理10.3.3 对于正定二次函数(10.3

25、.12),具有精确一维搜索的fletcher-reeves法在mn次一维搜索后即终止,并且对所有i(1 i m),下列关系成立:( )( )( )( )1,0, 1,2,.,12,0, 1,2,.,13, (0)i tjtijtitiiiidadjig gjig dg gd 蕴涵证明: 显然m1,下用归纳法(对i)证之. (1)11,),2,idgi 当时由于从而3 成立对时关系1)和2)成立,从而3)也成立.10.3共轭梯度法设对某个im,这些关系均成立,我们证明对于i+1也成立.先证2),(1)( )( )iiiixxd由迭代公式两端左乘a,再加上b,得( )1 (10.3.20)iii

26、iggad其中由式(10.3.17)确定,即i( )( )( )( )( )0 (10.3.21)titiiiii tii tig dg gdaddad10.3共轭梯度法考虑到(10.3.20)和(10.3.18),则( )1( )( )(1)1() (10.3.22)ttiijiijti tjjijijgggadgg gdadd( )(1)111)tti tiiiggg gdad(注:j=1时上式为( )(i 1)( )( )1,0,(10.3.21) 0 i ti titiiitiijidaddadg ggg当时由归纳假设根据10.3共轭梯度法当ji时,根据归纳假设,式(10.3.22)

27、等号右端各项均为010tijgg故再证1),运用(10.3.18)和(10.3.20),则(1)( )( )( )11( )( )1titjijiijjti tjiijdadgdadgggdad 当j=i时,把(10.3.19)代入上式第一个等号的右端,立得(1)( )0itjdad10.3共轭梯度法当ji时,由前面已经证明的结论和归纳假设,式中第2个等号右端显然为0,因此(1)( )0itjdad最后证3),易知(1)( )11111tititiiiiiigdggdgg 综上,对i+1,上述三种关系成立(1)(2)(),re.,.,a10.3.2mfletcherevesdddth由上可知

28、共轭梯度法所产生的搜索方向是共轭的,根据,经有限步迭代必达极小点.10.3共轭梯度法注意,初始搜索方向选择最速下降方向十分重要, 如果选择别的方向作为初始方向,其余方向均按fr方法构造,则极小化正定二次函数时,这样构造出来的一组方向并不能保证共轭性.例例考虑下列问题2221231min 2xxx取初始点和初始搜索方向分别为(1)(1)111 ,210 xd 10.3共轭梯度法显然, 不是目标函数在处的最速下降方向.(1)d(1)x下面,我们用fr法构造两个搜索方向.(1)(1),:xd1从出发沿方向进行搜索,求步长,使满足(1)(1)(1)(1)101()min()23f xdf xd

29、得(2)(1)(1)121/32/31/3 ,1/311xxdg (2)(1)21dgd 令10.3共轭梯度法根据公式(10.3.19),有(1)21(1)(1)2/3169ttdagdad 因此(2)2/315/911/325/99101d (2)(2),:xd2从出发沿方向进行搜索,求步长,使满足(1)(1)(2)(2)202()min()2126f xdf xd得 10.3共轭梯度法(3)(2)(2)239/7818/789/78,9/785/265/26xxdg(3)(2)32dgd 令根据公式(10.3.19),有(2)32(2)(2)45676ttdagdad10.3共轭梯度法注

30、意注意,在在fr法中法中,初始搜索方向必须取最速下降方向初始搜索方向必须取最速下降方向因此(3)18/785/91314519/785/9536766765/261175d (1)(2)(3)(2)(1)(3)(1)(2)(3),aaaaddddddddd可以验证与关于共轭,与关于共轭,但与不关于共轭,于是,不关于共轭.10.3共轭梯度法可以证明,对于正定二次函数,运用fr法时不作矩阵运算就能求出因子i定理定理10.3.4 对于正定二次函数,fr法中因子i具有下述表达式212, (1,0) (10.3.24)iiiigigg证明:( )(1)( )11( )( )( )(1)( )()/

31、()/i ttiiiiiii tii tiiidagga xxdadda xx10.3共轭梯度法2111( )( )12( )() (10.3.23)()10.3.3,. tiiiii ti tiiii tiiggggdggdgdgg根据定理因此212, (10.3.24)iiigg10.3共轭梯度法fr法(对二次凸函数)(1)( )k( )( )(1)1111,1.2,().0, ,. 3,. ,1,0,1(10.3.24). kkkkkkkkkxkgf xgxxdgdkk给定初点置计算若停止计算得点；否则进行下一步构造搜索方向令其中当时当时按公式计算10.3共轭梯度法(1)( )( )

32、(1)4,(10.3.17).5,:1,2kkkkkkxxdknxxkk令其中按公式计算步长若则停止计算得点否则置转2212min ( )2f xxx例3.2 用fr法求解下列问题(1)(5,5)tx初点10.3共轭梯度法令第一次迭代，目标函数f(x)在点x处的梯度122( )4xf xx(1)11020dg (1)(1),:xd1从出发沿方向进行一维搜索求步长10.3共轭梯度法(1)11(1)(1)10( 10, 20)205201018( 10, 20)0420ttg ddad (2)(1)(1)151020/955205/918xxd 第2次迭代目标函数在点x 处的梯度(2)

33、240/920/9g10.3共轭梯度法(2)(1)214100181dgd (2)(2),:xd2从出发沿方向作一维搜索求构造搜索方向d .先计算因子(2)1222212221(40/9)( 20/9)4102081gg 令(2)222(2)(2)420 100(2, 1)9811920204100( 4,1)81041ttg ddad 10.3共轭梯度法(3)(2)(2)220/94091005/9102081xxd (2)200 xg 0显然点处目标函数的梯度,已达极小点010.3 共轭梯度法11100 k=0,1,. (10.3.3.1), kkkkkkkkkkxxddgddg其中初

34、始方向步长参数由一维搜索得到，的计算公式通常有如下几种：一般迭代格式11()1, (fletcher-reeves(fr)()kkktkk tggggl3用于一般函数的共轭梯度法非线性共轭梯度法10.3共轭梯度法11()2, tkkkktkkgggg g-prp(polak-ribiere-polyar111()3, () ()tkkkktkkgggdggk-sw(sorenson-wolfe21121()()4, ()()ktkkkktkkdf xgdf xd-daniel115, ()tkkktkggdgk -dixon10.3共轭梯度法(1)(1)(1)(1)(1)( )( )( )(

35、)( )(1)( )( )1,(),0.2,(),()min() jjjjjjjjjjjxyxdf ykjf yf ydf ydyyd 给定初始点,允许误差0.置若则停止计算否则作一维搜索求满足令 fr共轭梯度法10.3共轭梯度法3,如果j n,转步4,否则,转5(1)(1)( )2(1)2( )4,()()():1,2.jjjjjjjdf ydf yf yjj令 =-其中置转步(1)(1)(1)(1)(1)(1)5,()1, :1,2.jnkxyyxdf yjkk 令 =,置转步可以证明,对一般函数,共轭梯度法在一定条件下是收敛的,10.3共轭梯度法fr算法中使用精确线搜索，我们有如下

36、收敛性结果k1:( )lipschitz.frarmijo0,0,liminf0(armijo()()() nkkkkkkkktkkkfrrf xkggf xdf xcf xd 假设函数有下界，梯度是连续的在共轭梯度法中，步长参数是由精确线搜索确定的，并且满足充分下降条件(即条件).若则条件:选择步长满足定定理理4. 1 拟牛顿条件和算法步骤拟牛顿条件和算法步骤10.4 拟牛顿法基本思想基本思想:牛顿法成功的关键在于利用了hesse矩阵提供的曲率信息，而计算hesse矩阵工作量大，并且有的目标函数的hesse矩阵很难计算，甚至不好求出，这就导致仅利用目标函数一阶导数的方法,拟牛顿法就是利用

37、目标函数值f和一阶导数g的信息,构造出目标函数的曲率近似，而不需要明显形成hesse矩阵，同时具有收敛速度快的优点。牛顿法的迭代公式为10.4 拟牛顿法(1)( )( ) (10.4.1)kkkkxxd=( )( )kkdx 其中是在处的牛顿方向( )2( )1( )()()102kkkdf xf x= (.4. )( )k.kx是从出发沿牛顿方向搜索的最优步长2( )12( )1(),()kkkf xhf x为构造的近似矩阵先分析与一阶导数的关系.10.4拟牛顿法(1)(1)(1)(1)2(1)(1)( )()() ()(kktkktkkf xf xf xxxxxf xxx)+1 )2(1)

38、(1),( )taylorkkkxf xx设在第次迭代后,得点将在点展开(1)2(1)(1)( )( )()()(10.4.3)kkkg xf xf xf xxx +) (1)kx于是在附近( )kxx令,则( )(1)2(1)( )(1)()()()(kkkkkf xf xf xxx +)记10.4 拟牛顿法( )(1)( )( )(1)( )(10.4.4)()() (10.4.5)kkkkkkpxxqf xf x 则( )2(1)( )() (10.4.6)kkkqf xp 2(1)hessian(),kf x设矩阵可逆则( )2(1)1( )() (10.4.7)kkkpf xq

39、( )( )(1)12(1)11,(10.4.7)hessian.hessian() ,kkkkkkpqxhf xh于是计算出和可根据估计在处的矩阵的逆令取代牛顿法中的阵的逆则满足(10.4.8)称为拟牛顿条件拟牛顿条件(方程方程)，也称为割线方程割线方程.怎样确定满足这个条件的h k+1 ?10.4 拟牛顿法( )( )1= (10.4.8)kkkphq算法拟牛顿法拟牛顿法000011(),(0,1)(),0.2(),3(),(,) |,0, nn nkkkkkkkkkkkkkxrhrgf xkgdh gr x dx xxdxxd初始化给定初始点,正定矩阵,;计算置平稳性检验若则停止

40、否则, 计算搜索方向线搜索沿射线进行线搜索，求出步长令10.4 拟牛顿法1114=(),kk kkkkgf xhh(修正拟牛顿方程),计算对校正，得使满足拟牛顿条件，令1，转24. 2 对称秩对称秩1 1校正校正2( )1111(),., ,.kkkkf xnhnhnihh当是阶对称正定矩阵时满足拟牛顿条件的矩阵也应是阶对称矩阵于是构造如此的近似矩阵的一般策略是:取为任意一阶对称正定矩阵(如单位阵 ) 然后通过修正给出令hk称为校正矩阵校正矩阵.确定hk的一个方法是令10.4 拟牛顿法1 (10.4.9)kkkhhh ( )( )kk tkkhzz(10.4.10)( ).kkz

41、n是一常数,是维列向量( )(10.4.8),kz的选择应使得到满足令( )( )( )( )( )kkkk tkkkph qzzq(10.4.11)从而( )( )( )( )( )kkkkk tkkph qzzq(10.4.12)利用(10.4.10),(10.4.12-13),(10.4.9)可写成10.4 拟牛顿法( )(10.4.11),k tq等号两端左乘整理得( )t( )( )( )( )2()()kkkk tkkkqph qzq(10.4.13)( )( )( )( )1( )t( )( )()()()kkkktkkkkkkkkph qph qhhqph q(10.4.1

42、4)-秩秩1 1校正公式校正公式利用秩1校正极小化函数f(x),在第k次迭代中,令搜索方向( )( )()kkkdhf x (10.4.15)10.4 拟牛顿法( )kkd然后沿方向搜索,求步长,满足( )( )( )( )0()min()kkkkkf xdf xd 确定后继点(1)( )( )kkkkxxd(10.4.16)4.3 对称秩对称秩2 2校正校正10.4 拟牛顿法定义校正矩阵( )( )( )( )t( )t( )( )t( )kk tkkkkkkkkkkpph qqhhpqqh q(10.4.17)dfp(davidon-fletcher-power)公式( )( )( )(

43、)t1( )t( )( )t( )kk tkkkkkkkkkkkpph qqhhhpqqh q(10.4.18)则1，dfp算法算法(变尺度法变尺度法)dfp算法10.4 拟牛顿法( )(1)1(1)1( )( )( )( )( )( )( )0(1)( )(1,0,2, ()13, 4,()min()knnkkkkkkkkkkkkkkkstepxestephixgf xkstepdh gstepxdf xdf xdxxd 给定初始点允许误差置计算出在处的梯度置令从出发沿进行一维搜索求使令),10.4拟牛顿法(1)(1)(1)(1)(1)( )(1)( )( )1115, (),66,2

44、;,77,(),(10.4.18),:1,3kkkkkkkkkkkkstepf xxxstepstepknxxstepstepstepgf xpxxqgghkkstep 检验是否满足收敛准则若停止得否则转若则令转否则转令由公式计算置转例1用dfp方法求解下列问题10.4拟牛顿法22121min 242xxx初始点及初始矩阵分别为(1)1210,101 xh12( ,)txx x在点的梯度124(1)2xgx第1次迭代10.4拟牛顿法(1)x在点处的梯度142g 令搜索方向(1)1142dh g (1)(1),:xd1从出发沿方向进行一维搜索,求步长(1)(1)0min()f xd得到

45、1518令10.4拟牛顿法(2)(1)(1)1248/95124/918xxd 284(14/9948/929g第2次迭代10.4拟牛顿法(1)(1)110/95/9pd(1)2140/910/9qgg2h计算(1)(1)(1)(1)t1121(1)t(1)(1)t(1)1tpph q qhhhpqqh q10.4拟牛顿法10/910/95/9105/940/90110/95/910/91040/91040/910/90110/9011040/940/910/90110/9令10.4拟牛顿法10421641101214118178638138305306(2)2286384/91383058/

46、9306112 451dh g 10.4拟牛顿法(2)(2),:xd2从出发沿方向进行一维搜索,求步长(2)(2)0min()f xd得到21736令(3)(3)(2)210 xxd 于是得最优解10.4拟牛顿法(3)30()0gf x 12( ,)(1,0)x x2 dfp算法的正定性及二次终止性算法的正定性及二次终止性10.4拟牛顿法0,1,2,., ,dfp(1,2,., )0.1 4.1iiginh in若则方法构造的矩阵为对称正定.定矩阵理证明:用归纳法 dfp方法中, h1是给定的对称正定矩阵.设hj是对称正定矩阵,下证hj+1也是对称正定矩阵.根据定义,对称性是显然的,下证正定

47、性(10.4.19)10.4拟牛顿法,nye对任意的非零向量有( )( )t( )( )1( )t( )( )t( )( )2( )2( )t( )( )t( )()() tjjtjj tjjttjjjjjjjtjtjjtjjjjjjy h qqh yy ppyy hyy h ypqqh qy h qy py h ypqqh q12,jjhh又对称正定故存在对称正定阵使得1122jjjhh h令10.4拟牛顿法11( )22, (10.4.20)jjjph y qh q则( )( )t( )ttjtjtjjjtjy h yp py h qp qqh qq q于是(10.4.19)可写为( )

48、221( )t( )t( )22( )t( )t()()()()()() tjtttjjjtjtttjjy pp qy hyp ppqq qy pp p q qp qpqq q(10.4.21)由schwartz不等式,有10.4拟牛顿法2t()()()0tttp p q qp qq q(10.4.22)考虑到一维搜索及方向的定义,(10.4.21)右端第一项的分母( )( )( )( )1()()j tjj tj tjjjjjtjjjjpqdggdgh gg j0,0,jjgh由于正定,故( )( )0 (10.4.23)j tjpq于是10.4拟牛顿法( )2( )t( )()0 (10.

49、4.24)tjjjy ppq下证(10.4.22)和(10.4.24)不同时为0.若不然,(10.4.22)为0,则p/q,即p=q(0).从而( )( )( )t( )0jtijjypy pqp( )2( )t( )()0tjjjy ppq综上,知10.4拟牛顿法10tjy hy1min( )2ttf xx axb xc 定理10.4.2 设用dfp方法求解下列问题其中a为n阶对称正定矩阵.取初点x(1) en ,令h1为n阶对称正定矩阵,则成立:( )( )( )( )1( )(1)( )( )1, 0, 1 (10.4.25)2, , 1 (10.4.26),0,.i tjiikiiii

50、iipapijkhappikpxxdkn 其中证明:对k归纳. k=1时有10.4拟牛顿法(1)(1)(1)(1)t(1)(1)1121(1)t(1)(1)t(1)1()tpph q qhh aphappqqh q(10.4.27)由于( )(1)( )( )1() (10.4.28)iiiiiiapa xxggq(1)(1)apq(1)(1)2h app代入(10.4.27)即得即(10.4.26)成立.当k=2时,10.4拟牛顿法(1)(2)(1)222(1)(1)22222() 0ttttpappah gg h apg p 由此结果,易证k=2时(10.4.26)亦成立下设k=m时(10

51、.4.25-26)成立,下证当k=m+1时上述关系式也成立.先证k=m+1时(10.4.25)成立. (1)(1)(2)(),.,.mmppppa与中每一个关于共轭由归纳假设,只需证:由对(10.4.26)的归纳假设,当1im时有10.4拟牛顿法( )( )1iimhapp由此有( )(1)( )111( )( )11111( )11() i tmi tmmmtitimmmmmtimimpappahgghapgpgd (10.4.29)根据th10.3.2的推论,有( )10 (1)timgdim由(10.4.29),知10.4拟牛顿法( )(1)0i tmpap再证当k=m+1时(10.4

52、.26)成立对于1im+1有(1)(1)( )21(1)t(1)(1)(1)t( )11(1)t(1)1( )mmtimmmmmmimmmmmpphaphpqhqqhapqhq(10.4.30)当i=m+1时,由(10.4.28)知(1)(1)mmapq将其代入(10.4.30)得10.4拟牛顿法(1)(1)2mmmhapp当im+1时,根据关于(10.4.26)的归纳假设及当k=m+1时(10.4.25)成立,考虑到(10.4.28),则有(1)( )(1)( )(1)( )10mtimi tmtimqhapqppap从而可得( )( )( )21iiimmhaphappq.e.d.推论:在

53、th10.4.2的条件下,必有10.4拟牛顿法11nhadfp方法中构造出来的搜索方向是一组a共轭方向dfp方法具有二次终止性.22( ),0, ( )( )( ),( ).nnntknfexemxc xx f xf xyem yyf x ydfpxfe若是上的二次连续可微实函数对任意的存在常数使得当时有则方法产生的序列或终止于或收敛于在上的唯一极小点3 bfgs公式及 broyden簇10.4拟牛顿法2(1)1(),(10.4.6),kkbf x若用不含二阶导数的矩阵近似海塞矩阵则由给出另一种形式的拟牛顿条件即( )( )1= (10.4.32)kkkqbp( )( )( )( )

54、t1( )t( )( )t( )kk tkkkkkkkkkkkqqb ppbbbqppb p(10.4.33)可得修正公式-关于矩阵b的bfgs修正公式10.4拟牛顿法1,(10.4.32)kb设可逆则由可知( )1( )1 = kkkpbq11(10.4.8), kb于是满足拟牛顿条件故可令111= (10.4.34)kkhb,hbfgs:shermanmorrison于是利用公式可得关于的公式( )( )( )( )1( )t( )( )t( )( )( )t( )( )t( )t( )(1) k tkkk tbfgskkkkkkkkkkkkkkkqh qpphhpqpqpqhh q

55、ppq(10.4.35)上述公式由broyden,fletcher,goldfarb,shanno(1970)给出.10.4拟牛顿法定义dfpbfgs111(1) (10.4.36)kkkhhh-broyden簇( )( )dfpbfgs2,kkkph q和公式都有由和构成的对称秩校正故此两公式的加权组合仍具有相同的形式显示表达式10.4拟牛顿法( )( )( )( )t( )( )t1( )t( )( )t( )( )( )t1 kk tkkkkkkkkkkkkkdfpkkkpph qqhhhvvpqqh qhvv(10.4.37)( )( )1/2( )( )t( )( )t( )( )

56、t( )kkkkkkkkkkkkph qvqh qpqqh q其中(10.4.38)10.4拟牛顿法1min( )2ttf xx axb xc 定理10.4.3 设其中a为n阶对称正定矩阵. 则对于broyden方法,成立:( )( )( )( )11, 0, 12, , 1i tjiikpapijkhappik tp shuai118线搜索方法：每次迭代时产生一搜索方向，在此方向上进行精确或不精确一维搜索，得到下一迭代点。缺点：可能由于步长过大导致算法失败，特别当问题病态时。ch10.5 信赖域方法主要数值方法1：tp shuai119主要数值方法2：信赖域方法：在每次迭代时，强制性要求新

57、迭代点与当前迭代点之间的距离不超过某一控制量。实际上是，在以当前迭代点为中心的邻域内对一近似于原问题的简单模型求极值。优点：算法稳定性好、收敛性强。tp shuai120主要内容：1 无约束优化信赖域法： 1.1 算法描述 1.2 收敛性2 约束优化（带一个等式约束）： 2.1 逐步二次规划法（sqp） 2.2 marotos 效应 2.3 信赖域方法tp shuai1211 无约束优化信赖域方法问题：基本思想：给定初始迭代点，确定一个以其为中心的邻域，在此域内优化目标函数的二次逼近式，得到下一迭代点。min( )nx rf xtp shuai122信赖域子问题：信赖域内原问题的逼近问题：tp

58、 shuai1231.1 算法描述step1 给定初始点step2 若，则停止计算，得解；否则，解子问题得最优解step3 计算，令选取下一信赖域半径使其满足step4 产生转step21112134,0,0,01,01, : 1n nx brk kgkdkr1,0,0kkkkkxdrxxr11341,kkkkkdrdr 1, :1kbkktp shuai124定理：是信赖域子问题的解当且仅当它是子问题的k-t点，且是半正定矩阵。kd*()bitp shuai1251.2 收敛性在一定条件下，信赖域方法具有全局收敛性。设是上的实函数，是给定初始点，是有界闭集，和在上连续

59、，用信赖域方法求得序列，则 .( )f xnr1x1|( )()sx f xf x( ),( )f xf x2( )f xs kxlim()0kkf xtp shuai1262 等式约束非线性优化问题(2.1)：其中：21( )()()()2ttkkkf xf xf xddf x d( )()()tkkc xc xc xdmin( ). .( )0f xstc x tp shuai1272.1 逐步二次规划(sqp)sqp方法是求解非线性规划的一般方法，是线搜索方法的一种。基本方法：求解原问题可以转化为求解一系列二次规划子问题。是原问题k-t点当且仅当：其实就是拉格朗日函数的稳定点( , )x( )( )0( )0tf xc xc x( , )( )( )l xf xc xtp shuai128sqp给定当前迭代点通过下面的等式求迭代步，可得到下一个迭代点 . （2.2）其中，(,)kkx() ,() )kkx11(,)kkx()()()(,)()()0(

人人文库> 全部分类> 应用文书 > 年终总结

温馨提示

1. 本站所有资源如无特殊说明，都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2. 本站的文档不包含任何第三方提供的附件图纸等，如果需要附件，请联系上传者。文件的所有权益归上传用户所有。
3. 本站RAR压缩包中若带图纸，网页内容里面会有图纸预览，若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 人人文库网仅提供信息存储空间，仅对用户上传内容的表现方式做保护处理，对用户上传分享的文档内容本身不做任何修改或编辑，并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容，请与我们联系，我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

北邮最优化课件 10使用导数的最优化方法

文档简介

温馨提示

最新文档

评论

北邮最优化课件 10使用导数的最优化方法

文档简介

温馨提示

最新文档

评论

相关文档