




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
惩罚函数法〔PenaltyFunctionMehthod〕南京邮电大学理学院信息与计算科学系minf(x)s.t.s1(x)≥0 …… sm(x)≥0 h1(x)=0 …… hn(x)=0数学模型将这种约束问题转化为无约束问题〔罚函数法等〕求解约束问题的方法分类
直接从这种约束问题出发来求解。因无约束问题已有较好的求解方法比方BFGS,DFP将约束条件对问题的限制作用按一定的规那么转换到目标函数上,然后对转换后得到的新的无约束问题求解,然后将求解的结果反映到原问题.仿照无约束优化问题的求解思想,构造“下降迭代算法〞但是构造的方向满足下降要求前,首先要满足可行域!所以这类方法我们称为可行下降方向法。minx12+x22s.t.x1+x2-2=0由图解法易见最优解为(1,1)T直观引例将这个问题改造为一个无约束问题如下:min(x12+x22)+(x1+x2-2)2
(*)分析:任意点x假设不满足原问题的约束,那么(*)第二项就会非常大那么该点x就不会是(*)的最优解。这样的存在迫使最优解在可行域内取得。随着的增大或更特殊地取为+∞,那么问题(*)就成为:min(x12+x22)当(x1+x2-2)=0.这恰为所要求解的原问题.minx12+x22s.t.x1+x2-2=0为一个充分大的正的参数引例求解思想的理论支持问题
min(x12+x22)+(x1+x2-2)2最优解的解析式为:问题“粗放〞想法的进一步深入分析的最优解即是原问题的最优解,但是为+∞在计算机上无法实现。理论上特殊地取为+∞,则min(x12+x22)+(x1+x2-2)2
(*)
为一个较大的正的参数
实际上充分大时,(*)的最优解即可为原问题的最优解。先给定,求解问题min(x12+x22)+(x1+x2-2)2.判断得到的点是否是原问题的解,假设还不是,那么增大再求上述问题,假设还不是,继续。比方本例:取为0,1,10,100,1000时的解如图,趋于(1,1)T.引例的计算机处理方法引例的计算机处理方法一般地,对于等式约束问题,
minf(x)s.t.hj(x)=0,j=1:n将此问题改造成一个新问题(**):~x~x这个新问题的最优解必定使得hj()接近于0引例求解思想推广到一般的等式约束问题因为使得hj(x)=0的那些x就能使得F(x,)的值比F(,)小~x现在的这个点就不会是这个无约束问题的极小点~x否则的话式子中的第二项就会是一个很大的正数新目标函数的特征:在任意原问题的可行点x’处:F(x’,)=f(x’);在任意原问题的不可行点x〞处:F(x〞,)=f(x〞)+大正数。根据这样的原那么,对不等式约束问题可以类似构造:minf(x)s.t.si(x)≥0,i=1;m转化为(易验证满足上述原那么)不等式约束问题改造为相应无约束优化问题的方法·x0转换原那么的解释在极小化新无约束问题时所考虑的是整个空间上的点,而这些点其实是两大块:原可行域D和Rn-D当任取一点x0时F(x0,)显然是要比F(x,)(xD)大的,所以minF(x,)时总体上就是从D外边向D里边(或是边界)“跑〞!比方一个具体的例子:min(x-1)2s.t.x-2≥0构造F(x,)=(x-1)2+[max(0,-(x-2)]2取0,1,10时F的极小点如图总体上就是从D外边向D里边(或是边界)“跑〞!对于混合约束问题
minf(x)s.t.si(x)≥0,i=1:mhj(x)=0,j=1:n.也可以转化为混合约束问题改造为相应无约束优化问题的方法P(x)-----惩罚函数〔惩罚项〕----罚因子F(x,)-----增广目标函数给定初始点x(0),初始惩罚因子1,放大系数c>1,置k=1STEP1:以x(k-1)为初始点求解minF(x,k),得极小点x(k)STEP2:假设x(k)符合原问题的最优解要求,stopSTEP3:k+1=c·k,置k=k+1转(i)外部罚函数法初步框架Proof
(必要性)显然(充分性)假设x是原问题的极小点,那么对于原问题的任意容许点x,总有f(x)=F(x,)(∵在x处分项=0)≤F(x,)(∵x是F的极小点)=f(x)(∵在x处分项=0)这就说明x是原约束问题的最优解。定理(外部罚函数法的终止准那么)无约束问题F(x,)的极小点x恰是原约束问题的极小点的充要条件是x是原约束问题的可行点。
解minF(x,k)=f(x)+罚项,得解x(k),要看它是否是容许点,而这只要看是否罚项<,假设是,那么x(k)就是原约束问题的一个好的近似解.所谓“符合要求”可作如下的解释:外部罚函数法
给定初始点x(0),初始惩罚因子1,放大系数c>1,>0,置k:=1STEP1:以x(k-1)为初始点求解minF(x,k)得极小点x(k)STEP2:假设KP(x(k))<,stopSTEP3:k+1=c·k,置k:=k+1转STEP1Wedoit!算法流程图初始x(0),1>0,c>1,ε>0,k:=1以x(k-1)为初始点,解minf(x)+KP(x)得x(k)kP(x(k))<εyes停;x(k)=optNok+1
:=ck
k:=k+1根据约束条件的特点,构造某种“惩罚函数〞,然后把这个函数参加到目标函数中,将约束函数的求解转化为一系列无约束问题的求解。这种“惩罚〞策略,对于在求解过程中,那些违反约束的迭代点给予很大的目标函数值,(惩罚策略)迫使一系列无约束问题的极小点或者无限地靠近可行域,直至迭代点列收敛到原约束问题的极小点。小结外部罚函数法的基本思想设约束优化问题(I)minf(x)s.t.si(x)≥0,i=1:mhj(x)=0,j=1:n.与无约束优化问题(II)整体最优解分别为x*,x(k),那么对正数序列{k},k+1>k,外部罚函数法产生的点列{x(k)}的任意聚点均为(I)的最优解。外点法的一个重要性质0<k<k+1,记F(x,)=f(x)+P(x),minF(x,k)得x(k),minF(x,k+1)得x(k+1),那么(i)F(x(k),k)≤F(x(k+1),k+1)(ii)P(x(k))≥P(x(k+1))(iii)f(x(k))≤f(x(k+1))Proof(i)F(x(k),k)=f(x(k))+kP(x(k))≤f(x(k+1))+kP(x(k+1))≤f(x(k+1))+k+1P(x(k+1))=F(x(k+1),k+1)(ii)P(x(k))≥P(x(k+1))由F(x(k+1),k)≥F(x(k),k)F(x(k),k+1)≥F(x(k+1),k+1)从而
f(x(k+1))+kP(x(k+1))≥f(x(k))+kP(x(k))f(x(k))+k+1P(x(k))≥f(x(k+1))+k+1P(x(k+1))从而kP(x(k))-kP(x(k+1))≤f(x(k+1))-f(x(k))≤k+1P(x(k))-k+1P(x(k+1))即k+1[P(x(k))-P(x(k+1))]-k[P(x(k))-P(x(k+1))]≥0即
[k+1-k][P(x(k))-P(x(k+1))]≥0即
P(x(k))≥P(x(k+1))。从而
f(x(k))≤f(x(k+1))内惩罚函数外点法是对不可行点施加惩罚,迫使不可行点跑向可行域,而对可行点不加惩罚,由此想法构造出外惩罚函数。内点法也要构造惩罚函数:初始点要求是一个可行的内点由此初始点开始迭代,迭带过程中假设有点要离开可行域那么对该点施加无穷大的惩罚以不让它离开,这样就保证整个迭代过程都是在可行域内完成的。易见,这种解法只能用于不等式约束问题:minf(x)s.t.si(x)≥0,i=1:m仿此,可定义F(x,)=f(x)+(1/s12(x)+1/s22(x)+…+1/sm2(x))
或F(x,)=f(x)+(ln1/s1(x)+ln1/s2(x)+…+ln1/sm(x))
等minf(x)s.t.si(x)≥0,i=1:m,可行域记为D可转化为
minF(x,)=f(x)+(1/s1(x)+1/s2(x)+…+1/sm(x))
其中为一个小正数。易见,当解这个新问题时,假设x由内部接近边界时,那么必有某个si(x)接近于0,这样就使得第二项式子的值近于无穷大由此,就保证了迭代只能在D的可行域内,当x试图出去时会遇到一个无穷大的“障碍〞而出不去,将F(x,)称为障碍函数,其中的第二项称为惩罚项,>0称为惩罚因子。4.内点法f(x),si(x),取(x)=1/s12(x)+1/s22(x)+…+1/sm2(x)取一初始容许点x0,初始惩罚因子1>0,惩罚因子的缩小系数c<1,置k=1(i)以x(k-1)为初始点,求解minf(x)+k(x)得极小点x(k);(ii)假设k(x(k))<,stop;(iii)置k+1=ck,置k=k+1,转(ii)
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- DB32/T 4307-2022党政机关办公楼(区)物业管理服务规范
- DB32/T 4143-2021公共信用信息归集规范
- DB32/T 4081-2021沥青路面用熔融固化体集料通用技术规范
- DB32/T 3975-2021公安机关投诉举报处置规范
- DB32/T 3904-2020电动自行车停放充电场所消防技术规范
- DB32/T 3762.14-2021新型冠状病毒检测技术规范第14部分:N亚基因组荧光PCR检测程序
- DB32/T 3575-2019快速货运服务规范
- DB32/T 3529-2019桂花白叶茶加工技术规程
- DB31/T 954-2015犬瘟热病毒和犬细小病毒荧光PCR检测方法
- DB31/T 945.2-2015节能服务业服务规范第2部分:合同能源管理
- DB32T 3842-2020 土工袋护坡技术规范
- 拆除工程原始记录
- 谁是卧底?班会课游戏
- 神话故事相关的英语习语
- 国家开放大学《教育心理学》形成性考核册参考答案
- 调味品QS审查细则
- 《淹溺急救》PPT课件(2022版)
- 四川省职工住房补贴实施办法
- 辽宁医院明细.xls
- JYC全自动变频抗干扰介质损耗测试仪
- 报考广东警官学院考生政审表
评论
0/150
提交评论