版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
最优控制第六章极小值原理第一页,共五十一页,2022年,8月28日极小值原理是原苏联学者庞特里亚金于1956年提出的。它从变分法引伸而来,与变分法极为相似。因为极大与极小只相差一个符号,若把性能指标的符号反过来,极大值原理就成为了极小值原理。极小值原理是解决最优控制,特别是求解容许控制问题的得力工具。第二页,共五十一页,2022年,8月28日用古典变分法求解最优控制问题,都是假定控制变量u(t)的取值范围不受任何限制,控制变分δu是任意的,从而得到最优控制u*(t)所应满足的控制方程。但是,在大多数情况下,控制变量u(t)总要受到一定限制,δu不能任意取值,控制变量被限制在某一闭集内,即u(t)满足不等式约束条件在这种情况下,控制方程已不成立,所以不能再用变分法来处理最优控制问题。第三页,共五十一页,2022年,8月28日(2)一、连续系统的极小值原理
设系统状态方程为(1)初始条件为x(t0)=x0,终态x(tf)满足终端约束方程式中N——q维连续可微的矢量函数,q≤n。第四页,共五十一页,2022年,8月28日控制式中g——l维连续可微的矢量函数,l≤r。(3)受不等式约束第五页,共五十一页,2022年,8月28日式中,Φ和L——连续可微的矢量函数
tf——待定终端时刻。最优控制问题就是要寻求最优容许控制u(t)在满足上列条件下,使J为极小。性能泛函(4)第六页,共五十一页,2022年,8月28日与前面讨论过的等式约束条件最优控制问题作一比较,可知它们之间的主要差别在于:这里的控制u(t)是属于有界闭集U,受到不等式g[x(t),x(t),t]≥0约束。为了把这样的不等式约束问题转化为等式约束问题,采取以下两个措施:第七页,共五十一页,2022年,8月28日虽然u(t)不连续,但w(t)是连续的。若u(t)分段连续,则u(t)是分段光滑连续系统。(5)1)引入一个新的r维控制变量w(t),令第八页,共五十一页,2022年,8月28日(6)无论是正是负,恒非负,故满足g非负的要求。2)引入另一个新的l维变量z(t),令第九页,共五十一页,2022年,8月28日的极值问题。(7)通过以上变换,便将上述有不等式约束的最优控制问题转化为具有等式约束的波尔扎问题。再应用拉格朗日乘子法引入乘子λ和γ(读gamma),问题便进一步化为下列增广性能泛函第十页,共五十一页,2022年,8月28日(8)(9)为简便计,令哈密尔顿函数为第十一页,共五十一页,2022年,8月28日、δJx、δJw、δJz分别是由于tf、x、w、z于是J1可写成(10)现在求增广性能泛函J1的一次变分(11)式中作微小变化所引起的J1的变分。
第十二页,共五十一页,2022年,8月28日(12)第十三页,共五十一页,2022年,8月28日第十四页,共五十一页,2022年,8月28日注意到(13)故第十五页,共五十一页,2022年,8月28日(14)(15)第十六页,共五十一页,2022年,8月28日把式(12)~式(15)代入式(11),最后得第十七页,共五十一页,2022年,8月28日由于δtf、δxT(tf)、δx、δw、δz都是任意的,于是由δJ1=0可得增广性能泛函取极值的必要条件,是下列各关系式成立。(16)第十八页,共五十一页,2022年,8月28日1)欧拉方程(17)(18)(19)即即第十九页,共五十一页,2022年,8月28日2)横截条件(22)(21)(20)(23)第二十页,共五十一页,2022年,8月28日将代入式(17),并注意到,便得到1)欧拉方程(24)(25)(26)第二十一页,共五十一页,2022年,8月28日2)横截条件(27)(28)(29)(30)第二十二页,共五十一页,2022年,8月28日对上列方程稍作分析可知:1)由式(24)看出,只有当g不含x时,才有(31)与通常的伴随方程一致。第二十三页,共五十一页,2022年,8月28日2)式(18)和式(19)说明和均为常数,又由式(22)和式(23)可知,它们在终端处为零,故沿最优轨线,恒有(32)第二十四页,共五十一页,2022年,8月28日3)若将代入,则得即这表明在有不等式约束情况下,沿最优轨迹这个条件已不成立。第二十五页,共五十一页,2022年,8月28日值得指出的是,式(24)~式(30)只给出了最优解的必要条件。为使最优解为极小,则还必须满足维尔特拉斯函数沿最优轨迹为非负的条件,即(33)第二十六页,共五十一页,2022年,8月28日由于沿最优轨线有和,,并且,所以上式可写成第二十七页,共五十一页,2022年,8月28日即上式表明,如果哈密尔顿函数H看成的函数,那么最优轨迹上与最优控制u*(t)相对应的H将取绝对极小值(即最小值)。这是极小值原理的一个重要结论。(34)以,代入上式,便得(35)第二十八页,共五十一页,2022年,8月28日定理设系统状态方程为(36)控制约束为终端约束为,待定(38)(37)始端条件为第二十九页,共五十一页,2022年,8月28日性能泛函为取哈密尔顿函数为则实现最优控制的必要条件是,最优控制u*、最优轨迹x*和最优协态矢量λ*满足下列关系式:(39)(40)第三十页,共五十一页,2022年,8月28日1)沿最优轨线满足正则方程(41)若g中不包含x,则为(43)(42)第三十一页,共五十一页,2022年,8月28日2)在最优轨迹上,与最优控制u*相应的函数取绝对极小值,即(44)沿最优轨迹,有(45)或第三十二页,共五十一页,2022年,8月28日3)函数在最优轨迹终点处的值决定于(47)(46)4)协态终值满足横截条件第三十三页,共五十一页,2022年,8月28日5)满足边界条件这就是著名的极小值原理。(48)第三十四页,共五十一页,2022年,8月28日下面对定理作些说明:1)定理的第一、第二个条件,即式(41)~式(44),普遍适用于求解各种类型的最优控制问题,且与边界条件形式或终端时刻自由与否无关。其中,第二个条件:说明,当u(t)与u*(t)都从容许的有界闭集U中取值时,只有u*(t)能使函数沿最优轨迹x*(t)取全局最小值。这一性质与闭集U的特性无关。第三十五页,共五十一页,2022年,8月28日将上述条件与等式约束下最优控制的必要条件作一比较,可以发现,横截条件和端点边界条件没有改变,只是这一条件不成立,代之以条件此外,协态方程也略有改变,仅当g函数中不包括x时,方程才与前面一致。第三十六页,共五十一页,2022年,8月28日第三个条件,即式(46),描述了H函数终值与tf的关系,可用于确定tf的值。在定理推导过程中看出,该条件是由于tf变动而产生的,因此当终端时刻固定时,该条件将不复存在。第三十七页,共五十一页,2022年,8月28日第四个、五个条件,即式(47)~式(48),将为正则方程式(41)~式(43)提供数量足够(2n个)的边值条件。若初态固定,其一半由x(t0)=x0提供,另一半由状态终值约束方程式(48)和协态终值方程式(47)共同提供。例如,若终态固定,这一半便由状态终值x(tf)=xf提供,而毋须再对协态终值附加任何约束条件;若的形式看,虽然也是寻求H为极小(或极大)的必要条件。但在变分法中,由u*(t)只和“接近”的u(t)作比较,所以u*(t)只能使H取得相对极小(或极大)值,甚至只能得到H的驻点条件。第三十八页,共五十一页,2022年,8月28日2)当控制矢量无界时,控制方程成立。但当控制矢量有界时,正如同一个定义在闭区间上的函数不能用导数等于零去判定它在两个端点处的极值一样,这里,不成立了,而应代之H为全局最小。从的形式看,虽然也是寻求H为极小(或极大)的必要条件。但在变分法中,由于u*(t)只和“接近”的u(t)作比较,所以u*(t)只能使H取得相对极小(或极大)值,甚至只能得到H的驻点条件。第三十九页,共五十一页,2022年,8月28日不难理解,当满足变分法应用条件时,用求解控制向量无界时的泛函极值问题只是最小值原理应用的一个特例。第四十页,共五十一页,2022年,8月28日3)最优控制u*(t)保证哈密尔顿函数取全局最小值,所谓“极小值原理”一词正源于此。在证明这一原理中,如果定义λ与H的符号恰好与上面相反,,可得结论因此,在有些文献中亦称“极大值原理”。第四十一页,共五十一页,2022年,8月28日4)极小值原理只给出了最优控制的必要条件,并非充要条件。可以这样说,凡不符合极小值原理的控制必不是最优控制;凡符合极小值原理求得的每个控制,还只是最优控制的候选函数,至于到底哪个是最优控制,还得根据问题的性质加以判断,或进一步从数学上予以证明。但是能够证明,对于线性函数,极小值原理既是泛函取最小值的必要条件,也是充分条件。此外,极小值原理没有涉及最优控制的存在性和唯一性问题。第四十二页,共五十一页,2022年,8月28日5)极小值原理的实际意义在于放宽了控制条件,解决了当控制为有界闭集时,容许控制的求解问题。它不要求对有可微性。例如,当H(u)为线性函数,或者在容许控制范围内,H(u)是单调上升(或下降)时,由极小值原理求得的最优控制在边界上,但用变分法却求不出来,因为已不适用。第四十三页,共五十一页,2022年,8月28日例1:设系统的状态方程为控制约束0.5≤u≤1,求u(t)使第四十四页,共五十一页,2022年,8月28日解:这是个终端自由的容许控制问题。1)由哈密尔顿函数可见H是的线性函数,与u无关。根据极小值原理,求H极小等效于求泛函极小,这只要使u(1-λ)为极小即可。第四十五页,共五十一页,2022年,8月28日u的上界为1,下界为0.5,因此当λ>1时应取u*(t)=1(上界)λ<1时,u*(t)=0.5(下界)
第四十六页,共五十一页,2022年,8月28日得其解为λ=-1+Ce-t当tf
=1时λ(tf
)=λ
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 施工方案点评评语(3篇)
- 服务类项目施工方案(3篇)
- 桩基础桥施工方案(3篇)
- 水泥轻质墙板施工方案(3篇)
- 洞口加筋施工方案(3篇)
- 猎头公司营销方案(3篇)
- 登山健步道施工方案(3篇)
- 粽子绘画活动方案策划(3篇)
- 荣誉聚会活动策划方案(3篇)
- 路边沟清理施工方案(3篇)
- 2026国家粮食和物资储备局招聘面试题库
- 2026年江苏苏锡常镇四市高三下学期二模英语试卷和答案
- 家庭食物中毒预防要点
- 17太空生活趣事多 课件(共19张)
- 2026秋招:重庆水务环境控股集团笔试题及答案
- 2025年黑龙江省事业单位招聘档案管理基本知识训练题及答案
- 2025年江苏苏海投资集团有限公司及下属子公司对外公开招聘工作人员57人备考题库附答案详解
- 2025江苏南京晓庄学院招聘体育专任教师2人(公共基础知识)测试题带答案解析
- DB32∕T 5267-2025 城市桥梁数字孪生监测系统设计标准
- 临时用电安全培训考试题及答案
- 急危重症患者评估
评论
0/150
提交评论