




已阅读5页,还剩168页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第4章最优控制原理与应用,最优控制的基本概念,最优控制研究的主要问题:根据已建立的被控对象的数学模型,选择一个容许的控制率,使得被控对象按照预定的要求运行,并使给定的某一性能指标达到极小值(或极大值)。从数学观点来看,最优控制研究的问题是:求解一类带有约束条件的泛函极值问题。,最优控制问题,最优控制问题的一般提法:在满足系统方程的约束条件下,在容许控制域中确定一个最优控制律,使得系统状态从已知初态转移到要求的目标集,并使性能指标达到极值。,最优控制的应用类型,I.积分型性能指标最小时间控制;最少能量控制;最少燃料控制;II.末值型性能指标III.复合型性能指标,4.1用变分法解最优控制,4.1.1泛函与变分4.1.2欧拉方程4.1.3横截条件4.1.4变分法解最优控制问题,返回主目录,在动态系统最优控制问题中,性能指标是一个泛函,性能指标最优即泛函达到极值。解决泛函极值问题的有力工具是变分法。所以下面就来列出变分法中的一些主要结果,大部分不加证明,但读者可对照微分学中的结果来理解。,4.1.1泛函与变分,如果对某一类函数中的每一个函数,有一个实数值与之相对应,则称为依赖于函数的泛函,记为,粗略来说,泛函是以函数为自变量的函数。(函数的函数),1、泛函:,先来给出下面的一些定义。,2、泛函的连续性:,则,则线性泛函是连续的,称Jx为线性连续泛函。,若对于收敛于点x0点列xn,其中x0,xn,均有则称泛函J在x0处连续。对于线性泛函Jx,若,满足下面条件的泛函称为线性泛函这里是实数,和是函数空间中的函数。,3、线性泛函:,4、自变量函数的变分:,自变量函数的变分是指同属于函数类中两个函数、之差,这里,t看作为参数。当为一维函数时,可用图4-1来表示。,图4-1自变量函数的变分,这里,是的线性泛函,是关于的高阶无穷小,则称为泛函Jx的变分。可知泛函变分就是泛函增量的线性主部。,当自变量函数有变分时,泛函的增量为,5、泛函的变分:,当一个泛函具有变分时,也称该泛函可微。和函数的微分一样,泛函的变分可以利用求导的方法来确定。定理设Jx是线性赋范空间Rn上的连续泛函,若在x=x0处Jx可微,则Jx的变分为,证明:,由于是的线性连续泛函,又因为是的高阶无穷小,,泛函变分的规则,举例:,可见,计算泛函的变分如同计算函数的微分一样。,6、泛函的极值:,若存在,对满足的一切X,具有同一符号,则称在处有极值(极大值或极小值)。,定理(变分预备定理):设是时间区间t0,t1上连续的n维向量函数,是任意的连续n维向量函数,且有,若,则必有,4.1.2欧拉方程,假定t0与tf给定,且初态与末态两端固定。(1)无约束泛函极值的必要条件定理设有如下泛函极值问题:,(1),已知x(t0)=x0 x(tf)=xf,则极值曲线应满足如下欧拉方程,(2),(3),及横截条件,于是泛函J的增量可计算如下(以下将*号省去),上式中是高阶项。,证明:与之间有如下关系,根据定义,泛函的变分是的线性主部,即,对上式第二项作分部积分,按公式,J取极值的必要条件是等于零。因是任意的,要使(3-2)中第一项(积分项)为零,必有,(5),(4)式中第二项即为结论中的式(3).,举例:利用上面的结论求得,(2)有等式约束泛函极值的必要条件定理设有如下泛函极值问题:,(6),已知x(t0)=x0,x(tf)=xf,则极值曲线应满足如下欧拉方程和横截条件,其中,为拉格朗日函数,是待定拉格朗日乘子。,4.1.3横截条件,末端时刻固定时的横截条件当tf固定时,在x(t0)=x0固定时,横截条件为如果末端状态也固定x(tf)=xf时,边界条件退化为x(t0)=x0,x(tf)=xf;当末端状态自由时,横截条件为,x(t0)=x0,x(t0)=x0,(2)末端时刻自由时的横截条件,末端受约束时,存在如下近似关系:如果末端自由,则曲线c(t)不存在。设性能指标为容许轨线x(t)与极值曲线x*(t)之间有如下关系,(7),当末端由(xf,tf)移动到时,产生如下的泛函增量,(8),将(8)右端的第二项在极值曲线泰勒展开,对上式右端的第二项分部积分,将以上结果代入(8),取增量的线性主部,得泛函的变分令,得欧拉方程和横截条件:,(9),(10),末端时刻自由、末端状态变动时的横截条件1)末端状态自由时的横截条件当x(tf)自由时,由(7)可知代入(10)可得到因为任意,所以tf自由、x(tf)自由的横截条件和边界条件为:,(11),2)末端状态受约束时的横截条件设受约束方程为x(tf)=c(tf),由(7)可知代入(11),并考虑任意,得到tf自由、x(tf)受约束的横截条件和边界条件为,(11.1),如果t0也自由、x(t0)受约束,即沿着曲线g(t)则应满足以下横截条件,(11.2),例子:求平面上给定两点A(0,1),B(1,3)间的最短弧长。若B点可沿曲线c(t)=2-t移动,求一连接A、B两点且弧长最短的曲线。对于最短弧长问题,它是泛函在两端固定条件下的变分问题,欧拉方程的解为x=at+b带入边界条件可得解x=2t+1。,(2)属于末端受约束的变分问题,其最短弧长满足与(1)相同的欧拉方程,因此x=at+b,因为初始点没有变化,所以由x(0)=1可得b=1.为了确定参数a,运用横截条件(11.1)可得解得a=1,因此可知极值曲线为.由末端约束条件,可知tf=0.5,带入弧长公式得到最短弧长,x=t+1,不同边界情况下的横截条件,4.1.4变分法解最优控制问题,系统方程为性能指标为末端状态x(tf)受约束,要求的目标集为最优控制问题是:确定最优控制u*(t)和最优曲线x*(t),使得系统(12)由已知初态x0转移到要求的目标集(14),并使性能指标(13)达到极值。,(14),(13),(12),可以利用拉格朗日乘子法将上述有约束条件的泛函极值问题化为无约束条件的泛函极值问题。,再引入一个标量函数,它称为哈密顿(Hamilton)函数,在最优控制中起着重要的作用。,(1)末端时刻固定时的最优解对于如下最优控制问题:无约束且在t0,tf上连续,.在t0,tf上,f(.),和L(.)连续可微,tf固定。最优解的必要条件为:1)x(t)和满足正则方程,2)边界条件和横截条件3)极值条件证明:构造广义泛函,分部积分则对上式取一次变分,考虑到根据泛函极值的必要条件,可得到结论。,当末端时间tf固定,末端状态x(tf)自由时,不存在目标集因此,该下的泛函极值只需将上述结论中的去掉即可。当末端时间tf固定,末端状态x(tf)固定时,正则方程不变,边界条件退化为x(t0)=x0,x(tf)=xf,系统在可控的条件下,极值条件也不变。,本例属于末端时刻固定,末端状态受约束的泛函极值问题。Hamilton函数协态方程极值条件,状态方程根据初始条件和目标条件可求出c3=c4=0,4c1-9c2=6再根据横截条件可求出c1=(1/2)c2,可求出c1与c2的值。进而获得最优解,(2)末端时刻自由时的最优解,对于如下最优控制问题:最优解的必要条件为:1)x(t)和满足正则方程,2)边界条件和横截条件3)极值条件4)在最优曲线末端的Hamilton函数满足,证明:构造广义泛函当末端由(xf,tf)移动到时,产生如下的泛函增量将上式在最优轨线展成泰勒级数并取主部,应用中值定理并考虑,可得到,将代入上式可得到令得到定理的结论。,Page562,表10-2用变分法求最优解的必要条件,例子:,解:本例属于tf自由,末端状态固定、控制无约束的泛函极值问题。,=常数,再由极值条件得由状态方程和初始条件得到利用末态条件得到最后根据末端时刻H的变化率可以求得这样,求得的最优解为,4.2极小值原理及其应用,4.2.1连续系统的极小值原理4.2.2离散系统的极小值原理4.2.3最小时间控制4.2.4最小能量控制,返回主目录,为解决控制有约束的变分问题,庞特里亚金提出并证明了极小值原理,其结论与经典的变分理论有许多相似之处,而且不要求哈密尔顿函数对控制量连续可微。,4.2.1连续系统的极小值原理末端自由时的极小值原理定理对于如下定常系统、末值型性能指标、末端自由、控制受约束的最优控制问题式中为任意分段连续函数;末端状态自由;末端时刻固定或自由。假设f(x,u)和都是自变量的连续可微函数,且在有界集上f(x,u)对变量x满足,则对于最优解u*,x*,tf*,必存在非零的,使如下必要条件成立:正则方程其中边界条件与横截条件极小值条件4)沿最优轨线哈密尔顿函数变化率(tf自由时用),极小值原理与经典变分法的区别:,容许控制条件放宽。极小值条件对通常的控制约束均适用。最优控制使哈密顿函数取全局极小值。当满足经典变分法的应用条件时,其极值条件是极小值原理中极值条件的特例。极小值原理不要求哈密顿函数对控制向量的可微性。,例子:解:已知由协态方程可得到,由横截条件解出由极小值条件由于可得到,定理对于如下时变系统、末值型性能指标、末端自由、控制受约束的最优控制问题式中末端时刻固定或自由,假设同前,则对于最优解u*,x*,tf*,必存在非零的,使如下必要条件成立:正则方程其中,边界条件与横截条件极小值条件4)沿最优轨线哈密尔顿函数变化率(tf自由时用),于是该问题就变成了如下定常问题:,利用定常系统的结论,可知协态方程为即,(17),(16),横截条件为即极小值条件为将式(16)代入可得即得结论3)。沿最优轨线哈密尔顿函数变化率将(18)代入可得到本定理的结论4)。,(18),定理对于如下定常系统、积分型性能指标、末端自由、控制受约束的最优控制问题式中末端时刻固定或自由,假设同前,则对于最优解u*,x*,tf*,必存在非零的,使如下必要条件成立:正则方程其中,边界条件与横截条件极小值条件4)沿最优轨线哈密尔顿函数变化率(tf自由时用),于是该积分型问题就变成了如下末值型问题:,把上面两个式子代入协态方程,可得,因此由横截条件可知因为,上式可表示为由(19)可得,(19),则哈密尔顿函数为将它代入(19)可得从而也得到了极值条件3)和最优轨线末端应满足条件4)。,解:该题属于定常系统、积分型性能指标、tf固定、末端自由、控制受约束的最优控制问题。令,由协态方程解得再由横截条件可以求出c=e。显然,当时u*(t)产生切换,由可以解出=0.307,因此将u*代入状态方程并利用初值条件可得到最优轨线为,(2)末端受约束时的极小值原理定理对于如下定常系统、末值型性能指标、末端受约束、控制受约束的最优控制问题式中末端时刻固定或自由,假设同前,则必存在非零的,使如下必要条件成立:,正则方程其中边界条件与横截条件极小值条件4)沿最优轨线哈密尔顿函数变化率(tf自由时用),定理对于如下时变系统、末值型性能指标、末端受约束、控制受约束的最优控制问题式中末端时刻固定或自由,假设同前,则必存在非零的,使如下必要条件成立:,正则方程其中边界条件与横截条件极小值条件4)沿最优轨线哈密尔顿函数变化率(tf自由时用),4.2.2离散系统的极小值原理末端约束时的离散极小值原理定理设离散系统状态差分方程为性能指标为式中N固定。假设f(.),和L(.)都是自变量的连续可微函数,末端状态受如下目标集约束,则对于最优序列u*,x*,必存在非零的,使如下必要条件成立:差分方程其中边界条件与横截条件极小值条件,若u(k)无约束,则极值条件为,(2)末端自由时的离散极小值原理定理设离散系统状态差分方程为性能指标为式中N固定。假设同前,末端状态自由,则对于最优序列u*,x*,必存在非零的,使如下必要条件成立:,差分方程其中边界条件与横截条件极小值条件,若u(k)无约束,则极值条件为,该题属于控制无约束问题,构造由协态方程可得到由极值条件,得到将u*(k)代入状态方程并利用边界条件可得到,4.2.3最小时间控制最小时间的控制问题设线性定常系统完全可控,求满足下列不等式约束的容许控制:使系统从初始状态x(0)=x0转移到x(tf)=0,并使性能指标极小,其中tf自由。,(2)正常情况与奇异情况构造根据极小值条件,可得则设可知,(20)可表示为下式,(20),(3)奇异性的充要条件定理设矩阵式中bj中为矩阵B的列向量,当且仅当m个Gj矩阵中至少有一个是奇异矩阵,上述最优问题是奇异的。定理上述问题是正常的,当且仅当,(3)Bang-Bang控制定理对上述问题,若系统是正常的,则最优解的必要条件是,正则方程其中边界条件极小值条件,4)沿最优轨线哈密尔顿函数变化率(tf自由时用),4)经验证系统可控,因此系统正常。可用上述定理求解。由协态方程得取u*=1,可以求得系统的解,并消去变量t可得到最优轨线方程,则满足末态要求的最优轨线方程可表示为取u*=-1,也可得到满足末态要求的最优轨线方程曲线组成曲线,称为开关曲线,表示为开关曲线将相平面分成两部分R+和R-,则时间最优控制为,4.2.4最小能量控制设线性定常系统求满足下列不等式约束的容许控制:使系统从初始状态x0转移到x(tf)=xf,并使性能指标极小,其中tf固定。,构造定义开关向量函数由协态方程可得则开关向量可表示为,其分量为则将上式代入哈密尔顿函数,可得若uj(t)无约束,则,解出由控制约束条件可得出下面的最优控制律,解:构造,则最优控制律应满足由协态方程可解出,因为末端固定,不能由横截条件确定c1,c2,这里采用试探法。通常情况下,如果使最小能量控制问题的控制量较小,首先选取线性最优控制函数,即将上式代入状态方程解得根据初始条件可得c3=c4=0。根据末态条件,可得,根据哈密尔顿函数沿最优轨线的变化率得将u(tf),x1(tf)和x2(tf)代入上式可得c1-(c2-c1tf)2=0。综合以上方程,可以得出,因此,最优控制为经检验在0,tf区间上,满足u(tf)t0)和相应状态x(t1),u*(t)、x*(t)仍是该系统的最优控制和最优轨线。,(2)动态规划的基本递推方程问题:设N级决策过程的动态方程为式中,控制决策约束u(k),k=0,1,2,N-1;代价函数(性能指标)为假设f(.)和L(.)连续,L(.)正有界。求最优控制序列u(0),u(1),u(N-1),使代价函数极小。,(35),说明:上述问题中,k表示N级决策过程中的阶段变量,x(k)表示第k+1级的初始状态,u(k)表示第k+1级采用的控制向量。问题中的假设是为了保证最优控制序列的存在。设有N-k级决策过程,式中,j=k,N-1,u=u(k),u(N-1).则始自第k级任一容许状态x(k)的最小代价为上式中右端第一项是第k级所付出的代价;第二项是从第k+1级到第N级的代价和。因此式中求极小的运算分,为两部分:在本级决策u(k)作用下求极小,以及在剩余决策序列u(k+1),u(N-1)作用下求极小,则上式变为,(36),根据最优性原理,如下关系成立将上式代入(36)得到动态规划基本递推方程利用上式求解最优控制序列时,从过程的最后一项开始,逐级逆向递推:首先令k=N-1则由式(37)可得到,(37),式中J*xN,N表示代价函数中的末项值。对于(35)问题,代价函数中无末值项,J*xN,N=0,故式(38)为单级最优决策问题。令k=N-2,则由式(37)可得到式中J*x(N-1),N-1已由式(38)确定,因此上式也是一个单级最优决策问题。,(38),根据(37)逆向逐级递推,最后可以得到J*x(0),0.最后一步的递推解及最优策略正是我们要求的最优解。,式中的状态及控制均不受约束。求最优控制序列u*(0),u*(1),u*(2),使代价函数极小。,解:本题属于N=3级最优决策问题。根据递推方程(37)令k=2根据代价函数的末值项及系统方程,有所以因为u(k)无约束,令可得,令k=1可得,令k=0可得,代入已知的x(0),按正向顺序求出因此最优控制、最优轨线及最优代价为,采用离散动态规划方法,可以方便地求出控制与状态变量均有约束时离散系统的最优控制问题。离散最优控制问题的动态规划解设非线性离散系统的状态差分方程为其中,k=0,1,N-1.代价函数为求最优控制序列u*(k),使代价函数最小。,4.4.2离散动态规划,(39),根据动态规划的基本递推方程,分以下步骤进行求解:求第N级最优控制u*(N-1)求出,求第N-1级最优控制u*(N-2)求出,求第k+1级最优控制u*(k)求出,求第1级最优控制u*(0)求出,再由已知初值x(0),顺序求出u*(0),x*(1),u*(N-1),x*(N-1).,解:本题为N=4级最优控制问题。令k=3,令k=2,令k=1,令k=0,最优解为:,4.4.3连续动态规划,连续系统的最优控制问题设连续系统的状态方程为性能指标为,控制u(t)有界;在t0,tf上,f(.),L(.)连续且可微;并假设以t为初始时刻,tt0,tf,x(t)为初始状态时,函数J(x,t)连续,且对x(t)和t有连续的一阶和二阶偏导数。求在容许控制域中,确定最优控制u*(t),使性能指标最小。为了求上述问题的最优解,除了可以采用极小值原
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 5.1 原子核的组成 教学设计 (1)-2023-2024学年高二下学期物理人教版(2019)选择性必修第三册
- 智能制造背景下前围板加强板自动化装配的工艺瓶颈与质量控制策略
- 智能制造技术如何实现0.5%浓度口服液灌装环节的全程可追溯性
- 智能刮垢系统多模态传感器的认知偏差校正模型
- 智能传感器网络在井式炉快速响应中的时空同步难题
- 新能源电池隔膜分切工艺与电极涂布设备参数耦合控制难题
- 新型复合材料在分体坐便器密封系统中的失效机理与成本控制难题
- 文化遗产数字化载体中机械计时模块的伦理边界与技术创新
- 2025年中国易水砚数据监测报告
- 5.2 分式的基本性质说课稿-2025-2026学年初中数学浙教版2012七年级下册-浙教版2012
- 反恐C-TPAT程序文件整套(通用)
- 大学通用俄语1
- 液化气站年度安全教育培训计划及考试试题
- 大陆法系和英美法系的比较优质课件
- 智能纤维案例
- 金蝶云星空+V7.5-产品培训-电商与分销-返利管理
- 甘肃省嘉峪关市辅警招聘考试真题《公共基础知识》含答案
- 人教版:生命生态安全六年级上册教案
- 解除合同协议书简单版通用版(2篇)
- GB/T 25070-2010信息安全技术信息系统等级保护安全设计技术要求
- GB/T 22365-2008纸和纸板印刷表面强度的测定
评论
0/150
提交评论