版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
现代控制理论最优控制第1页,共88页,2023年,2月20日,星期一6.1引言什么是最优控制?以下通过直流他励电机的控制问题来说明问题6-1电动机的运动方程为(1)其中,为转矩系数;为转动惯量;为恒定的负载转矩;希望:在时间区间[0,tf]内,电动机从静止起动,转过一定角度后停止,使电枢电阻上的损耗最小,求因为是时间的函数,E又是的函数,E是函数的函数,称为泛函。(2)第2页,共88页,2023年,2月20日,星期一采用状态方程表示,令于是(3)初始状态末值状态控制不受限制性能指标(4)本问题的最优控制问题是:在数学模型(3)的约束下,寻求一个控制,使电动机从初始状态转移到末值状态,性能指标E为最小。第3页,共88页,2023年,2月20日,星期一问题6-2对于问题6-1中的直流他励电动机,如果电动机从初始时刻的静止状态转过一个角度又停下,求控制(是受到限制的),使得所需时间最短。这也是一个最优控制问题:系统方程为初始状态末值状态≤(5)性能指标(6)最优控制问题为:在状态方程的约束下,寻求最优控制,将转移到,使J为极小。≤第4页,共88页,2023年,2月20日,星期一最优控制问题的一般性提法为系统状态方程为初始状态为其中,x为n维状态向量;
u为r维控制向量;f为n维向量函数,它是x、u和t的连续函数,并且对x、t连续可微。最优。其中是x、u和t的连续函数寻求在上的最优控制或,以将系统状态从转移到或的一个集合,并使性能指标最优控制问题就是求解一类带有约束条件的条件泛函极值问题。第5页,共88页,2023年,2月20日,星期一补充:泛函与变分法一、泛函与变分1、泛函的基本定义:如果对于某个函数集合中的每一个函数,变量J都有一个值与之对应,则称变量J为依赖于函数的泛函,记作可见,泛函为标量,可以理解为“函数的函数”例如:(其中,为在上连续可积函数)当时,有;当时,有。第6页,共88页,2023年,2月20日,星期一泛函如果满足以下条件时,称为线性泛函:1),其中c为任意常数;2)对于一个任意小正数,总是可以找到,当时,有就称泛函在处是连续的。2、泛函的变分所谓泛函的宗量的变分是指两个函数间的差。定义:设是线性赋泛空间上的连续泛函,其增量可表示为其中,是关于的线性连续泛函,是关于的高阶无穷小。则称为泛函的变分。第7页,共88页,2023年,2月20日,星期一3、泛函变分的规则1)2)3)4)泛函的变分等于第8页,共88页,2023年,2月20日,星期一定理:设是在线性赋泛空间上某个开子集D中定义的可微泛函,且在处达到极值,则泛函在处必有4、泛函的极值设是在线性赋泛空间上某个子集D中的线性连续泛函,,若在的某领域内在时,均有≥0≤0或则称在处达到极大值或极小值。第9页,共88页,2023年,2月20日,星期一欧拉方程:定理:设有如下泛函极值问题:其中,及在上连续可微,和给定,已知,,,则极值轨线满足如下欧拉方程及横截条件注意:满足欧拉方程是必要条件,不是充分条件。第10页,共88页,2023年,2月20日,星期一6.2用变分法求解最优控制问题6.2.1末值时刻固定、末值状态自由情况下的最优控制非线性时变系统状态方程为(6)初始状态(7)其中,x为n维状态向量;
u为r维控制向量;f为n维向量函数。要求在控制空间中寻求一个最优控制向量,使以下性能指标(8)沿最优轨线取极小值。(性能指标如(8)式所示的最优控制问题,是变分法中的波尔扎问题)第11页,共88页,2023年,2月20日,星期一引入拉格朗日乘子(9)将性能指标(8)式改写为其等价形式定义哈密顿函数(10)则(11)由(6)式可知为零第12页,共88页,2023年,2月20日,星期一(12)对(11)式中的第三项进行分部积分,得当泛函J取极值时,其一次变分等于零。即可以变分的量:不可以变分的量:求出J的一次变分并令其为零第13页,共88页,2023年,2月20日,星期一将上式改写成(13)由于未加限制,可以选择使上式中和的系数等于零。于是有(15)(14)(16)由于是任意的变分,根据变分法中的辅助引理,由(16)式得(17)(14)式称为伴随方程,为伴随变量,(17)式为控制方程。第14页,共88页,2023年,2月20日,星期一几点说明:1)实际上,(14)式和(17)式就是欧拉方程。(18)因为(19)如果令简记成(20)由欧拉方程得到即(21)第15页,共88页,2023年,2月20日,星期一可见(21)式和(18)式相同,(22)式和(19)式相同。因此,(14)式和(17)就是欧拉方程,而(7)式和(15)就是横截条件。(22)2)是泛函取极值的必要条件是否为极小值还需要二次变分来判断,则泛函J取极小值。第16页,共88页,2023年,2月20日,星期一3)哈密顿函数沿最优轨线随时间的变化率在最优控制、最优轨线下,有和(10)式的哈密顿函数对求偏导,结果为
由(14)式可得
因为减号两边是相等标量(行向量与列向量相乘)(23)(24)这两个等于零的式子代入(23)式,于是第17页,共88页,2023年,2月20日,星期一即哈密顿函数H沿最优轨线对时间的全导数等于它对时间的偏导数。记为则(25)对上式积分,得到(26)当哈密顿函数不显含t时,由(25)式得第18页,共88页,2023年,2月20日,星期一初始条件例6-1系统状态方程为性能指标试求最优控制,使J取极小值。解哈密顿函数由伴随方程因为第19页,共88页,2023年,2月20日,星期一由控制方程即将代入状态方程解为当时,代入上式,求得,所以当时,最优性能指标为第20页,共88页,2023年,2月20日,星期一6.2.2末值时刻固定,末端状态固定情况下的最优控制非线性时变系统状态方程为(27)初始状态(28)末值状态(29)性能指标(30)寻求最优控制,在内,将系统从转移到,同时使性能指标J取极小值。(性能指标如(30)式所示的最优控制问题,是变分法中的拉格朗日问题)第21页,共88页,2023年,2月20日,星期一引入哈密顿函数其中于是因为对上式右边第2项进行分部积分,可以得到上式中可以变分的量:不可以变分的量:第22页,共88页,2023年,2月20日,星期一令性能指标J的一次变分等于零,得(31)选择,使其满足(32)则(33)在末端状态固定情况下,不是任意的。只有在系统能控的情况下,才有控制方程第23页,共88页,2023年,2月20日,星期一例6-2问题6-1的系统状态方程为末值状态初始状态性能指标设最优控制问题就是在状态方程的约束下,寻求,使转移到,并使J取极小值。第24页,共88页,2023年,2月20日,星期一解根据能控性判据知,该系统是能控的1)哈密顿函数为2)由控制方程得到即第25页,共88页,2023年,2月20日,星期一3)由伴随方程,得到(,为积分常数)4)由状态方程得(,为积分常数)第26页,共88页,2023年,2月20日,星期一根据边界条件,确定积分常数,得代入和它们的曲线如图所示(图中,实线是理论上的变化,虚线是实际的轨线。)第27页,共88页,2023年,2月20日,星期一6.2.3末值时刻自由情况下的最优控制非线性时变系统状态方程为初始状态初始时刻固定,末值时刻是自由的。自由,性能指标(34)寻求最优控制以及,使性能指标J取极小值。为了求出最优控制,引入哈密顿函数其中第28页,共88页,2023年,2月20日,星期一于是可以变分的量不能变分的量上式中H为的简化表示对上式中进行分部积分,成为(35)第29页,共88页,2023年,2月20日,星期一应当注意,末值时刻自由时,不等于或上式代入(35)式第30页,共88页,2023年,2月20日,星期一性能指标取极值时,必有(36)选择使其满足(37)(38)由于、是任意的,可得(39)第31页,共88页,2023年,2月20日,星期一(40)(41)而例6-3系统的状态方程为性能指标求最优控制和末值时刻,使性能指标泛函取极小值。解经判断系统是能控的1)构造哈密顿函数第32页,共88页,2023年,2月20日,星期一2)由控制方程,得或3)由伴随方程4)将代入状态方程解为其中,、为积分常数,由,确定,得第33页,共88页,2023年,2月20日,星期一5)由于自由,,得到或解得第34页,共88页,2023年,2月20日,星期一6.3极小值原理及其在快速控制中的应用6.3.1问题的提出用变分法求解最优控制时,认为控制向量不受限制。但是实际的系统,控制信号都是受到某种限制的。因此,应用控制方程来确定最优控制,可能出错。a)图中所示,H最小值出现在左侧,不满足控制方程。b)图中不存在第35页,共88页,2023年,2月20日,星期一6.3.2极小值原理非线性定常系统的状态方程为(42)初始时刻,初始状态,末值时刻,末端状态自由(43)性能指标为末值型性能指标(44)要求在状态方程约束下,寻求最优控制及使系统从转移到,并使J取极小值。第36页,共88页,2023年,2月20日,星期一以下就是用极小值原理解前面的问题:设为容许控制,为对应的状态轨线。为了使它们分别成为最优控制和最优轨线,存在一个向量函数,使得(45)(46)其中哈密顿函数:(47)(49)(48)和满足边界条件第37页,共88页,2023年,2月20日,星期一则哈密顿函数H相对最优控制取极小值,即(50)或者≤(51)在末值时刻是自由的情况哈密顿函数沿最优轨线随时间的变化规律:在末值时刻是固定的情况(52)(53)几点说明:1)极小值原理给出的只是最优控制应该满足的必要条件。2)极小值原理的结果与用变分法求解最优问题的结果相比,差别仅在于极值条件。4)非线性时变系统也有极小值原理。3)这里给出了极小值原理,而在庞德里亚金著作论述的是极大值原理。因为求性能指标J的极小值与求-J的极大值等价。第38页,共88页,2023年,2月20日,星期一6.3.3二次积分模型的快速控制在问题6-2中,若,,令。就是二次积分模型。其状态方程模型(54)≤1(55)系统的初始状态为(56)末值状态为(57)性能指标为(58)第39页,共88页,2023年,2月20日,星期一要求在状态方程约束下,寻求满足(55)式的最优控制,使系统从转移到,同时使J取极小值。因为在这个最优控制问题中,控制信号受限制,因此用极小值原理来求解。系统是能控的,其解存在且唯一。1)哈密顿函数为(59)2)根据极值条件(50),来确定最优控制。只能用分析的方法确定u(t),使哈密顿函数取极小值。显然,在u的限制条件下,选择u使H取得极小。有(60)或(61)第40页,共88页,2023年,2月20日,星期一3)伴随方程为如果的初始值为,,则(62)(63)在[0,]内最多变号一次,最优控制函数有以下可能的4种情况第41页,共88页,2023年,2月20日,星期一4)由状态方程可知,当时,求得消去t得或写成为了形象地表示系统的运动形态,引用相平面方法,画出相轨迹如下图所示。相轨迹为两族抛物线。第42页,共88页,2023年,2月20日,星期一从到达的相轨迹只有两条、。≤0≥0将和合起来,曲线r将相平面分成两个区域和第43页,共88页,2023年,2月20日,星期一当初始状态位于:为(+1,-1)最优轨线:当初始状态位于:为(-1,+1)曲线r常称为转移曲线或开关曲线。开关曲线方程式为也称为开关函数。最优控制为当及,≤0当及,≥0最优控制系统的结构图,如下图所示第44页,共88页,2023年,2月20日,星期一5)最优性能指标初始状态在A点:说明:通过这个最优控制问题的求解发现,最优控制与问题6-1不同。在问题6-1中,为时间的三角函数。而在这里,为时间方波函数。原因在于性能指标不同,因此也不同。因此,在说到最优控制问题时,一定要指明性能指标,即求解在什么性能指标下的最优。第45页,共88页,2023年,2月20日,星期一6.4用动态规划法求解最优控制问题右图为某小城镇交通路线图。起点站为S,终点站为F,站与站之间的里程标在图上,要求选择一条路线走法,使里程最短。这是一个最优控制问题。一种办法是将从S到F所有可能走法都列出来,并且把每种走法的里程标在各条路线上,找出最短的。6.4.1动态规划法的基本思想第46页,共88页,2023年,2月20日,星期一第47页,共88页,2023年,2月20日,星期一第二个办法:从最后一段开始,向前倒推。当倒推到某一站时,计算该站到终点站的总里程,并选择里程最少的走法。第48页,共88页,2023年,2月20日,星期一从该例看出,这种解法有两个特点:第一,它把一个复杂的问题(即:决定一条路线的选择问题)变成许多个简单的问题(即:每次只决定向上走(p)还是向下走(q)的问题),因此问题的求解变得简单容易了。不变嵌入原理的含义是:为了解决一个特定的最优控制问题,而把原问题嵌入到一系列相似的但易于求解的问题中去。对于一个多级最优控制过程来说,就是把原来的多级最优控制问题代换成一系列单级最优控制问题。第49页,共88页,2023年,2月20日,星期一6.4.2最优性原理最优性原理——在一个多级决策问题中的最优决策具有这样的性质,不管初始级、初始状态和初始决策是什么,当把其中任何一级和这一级的状态再作为初始级和初始状态时,余下的决策对此必定构成一个最优决策。将最优性原理应用到离散系统中去,系统状态方程为初始状态为性能指标为要求确定,使性能指标最优,即第50页,共88页,2023年,2月20日,星期一一般认为,第k级决策与第k级以及k以前各级状态和决策有关(64)以上函数称为策略函数如果记则对于任意级k,有(65)应该指出,最优性原理所肯定的是余下的决策为最优决策。对以前的决策没有明确的要求。第51页,共88页,2023年,2月20日,星期一6.4.3用动态规划法求解离散系统最优控制问题系统状态方程为(66)(67)(68)要求在状态方程约束下,寻求使可以受限制,也可以不受限制。第52页,共88页,2023年,2月20日,星期一例6-4线性定常离散系统的状态方程为初始状态为,性能指标为寻求最优控制序列,使(为了简单起见,设)解运用动态规划法来求解1)从最后一级开始,即第53页,共88页,2023年,2月20日,星期一2)向前倒推一级,即因为不受限制,故可以通过下式求得第54页,共88页,2023年,2月20日,星期一3)再向前倒推一级,即注意:1、对一个多级决策过程来说,最优性原理保证了全过程性能指标最小,并不保证每一级性能指标最小。但是在每考虑一级时,都不是孤立地只把这一级的性能指标最小的决策作为最优决策,而总是把这一级放到全过程中间去考虑,取全过程的性能指标最优的决策作为最优决策。2、动态规划法给出的是最优控制的充分条件,不是必要条件。这和极小值原理是不同的。由,解得)0(211)2(*xcx+=第55页,共88页,2023年,2月20日,星期一6.4.4用动态规划法求解连续系统最优控制问题非线性时变系统状态方程为(69)初始条件(70)性能指标(71)要寻求最优控制,在满足状态方程(69)的条件下,使J取极小值(72)满足条件(73)求解时,用到连续系统的最优性原理。第56页,共88页,2023年,2月20日,星期一如果对于初始时刻和初始状态来说,和是系统的最优控制和最优轨线。那么,对于和状态,它们仍是所研究的系统往后的最优控制和最优轨线。假定是存在的且是连续的并且有连续的一阶、二阶偏导数,由最优性原理可以写出(74)第57页,共88页,2023年,2月20日,星期一用类似6.4.2中的处理方法,令(75)则(74)式可以写成(76)由于对于、是连续可微的,故式(76)右边第二项可以展开成台劳级数,取一阶近似(77)第58页,共88页,2023年,2月20日,星期一而由中值定理,(76)式右边第一项可以写成(78)其中,是介于0和1之间的某一常数。将(77)、(78)式代入(76)式(79)(80)对(79)式简化,并且令(80)式称为哈密顿-贝尔曼方程,是用动态规划法求解最优控制问题的基本方程。第59页,共88页,2023年,2月20日,星期一显然有(81)方程(80)的边界条件(82)如果性能指标泛函中无末值项,则(83)注意:哈密顿-贝尔曼方程是求解最优控制问题的充分条件,不是必要条件。第60页,共88页,2023年,2月20日,星期一用动态规划法求解连续系统最优控制问题的步骤:(84)的解1)求满足在求解方程(84)时,若不受限制,则在引入哈密顿时,有如果受限,即,在确定时,只能用分析方法,使≤2)将代入(80)、(82)和(83)式,解出(85)3)将再代入(84)就得到最优控制第61页,共88页,2023年,2月20日,星期一(86)4)将(85)式代入系统状态方程可以求出最优轨线。把代入(85)式得到最优控制例6-5系统状态方程为,性能指标。≤1寻求,在状态方程约束下,J取极小值。解
1)求用分析方法,可知第62页,共88页,2023年,2月20日,星期一2)将代入哈密顿-贝尔曼方程即可以分析出是正函数,则哈密顿-贝尔曼方程可写成由于与无关,上式为一元微分方程,其通解为其中,c为积分常数,由边界条件确定为c=0
第63页,共88页,2023年,2月20日,星期一3)将代入的表达式中本例中4)将代入状态方程,可解得由此得最优性能指标第64页,共88页,2023年,2月20日,星期一6.5线性状态调节器6.5.1引言线性系统以二次型为性能指标的最优控制问题,已经在国内、外的工程实践中得到应用。原因如下:1)被控对象是线性的,最优控制问题容易求得解析解。2)线性系统最优控制的结果,可以在小信号条件下,应用于非线性系统。3)最优控制器是线性的,易于实现。4)线性、二次型性能指标的最优控制问题除了得到最优解外,还可以导出经典控制理论的一些特性。第65页,共88页,2023年,2月20日,星期一6.5.2有限时间状态调节器线性时变系统的状态方程为(87)(88)(89)寻找一个最优控制,使为极小。其中,x为n维状态向量;u为r维控制向量,且u不受限制。其中,F为对称半正定常数阵;为对称半正定时变阵。为对称正定时变阵。第66页,共88页,2023年,2月20日,星期一求解这个最优控制问题,可以用极小值原理,也可以用动态规划法。这里用极小值原理来求解。1)哈密顿函数为(90)2)伴随方程为(91)(92)3)控制方程为(93)故J取极小值第67页,共88页,2023年,2月20日,星期一4)将代入状态方程得(94)初始状态为(95)将(90)式至(95)式联立,即可即可求解这个最优控制问题。另外一种求解方式:设(96)其中,为待定的时变阵(97)(96)式对t求导,并且将(94)式代入第68页,共88页,2023年,2月20日,星期一(91)式可改写成(98)比较(97)和(98),可以得到(99)(100)(99)式称为Riccati微分方程。其边界条件为得到(101)第69页,共88页,2023年,2月20日,星期一状态反馈的闭环方程为(102)其中(103)两点说明:1)由于矩阵黎卡提微分方程的解为对称因此有个独立的非线性标量微分方程。2)最优性能指标为(104)(证明请见教材228页)第70页,共88页,2023年,2月20日,星期一例6-6系统状态方程为求最优控制,使性能指标取极小值。解矩阵的黎卡提方程为求解上面的微分方程,有第71页,共88页,2023年,2月20日,星期一其中即最优控制为由最优轨线为第72页,共88页,2023年,2月20日,星期一6.5.3无限时间状态调节器线性时变系统寻找一个最优控制,使J取极小值(105)这里产生一个问题:时,性能指标是否收敛?例如寻找最优控制,使J取极小值(106)第73页,共88页,2023年,2月20日,星期一根据分析,显然当时,J取极小值。但是是不能控的状态分量,而且是不稳定的。导致结论:该问题不存在有意义的解。如果线性时变系统(105)是能控的,无限时间状态调节器问题一定有解,并且可以通过有限时间状态调节器的解,取来获得。其结果为最优控制(107)(108)(109)最优性能指标(110)第74页,共88页,2023年,2月20日,星期一可见,无限时间状态调节器与有限时间最优调节器类似,均可以用状态负反馈构成状态闭环控制。但是反馈增益矩阵是时变的,给工程实践带来不便。卡尔曼研究了矩阵黎卡提微分方程解的各种性质,得出以下结果:线性定常系统(111)(112)(113)最优控制为(114)(115)常数阵满足如下黎卡提矩阵代数方程第75页,共88页,2023年,2月20日,星期一(114)式代入(111)式,得(116)最优轨线可以由(116)式和(114)式求出。最优性能指标(117)当这个无限时间状态调节器满足以下条件时,状态反馈增益矩阵才为常数矩阵:1)系统为线性定常系统;2)系统为能控;3)末值时刻;4)J中不含末值项,即F=0;5)Q,R为正定阵。第76页,共88页,2023年,2月20日,星期一例6-7线性定常系统的状态方程为≥0求最优控制,使J取极小值。解检验系统能控性能控。设代入(115)式黎卡提方程,解得第77页,共88页,2023年,2月20日,星期一当时,;当时,。6.5.4定常情况下状态调节器的稳定性用李亚普诺夫第二法来研究其稳定性假设正定,所以正定。取Lyapunov函数(118)这里不加证明,给出结论:使为正定对称阵的充要条件是:能观测。其中D是任意一个使成立的矩阵。第78页,共88页,2023年,2月20日,星期一将(116)式代入(119)式,并且考虑(11
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 狂犬病健康宣教
- 神态描写阅读方法指导
- 上台如何介绍自己演讲
- 甜蜜素检测方法答辩
- 洗胃及催吐处理方法
- 业余排球训练讲座
- 闪电自行车介绍
- 常用浏览器概述
- 吸入剂型使用方法
- 老员工工作总结
- 2025至2030中国溶剂回收行业发展趋势分析与未来投资战略咨询研究报告
- 2025重庆市设计院有限公司招聘29人笔试参考题库附带答案详解析集合
- 2024年中级注册安全工程师《金属非金属矿山安全》真题及答案
- 临床用药解读-消化系统常见疾病的诊疗进展及处方审核要点
- 《结直肠癌的治疗进展》课件
- GB/T 45637-2025电动牙刷性能测试方法
- 菜鸟驿站合伙合同协议
- 药品市场交接协议书范本
- 法官入额考试试题及答案
- 高危儿的家庭护理
- 2025-2030中国潜油电泵(ESP)行业市场发展趋势与前景展望战略研究报告
评论
0/150
提交评论