变分法在最优控制中的应用_第1页
变分法在最优控制中的应用_第2页
变分法在最优控制中的应用_第3页
变分法在最优控制中的应用_第4页
变分法在最优控制中的应用_第5页
已阅读5页,还剩42页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

关于变分法在最优控制中的应用具有等式约束条件下的变分问题

(1/10)3.1具有等式约束条件下的变分问题

具有等式约束条件下,多个宗量函数的泛函极值问题可表示如下。等式约束变分问题

寻找一条连续可微的极值曲线,使性能泛函

达到极值,极值曲线

x(t)满足微分方程形式的等式约束式中,为m维(m

n)关于t,

x和的非线性向量函数。第2页,共47页,2024年2月25日,星期天具有等式约束条件下的变分问题

(2/10)这里,极值曲线x(t)除满足边界条件和古典变分学中规定的连续可微条件外,还须满足该等式约束条件。由于动态系统的状态方程可归为等式约束,因此该等式约束变分问题是研究最优控制的基础。下面就给出并证明处理等式约束变分问题的等式约束变分定理。第3页,共47页,2024年2月25日,星期天具有等式约束条件下的变分问题

(3/10)—定理4定理4(等式约束变分定理)

如果n维向量函数x(t)能使等式约束变分问题取极值,那么,必存在待定的m维拉格朗日乘子向量函数

(t),使泛函达到无条件极值,即极值曲线x(t)是上述泛函所满足的欧拉方程和等式约束条件(47)的解,其中第4页,共47页,2024年2月25日,星期天具有等式约束条件下的变分问题

(4/10)引进拉格朗日乘子可以将泛函的条件极值问题化为一个无条件的极值问题。引入该定理的作用,仅仅是表明泛函J在等式约束条件下的极值曲线x(t),同时使得泛函J和J1达到无条件极值。在后面还要详细讲解具有约束条件下求解极值问题的泛函变分问题。第5页,共47页,2024年2月25日,星期天具有等式约束条件下的变分问题

(5/10)—例7上述欧拉方程和约束条件共有n+m个方程,恰好可以解出n+m个未知函数x(t)和

(t)。通过边界条件确定x(t)和

(t)中的积分常数。随着终端条件的不同,边界条件也不同。在2.4节和2.5节所讨论横截条件就能解决这个问题。例6

火箭在自由空间里的运动作用可用下列微分方程描述式中,u(t)为推力;

(t)为角位移。第6页,共47页,2024年2月25日,星期天具有等式约束条件下的变分问题

(6/10)令x1(t)=

(t),x2(t)=(t),可建立状态方程如下试求控制函数u(t),使系统从初始状态经过t=2s转移到状态空间原点,即且使如下性能指标取极小。第7页,共47页,2024年2月25日,星期天具有等式约束条件下的变分问题

(7/10)解该问题属于终端固定的极值问题。选择向量拉格朗日乘子函数

(t)=[

1(t),

2(t)]

,由定理4,利用拉格朗日乘子法可得如下辅助泛函指标式中,式中状态变量x(t)、控制函数u(t)和向量拉格朗日乘子函数

(t)都为该泛函的宗量。在一般形式中没有宗量u(t),实际上,我们可以把u(t)和x(t)一样来处理,比如,在本例中可以定义u(t)=x3(t)。第8页,共47页,2024年2月25日,星期天具有等式约束条件下的变分问题

(8/10)那么,这些泛函的宗量必须满足如下欧拉方程第9页,共47页,2024年2月25日,星期天具有等式约束条件下的变分问题

(9/10)联立求解上述欧拉方程,可得第10页,共47页,2024年2月25日,星期天具有等式约束条件下的变分问题

(10/10)利用边界条件可解得因此,最优控制函数和状态的最优轨线第11页,共47页,2024年2月25日,星期天末态时刻固定、末态无约束的最优控制问题(1/12)3.2末态时刻固定、末态无约束的最优控制问题这一节着重讨论末态不受约束的最优控制问题。所谓末态不受约束,是指末态x(tf)可在Rn空间中取任何值,即目标集为整个状态空间。因此,该问题可描述如下。末态无约束最优控制问题

求一容许控制u(t)

U,t

[t0,tf],在末态时刻tf固定,状态x(tf)无约束,初始状态x(t0)=x0以及被控系统等约束条件下,使如下复合型性能泛函指标达到最小值。第12页,共47页,2024年2月25日,星期天末态时刻固定、末态无约束的最优控制问题(2/12)对该最优控制问题,若将动态系统的状态方程改写成等式约束条件则可根据等式约束变分定理(定理4)求解该泛函极值问题,两问题只是边界条件不同而已。引入拉格朗日乘子向量函数

(t),将等式约束条件和原有的性能指标泛函结合成一个新的泛函泛函J1的极值问题与原泛函J的极值问题等价。第13页,共47页,2024年2月25日,星期天末态时刻固定、末态无约束的最优控制问题(3/12)为方便起见,定义一标量函数如下该标量函数H称为哈密顿(Hamilton)函数。因此,泛函J1可记为。第14页,共47页,2024年2月25日,星期天末态时刻固定、末态无约束的最优控制问题(4/12)求泛函J1的极值问题,可以直接用欧拉方程(49)来求得极值条件,并且通过边界条件确定由极值条件得到方程解的积分常数,如例6中,边界条件为系统起点和终点状态。后面将会给出不同情况下的边界条件。当然在确定泛函J1的极值条件时,不是一定要利用欧拉方程(49)来求解,可以根据实际情况进行必要的简化。就泛函J1而言,其宗量有以及u(t)和

(t);前面已经指出,不必对宗量

(t)变分,因为对

(t)的变分结果就是约束条件(系统状态方程)。第15页,共47页,2024年2月25日,星期天末态时刻固定、末态无约束的最优控制问题(5/12)考虑到初始状态(t0,x(t0)),末态时刻tf固定以及x(tf)自由,泛函J1对其所有的可变宗量的一阶变分为当选择

(t)满足时,可惟一确定拉格朗日乘子函数

(t)。于是,泛函J1的一阶变分可变为第16页,共47页,2024年2月25日,星期天末态时刻固定、末态无约束的最优控制问题(6/12)根据泛函极值的必要条件

J1=0,考虑到变分

u(t)的任意性,由变分学的基本预备定理可得联立上述方程以及动态系统的状态方程和初始状态条件x(t0)=x0,可解得最优控制函数u*(t)、最优状态轨线x*(t)和适当的拉格朗日乘子函数

(t)。上述结果可归纳成如下定理。第17页,共47页,2024年2月25日,星期天末态时刻固定、末态无约束的最优控制问题(7/12)—定理5定理5(末态无约束最优控制定理)

末态无约束最优控制问题的最优控制函数u*(t),最优状态轨线x*(t)和适当选择的拉格朗日乘子函数

(t)须满足如下条件:1)

规范方程2)

边界条件3)

极值条件第18页,共47页,2024年2月25日,星期天末态时刻固定、末态无约束的最优控制问题(8/12)在末态无约束最优控制定理的结论中,由上述微分方程以及边界条件可惟一确定出最优状态轨线x*(t)和适当选择的拉格朗日乘子函数

(t)。上述关于x(t)和

(t)的微分方程通常被称为规范方程,其中

(t)的微分方程又称为协态方程(或共轭方程,伴随方程),相应地,拉格朗日乘子函数

(t)又称为协态变量或共轭变量。极值条件

H/u=0是一代数方程,由它联立规范方程的解可求得具体的最优控制函数u*(t)和最优状态轨线x*(t)。第19页,共47页,2024年2月25日,星期天末态时刻固定、末态无约束的最优控制问题(9/12)下面讨论哈密顿函数的一个重要性质。哈密顿函数对时间t的全导数为考虑到规范方程,则有再考虑到极值条件

H/u=0,于是哈密顿函数对时间t的全导数可表示为第20页,共47页,2024年2月25日,星期天末态时刻固定、末态无约束的最优控制问题(10/12)—例7上式表明,沿最优轨线哈密顿函数H对时间的全导数等于对时间的偏导数。因此,当哈密顿函数H不显含时间变量t时,则有H(t)=常数t

[t0,tf]例7

已知被控系统为求最优控制u*(t)使如下性能指标泛函取极小。第21页,共47页,2024年2月25日,星期天末态时刻固定、末态无约束的最优控制问题(11/12)解这是一个具有tf固定,x(tf)自由的终端约束的极值问题。构造哈密顿函数如下,由极值条件

H/u=0可解得u=-

。将其代入规范方程,可得并满足如下边界条件x(t0)=x0

(tf)=Cx(tf)从而解得第22页,共47页,2024年2月25日,星期天末态时刻固定、末态无约束的最优控制问题(12/12)式中,tf为某一确定的常数。将u*(t)代入哈密顿函数H得其中(t)为常数。第23页,共47页,2024年2月25日,星期天末态时刻和末态固定的问题

(1/5)3.3末态时刻和末态固定的问题

对末态的要求不同将导致最优控制问题的结论不同。上面讨论了无末态约束的问题,这一小节将研究末态时刻tf和末态x(tf)固定的最优控制问题。由于末态时刻tf和末态x(tf)已固定,即x(tf)=xf,因此,性能指标泛函中的末值项S(x(tf),tf)就没有存在的必要。在这种情况下,最优控制问题的性能指标泛函为如下积分型泛函第24页,共47页,2024年2月25日,星期天末态时刻和末态固定的问题

(2/5)因此,该最优控制问题描述如下。末态固定最优控制问题对于被控系统(51),始端状态(t0,x(t0))和末态(tf,x(tf))固定时的性能指标泛函(68)极小的最优控制问题。与前面的推导过程类似,考虑到末值项S(x(tf),tf)=0,辅助泛函J1可定义为就泛函J1而言,其宗量有以及u(t)和

(t)。前面已经指出,不必对宗量

(t)变分,因为对

(t)的变分结果就是系统状态方程。第25页,共47页,2024年2月25日,星期天末态时刻和末态固定的问题

(3/5)因此,考虑到始端和末端固定,即

x(tf)=

x(t0)=0,泛函J1对其所有宗量的一阶变分为根据泛函极值的必要条件

J1=0,同样可以导出第26页,共47页,2024年2月25日,星期天末态时刻和末态固定的问题

(4/5)当x(tf)固定,即

x(tf)=0时,虽然变分

u(t)不再是任意的。但x(tf)固定是相对的,其值的确定具有任意性,因此,末态x(tf)固定时的最优控制问题的极值条件仍然为同上一节末态时刻tf固定,末态x(tf)无约束的变分问题相比,边界条件在这里被取而代之的是x(tf)=xf。综合上述结论,有如下关于末态固定最优控制问题的定理。第27页,共47页,2024年2月25日,星期天末态时刻和末态固定的问题

(5/5)—定理6定理6(末态固定最优控制问题)

末态固定最优控制问题的最优控制函数u*(t)、最优状态轨线x*(t)和适当选择的拉格朗日乘子函数

(t)在边界条件x(t0)=x0

x(tf)=xf

下须满足规范方程以及极值条件第28页,共47页,2024年2月25日,星期天末态时刻固定、末态受约束的问题(1/10)3.4末态时刻固定、末态受约束的问题本小节讨论末态时刻tf固定,末态x(tf)受等式约束的最优控制问题。该问题可描述为如下:末态约束最优控制问题对于被控系统,末态时刻tf固定,末态x(tf)受等式g(x(tf),tf)=0约束,如下复合型性能指标泛函取极小的最优控制问题。第29页,共47页,2024年2月25日,星期天末态时刻固定、末态受约束的问题(2/10)所谓末态约束,即末态只允许在末端流形(73)上变化。上述约束条件中向量函数g(x(tf),tf)的维数为p,为使该最优控制问题的解存在,当性能指标泛函中L=0时,p

n-1;当L≠0时,p

n。上述最优控制问题与3.2所讨论的末态x(tf)无约束的问题相比,只是增加了末态约束条件(73)。对该约束条件,可引入待定拉格朗日乘子向量

=[

1,

2,…,

p]

,定义如下新的辅助泛函式中,哈密顿函数H的定义与前面一致。g(x(tf),tf)=0(73)第30页,共47页,2024年2月25日,星期天末态时刻固定、末态受约束的问题(3/10)若令则泛函J1可表示为与3.2所讨论的末态x(tf)无约束的问题一样,可得规范方程、极值条件和边界条件。其中边界条件为第31页,共47页,2024年2月25日,星期天末态时刻固定、末态受约束的问题(4/10)—定理7泛函J1对其宗量的变分结果是x(tf)所满足的等式约束条件g(x(tf),tf)=0,所以,在求泛函J1的变分

J1时,和不需要对变分一样,也不需要对

(t)的变分。综上所述,末态时刻tf固定、末态x(tf)受约束的最优控制问题的结论可以归纳为以下定理。定理7(末态约束最优控制定理)末态约束最优控制问题的最优控制函数u*(t)、最优状态轨线x*(t)和适当选择的拉格朗日乘子函数

(t)在边界条件下满足规范方程(61)~(62)以及极值条件(64)。第32页,共47页,2024年2月25日,星期天末态时刻固定、末态受约束的问题(5/10)从定理7可知,末端受约束不改变该问题求解中的规范方程,只影响边界条件。与2节相比,增加了边界条件中的末态条件,而且引入了拉格朗日乘子向量

,其变量数和末态受约束条件个数相等。当复合型性能指标泛函中末值型指标S(x(tf),tf)=0时,边界条件可记为第33页,共47页,2024年2月25日,星期天末态时刻固定、末态受约束的问题(6/10)由于

g

(x(tf),tf)/

x(tf)为最优轨线的末端约束流形上的方向场,即方向梯度,因此式(80)表明,在最优轨线的末端,

(tf)与末端目标集正交,即与g(x(tf),tf)=0规定的n-p维末端约束流形正交。所以,边界条件(80)常称为横截条件。而边界条件(79)表示

(tf)既不与末端目标集正交,亦不与之相切,因此,它常被称为斜截条件。最后值得指出的是,由于末态固定x(tf)=xf可以视为末端约束条件g(x(tf),tf)=0的一种特例,因此,本小节方法同样适用于上一小节的末态固定的情况。第34页,共47页,2024年2月25日,星期天末态时刻固定、末态受约束的问题(7/10)—例8例8

对被控系统试求控制函数u(t),使系统从初始状态x1(0)=0x2(0)=0经过1s转移到目标集x1(1)+x2(1)=1且使如下性能指标取极小。第35页,共47页,2024年2月25日,星期天末态时刻固定、末态受约束的问题(8/10)解

本例中末态约束条件为g(x(tf),tf)=x1(1)+x2(1)-1=0因此,相应的哈密顿函数和辅助性能指标泛函中的末值项分别为根据定理7,可得该最优控制的如下方程和边界条件第36页,共47页,2024年2月25日,星期天末态时刻固定、末态受约束的问题(9/10)第37页,共47页,2024年2月25日,星期天末态时刻固定、末态受约束的问题(10/10)由上述方程可求得如下解析解第38页,共47页,2024年2月25日,星期天末态时刻未定的问题

(1/8)3.5末态时刻未定的问题

末态时刻tf未定时,末态x(tf)又可分为自由、固定和受约束3种情况。这里仅讨论末态x(tf)受约束的情况,末态x(tf)固定和自由两种情况可以视为这一类情况的特例。此外,这种情况下的优化问题可视为前面末态时刻tf固定情况的一般化,通过本节的结论可以得到前几节的结论。第39页,共47页,2024年2月25日,星期天末态时刻未定的问题

(2/8)末态时刻未定最优控制问题对于被控系统,末态时刻tf未定,末态x(tf)受等式g(x(tf),tf)=0约束,如下性能指标泛函取极小的最优控制问题。与前面一样,引入状态约束的拉格朗日乘子函数

(t)和末态x(tf)约束的拉格朗日乘子向量

,将系统状态方程和性能指标泛函结合成如下新的辅助泛函

式中,哈密顿函数H的定义与前面一致。第40页,共47页,2024年2月25日,星期天末态时刻未定的问题

(3/8)将泛函J1中最后一个积分项进行分部积分,可得定义则泛函J1可表示为第41

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论