ppt第三章变分法泛函极值问题_第1页
ppt第三章变分法泛函极值问题_第2页
ppt第三章变分法泛函极值问题_第3页
ppt第三章变分法泛函极值问题_第4页
ppt第三章变分法泛函极值问题_第5页
已阅读5页,还剩102页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第三章第三章 用变分法解最优控制用变分法解最优控制 泛函极值问题泛函极值问题本章主要内容3.1 变分法基础3.2 无约束条件的泛函极值问题 3.3 有约束条件的泛函极值动态系 统的最优控 制问题3.4 小结ft 在动态系统最优控制问题中,性能指标是一个泛函,性能指标最优即泛函达到极值。解决泛函极值问题的有力工具是变分法。所以下面就来列出变分法中的一些主要结果,大部分不加证明,但读者可对照微分学中的结果来理解。3.1 变分法基础变分法基础 如果对某一类函数 中的每一个函数 ,有一个实数值 与之相对应,则称 为依赖于函数 的泛函,记为)(tXJ)(tXJ)(tX)(tXJJ 粗略来说,泛函是以函数

2、为自变量的函数。1、泛函:先来给出下面的一些定义。0 若对任给的 ,存在0)()(tXtX当时,就有)()(XJXJ则称 在 处是连续的。 )(XJX2、泛函的连续性: 满足下面条件的泛函称为线性泛函 这里 是实数, 和 是函数空间中的函数。 XJXJ)()()(YJXJYXJXY3、线性泛函:4、自变量函数的变分: 自变量函数 的变分 是指同属于函数类 中两个函数 、 之差)(tXX)(tX)(1tX)(2tX)()(21tXtXX 这里, t 看作为参数。当 为一维函数时, 可用图3-1来表示。)(tXX图3-1自变量函数的变分 这里, 是 的线性泛函,若 时,有 ,则称 是泛函 的变分。

3、 是 的线性主部。XXJ,X0X0XXJ, XJJJ 当自变量函数 有变分 时,泛函的增量为 )(tXXXXXJ, XJXXJJ 5、泛函的变分:6、泛函的极值: 若存在 ,对满足的 一切X, 具有同一符号,则 称 在 处有极值。0*XX)()(*XJXJ)(XJ*XX 定理: 在 处有极值的必要条件是对于所有容许的增量函数 (自变量的变分),泛函 在 处的变分为零)(XJ*XX X)(XJ*X*(,)0J XX为了判别是极大还是极小,要计算二阶变分 。但在实际问题中根据问题的性质容易判别是极大还是极小,故一般不计算 。J2J23.2 无约束条件的泛函极值问题无约束条件的泛函极值问题3.2.1

4、 泛函的自变量函数为标量函数的情况泛函的自变量函数为标量函数的情况 为简单起见,先讨论自变量函数为标量函数 (一维)的情况。我们要寻求极值曲线 ,使下面的性能泛函取极值)()(*txtxfttdtttxtxFJ0),(),((3-1))()()(*txtxtx)()()(*txtxtx于是泛函J 的增量 可计算如下(以下将*号省去)JdttxxFtxxxxFJftt,0022() ,()fttFFxxoxxdtxx上式中 是高阶项。22() ,() oxx为此,让自变量函数 、 在极值曲线 、 附近发生微小变分 、 ,即)(tx)(tx )(*tx)(*tx xx 根据定义,泛函的变分 是 的

5、线性主部,即JJfttdtxxFxxFJ0fffttttttvduuvudv000对上式第二项作分部积分,按公式可得ffttttxxFxdtxFdtdxFJ00)((3-2) J取极值的必要条件是 等于零。因 是任意的,要使(3-2)中第一项(积分项)为零,必有Jx0)(xFdtdxF(3-3)上式称为欧拉拉格朗日方程。(3-2)式中第二项为零的条件要分两种情况来讨论: 1、 固定端点的情况 这时 ,它们不发生变化,所以 。而(3-2)中第二项可写成ffxtxxtx)(,)(000)()(0ftxtx当 时,(3-4)式自然为零。0)()(0ftxtx)()()()(000txxFtxxFxx

6、Fttfttttff(3-4)2、自由端点的情况 这时 和 可以发生化, ,而且可以独立地变化。于是要使(3-2)中第二项为零,由(3-4)式可得)(0tx)(ftx0)(, 0)(0ftxtx0)()(00txxFtt(3-6)0)()(ftttxxFf(3-5) 因为这里讨论 是标量函数的情况, 和 也是标量,且是任意的,故(3-5)、(3-6)可化为)(ftx)(tx)(0tx(3-7)、(3-8)称为横截条件横截条件。0)()(00txxFtt(3-8)0)()(ftttxxFf(3-7) 当边界条件全部给定(即固定端点)时,不需要这些横截条件。当给定时,不要(3-8)。当给定时,不要

7、(3-7)。)(ftx)(0tx3.2.2 泛函的自变量函数为向量函数的情况泛函的自变量函数为向量函数的情况现在,将上面对 是标量函数时所得到的公式推广到 是n维向量函数的情况。这时,性能泛函为)(tx)(tXfttdttXXFJ0),(3-9)()()(21txtxtxXn)()()(21txtxtxXn(3-10)式中0)(XFdtdXFffttttTTXFXdtXFdtdXFXJ00)( 向量欧拉拉格朗日方程为nxFxFxFXF21nxFxFxFXF21(3-11)式中泛函变分由(3-2)式改为 (当 和 时)0tt ftt 0XF横截条件为(自由端点情况) 例3-11022)(dtxx

8、J 取极值的轨迹 。 )(*tx求通过点(0,0)及(1,1)且使 解 0)2(2xdtdx0 xx 即BshtAchttx)(它的通解形式为2,2tttteeshteecht 式中:这是固定端点问题,相应的欧拉拉格朗日方程为 由初始条件 ,可得A=0。0)0(x再由终端条 件 ,可得 ,1) 1 (x11 shB 1)(*shshttx因而极值轨迹为 例3-2 求使指标 1032)(dtxxJ取极值的轨迹 ,并要求 ,但对 没有限制。)(*tx0)0(*x) 1 (*x解0)32(2 xxdtd即 常数232xx于是 是常数, 则是时间的线性函数,令x xBAttx)( 由 可得 ,又终端是

9、自由的,由式(3-7)可得横截条件为0)0(x0B0)32()(121ttxxxF这是终端自由的情况。欧拉拉格朗日方程为容易验证 时, 对应局部极小;时, ,对应局部极大。0)(tx0J32)(ttx274J由上式解得 或 。 时的极值轨迹为 ; 时的极值轨迹为 。0A32A0A0)(*tx32A32)(*ttx0322 AA 即3.3 有约束条件的泛函极值有约束条件的泛函极值 动态系统的最优控制问题动态系统的最优控制问题前面讨论泛函极值问题时,对极值轨迹 没有附加任何约束条件。但在动态系统最优控制问题中,极值轨迹必须满足系统的状态方程,也就是要受到状态方程的约束。考虑下列系统)(*tXttU

10、tXfX),(),((3-13)这是综合指标。我们要求出最优控制 和满足状态方程的极值轨迹 ,使性能指标取极值。)(*tU)(*tX式中, 为 维状态向量, 为 维控制向量(这里假定 不受限制.)(tXn)(tUm( )U t否则不能用变分法求解,而要用极小值原理或动态规划法求解) 是n维连续可微的向量函数。性能指标如下:ttUtXf),(),(fttffdtttUtXFttXJ0),(),(),((3-14) 在下面的讨论中,假定初始时刻 和初始状态 是给定的,终端则可能有几种情况。我们将就几种常见的情况来讨论,即 给定, 自由和 自由, 属于一个约束集。0t00)(XtXft)(ftXft

11、)(ftX3.3.1 终端时刻终端时刻 给定,终端状态给定,终端状态 自由自由ft)(ftX)(,),(),()(21ttttnT(3-16)0)(),(tXtUXf(3-15)与有约束条件的函数极值情况类似,引入待定的n维拉格朗日乘子向量函数 将状态方程(3-13)写成等式约束方程的形式 与以前不同的是,在动态问题中拉格朗日乘子向量 是时间函数。)(t在最优控制中经常将 称为伴随变量,协态(协状态向量)或共轭状态。引入 后可作出下面的增广泛函)(t)(tfttTffadtXtUXfttUXFttXJ0),()(,),((3-17) 于是有约束条件的泛函 的极值问题化为无约束条件的增广泛函 的

12、极值问题。JaJ),(),(),(tUXftUXFtUXHT(3-18)再引入一个标量函数它称为哈密顿(Hamilton)函数,在最优控制中起着重要的作用 于是 可写成aJdtXtUXHttXJfttTffa0),(),()()()()(),(00tXttXtttXJTffTffadtXtUXHfttT0),((3-19)对上式积分号内第二项作分部积分后可得 设 、 相对于最优值 、 的变分分别为 和 )(tX)(tU)(tX)(tU)(tX)(tU因为 自由,故还要考虑变分 。)(ftX)(ftX下面来计算由这些变分引起的泛函 的变分。aJaJ)()()()(ffTffTattXtXtXJf

13、ttTTdtUHUXHX0)( 为极小的必要条件是:对任意的 、 、 ,变分 等于零。由(3-18)及(3-20)可得下面的一组关系式XU)(ftXaJaJXH(协态方程) (3-21)HX(状态方程) (3-22))()(fftXt(控制方程) (3-23)0UH(横截条件) (3-24) (3-21)(3-24)即为 取极值的必要条件,由此即可求得最优值 , , 。aJ)(*tU)(*tX)(*t(3-22)式即为状态方程,这可由 的定义式(3-18)看出,实 际解题时无需求 ,只要直接用状态方程即可,这里为形式上对称而写成(3-22)式。HH(3-21)与(3-22)一起称为哈密顿正则程

14、哈密顿正则程。 (3-23)是控制方程,它表示 在最优控制处取极值。H注意,这是在 为任意时得出的方程,当 有界且在边界上取得最优值时,就不能用这方程,这时要用极小值原理求解。U)(tU(3-24)是在 固定、 自由时得出的横截条件。当 固定时, ,就不需要这个横截条件了。横截条件表示协态终端所满足的条件。ft)(ftX0)(ftX)(ftX 在求解(3-21)(3-24)时,我们只知道初值 和由横截条件(3-24)求得的协态终端值 ,这种问题称为两点边值问题,一般情况下它们是很难求解的。)(0tX)(ft 因为 不知道,如果假定一个 ,然后正向积分(3-21)(3-24),则在 时的 值一般

15、与给定的 不同,于是要反复修正 的值,直至 与给定值的差可忽略不计为止。)(0tftt )(ft)(0t)(0t)(ft非线性系统最优控制两点边值问题的数值求解是一个重要的研究领域。对于线性系统两点边值问题的求解,则可寻找缺少的边界条件并只要进行一次积分,下面的例3-4给出了求解过程。 例3-3 设系统状态方程为 的边界条件为 。求最优控制 ,使下列性能指标 为最小。)()(tutxx)(tx0)(, 1)0(ftxx)(tuftdtuxJ02221 解 这里 、 均给定,故不需要横截条件(3-24)式。作哈密顿函数)0(x)(ftx)()(2122uxuxHxxH0uuH则协态方程和控制方程

16、为u即 故可得正则方程 )()()(ttxtx)()()(ttxt对正则方程进行拉氏变换,可得 ( )(0)( )( )sX sxX ss (3-25)( )(0)( )( )ssX ss (3-26)1)()0()(ssxsX(3-27)由(3-25)式可求得 )0()0() 1()()2(2xsss于是,解出 为)(s) 0 ()2)(2(1) 0 ()2)(2(12) 0 () 0 () 1()(2xssssssxss(3-28)代入(3-26),即得)0()(221)(22xeettt)0() 12() 12(22122ttee(3-29)反变换可求得 将(3-28)代入(3-26)可

17、得 )0()2)(2(1)0()2)(2(1)(ssxssssX)0() 12() 12(221)(22xeetxtt故 由 , 从上式可得1)0(x0)(ftxfffftttteeee2222) 12() 12()0(把 代入(3-29),可得 ,而最优控制为)(t)0(tttttttteeeeeeeettuffff22222222*) 12() 12() 12() 12(221) () (设系统的状态方程为)()(21txtx)()(2tutx要求确定最优控制 ,使指标泛函)(*tudttuuJ)(21)(102例3-41)0(1x1)0(2x初始条件为取极小值0) 1 (1x) 1 (2

18、x终端条件为自由 这里 是自由的,所以要用到横截条件(3- 24)式,因终端指标 ) 1 (2x(),0ffX tt011xH解:作哈密顿函数由(3-21)(3-23)可求得0) 1 () 1 (22X所以(3-30)uxuH221221(3-31)122xH0uH将 代入状态方程,可得)(*tu02u 即)()(2*ttu得(3-32)边界条件为 1)0(1x1)0(2x0) 1 (1x0) 1 (2(3-37))(12t(3-36)01(3-35))(22tx(3-34))(21txx (3-33) 222( )(0)( )sXsxs (3-39)112( )(0)( )sX sxXs(3

19、-38)11( )(0)0ss(3-40)221( )(0)( )sss (3-41) 可见这是两点边值问题,对正则方程(3-33)(3-36)进行拉氏变换,可得 43211221( )(0)(0)(0)(0)s Xss xs xs代入初始条件 , ,可得1)0(1x1)0(2x)0(1)0(111)(142321sssssX31221)0(61)0(211)(ttttx故由(3-38)(3-41)可解出 同样可解得 0) 1 (1x0) 1 (2利用终端条件 , ,由(3-42)、(3-43)可得0)0(61)0(212120)0()0(12tt)0()0()(122(3-43))0(1)0

20、(1)(1222sss(3-42) 由上二式可解出 32*131)(ttttx6)0(16)0(2由(3-42)式可得最优状态轨迹由(3-43)式可得最优协态 ) 1(6)(*ttu2*2361)(tttx)1 (6)(*2tt由(3-32)式可得最优控制同理还可求出图3-2 最优控制和最优状态轨迹解 注意,这个系统是线性定常系统,这种线性两点边值问题的解可以通过寻找缺少的边界条件,并且进行一次积分而求得其解。 对非线性两点边值问题,则要借助于迭代方法产生一个序列,来多次修正缺少的初始条件的试探值,直到满足两点边值的条件。图3-2是最优解的轨迹曲线。3.3.2 终端时刻自由,终端状态受约束终端

21、时刻自由,终端状态受约束设终端状态 满足下面约束方程)(ftXdtttUtXFttXJfttff0),(),(),((3-46)ffqffffttXGttXGttXGG),(),(),(21(3-45)0),(ffttXG(3-44)性能指标为其中 引入n维拉格朗日乘子向量函数 和 维拉格朗日乘子向量 ,作出增广性能泛函 将 代入(3-47),可得H)(tqvfttTffTffadtXtUXHttXGvttXJ0),(),(),((3-49)),(,),(tUXftUXFtUXHT(3-48)fttTffTffadtXtUXfttUXFttXGvttXJ0),()(),(),(),((3-47

22、)引入哈密顿函数 与 固定时的情况不同,现在 由 、 、 和 所引起。这里 不再为零,而 可计算如下(参见图3-3):ftaJUX)(ftXftft)(ftXdtXtUXHttXJfttTffa0),(),((3-51)则ffTffffttXGvttXttX),(),(),((3-50)令图3-3 各种变分的表示)()()()()()(*ffffffftXtXttXtXtXtXfffttXtX)()(*(3-52)fffttt*令一是在 时函数 相对 的变化 .)(*ftX)(*ftX)(ftX*ft另一是因 的变化所引起的函数值的变化量 后者可用它的线性主部 来 近似。)()(*ffftXt

23、tXffttX)(*ft注意,这里 和 不同,故*号不能省去。上式表明 由两部分组成:)(ftX)(*ftX)(ftX 现在来计算 (只计算到一阶小量)。aJfftttTffffadtXXtUUXXHtttXtXJ*0*)(),(),()(*0),(),(fttTffdtXtUXHttX 上式中方括号外的下标*表示 、 、 是最优 值 、 、 。 是上式的线性主部,故 XUft*X*U*ftaJdtXUUHXXHtttXtXJfttTTTfffTfa*0)()(ffftttTdtXXtUUXXH*)(, )()(*0fttfTTTtXtdtUUHXXHf对第三项作分部积分,可得ffftttTT

24、TTdtXXUUHXXHtUXH*)()(),(fffTfttXtttUXH)()(),(*)()()(*fffTftXtXttH 第四项可表示为(忽略二阶小量) fffTfatttXtXJ*)()()()(*0*fttfTfTTtXttHdtUUHXXHf 上式最后一个等号用到了(3-52)式。 表示 的自变量取最优值时 的值。*HHH根据上面的结果可得 取极值的必要条件为 因 、 、 、 为任意,故得(省去*号)aJ0aJ)(ftXftXUXH(协态方程) (3-53)HX(状态方程) (3-54)0UH(控制方程) (3-55))()()()(fTffftXGtXtXt(横截方程) (3

25、-56) 与 固定情况相比,这里多了一个方程, ,用它可求出最优终端时间 。ftffttH)(*fftt fTffftGtttH)((3-57)要求确定最优控制 ,使 最小。*uJftfdtutJ0221ux 例3-5设系统状态方程为边界条件为1)0(x0)(ftxft自由性能指标为 解0)(ftx这是 自由问题。终端状态固定, 是满足约束集的特殊情况,即ft0)(),(ffftxttXGuuH221作哈密顿函数uHx0 xH0uuHu正则方程是控制方程是将 代入,可得)()(ttu01)()(2122fftt1)()()(212ffftuttu1)(ffffftttttH因边界条件全部给定,

26、故不用横截条件。确定最优终端时刻的条件(3-57)式为 因为由正则方程 ,所以 ,于是最优控制02)()(ftt2)(*tu再由正则方程 ,可得 ux cttx2)(2)(ft由上式求得 由初始条件 ,求得 ,故最优轨迹为1)0(x1c12)(*ttx0)(*ftx22*ft以终端条件代入上式,即求得最优终端时刻 火箭发射最优程序问题。设火箭在垂直平面内运动,加速度 与水平面夹角为 , 是控制作用,见图3-4。令 )(t)(ta)(t例3-6)(1tVxL(水平速度))(2tVxh(垂直速度))(3tLx (水平距离))(4thx (垂直高度) 图3-4 火箭发射示意图0)0(2xsin2ax

27、 0)0(1xcos1ax 忽略重力和空气阻力时,系统的状态方程和初始条件为0)0(4x24xx 0)0(3x13xx (3-58)要求选择最优控制程序 ,使性能指标)()(ttuffhtx)(4自由)(3ftx0)(2ftxUtxf)(1终端状态为ftftdtJ0为最小。0)(11UtxGf0)(22ftxG因为要求 最小,故是 自由问题。由给 定的终端状态可得三个约束方程为ftft解0)(43ffhtxG(3-59)241321sincos1xxaafFHT033xH422xH311xH作哈密顿函数协态方程为044xH(3-60) )()()()(fTfTfftXGtXGtXt343242

28、1413332321313232221213132121113213214321)(,)()()()(xGxGxGxGxGxGxGxGxGxGxGxGtXGGGttttfffff横截条件为即0)(3ft22)(ft11)(ft上式右端矩阵中 的自变量 已省略。由(3-59)式求出上式中的偏导数,可得协态的终值为ft4 , 3 , 2 , 1,ixi34)(ft(3-61)131ct 242ct 434)(ft常数积分协态方程可得30)(3ft常数11223,fcct代入协态终值条件后,得11)(322ttf0334故(3-62)由控制方程 ,得0HUH0cossin21aa)(tan2112t

29、tf(3-63)即 下面来积分状态方程(3-58),为此将自变量 变成 。由(3-63)式得t 为了确定最优程序 ,还需确定拉格朗日未定常数 、 。)(t1222sectandtddtddd22secdtdcoscos21addtaddx222cossinsinaddtaddx321)tanln(seccax322seccax将上面关系代入状态方程,即得积分上面两式得0)0(1x0)0(2x0)0(由初始条件可求得0021sectansectanlnax(3-64)sec(sec022ax(3-65) 将上面的 和 代入状态方程(3-58)的后两式,积分并经较复杂运算得 1x2x0000022

30、4sectansectanlntan)sec(secsec)tan(tan2ax(3-66))sectansectanlntansec(sec000223ax(3-67) (注:另一解为 ,但这时由(3-67)式可得出 与给定终端条件 不符,故略去 的解)0f0)(4ffhtx0)(4ftx0f由终端条件 和(3-65)式得 0)(2ftx0sec)(secft故02)(fft(3-68)t20tantanfft20tantan02tan2ft由(3-63)式得于是0tan)21 (tanftt(3-70)故ft02tan2(3-69) 将终端条件 和(3-69)式代入(3-64)式,可得Utxf)()214tan(lntantansectansecln21tan0000000

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论