3.2最优控制理论ppt课件_第1页
3.2最优控制理论ppt课件_第2页
3.2最优控制理论ppt课件_第3页
3.2最优控制理论ppt课件_第4页
3.2最优控制理论ppt课件_第5页
已阅读5页,还剩115页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、最优控制理论主讲:罗文广授课内容1、最优控制概述2、最优控制中的变分法3、极小值原理及其应用4、动态规划5、线性最优状态调节器6、线性最优输出调节器与跟踪系统考核方式一、小设计论文30) 1、选题:每人自选一个与最优控制相关的实际小问题,在小组讨论中初步确定选题。小组45人,自行成立。2、解题:通过建模、编程和仿真,获得问题的最优解;或者通过制作实物、编程,对对象实现最优控制。3、论文:通过以上工作,完成一篇小论文。论文撰写格式按照广西工学院学报的格式要求。4、报告和答辩:每人约用10分钟对所做选题进行汇报和答辩5、时间要求: 题目确定:第6周,个人上交自拟的题目。 答辩时间:12周以后。 最

2、后完成时间:本学期最后一周。6、上交材料:(1编制的程序、仿真结果,或制作的实物;(2小论文。由班长统一上交含统计表)二、考试70) 开卷方式第1章 导论 1.1 引言一、现代控制理论一、现代控制理论 现代控制理论是研究系统状态的控制和观测的理论,主要包括现代控制理论是研究系统状态的控制和观测的理论,主要包括5 5个方个方面:面: 1 1、线性系统理论:研究线性系统的性质,能观性、能控性、稳定性、线性系统理论:研究线性系统的性质,能观性、能控性、稳定性等。以状态空间法为主要工具研究多变量线性系统的理论。等。以状态空间法为主要工具研究多变量线性系统的理论。 2 2、系统辨识:根据输入、输出观测确

3、定系统数学模型。、系统辨识:根据输入、输出观测确定系统数学模型。 3 3、最优控制:寻找最优控制向量、最优控制:寻找最优控制向量u(t)u(t)。根据给定的目标函数和约束。根据给定的目标函数和约束条件条件, ,寻求最优的控制规律的问题。寻求最优的控制规律的问题。 4 4、最佳滤波卡尔曼滤波、最优估计):存在噪声情况下,如何根、最佳滤波卡尔曼滤波、最优估计):存在噪声情况下,如何根据输入、输出估计状态变量。据输入、输出估计状态变量。 5 5、适应控制:利用辨识系统动态特性的方法随时调整控制规律以实、适应控制:利用辨识系统动态特性的方法随时调整控制规律以实现最优控制,即在参数扰动情况下,控制器的设

4、计问题。现最优控制,即在参数扰动情况下,控制器的设计问题。 把鲁棒控制、预测控制均纳入到现代控制理论的范畴。把鲁棒控制、预测控制均纳入到现代控制理论的范畴。第1章 导论 1.1 引言 二、最优控制的发展简史先期工作:1948年,维纳(N.Wiener)发表控制论,引进了信息、反馈和控制等重要概念,奠定了控制论(Cybernetics)的基础。并提出了相对于某一性能指标进行最优设计的概念。1950年,米顿纳尔(Medona1)首先将这个概念用于研究继电器系统在单位阶跃作用下的过渡过程的时间最短最优控制问题。1954年,钱学森编著工程控制论(上下册),作者系统地揭示了控制论对自动化、航空、航天、电

5、子通信等科学技术的意义和重大影响。其中“最优开关曲线等素材,直接促进了最优控制理论的形成和发展。第1章 导论 1.1 引言n理论形成阶段:理论形成阶段:n 自动控制联合会自动控制联合会(IFAC)(IFAC)第一届世界大会于第一届世界大会于19601960年召开年召开, ,卡尔曼卡尔曼KalmanKalman)、贝尔曼)、贝尔曼R.BellmanR.Bellman和庞特里亚金和庞特里亚金PontryaginPontryagin分分别在会上作了别在会上作了“控制系统的一般理论控制系统的一般理论”、“动态规划动态规划和和“最优控制最优控制理论理论的报告的报告, ,宣告了最优控制理论的诞生宣告了最优

6、控制理论的诞生, ,人们也称这三个工作是现人们也称这三个工作是现代控制理论的三个里程碑。代控制理论的三个里程碑。n1953195319571957年,贝尔曼年,贝尔曼(R.E.Bellman)(R.E.Bellman)创建创建“动态规划动态规划原理。原理。为了解决多阶段决策过程逐步创立的,依据最优化原理,用一组基本为了解决多阶段决策过程逐步创立的,依据最优化原理,用一组基本的递推关系式使过程连续地最优转移。的递推关系式使过程连续地最优转移。“动态规划动态规划对于研究最优控对于研究最优控制理论的重要性,表现于可得出离散时间系统的理论结果和迭代算法。制理论的重要性,表现于可得出离散时间系统的理论结

7、果和迭代算法。n 第1章 导论n1 9 5 61 9 5 6 1 9 5 81 9 5 8 年 , 庞 特 里 亚 金 创 立年 , 庞 特 里 亚 金 创 立 “ 极 小 值 原 理极 小 值 原 理 ” 。它是最优控制理论的主要组成部分和该理论发展史上的一个里程碑。它是最优控制理论的主要组成部分和该理论发展史上的一个里程碑。对于对于“最大值原理最大值原理”,由于放宽了有关条件的使得许多古典变分法和,由于放宽了有关条件的使得许多古典变分法和动态规划方法无法解决的工程技术问题得到解决,所以它是解决最优动态规划方法无法解决的工程技术问题得到解决,所以它是解决最优控制问题的一种最普遍的有效的方法。

8、同时,庞特里亚金在控制问题的一种最普遍的有效的方法。同时,庞特里亚金在 著作中已经把最优控制理论初步形成了一个完整的体著作中已经把最优控制理论初步形成了一个完整的体系。系。n此外,构成最优控制理论及现代最优化技术理论基础的代表性工作,此外,构成最优控制理论及现代最优化技术理论基础的代表性工作, 还有不等式约束条件下的非线性最优必要条件还有不等式约束条件下的非线性最优必要条件( (库恩库恩图克定理图克定理) )以及以及卡 尔 曼 的 关 于 随 机 控 制 系 统 最 优 滤 波 器 等 。卡 尔 曼 的 关 于 随 机 控 制 系 统 最 优 滤 波 器 等 。第1章 导论 1.2 最优控制问

9、题一、问题的描述已知被控系统的状态方程以及给定的初始状态规定的目标集为S(例如 )求一容许控制 ,使系统在该控制的作用下由初态出发,在某个大于t0 的终端时刻tf 达到目标集S上,并使性能指标 达到最小。,),(0fttttfuxx0 xx)(0tnptSpf, 0),(RxxrUufttffdtttutxLttxuJ0),(),(),()(第1章 导论 1.2 最优控制问题从以上最优控制问题的描述中可见:从以上最优控制问题的描述中可见:1 1、有一个被控对象系统数学模型)、有一个被控对象系统数学模型) 它通常由常微分方程组描述的动态模型来表征,即它通常由常微分方程组描述的动态模型来表征,即

10、其初态一般是给定的,即其初态一般是给定的,即2 2、有一目标集及边界条件、有一目标集及边界条件 目标集:在控制目标集:在控制u u的作用下,把被控对象的初态的作用下,把被控对象的初态x0 x0在某个在某个终端时刻转移到某个终端状态终端时刻转移到某个终端状态x(tf)x(tf)。 x(tf)x(tf)通常受几何通常受几何约束。例如考虑它是一个点集,在约束条件约束。例如考虑它是一个点集,在约束条件 下下 目标集为目标集为,),(0fttttfuxx0 xx)(0t0),(ftxnptSpf, 0),(Rxx第1章 导论 1.2 最优控制问题边界条件:边界条件:初始状态:初始时刻初始状态:初始时刻t

11、0t0和和x(t0),x(t0),通常是已知的。通常是已知的。末端状态:末端时刻末端状态:末端时刻tftf和和x(tf) x(tf) ,通常是未知的。,通常是未知的。3 3、容许控制集、容许控制集控制向量控制向量u u的各个分量的各个分量uiui往往是具有不同物理属性的控制量。往往是具有不同物理属性的控制量。在实际控制问题中,大多数控制量受客观条件的限制只能在实际控制问题中,大多数控制量受客观条件的限制只能取值于一定的范围,将控制约束条件的点集称为控制取值于一定的范围,将控制约束条件的点集称为控制域域 ,则将在闭区间,则将在闭区间t0,tft0,tf上有定义,且在控制域内上有定义,且在控制域内

12、取值的每个控制函数取值的每个控制函数u(t)u(t)称为容许控制,记做称为容许控制,记做u第1章 导论 1.2 最优控制问题4 4、性能指标、性能指标 为了能在各种控制律中寻找到效果最好的控制,需要建立为了能在各种控制律中寻找到效果最好的控制,需要建立一种评价控制效果好坏或控制品质优劣的性能指标函数。一种评价控制效果好坏或控制品质优劣的性能指标函数。又称代价本钱,目的函数或泛函,记做又称代价本钱,目的函数或泛函,记做 ,它是一个依赖于控制的有限实数,一般的表达式为:它是一个依赖于控制的有限实数,一般的表达式为: 该表达式包括了依赖于终端时刻该表达式包括了依赖于终端时刻tftf和终端状态和终端状

13、态x(tf)x(tf)的末的末值型项,以及依赖于这个控制过程的积分型项。因而,可值型项,以及依赖于这个控制过程的积分型项。因而,可将最优控制问题的性能指标分为:混合型、末值型和积分将最优控制问题的性能指标分为:混合型、末值型和积分型。不同的控制问题,应取不同的性能指标:型。不同的控制问题,应取不同的性能指标: )(uJfttffdtttutxLttxuJ0),(),(),()(第1章 导论 1.2 最优控制问题(1 1积分型性能指标:积分型性能指标: a.a.最短时间控制:最短时间控制: b.b.最少燃烧控制:最少燃烧控制: c.c.最小能量控制最小能量控制: :(2 2末值型性能指标末值型性

14、能指标(3 3混合型性能指标混合型性能指标fttfttdtuJttutxL00)(, 1),(),(fttdtttutxLuJ0),(),()(mjjtuttutxL1)(),(),( fttmjjdttuJ01)(fttTdttutuJ0)()()()(),(),(tututtutxLT),()(ffttxuJfttffdtttutxLttxuJ0),(),(),()(第1章 导论 1.2 最优控制问题二、对最优控制问题的进一步说明二、对最优控制问题的进一步说明 如果最优控制问题有解,即如果最优控制问题有解,即: :使使 达到极小值的控制达到极小值的控制函数存在,记为函数存在,记为 ,称为最

15、优控制;,称为最优控制;相应的状态轨迹相应的状态轨迹x x* *(t)(t)称为最优轨迹;性能指标称为最优轨迹;性能指标 称为最优性能指标。称为最优性能指标。三、举例三、举例 月球上的软着陆问题最小燃耗问题)月球上的软着陆问题最小燃耗问题))(uJ)(*uJJ,)(0*fttttu飞船靠其发动机产生一与月球重力方向相反的推力飞船靠其发动机产生一与月球重力方向相反的推力u(t)u(t),以使飞船在月球表面实现软着陆,要寻求发,以使飞船在月球表面实现软着陆,要寻求发动机推力的最优控制规律,以便使燃料的消耗为最动机推力的最优控制规律,以便使燃料的消耗为最少。少。第1章 导论 1.2 最优控制问题设飞

16、船质量为设飞船质量为m(t)m(t),高度为,高度为h(t)h(t),垂直速度为,垂直速度为v(t)v(t),发动机推力为,发动机推力为u(t)u(t),月球表面的重力加,月球表面的重力加速度为常数速度为常数g g。设不带燃料的飞船质量为。设不带燃料的飞船质量为M M, 初初始燃料的总质量为始燃料的总质量为F F初始高度为初始高度为h0h0,初始的垂,初始的垂直速度为直速度为v0v0,那么飞船的运动方程式可以表示为:,那么飞船的运动方程式可以表示为:)()()()()()()(tkutmtmtugtvtvth初始条件 FMmvvhh)0()0()0(00终端条件终端条件 0)(0)(fftvt

17、h性能指标是使燃料消耗为最小,即性能指标是使燃料消耗为最小,即 约束条件)(0tu)(ftmJ 达到最大值 第2章 最优控制中的变分法变分法是求解泛函极值的一种经典方法,因此也是研究最优控制问题的一种重要工具。本章的中心内容是介绍经典变分法的基本原理,并加以推广,用以求解某些最优控制问题。尽管经典变分法有其局限性,但本章所涉及的有关内容,在最优控制理论中是最基本的东西。第2章 最优控制中的变分法 2.1 泛函与变分(1泛函定义: 给定函数空间U,若对于任何函数x(t) U,总有一个确定的值J(x(t)与之对应,则称J(x(t)是函数x(t)的泛函。这里x(t)常被称做宗量。从定义中可以发现,泛

18、函是变量与函数之间的关系,常称之为“函数的函数”。例: 是一个泛函,当x(t)=t时,J=0.5; 而不定积分 不是一个泛函。 10)( dttxJdttxJ)(第2章 最优控制中的变分法 2.1 泛函与变分函数:对于变量t的某一变域中的每一个值,x都有一个值与之相对应,那么变量x称作变量t的函数。记为: x=f (t)t称为函数的自变量自变量的微分:dt=t-t0 (增量足够小时)泛函:对于某一类函数x()中的每一个函数x(t),变量J都有一个值与之相对应,那么变量J称作依赖于函数x(t)的泛函。记为: J=J x(t)x(t)称为泛函的宗量宗量的变分:)()(0txtxx函数与泛函比较:第

19、2章 最优控制中的变分法 2.1 泛函与变分关于变分,可将泛函的变分概念看成是函数微分概念的推广,其作用如同微分在函数中的作用。(2变分定义: 若连续泛函J(x(t)的增量可表示为 其中第一项是 的连续线性泛函,第二项是关于 的高阶无穷小,则称上式第一项为泛函的变分,记做 如同函数的微分是函数增量的线性主部一样,泛函的变分就是泛函增量的线性主部。)(),()(),()()()(txtxrtxtxLtxJtxtxJJ)(),(txtxLJ)(tx)(tx第2章 最优控制中的变分法 2.1 泛函与变分显然,直接用定义求泛函的变分 很困难。因此必须寻求一种计算方法。(3计算泛函变分的公式定理21 如

20、果连续泛函J(x(t)的变分存在,那么证明: (见P12) 例子:(见P12 )为了确定泛函的极小值或极大值,需要考察泛函的二次变分:(4二次变分定义:P12(5求解二次变分定理:P12J10,),(00 xxJJ第2章 最优控制中的变分法 2.1 泛函与变分例:求下列泛函的变分fttdttxJ0)(2dttxtxdttxtxtxdttxtxtxtxJJffftttttt)()(2|)()()( 2|)()(|)()(0000020第2章 最优控制中的变分法 2.1 泛函与变分(6泛函极值定义:定义215对于与x0(t)接近的曲线x(t),泛函Jx(t) 的增量(7泛函极值的必要条件:定理23

21、(8泛函极小值的充要条件:定理24(9变分引理:定理25 则泛函Jx(t) 在曲线x0(t)上达到极值。0)()(0)()(00txJtxJJtxJtxJJ或0J泛函极值定理: 若可微泛函Jx(t)在x0(t)上达到极值,则在x= x0(t)上的变分为零。即第2章 最优控制中的变分法 2.2 欧拉方程主要讨论:(1无约束和有约束情况下,泛函极值存在的必要条件欧拉方程;(2泛函极小值的充分条件勒让德条件。2.2.1 无约束泛函极值的必要条件这里所提到的约束或无约束是指状态x(t)的约束问题。无约束:指求解最优控制解时状态无约束,即无状态方程的约束。1、所定义的问题问题2-1:无约束泛函极值问题为

22、)172()(),(,min0fttxdttxtxtLJ问题为:确定一个函数x(t),使Jx(t) 达到极小大值。这条能使泛函Jx(t) 达到极值的曲线称为极值曲线轨线),记作:x*(t),见图2-2。对于端点固定的情况,容许轨线x(t)应满足下列边界条件:第2章 最优控制中的变分法 2.2 欧拉方程2、极值的必要条件定理26:极值轨线x(t)满足欧拉方程证明:P16.注意名词:横截条件第3节讨论)例22:(求极值轨线)2.2.2 有等式约束的泛函极值的必要条件在最优控制问题中,泛函Jx(t)所依赖的函数x(t)往往会受到一定约束条件的限制。在动态最优化问题中,由于受控系统的数学模型往往用微分

23、方程来描述,所以等式约束就是系统的状态方程。等式约束:系统的运动微分方程)162()()(00ffxtxxtx)212(0)(xLdtdxL第2章 最优控制中的变分法 2.2 欧拉方程1、定义的问题问题描述:问题222、极值的必要条件解决有约束问题方法:将有约束问题转化为无约束问题,利用无约束的结论。通过引入拉格朗日乘子向量,解决这个问题。定理27:(主要的问题:将有约束问题转化为无约束问题后的拉格朗日乘子向量定义、计算)这里,为了将有约束条件的泛函极值问题转化为无约束条件的泛函极值问题,应用拉格朗日乘子法。为此,引入待定的n维拉格朗日乘子向量(t),即证明:P18例2-3:Tntttt)()

24、()()(21第2章 最优控制中的变分法 2.2 欧拉方程2.2.3 泛函极小值的充分条件(1无约束情况定理2-8:(2有约束情况定理2-9:例2-4:第2章 最优控制中的变分法 2.3 横截条件横截条件:两点边界满足的条件。例如式226) 前面讨论的是最简单的情况:两端固定初始状态和末端状态且初始时刻和末端时刻都固定,在工程实际中存在许多复杂的情况,讨论如下:2.3.1 末端时刻固定时的横截条件末端时刻tf固定,存在以下几种情况:见表2-12.3.2 末端时刻自由时的横截条件横截条件:式2-53)末端时刻tf自由,存在以下几种情况:见表2-22.3.3 初始时刻自由时的横截条件横截条件:式2

25、-62)初始时刻自由,存在以下几种情况:见表2-20),()(x)(x.*00fttTftTttxxLtxLtxLff横截条件:0)(x)(x00txLtxLtTftTf0),()(x)(x0.*000ttxxxxLtxLtxLttTftTf第2章 最优控制中的变分法 2.4 用变分法解最优控制问题用变分法求解连续系统最优控制问题:(1)具有等式约束条件的泛函极值问题,只要把受控系统的数学模型看成是最优轨线x(t) 应满足的等式约束条件即可;(2)控制变量不受约束;(3末端时刻固定和末端时刻自由时最优解的必要条件和充分条件。一、可用变分法求解的最优控制问题一般描述,非线性时变系统状态方程为),

26、(tux,fx 初始状态)()(00ttttxx其中,x 为n 维状态向量; u 为m 维控制向量; f 为n 维向量函数。要求在控制空间中寻求一个最优控制向量 (不受约束) ,使以下性能指标)(tu沿最优轨线 取极小值。)(tx*tttJfttfd),()(0uxLx目标集末端状态集)0),(ffttx第2章 最优控制中的变分法 2.4 用变分法解最优控制问题二、末端时刻固定时的最优解问题的描述:P301、末端受约束情况两个约束:状态受系统状态方程约束,末端状态受目标集约束。引入两个拉格朗日乘子向量(t)、(t),构造广义泛函无条件极值):tttttttJTttfTfafdx), u, x(

27、f)(), u, x(L)()()(x0), u, x(f )(), u, x(L), , u, x(ttttHT定义哈密顿函数(关于该函数的说明P31)tttuxHtttJTttfTfafd(t)x)(),()()()(x0代入上式得式中的第三项进行分部积分,得tttttHtttJTttttTttfTfafffdx)(x)(d), , u, x()()()(x000当泛函J 取极值时,其一次变分等于零。 即0aJ第2章 最优控制中的变分法 2.4 用变分法解最优控制问题H(t)xxH)()(00ttttxx可以变分的量:uuu)()(ttxxx)()(tt)()()(ffftttxxx求出J

28、 的一次变分并令其为零0dxuuxx)()()()()(0tHHtttxtxtxJTTTttfffTffTaf广义泛函取极值的必要条件是定理210)正则方程:边界条件:极值条件控制方程):)()()()(ffTffttxtxt0),(ffttx0uH不可以变分的量:0tft)(0tx)( t(t)第2章 最优控制中的变分法 2.4 用变分法解最优控制问题几点说明:1实际上,(2-73式和2-74式为欧拉方程。xfxLxH因为0uH0ufuL推导过程:如果令广义泛函的积分内的函数)x),u,x(f)(),u,x(L),u,x(ttttHT简记成xfLTHxfxL由欧拉方程得到0ddxxHtH0)

29、(xfxL即第2章 最优控制中的变分法 2.4 用变分法解最优控制问题而275式和初始条件266就是横截条件。0dduuHtH0ufuL2) 是泛函取极值的必要条件,是否为极小值还需要二次变分 来判断, 则泛函J 取极小值。0JJ202J第2章 最优控制中的变分法 2.4 用变分法解最优控制问题3) 哈密顿函数沿最优轨线随时间的变化率tHHHHtHTTTuuxxdd在最优控制 、最优轨线 下,有 和*u*x0uH(270式的哈密顿函数对 求偏导,结果为 0 xxxxHHHHHHTTTT 由277式可得于是tHtHddx), ux,(ft第2章 最优控制中的变分法 2.4 用变分法解最优控制问题

30、 即哈密顿函数H 沿最优轨线对时间的全导数等于它对时间的偏导数。记为 那么)(), ,u,x(*tHtHttHHdd对上式积分,得到dHtHtHfttf*0*0)()(当哈密顿函数不显含 t 时,得consttHtHf)()(*第2章 最优控制中的变分法 2.4 用变分法解最优控制问题2、末端自由情况广义泛函取极值的必要条件是定理211)正则方程:边界条件:极值条件:H(t)xxH)()(fftxt00)(xtx0uH3、末端固定情况广义泛函取极值的必要条件是定理212)正则方程:边界条件:极值条件:末端时刻固定时最优解的充分条件:定理213H(t)xxHffxtx)(00)(xtx0uH第2

31、章 最优控制中的变分法 2.4 用变分法解最优控制问题三、末端时刻自由时的最优解推导过程与末端时刻固定时一样,只不过不同在于可以变分的量:uuu)()(ttxxx)()(tt)()()(ffftttxxxfffttt不可以变分的量:0t)(0tx)(t末端受约束情况:定理214末端自由情况:定理215末端固定时情况:定理216注意与末端时刻固定的情况不同。第第3章章 极小值原理及其应用极小值原理及其应用 3.1 连续系统的极小值原理连续系统的极小值原理问题的提出问题的提出 用变分法求解最优控制时,认用变分法求解最优控制时,认为控制向量为控制向量 不受限制。但是不受限制。但是实际的系统,控制信号

32、都是受到实际的系统,控制信号都是受到某种限制的。某种限制的。)(tu 因而,应用控制方程因而,应用控制方程来确定最优控制,可能出错。来确定最优控制,可能出错。0uHa)a)图中所示,图中所示,H H 最小值出现在左侧,最小值出现在左侧,不满足控制方程。不满足控制方程。b)b)图中不存在图中不存在 0uHrRUt )(u第第3章章 极小值原理及其应用极小值原理及其应用 3.1 连续系统的极小值原理连续系统的极小值原理( )min ( ) ( )fu tJ ux t. .s t( )( , ),x tf x u00( ),x tx0 ,fttt( )x t( ) t( )Hx t( )Htx 一、

33、自由末端的极小值原理一、自由末端的极小值原理定理定理3-13-1:对应如下定常系统、末值型性能指标、末端自由、控制受约束:对应如下定常系统、末值型性能指标、末端自由、控制受约束的最优控制问题的最优控制问题 及及满足下述正则方程满足下述正则方程: :对于最优解和最优末端时刻、最优轨线,存在非零的对于最优解和最优末端时刻、最优轨线,存在非零的n n维向量函数维向量函数 使使( ) t第第3章章 极小值原理及其应用极小值原理及其应用 3.1 连续系统的极小值原理连续系统的极小值原理( , , )( ) ( , )TH x ut f x u( )x t( ) t00()()()ffx txtx t*(

34、 )( , )min( , , )u tH x uH x u式中哈密顿函数式中哈密顿函数及及满足边界条件满足边界条件哈密顿函数相对最优控制为极小值哈密顿函数相对最优控制为极小值ft*( ( ),( ), ( )( ( ),( ), ( )fffH x t u ttH x tu ttconstft*(),(), ()0ffftttH x tu tt哈密顿函数沿最优轨迹线保持为常数哈密顿函数沿最优轨迹线保持为常数固定时固定时当当自由时自由时当当第第3章章 极小值原理及其应用极小值原理及其应用 3.1 连续系统的极小值原理连续系统的极小值原理/0Hu *( )( ( ),( ), ( )( ( ),

35、 ( ), ( )u tH x t u ttH x t u tt上述极小值原理与变分法主要区别在于条件上述极小值原理与变分法主要区别在于条件。当控制无约束时,。当控制无约束时,相应条件为相应条件为 ;不再成立,而代之为不再成立,而代之为当控制有约束时,当控制有约束时,/0Hu 极小值原理的重要意义:(极小值原理的重要意义:(P51)(1容许控制条件放宽了。容许控制条件放宽了。(2最优控制使哈密顿函数取全局极小值。最优控制使哈密顿函数取全局极小值。(3极小值原理不要求哈密顿函数对控制的可微性。极小值原理不要求哈密顿函数对控制的可微性。(4极小值原理给出了最优控制的必要而非充分条件。极小值原理给出

36、了最优控制的必要而非充分条件。例例31:说明:说明:1 1极小值原理给出的只是最优控制应该满足的必要条件。极小值原理给出的只是最优控制应该满足的必要条件。2 2极小值原理与用变分法求解最优问题相比,差别仅在于极值条件。极小值原理与用变分法求解最优问题相比,差别仅在于极值条件。3 3这里给出了极小值原理,而在庞德里亚金著作论述的是极大值原理。因为求这里给出了极小值原理,而在庞德里亚金著作论述的是极大值原理。因为求性能指标性能指标J J的极小值与求的极小值与求J J的极大值等价。的极大值等价。4 4非线性时变系统也有极小值原理。非线性时变系统也有极小值原理。第第3章章 极小值原理及其应用极小值原理

37、及其应用 3.1 连续系统的极小值原理连续系统的极小值原理二、极小值原理的一些推广形式二、极小值原理的一些推广形式1、时变问题、时变问题定义:描述最优控制问题的相关函数显含时间,称为时变问题。定义:描述最优控制问题的相关函数显含时间,称为时变问题。解决办法:引入新状态变量,将时变问题转为定常问题,利用定理解决办法:引入新状态变量,将时变问题转为定常问题,利用定理3-1。( )min( ) (),ffu tJ ux tt. .st( )( , , ),x tf x u t00( )x tx0 ,fftt tt未知定理定理3-23-2: ( )Hx t( )Htx 满足下述正则方程满足下述正则方程

38、: :( )x t( ) t及及式中哈密顿函数式中哈密顿函数( , , , )( ) ( , , )TH xu tt f x u t第第3章章 极小值原理及其应用极小值原理及其应用 3.1 连续系统的极小值原理连续系统的极小值原理( )x t( ) t00()()()ffx txtx t及及满足边界条件满足边界条件哈密顿函数相对最优控制为极小值哈密顿函数相对最优控制为极小值在最优轨线末端哈密顿函数应满足在最优轨线末端哈密顿函数应满足*( ) ( ), ( ),( ), min ( ), ( ), ( ), u tH x tt u t tH x tt u t t*( ),( ), ( ),( )

39、,fffffffx ttH x ttu ttt*( , , , ) ( ), ( ), ( ), ( ), ( ), ( ), ftfffftH xuH x tt u t tH x ttu ttd沿最优轨线哈密顿函数变化率沿最优轨线哈密顿函数变化率定理定理3 32 2与定理与定理3 31 1的区别:的区别:P61P61第第3章章 极小值原理及其应用极小值原理及其应用 3.1 连续系统的极小值原理连续系统的极小值原理2 2、积分型性能指标问题、积分型性能指标问题. .st( )( , , ),x tf x u t00( )x tx0 ,fftt tt未知定理定理3-33-3: ( )Hx t(

40、)Htx 满足下述正则方程满足下述正则方程: :( )x t( ) t及及式中哈密顿函数式中哈密顿函数0( )min( ) ( ), ( )fttu tJ uL x t u t dt( )x t( ) t及及满足边界条件满足边界条件00()x tx()0ft)u, x(f )()u, x(L), u, x(tHT第第3章章 极小值原理及其应用极小值原理及其应用 3.1 连续系统的极小值原理连续系统的极小值原理哈密顿函数相对最优控制为极小值哈密顿函数相对最优控制为极小值ft*( ( ),( ), ( )( ( ),( ), ( )fffH x t u ttH x tu ttconstft*(),

41、(), ()0ffftttH x tu tt哈密顿函数沿最优轨迹线保持为常数哈密顿函数沿最优轨迹线保持为常数固定时固定时当当自由时自由时当当*( )( ), ( ),( )min( ), ( ), ( )u tH x tt u tH x tt u t第第3章章 极小值原理及其应用极小值原理及其应用 3.1 连续系统的极小值原理连续系统的极小值原理例例3-23-2:试求:试求: 时的时的 ,解:定常系统、积分型解:定常系统、积分型 , 固定,固定, 自在,自在, 受约束。取哈密顿函数受约束。取哈密顿函数 tutxtx 50 x 15 . 0tu min10dttutxJ*u*xJft)(ftxu

42、 uxuxuxH11 5 . 01*tu11 1xHt 1tcet 0111ceec 11tte由协态方程由协态方程由边界条件由边界条件注:控制的切换点为注:控制的切换点为(ts)=1第第3章章 极小值原理及其应用极小值原理及其应用 3.1 连续系统的极小值原理连续系统的极小值原理 10st 111stset307. 0st 5 . 01*tu00.307t 1307. 0 t控制的切换点处控制的切换点处00.307t 1307. 0 t 5 . 0121ttecectx00.307t 1307. 0 t5 . 037. 414*tteex00.307t 1307. 0 t根据边界条件继续求出

43、:根据边界条件继续求出: 5 . 01txtxtx 代入状态方程得代入状态方程得第第3章章 极小值原理及其应用极小值原理及其应用 3.1 连续系统的极小值原理连续系统的极小值原理 tt72. 11307. 0105 . 01307. 01t*u0 tx*t1307.0044.653 .12第第3章章 极小值原理及其应用极小值原理及其应用 3.1 连续系统的极小值原理连续系统的极小值原理最优性能指标为:最优性能指标为: 1307. 0307. 0010*68. 8) 137. 4()24(dtedtedttutxJtt例例3-3:3、末端受约束的情况、末端受约束的情况做法与前面得一样,引入两个拉

44、格朗日乘子向量,构造广义泛函,做法与前面得一样,引入两个拉格朗日乘子向量,构造广义泛函,在满足末端约束条件下,泛函取得极值是等价的。在满足末端约束条件下,泛函取得极值是等价的。定理定理3-4:(定常系统):(定常系统)定理定理3-5:(时变系统)(时变系统)4、复合型性能指标情况、复合型性能指标情况定理定理36:表表3-1,3-2例例35:第第3章章 极小值原理及其应用极小值原理及其应用 3.2 离散系统的极小值原理离散系统的极小值原理一、离散欧拉方程一、离散欧拉方程控制序列不受约束时,利用离散变分法求解离散系统的最优控制问题。控制序列不受约束时,利用离散变分法求解离散系统的最优控制问题。1,

45、.,1 , 0,),(),() 1(Nkkkukxfkx1010),1(),(),(NkkNkLkkxkukxLJ设系统的差分方程为:设系统的差分方程为:系统的性能指标为:系统的性能指标为:离散泛函取得极值的必要条件欧拉方程)离散泛函取得极值的必要条件欧拉方程)0)(0)()(1kuLkxLkxLkkk离散横截条件为:离散横截条件为:0)0()()()(01xkxLNxkxLTkkTNkk若始端固定,末端自由,若始端固定,末端自由,由离散横截条件得边界条件:由离散横截条件得边界条件:例例36:0)( 1),(),1(),1(,)0(0NxNNxNuNxLxx第第3章章 极小值原理及其应用极小值

46、原理及其应用 3.2 离散系统的极小值原理离散系统的极小值原理二、离散极小值原理二、离散极小值原理先给出控制序列不受约束时得离散极小值原理,然后推广到控制序列受先给出控制序列不受约束时得离散极小值原理,然后推广到控制序列受约束的情况。约束的情况。1、末端状态受等式约束、末端状态受等式约束1,.,1 , 0,),(),() 1(Nkkkukxfkx10),1(),(),(),(NkkkxkukxLNNxJ定理定理3-7:3-7:设离散系统状态方程设离散系统状态方程系统的性能指标为:系统的性能指标为:目标集:目标集:0),(NNx取得极值的必要条件:取得极值的必要条件:( )x k( )k( )(

47、1)(1)H kx kk( )( )( )H kkx k( ) ( ), ( ),(1), H kH x ku kkk ( ), ( ), (1) ( ), ( ), TL x k u k kkf x k u k k和和满足下列差分方程满足下列差分方程: :式中离散哈密顿函数式中离散哈密顿函数第第3章章 极小值原理及其应用极小值原理及其应用 3.2 离散系统的极小值原理离散系统的极小值原理( )x k( )k0(0)xx (),0 x NN ( ), ( ),( )( )( )Tx N Nx N NNx Nx N*( )u k*( ),( ), (1), H xkukkk*( )min( ),

48、 ( ), (1), u kH x k u kkk( )0( )H ku k和和满足边界条件满足边界条件离散哈密顿函数对最优控制离散哈密顿函数对最优控制取极小值取极小值控制序列不受约束时控制序列不受约束时2 2、末端状态自由时、末端状态自由时定理定理3 38 8:例例3 37 7:第第3章章 极小值原理及其应用极小值原理及其应用 3.3 时间最优控制时间最优控制时间最优控制:如果性能指标是系统由初态转移到目标集的运动时间,则使时间最优控制:如果性能指标是系统由初态转移到目标集的运动时间,则使转移时间为最短的控制称为时间最优控制。转移时间为最短的控制称为时间最优控制。一、一类非线性系统的时间最优

49、控制一、一类非线性系统的时间最优控制最短时间控制问题的提法:最短时间控制问题的提法: 设受控系统状态方程为设受控系统状态方程为 )(),(),()(tuttxBttxftx 给定终端约束条件为给定终端约束条件为 0),()(00ffttxxtx 寻求寻求m m维有界闭集中的最优控制维有界闭集中的最优控制u u* *(t)(t),满足不等式约束,满足不等式约束 ),.,2 , 1(1)(mjtuj 使系统从已知初始状态使系统从已知初始状态 转移到目标集中某一状态转移到目标集中某一状态 时,时,如如下目标泛函取极小值,其中下目标泛函取极小值,其中 未知未知 )(0tx)(ftxft00)(fttf

50、ttdttuJ 属于时变系统、积分型性能指标、终端受约束的最优控制问题属于时变系统、积分型性能指标、终端受约束的最优控制问题 第第3章章 极小值原理及其应用极小值原理及其应用 3.3 时间最优控制时间最优控制应用极小值原理,系统的哈密尔顿函数为:应用极小值原理,系统的哈密尔顿函数为:)(1),(),(),(BufttuttxHT在使在使J J最小以实现最优控制的必要条件中,侧重分析极值条件最小以实现最优控制的必要条件中,侧重分析极值条件),.,2 , 1()(),(min)(),()(1min)(1*1)(*1)(*mjtuttxBtuttxBBufBufTtuTTtuTjj将上式中的矩阵表达

51、式展开成分量形式将上式中的矩阵表达式展开成分量形式mjniiijjmnmnnmmnbuuuubbbbbbbbb112121222211121121.jg则极值条件可写为:则极值条件可写为:mjjjumjjjguguj1*11*min第第3章章 极小值原理及其应用极小值原理及其应用 3.3 时间最优控制时间最优控制由上式可见,由于由上式可见,由于 是确定的,故使是确定的,故使 取极小值的最优控制为取极小值的最优控制为*jgmjjjgu1*00101*jjjjgggu不定或简写为:或简写为:niiijjbguj1*sgnsgn 根据根据 是否为零,将系统分为两种情形:正常平凡)、奇异非平凡)是否为

52、零,将系统分为两种情形:正常平凡)、奇异非平凡)(砰(砰- -砰控制)砰控制)*jg*jg*ju011第第3章章 极小值原理及其应用极小值原理及其应用 3.3 时间最优控制时间最优控制正常平凡最短时间控正常平凡最短时间控制系统定义制系统定义3 31 1) 只是在各个孤立的瞬只是在各个孤立的瞬刻才取零值,刻才取零值, 是有第一是有第一类间断点的分段常数函数类间断点的分段常数函数。奇异非平凡最短时奇异非平凡最短时间控制系统定义间控制系统定义3 32 2)并不意味着在该区间内并不意味着在该区间内最优控制不存在,仅表最优控制不存在,仅表明,从必要条件不能推明,从必要条件不能推出确切关系式。出确切关系式

53、。*jg*ju定理定理3 39 9:砰:砰- -砰控制原理砰控制原理第第3章章 极小值原理及其应用极小值原理及其应用 3.3 时间最优控制时间最优控制二、线性定常系统的时间最优控制二、线性定常系统的时间最优控制线性时间最优调节器问题的提法问题线性时间最优调节器问题的提法问题3 32 2):): 设受控系统状态方程为设受控系统状态方程为 )()()(tButAxtx 给定终端约束条件为给定终端约束条件为 0)()0()(0ftxaxtx 寻求寻求m m维有界闭集中的最优控制维有界闭集中的最优控制u u* *(t)(t),满足不等式约束,满足不等式约束 ),.,2 , 1(1)(mjtuj 使系统

54、以最短时间从初始状态使系统以最短时间从初始状态 转移到状态空间原点。目标泛转移到状态空间原点。目标泛函取极小值函取极小值)0(x根据上一节的结论,可得极值条件为:根据上一节的结论,可得极值条件为:)(sgnsgn*tbguTjjj00)(fttfttdttuJ第第3章章 极小值原理及其应用极小值原理及其应用 3.3 时间最优控制时间最优控制对于线性定常系统的最短时间控制问题,经过理论推导和证明,可得如对于线性定常系统的最短时间控制问题,经过理论推导和证明,可得如下重要结论:下重要结论:(1 1系统正常平凡的充要条件定理系统正常平凡的充要条件定理3 31111):当且仅当):当且仅当m m个矩阵

55、个矩阵中全部为非奇异矩阵时,系统是正常平凡的。(至少有一个为奇异中全部为非奇异矩阵时,系统是正常平凡的。(至少有一个为奇异矩阵时,系统是奇异的定理矩阵时,系统是奇异的定理3 31010) )定理定理3-11:3-11:当且仅当当且仅当 问题问题3-23-2是正常是正常的的 mjbAbAAbbGjnjjjj , 2 , 1.,1,2,(2 2系统最优解存在的条件:常数矩阵系统最优解存在的条件:常数矩阵A A的特征值全部具有非正实部。的特征值全部具有非正实部。(3 3最优解唯一性定理:系统是平凡的且最短时间控制存在,则最短最优解唯一性定理:系统是平凡的且最短时间控制存在,则最短时间控制必然是唯一的

56、。时间控制必然是唯一的。( (定理定理3-12)3-12)(4 4开关次数定理:系统是平凡的且最短时间控制存在,则最优控制开关次数定理:系统是平凡的且最短时间控制存在,则最优控制u u* *的任一分量的任一分量 的切换次数最多为的切换次数最多为n-1n-1次。(次。(n n为系统维数)为系统维数)( (定理定理3-14)3-14)*junbAbAAbbrankrankGjnjjjj.,1,2,第第3章章 极小值原理及其应用极小值原理及其应用 3.3 时间最优控制时间最优控制三、双积分模型的最短时间控制问题三、双积分模型的最短时间控制问题双积分模型的物理意义:惯性负载在无阻力环境中运动例双积分模

57、型的物理意义:惯性负载在无阻力环境中运动例3 38 8) 作用力位移,质量,)()(tftym负载运动方程:负载运动方程: )()(tftym )()(),()(21tytxtytx传递函数:传递函数: 21)()()(mssFsYsG(由两个积分环节组成)(由两个积分环节组成) 定义定义u(t)=f(t)/m , u(t)=f(t)/m , 则上式变为:则上式变为: )()(tuty 取状态变量取状态变量 )()()()(221tutxtxtx则有则有 矩阵形式为:矩阵形式为: )(10)(0010)(tutxtx第第3章章 极小值原理及其应用极小值原理及其应用 3.3 时间最优控制时间最优

58、控制( )( )( )Hx tAx tBu t( )( )THtAtx ( , , ) 1( )( )( )TH xut Ax tBu t 0(0)xx( )0fx t*1,( )0( )sgn( )1,( )0TjTjjTjbtu tbtbt 当当H*()0fHt定理定理3-153-15正则方程正则方程式中哈密顿函数式中哈密顿函数边界条件边界条件, 极小值条件极小值条件函数变化率函数变化率第第3章章 极小值原理及其应用极小值原理及其应用 3.3 时间最优控制时间最优控制双积分模型最短时间控制问题的提法:双积分模型最短时间控制问题的提法: 已知二阶系统的状态方程为已知二阶系统的状态方程为 给定

59、端点约束条件为给定端点约束条件为 TfTtxxxx00)()0(2010 寻求有界闭集中的最优控制寻求有界闭集中的最优控制u u* *(t)(t),满足不等式约束,满足不等式约束 1)(tu 使系统从以最短时间从任意初态转移到终态。使系统从以最短时间从任意初态转移到终态。)()()()(221tutxtxtx0110ABBG)(10)(0010)(tutxtx先判断该系统是否平凡?先判断该系统是否平凡?第第3章章 极小值原理及其应用极小值原理及其应用 3.3 时间最优控制时间最优控制由上节重要结论可知:由上节重要结论可知:(1 1本系统为正常平凡最短时间控制系统本系统为正常平凡最短时间控制系统

60、(2 2其时间最优控制必然存在且唯一其时间最优控制必然存在且唯一(3 3时间最优控制时间最优控制u(t)u(t)至多切换一次至多切换一次 最优控制表达式:最优控制表达式:)(sgn)(sgn2*ttBuT 下面利用协态方程求解下面利用协态方程求解)(2t12211)(0)(xHtxHtuxfHT2211121211)()(ctctct1)sgn(1020*tu0)(, 10)(, 1)(sgn(222*tttu当当 哈密顿函数:哈密顿函数: 最优控制:最优控制:第第3章章 极小值原理及其应用极小值原理及其应用 3.3 时间最优控制时间最优控制1)(*tu)0(21)0(21)(221221xx

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论