最优控制理论.ppt

上传人：优*** IP属地：广东上传时间：2020-03-16 格式：PPT 页数：122 大小：3.37MB 积分：88 举报 版权申诉

已阅读5页，还剩117页未读，继续免费阅读

版权说明：本文档由用户提供并上传，收益归属内容提供方，若内容存在侵权，请进行举报或认领

文档简介

最优控制理论主讲罗文广授课内容 1 最优控制概述2 最优控制中的变分法3 极小值原理及其应用4 动态规划5 线性最优状态调节器6 线性最优输出调节器与跟踪系统考核方式一小设计论文 30 1 选题每人自选一个与最优控制相关的实际小问题在小组讨论中初步确定选题小组4 5人自行成立 2 解题通过建模编程和仿真获得问题的最优解或者通过制作实物编程对对象实现最优控制 3 论文通过以上工作完成一篇小论文论文撰写格式按照广西工学院学报的格式要求 4 报告和答辩每人约用10分钟对所做选题进行汇报和答辩5 时间要求题目确定第6周个人上交自拟的题目答辩时间 12周以后最后完成时间本学期最后一周 6 上交材料 1 编制的程序仿真结果或制作的实物 2 小论文由班长统一上交含统计表二考试 70 开卷方式第1章导论1 1引言一现代控制理论现代控制理论是研究系统状态的控制和观测的理论主要包括5个方面 1 线性系统理论研究线性系统的性质能观性能控性稳定性等以状态空间法为主要工具研究多变量线性系统的理论 2 系统辨识根据输入输出观测确定系统数学模型 3 最优控制寻找最优控制向量u t 根据给定的目标函数和约束条件寻求最优的控制规律的问题 4 最佳滤波卡尔曼滤波最优估计存在噪声情况下如何根据输入输出估计状态变量 5 适应控制利用辨识系统动态特性的方法随时调整控制规律以实现最优控制即在参数扰动情况下控制器的设计问题把鲁棒控制预测控制均纳入到现代控制理论的范畴第1章导论1 1引言二最优控制的发展简史先期工作 1948年维纳 N Wiener 发表控制论引进了信息反馈和控制等重要概念奠定了控制论 Cybernetics 的基础并提出了相对于某一性能指标进行最优设计的概念 1950年米顿纳尔 Medona1 首先将这个概念用于研究继电器系统在单位阶跃作用下的过渡过程的时间最短最优控制问题 1954年钱学森编著工程控制论上下册作者系统地揭示了控制论对自动化航空航天电子通信等科学技术的意义和重大影响其中最优开关曲线等素材直接促进了最优控制理论的形成和发展第1章导论1 1引言理论形成阶段自动控制联合会 IFAC 第一届世界大会于1960年召开卡尔曼 Kalman 贝尔曼 R Bellman 和庞特里亚金 Pontryagin 分别在会上作了控制系统的一般理论动态规划和最优控制理论的报告宣告了最优控制理论的诞生人们也称这三个工作是现代控制理论的三个里程碑 1953 1957年贝尔曼 R E Bellman 创立动态规划原理为了解决多阶段决策过程逐步创立的依据最优化原理用一组基本的递推关系式使过程连续地最优转移动态规划对于研究最优控制理论的重要性表现于可得出离散时间系统的理论结果和迭代算法第1章导论 1956 1958年庞特里亚金创立极小值原理它是最优控制理论的主要组成部分和该理论发展史上的一个里程碑对于最大值原理由于放宽了有关条件的使得许多古典变分法和动态规划方法无法解决的工程技术问题得到解决所以它是解决最优控制问题的一种最普遍的有效的方法同时庞特里亚金在最优过程的数学理论著作中已经把最优控制理论初步形成了一个完整的体系此外构成最优控制理论及现代最优化技术理论基础的代表性工作还有不等式约束条件下的非线性最优必要条件库恩图克定理以及卡尔曼的关于随机控制系统最优滤波器等第1章导论1 2最优控制问题一问题的描述已知被控系统的状态方程以及给定的初始状态规定的目标集为S 例如求一容许控制使系统在该控制的作用下由初态出发在某个大于t0的终端时刻tf达到目标集S上并使性能指标达到最小第1章导论1 2最优控制问题从以上最优控制问题的描述中可见 1 有一个被控对象系统数学模型它通常由常微分方程组描述的动态模型来表征即其初态一般是给定的即2 有一目标集及边界条件目标集在控制u的作用下把被控对象的初态x0在某个终端时刻转移到某个终端状态x tf x tf 通常受几何约束例如考虑它是一个点集在约束条件下目标集为第1章导论1 2最优控制问题边界条件初始状态初始时刻t0和x t0 通常是已知的末端状态末端时刻tf和x tf 通常是未知的 3 容许控制集控制向量u的各个分量ui往往是具有不同物理属性的控制量在实际控制问题中大多数控制量受客观条件的限制只能取值于一定的范围将控制约束条件的点集称为控制域则将在闭区间 t0 tf 上有定义且在控制域内取值的每个控制函数u t 称为容许控制记做第1章导论1 2最优控制问题 4 性能指标为了能在各种控制律中寻找到效果最好的控制需要建立一种评价控制效果好坏或控制品质优劣的性能指标函数又称代价成本目标函数或泛函记做它是一个依赖于控制的有限实数一般的表达式为该表达式包括了依赖于终端时刻tf和终端状态x tf 的末值型项以及依赖于这个控制过程的积分型项因此可将最优控制问题的性能指标分为混合型末值型和积分型不同的控制问题应取不同的性能指标第1章导论1 2最优控制问题 1 积分型性能指标 a 最短时间控制 b 最少燃烧控制 c 最小能量控制 2 末值型性能指标 3 混合型性能指标第1章导论1 2最优控制问题二对最优控制问题的进一步说明如果最优控制问题有解即使达到极小值的控制函数存在记为称为最优控制相应的状态轨迹x t 称为最优轨迹性能指标称为最优性能指标三举例月球上的软着陆问题最小燃耗问题飞船靠其发动机产生一与月球重力方向相反的推力u t 以使飞船在月球表面实现软着陆要寻求发动机推力的最优控制规律以便使燃料的消耗为最少第1章导论1 2最优控制问题设飞船质量为m t 高度为h t 垂直速度为v t 发动机推力为u t 月球表面的重力加速度为常数g 设不带燃料的飞船质量为M 初始燃料的总质量为F 初始高度为h0 初始的垂直速度为v0 那么飞船的运动方程式可以表示为初始条件终端条件性能指标是使燃料消耗为最小即约束条件达到最大值第2章最优控制中的变分法变分法是求解泛函极值的一种经典方法因此也是研究最优控制问题的一种重要工具本章的中心内容是介绍经典变分法的基本原理并加以推广用以求解某些最优控制问题尽管经典变分法有其局限性但本章所涉及的有关内容在最优控制理论中是最基本的东西第2章最优控制中的变分法2 1泛函与变分 1 泛函定义给定函数空间U 若对于任何函数x t U 总有一个确定的值J x t 与之对应则称J x t 是函数x t 的泛函这里x t 常被称做宗量从定义中可以发现泛函是变量与函数之间的关系常称之为函数的函数例是一个泛函当x t t时 J 0 5 而不定积分不是一个泛函第2章最优控制中的变分法2 1泛函与变分函数对于变量t的某一变域中的每一个值 x都有一个值与之相对应那么变量x称作变量t的函数记为 x f t t称为函数的自变量自变量的微分 dt t t0 增量足够小时泛函对于某一类函数x 中的每一个函数x t 变量J都有一个值与之相对应那么变量J称作依赖于函数x t 的泛函记为 J J x t x t 称为泛函的宗量宗量的变分函数与泛函比较第2章最优控制中的变分法2 1泛函与变分关于变分可将泛函的变分概念看成是函数微分概念的推广其作用如同微分在函数中的作用 2 变分定义若连续泛函J x t 的增量可表示为其中第一项是的连续线性泛函第二项是关于的高阶无穷小则称上式第一项为泛函的变分记做如同函数的微分是函数增量的线性主部一样泛函的变分就是泛函增量的线性主部第2章最优控制中的变分法2 1泛函与变分显然直接用定义求泛函的变分很困难因此必须寻求一种计算方法 3 计算泛函变分的公式定理2 1如果连续泛函J x t 的变分存在则证明见P12 例子见P12 为了确定泛函的极小值或极大值需要考察泛函的二次变分 4 二次变分定义 P12 5 求解二次变分定理 P12 第2章最优控制中的变分法2 1泛函与变分例求下列泛函的变分第2章最优控制中的变分法2 1泛函与变分 6 泛函极值定义定义2 15对于与x0 t 接近的曲线x t 泛函J x t 的增量 7 泛函极值的必要条件定理2 3 8 泛函极小值的充要条件定理2 4 9 变分引理定理2 5 则泛函J x t 在曲线x0 t 上达到极值泛函极值定理若可微泛函J x t 在x0 t 上达到极值则在x x0 t 上的变分为零即第2章最优控制中的变分法2 2欧拉方程主要讨论 1 无约束和有约束情况下泛函极值存在的必要条件欧拉方程 2 泛函极小值的充分条件勒让德条件 2 2 1无约束泛函极值的必要条件这里所提到的约束或无约束是指状态x t 的约束问题无约束指求解最优控制解时状态无约束即无状态方程的约束 1 所定义的问题问题2 1 无约束泛函极值问题为问题为确定一个函数x t 使J x t 达到极小大值这条能使泛函J x t 达到极值的曲线称为极值曲线轨线记作 x t 见图2 2 对于端点固定的情况容许轨线x t 应满足下列边界条件第2章最优控制中的变分法2 2欧拉方程 2 极值的必要条件定理2 6 极值轨线x t 满足欧拉方程证明 P16 注意名词横截条件第3节讨论例2 2 求极值轨线 2 2 2有等式约束的泛函极值的必要条件在最优控制问题中泛函J x t 所依赖的函数x t 往往会受到一定约束条件的限制在动态最优化问题中由于受控系统的数学模型往往用微分方程来描述所以等式约束就是系统的状态方程等式约束系统的运动微分方程第2章最优控制中的变分法2 2欧拉方程 1 定义的问题问题描述问题2 22 极值的必要条件解决有约束问题方法将有约束问题转化为无约束问题利用无约束的结论通过引入拉格朗日乘子向量解决这个问题定理2 7 主要的问题将有约束问题转化为无约束问题后的拉格朗日乘子向量定义计算这里为了将有约束条件的泛函极值问题转化为无约束条件的泛函极值问题应用拉格朗日乘子法为此引入待定的n维拉格朗日乘子向量 t 即证明 P18例2 3 第2章最优控制中的变分法2 2欧拉方程 2 2 3泛函极小值的充分条件 1 无约束情况定理2 8 2 有约束情况定理2 9 例2 4 第2章最优控制中的变分法2 3横截条件横截条件两点边界满足的条件例如式 2 26 前面讨论的是最简单的情况两端固定初始状态和末端状态且初始时刻和末端时刻都固定在工程实际中存在许多复杂的情况讨论如下 2 3 1末端时刻固定时的横截条件末端时刻tf固定存在以下几种情况见表2 12 3 2末端时刻自由时的横截条件横截条件式 2 53 末端时刻tf自由存在以下几种情况见表2 22 3 3初始时刻自由时的横截条件横截条件式 2 62 初始时刻自由存在以下几种情况见表2 2 横截条件第2章最优控制中的变分法2 4用变分法解最优控制问题用变分法求解连续系统最优控制问题 1 具有等式约束条件的泛函极值问题只要把受控系统的数学模型看成是最优轨线x t 应满足的等式约束条件即可 2 控制变量不受约束 3 末端时刻固定和末端时刻自由时最优解的必要条件和充分条件一可用变分法求解的最优控制问题一般描述非线性时变系统状态方程为初始状态其中 x为n维状态向量 u为m维控制向量 f为n维向量函数要求在控制空间中寻求一个最优控制向量不受约束使以下性能指标沿最优轨线取极小值目标集末端状态集第2章最优控制中的变分法2 4用变分法解最优控制问题二末端时刻固定时的最优解问题的描述 P301 末端受约束情况两个约束状态受系统状态方程约束末端状态受目标集约束引入两个拉格朗日乘子向量 t t 构造广义泛函无条件极值定义哈密顿函数关于该函数的说明P31 代入上式得式中的第三项进行分部积分得当泛函J取极值时其一次变分等于零即第2章最优控制中的变分法2 4用变分法解最优控制问题可以变分的量求出J的一次变分并令其为零广义泛函取极值的必要条件是定理2 10 正则方程边界条件极值条件控制方程第2章最优控制中的变分法2 4用变分法解最优控制问题几点说明 1 实际上 2 73 式和 2 74 式为欧拉方程因为推导过程如果令广义泛函的积分内的函数简记成由欧拉方程得到即第2章最优控制中的变分法2 4用变分法解最优控制问题而 2 75 式和初始条件 2 66 就是横截条件 2 是泛函取极值的必要条件是否为极小值还需要二次变分来判断则泛函J取极小值第2章最优控制中的变分法2 4用变分法解最优控制问题 3 哈密顿函数沿最优轨线随时间的变化率在最优控制最优轨线下有和 2 70 式的哈密顿函数对求偏导结果为于是第2章最优控制中的变分法2 4用变分法解最优控制问题即哈密顿函数H沿最优轨线对时间的全导数等于它对时间的偏导数记为则对上式积分得到当哈密顿函数不显含t时得第2章最优控制中的变分法2 4用变分法解最优控制问题 2 末端自由情况广义泛函取极值的必要条件是定理2 11 正则方程边界条件极值条件 3 末端固定情况广义泛函取极值的必要条件是定理2 12 正则方程边界条件极值条件末端时刻固定时最优解的充分条件定理2 13 第2章最优控制中的变分法2 4用变分法解最优控制问题三末端时刻自由时的最优解推导过程与末端时刻固定时一样只不过不同在于可以变分的量不可以变分的量末端受约束情况定理2 14末端自由情况定理2 15末端固定时情况定理2 16注意与末端时刻固定的情况不同第3章极小值原理及其应用3 1连续系统的极小值原理问题的提出用变分法求解最优控制时认为控制向量不受限制但是实际的系统控制信号都是受到某种限制的因此应用控制方程来确定最优控制可能出错 a 图中所示 H最小值出现在左侧不满足控制方程 b 图中不存在第3章极小值原理及其应用3 1连续系统的极小值原理一自由末端的极小值原理定理3 1 对应如下定常系统末值型性能指标末端自由控制受约束的最优控制问题及满足下述正则方程对于最优解和最优末端时刻最优轨线存在非零的n维向量函数使第3章极小值原理及其应用3 1连续系统的极小值原理式中哈密顿函数及满足边界条件哈密顿函数相对最优控制为极小值哈密顿函数沿最优轨迹线保持为常数固定时当自由时当第3章极小值原理及其应用3 1连续系统的极小值原理上述极小值原理与变分法主要区别在于条件当控制无约束时相应条件为不再成立而代之为当控制有约束时极小值原理的重要意义 P51 1 容许控制条件放宽了 2 最优控制使哈密顿函数取全局极小值 3 极小值原理不要求哈密顿函数对控制的可微性 4 极小值原理给出了最优控制的必要而非充分条件例3 1 说明 1 极小值原理给出的只是最优控制应该满足的必要条件 2 极小值原理与用变分法求解最优问题相比差别仅在于极值条件 3 这里给出了极小值原理而在庞德里亚金著作论述的是极大值原理因为求性能指标J的极小值与求 J的极大值等价 4 非线性时变系统也有极小值原理第3章极小值原理及其应用3 1连续系统的极小值原理二极小值原理的一些推广形式1 时变问题定义描述最优控制问题的相关函数显含时间称为时变问题解决办法引入新状态变量将时变问题转为定常问题利用定理3 1 定理3 2 满足下述正则方程及式中哈密顿函数第3章极小值原理及其应用3 1连续系统的极小值原理及满足边界条件哈密顿函数相对最优控制为极小值在最优轨线末端哈密顿函数应满足沿最优轨线哈密顿函数变化率定理3 2与定理3 1的区别 P61 第3章极小值原理及其应用3 1连续系统的极小值原理 2 积分型性能指标问题定理3 3 满足下述正则方程及式中哈密顿函数及满足边界条件第3章极小值原理及其应用3 1连续系统的极小值原理哈密顿函数相对最优控制为极小值哈密顿函数沿最优轨迹线保持为常数固定时当自由时当第3章极小值原理及其应用3 1连续系统的极小值原理例3 2 试求时的解定常系统积分型固定自由受约束取哈密顿函数由协态方程由边界条件注控制的切换点为 ts 1 第3章极小值原理及其应用3 1连续系统的极小值原理控制的切换点处根据边界条件继续求出代入状态方程得第3章极小值原理及其应用3 1连续系统的极小值原理第3章极小值原理及其应用3 1连续系统的极小值原理最优性能指标为例3 3 3 末端受约束的情况做法与前面得一样引入两个拉格朗日乘子向量构造广义泛函在满足末端约束条件下泛函取得极值是等价的定理3 4 定常系统定理3 5 时变系统 4 复合型性能指标情况定理3 6 表3 1 3 2例3 5 第3章极小值原理及其应用3 2离散系统的极小值原理一离散欧拉方程控制序列不受约束时利用离散变分法求解离散系统的最优控制问题设系统的差分方程为系统的性能指标为离散泛函取得极值的必要条件欧拉方程离散横截条件为若始端固定末端自由由离散横截条件得边界条件例3 6 第3章极小值原理及其应用3 2离散系统的极小值原理二离散极小值原理先给出控制序列不受约束时得离散极小值原理然后推广到控制序列受约束的情况 1 末端状态受等式约束定理3 7 设离散系统状态方程系统的性能指标为目标集取得极值的必要条件和满足下列差分方程式中离散哈密顿函数第3章极小值原理及其应用3 2离散系统的极小值原理和满足边界条件离散哈密顿函数对最优控制取极小值控制序列不受约束时 2 末端状态自由时定理3 8 例3 7 第3章极小值原理及其应用3 3时间最优控制时间最优控制如果性能指标是系统由初态转移到目标集的运动时间则使转移时间为最短的控制称为时间最优控制一一类非线性系统的时间最优控制最短时间控制问题的提法设受控系统状态方程为给定终端约束条件为寻求m维有界闭集中的最优控制u t 满足不等式约束使系统从已知初始状态转移到目标集中某一状态时如下目标泛函取极小值其中未知属于时变系统积分型性能指标终端受约束的最优控制问题第3章极小值原理及其应用3 3时间最优控制应用极小值原理系统的哈密尔顿函数为在使J最小以实现最优控制的必要条件中侧重分析极值条件将上式中的矩阵表达式展开成分量形式则极值条件可写为第3章极小值原理及其应用3 3时间最优控制由上式可见由于是确定的故使取极小值的最优控制为或简写为根据是否为零将系统分为两种情形正常平凡奇异非平凡砰砰控制第3章极小值原理及其应用3 3时间最优控制正常平凡最短时间控制系统定义3 1 只是在各个孤立的瞬刻才取零值是有第一类间断点的分段常数函数奇异非平凡最短时间控制系统定义3 2 并不意味着在该区间内最优控制不存在仅表明从必要条件不能推出确切关系式定理3 9 砰砰控制原理第3章极小值原理及其应用3 3时间最优控制二线性定常系统的时间最优控制线性时间最优调节器问题的提法问题3 2 设受控系统状态方程为给定终端约束条件为寻求m维有界闭集中的最优控制u t 满足不等式约束使系统以最短时间从初始状态转移到状态空间原点目标泛函取极小值根据上一节的结论可得极值条件为第3章极小值原理及其应用3 3时间最优控制对于线性定常系统的最短时间控制问题经过理论推导和证明可得如下重要结论 1 系统正常平凡的充要条件定理3 11 当且仅当m个矩阵中全部为非奇异矩阵时系统是正常平凡的至少有一个为奇异矩阵时系统是奇异的定理3 10 定理3 11 当且仅当问题3 2是正常的 2 系统最优解存在的条件常数矩阵A的特征值全部具有非正实部 3 最优解唯一性定理系统是平凡的且最短时间控制存在则最短时间控制必然是唯一的定理3 12 4 开关次数定理系统是平凡的且最短时间控制存在则最优控制u 的任一分量的切换次数最多为n 1次 n为系统维数定理3 14 第3章极小值原理及其应用3 3时间最优控制三双积分模型的最短时间控制问题双积分模型的物理意义惯性负载在无阻力环境中运动例3 8 负载运动方程传递函数由两个积分环节组成定义u t f t m 则上式变为取状态变量则有矩阵形式为第3章极小值原理及其应用3 3时间最优控制定理3 15正则方程式中哈密顿函数边界条件极小值条件函数变化率第3章极小值原理及其应用3 3时间最优控制双积分模型最短时间控制问题的提法已知二阶系统的状态方程为给定端点约束条件为寻求有界闭集中的最优控制u t 满足不等式约束使系统从以最短时间从任意初态转移到终态先判断该系统是否平凡第3章极小值原理及其应用3 3时间最优控制由上节重要结论可知 1 本系统为正常平凡最短时间控制系统 2 其时间最优控制必然存在且唯一 3 时间最优控制u t 至多切换一次最优控制表达式下面利用协态方程求解哈密顿函数最优控制 2020 3 16 61 可编辑第3章极小值原理及其应用3 3时间最优控制为一直线为非零向量故c1和c2不能同时为零由于开关次数的限制其四种可能的开关序列为如图3 7 下面通过图解法在相平面上分析相轨迹转移的规律从而寻找最优控制u t 首先求解状态轨线的方程令相轨迹方程为令相轨迹满足末态要求的相轨迹为满足末态要求的相轨迹为两种情况组合后第3章极小值原理及其应用3 3时间最优控制为开关曲线第3章极小值原理及其应用3 3时间最优控制第3章极小值原理及其应用3 3时间最优控制求解状态转移最短时间t 第3章极小值原理及其应用3 3时间最优控制式 1 与式 2 比较有第3章极小值原理及其应用3 3时间最优控制四离散系统的时间最优控制离散系统的时间最优控制问题最多在n个采样周期内可使任意初始状态转移到要求的末端状态找出这n个采样周期内的控制序列则是最优控制序列线性定常离散系统的控制 P106例3 9 第3章极小值原理及其应用3 4燃料最优控制燃料最优控制问题的提法设受控系统状态方程为给定端点约束条件为寻求m维有界闭集中的最优控制u t 满足不等式约束使系统从已知初始状态转移到目标集中某一状态时如下目标泛函取极小值其中未知第3章极小值原理及其应用3 4燃料最优控制二次积分模型最少燃料控制问题的提法已知二阶系统的状态方程为寻求有界闭集中的最优控制u t 满足不等式约束二次积分模型的燃料最优控制问题问题3 7 使系统由任意初始状态转移到预定终态并使如下目标函数取极小值其中自由给定端点约束条件为第3章极小值原理及其应用3 4燃料最优控制哈密顿函数协态方程极小值条件哈密顿函数在末端时刻变化率哈密顿函数取得极小值后极小值条件式等价于用极小值原理求解对最优控制取得极小值第3章极小值原理及其应用3 4燃料最优控制令则关系如图3 21 分析如何得到图死区函数关系引入死区函数记号dez 得图3 21的b图则得图3 21的a图第3章极小值原理及其应用3 4燃料最优控制平凡燃料最优控制奇异非平凡燃料最优控制并不意味着在该区间内最优控制不存在仅表明利用常规公式无法求解第3章极小值原理及其应用3 4燃料最优控制 1 奇异区内有命题3 1 2 平凡区内此时得出9种可能的控制序列作为候选函数命题3 2 第3章极小值原理及其应用3 4燃料最优控制等速直线由图见这是一族不通过原点的平行线或是x1轴上的孤立点因此以u 0结尾的控制序列不是最优控制九个序列变为六个该关系式提供了燃料消耗量的下限所以如果能找到一个控制驱使状态从初态转移到原点的燃料消耗为则该控制肯定是燃料最优控制命题3 3 第3章极小值原理及其应用3 4燃料最优控制第3章极小值原理及其应用3 4燃料最优控制曲线以及坐标轴x1将相平面分成了四个区域第3章极小值原理及其应用3 4燃料最优控制 1 初态位于开关曲线上命题3 4 对于问题3 7 若初态则是燃料最优控制且唯一若初态则是燃料最优控制且唯一 2 初态位于区域R4和R2上命题3 5 对于问题3 7 若初态则是燃料最优控制若初态则是燃料最优控制平凡情况只有序列 0 1 和 1 0 1 可驱使系统状态到达原点其中 0 1 控制下燃料消耗为 1 0 1 燃料消耗大于结论 0 1 为最优控制序列且在各种情况下其响应时间最短第3章极小值原理及其应用3 4燃料最优控制 3 初态位于区域R1和R3上平凡情况只有序列 1 0 1 可驱使系统状态到达原点结论燃料控制问题无解燃料最优控制命题3 6 第3章极小值原理及其应用3 4燃料最优控制类似地可对其它两个区间进行研究综上所述双积分装置最少燃料问题的控制规律如下第3章极小值原理及其应用3 5时间燃料最优控制一问题的提出以节省燃料为目标的燃料最优控制问题一般说响应速度慢有时不能满足系统的性能要求为此将时间与燃料综合考虑使所设计的控制系统既能节约燃料又不至于响应缓慢因此产生了时间燃料最优控制问题取性能指标 0 为时间加权系数表示设计者对响应时间的重视程度若 0 表示不计响应时间长短只考虑节省燃料若无穷大表示不计燃料消耗只要求时间最短第3章极小值原理及其应用3 5时间燃料最优控制二次积分模型最少燃料控制问题的提法已知二阶系统的状态方程为寻求有界闭集中的最优控制u t 满足不等式约束二二次积分模型的燃料最优控制问题问题3 8 使系统由任意初始状态转移到预定终态并使如下目标函数取极小值其中自由给定端点约束条件为第3章极小值原理及其应用3 5时间燃料最优控制属于定常系统积分型性能指标末端时间自由和末端固定的最优控制问题哈密顿函数协态方程极小值条件哈密顿函数在末端时刻变化率经过分析见P117 120 时间燃料最优控制是比单纯燃料最优控制和单纯时间最优控制更广泛的一类控制两者是前者的特例用极小值原理求解第4章动态规划本章主要内容 4 1多级决策问题4 2离散动态规划4 3连续动态规划4 4动态规划与变分法极小值原理的关系求解动态最优化问题的两种基本方法最小值原理和动态规划动态规划美国学者贝尔曼在20世纪50年代提出是一种分级最优化方法其连续形式与最小值原理相辅相成深化了最优控制的研究第4章动态规划4 1多级决策问题多级决策过程所谓多级决策过程是指将一个过程按时间或空间顺序分为若干级步然后给每一级步作出决策在控制过程中令每走一步所要决定的控制步骤称之为决策以使整个过程取得最优的效果即多次的决策最终要构成一个总的最优控制策略最优控制方案说明 1 全部决策总体成为策略 2 在多级决策过程中每一级的输出状态都仅与该级的决策及该级的输入状态有关而与其前面各级的决策及状态的转移规律无关这种特有性质称为无后效性第4章动态规划4 1多级决策问题 4 1 1最短路线问题解法一穷举法列出所有可能的组合方案找出时间最短的一个可能的行车线路共有 2 2 2 8 每阶段有两种可能缺点计算量大容易出错需确定一条最优的汽车行驶路线使从S站到F站的行车时间为最短第4章动态规划4 1多级决策问题解法二动态规划法是一种逆序计算法从终点开始按时间最短为目标逐段向前逆推依次计算出各站至终点站的时间最优值据此决策出每一站的最优路线 4 3 4 5 10 8 13 第4章动态规划4 1多级决策问题特点 1 将一个多阶段决策问题化为多个单阶段决策问题易于分析2 每阶段评估只与前一阶段结果有关计算量减小具体解法 P132 2 最优性原理不论初始状态和初始决策如何当把其中的任何一级和状态再作为初始级和初始状态时其余的决策对此必定也是一个最优决策表明若有一个初态x 0 的N级决策过程其最优决策为 u 0 u 1 u N 1 那么对于以x 1 为初态的N 1级决策过程来说决策集合 u 1 u 2 u N 1 必定是最优策略第4章动态规划4 1多级决策问题 3 离散系统动态规划的基本递推方程离散控制系统最优控制问题的提法问题4 1 离散控制系统的状态方程为给定端点约束条件为寻求最优控制序列使系统从起点转移终端时目标函数取极小值第4章动态规划4 1多级决策问题相对独立动态规划基本方程或贝尔曼泛函方程第4章动态规划4 1多级决策问题同理不断向终点递推可得结合 5 从 4 出发逆推到 1 可得出最优控制序列基本的递推方程第4章动态规划4 1多级决策问题例设一阶离散控制系统试确定最优控制序列u 0 u 1 u 2 使如下性能指标达最小解从最后一级相前递推 N 3 为使达到最小则有第4章动态规划4 1多级决策问题最后从前往后推可得出最优控制序列 u 0 3 2 u 1 1 2 u 2 0 关于动态规划本质的讨论一个最优控制策略具有这样的性质不论过去的状态及过去的决策如何如把现在的状态看作后续状态的初态则其后诸决策仍必须构成一最优策略动态规划的最优性原理得以成立的前提条件是所谓无后效性即上一状态和上一决策对后续过程的影响仅表现在它们把状态转移到了当前状态至于后续过程如何他们就不再起作用了动态规划的解题顺序与事物发展进程相反第4章动态规划4 2离散动态规划给定端点约束条件为寻求最优控制序列使系统从起点转移终端时目标函数取极小值离散控制系统最优控制问题的提法问题4 2 离散控制系统的状态方程为求解过程与上节相同例4 1 第4章动态规划4 3连续控制系统的动态规划控制问题的提法问题4 3 设受控系统状态方程为给定端点约束条件为寻求m维有界闭集中的最优控制u t 即使系统从已知初始状态转移到目标集中某一状态时如下目标泛函取极小值第4章动态规划4 3连续控制系统的动态规划由动态规划最优性原理第4章动态规划4 3连续控制系统的动态规划对任意给定初态时式 4 21 可改写为哈密尔顿雅可比贝尔曼方程定义可视为影响函数表示的变分施加于的影响程度第4章动态规划4 3连续控制系统的动态规划哈密尔顿雅可比贝尔曼方程表明在最优轨线上最优控制函数必使H达整体最小这是最小值原理的另一种表述形式连续动态规划的基本方程最优解的求解步骤 P148 150 第4章动态规划4 4动态规划与变分法最小值原理的关系 1 动态规划与变分法由哈密尔顿雅可比贝尔曼方程可推倒出欧拉方程结论动态规划与变分法和极小值原理在数学上是等效关系应用范畴有所不同对某些最优性能指标的可微性条件不能满足的最优控制问题未必能写出哈密尔顿雅可比贝尔曼方程 2 动态规划与极小值原理由哈密尔顿雅可比贝尔曼方程本身就是极小值原理的极值条件通过它还可推倒极小值原理的协态方程和横截条件区别在于第5章线性最优状态调节器5 1线性二次型问题线性二次型问题的特点 1 最优解可写成统一的解析表达式实现求解过程规范化 2 可以兼顾系统的性能指标快速性准确性稳定性灵敏度线性二次型问题系统为线性系统性能指标为状态变量与控制变量的二次型函数这类系统的最优控制问题主要内容最优状态调节最优输出调节和最优跟踪其中最优输出调节问题和最优跟踪问题可以化为最优状态调节问题第5章线性最优状态调节器5 1线性二次型问题线性二次性问题的提法设线性时变系统的状态方程为假设控制向量不受约束用表示期望输出则误差向量为正定二次型半正定二次型实对称阵A为正定半正定的充要条件是全部特征值 0 0 求最优控制使下列二次型性能指标最小第5章线性最优状态调节器5 1线性二次型问题性能指标的物理含义 P163 加权矩阵的意义 1 F Q R是衡量误差分量和控制分量的加权矩阵可根据各分量的重要性灵活选取 2 采用时变矩阵Q t R t 更能适应各种特殊情况例如 Q t 可开始取值小而后取值大第5章线性最优状态调节器5 1线性二次型问题线性二次型问题的本质用不大的控制来保持较小的误差以达到能量和误差综合最优的目的线性二次型问题的三种重要情形第5章线性最优状态调节器5 2状态调节器问题设线性时变系统的状态方程为假设控制向量不受约束求最优控制使系统的二次型性能指标取极小值 5 2 1有限时间状态调节器问题物理意义以较小的控制能量为代价使状态保持在零值附近状态调节器问题就是要求系统的状态保持在平衡状态附件分两种情况讨论第5章线性最优状态调节器5 2状态调节器问题 1 最优解的充分必要条件定理5 1 最优控制的充分必要条件最优性能指标对称非负矩阵P满足黎卡提矩阵微分方程边界条件 2 黎卡提方程解的若干性质 P168 3 最优控制解的存在性与唯一性定理5 2 第5章线性最优状态调节器5 2状态调节器问题 1 根据系统要求和工程实际经验选取加权矩阵F Q R 状态调节器的设计步骤 2 求解黎卡提微分方程求得矩阵P t 3 求反馈增益矩阵K t 及最优控制u t 4 求解最优轨线x t 5 计算性能指标最优值第5章线性最优状态调节器5 2状态调节器问题例 5 2 已知一阶系统的微分方程为求使性能指标为极小值时的最优控制解二次型性能指标为其中p t 为黎卡提方程的解最优轨为如下时变一阶微分方程的解可得出解析解第5章线性最优状态调节器5 2状态调节器问题 1 无限时间时变状态调节器设线性时变系统的状态

人人文库> 全部分类> 教育资料 > 课件下载

温馨提示

1. 本站所有资源如无特殊说明，都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2. 本站的文档不包含任何第三方提供的附件图纸等，如果需要附件，请联系上传者。文件的所有权益归上传用户所有。
3. 本站RAR压缩包中若带图纸，网页内容里面会有图纸预览，若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 人人文库网仅提供信息存储空间，仅对用户上传内容的表现方式做保护处理，对用户上传分享的文档内容本身不做任何修改或编辑，并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容，请与我们联系，我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最优控制理论.ppt

文档简介

温馨提示

最新文档

评论

最优控制理论.ppt

文档简介

温馨提示

最新文档

评论

相关文档