




已阅读5页,还剩55页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第五章用变分法求解连续最优控制问题 有约束条件的泛函极值 1 上节讨论没有约束条件的泛函极值问题 但在最优控制问题中 泛函J所依赖的函数总要受到受控系统状态方程的约束 解决这类问题的思路是应用拉格朗日乘子法 将这种有约束条件的泛函极值问题转化为无约束条件的泛函极值问题 2 一 拉格朗日问题考虑系统 n维连续可微的矢量函数 5 1 式中 3 设给定 初始状态为x t0 x0 终端状态x tf 自由 性能泛函为 寻求最优控制u t 将系统从初始状态x t0 x0转移到终端状态x tf 并使性能泛函J取极值 5 2 4 将状态方程式 5 1 写成约束方程形式 应用拉格朗日乘子法 构造增广泛函 式中 t 待定的n维拉格朗日乘子矢量 5 3 5 定义纯量函数 称H x u t 为哈密尔顿函数 则 或 5 4 5 5 5 6 式中 5 7 6 对式 5 5 右边第二项作分部积分 得 将上式代入式 5 5 得 5 8 7 使J 取极小的必要条件是 对任意的 u和 x 都有 J 0成立 设u t 和x t 相对于最优控制u t 及最优轨线u t 的变分为 u和 x 计算由 u和 x引起的J 的变分为 8 因此得 5 9 5 10 5 11 5 12 9 式 5 9 称为动态系统的伴随方程或协态方程 又称为伴随矢量或协态矢量 式 5 10 即系统的状态方程 式 5 9 与式 5 10 联立称为哈密尔顿正则方程 式 5 11 称为控制方程 10 这个方程是在假设 u为任意 控制u t 取值不受约束条件下得到的 如果u t 为容许控制 受到的约束 u变分不能任意取值 那么 关系式不成立 这种情况留待极小值原理中讨论 11 5 13 5 14 式 5 12 称为横截条件 常用于补充边界条件 例如 若始端固定 终态自由时 由于 x t0 0 x tf 任意 则有 12 若始端和终端都固定时 x t0 0 x tf 0则以 作为两个边界条件 5 16 5 15 13 实际上 上述泛函极值的必要条件 亦可由式 5 6 写出欧拉方程直接导出 即 5 17 14 应用上述条件求解最优控制的步骤如下 1 由控制方程 解出 2 将u 代入正则方程解两边边值问题 求x 3 再将x 代入得 为所求 15 例1 有系统如图1所示 欲使系统在2s内从状态 转移到 使性能泛函 试求u t 16 解 系统状态方程及边界条件为 17 由式 5 7 得 18 由欧拉方程 得 19 20 5个未知数x1 x2 1 2 u 由5个方程联立求得通解 21 4个积分常数C1 C2 C3 C4由4个边界条件 解得 22 因此 最优解为 23 最优控制u t 及最优轨线x t 如图2所示 24 例2 设问题同例1 但将终端状态改为 2 0 2 自由 即终端条件改成部分约束 部分自由 重求u t x t 25 解正则方程及控制方程与例1完全相同 只是边界条件改成时 时 代入例1的通解中可确定积分常数 26 于是得 27 u t 和x t 的图像见图3 28 比较上述结果可见 即使是同一个问题 如果终端条件不同 其最优解也不同 29 二 波尔札问题设系统状态方程 初始状态x t0 x0 终始状态x tf 满足 式中N q维向量函数 n q 5 18 5 19 30 性能泛函 其中 L都是连续可微的数量函数 tf是待求的终端时间 最优控制问题是寻求控制矢量u t 将系统从初态x t0 转移到目标集N x tf tf 0上 并使J取极小 5 20 31 在这类极值问题中 要处理两种类型的等式约束 一是微分方程约束 一是终端边界约束 根据拉格朗日乘子法 要引入两面两个乘子矢量 一个是n维 t 另一个是q维 将等式约束条件泛函极值化成无约束条件泛函极值问题来求解 32 为此 构造增广泛函 写出哈密顿函数 5 22 5 21 33 于是 5 23 34 对上式中最后一次作分部积分 得 5 24 35 5 25 5 26 5 27 这是一个可变端点变分问题 考虑x t u t tf相对于它们最优值x t u t t f的变分 并计算由此引起J 的一次变分 J 设 36 图4可变终端各变分间的关系 37 从图4可知在端点处变分之间存在下列近似关系 式中 x t f x在t f时的一次变分 x t f tf x在tf t f tf时的一次变分 式 5 28 描述了在可变终端情况下 x在这两个时刻上变分的近似关系 近似式中忽略了高阶无穷小量 5 28 38 考虑到式 5 24 右边第一项和第二项的一次变分各有两项 39 因此 有 5 29 40 注意到 tf x u任意性 及泛函极值存在的必要条件 J 0式 5 29 可得极值必要条件如下 5 30 41 式中H x tf u tf tf tf 函数H最优轨线终端处的值 边界条件x t0 x0 5 32 终端时刻由下式计算 5 31 42 终端时刻由下式计算 式中H x tf u tf tf tf 函数H最优轨线终端处的值 上述总共个2n r q 1方程 可联解出2n r q 1个变量 5 32 43 最后 分析哈密尔顿函数沿最优轨线随时间的变化规律 哈密顿函数H对时间的全导数为 5 33 44 如果u为最优控制 必满足 及 5 34 因此 有 上式表明 哈密顿函数H沿最优轨线对时间的全导数等于它对时间的偏导数 45 当H不显含t时 恒有 即 常数 5 35 这就是说 对定常系统 沿最优轨线H恒为常值 46 例4 给定系统状态方程为 设初始状态x 0 0 终端状态约束曲线x1 1 x2 1 1 0求使性能泛函 取极小时的最优控制u t 及最优轨线x t 47 解这是个终端时间tf给定 但终端状态受约束的拉格朗日问题 哈密顿函数 48 由性能泛函取极值的必要条件 得 49 它们的通解为 50 由边界条件确定积分常数 51 代入解得 由终端约束方程x1 1 x2 1 1可解出 3 7 52 最优解 53 结果如图5所示 54 例5 设一阶系统状态方程为 边界条件x 0 1和x tf 0 终端时刻tf待定 试确定最优控制u 使下列性能泛函 为极小 55 解这里 哈密顿函数为 控制方程 正则方程 56 由边
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 二零二五年烧烤店承包经营合同
- 2025版画考试题目及答案
- 2025加料人员考试题及答案
- 消防安全与校园作业管理(3篇)
- 重消防安全创平安校园(3篇)
- 户外安全理论知识培训课件
- 户外园林景观知识培训课件
- 戴口罩课件教学课件
- 戴口罩的课件
- 戒烟知识培训课件
- 乏力诊治与管理专家共识解读 2
- 2025-2030牛结核病防控技术进展与行业影响分析报告
- 2024年泰州市靖江市公安局招聘警务辅助人员真题
- 国际快递基本知识培训课件
- 2025年四川省高考生物试卷(含答案与解析)
- 塔吊拆除安全操作方案模板
- 普惠金融业务讲座
- 虚拟健康咨询接受度分析-洞察及研究
- 多发性周围神经病护理查房
- 2025年河北省廊坊市三河市小升初数学试卷
- 2025年高警示药品管理试题(附答案)
评论
0/150
提交评论