运筹学14动态规划2----.ppt_第1页
运筹学14动态规划2----.ppt_第2页
运筹学14动态规划2----.ppt_第3页
运筹学14动态规划2----.ppt_第4页
运筹学14动态规划2----.ppt_第5页
已阅读5页,还剩7页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第五节 动态规划与静态规划之间的关系及其它相关总结 静态规划动态规划 线性规划 非线性规划 5 1逆序 递推 法 设已知初始状态s1 最优值函数fk sk 表示从k阶段到n阶段所得到的最大效益 以求最大化为例来说明 具体方法如下 当阶段k n时 可得最优决策xn xn sn 和最优值fn sn 要注意的是 若D sn 只有一个决策 则可写成xn xn sn 当阶段k n 1时 其中状态转移方程 得到最优决策xn 1 xn 1 sn 1 和最优值fn 1 sn 1 当阶段k k时 其中状态转移方程 得最优决策xk xk sk 和最优值fk sk 如此类推 直到第一阶段 当阶段k 1时 其中状态转移方程 得最优决策x1 x1 s1 和最优值f1 s1 由于初始状态s1已知 故x1 x1 s1 和f1 s1 是确定的 根据状态转移方程按照上述递推过程相反顺序推算下去 就可逐步确定出每阶段的决策及效益 例1用动态规划的逆序法求解下面问题 解 分阶段 按照问题的变量个数划分阶段 分三个阶段 即k 1 2 3 确定决策变量 通常可以取问题中的变量为决策变量 确定状态变量 状态变量与决策变量有密切关系 状态变量一般为累计量或随递推过程变化的量 指标函数 最优指标函数fk sk maxVk 3 状态转移方程 决策变量 边界条件f4 s4 1 基本方程 当阶段k 3时 有 当阶段k 2时 有 有两个解 其中x2 0舍去 因2阶导数在x 2处小于0 故有极大值 当阶段k 1时 有 因此最后可得 与前面一样用微分法 s3 s2 x 2 s1 x 1 x 2 例2某公司有资金10万元 若投资于项目i i 1 2 3 的投资额为xi时 其效益分别为 问如何分配投资数额才能使总效益最大 解 可列出静态规划问题的模型如下 分阶段 考虑效益函数的形式 分三个阶段 即k 1 2 3 确定决策变量 通常可以取静态规划中的变量为决策变量 确定状态变量 状态变量与决策变量有密切关系 状态变量一般为累计量或随递推过程变化的量 此问题中可设 状态转移方程 决策 指标函数 最优指标函数fk sk maxVk 3 基本方程 当阶段k 3时 有 最优决策为 最优目标函数 每一阶段可使用的资金数为状态变量sk 当阶段k 2时 有 是凸函数 最大值点只能在 0 s2 端点上取得 即 当 当 当 时 时 时 当阶段k 1时 有 2阶导数大于0 最优投资方案是全部资金投于第3个项目 可得最大收益200万元 S2 9 2 S2 9 2 2阶导数 0 5 2顺序解法例1 P206 5 3动态规划的优缺点 优点最优解是全局最优解 能得到一系列 包括子过程 的最优解 不需要对系统状态转移方程 阶段效应函数

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论