动态规划的基本概念与方法课件_第1页
动态规划的基本概念与方法课件_第2页
动态规划的基本概念与方法课件_第3页
动态规划的基本概念与方法课件_第4页
动态规划的基本概念与方法课件_第5页
已阅读5页,还剩9页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第一节动态规划的基本概念与方法一、多阶段决策问题1.时间阶段的例子(机器负荷问题)

某厂有1000台机器,现需作一个五年计划,以决定每年安排多少台机器投入高负荷生产(产量大但损耗也大)可使五年的总产量最大。12345S1=1000x1x2x5x4x3s5v1v2v3v4v5s2s3s4第一节动态规划的基本概念与方法一、多阶段决策问题12312.空间阶段的例子(最短路问题)

如图为一线路网络。现要从A点铺设一条管道到E点,图中两点间连线上数字表示两点间距离。现需选一条由A到E的铺管线路,使总距离最短。AEB1B2B3C1C2C3D1D229531225156468101312111410阶段1阶段2阶段3阶段42.空间阶段的例子(最短路问题)

如图为2二、基本概念与方程

1.基本概念阶段——分步求解的过程,用阶段变量k表示,k=1,…,n状态——每阶段初可能的情形或位置,用状态变量Sk表示。

按状态的取值是离散或连续,将动态规划问题分为离散型和连续型。决策——每阶段状态确定后的抉择,即从该状态演变到下阶段某状态的选择,用决策变量xk表示。状态转移——由Sk转变为Sk+1的规律,记Sk+1=T(Sk,xk)。策略——由各阶段决策组成的序列,记P1n={x1,…,xn},

称Pkn={xk,…,xn}为阶段k至n的后部子策略。

二、基本概念与方程

1.基本概念阶段——分步求解的过程,用3阶段指标——每阶段选定决策xk后所产生的效益,记

vk=vk(Sk,xk)。指标函数——各阶段的总效益,记相应于Pkn的指标函数为vkn=vkn(Sk,Pkn)。其中最优的称最优指标函数,记fk=fk(Sk)=optvkn。问题:动态规划的最优解和最优值各是什么?——最优解:最优策略P1n,

最优值:最优指标f1。阶段指标——每阶段选定决策xk后所产生的效益,记指标函数—42.基本原理与基本方程(1)基本原理以最短路为例说明2.基本原理与基本方程(1)基本原理以最短路为例说明5(2)基本方程

根据最优性原理,可建立从后向前逆推求解的递推公式——基本方程:动态规划求解的一般步骤:-确定过程的分段,构造状态变量;-设置决策变量,写出状态转移;-列出阶段指标和指标函数;-写出基本方程,由此逐段递推求解。(2)基本方程

根据最优性原理,可建立从后向6三、求解方法

1.离散型(用表格方式求解)例1用动态规划方法求解前面的最短路问题。AEB1B2B3C1C2C3D1D229531225156468101312111410三、求解方法

1.离散型(用表格方式求解)例1用动态规7AEB1B2B3C1C2C3D1D229531225156468101312111410解:设阶段k=1,2,3,4依次表示4个阶段选路的过程;状态sk表示k阶段初可能处的位置;决策xk表示k阶段初可能选择的路;阶段指标vk表示k阶段与所选择的路段相应的路长;指标函数vk4=表示k至4阶段的总路长;AEB1B2B3C1C2C3D1D22953122515648AEB1B2B3C1C2C3D1D2295312251564681013121114104kSkxkvkvkn=vk+fk+1

fk3C1C2C38712C1D1EC2D2EC3D2EAEB1B2B3C1C2C3D1D22953122515649kSkxkvkvkn=vk+fk+1

fkAEB1B2B3C1C2C3D1D2295312251564681013121114102B1B2B320B1C1D1E14B2C1D1E19B3C2D2EkSkxkvk10kSkxkvkvkn=vk+fk+1

fkAEB1B2B3C1C2C3D1D2295312251564681013121114101A19AB2C1D1EP*14=AB2C1D1Ef1=19(最短路)(最短距)kSkxkvk112.连续型(用公式递推求解)例2用动态规划方法求解前面的机器负荷问题。某种机器可以在高、低两种负荷下进行生产。高负荷年产量8,年完好率0.7;低负荷年产量5,年完好率0.9。现有完好机器1000台,需制定一个5年计划,以决定每年安排多少台机器投入高、低负荷生产,使5年的总产量最大。解:设阶段k=1,…,5表示第k年安排机器的过程;状态sk表示第k年初的完好机器台数;决策xk表示第k年投入高负荷的机器台数;则投入低负荷的台数为sk-xk;状态转移sk+1=0.7xk+0.9(sk-xk);2.连续型(用公式递推求解)例2用动态规划方法求解前面12阶段指标vk=8x

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论