运筹学第六节动态规划_第1页
运筹学第六节动态规划_第2页
运筹学第六节动态规划_第3页
运筹学第六节动态规划_第4页
运筹学第六节动态规划_第5页
已阅读5页,还剩4页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第六章 动态规划主要内容:1、动态规划的基本概念 2、动态规划的最优性原理和基本方程 3、动态规划的模型及其应用重点与难点:动态规划的状态转移方程、基本方程;动态规划的建模思路与方法;运用递推原理确定最优解的方法与技巧。要 求:理解动态规划的基本概念,掌握动态规划的建模步骤和求解方法,能够创造性地建立数学模型,并能运用动态规划方法解决实际问题。§1 动态规划的基本概念例1 最短线路问题。给定一个运输网络(如图),两点之间的数字表示两点间的距离,试求一条从A0到A4的运输线路,使总距离为最短?A0A1B1C1A20B2C2B3A30A40204030705030204040105010

2、406030303030401、阶段对于一给定的多阶段过程,恰当地分为若干个相互联系的阶段,以便能按一定的次序去求解。描述阶段的变量称为阶段变量,常用K表示。1)阶段数固定的问题称为定期多阶段决策问题;如例1,可分为四个阶段。2)阶段数不固定的问题称为不定期多阶段决策问题。如BACDE4724262112、状态状态表示某阶段的出发位置。它既是某阶段过程演变的起点,又是前一阶段决策的结果。例1中,第一阶段有一种状态即A0点,第二阶段有三个状态,即点集合A1,B1,C1,一般第K阶段的状态就是第K阶段所有始点的集合。描述过程状态的变量称为状态变量。第K阶段的状态变量,记为。3、决策决策表示当过程处

3、于某一阶段的某个状态时,可以作出不同的决定(或选择),从而确定下一阶段的状态,这种决定称为决策。描述决策的变量称为决策变量,常用表示处于状态时的决策变量,它是状态变量的函数。如: , 记为决策变量可取值的全体,称为允许决策集合。常用表示状态的允许决策集合。如: ,4、策略全过程的各个阶段上所选择的决策组成的全体称之为全过程策略,记为。若为一决策,则全过程策略由过程的第K阶段开始到终止状态为止的过程,称为问题的后子过程(或K子过程)。其决策函数序列称为k子过程策略,简称子策略,记为。即在实际问题中,可供选择的策略有一定范围,此范围称为允许策略集合,用P表示。从允许策略集合中找出达到最优效果的策略

4、称为最优策略。5、状态转移方程状态转移方程是确定过程由一个状态到另一个状态的演变过程。它描述了由K阶段到K+1阶段的状态转移规律,称之为状态转移方程,记为。6、指标函数和最优值函数用来衡量所实现过程优劣的一种数量指标,称为指标函数。它是定义在全过程和所有后部子过程上确定的数量函数,常用表示。即动态规划的指标函数,应具有可分离性,并满足递推关系。即过程和它的任一子过程的指标是它所包含的各阶段的指标和,即 指标函数具有可加性其中表示第j阶段的阶段指标上式可写成:由于给定了过程的初始状态及策略,则指标函数也随之确定,所以指标函数是初始状态和策略的函数,记为, 子策略上式也可写成指标函数的最优值,称为

5、最优值函数,记为,即 §2 基本定理和基本方程一、最优性原理作为整个过程的最优策略具有这样的性质:即无论过去的状态和决策如何,对前面的决策所形成的状态而言,余下的诸决策必须构成最优策略。简而言之,一个最优策略的子策略总是最优的。这是动态规划的理论基础。在例1中,如果是的最短路线,则一定是由B1到A4的最短路线。二、基本方程§3 动态规划的模型及求解因为动态规划没有一个标准的数学表达式,所以建立动态规划的模型比它的计算更为困难。一、建立模型的步骤(1)选择阶段变量K按时间或空间的先后顺序将问题划分为满足某种递推关系的若干阶段。(2)选择状态变量状态变量应满足可知性和无后效性。

6、可知性是指过程的各阶段状态变量的取值,都能直接或间接的确定;无后效性是指如果某阶段状态给定后,则在这阶段以后过程的发展不受这阶段以前各阶段状态的影响。通常选择随递推关系累计的量或按某种规律变化的量作为状态变量。(3)选择决策变量(4)写出状态转移方程式(5)列出动态规划的基本方程二、逆序解法与顺序解法动态规划的求解有两种基本方法:逆序解法(后向动态规划方法)、顺序解法(前向动态规划方法)。使用上述两种方法求解时,除了求解的行进方向不同外,在建模时要注意以下区别:1、状态转移方式不同逆序解法中第k段的输入状态为,决策为,输出状态为,即第k+1阶段的状态,所以状态转移方程为:,阶段指标为 。顺序解

7、法中第k段的输入状态为,决策为,输出状态为,所以状态转移方程为:,阶段指标为 。2、指标函数的定义不同逆序解法中,最优指标函数表示第k段从状态出发,到终点后部子过程最优效益值。是整体最优函数值。顺序解法中,最优指标函数表示第k段时从起点到状态的前部子过程最优效益值。是整体最优函数值。3、基本方程形式不同(1)当指标函数为阶段指标和形式,逆序解法中,则基本方程为:顺序解法中, ,基本方程为:(2)当指标函数为阶段指标积形式,逆序解法中,则基本方程为:顺序解法中, ,基本方程为:例1 解:A0A1B1C1A20B2C2B3A30A4020403070503020404010501040603030

8、303040 k=1 k=2 k=3 k=4当k=4时, 当k=3时, 当k=2时, 当k=1时, 的最短距离为110,最短路为: 例2 多阶段资源分配问题有1000台机器生产A、B两种产品,用Y台机器生产A产品,可获得收入5Y,用Y台机器生产B产品,可获得收入4Y,一年后,生产A产品的机器完好率为0.8,生产B产品的机器完好率为0.9,问五年内如何安排生产A、B两种产品,使得总收入最大?解:设k表示年度为第k年初完好机器数(亦即第k-1年未完好机器数)为第k年安排生产A产品的机器数(生产B产品的机器数为)则允许决策集合状态转移方程为基本方程为其中当k=5时, 最优决策,即第五年所有设备都用于生产A产品。当k=4时 最优决策,即第四年所有设备都用于生产A产品。当k=3时 最优决策,即第三年所有机器都用于生产A产品。当k=2时 最优决策,即第二年所有设备都用于生产B产品。当k=1时 最优决策,即第一年所有设备都用于生产B产品。最优策略由题意知:最优策略,最大收入为1748

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论