动态规划的基本概念ppt课件.ppt

上传人：鹏*** IP属地：广东上传时间：2020-04-12 格式：PPT 页数：22 大小：719.50KB 积分：22 举报 版权申诉

已阅读5页，还剩17页未读，继续免费阅读

版权说明：本文档由用户提供并上传，收益归属内容提供方，若内容存在侵权，请进行举报或认领

文档简介

运筹学动态规划 1 第五章动态规划动态规划是运筹学的一个重要分支它是从1951年开始由美国人贝尔曼 R Belman 为首的一个学派发展起来的动态规划在经济管理军事工程技术等方面都有广泛的应用动态规划是解决多阶段决策过程的最优化问题的一种方法所谓多阶段决策过程是指这样一类决策过程它可以把一个复杂问题按时间或空间分成若干个阶段每个阶段都需要作出决策以便得到过程的最优结局由于在每个阶段采取的决策是与时间有关的而且前一阶段采取的决策如何不但与该阶段的经济效果有关还影响以后各阶段的经济效果可见这类多阶段决策问题是一个动态的问题因此处理的方法称为动态规划方法然而动态规划也可以处理一些本来与时间没有关系的静态模型这只要在静态模型中人为地引入时间因素分成时段就可以把它看作是多阶段的动态模型用动态规划方法去处理动态规划对于解决多阶段决策问题的效果是明显的但也有一定的局限性首先它没有统一的处理方法必须根据问题的各种性质并结合一定的技巧来处理另外当变量的维数增大时总的计算量及存贮量急剧增大由于计算机的存贮量及计算速度的限制目前的计算机仍不能用动态规划方法来解决较大规模的问题这就是所谓维数障碍 2 需指出动态规划是求解某类问题的一种方法是考察问题的一种途径而不是一种算法必须对具体问题进行具体分析运用动态规划的原理和方法建立相应的模型然后再用动态规划方法去求解 1动态规划的基本概念 1 1多阶段决策问题在研究社会经济经营管理和工程技术领域内的有关问题中有一类特殊形式的动态决策问题多阶段决策问题在多阶段决策过程中系统的动态过程可以按照时间进程分为相互联系而又相互区别的各个阶段在每个阶段都要进行决策系统在每个阶段存在许多不同的状态在某个时点的状态往往要依某种形式受到过去某些决策的影响而系统的当前状态和决策又会影响系统过程今后的发展因而在寻求多阶段决策问题的最优解时重要的是不能仅仅从眼前的局部利益出发进行决策而需要从系统所经过的整个期间的总效应出发有预见性地进行动态决策找到不同时点的最优决策及整个过程的最优策略下面举例说明什么是多阶段决策问题 4 例1 最短路线问题在线路网络图1中从A至E有一批货物需要调运图上所标数字为各节点之间的运输距离为使总运费最少必须找出一条由A至E总里程最短的路线 A B1 B2 E B3 C2 C3 C1 D2 D3 D1 4 5 3 4 4 4 3 1 6 5 8 8 7 7 10 2 9 6 为了找到由A至E的最短线路可以将该问题分成A B C D E4个阶段在每个阶段都需要作出决策即在A点需决策下一步到B1还是到B2或B3 同样若到达第二阶段某个状态比如B1 需决定走向C1还是C2 依次类推可以看出各个阶段的决策不同由A至E的路线就不同当从某个阶段的某个状态出发作出一个决策则这个决策不仅影响到下一个阶段的距离而且直接影响后面各阶段的行进线路所以这类问题要求在各个阶段选择一个恰当的决策使这些决策序列所决定的一条路线对应的总路程最短图1 5 例2 带回收的资源分配问题某厂新购某种机床125台据估计这种设备5年后将被其它设备所代替此机车如在高负荷状态下工作年损坏率为1 2 年利润为10万元如在低负荷状态下工作年损坏率为1 5 年利润为6万元问应如何安排这些机床的生产负荷才能使5年内获得的利润最大本问题具有时间上的次序性在五年计划的每一年都要作出关于这些机床生产负荷的决策并且一旦作出决策不仅影响到本年利润的多少而且影响到下一年初完好机床数从而影响以后各年的利润所以在每年初作决策时必须将当年的利润和以后各年利润结合起来统筹考虑与上面例1 例2类似的多阶段决策问题还有资源分配生产存贮可靠性背包设备更新问题等等 6 1 2动态规划的基本概念1 阶段动态规划问题通常都具有时间或空间上的次序性因此求解这类问题时首先要将问题按一定的次序划分成若干相互联系的阶段以便能按一定次序去求解如例1 可以按空间次序划分为A B C D E4个阶段而例2 按照时间次序可分成5个阶段 2 状态在多阶段决策过程中每阶段都需要作出决策而决策是根据系统所处情况决定的状态是描述系统情况所必需的信息如例1中每阶段的出发点位置就是状态例2中每年初拥有的完好机床数是作出机床负荷安排的根据所以年初完好机床数是状态一般地状态可以用一个变量来描述称为状态变量记第k阶段的状态变量为xk k 1 2 n 7 3 决策多阶段决策过程的发展是用各阶段的状态演变来描述的阶段决策就是决策者从本阶段某状态出发对下一阶段状态所作出的选择描述决策的变量称为决策变量当第k阶段的状态确定之后可能作出的决策要受到这一状态的影响这就是说决策变量uk还是状态变量xk的函数因此又可将第k阶段xk状态下的决策变量记为uk xk 在实际问题中决策变量的取值往往限制在某一范围之内此范围称为允许决策变量集合记作Dk uk 如例2中取高负荷运行的机床数uk为决策变量则0 uk xk xk是k阶段初完好机床数为允许决策变量集合 4 状态转移方程在多阶段决策过程中如果给定了k阶段的状态变量xk和决策变量uk 则第k 1阶段的状态变量xk 1也会随之而确定也就是说xk 1是xk和uk函数这种关系可记为xk 1 T xk uk 称之为状态转移方程 8 5 策略在一个多阶段决策过程中如果各个阶段的决策变量uk xk k 1 2 n 都已确定则整个过程也就完全确定称决策序列 u1 x1 u2 x2 un xn 为该过程的一个策略从阶段k到阶段n的决策序列称为子策略表示成 uk xk uk 1 xk 1 un xn 如例1中选取一路线A B1 C2 D2 E就是一个策略 u1 A B1 u2 B1 C2 u3 C2 D2 u4 D2 E 由于每一阶段都有若干个可能的状态和多种不同的决策因而一个多阶段决策的实际问题存在许多策略可供选择称其中能够满足预期目标的策略为最优策略例1中存在12条不同路线其中A B2 C1 D2 E是最短线路 6 指标函数用来衡量过程优劣的数量指标称为指标函数在阶段k的xk状态下执行决策uk 不仅带来系统状态的转移而且也必然对目标函数给予影响阶段效应就是执行阶段决策时给目标函数的影响 9 多阶段决策过程关于目标函数的总效应是各阶段的阶段效应累积形成的常见的全过程目标函数有以下两种形式 1 全过程的目标函数等于各阶段目标函数的和即 R r1 x1 u1 r2 x2 u2 rn xn un 2 全过程的目标函数等于各阶段目标函数的积即 R r1 x1 u1 r2 x2 u2 rn xn un 指标函数的最优值称为最优函数值一般 f1 x1 表示从第1阶段x1状态出发至第n阶段最后阶段的最优指标函数 fk xk 表示从第k阶段xk状态出发至第n阶段的最优指标函数 k 1 2 n 10 2动态规划的最优性原理多阶段决策过程的特点是每个阶段都要进行决策具有n个阶段的决策过程的策略是由n个相继进行的阶段决策构成的决策序列由于前阶段的终止状态又是后一阶段的初始状态因此确定阶段最优决策不能只从本阶段的效应出发必须通盘考虑整体规划就是说阶段k的最优决策不应只是本阶段的最优而必须是本阶段及其所有后续阶段的总体最优即关于整个后部子过程的最优决策对此贝尔曼在深入研究的基础上针对具有无后效性的多阶段决策过程的特点提出了著名的多阶段决策的最优性原理整个过程的最优策略具有这样的性质即无论过程过去的状态和决策如何对前面的决策所形成的状态而言余下的诸决策必须构成最优策略简而言之最优性原理的含意就是最优策略的任何一部分子策略也必须是最优的 11 如例1 A B2 C1 D2 E是由A到E的最短路线我们在该路线上任取一点C1 按照最优性原理C1 D2 E应该是C1到E的最短路很容易用反证法证明这一结论的正确性从而说明最优性原理的正确性按最优性原理可以将例1分成A B C D E4个阶段由后向前逐步求出各点到E的最短线路直至求出A至E的最短线路 K 4时出发点有D1 D2 D3 记f4 Di i 1 2 3 为Di到E的最短距离 u4 Di 表示从状态Di出发采取的决策显然 f4 D1 7 u4 D1 Ef4 D2 8 u4 D2 Ef4 D3 6 u4 D3 EK 3时出发点有C1 C2 C3 f3 C1 min d C1D1 f4 D1 d C1D2 f4 D2 min 4 7 2 8 10 u3 C1 D2f3 C2 min d C2D2 f4 D2 d C2D3 f4 D3 min 5 8 7 6 13 u3 C2 D2或D3f3 C3 min d C3D2 f4 D2 d C3D3 f4 D3 min 10 8 9 6 15 u3 C3 D3 12 K 2时出发点有B1 B2 B3f2 B1 min d B1C1 f3 C1 d B1C2 f3 C2 min 6 10 4 13 16 u2 B1 C1f2 B2 min d B2C1 f3 C1 d B2C3 f3 C3 min 3 10 1 15 13 u2 B2 C1f2 B3 min d B3C2 f3 C2 d B3C3 f3 C3 min 8 13 4 15 19 u2 B3 C3K 1时出发点只有Ad AB1 f2 B1 4 16f1 A mind AB2 f2 B2 5 13 18 d AB3 f2 B3 3 19u1 A B2由f1 A 18 可知从起点A到终点E的最短距离为18 13 为了找出最短线路再按计算顺序反推回去可求出最优决策序列即由u1 A B2 u2 B2 C1 u3 C1 D2 u4 D2 E组成最优策略也就是最短线路为 A B2 C1 D2 E 从上面的例子不难看出对于最短线路问题有如下的递推关系函数方程 fk xk min d xk uk xk fk 1 T xk uk fn 1 xn 1 0k n n 1 1 一般情况下多阶段决策问题存在下面的递推关系 fk xk opt rk xk uk xk fk 1 T xk uk uk Dk uk fn 1 xn 1 Ck n n 1 1这里rk xk uk xk 是第阶段采用uk xk 决策产生的阶段效应 fn 1 xn 1 C是边界条件号大多数情况下是号也可能是号称上述递推关系为动态规划的基本方程这个方程是最优化原理的具体表达形式 14 在基本方程中 rk xk uk xk 1 T xk uk 都是已知函数最优子策略fk xk 与fk 1 xk 1 之间是递推关系要求出fk xk 及uk xk 需要先求出fk 1 xk 1 这就决定了应用动态规划基本方程求最优策略总是逆着阶段的顺序进行的另一方面由于k 1阶段的状态xk 1 T xk uk 是由前面的状态和决策所形成的在计算fk 1 xk 1 时还不能具体确定xk 1的这就要求必须就k 1阶段的各个可能状态计算fk 1 xk 1 因此动态规划不但能求出整个问题的最优策略和最优目标值而且还能求出决策过程中所有可能状态的最优策略及最优目标值 15 3建立动态规划数学模型的步骤最优化原理是动态规划的核心所有动态规划问题的递推关系都是根据这个原理建立起来的并且根据递推关系依次计算最终可求得动态规划问题的解一般来说利用动态规划求解实际问题需先建立问题的动态模型具体步骤如下将问题按时间或空间次序划分成若干阶段有些问题不具有时空次序也可以人为地引进时空次序划分阶段正确选择状态变量xk 这一步是形成动态模型的关键状态变量是动态规划模型中最重要的参数一般来说状态变量应具有以下三个特性要能够用来描述决策过程的演变特征要满足无后效性即如果某阶段状态已给定后则以后过程的进展不受以前各状态的影响也就是说过去的历史只通过当前的状态去影响未来的发展递推性即由k阶段的状态变量xk及决策变量uk可以计算出k 1阶段的状态变量xk 1 16 确定决策变量uk及允许决策变量集合Dk uk 根据状态变量之间的递推关系写出状态转移方程 xk 1 T xk uk xk 建立指标函数一般用rk xk uk 描写阶段效应 fk xk 表示k n阶段的最优子策略函数建立动态规划基本方程 fk xk opt rk xk uk xk fk 1 xk 1 uk Dk uk fn 1 xn 1 Ck n n 1 1以上是建立动态规划模型的过程这个过程是正确求解动态规划的基础在动态规划基本方程中 rk xk uk xk 1 T xk uk 都是已知函数最优子策略fk xk 与fk 1 xk 1 之间是递推关系要求出fk xk 及uk xk 需要先求出fk 1 xk 1 这就决定了应用动态规划基本方程求最优策略总是逆着阶段的顺序进行的由后向前逐步计算最终可以算出全过程的最优策略函数值及最优策略 17 另一方面由于k 1阶段的状态xk 1 T xk uk 是由前面的状态xk和决策uk所形成的在计算fk 1 xk 1 时还不能具体确定xk 1的值所以这就要求必须就k 1阶段的各个可能状态计算fk 1 xk 1 因此动态规划方法不但能求出整个问题的最优策略和最优目标值而且还能求出决策过程中所有可能状态的最优策略及最优目标值下面就按上述步骤求解例2 18 例2 带回收的资源分配问题某厂新购某种机床125台据估计这种设备5年后将被其它设备所代替此机床如在高负荷状态下工作年损坏率为1 2 年利润为10万元如在低负荷状态下工作年损坏率为1 5 年利润为6万元问应如何安排这些机床的生产负荷才能使5年内获得的利润最大解以年为阶段 k 1 2 3 4 5取k年初完好的机床数为状态变量xk以k年初投入高负荷运行的机床数为决策变量uk 则低负荷运行机床数是xk uk 于是状态转移方程为 xk 1 1 2uk 4 5 xk uk 0 8xk 0 3uk以利润为目标函数则k年利润为 10uk 6 xk uk 4uk 6xk记fk xk 为k年至5年末最大总利润则动态规划基本方程为 fk xk max 4uk 6xk fk 1 0 8xk 0 3uk 0 uk xkf6 x6 0k 5 4 3 2 1 19 以上是建立动态模型的过程下面具体求解注意动态规划基本方程

人人文库> 全部分类> 教育资料 > 作文作品

温馨提示

1. 本站所有资源如无特殊说明，都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2. 本站的文档不包含任何第三方提供的附件图纸等，如果需要附件，请联系上传者。文件的所有权益归上传用户所有。
3. 本站RAR压缩包中若带图纸，网页内容里面会有图纸预览，若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 人人文库网仅提供信息存储空间，仅对用户上传内容的表现方式做保护处理，对用户上传分享的文档内容本身不做任何修改或编辑，并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容，请与我们联系，我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

动态规划的基本概念ppt课件.ppt

文档简介

温馨提示

最新文档

评论

动态规划的基本概念ppt课件.ppt

文档简介

温馨提示

最新文档

评论

相关文档