动态规划讲解+例子ppt课件.ppt

上传人：鹏*** IP属地：广东上传时间：2020-04-12 格式：PPT 页数：52 大小：2.43MB 积分：22 举报 版权申诉

已阅读5页，还剩47页未读，继续免费阅读

版权说明：本文档由用户提供并上传，收益归属内容提供方，若内容存在侵权，请进行举报或认领

文档简介

1 第一讲动态规划 DynamicProgramming 动态规划的基本概念和思想最短路径问题投资分配问题背包问题排序问题 2 动态规划是运筹学的一个分支是求解多阶段决策过程最优化问题的数学方法动态规划在经济管理工程技术工农业生产及军事部门中都有着广泛的应用并且获得了显著的效果学习动态规划我们首先要了解多阶段决策问题 3 最短路径问题给定一个交通网络图如下其中两点之间的数字表示距离或运费试求从A点到G点的最短距离总运输费用最小 1 2 3 4 5 6 A B1 B2 C1 C2 C3 C4 D1 D2 D3 E1 E2 E3 F1 F2 G 5 3 1 3 6 8 7 6 3 6 8 5 3 3 8 4 2 2 2 1 3 3 3 5 2 5 6 6 4 3 4 背包问题有一个徒步旅行者其可携带物品重量的限度为a公斤设有n种物品可供他选择装入包中已知每种物品的重量及使用价值作用问此人应如何选择携带的物品各几件使所起作用使用价值最大类似的还有工厂里的下料问题运输中的货物装载问题人造卫星内的物品装载问题等 5 生产决策问题企业在生产过程中由于需求是随时间变化的因此企业为了获得全年的最佳生产效益就要在整个生产过程中逐月或逐季度地根据库存和需求决定生产计划机器负荷分配问题某种机器可以在高低两种不同的负荷下进行生产要求制定一个五年计划在每年开始时决定如何重新分配完好的机器在两种不同的负荷下生产的数量使在五年内产品的总产量达到最高航天飞机飞行控制问题由于航天飞机的运动的环境是不断变化的因此就要根据航天飞机飞行在不同环境中的情况不断地决定航天飞机的飞行方向和速度状态使之能最省燃料和完成飞行任务如软着陆 6 根据过程的特性可以将过程按空间时间等标志分为若干个互相联系又互相区别的阶段在每一个阶段都需要做出决策从而使整个过程达到最好的效果各个阶段决策的选取不是任意确定的它依赖于当前面临的状态又影响以后的发展当各个阶段的决策确定后就组成了一个决策序列因而也就决定了整个过程的一条活动路线这样的一个前后关联具有链状结构的多阶段过程就称为多阶段决策问题多阶段决策过程的特点 7 针对多阶段决策过程的最优化问题美国数学家Bellman等人在20世纪50年代初提出了著名的最优化原理把多阶段决策问题转化为一系列单阶段最优化问题从而逐个求解创立了解决这类过程优化问题的新方法动态规划对最佳路径最佳决策过程所经过的各个阶段其中每个阶段始点到全过程终点的路径必定是该阶段始点到全过程终点的一切可能路径中的最佳路径最优决策这就是Bellman提出的著名的最优化原理简言之一个最优策略的子策略必然也是最优的 Bellman在1957年出版的 DynamicProgramming 是动态规划领域的第一本著作 8 例1 从A地到E地要铺设一条煤气管道其中需经过三级中间站两点之间的连线上的数字表示距离如图所示问应该选择什么路线使总距离最短二最短路径问题 A B2 B1 B3 C1 C3 D1 D2 E 5 2 14 1 12 6 10 10 4 3 12 11 13 9 6 5 8 10 5 2 1 C2 9 解整个计算过程分四个阶段从最后一个阶段开始第四阶段 D E D有两条路线到终点E 显然有 A B2 B1 B3 C1 C3 D1 D2 E 5 2 14 1 12 6 10 10 4 3 12 11 13 9 6 5 8 10 5 2 1 C2 10 首先考虑经过的两条路线第三阶段 C D C到D有6条路线最短路线为 A B2 B1 B3 C1 C3 D1 D2 E 5 2 14 12 6 10 10 4 3 12 11 13 9 6 5 8 10 5 2 1 C2 11 A B2 B1 B3 C1 C3 D1 D2 E 5 2 14 12 6 10 10 4 3 12 11 13 9 6 5 8 10 5 2 1 C2 最短路线为考虑经过的两条路线 12 A B2 B1 B3 C1 C3 D1 D2 E 5 2 14 12 6 10 10 4 3 12 11 13 9 6 5 8 10 5 2 1 C2 最短路线为考虑经过的两条路线 13 A B2 B1 B3 C1 C3 D1 D2 E 5 2 14 12 6 10 10 4 3 12 11 13 9 6 5 8 10 5 2 1 C2 最短路线为第二阶段 B C B到C有9条路线首先考虑经过的3条路线 14 A B2 B1 B3 C1 C3 D1 D2 E 5 2 14 12 6 10 10 4 3 12 11 13 9 6 5 8 10 5 2 1 C2 最短路线为考虑经过的3条路线 15 A B2 B1 B3 C1 C3 D1 D2 E 5 2 14 12 6 10 10 4 3 12 11 13 9 6 5 8 10 5 2 1 C2 最短路线为考虑经过的3条路线 16 A B2 B1 B3 C1 C3 D1 D2 E 5 2 14 12 6 10 10 4 3 12 11 13 9 6 5 8 10 5 2 1 C2 最短路线为第一阶段 A B A到B有3条路线最短距离为19 17 动态规划是用来解决多阶段决策过程最优化的一种数量方法其特点在于它可以把一个n维决策问题变换为几个一维最优化问题从而一个一个地去解决需指出动态规划是求解某类问题的一种方法是考察问题的一种途径而不是一种算法必须对具体问题进行具体分析运用动态规划的原理和方法建立相应的模型然后再用动态规划方法去求解即在系统发展的不同时刻或阶段根据系统所处的状态不断地做出决策动态决策问题的特点系统所处的状态和时刻是进行决策的重要因素找到不同时刻的最优决策以及整个过程的最优策略 18 动态规划方法的关键在于正确地写出基本的递推关系式和恰当的边界条件简称基本方程要做到这一点就必须将问题的过程分成几个相互联系的阶段恰当的选取状态变量和决策变量及定义最优值函数从而把一个大问题转化成一组同类型的子问题然后逐个求解即从边界条件开始逐段递推寻优在每一个子问题的求解中均利用了它前面的子问题的最优化结果依次进行最后一个子问题所得的最优解就是整个问题的最优解 19 2 在多阶段决策过程中动态规划方法是既把当前一段和未来一段分开又把当前效益和未来效益结合起来考虑的一种最优化方法因此每段决策的选取是从全局来考虑的与该段的最优选择答案一般是不同的最优化原理作为整个过程的最优策略具有这样的性质无论过去的状态和决策如何相对于前面的决策所形成的状态而言余下的决策序列必然构成最优子策略也就是说一个最优策略的子策略也是最优的 3 在求整个问题的最优策略时由于初始状态是已知的而每段的决策都是该段状态的函数故最优策略所经过的各段状态便可逐段变换得到从而确定了最优路线 20 动态规划求解的多阶段问题的特点每个阶段的最优决策过程只与本阶段的初始状态有关而与以前各阶段的决策即为了到达本阶段的初始状态而采用哪组决策路线无关换言之本阶段之前的状态与决策只是通过系统在本阶段所处的初始状态来影响本阶段及以后各个阶段的决策或者说系统过程的历史只能通过系统现阶段的状态去影响系统的未来具有这种性质的状态称为无后效性即马尔科夫性状态动态规划方法只适用于求解具有无后效性状态的多阶段决策问题 21 现有数量为a 万元的资金计划分配给n个工厂用于扩大再生产假设 xi为分配给第i个工厂的资金数量万元 gi xi 为第i个工厂得到资金后提供的利润值万元问题如何确定各工厂的资金数使得总的利润为最大据此有下式三投资分配问题 22 令 fk x 表示以数量为x的资金分配给前k个工厂所得到的最大利润值用动态规划求解就是求fn a 的问题当k 1时 f1 x g1 x 因为只给一个工厂当1 k n时其递推关系如下设 y为分给第k个工厂的资金其中0 y x 此时还剩x y 万元的资金需要分配给前k 1个工厂如果采取最优策略则得到的最大利润为fk 1 x y 因此总的利润为 gk y fk 1 x y 23 如果a是以万元为资金分配单位则式中的y只取非负整数0 1 2 x 上式可变为所以根据动态规划的最优化原理有下式 24 例2 设国家拨给60万元投资供四个工厂扩建使用每个工厂扩建后的利润与投资额的大小有关投资后的利润函数如下表所示解依据题意是要求f4 60 25 按顺序解法计算第一阶段求f1 x 显然有f1 x g1 x 得到下表第二阶段求f2 x 此时需考虑第一第二个工厂如何进行投资分配以取得最大的总利润 26 最优策略为 40 20 此时最大利润为120万元同理可求得其它f2 x 的值 27 最优策略为 30 20 此时最大利润为105万元 28 最优策略为 20 20 此时最大利润为90万元最优策略为 20 10 此时最大利润为70万元 29 最优策略为 10 0 或 0 10 此时最大利润为20万元 f2 0 0 最优策略为 0 0 最大利润为0万元得到下表最优策略为 20 0 此时最大利润为50万元 30 第三阶段求f3 x 此时需考虑第一第二及第三个工厂如何进行投资分配以取得最大的总利润 31 最优策略为 20 10 30 最大利润为155万元同理可求得其它f3 x 的值得到下表 32 第四阶段求f4 60 即问题的最优策略 33 最优策略为 20 0 30 10 最大利润为160万元 34 有一个徒步旅行者其可携带物品重量的限度为a公斤设有n种物品可供他选择装入包中已知每种物品的重量及使用价值作用问此人应如何选择携带的物品各几件使所起作用使用价值最大这就是背包问题类似的还有工厂里的下料问题运输中的货物装载问题人造卫星内的物品装载问题等四背包问题 35 设xj为第j种物品的装件数非负整数则问题的数学模型如下用动态规划方法求解令fk y 总重量不超过y公斤包中只装有前k种物品时的最大使用价值其中y 0 k 1 2 n 所以问题就是求fn a 36 其递推关系式为当k 1时有 37 例3 求下面背包问题的最优解解 a 5 问题是求f3 5 38 39 40 41 42 所以最优解为X 1 1 0 最优值为Z 13 总结解动态规划的一般方法从终点逐段向始点方向寻找最小大的方法 43 排序问题指n种零件经过不同设备加工是的顺序问题其目的是使加工周期为最短 1 n 1排序问题即n种零件经过1种设备进行加工如何安排例5 1 五排序问题 44 1 平均通过设备的时间最小按零件加工时间非负次序排列顺序其时间最小即将加工时间由小到大排列即可零件加工顺序平均通过时间延迟时间 13 6 7 45 2 按时交货排列顺序零件加工顺序平均通过时间延迟时间 0 46 3 既满

人人文库> 全部分类> 教育资料 > 作文作品

温馨提示

1. 本站所有资源如无特殊说明，都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2. 本站的文档不包含任何第三方提供的附件图纸等，如果需要附件，请联系上传者。文件的所有权益归上传用户所有。
3. 本站RAR压缩包中若带图纸，网页内容里面会有图纸预览，若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 人人文库网仅提供信息存储空间，仅对用户上传内容的表现方式做保护处理，对用户上传分享的文档内容本身不做任何修改或编辑，并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容，请与我们联系，我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

动态规划讲解+例子ppt课件.ppt

文档简介

温馨提示

最新文档

评论

动态规划讲解+例子ppt课件.ppt

文档简介

温馨提示

最新文档

评论

相关文档