数模(动态规划).ppt

上传人：灯*** IP属地：河北上传时间：2020-01-29 格式：PPT 页数：77 大小：1.06MB 积分：15 举报 版权申诉

已阅读5页，还剩72页未读，继续免费阅读

版权说明：本文档由用户提供并上传，收益归属内容提供方，若内容存在侵权，请进行举报或认领

文档简介

1 数学模型电子教案重庆邮电大学数理学院沈世云 2 第7章动态规划 Dynamicprogramming 动态规划的基本思想最短路径问题投资分配问题背包问题 3 动态规划是用来解决多阶段决策过程最优化的一种数量方法其特点在于它可以把一个n维决策问题变换为几个一维最优化问题从而一个一个地去解决需指出动态规划是求解某类问题的一种方法是考察问题的一种途径而不是一种算法必须对具体问题进行具体分析运用动态规划的原理和方法建立相应的模型然后再用动态规划方法去求解 4 即在系统发展的不同时刻或阶段根据系统所处的状态不断地做出决策每个阶段都要进行决策目的是使整个过程的决策达到最优效果动态决策问题的特点系统所处的状态和时刻是进行决策的重要因素找到不同时刻的最优决策以及整个过程的最优策略多阶段决策问题是动态决策问题的一种特殊形式在多阶段决策过程中系统的动态过程可以按照时间进程分为状态相互联系而又相互区别的各个阶段 5 多阶段决策问题的典型例子 1 生产决策问题企业在生产过程中由于需求是随时间变化的因此企业为了获得全年的最佳生产效益就要在整个生产过程中逐月或逐季度地根据库存和需求决定生产计划 2 机器负荷分配问题某种机器可以在高低两种不同的负荷下进行生产在高负荷下进行生产时产品的年产量g和投入生产的机器数量u1的关系为g g u1 1 2 n 状态决策状态决策状态状态决策 6 这时机器的年完好率为a 即如果年初完好机器的数量为u 到年终完好的机器就为au 0 a 1 在低负荷下生产时产品的年产量h和投入生产的机器数量u2的关系为h h u2 假定开始生产时完好的机器数量为s1 要求制定一个五年计划在每年开始时决定如何重新分配完好的机器在两种不同的负荷下生产的数量使在五年内产品的总产量达到最高相应的机器年完好率b 0 b 1 7 3 航天飞机飞行控制问题由于航天飞机的运动的环境是不断变化的因此就要根据航天飞机飞行在不同环境中的情况不断地决定航天飞机的飞行方向和速度状态使之能最省燃料和实现目的如软着落问题不包含时间因素的静态决策问题本质上是一次决策问题也可以适当地引入阶段的概念作为多阶段的决策问题用动态规划方法来解决 4 线性规划非线性规划等静态的规划问题也可以通过适当地引入阶段的概念应用动态规划方法加以解决 8 5 最短路问题给定一个交通网络图如下其中两点之间的数字表示距离或花费试求从A点到G点的最短距离总费用最小 1 2 3 4 5 6 A B1 B2 C1 C2 C3 C4 D1 D2 D3 E1 E2 E3 F1 F2 G 5 3 1 3 6 8 7 6 3 6 8 5 3 3 8 4 2 2 2 1 3 3 3 5 2 5 6 6 4 3 9 一基本概念1 阶段把一个问题的过程恰当地分为若干个相互联系的阶段以便于按一定的次序去求解描述阶段的变量称为阶段变量阶段的划分一般是根据时间和空间的自然特征来进行的但要便于问题转化为多阶段决策 2 状态表示每个阶段开始所处的自然状况或客观条件通常一个阶段有若干个状态描述过程状态的变量称为状态变量一个数一组数一个向量状态变量的取值有一定的允许集合或范围此集合称为状态允许集合一动态规划的基本思想 10 3 决策表示当过程处于某一阶段的某个状态时可以作出不同的决定从而确定下一阶段的状态这种决定称为决策描述决策的变量称为决策变量决策变量是状态变量的函数可用一个数一组数或一向量多维情形来描述在实际问题中决策变量的取值往往在某一范围之内此范围称为允许决策集合系统在某一阶段的状态转移不但与系统的当前的状态和决策有关而且还与系统过去的历史状态和决策有关 4 多阶段决策过程可以在各个阶段进行决策去控制过程发展的多段过程其发展是通过一系列的状态转移来实现的 11 图示如下状态转移方程是确定过程由一个状态到另一个状态的演变过程如果第k阶段状态变量sk的值该阶段的决策变量一经确定第k 1阶段状态变量sk 1的值也就确定其状态转移方程如下一般形式能用动态规划方法求解的多阶段决策过程是一类特殊的多阶段决策过程即具有无后效性的多阶段决策过程 12 如果状态变量不能满足无后效性的要求应适当地改变状态的定义或规定方法动态规划中能处理的状态转移方程的形式状态具有无后效性的多阶段决策过程的状态转移方程如下无后效性马尔可夫性如果某阶段状态给定后则在这个阶段以后过程的发展不受这个阶段以前各段状态的影响过程的过去历史只能通过当前的状态去影响它未来的发展构造动态规划模型时要充分注意是否满足无后效性的要求状态变量要满足无后效性的要求 13 5 策略是一个按顺序排列的决策组成的集合在实际问题中可供选择的策略有一定的范围称为允许策略集合从允许策略集合中找出达到最优效果的策略称为最优策略 6 状态转移方程是确定过程由一个状态到另一个状态的演变过程描述了状态转移规律 7 指标函数和最优值函数用来衡量所实现过程优劣的一种数量指标为指标函数指标函数的最优值称为最优值函数在不同的问题中指标函数的含义是不同的它可能是距离利润成本产量或资源消耗等动态规划模型的指标函数应具有可分离性并满足递推关系 14 小结指标函数形式和积无后效性可递推 15 解多阶段决策过程问题求出 f1 s1 从k到终点最优策略子策略的最优目标函数值 16 1 动态规划方法的关键在于正确地写出基本的递推关系式和恰当的边界条件简称基本方程要做到这一点就必须将问题的过程分成几个相互联系的阶段恰当的选取状态变量和决策变量及定义最优值函数从而把一个大问题转化成一组同类型的子问题然后逐个求解即从边界条件开始逐段递推寻优在每一个子问题的求解中均利用了它前面的子问题的最优化结果依次进行最后一个子问题所得的最优解就是整个问题的最优解二动态规划的基本思想 17 2 在多阶段决策过程中动态规划方法是既把当前一段和未来一段分开又把当前效益和未来效益结合起来考虑的一种最优化方法因此每段决策的选取是从全局来考虑的与该段的最优选择答案一般是不同的最优化原理作为整个过程的最优策略具有这样的性质无论过去的状态和决策如何相对于前面的决策所形成的状态而言余下的决策序列必然构成最优子策略也就是说一个最优策略的子策略也是最优的 3 在求整个问题的最优策略时由于初始状态是已知的而每段的决策都是该段状态的函数故最优策略所经过的各段状态便可逐段变换得到从而确定了最优路线 18 三建立动态规划模型的步骤1 划分阶段划分阶段是运用动态规划求解多阶段决策问题的第一步在确定多阶段特性后按时间或空间先后顺序将过程划分为若干相互联系的阶段对于静态问题要人为地赋予时间概念以便划分阶段 2 正确选择状态变量选择变量既要能确切描述过程演变又要满足无后效性而且各阶段状态变量的取值能够确定一般地状态变量的选择是从过程演变的特点中寻找 3 确定决策变量及允许决策集合通常选择所求解问题的关键变量作为决策变量同时要给出决策变量的取值范围即确定允许决策集合 19 4 确定状态转移方程根据k阶段状态变量和决策变量写出k 1阶段状态变量状态转移方程应当具有递推关系 5 确定阶段指标函数和最优指标函数建立动态规划基本方程阶段指标函数是指第k阶段的收益最优指标函数是指从第k阶段状态出发到第n阶段末所获得收益的最优值最后写出动态规划基本方程以上五步是建立动态规划数学模型的一般步骤由于动态规划模型与线性规划模型不同动态规划模型没有统一的模式建模时必须根据具体问题具体分析只有通过不断实践总结才能较好掌握建模方法与技巧 20 例一从A地到D地要铺设一条煤气管道其中需经过两级中间站两点之间的连线上的数字表示距离如图所示问应该选择什么路线使总距离最短 A B1 B2 C1 C2 C3 D 2 4 3 3 3 3 2 1 1 1 4 二最短路径问题 21 解整个计算过程分三个阶段从最后一个阶段开始第一阶段 C D C有三条路线到终点D A B1 B2 C1 C2 C3 D 2 4 3 3 3 3 2 1 1 1 4 D C1 C2 C3 显然有f1 C1 1 f1 C2 3 f1 C3 4 22 d B1 C1 f1 C1 3 1f2 B1 mind B1 C2 f1 C2 min3 3d B1 C3 f1 C3 1 44 min6 45 第二阶段 B C B到C有六条路线 A B1 B2 C1 C2 C3 D 2 4 3 3 3 3 2 1 1 1 4 D C1 C2 C3 B1 B2 最短路线为B1 C1 D 23 d B2 C1 f1 C1 2 1f2 B2 mind B2 C2 f1 C2 min3 3d B2 C3 f1 C3 1 43 min6 35 A B1 B2 C1 C2 C3 D 2 4 3 3 3 3 2 1 1 1 4 D C1 C2 C3 B1 B2 最短路线为B2 C1 D 24 第三阶段 A B A到B有二条路线 f3 A 1 d A B1 f2 B1 2 4 6f3 A 2 d A B2 f2 B2 4 3 7 f3 A min min 6 7 6 d A B1 f2 B1 d A B2 f2 B2 最短路线为A B1 C1 D A B1 B2 C1 C2 C3 D 2 4 3 3 3 3 2 1 1 1 4 D C1 C2 C3 B1 B2 A 25 A B1 B2 C1 C2 C3 D 2 4 3 3 3 3 2 1 1 1 4 D C1 C2 C3 B1 B2 A 最短路线为A B1 C1 D路长为6 26 练习1 A B1 B2 C1 C2 C3 C4 D1 D2 D3 E1 E2 E3 F1 F2 G 5 3 1 3 6 8 7 6 3 6 8 5 3 3 8 4 2 2 2 1 3 3 3 5 2 5 6 6 4 最优路线为 A B1 C2 D1 E2 F2 G路长 18 求从A到G的最短路径 3 27 k 5 出发点E1 E2 E3 28 k 2 f2 B1 13u2 B1 C2f2 B2 16u2 B2 C3 29 759 u5 E2 F2 u6 F2 G 最优策略 A B1 B2 C1 C2 C3 C4 D1 D2 D3 E1 E2 E3 F1 F2 G 5 3 1 3 6 8 7 6 3 6 8 5 3 3 8 4 2 2 2 1 3 3 3 5 2 5 6 6 4 3 30 求从A到E的最短路径路线为A B2 C1 D1 E 最短路径为19 A B2 B1 B3 C1 C3 D1 D2 E C2 5 2 14 1 12 6 10 10 4 3 12 11 13 9 6 5 8 10 5 2 练习2 1 31 现有数量为a 万元的资金计划分配给n个工厂用于扩大再生产假设 xi为分配给第i个工厂的资金数量万元 gi xi 为第i个工厂得到资金后提供的利润值万元问题是如何确定各工厂的资金数使得总的利润为最大据此有下式三投资分配问题 32 令 fk x 以数量为x的资金分配给前k个工厂所得到的最大利润值用动态规划求解就是求fn a 的问题当k 1时 f1 x g1 x 因为只给一个工厂当1 k n时其递推关系如下设 y为分给第k个工厂的资金其中0 y x 此时还剩x y 万元的资金需要分配给前k 1个工厂如果采取最优策略则得到的最大利润为fk 1 x y 因此总的利润为 gk y fk 1 x y 33 如果a是以万元为资金分配单位则式中的y只取非负整数0 1 2 x 上式可变为所以根据动态规划的最优化原理有下式 34 例题设国家拨给60万元投资供四个工厂扩建使用每个工厂扩建后的利润与投资额的大小有关投资后的利润函数如下表所示解依据题意是要求f4 60 35 按顺序解法计算第一阶段求f1 x 显然有f1 x g1 x 得到下表第二阶段求f2 x 此时需考虑第一第二个工厂如何进行投资分配以取得最大的总利润 36 最优策略为 40 20 此时最大利润为120万元同理可求得其它f2 x 的值 37 最优策略为 30 20 此时最大利润为105万元 38 最优策略为 20 20 此时最大利润为90万元最优策略为 20 10 此时最大利润为70万元 39 最优策略为 10 0 或 0 10 此时最大利润为20万元 f2 0 0 最优策略为 0 0 最大利润为0万元得到下表最优策略为 20 0 此时最大利润为50万元 40 第三阶段求f3 x 此时需考虑第一第二及第三个工厂如何进行投资分配以取得最大的总利润 41 最优策略为 20 10 30 最大利润为155万元同理可求得其它f3 x 的值得到下表 42 第四阶段求f4 60 即问题的最优策略 43 最优策略为 20 0 30 10 最大利润为160万元 44 练习求投资分配问题得最优策略其中a 50万元其余资料如表所示 45 例某公司打算在3个不同的地区设置4个销售点根据市场部门估计在不同地区设置不同数量的销售点每月可得到的利润如表所示试问在各地区如何设置销售点可使每月总利润最大 x1 2 x2 1 x3 1 f3 4 47 46 有一个徒步旅行者其可携带物品重量的限度为a公斤设有n种物品可供他选择装入包中已知每种物品的重量及使用价值作用问此人应如何选择携带的物品各几件使所起作用使用价值最大这就是背包问题类似的还有工厂里的下料问题运输中的货物装载问题人造卫星内的物品装载问题等四背包问题 47 设xj为第j种物品的装件数非负整数则问题的数学模型如下用动态规划方法求解令fx y 总重量不超过y公斤包中只装有前k种物品时的最大使用价值其中y 0 k 1 2 n 所以问题就是求fn a 48 其递推关系式为当k 1时有 49 例题求下面背包问题的最优解解 a 5 问题是求f3 5 50 51 52 53 54 所以最优解为X 1 1 0 最优值为Z 13 55 练习1 某厂生产三种产品各种产品重量与利润的关系如表所示现将此三种产品运往市场出售运输能力总重量不超过6吨问如何安排运输使总利润最大最优方案 X1 0 2 0 X2 1 0 1 Z 260 56 练习2 求下列问题的最优解 X 2 1 0 最优值为Z 13 57 排序问题指n种零件经过不同设备加工是的顺序问题其目的是使加工周期为最短 1 n 1排序问题即n种零件经过1种设备进行加工如何安排例1 五排序问题 58 1 平均通过设备的时间最小按零件加工时间非负次序排列顺序其时间最小即将加工时间由小到大排列即可零件加工顺序平均通过时间 59 延迟时间 13 6 7 2 按时交货排列顺序零件加工顺序平均通过时间延迟时间 0 60 3 既满足交货时间又使平均通过时间最小零件加工顺序延迟时间 0 平均通过时间 61 2 n 2排序问题即n种零件经过2种设备进行加工如何安排例二 62 经变换为加工顺序图如下 A B T 3 7 5 6 8 9 5 4 3 2 2 2 5 加工周期T 3 7 5 6 8 2 31 63 3 n 3排序问题即n种零件经过3种设备进行加工如何安排例三 64 A B C T 变换 65 排序复原 66 计算 T 6 10 8 7 6 4 3 44 计算依据 67 练习 68 一动态规划的基本概念和最优化原理 1 引例最短路问题假如上图是一个线路网络两点之间连线上的数字表示两点间的距离或费用我们的问题是要将货物从A地运往E地中间通过B C D三个区域在区域内有多条路径可走现求一条由A到E的线路使总距离最短或总费用最小 69 第四阶段由D1到E只有一条路线其长度f4 D1 3 同理f4 D2 4 第三阶段由Cj到Di分别均有两种选择即决策点为D1 决策点为D1 决策点为D2 70 第二阶段由Bj到Cj分别均有三种选择即决策点为C2 决策点为C1或C2 决策点为C2 71 第一阶段由A到B 有三种选择即决策点为B3 f1 A 15说明从A到E的最短距离为12 最短路线的确定可按计算顺序反推而得即A B3 C2 D2 E上述最短路线问题的计算过程也可借助于图形直观的表示出来 72 图中各点上方框的数表示该点到E的最短距离图中红箭线表示

人人文库> 全部分类> 行业资料 > 管理策划

温馨提示

1. 本站所有资源如无特殊说明，都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2. 本站的文档不包含任何第三方提供的附件图纸等，如果需要附件，请联系上传者。文件的所有权益归上传用户所有。
3. 本站RAR压缩包中若带图纸，网页内容里面会有图纸预览，若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 人人文库网仅提供信息存储空间，仅对用户上传内容的表现方式做保护处理，对用户上传分享的文档内容本身不做任何修改或编辑，并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容，请与我们联系，我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

数模(动态规划).ppt

文档简介

温馨提示

最新文档

评论

数模(动态规划).ppt

文档简介

温馨提示

最新文档

评论

相关文档