




免费预览已结束,剩余73页可下载查看
下载本文档
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1,第九章动态规划(续),动态规划的基本原理动态规划方法的基本步骤动态规划方法应用举例,本章以下内容,2,最优化原理(贝尔曼最优化原理)作为一个全过程的最优策略具有这样的性质:对于最优策略过程中的任意状态而言,无论其过去的状态和决策如何,余下的诸决策必构成一个最优子策略。该原理的具体解释是,若某一全过程最优策略为:,动态规划的基本原理,则对上述策略中所隐含的任一状态而言,第k子过程上对应于该状态的最优策略必然包含在上述全过程最优策略p1*中,即为,3,3.动态规划方法的基本步骤,1应将实际问题恰当地分割成n个子问题(n个阶段)。通常是根据时间或空间而划分的,或者在经由静态的数学规划模型转换为动态规划模型时,常取静态规划中变量的个数n,即k=n。2正确地定义状态变量sk,使它既能正确地描述过程的状态,又能满足无后效性动态规划中的状态与一般控制系统中和通常所说的状态的概念是有所不同的,动态规划中的状态变量必须具备以下三个特征:,4,3.动态规划方法的基本步骤,(1)要能够正确地描述受控过程的变化特征。(2)要满足无后效性。即如果在某个阶段状态已经给定,那么在该阶段以后,过程的发展不受前面各段状态的影响,如果所选的变量不具备无后效性,就不能作为状态变量来构造动态规划的模型。(3)要满足可知性。即所规定的各段状态变量的值,可以直接或间接地测算得到。一般在动态规划模型中,状态变量大都选取那种可以进行累计的量。此外,在与静态规划模型的对应关系上,通常根据经验,线性与非线性规划中约束条件的个数,相当于动态规划中状态变量sk的维数而前者约束条件所表示的内容,常就是状态变量sk所代表的内容。,5,3.动态规划方法的基本步骤,3正确地定义决策变量及各阶段的允许决策集合Uk(sk),根据经验,一般将问题中待求的量,选作动态规划模型中的决策变量。或者在把静态规划模型(如线性与非线性规划)转换为动态规划模型时,常取前者的变量xj为后者的决策变量uk。4.能够正确地写出状态转移方程,至少要能正确反映状态转移规律。如果给定第k阶段状态变量sk的值,则该段的决策变量uk一经确定,第k+1段的状态变量sk+1的值也就完全确定,即有sk+1=Tk(sk,uk),6,3.动态规划方法的基本步骤,5根据题意,正确地构造出目标与变量的函数关系目标函数,目标函数应满足下列性质:(1)可分性,即对于所有k后部子过程,其目标函数仅取决于状态sk及其以后的决策uk,uk+1,un,就是说它是定义在全过程和所有后部子过程上的数量函数。(2)要满足递推关系,即(3)函数对其变元Rk+1来说要严格单调。,7,6写出动态规划函数基本方程例如常见的指标函数是取各段指标和的形式其中表示第i阶段的指标,它显然是满足上述三个性质的。所以上式可以写成:,3.动态规划方法的基本步骤,8,学习方法建议:第一步先看问题,充分理解问题的条件、情况及求解目标。第二步结合前面讲到的理论和解题过程,考虑如何着手进行求解该问题的工作。分析针对该动态规划问题的“四大要素、一个方程”这一步在开始时会感到困难,但是一定要下决心去思考,在思考过程中深入理解前文讲到的概念和理论。,4.动态规划方法应用举例,9,第三步动手把求解思路整理出来,或者说,把该问题作为习题独立的来做。第四步把自己的求解放到一边,看书中的求解方法,要充分理解教材中的论述。第五步对照自己的求解,分析成败。,4.动态规划方法应用举例,10,1.动态规划的四大要素状态变量及其可能集合xkXk决策变量及其允许集合ukUk状态转移方程xk+1=Tk(xk,uk)阶段效应rk(xk,uk),4.动态规划方法应用举例,11,2.动态规划基本方程fn+1(xn+1)=0(边界条件)fk(xk)=opturk(xk,uk)+fk+1(xk+1)k=n,1,4.动态规划方法应用举例,12,求最短路径,13,求最短路径例5.5,14,将问题分成五个阶段,第k阶段到达的具体地点用状态变量xk表示,例如:x2=B3表示第二阶段到达位置B3,等等。这里状态变量取字符值而不是数值。,将决策定义为到达下一站所选择的路径,例如目前的状态是x2=B3,这时决策允许集合包含三个决策,它们是D2(x2)=D2(B3)=B3C1,B3C2,B3C3,求最短路径,15,最优指标函数fk(xk)表示从目前状态到E的最短路径。终端条件为f5(x5)=f5(E)=0其含义是从E到E的最短路径为0。,第四阶段的递推方程为:,求最短路径,16,其中*表示最优值,在上表中,由于决策允许集合D4(x4)中的决策是唯一的,因此这个值就是最优值。,由此得到f4(x4)的表达式。由于这是一个离散的函数,取值用列表表示:,求最短路径,17,第三阶段的递推方程为:,求最短路径,18,由此得到f3(x3)的表达式:,求最短路径,19,求最短路径,20,由此得到f2(x2)的表达式:,求最短路径,21,第一阶段的递推方程为:,求最短路径,22,由此得到f1(x1)的表达式,求最短路径,23,资源分配问题,24,例5.6:有资金4万元,投资A、B、C三个项目,每个项目的投资效益与投入该项目的资金有关。三个项目A、B、C的投资效益(万吨)和投入资金(万元)关系见下表:,求对三个项目的最优投资分配,使总投资效益最大。,资源分配问题,25,阶段k:每投资一个项目作为一个阶段;状态变量xk:投资第k个项目前的资金数;决策变量dk:第k个项目的投资;决策允许集合:0dkxk状态转移方程:xk+1=xk-dk阶段指标:vk(xk,dk)见表中所示;递推方程:fk(xk)=maxvk(xk,dk)+fk+1(xk+1)终端条件:f4(x4)=0,资源分配问题,26,k=4,f4(x4)=0k=3,0d3x3,x4=x3-d3,资源分配问题,27,k=2,0d2x2,x3=x2-d2,资源分配问题,28,k=1,0d1x1,x2=x1-d1,资源分配问题,29,背包问题,30,背包问题,31,则Maxz=c1x1+c2x2+cnxns.t.w1x1+w2x2+wnxnWx1,x2,xn为正整数,阶段k:第k次装载第k种物品(k=1,2,n)状态变量xk:第k次装载时背包还可以装载的重量;决策变量dk:第k次装载第k种物品的件数;,背包问题,32,4.决策允许集合:Dk(xk)=dk|0dkxk/wk,dk为整数;5.状态转移方程:xk+1=xk-wkdk6.阶段指标:vk=ckdk7.递推方程fk(xk)=maxckdk+fk+1(xk+1)=maxckdk+fk+1(xk-wkdk)8.终端条件:fn+1(xn+1)=0,背包问题,33,例5.7:对于一个具体问题c1=65,c2=80,c3=30;w1=2,w2=3,w3=1;以及W=5用动态规划求解f4(x4)=0对于k=3,背包问题,34,对于k=3,列出f3(x3)的数值表如下:,35,对于k=2,列出f2(x2)的数值表,36,对于k=1,列出f1(x1)的数值表,37,38,机器负荷分配问题,39,40,构造动态规划模型如下:阶段k:运行年份(k=1,2,3,4,5,6),其中k=1表示第一年初,依次类推;k=6表示第五年末(即第六年初)。状态变量xk:第k年初完好的机器数(k=1,2,3,4,5,6),其中x6表示第五年末(即第六年初)的完好机器数。决策变量dk:第k年投入高负荷运行的机器数;状态转移方程:xk+1=0.7dk+0.9(xk-dk)决策允许集合:Dk(xk)=dk|0dkxk阶段指标:vk(xk,dk)=8dk+5(xk-dk)终端条件:f6(x6)=0,机器负荷分配问题,41,递推方程:fk(xk)=maxvk(xk,dk)+fk+1(xk+1)dkDk(xk)=max8dk+5(xk-dk)+fk+10.7dk+0.9(xk-dk)0dkxk,机器负荷分配问题,42,f5(x5)=max8d5+5(x5-d5)+f6(x6)0d5x5=max3d5+5x5=8x5,d5*=x50d5x5f4(x4)=max8d4+5(x4-d4)+f5(x5)0d4x4=max8d4+5(x4-d4)+8x50d4x4=max8d4+5(x4-d4)+80.7d4+0.9(x4-d4)0d4x4=max1.4d4+12.3x4=13.7x4,d4*=x40d4x4,机器负荷分配问题,43,f3(x3)=max8d3+5(x3-d3)+f4(x4)0d3x3=max8d3+5(x3-d3)+13.7x40d3x3=max8d3+5(x3-d3)+13.70.7d3+0.9(x3-d3)0d3x3=max0.28d3+17.24x3=17.52x3,d3*=x30d3x3,机器负荷分配问题,44,f2(x2)=max8d2+5(x2-d2)+f3(x3)0d2x2=max8d2+5(x2-d2)+17.52x30d2x2=max8d2+5(x2-d2)+17.520.7d2+0.9(x2-d2)0d2x2=max-0.504d2+20.77x2=20.77x2,d2*=00d2x2,机器负荷分配问题,45,f1(x1)=max8d1+5(x1-d1)+f2(x2)0d1x1=max8d1+5(x1-d1)+20.77x20d1x1=max8d1+5(x1-d1)+20.770.7d1+0.9(x1-d1)0d1x1=max-0.05d1+23.69x1=23.69x1,d1*=00d1x1,机器负荷分配问题,46,由此可以得到:f1(x1)=23.69x1,d1*=0f2(x2)=20.77x2,d2*=0f3(x3)=17.52x3,d3*=x3f4(x4)=13.60 x4,d4*=x4f5(x5)=8x5d5*=x5用x1=1000代入,得到五年最大产量为f1(x1)=f1(1000)=23690,机器负荷分配问题,47,每年投入高负荷运行的机器数以每年初完好的机器数为:x1=1000d1*=0,x2=0.7d1+0.9(x1-d1)=900d2*=0,x3=0.7d2+0.9(x2-d2)=810d3*=x3=810,x4=0.7d3+0.9(x3-d3)=567d4*=x4=567,x5=0.7d4+0.9(x4-d4)=397d5*=x5=397,x6=0.7d5+0.9(x5-d5)=278,机器负荷分配问题,48,在这个例子中,状态变量的终端值x6是未加约束的,如果要求在第五年末(即第六年初)完好的机器数不少于500台,这时决策变量d5的决策允许集合将成为:D5(x5)=d5|0.7d5+0.9(x5-d5)500,d50即0.9x5-0.2d5500d50或0d54.5x5-2500,容易想象,这时的最大产量将比x6是自由的情况下小。这个例子可以推广到一般情况。设高负荷生产时机器的完好率为k1,单台产量为p1;低负荷完好率为k2,单台产量为p2。若有t满足:,机器负荷分配问题,49,则从1t-1年,年初将全部完好机器投入低负荷运行,从tn年,年初将全部完好机器投入高负荷运行,这样的决策,将使总产量达到最大。,机器负荷分配问题,50,生产库存问题,51,例5.9:一个工厂生产某种产品,1-7月份生产成本和产品需求量的变化情况如下表:,生产库存问题,52,阶段k:月份,k=1,2,7,8;状态变量xk:第k个月初(发货以前)的库存量;决策变量dk:第k个月的生产量;状态转移方程:xk+1=xk-rk+dk;决策允许集合:Dk(xk)=dk|dk0,rk+1xk+1H=dk|dk0,rk+1xk-rk+dkH;阶段指标:vk(xk,dk)=ckdk;终端条件:f8(x8)=0,x8=0;,生产库存问题,53,递推方程:fk(xk)=minvk(xk,dk)+fk+1(xk+1)dkDk(xk)=minckdk+fk+1(xk-rk+dk)dkDk(xk),对于k=7因为x8=0有d7=0递推方程为f7(x7)=minc7d7+f8(x8)=0d7=0,生产库存问题,54,对于k=6因为d7=0,所以x7=r7=4而x6-r6+d6=x7=4因此有d6=x7+r6-x6=4+7-x6=11-x6也是唯一的决策。因此递推方程为:f6(x6)=minc6d6+f7(x7)d6=11-x6=10d6=10(11-x6)=110-10 x6,生产库存问题,55,对于k=5f5(x5)=minc5d5+f6(x6)d5D5(x5)=min20d5+110-10 x6d5D5(x5)=min20d5+110-10(x5-r5+d5)d5D5(x5)=min20d5+110-10(x5-2+d5)d5D5(x5)=min10d5-10 x5+130d5D5(x5)D5(x5)=d5|d50,r6x5-r5+d5H=d5|d50,r6+r5-x5d5H+r5-x5=d5|d50,9-x5d511-x5,生产库存问题,56,因为x5H=9,因此9-x50,决策允许集合可以简化为D5(x5)=d5|9-x5d511-x5递推方程成为f5(x5)=min10d5-10 x5+1309-x5d511-x5=10(9-x5)-10 x5+130=220-20 x5d5*=9-x5,生产库存问题,57,对于k=4f4(x4)=minc4d4+f5(x5)d4D4(x4)=min17d4+220-20 x5d4D4(x4)=min17d4+220-20(x4-r4+d4)d4D4(x4)=min17d4+220-20(x4-3+d4)d4D4(x4)=min-3d4-20 x4+280d4D4(x4),生产库存问题,58,D4(x4)=d4|d40,r5x4-r4+d4H=d4|d40,r5+r4-x4d4H+r4-x4=d4|d40,5-x4d412-x4=d4|max0,5-x4d412-x4,由于在f4(x4)的表达式中d4的系数是-3,因此d4在决策允许集合中应取集合中的最大值,即d4=12-x4由此f4(x4)=-3(12-x4)-20 x4+280=-17x4+244,生产库存问题,59,对于k=3f3(x3)=minc3d3+f4(x4)d3D3(x3)=min13d3+244-17x4d3D3(x3)=min13d3+244-17(x3-r3+d3)d3D3(x3)=min-4d3-17x3+329d3D3(x3)D3(x3)=d3|d30,r4x3-r3+d3H=d3|d30,r4+r3-x3d3H+r3-x3=d3|d30,8-x3d314-x3=d3|max0,8-x3d314-x3由此f3(x3)=-4(14-x3)-17x3+329=-13x3+273,d3*=14-x3,生产库存问题,60,对于k=2f2(x2)=minc2d2+f3(x3)d2D2(x2)=min18d2+273-13x3d2D2(x2)=min18d2+273-13(x2-r2+d2)d2D2(x2)=min18d2+273-13(x2-8+d2)d2D2(x2)=min5d2-13x2+377d2D2(x2)D2(x2)=d2|d20,r3x2-r2+d2H=d2|d20,r3+r2-x2d2H+r2-x2=d2|d
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 七彩课堂下册数学试卷
- 政府茶叶采摘活动方案策划(3篇)
- 五一饮料促销活动方案策划(3篇)
- 气泡焊接施工方案(3篇)
- 云南白酒酒窖施工方案(3篇)
- 隐蔽工程房屋施工方案(3篇)
- 心理电影剪辑活动策划方案(3篇)
- 基础安全施工方案(3篇)
- 住宅夹层施工方案(3篇)
- 老年骨质疏松症的护理
- 2025年贵州省存量房买卖合同
- 2024-2025学年湖北省武汉市高一上学期1月期末考试英语试题(解析版)
- 既有供暖蒸汽管网及设施改造项目建议书(参考范文)
- 2025-2030中国细胞分选机行业市场发展趋势与前景展望战略研究报告
- 中国特色社会主义知识点总结中职高考政治一轮复习
- 马工程西方经济学(精要本第三版)教案
- 2024年家政服务业职业技能大赛家庭照护赛项技术工作文件
- 电信装维人员服务规范
- 2025年水文勘测工(中级)职业技能考试题(附答案)
- 加油站气象灾害防御制度
- 企业事故隐患内部报告奖励制度
评论
0/150
提交评论