




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、2021/6/71 2021/6/72 求解最短路问题求解最短路问题 A1 6 4 1 4 3 3 3 3 5 1 4 2 4 7 4 3 6 3 4 2 Q A2 T A3 B1 B2 C2 B3 C1 2021/6/73 分阶段的最短路径 : C1T 3 - : B1C1T 4 - :A2B1C1T 7 - -: QA2B1C1T 11 Q-A3B1C1T 11 Q-A3B2C2T 11 2021/6/74 最短路径最短路径 A1 6 4 1 4 3 3 3 3 5 1 4 2 4 7 4 3 6 3 4 2 Q A2 T A3 B1 B2 C2 B3 C1 3 4 4 7 6 11 7
2、8 11 2021/6/75 最短路径解的特点 1、可以将全过程求解分为若干阶段求解;- - 2、在全过程最短路径中,将会出现阶段的最 优路径;- 3、前面的终点确定,后面的路径也就确定了, 且与前面的路径(如何找到的这个终点)无关; - 3、逐段地求解最优路径,势必会找到一个全 过程最优路径。- 2021/6/76 动态规划是解决多阶段最优决策的方法动态规划是解决多阶段最优决策的方法, 由美国数学家贝尔曼由美国数学家贝尔曼(R. Bellman) 于于 1951 年首先提出年首先提出; 1957年贝尔曼发表动态规划方面的第一部年贝尔曼发表动态规划方面的第一部 专著专著“动态规划动态规划”,
3、标志着运筹学的一标志着运筹学的一 个个 新分支的创立。新分支的创立。 2021/6/77 动态规划将复杂的多阶段决策问题分解为动态规划将复杂的多阶段决策问题分解为 一系列简单的、离散的单阶段决策问题一系列简单的、离散的单阶段决策问题, 采用顺序求解方法采用顺序求解方法, 通过解一系列小问题通过解一系列小问题 达到求解整个问题目的达到求解整个问题目的; 动态规划的各个决策阶段不但要考虑本阶动态规划的各个决策阶段不但要考虑本阶 段的决策目标段的决策目标, 还要兼顾整个决策过程的还要兼顾整个决策过程的 整体目标整体目标, 从而实现整体最优决策从而实现整体最优决策. 2021/6/78 离散确定型离散
4、确定型 离散随机型离散随机型 连续确定型连续确定型 连续随机型连续随机型 2021/6/79 依赖分析者的经验和技巧依赖分析者的经验和技巧 2021/6/710 通常多阶段决策过程的发展是通过状态的一系列变换来通常多阶段决策过程的发展是通过状态的一系列变换来 实现的。一般情况下,系统在某个阶段的状态转移除与本阶实现的。一般情况下,系统在某个阶段的状态转移除与本阶 段的状态和决策有关外,还可能与系统过去经历的状态和决段的状态和决策有关外,还可能与系统过去经历的状态和决 策有关。因此,问题的求解就比较困难复杂。而适合于用动策有关。因此,问题的求解就比较困难复杂。而适合于用动 态规划方法求解的只是一
5、类特殊的多阶段决策问题,即具有态规划方法求解的只是一类特殊的多阶段决策问题,即具有 “无后效性无后效性”的多阶段决策过程。的多阶段决策过程。 具有无后效性的多阶段决策过程的特点是系统过去的历史,具有无后效性的多阶段决策过程的特点是系统过去的历史, 只能通过现阶段的状态去影响系统的未来,当前的状态就是只能通过现阶段的状态去影响系统的未来,当前的状态就是 后过程发展的初始条件。后过程发展的初始条件。 2021/6/711 动态规划在工程技术动态规划在工程技术, 企业管理企业管理, 军事部军事部 门有广泛的应用门有广泛的应用; 可解决资源分配可解决资源分配, 生产生产 调度调度, 库存管理库存管理,
6、 路径优化路径优化, 设备更新设备更新, 投投 资规划资规划, 排序问题和生产过程的最优控制排序问题和生产过程的最优控制 等问题等问题 2021/6/712 使用动态规划方法求解决策问题首先要将使用动态规划方法求解决策问题首先要将 问题改造成符合动态规划求解要求的形式问题改造成符合动态规划求解要求的形式, , 要涉及以下概念要涉及以下概念: : (1)(1)阶段阶段 (2)(2)状态状态 (3)(3)决策与策略决策与策略 (4)(4)状态转移方程状态转移方程 (5)(5)指标函数指标函数 (6)(6)基本方程基本方程 2021/6/713 把一个复杂决策问题按时间或空间特把一个复杂决策问题按时
7、间或空间特 征分解为若干征分解为若干(n)(n)个相互联系的阶段个相互联系的阶段 (stage), (stage), 以便按顺序求解以便按顺序求解; ; 阶段变量描述当前所处的阶段位置,一阶段变量描述当前所处的阶段位置,一 般用下标般用下标 k 表示表示; ; 2021/6/714 每阶段有若干状态每阶段有若干状态(state), 表示某一阶段决策表示某一阶段决策 面临的条件或所处位置及运动特征的量面临的条件或所处位置及运动特征的量,称为称为 状态。反映状态变化的量叫作状态变量。状态。反映状态变化的量叫作状态变量。 k 阶段的状态特征可用状态变量阶段的状态特征可用状态变量 sk 描述描述; 每
8、一阶段的全部状态构成该阶段的状态集合每一阶段的全部状态构成该阶段的状态集合Sk, 并有并有sk Sk。每个阶段的状态可分为初始状态。每个阶段的状态可分为初始状态 和终止状态,或称输入状态和输出状态,阶和终止状态,或称输入状态和输出状态,阶 段的初始状态记作段的初始状态记作sk ,终止状态记为,终止状态记为sk+1 ,也,也 是下个阶段的初始状态。是下个阶段的初始状态。 2021/6/715 所谓决策就是确定系统过程发展的方案,所谓决策就是确定系统过程发展的方案, 决策的实质是关于状态的选择,是决策者决策的实质是关于状态的选择,是决策者 从给定阶段状态出发对下一阶段状态作出从给定阶段状态出发对下
9、一阶段状态作出 的选择。的选择。 用以描述决策变化的量称之决策变量,用以描述决策变化的量称之决策变量, 和状态变量一样,决策变量可以用一个数,和状态变量一样,决策变量可以用一个数, 一组数或一向量来描述也可以是状态变量一组数或一向量来描述也可以是状态变量 的函数,记以的函数,记以 ,表示于,表示于 k 阶段状阶段状 态态 sk 时的决策变量时的决策变量 ( ) kkk xx s 2021/6/716 决策变量的取值往往也有一定的容许范围,决策变量的取值往往也有一定的容许范围, 称之允许决策集合决策变量称之允许决策集合决策变量 xk(sk)的允许决的允许决 策集用策集用 XK(SK)表示,表示,
10、 xk(sk) XK(SK) , 允许决允许决 策集合实际是决策的约束条件。策集合实际是决策的约束条件。 2021/6/717 策略策略(Policy)也叫决策序列策略有全过程也叫决策序列策略有全过程 策略和策略和 k 部子策略之分,全过程策略是指具部子策略之分,全过程策略是指具 有有n 个阶段的全部过程,由依次进行的个阶段的全部过程,由依次进行的 n 个个 阶段决策构成的决策序列,简称策略,表示阶段决策构成的决策序列,简称策略,表示 为为 。从。从 k 阶段到第阶段到第 n 阶段,阶段, 依次进行的阶段决策构成的决策序列称为依次进行的阶段决策构成的决策序列称为 k 部子策略部子策略,表示为表
11、示为 ,显然当,显然当 k=1时的时的 k 部子策略就是全过程策略。部子策略就是全过程策略。 1,12 , , nn px xx ,1 , , k nkkn px xx 2021/6/718 状态转移确定从一个状态到另一个状态的转状态转移确定从一个状态到另一个状态的转 移过程移过程, 由状态转移方程描述由状态转移方程描述: sk+1 = T (sk, xk); 状态转移方程在大多数情况下可以由数学公状态转移方程在大多数情况下可以由数学公 式表达式表达, 如如: sk+1 = sk + xk; 2021/6/719 用来衡量策略或子策略或决策的效果的用来衡量策略或子策略或决策的效果的 某种数量指
12、标,就称为指标函数。它是定义某种数量指标,就称为指标函数。它是定义 在全过程或各子过程或各阶段上的确定数量在全过程或各子过程或各阶段上的确定数量 函数。对不同问题,指标函数可以是诸如费函数。对不同问题,指标函数可以是诸如费 用、成本、产值、利润、产量、耗量、距离、用、成本、产值、利润、产量、耗量、距离、 时间、效用,等等。时间、效用,等等。 2021/6/720 用用vk(sk , xk)表示第表示第 k 段处于状态段处于状态 sk且所作且所作 决策为决策为 xk 时的指标,则它就是第时的指标,则它就是第 k 段指标函段指标函 数,简记为数,简记为vk 。 用用f(sk , xk)表示第表示第
13、k k子过程的指标函数。表子过程的指标函数。表 示处于第示处于第 k 段段 sk 状态且所作决策为状态且所作决策为xk时,时, 从从 sk 点到终点的距离。由此可见,点到终点的距离。由此可见, f(sk , xk) 不仅跟当前状态不仅跟当前状态 sk 有关,有关, (2 2)过程指标函数)过程指标函数(也称目标函数)(也称目标函数) (1)阶段指标函数)阶段指标函数(也称阶段效应)(也称阶段效应) 2021/6/721 还跟该子过程策略还跟该子过程策略 pk(sk) 有关有关,严格说来,应严格说来,应 表示为表示为 fk(sk , pk(sk) 。它是由各阶段的阶段。它是由各阶段的阶段 指标函
14、数指标函数 vk(sk , xk)累积形成的,对于累积形成的,对于 k 部子部子 过程的指标函数可以表示为:过程的指标函数可以表示为: ,11 111 ( , , , ) (, )(,)( , ) k nk nkkkknn kkkkkknnn ffs x sxs x v s xvsxv s x 式中式中 ,表示某种运算,可以是加、减、,表示某种运算,可以是加、减、 乘、除、开方等乘、除、开方等 2021/6/722 多阶段决策问题中,常见的目标函数形式多阶段决策问题中,常见的目标函数形式 之一是取各阶段效应之和的形式,即之一是取各阶段效应之和的形式,即: (,) n kkkk ik fvsu
15、有些问题,如系统可靠性问题,其目标函有些问题,如系统可靠性问题,其目标函 数是取各阶段效应的连乘积形式,数是取各阶段效应的连乘积形式, (,) n kkkk ik fvsu 2021/6/723 用用 fk* (sk) 表示第表示第 k 子过程指标函数子过程指标函数Fk(sk , pk(sk) 在状态在状态 sk 下的最优值,即下的最优值,即: () ( )( ,( )1,2, kKk kkkkkk pPs fsoptF sp skn 称称 fk(sk) 为第为第 k 子过程上的最优指标函数;子过程上的最优指标函数; 与它相应的子策略与它相应的子策略 pk(sk) 称为状态称为状态 sk 下的
16、最下的最 优子策略,记为优子策略,记为 pk*(sk) 2021/6/724 用动态规划求解最短路问题用动态规划求解最短路问题 A1 6 4 1 4 3 3 3 3 5 1 4 2 4 7 4 3 6 3 4 2 Q A 2 T A3 B1 B2 C2 B3 C1 2021/6/725 阶段阶段: 可分为可分为4个阶段个阶段, k = 1, ., 4。 状态状态: 可用城市编号可用城市编号, S1=Q, S2=A1,A2,A3, S3=B1,B2,B3, S4=C1,C2, S5=T 决策决策: 决策变量也可用城市编号决策变量也可用城市编号; 状态转移方程状态转移方程: sk+1= xk; 阶
17、段指标函数:阶段指标函数: 过程指标(阶段递推)函数过程指标(阶段递推)函数: , kk kkks x vsxc 11 ()(,)() kkkkkkk fsmin v sxfs A1 6 4 1 4 3 3 3 3 5 1 4 2 4 7 4 3 6 3 4 2 Q A 2 T A3 B1 B2 C2 B3 C1 2021/6/726 k = 4 f4 (C1) = 3, f4 (C2) = 4 k = 3 f3(B1)=min1+f4(C1)=4*, 4+f4(C2)=8=4 f3(B2)=min6+f4(C1)=9, 3+f4(C2)=7*=7 f3(B3)=min3+f4(C1)=6*,
18、 3+f4(C2)=7=6 k = 2 f2(A1) = min7+ f3(B1), 4+ f3(B2), 6+ f3(B3) = min11*, 11*, 12 = 11 f2(A2) = min3+ f3(B1), 2+ f3(B2), 4+ f3(B3) = min7*, 9, 10 = 7 f2(A3) = min4+ f3(B1), 1+ f3(B2), 5+ f3(B3) = = min8*, 8*, 11 = 8 k = 1 f1(Q) = min2+f2(A1), 4+f2(A2), 3+f2(A3) = min13, 11*, 11* = 11 最短路是:最短路是:Q A2
19、B1 C1 T,p=A2,B1,C1,T Q A3 B1 C1 T ,p=A3,B1,C1,T Q A3 B2 C2 T ,p=A3,B2,C2,T A1 6 4 1 4 3 3 3 3 5 1 4 2 4 7 4 3 6 3 4 2 Q A2 T A3 B1 B2 C2 B3 C1 2021/6/727 整个过程的最优策略应具有这样的性质整个过程的最优策略应具有这样的性质: 无无 论过去的状态和决策如何论过去的状态和决策如何, 对前面的决策所对前面的决策所 形成的状态而言形成的状态而言, 后续的诸决策必须构成最后续的诸决策必须构成最 优策略;优策略; 上一条成立的条件是阶段递推函数严格单上一
20、条成立的条件是阶段递推函数严格单 调。调。 2021/6/728 在例题中,求解最短路线的计算公式可以概在例题中,求解最短路线的计算公式可以概 括写成:括写成: 55 11 () ( ) 0 ( )min ( ,( )() 4,3,2,1 kkk kkkkkkkk xXs fs fsv s x sfs k 其中,其中,vk 在这里表示从状态在这里表示从状态 sk 到由决策到由决策 xk 所决定的状态所决定的状态 sk+1 之间的距离。之间的距离。f5(s5)=0 是边是边 界条件,表示全过程到第四阶段终点结束。界条件,表示全过程到第四阶段终点结束。 2021/6/729 一般地,对于一般地,对
21、于 n 个阶段的决策过程,假设只个阶段的决策过程,假设只 考虑指标函数是考虑指标函数是“和和”与与“积积”的形式,第的形式,第 k 阶段和第阶段和第 k+1 阶段间的递推公式可表示如下:阶段间的递推公式可表示如下: 当过程指标函数为下列当过程指标函数为下列“和和”的形式时的形式时 () ( ) ( ,( ) kKk kkkkkk pPs fsoptf s p s () ( ,) kkk n iii pPs i k optv s x 2021/6/730 相应的函数基本方程为相应的函数基本方程为 : : 11 11 () 0 ( ) ( , ( )() ,1,2,1 kk nn kkkkkkkk
22、 xX fs fsopt v s x sfs k n n 2021/6/731 当过程指标函数为下列当过程指标函数为下列“积积”的形式时的形式时 ( ) ( ) ( ,( ) kKk kkkkkk p P s f soptf s p s () ( ,) iki n iii pPs i k optv s x 2021/6/732 相应的函数基本方程为相应的函数基本方程为 : 11 11 () 1 ( ) ( , ( )() ,1,2,1 kk nn kkkkkkkk xX fs fsopt v s x sfs kn n 2021/6/733 动态规划的优缺点 可以解决线性可以解决线性, 非线性非
23、线性, 整整 数规划无法有效求解的复数规划无法有效求解的复 杂问题杂问题; 容易找到全局最优解容易找到全局最优解; 可以得到一组解可以得到一组解; 没有标准的模型可供应用没有标准的模型可供应用, 构构 模依赖于个人的经验和技巧模依赖于个人的经验和技巧; 状态变量需满足无后效性状态变量需满足无后效性, 有有 较大的局限性较大的局限性; 动态规划的维数灾难限制了动态规划的维数灾难限制了 对规模较大问题的求解效率对规模较大问题的求解效率; 2021/6/734 动态规划的步骤:动态规划的步骤: 1. 将问题按时间或空间划分为满足递推关系将问题按时间或空间划分为满足递推关系 的若干阶段的若干阶段, 对
24、非时序问题可人为地引入对非时序问题可人为地引入 “时段时段”概念概念; 2. 正确选择状态变量正确选择状态变量 sk, 满足满足: 可知性可知性: 正确描述动态过程演变正确描述动态过程演变, 可直接或可直接或 间接确定状态变量的值间接确定状态变量的值; 无后效性无后效性: 后面的决策与前面的决策无关后面的决策与前面的决策无关; 2021/6/735 3. 确定决策变量确定决策变量 xk以及允许决策集合以及允许决策集合Xk; 4. 写出状态转移方程写出状态转移方程 sk+1 = T (sk , xk); 5. 决策变量的取值范围决策变量的取值范围 6. 写出过程指标函数(阶段函数)的递推写出过程
25、指标函数(阶段函数)的递推 关系关系, 应满足应满足: a) 是定义在所有阶段上的数量函数;是定义在所有阶段上的数量函数; b) 具有可分离性,并满足递推关系;具有可分离性,并满足递推关系; c) 阶段函数应严格单调。阶段函数应严格单调。 2021/6/736 1. 最优路径问题最优路径问题 2. 资源配置问题资源配置问题 3. 生产与库存问题生产与库存问题 4. 机器负荷分配问题机器负荷分配问题 5. 复合系统工作可靠性问题复合系统工作可靠性问题 6. 二维背包问题二维背包问题 7. 设备更新问题设备更新问题 货郎担问题货郎担问题 8.非线性规划的求解非线性规划的求解 2021/6/737
26、某厂要确定一种新产品在今后五年内的价格,并已拟定只在 5、6、7、8元这四种单价中进行选择。据预测,今后五年 不同价格下每年盈利(万元)见下表,但是各相邻年度价 格增减不得超过1元。问今后五年内每年定价各为多少,可 逾七五年总利润最大。 价格/元 盈利/万元 第一年第二年第三年第四年第五年 592458 675864 765973 887664 2021/6/738 价格/元 盈利/万元 第一年第二年第三年第四年第五年 592458 675864 765973 887664 13 14 11 8 4 3 4 10 18 22 23 17 24 28 28 30 37 35 36 38 2021
27、/6/739 解:1、建立动态规划模型: 阶段:以年划分阶段,k=5,4,3,2,1; 状态变量sk为每个阶段初的价格,则Sk=5,6,7,8; 决策变量xk为每年所确定的价格,则Xk=5,6,7,8; 状态转移方程: 阶段指标函数vk(sk ,xk)为每个阶段选择xk所取得的盈 利;例如v(sk ,) 过程指标函数为第k阶段状态为sk时到最后一个阶段 的总利润。 基本函数方程为: 1kk sx 66 11 () ()0 ()max (,)() 5,4,3,2,1 kkk kkkkkkk xXs fs fsv sxfs k 2021/6/740 、逆序求解: k=5 f5(s5,x5) v5(
28、s5,x5)+ f6*(s6) f5*(s5) x5 * s x 5 6 7 8 5 8+0 8 5 6 4+0 4 6 7 3+0 3 7 8 4+0 4 8 2021/6/741 k=4 f4(s4,x4) v4(s4,x4)+ f5*(s5) f4*(s4) x4 * s x 5 6 7 8 5 5+8 5+4 13 5 6 6+8 6+4 6+3 14 5 7 7+4 7+3 7+4 11 6,8 8 6+3 6+4 10 7 2021/6/742 k=3 f3(s3,x3) v3(s3,x3)+ f4*(s4) f3*(s3) x3 * s x 5 6 7 8 5 4+13 4+14
29、 18 6 6 8+13 8+14 8+11 22 7 7 9+14 9+11 9+10 23 6 8 6+11 6+10 17 7 2021/6/743 k=2 f2(s2,x2) v2(s2,x2)+ f3*(s3) f2*(s2) x2 * s x 5 6 7 8 5 2+18 2+22 24 6 6 5+18 5+22 5+23 28 7 7 5+22 5+23 5+17 28 7 8 7+23 7+17 30 7 2021/6/744 k=1 f1(s1,x1) v1(s1,x1)+ f2*(s2) f1*(s1) x1 * s x 5 6 7 8 5 9+24 9+28 37 6
30、6 7+24 7+28 7+28 35 6,7 7 6+28 6+28 6+30 36 8 8 8+28 8+30 38 8 S1=8 X1=8 s2=8 x2=7 s3=7 x3=6 s4=6 x4=5 s5=5 x5=5 2021/6/745 如何将有限的资源分配给若干种生产活动,并使资源如何将有限的资源分配给若干种生产活动,并使资源 利用的收益最大是经济活动中常见的问题,动态规划利用的收益最大是经济活动中常见的问题,动态规划 可以求解一些线性规划无法解决的资源配置问题。可以求解一些线性规划无法解决的资源配置问题。 一般的资源分配问题可以描述为如下的规划问题:一般的资源分配问题可以描述为如
31、下的规划问题: 2021/6/746 分 厂 利润(万元) 0套1套2套 3套 4套5套 6套 10356765 204678910 30259887 2021/6/747 1.阶段阶段与分厂相联系与分厂相联系, 阶段阶段 k 只考虑分配分厂只考虑分配分厂 k 的设备套数的设备套数; 2.状态变量状态变量 sk 表示表示 k 分厂分厂可分配的设备套数可分配的设备套数; 3.决策变量决策变量 xk 表示决定在表示决定在 k 分厂分厂使用的设备套数使用的设备套数; 4.状态转移方程状态转移方程: sk+1 = sk - xk; 阶段函数阶段函数: vk(sk,xk)为为k分厂使用设备分厂使用设备x
32、k时的获利时的获利 ,从第一分厂到第,从第一分厂到第k分分 厂的总获利厂的总获利 fk(sk)=max vk(sk,xk)+fk+1(sk+1) 6. 基本状态方程基本状态方程 44 11 () ()0 ()max (,)() 3,2,1 kkk kkkkkkk xXs fs fsvsxfs k 2021/6/748 k=3 2021/6/749 s3 = s2 x2 2021/6/750 k = 1:s2 = s1 - x1 因此得到:因此得到:x1 = 2 ,s2=6-2=4, x2 = 1 ,s3=4-1=3 , x3 = 3 x1 =1 ,s2=6-1=5, x2 = 2 ,s3=5-
33、2=3 , x3 = 3 即:即:p=2,1,3或或1,2,3获利获利18万元万元 2021/6/751 为保证设备可靠运行为保证设备可靠运行, 一些关键部件往往由多个器一些关键部件往往由多个器 件并联运行件并联运行, 如果器件如果器件 i 的失效概率为的失效概率为 pi, 则则 xi 个器个器 件并联工作的可靠性为件并联工作的可靠性为(1 - pixi), 假定每个器件的采假定每个器件的采 购费用为购费用为 ci, 在满足总采购费用不超过预算限制在满足总采购费用不超过预算限制 C 的前提下的前提下, 使设备可靠性最高的规划问题可以描述使设备可靠性最高的规划问题可以描述 为为: max: z
34、= )1( 1 n i x i i p s.t. n i ii cxc 1 2021/6/752 该问题为整数非线性规划,可以用动态规该问题为整数非线性规划,可以用动态规 划求解,设关键器件数划求解,设关键器件数n = 3,总费用为,总费用为 120万元。器件的单价与可靠性如下表:万元。器件的单价与可靠性如下表: 器件号器件号i 单价单价(万元万元) 失效概率失效概率pi 2021/6/753 阶段与器件挂钩,第阶段与器件挂钩,第 k 阶段仅考虑器件阶段仅考虑器件k的采购数量的采购数量; sk 表示表示k 阶段可使用的采购费用阶段可使用的采购费用; xk 表示表示 k阶段决定购买阶段决定购买k
35、 器件的数量;器件的数量; 状态转移方程状态转移方程: sk+1 = sk - ck xk; 递推阶段函数递推阶段函数:vk(sk,xk)=1-pkxk 总可靠性总可靠性fk(sk) = max ( 1 - pkxk) fk+1(sk+1) 基本状态方程:基本状态方程: 44 11 () ()0 ()max (,)*() 3,2,1 kkk kkkkkkk xXs fs fsv sxfs k 2021/6/754 k=3 2021/6/755 s3 = s2 c2x2 2021/6/756 k = 1:s2 = s1 c1 x1 因此得到:因此得到: x1 = 1 ,s2=120-30=90,
36、 x2 = 2 ,s3=90-2*15=60 , x3 = 3 即:即:p=1,2,3 可靠性为可靠性为0.756 2021/6/757 4、生产调度(生产与库存)问题 某厂根据市场预测,确认今后某厂根据市场预测,确认今后4个月该厂个月该厂 的一种主要产品每月的需求的量的一种主要产品每月的需求的量d为为3,2, 3,2万件。已知每月生产固定费用万件。已知每月生产固定费用b为为2 千元,但若当月不生产则为千元,但若当月不生产则为0;产品成本;产品成本 c为为1千元千元/件,贮存费用件,贮存费用h为为 0.2千元千元/万件万件 /月。最大存贮能力月。最大存贮能力w为为4万件。若第万件。若第1月月
37、初五库存产品,第初五库存产品,第4月末也不留库存,则月末也不留库存,则 该厂怎样安排生产,才能使今后该厂怎样安排生产,才能使今后4个月的个月的 总费用最少?总费用最少? 2021/6/758 55 11 () ()0 ()m in(,)() 4, 3, 2,1 kkk kkkkkkk xXs fs fsvsxfs k 建立动态规划模型:建立动态规划模型: 1、阶段与时间相联系、阶段与时间相联系, 阶段阶段 k表示月份表示月份 2、状态变量、状态变量 sk 表示表示 k 月初的库存量月初的库存量; 3、决策变量、决策变量 xk 表示表示 k月的产量月的产量; 4、若、若dk为需求量,则状态转移方
38、程为需求量,则状态转移方程: sk+1 = sk +xk- dk; 5、阶段函数、阶段函数: vk(sk,xk)为为k月月的生产费用的生产费用 , 过程函数:过程函数: fk(sk)为从第一月到第为从第一月到第k月的总生产费用月的总生产费用 fk(sk)=max vk(sk,xk)+fk+1(sk+1) 6. 基本状态方程基本状态方程 ,0 , ,0 kkk kkk kk bcxhxx vsx hsx 当 当 2021/6/759 k=4 这是最后一个月,需求为这是最后一个月,需求为2,无库存,无库存s5=0。由。由 状态方程知:状态方程知:s4=2-x4,x4 0,则则s4只能是只能是0,1
39、,2 2021/6/760 k=3 这是第这是第3个月,需求为个月,需求为3。由状态方程知:。由状态方程知: s4=s3+x3-3,又由于又由于 2 s4 0,即即2 s3+x3-3 0,s3 w=4则则s3取值是取值是0,1,2,3,4。 X3=x3|3s3+x35,s3=0,1,2,3,4 2021/6/761 k=2 这是第这是第2个月,需求为个月,需求为2。第一个月无库存第一个月无库存 s1=0,s2 =s1+x1-3=x1-3,又因,又因x1 5,则则s2取值取值 是是0,1,2。由状态方程知:由状态方程知:s3=s2+x2-2,又由又由 于于 4 s3 0,即即4 s2+x2-2
40、0; X2=x2|2s2+x26 且且x2 5,s2=0,1,2 2021/6/762 k=1 这是第这是第1个月,需求为个月,需求为3。第一个月无库存第一个月无库存 s1=0,s2 =x1-3=x1-3,又因,又因x1 5,s2取值是取值是0, 1,2。X1=x1|3x15 2021/6/763 设备在使用全过程中会遭受磨损设备在使用全过程中会遭受磨损, 使用一段使用一段 时间后就要维修时间后就要维修, 而且使用的时间越长而且使用的时间越长, 维维 修费用越高修费用越高, 设备使用多少时间在经济上最设备使用多少时间在经济上最 合算合算, 就是设备更新问题。就是设备更新问题。 2021/6/7
41、64 2021/6/765 2021/6/766 2021/6/767 2021/6/768 2021/6/769 2021/6/770 2021/6/771 2021/6/772 有某种机床,可以在高低两种不同的负荷下进行生产,在高有某种机床,可以在高低两种不同的负荷下进行生产,在高 负荷下生产时,产品的年产量为负荷下生产时,产品的年产量为 g ,与年初投入生产的机床,与年初投入生产的机床 数量数量 u1 的关系为的关系为 g=g(u1)=8u1 ,这时,年终机床完好台数将,这时,年终机床完好台数将 为,为,au1 ( a为机床完好率,为机床完好率, 0 a 1 ,设,设 a=0.7 )。在
42、低负荷。在低负荷 下生产时,产品的年产量为下生产时,产品的年产量为 h ,和投入生产的机床数量的关,和投入生产的机床数量的关 系为系为 h=h(u2)=5u2 ,相应的机床完好率为,相应的机床完好率为 b ( 0b2 ,设,设 b= 0.9 ),一般情况下,一般情况下 ( a b )。假设某厂开始有。假设某厂开始有 x1=1000 台完台完 好的机床,现要制定一个五年生产计划,问每年开始时如何好的机床,现要制定一个五年生产计划,问每年开始时如何 重新分配完好的机床在两种不同的负荷下生产的数量,以使重新分配完好的机床在两种不同的负荷下生产的数量,以使 在在5年内产品的总产量为最高。年内产品的总产
43、量为最高。 2021/6/773 首先构造这个问题的动态规划模型。首先构造这个问题的动态规划模型。 1分阶段:分阶段:设阶段变量设阶段变量 k 表示年度,因此,表示年度,因此, 阶段总数阶段总数 n = 5 。 2. 状态变量:状态变量:用用 sk 表示第表示第 k 年度初拥有的年度初拥有的 完好机床台数,同时也是第完好机床台数,同时也是第 k-1 年度末时年度末时 的完好机床数量。的完好机床数量。 3. 决策变量:决策变量:用用 uk 表示第表示第 k 年度中分配年度中分配 于高负荷下生产的机床台数。于是于高负荷下生产的机床台数。于是 sk-uk 便便 为该年度中分配于低负荷下生产的机床台为
44、该年度中分配于低负荷下生产的机床台 数。数。 2021/6/774 4状态转移方程为:状态转移方程为: 1 () 0 .70 .9 () 0 .90 .2 1 ,2,6 kkkk kkk kk sa ubsu usu su k 决策变量的取值:决策变量的取值:在第在第 k 段为段为 su0u)s (U kkkkk 2021/6/775 6阶段指标函数阶段指标函数 令令 vk(sk,uk ) 表示由第表示由第 k 年的状态年的状态 sk 出发,采出发,采 取取uk分配方案的产品产量分配方案的产品产量. ( ,) 85() kkkkkk v s uusu 7条件最优目标函数递推方程条件最优目标函数
45、递推方程 令令 fk(sk ) 表示由第表示由第 k 年的状态年的状态 sk 出发,采取出发,采取 最优分配方案到第最优分配方案到第5年度结束这段时间的产品年度结束这段时间的产品 产量,根据最优化原理有以下递推关系产量,根据最优化原理有以下递推关系: 2021/6/776 * 11 1 66 ()max(,)() max85()0.70.9() 1 , 2 , 5 ()0 kk kk kkkkkkk uU kkkkkkk uU fsv s ufs usufusu k fs 2021/6/777 下面采用逆序递推计算法下面采用逆序递推计算法,从第从第5年度开始递年度开始递 推计算推计算 K=5
46、时有时有 )()(max)( k su sfususf k 6555 0 55 58 5 )(max 555 0 58 5 usu suk 显然,当显然,当 u5*=s5 时,时,f5(s5) 有最大值,相应的有最大值,相应的 有有 f5(s5) = 8s5 。 2021/6/778 K=4 K=4 时有:时有: )(. )(max)( 4445 444 0 44 9070 58 44 usuf ususf su )(. )(max 444 444 0 90708 58 44 usu usu su )(.max 444 0 212613 44 usu su 2021/6/779 因此,当因此,
47、当 u4*= s4 时,有最大值时,有最大值 f4(s4)=13.6s4 K=3 =3 时有:时有: )()(max)( 44333 0 33 58 33 sfususf su )(.max 333 0 22175517 33 usu su 可见,当可见,当 u3*= s3 时,有最大值时,有最大值 f3(s3) =17.55s3 。 K=2 =2 时有:时有: )()(max)( 33222 0 22 58 22 sfususf su 2021/6/780 )(. )(max 222 222 0 90705517 58 22 usu usu su )(.max 222 0 8202520 2
48、2 usu su 此时,当此时,当 u2*= 0 时有最大值,即时有最大值,即 f2(s2)=20.8s2, 其中其中 s2=0.7u1+0.9(s1-u1) K=1 =1 时有:时有: )(. )(max)( 111 111 0 11 9070820 58 11 usu ususf su 2021/6/781 )(.max 111 0 7235522 11 usu su 当当 u1*= 0 时时, 有最大值,即有最大值,即 f1(s1)=23.7s1 , 因因 为为 s1=1000 , 故故 f1(s1)=23700 个产品。个产品。 按照上述计算顺序寻踪得到下述计算结果:按照上述计算顺序寻
49、踪得到下述计算结果: 23700500010000 1111111 )(),( * sfusgsu 1872045009000 2222222 )(),( * sfusgsu 142166480810 33333333 )(),( * sfusgssu 77114536567 14444444 )(),( * sfusgssu 31763176387 11333555 )(),( * sfusgssu 2021/6/782 上面所讨论的最优决策过程是所谓始端上面所讨论的最优决策过程是所谓始端 状态固定,终端状态自由如果终端也附加状态固定,终端状态自由如果终端也附加 上一定的约束条件,那么计算结
50、果将会与之上一定的约束条件,那么计算结果将会与之 有所差别例如,若规定在第五个年度结束有所差别例如,若规定在第五个年度结束 时,完好的机床数量为时,完好的机床数量为500台台(上面只有上面只有278 台台),问应该如何安排五年的生产,使之在满,问应该如何安排五年的生产,使之在满 足这一终端要求的情况下产量最高?足这一终端要求的情况下产量最高? 由状态转移方程由状态转移方程 2021/6/783 )us ( 9 . 0u7 . 0)us ( baus kkkkkk1k 有有 25005 . 4 55 su 500)us ( 9 . 0u7 . 0s 5556 由此式得由此式得 当当 k=5 时有
51、时有 )us (5u8max)s (f 555 su0 55 5k )2500u5 . 4s (5)2500u5 . 4(8 555 75005 .18 5 s 当当 k=4 时有时有 2021/6/784 )s (f)us (5u8max)s (f 55444 su0 44 44 7500u5 .18)us (5u8max 5444 su0 44 7500)us (9 . 0u7 . 0 5 .18 )us ( 5u8max 444 444 su0 44 7500u75.0s7 .21max 44 su0 44 显 然 , 只 有 取显 然 , 只 有 取 u 4 * = 0 , 有 最 大
52、 值有 最 大 值 f4(s4)=21.4s4-7500 2021/6/785 当当 k=3 时有时有: )s (f)us (5u8max)s (f 44333 su0 33 33 7500)us (9 . 0u7 . 0 7 .21 )us (5u8max 333 333 su0 33 7500s5 .24u3 .1max 33 su0 33 显然,只有取显然,只有取 u 3 * =0 , f 3(s3) 有最大值 有最大值 f3(s3)=24.5s3-7500 。 2021/6/786 当当 k=2 时有时有: )s (f)us (5u8max)s (f 33222 su0 22 22 7
53、500)us (9 . 0u7 . 0 5 .24 )us (5u8max 222 222 su0 22 7500s1 .27u9 . 1max 22 su0 22 显然,只有取显然,只有取 u 2 * =0 , f 2(s2) 有最大值 有最大值 f2(s2)=27.1s2-7500 。 2021/6/787 当当 k=1 时有时有: )s (f)us (5u8max)s (f 22111 su0 11 11 7500)us (9 . 0u7 . 0 1 .27 )us (5u8max 111 111 su0 11 7500s4 .29u4 . 2max 11 su0 11 显然,只有取显然
54、,只有取 u 1 * =0 , f 1(s1) 有最大值 有最大值 f1(s1)=29.4s1-7500 。 2021/6/788 0u1000s * 11 (台) 0u810s9 . 0)us ( 9 . 0u7 . 0s * 32 * 22 * 23 0u729s9 . 0)us (9 . 0u7 . 0s * 43 * 33 * 34 656s 9 . 0)us ( 9 . 0u7 . 0s 4 * 44 * 45 4542500s5 . 4u 5 * 5 204us * 55 500)us (9 . 0u7 . 0s 5556 * 211112 0.70.9()0.99000susus
55、u 111 ( )29.4750029400750021900f ss 2021/6/789 7、非线性规划问题求解、非线性规划问题求解 某公司拥有资金某公司拥有资金 10 万元,若投资于项目万元,若投资于项目 i (i 1,2,3) 的投资额为的投资额为 xi 时,其收益分别为时,其收益分别为 g1(x1)=4x1 , g2(x2)=9x2 , g3(x3)=2x32 ,问应如何问应如何 分配投资数额才能使总收益最大分配投资数额才能使总收益最大? 这是一个与时间无明显关系的静态最优化这是一个与时间无明显关系的静态最优化 问题,可列出其静态模型为:问题,可列出其静态模型为: 2021/6/79
56、0 2 321 294maxxxxz ) 3 , 2 , 1(0 10 321 ix xxx i 满足满足 我们可以人为地赋予它我们可以人为地赋予它“时段时段”的概念,的概念, 用动态规划方法求解用动态规划方法求解 首先用逆序构造动态规划模型。首先用逆序构造动态规划模型。 1分阶段:分阶段:设阶段变量设阶段变量 k 表示依次对第表示依次对第 k 个个 项目投资,因此,阶段总数项目投资,因此,阶段总数 n = 3。 ( k = 1 , 2 , 3 ) 2021/6/791 2. 状态变量:状态变量:用用 sk 表示已经对第表示已经对第 1 至至 第第 k-1 个项目投资后的剩余资金;即第个项目投
57、资后的剩余资金;即第 k 段段 初拥有的可以分配给第初拥有的可以分配给第 k 到第到第3个项目的个项目的 资金额资金额 (单位:万元)(单位:万元) 。 3. 决策变量:决策变量:用用 xk 表示对第表示对第 k 个项目投个项目投 资资 的资金数量(单位:万元)。的资金数量(单位:万元)。 决策变量的取值:决策变量的取值: 0 xk sk 4状态转移方程为:状态转移方程为: kk1k xss 2021/6/792 6. 基本方程为:基本方程为: 0)( 1 , 2 , 3)()(max)( 44 11 0 sf ksfxgsf kkkk sx kk kk 最优指标函数最优指标函数 fk(sk) 表示第表示第 k 阶段,初阶段,初 始状态为始状态为 sk 时,从第时,从第 k 到第到第 3 个项目所获个项目所获 最大收益最大收益 2021/6/793 当当 k=3 时:时: x2max)s (f 2 3 sx0 33 33 得取 33 sx 2 3 2 3 sx0 33 s2x2max)s (f 33 当当 k=2 时:时: )s (fx9max
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 基于图神经网络的代码分析-洞察及研究
- 楼房吊运机租赁合同范本
- 双向合同可以签几份协议
- 服务合同免责协议书范本
- 旧房改梁加柱合同协议书
- 租赁合同期满后交接协议
- 装潢设计代运营合同范本
- 标准厂房epc合同范本
- 企业小轿车租赁合同范本
- 装修合同完质量补充协议
- 2025年新版小学语文新课标标准课件
- 《功能高分子材料》课程教学大纲
- 企业反恐防暴安全
- 高标准农田建设项目方案投标文件(技术方案)
- 《大学生求职面试礼仪指南课件》
- 私募股权投资基金(双GP)合作框架协议书范本
- 城市经理人合作合同范本
- 2025年度合伙人股权代持风险防范及解除协议
- 电网工程设备材料信息参考价(2024年第四季度)
- 上海(虹口宝山黄浦松江)2024-2025学年上学期七年级英语期末统考卷(含笔试答案无听力答案、原文及音频)
- 临床医学课程思政案例
评论
0/150
提交评论