版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、第9章 动态规划,课件,2,2020/9/7,教学目标与要求,【教学目标】 1. 理解下列基本概念:状态变量,决策变量,策略,状态转移方程,指标函数和最优值函数 2. 理解动态规划的基本方程和最优化原理 3. 理解动态规划模型建立过程 5. 掌握顺序算法与逆序算法解题方法 【知识结构】,课件,3,2020/9/7,引例 马车驿站问题,E,E,D1D2,D1D2,D1D2,D1D2,C2C3C4,C1C2C3,1,D1E,1,D2E,2,C4D1 C4D2,2,C3D1 C3D2,2,C2D1 C2D2,2,C1D1C1D2,3,B2C2B2C3B2C4,3,B1C1B1C2B1C3,B1B2,
2、2,AB1AB2,A,一共有2321=12条不同的路线,f(E)=0,f(D1)=2,f(D2)=1,f(C1)=8,f(C2)=5,f(C3)=4,f(C1)=5,f(B1)=8,f(B2)=11,f(A)=13,回顾分析过程: 1.将分析对象划分成4阶段; 2.每阶段始点状态与终点状态有关,而不考虑始终点状态如何形成(无记忆性); 3.每阶段各始点状态为终点状态与始点至终点距离之和的最小值(状态转移) 这种最优化方法称为动态规划, 由美国数学家贝尔曼等人于20世纪50年代创立.,课件,4,2020/9/7,本章主要内容,9.1 动态规划的概念和原理 9.1.1 动态规划的基本概念 9.1.
3、2 动态规划的最优化原理 9.2 动态规划的模型和求解 9.2.1 动态规划模型的建立 9.2.2 动态规划问题的解法 9.3 应用举例 案例1 资源分配问题 案例2 设备负荷问题 案例3 生产库存问题 案例4 背包问题 本章小结,课件,5,2020/9/7,9.1.1 动态规划的基本概念,1.阶段: 把所给问题的过程,恰当地分为若干个相互联系的阶段,以便能按一定的次序去求解。描述阶段的变量称为阶段变量,常用k表示。导入案例中k=1,2,3,4,2.状态变量: 每个阶段开始所处的自然状况或客观条件(用点集表示).如引例:第1阶段的状态就是起点A,记为s1=A;第2阶段有2个状态B1,B2,记为
4、s2=B1,B2;第3阶段有4个状态C1,C2,C3,C4,记为s3=C1,C2,C3,C4;第4阶段有2个状态D1,D2,记为s4=D1,D2;,3.决策变量: 在某一阶段的某个状态时的不同选择,如引例中B1状态下有3种选择:B1C1,B1C2,B1C3这3种选择构成了允许决策的集合。不同状态下允许决策的集合也不同,故决策变量是状态变量的函数,即xk(sk)D(sk),4.策略 按顺序排列的决策组成的集合,由过程的第k阶段开始到终止状态为止的过程(或k子过程),k子过程的策略称子策略,记为Pk,n(sk),即 Pk,n(sk)=xk(sk),xk+1(sk+1),xn(sn) 当k=1时,即
5、为全过程的一个策略。如引例中:DE,即4到5过程起始有2个状态,D1和D2,因此有P4,5=D1E,D2E,5.状态转移方程 确定过程是由一个状态到另一个状态的演变过程。第k阶段状态变量值给定后,如果确定决策变量,第k+1阶段状态变量值就完全确定。即:sk+1=T(sk,xk) 如引例中:若对AB1,AB2选择了AB1,则s2=5,B1到C有3种选择:B1C1、B1C2、B1C3,若选择了B1C2,则s3=s2+d(B1,C2)=8,6.指标函数 用来衡量所实现过程优劣的一种数量指标。其基本方程有加法和乘法两种形式,通常加法形式用的较多,其公式为:,7.边界条件 起始或终止条件。,课件,6,2
6、020/9/7,5.1.2 动态规划的基本原理,最优化原理(Optimality principle) : 最优策略具备这样的性质:无论初始状态与初始决策如何,以后诸决策对以第一个决策所形成的状态作为初始状态的过程而言,必然构成最优策策略.通俗地说:最优策略的子策略也是最优的. 例如,在导入案例中,最优策略是AB1C2D1E,最短距离为13,其子策略:B1C2D1E, C2D1E, D1E也是最优的。 依据这一原理,从后往前推各阶段最优子过程,从而得到全程最优过程。,设f(i)表示从点i到终点E的最短距离,d(i,j)表示点i,j之间的距离. 显然f(E)=0,为该问题的边界条件.,k=4,决
7、策:D1E,k=3,决策:D2E,决策:C1D1,决策:C2D1,k=2,决策:C3D2,决策:C4D2,决策:B1C2,决策:B2C3,k=1,决策:AB1,最短路线:AB1C2D1E 最短路长:13,课件,7,2020/9/7,5.1.2 动态规划的最优化原理,课件,8,2020/9/7,9.2.1 动态规划模型的建立,解 把生产第k种产品看成是第k阶段,划分为n个阶段. 设 sk表示第k阶段初资源可用量(状态变量) xk表示分配给第k阶段资源的数量(决策变量),显然有: 允许决策集合 sk+1=sk-xk (状态转移方程) s1=a (边界条件) 指标函数: 若fk(sk)表示数量为sk
8、资源分配给第k种产品时,从第k阶段到第n阶段总收益,则有:,课件,9,2020/9/7,9.2.1 动态规划模型的建立,指标函数通常有两种形式:加法形式和乘法形式。,课件,10,2020/9/7,9.2.2 动态规划问题的解法:逆序法,最优值函数f(k):从k阶段到E的最短距离;阶段指标函数,即该阶段选择不同路线的距离。从后向前推。,S1=A S2=B1,B2 S3=C1,C2,C3,C4 S4=D1,D2 S5=E,f5(E)=0 同理 f4(D1)=2,f4(D2)=1 同理 f3(C2)=5,f3(C3)=4,f3(c4)=5 同理 f2(B2)=11,课件,11,2020/9/7,9.
9、2.2 动态规划问题的解法:顺序法,最优值函数f(k):从A到k阶段的最短距离;阶段指标函数,即该阶段选择不同路线的距离。从前向后推。,S0=A S1=B1,B2 S2=C1,C2,C3,C4 S3=D1,D2 S4=E,最优值函数: f0(A)=0 f1(B1)=5,f2(B2)=3 f2(C1)=7,f3(C2)=8,f3(C3)=10,f3(c4)=9 f3(D1)=11,f4(D2)=13,课件,12,2020/9/7,案例1 资源分配问题,5台设备分配给3个工厂,盈利表如下,如何分配可使获利最大?,分析 3个工厂看成3个阶段. 阶段变量 k(k=1,2,3); 状态变量 sk表示为分
10、配给第k个工厂至第n个工厂的设备台数; 决策变量xk 表示分配给第k个工厂的设备台数; 则有sk+1=sk-xk; Pk(xk)表示为xk 台设备分配到第k个工厂所得赢利值; fk(sk)表示为 台设备分配给第k个工厂至第n个工厂所得到的最大赢利值。则有:,k=3,k=2,k=1,方案一:1,2,2,方案二:2,1,2,方案三:2,2,1,方案四:3,2,0,课件,14,2020/9/7,案例2 设备负荷问题,某种机器可在高低两种不同的负荷下进行生产,设机器在高负荷下生产的产量函数为g=9x,其中x为投入生产的机器数量,季度完好率为a=0.65,在低负荷下生产的产量函数为h=4y,其中y为投入
11、生产的机器数量,季度完好率为b=0.95。设资源拥有量100. 解 4季度看成4阶段sk第k季初拥有完好机器数xk第k季分配给高负荷机器数,则低负荷分配数sk-xk下季度初完好机器数sk+1=0.65xk+0.95(sk-xk)第k季产量vk=6xk+4(sk-xk),课件,15,2020/9/7,k=4,f4 是x4 的增函数,故最大值解为 x4*=s4,相应地有 f4(s4)=9s4,k=3,f3 是x3 的增函数,故最大值解为 x3*=s3,相应地有 f3(s3)=14.85s3,课件,16,2020/9/7,k=2,f2 是x2 的增函数,故最大值解为 x2*=s2,相应地有 f2(s
12、2)=18.6525s2,k=1,f1 是x1 的减函数,故最大值解为 x1*=0,相应地有 f1(s1)=21.719875s1=2172,反向推算,由s1=100,x1=0,知s2=95,x2=95, s3=61.75,x3=61.75,s4=40.14,x4=40.14,s5=26.09。 即第1季度设备100%全部分配给低负荷第2季度初完好设备为95%,全部分配给高负荷第3季度完好设备为61.75%,全部分配给高负荷第4季度完好设备为40.14%,全部分配给高负荷。全年结束后,设备完好率为26.09%.最大产量2172。,课件,17,2020/9/7,Lingo程序,model: se
13、ts: JD/1.4/:s,x,v;!定义状态变量、决策变量和指标函数; ZB/1.5/:f;!定义最优值函数; endsets f(5)=0;!初始化最优值函数; s(1)=100;!初始化状态变量; for(jd:x=s);!决策变量取值限制; for(jd(k)|k#lt#4:s(k+1)=0.65*x(k)+0.95*(s(k)-x(k););!状态转移方程; for(jd(k):v(k)=9*x(k)+4*(s(k)-x(k);!指标函数表达式; for(zb(k)|k#lt#5:f(k)=v(k)+f(k+1););!基本方程; max=f(1);!目标; end,课件,18,20
14、20/9/7,案例3 生产库存问题,课件,19,2020/9/7,案例3 生产库存问题,课件,20,2020/9/7,案例3 生产库存问题,课件,21,2020/9/7,案例3 生产库存问题,逆推: f5 =26.5, s5=0, x5*=0 或 3,s4=3 ,x4*=6,s4=0 ,x4*=0,s3=1 ,s3=4 ,x3*=0 或 3,x3*=6,s2=3 ,s2=0 ,s2=0 ,x2*=6 ,x2*=0,x2*=0,s1=0 ,x1*=2,s1=3 ,x1*=5,s1=3 ,x1*=5,课件,22,2020/9/7,案例4 背包问题,课件,23,2020/9/7,案例4 背包问题,课件,24,2020/9/7,案例4 背包问题,最优方案:依次装2,1,0个 最大价值:13,课件,25,2020/9/7,本章小结,本章介绍了动态规划的基本概念、基本原理和几种典型的应用问题。要求 1)理解动态规划的核心概念 状态与状态变量、决策与决策变量、策略、状态转移方程、指标函数和最优值函数。 2)理解动态规划的最优化原理:一个最优策略的子策略总是最优的。
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 盐酸生产工变更管理水平考核试卷含答案
- 工业视觉系统运维员岗前核心考核试卷含答案
- 染料后处理工操作技能竞赛考核试卷含答案
- 乳品评鉴师改进水平考核试卷含答案
- 商场管理规定制度
- (教师版)平面向量的数量积题型一:定义与简单计算专项训练20252026学年高一下学期数学人教A版必修第二册
- 协会会员行为制度
- 医院安保管理考核试题及答案
- 2024-2025学年广东省广州十六中教育集团八年级(下)期中数学试卷及答案
- 急性脑卒中急救考核试题及答案
- JJF 2370-2026 建筑运行阶段碳排放计量技术规范
- 2026“市委书记进校园”引才活动穆棱市事业单位招聘10人笔试模拟试题及答案解析
- DBJ50-T-547-2026 装配式混凝土空心楼盖结构技术
- 2026年慢病管理规范化培训试题及答案
- 山地驾驶经验培训
- 外贸企业培训课件
- 课件-项目5-5.2AI赋能高效办公的常用工具
- 2026中国REITS指数之不动产资本化率调研报告(第六期)
- 护理不良事件RCA工具的规范化应用
- 肾衰竭中医辨证施治方案
- 攀登计划课件
评论
0/150
提交评论