




已阅读5页,还剩9页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
p13-1,引言,动态规划(Dynamic Programming)是解决多阶段决策问题 最优化的一种数学方法. 1951年, 美国数学家贝尔曼(R. Bellman)等人提出了“最优 化原理”,把多阶段决策问题变换为一系列相互联系的单阶 段决策问题,逐阶段加以求解, 创建了动态规划方法. 名著动态规划于1957年出版, 是该领域的第一本著作. 动态规划应用广泛. 如求解最短路问题、生产计划问题、存 储问题、资源分配问题、推销商问题等.,第11章 动态规划的基本概念和基本定理,p13-2, 动态决策问题分类 1. 按数据给出的形式分为: 离散型动态决策问题 连续型动态决策问题 2. 按决策过程演变的性质分为: 确定型动态决策问题 随机型动态决策问题,引言,第11章 动态规划的基本概念和基本定理,p13-3,11.2 动态规划的基本概念和模型构成,一、动态规划的基本概念 以求最短路为例,1. 阶段(stage) 通常根据时间顺序或空间特征把所给问题的全过程恰当地分 为若干个相互联系的阶段, 以便按阶段的次序逐段解决整个 过程的优化问题.,p13-4,一、动态规划的基本概念 以求最短路为例,1. 阶段(stage) 通常根据时间顺序或空间特征把所给问题的全过程恰当地分 为若干个相互联系的阶段, 以便按阶段的次序逐段解决整个过程的优化问题.,描述阶段的变量称为阶段变量, 通常用 k 表示, k = 1 , , n,p13-5,一、动态规划的基本概念,1. 阶段(stage) 通常根据时间顺序或空间特征把所给问题的全过程恰当地分 为若干个相互联系的阶段, 以便按阶段的次序逐段解决整个过程的优化问题.,描述阶段的变量称为阶段变量, 用 k 表示, k = 1 , , n,2. 状态(state) 描述每个阶段开始时所处的自然状况或客观条件. 描述状态的变量称为状态变量, 用 xk表示第 k 阶段的状态变 量. 第 k 阶段所有状态的集合称为第 k 阶段可达状态的集合, 用 Xk表示. 如X3= C1 ,C2 ,C3,p13-6,一、动态规划的基本概念,1. 阶段(stage),2. 状态(state) 描述每个阶段开始时所处的自然状况或客观条件. 描述状态的变量称为状态变量, 用 xk表示第 k 阶段的状态变 量. 第 k 阶段所有状态的集合称为第 k 阶段可达状态集合, 用 Xk表示. 如X3= C1 ,C2 ,C3,3. 决策(decision) 决策的实质是关于状态的选择, 是从一个阶段某状态演变到 下一个阶段某状态的选择. 决策变量 uk(xk) , 如u2(B1) =C2,p13-7,一、动态规划的基本概念,1. 阶段(stage),2. 状态(state),3. 决策(decision) 决策的实质是关于状态的选择, 是从一个阶段某状态演变到 下一个阶段某状态的选择.,4. 策略(policy) 策略也叫决策序列. 从第1阶段至第n阶段的一个策略称为全过程子策略, 简称策略, 记作p1,n(x1). 从第k阶段至第n阶段的一个策略称为后部子策略, 记作pk,n(xk).,p13-8,一、动态规划的基本概念,1. 阶段(stage),2. 状态(state),3. 决策(decision),4. 策略(policy) 全过程子策略, 简称策略,记作p1,n(x1). 后部子策略, 记作pk,n(xk).,5. 指标函数(objective function) 用来衡量决策或策略效果的某种数量指标, 称为指标函数. 第k阶段的指标函数记作 vk(xk,uk,). 从第k阶段至第n阶段的指标函数记作 Vk,n(xk , pk,n). 从第1阶段至第n阶段的指标函数记作 V1,n(x1 , p1,n).,p13-9,一、动态规划的基本概念,1. 阶段(stage),2. 状态(state),3. 决策(decision),4. 策略(policy),5. 指标函数(objective function) 用来衡量决策或策略效果的某种数量指标, 称为指标函数. 第k阶段的指标函数记作 vk(xk,uk,). 从第k阶段至第n阶段的指标函数记作 Vk,n(xk , pk,n). 从第1阶段至第n阶段的指标函数记作 V1,n(x1 , p1,n).,指标函数的最优值称为最优指标函数, 记作 fk(xk)或 f1(x1).,二、动态规划的模型构成,1. 正确选择阶段变量k; 2. 正确选择状态变量xk要保证无后效性, 即某阶段的状 态一旦确定, 则此后过程的演变不受此前各状态及决策的 影响; 3. 正确选择决策变量uk; 4. 列出状态转移方程xk+1= Tk(xk, uk); 5. 列出指标函数Vk,n要满足按阶段可分性, 并满足递推关系 Vk,n= Vk,n(xk, pk,n)= vk(xk,uk,)+ Vk+1,n(xk+1, pk+1,n),p13-11,11.3 基本理论和基本方程,一、最优化原理 最优策略的任一后部子策略都是最优的.,二、基本方程 1. 逆序递推的基本方程(以求min为例),式中xk+1=Tk(xk, uk).,p13-12,11.3 基本理论和基本方程,一、最优化原理 最优策略的任一后部子策略都是最优的.,二、基本方程 2. 顺序递推的基本方程(以求min为例),式中xk=Tk(xk+1, uk).,p13-13,12.1 生产与存储问题,例 某厂生产某种产品,每千件的成本费为2千元;每季度开工的固定费用为3千元,第1、2、3季度市场对该产品的需求量分别为2、4、2千件,工厂每一季度的最大生产能力为6千件,设每季度每千件的存储费为1千元(按每季度初的库存量计算存储费),还规定年初和第3季度末无库存。问:如何安排各季度的产量,使全年的总费用最小?,p13-14,补充: 机器任务分配问题,例 某工厂有200台机器,拟分4个周期使用,在每一周期有两种 生产任务. 若机器投入第一种生产任
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 大洋大洲考试题及答案
- 财务兼职面试题及答案
- 钱塘社工面试题及答案
- 上虞社工面试题及答案
- 骨干培训面试题及答案
- 金茂物业面试题及答案
- 临床营养学试题营养及答案2025版
- 数据结构(Java语言描述)(第2版)课件 1.1 数据结构的基本概念
- 2025年事业单位招聘考试综合类无领导小组讨论面试真题模拟试卷:面试职业发展
- 2025年泰语等级考试泰国传统音乐试卷
- 2025淄博市沂源县历山街道社区工作者考试真题
- 二氧化碳逆水煤气变换技术研究进展
- 金融知识进校园高中课件
- 常压储罐管理制度
- 税务师事务所内部管理制度
- 房屋建筑工程竣工验收技术资料统一用表(2024 版)
- 《企业研发费用税前加计扣除政策解读与应用课件》
- 蓝桥杯-科学素养考试题库(含答案)
- OptiStruct结构分析与工程应用
- HRM4800原料立式磨使用手册
- 辽宁中考英语2022-2024真题汇编-教师版-专题05 阅读还原之五选四等
评论
0/150
提交评论