




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、 运 筹 学动态规划动态规划 3 建立动态规划数学模型的步骤 “最优化原理”是动态规划的核心,所有动态规划问题的递推关系都是根据这个原理建立起来的,并且根据递推关系依次计算,最终可求得动态规划问题的解。 一般来说,利用动态规划求解实际问题需先建立问题的动态模型,具体步骤如下: 将问题按时间或空间次序划分成若干阶段。有些问题不具有时空次序,也可以人为地引进时空次序,划分阶段。 正确选择状态变量xk。这一步是形成动态模型的关键,状态变量是动态规划模型中最重要的参数。一般来说,状态变量应具有以下三个特性: 要能够用来描述决策过程的演变特征。 要满足无后效性。即如果某阶段状态已给定后,则以后过程的进展
2、不受以前各状态的影响,也就是说,过去的历史只通过当前的状态去影响未来的发展。 递推性。即由k阶段的状态变量xk及决策变量uk可以计算出k+1阶段的状态变量xk+1。 确定决策变量uk及允许决策变量集合Dk(uk)。 根据状态变量之间的递推关系,写出状态转移方程: xk+1=T(xk, uk(xk) 建立指标函数。一般用rk(xk, uk)描写阶段效应,fk(xk)表示kn阶段的最优子策略函数。 建立动态规划基本方程: fk(xk)= opt rk(xk, uk(xk)fk+1(xk+1) uk Dk(uk) fn+1(xn+1)=C k=n,n-1,1 以上是建立动态规划模型的过程,这个过程是
3、正确求解动态规划的基础。 在动态规划基本方程中, rk(xk, uk), xk+1=T(xk, uk)都是已知函数,最优子策略fk(xk)与fk+1(xk+1)之间是递推关系,要求出fk(xk)及uk(xk),需要先求出fk+1(xk+1),这就决定了应用动态规划基本方程求最优策略总是逆着阶段的顺序进行的。由后向前逐步计算,最终可以算出全过程的最优策略函数值及最优策略。 另一方面,由于k+1阶段的状态xk+1=T(xk, uk)是由前面的状态xk和决策uk所形成的,在计算fk+1(xk+1)时还不能具体确定xk+1的值,所以,这就要求必须就k+1阶段的各个可能状态计算fk+1(xk+1),因此
4、动态规划方法不但能求出整个问题的最优策略和最优目标值,而且还能求出决策过程中所有可能状态的最优策略及最优目标值。 下面就按上述步骤求解例2。 例2(带回收的资源分配问题)某厂新购某种机床125台。据估计,这种设备5年后将被其它设备所代替。此机床如在高负荷状态下工作,年损坏率为1/2,年利润为10万元;如在低负荷状态下工作,年损坏率为1/5,年利润为6万元。问应如何安排这些机床的生产负荷,才能使5年内获得的利润最大? 解:以年为阶段,k=1,2,3,4,5 取k年初完好的机床数为状态变量xk 以k年初投入高负荷运行的机床数为决策变量uk,则低负荷运行机床数是xk-uk,于是状态转移方程为: xk
5、+1=1/2uk+4/5(xk-uk)=0.8xk-0.3uk 以利润为目标函数,则k年利润为: 10uk+6(xk-uk)=4uk+6xk 记fk(xk)为k年至5年末最大总利润,则动态规划基本方程为: fk(xk)= max 4uk+6xk+fk+1(0.8xk-0.3uk) 0ukxk f6(x6)=0 k=5,4,3,2,1以上是建立动态模型的过程,下面具体求解。注意动态规划基本方程为:fk(xk)= max 4uk+6xk+fk+1(0.8xk-0.3uk) 0ukxk所以,当k=5时,有f5(x5)= max 4u5+6x5+f6(x6)=10 x5 u5=x5 0u5x5当k=4
6、时f4(x4)= max 4u4+6x4+f5(0.8x4-0.3u4) 0u4x4 = max 4u4+6x4+10(0.8x4-0.3u4) 0u4x4 = max u4+14x4=15x4 u4=x4 0u4x4当k=3时f3(x3)= max 4u3+6x3+f4(0.8x3-0.3u3) 0u3x3 = max 4u3+6x3+15(0.8x3-0.3u3) 0u3x3 = max -0.5u3+18x3=18x3 u3=0 0u3x3 动态规划基本方程为: fk(xk)= max 4uk+6xk+fk+1(0.8xk-0.3uk) 0ukxk 当k=2时f2(x2)= max 4u2+6x2+f3(0.8x2-0.3u2) 0u2x2 = max 4u2+6x2+18(0.8x2-0.3u2) 0u2x2 = max-1.4u2+20.4x2=20.4x2 u2=0 0u2x2 当k=1时f1(x1)= max 4u1+6x1+f2(0.8x1-0.3u1) 0u1x1 = max 4u1+6x1+20.4(0.8x1-0.3u1) 0u1x1 = max -2.12u1+22.32x1=22.32x1 u1=0 0u1x1 =22.32125=2790(万元) 至此已算得最大总利润2790万元,再按与计算过程
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 安全教育培训财务岗位课件
- 文化遗产数字化展示2025年传播策略与数字内容创作方法研究
- 2025年功能性饮料运动健康市场推广的社交媒体营销策略研究报告
- 2025年农业科技成果转化对农业现代化影响研究报告
- 新能源行业2025年人才流动趋势与竞争格局研究报告
- 安全教育培训计划的名称课件
- 2025年物联网产业商业计划书:物联网技术在智慧城市中的应用与市场前景
- 安全教育培训计划和安排课件
- 2025年高速公路智能交通系统智能交通系统与智能交通应用案例报告
- 安全教育培训补贴课件
- 托育园火灾应急预案(3篇)
- 诈骗分期赔偿协议书
- 外科补液培训
- GB/Z 45463-2025热喷涂涂层孔隙率的测定
- 死亡记录书写规范
- 欧盟职业教育数字素养培育研究
- T-BSRS 128-2024 核医学放射性废液快速处理技术要求
- 《血小板功能障碍与血栓形成》课件
- 《融资攻略》课件
- TCTBA 005-2024 TCECA-G 0326-2024 合同能源管理招标规范 轨道交通
- 工勤岗转管理岗申请书
评论
0/150
提交评论