《运筹》教学课件动态规划-动态规划的基本原理_第1页
《运筹》教学课件动态规划-动态规划的基本原理_第2页
《运筹》教学课件动态规划-动态规划的基本原理_第3页
《运筹》教学课件动态规划-动态规划的基本原理_第4页
《运筹》教学课件动态规划-动态规划的基本原理_第5页
已阅读5页,还剩6页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

8.2动态规划的基本原理,动态规划的目标,有多个方案,且每个方案都有一个总指标函数值动态规划的目标是找到最优的方案,也就是找到使得总指标函数最优(最大或最小)方案,即,在总指标函数中,一般来说s1是给定的,其它的变量都是不确定的,这样一来总指标函数有2n-1个变量,直接求极值非常困难。动态规划的最优化原理提供了另外一种求解思路。,最优化原理的语言描述,一个过程的最优策略具有这样的性质,即无论初始状态及初始决策如何,对于先前决策所形成的状态而言,其以后的所有决策必构成最优策略。,理解1:如果第一阶段到第k阶段形成的策略是最优策略的话,那么从第一阶段到第t阶段所形成的策略也必须是最优策略(tk)例如在一个图中,若从点1到点5的最短路线为1235则235是点2到点5的最短路线,35是点3到点5的最短路线,1.利用前部子指标函数来描述,由于optV1,t+1仅仅与状态st+1有关,因而也称optV1,t+1为前部最优值函数,用ftst+1来表示,则上式可表示为,最优化原理的数学描述和形式,为了递推方程形式的统一,可以引入f0(s1)=0,这样一来上面的递推公式就可写为下式,由于f0(s1)=0是专门引入的,特称之为边界条件,最优化原理的数学描述和形式,2.利用后部子指标函数,由于optVt,n+1仅仅与状态st有关,因而也称optVt,n+1为后部最优值函数,用ftst来表示,则上式可表示为,最优化原理的数学描述和形式,为了递推方程形式的统一,可以引入fn+1(sn+1)=0,这样一来上面的递推公式就可写为下式,由于fn+1(sn+1)=0是专门引入的,也称之为边界条件,最优化原理的数学描述和形式,由于最优值指标函数fk(sk+1)中与状态变量st(1tk)和决策变量ut(1tk)无关,这意味着以前的状态和决策不影响后面的优化过程,也就是fk+1(sk+2)仅仅与fk(sk+1)有关,把这种特性称之为无后效性。,动态规划的无后效性,1.基于前部最优值指标函数递推方程,由于最优值指标函数fk(sk)中与状态变量st+1(ktn)和决策变量ut(ktn)无关,这意味着以前的状态和决策不影响以后的优化过程,也就是fk-1(sk-1)仅仅与fk(sk)有关,把这种特性称之为无后效性。,2.基于后部最优值指标函数递推方程,1.利用前部子指标函数来描述,最优化原理的数学描述积形式,其中f0(s1)=1为引入的边

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论