版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、动态规划根本实际推行函数迭代法与战略迭代法本章内容举例简单阐明不定期与无期决策过程的方式和概念;以不定期和无期决策过程为例,引见函数迭代法和战略迭代法。不定期与无期决策过程定义:多阶段的决策过程的阶段数N确定,称为定期决策过程,当N不确定时,称此类决策过程为不定期决策过程,当N趋向无穷时称为无期决策过程。不定期与无期决策过程例1:段数不定的最短道路问题不定期决策过程n个点相互衔接组成 一个连通图(右图中n=5),各点标号为1,2,n。恣意两点i,j之间的间隔(费用)记作dij 。求恣意一点i到点n(靶点)的最短道路(间隔)。322575560.51不定期与无期决策过程例1:段数不定的最短道路问
2、题不定期决策过程n个点相互衔接组成 一个连通图(右图中n=5),各点标号为1,2,n。恣意两点i,j之间的间隔(费用)记作dij 。求恣意一点i到点n(靶点)的最短道路(间隔)。322575560.51不定期与无期决策过程例2:无限期决策过程模型 ,形状变换函数为。( 存在明显的级变量,但级数是无限的 )不定期与无期决策过程求解这类问题假设仍运用以前的逐级递推方法,将遇到极大的计算量,为此必需寻觅新方法。函数方程可以用迭代法求解,通常有函数迭代法和战略迭代法两种迭代方法。函数迭代法与战略迭代法1.函数迭代法的步骤是:(1)选初始函数 (普通取 );(2)用迭代公式及 计算其中为当前阶段的形状和
3、决策, 为知终止函数, 为迭代步数, v为目的函数(3)当或函数迭代法与战略迭代法(4)当或时迭代停顿,最优值函数,最优战略 ;否那么以k+1替代k反复(2),(3).函数迭代法与战略迭代法阐明:函数迭代法和战略迭代法中,序列 和 的收敛性在相当广泛的条件下是可以保证的,普通来说它与 等的详细方式有关。函数迭代法的根本思想是以步数(段数)作为参数,先求在各个不同步数下的最优战略,然后从这些最优解中再选出最优者,从而同时确定了最优步数。函数迭代法与战略迭代法战略迭代法的根本思想是:先选定一初始战略 然后按某种方式求得新战略 直至最终求出最优战略。假设对某一k,对一切i有: ,那么称 收敛,此时,
4、战略就是最优战略。普通来说,选定初始战略要比选定初始目的最优值函数容易得多,且战略迭代的收敛速度稍快,但其计算量要大些。函数迭代法与战略迭代法 ( 是事先给定的数)时迭代停顿,最优值函数,最优战略 。2.战略迭代法的步骤是:(1)选初始战略 ,令k=1;(2)用 求解 ,(3)用 求改良战略 ,函数迭代法与战略迭代法例1的求解:分析:可以不思索回路,由于含有回路的道路一定不是最短的.本问题道路的段数事先不固定,而是随着最优战略确定的,然而形状、决策、形状转移、目的函数与以前的最短道路问题的一样.形状记作x=i,i=1,2,n,决策记作u(i).战略是对恣意形状x的决策函数,记作u(x)。阶段目
5、的是恣意两形状i,j间的间隔dij,目的函数V(i,u(x)是由形状i出发,在战略u(x)下到达形状n的道路的函数迭代法与战略迭代法间隔,它是阶段目的之和, 并满足可分别性要求,有最优值函数(i)为由i出发到达n的最短间隔,即式中u*(x)是最优战略,满足根本方程 函数迭代法与战略迭代法该式记为()式,它不是一个递推方程,而是一个关于(i)的函数方程,对固定的i使()右端 dij+(j) 到达极小的j即为最优决策u*(i),对一切的i求解()式得到最优战略u*(x)。不定期与无期决策过程例1:段数不定的最短道路问题不定期决策过程n个点相互衔接组成 一个连通图(右图中n=5),各点标号为1,2,
6、n。恣意两点i,j之间的间隔(费用)记作dij 。求恣意一点i到点n(靶点)的最短道路(间隔)。函数迭代法与战略迭代法用函数迭代法求解例1只求1,2,3,4各点到点5的最优道路,其他类似。解:(1)假设从i点走一步到靶点5的最优间隔为 , 那么显然有: 最优决策为:322575560.51函数迭代法与战略迭代法 (2)假设从i点走两步到靶点5的最优间隔为 , 根据最优化原理得:详细计算如下:函数迭代法与战略迭代法 注:不取含 的地方作为最优决策函数迭代法与战略迭代法 (3)假设从i点走三步到靶点5的最优间隔为 , 那么得:计算结果如下:函数迭代法与战略迭代法 (4)假设从i点走四步到靶点5的最
7、优间隔为 , 那么得:计算结果如下:函数迭代法与战略迭代法 函数迭代法与战略迭代法 由于只需5个点,因此从任一点出发到达靶点,其间最多有4步(否那么,有回路),这样就不需继续下去了。将计算结果列成表:i1252525252755.534.534.53355444444435353535函数迭代法与战略迭代法 分析上面的结果可得:从点1到点5走一步为最优,最优间隔为2,最优道路 ;从点2到点5走三步为最优,最优间隔为4.5,最优道路 ;从点3到点5走两步为最优,最优间隔为4,最优道路 ;从点4到点5走一步为最优,最优间隔为3,最优道路 。函数迭代法与战略迭代法 最优决策最多走4步,多于此步数,会
8、出现走回头路或回路,显然这些不是最优道路。 从任一点出发到靶点,走m(m=1,2,)步与走m+1步的最优间隔一样,决策函数也一样,假设继续计算走m+2步、m+3步、,其结果仍一样, 即 也就阐明 一致收敛于 , 一致收敛于 。故当这种一出现,计算便可停顿。函数迭代法与战略迭代法例1的求解:(战略迭代法 解:第一步,先选取初始战略 。如取:即 ,但必需没有回路,每点可达靶点。第二步,由 求 ,由战略迭代法的方程组可得:因战略 直达靶点,应先计算:函数迭代法与战略迭代法第三步,由 求 ,由求出它的解 :时,函数迭代法与战略迭代法所以, 不在含 的项取 时,函数迭代法与战略迭代法所以,同理,可求得
9、,于是得到第一次战略迭代的结果为以 为初始战略继续反复运用第二、三步进展迭代。第二步:由 求函数迭代法与战略迭代法第三步:由 求,即由求解 。 时,所以同理,求出故第二次战略迭代的结果为函数迭代法与战略迭代法第二步:由 求第三步:由 求,类似前面的方法求得第三次战略迭代的结果为i1234545321156535525.553534524.5435345函数迭代法与战略迭代法将以上结果记录下来:函数迭代法与战略迭代法由以上结果得到 ,对一切的i都成立,阐明迭代步骤可以停顿。故找到最优战略为列表表示为从而可以得到各点到靶点(点5)的最优道路和最优间隔:i12345345函数迭代法与战略迭代法最优道
10、路 最短间隔值 2 4.5 4 3可以看到战略迭代法得到的结果与函数迭代法的结果一致。不定期与无期决策过程例2:无限期决策过程模型 ,形状变换函数为。( 存在明显的级变量,但级数是无限的 )函数迭代法与战略迭代法例2的求解函数迭代法解:(1)任取初值,如形状变换函数为迭代公式为(2)i=1时,进展第一次迭代函数迭代法与战略迭代法 对 求导,并令其等于零,有 可得函数迭代法与战略迭代法 ,取i=2时,进展第二次迭代对 求导,并令其等于零,得函数迭代法与战略迭代法故由于 ,应继续进展迭代。当i=3时,进展第三次迭代,类似以上才方法,可得函数迭代法与战略迭代法由于 ,取i=4继续进展第四次迭代。其结
11、果如下:函数迭代法与战略迭代法由于 ,可以确定该问题的最优收益函数为最优决策为函数迭代法与战略迭代法例2的求解战略迭代法解:(1)任取初始战略值,如及(2)进展第一次迭代,取i=1,2,得函数迭代法与战略迭代法 由于取 再来确定第二次迭代的决策 : 函数迭代法与战略迭代法上式的解为 由于,需求进展第二次迭代: 函数迭代法与战略迭代法由于 ,需求继续进展迭代,直到 时为止,节省时间,直接给出结果 ,但由于 ,因此需求继续进展迭代。如今来确定第三次迭代的决策,有函数迭代法与战略迭代法那么由于,还必需进展下次迭代。第三次迭代:函数迭代法与战略迭代法由于 ,需求继续进展迭代,直到 时为止,最后得到 由
12、于 ,因此需求继续进展迭代。如今来确定第四次迭代的决策,有函数迭代法与战略迭代法那么第四次迭代:函数迭代法与战略迭代法继续进展迭代,直到 时为止,最后得到 由于 ,因此可停顿迭代。最优收益函数为 相应的最优战略为函数迭代法与战略迭代法注:对于定义一个无期决策过程的最优化问题,须满足三个条件,即对一切的有:形状转移方程有意义;允许决策集合 有意义,而且非空,那么存在允许战略使得对一切 非空;目的函数 对一切 有意义,且对一切允许战略,极限 存在。函数迭代法与战略迭代法注:对于定义一个无期决策过程的最优化问题,须满足三个条件,即对一切的有:形状转移方程有意义;允许决策集合 有意义,而且非空,那么存在允许战略使得对一切 非空;目的函数 对一切 有意义,且对一切允许战略,极限 存在。函数迭代法与战略迭代法当上述三个条件成立时,就可以说,无期决策过程的最优化的意义在于求最优战略 使得其中P是定义在无期过程上的非空允许战略集。 是 P的元素, 是定义在P上的目的函数。函数迭代法与战略迭代法例1、例2的共同点是在多阶段决策过程中允许决策集合、形状转移规律、阶段目的等于阶段变量k无关,从而根本方程成为函数方程,称这样的过程是平稳的。定义:满足以下条件的多阶段决策过程成为平稳过程,相应的战略称为平稳战略:(1) 允许决策集合Uk(x)与k无关,可记为U(x), 为形状变量;(2) 形
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2026湖北武汉市第三医院骨干人才及成熟型人才招聘备考题库附答案详解(综合卷)
- 2026江西萍矿总医院招聘见习康复治疗师4人备考题库含答案详解【综合卷】
- 2026湖北中联太工程造价咨询有限公司招聘备考题库附完整答案详解【名师系列】
- 2026湖北武汉刘三屋中医骨伤医院招聘49人备考题库附完整答案详解(全优)
- 2026山东青岛海发国际贸易有限公司招聘10人备考题库含完整答案详解(网校专用)
- 2026广东阳江市阳春市招聘乡村公益性岗位12人备考题库(第六批)附完整答案详解【名师系列】
- 2026广东清远市阳山县融媒体中心招聘新闻人员4人备考题库完整参考答案详解
- 2026河南郑州市第一〇七高级中学招聘23人备考题库附参考答案详解(考试直接用)
- 2026中国邮政集团有限公司安徽省分公司社会招聘备考题库含完整答案详解【夺冠系列】
- 2026青海海北州海晏县三角城镇卫生院招聘B超医生1人备考题库附参考答案详解(模拟题)
- 2024云南省委党校研究生招生考试真题(附答案)
- 2025年四川省成都市初中学业水平考试中考(会考)地理试卷(真题+答案)
- 2025年焊工(技师)考试练习题库(附答案)
- 冷库节能措施方案(3篇)
- GB/T 2820.5-2025往复式内燃机驱动的交流发电机组第5部分:发电机组
- 学术自由与责任共担:导师制度与研究生培养制的深度探讨
- 高中数学三年教学规划
- 保卫科部门绩效考核标准
- 2025年上海市各区高三二模语文试题汇编《现代文一》含答案
- 公司履约保函管理制度
- 数字化转型战略规划纲要
评论
0/150
提交评论