版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
-.z动态规划【目录】一。引言二。动态规划的根本思想
三。动态规划算法的根本步骤
四。动态规划的适用条件
五。动态规划的实例分析六。动态规划的技巧——阶段的划分和状态的表示
七。动态规划实现中的问题
八。动态规划与其他算法的比拟
九。动态规划的理论模型
一。引言
动态规划是运筹学的一个分支,是求解决策过程最优化的数学方法。20世纪50年代初美国数学家R.E.Bellman等人在研究
多阶段决策过程的优化问题时,提出了著名的最优化原理,把多阶段过程转化为一系列单阶段问题,逐个求解,创立了解决这类过程优化问题的新方法——动态规划。1957年出版了他的名著DynamicProgramming,这是该领域的第一本著作。
动态规划问世以来,在经济管理、生产调度、工程技术和最优控制等方面得到了广泛的应用。例如最短路线、库存管理、资源分配、设备更新、排序、装载等问题,用动态规划方法比用其它方法求解更为方便。
虽然动态规划主要用于求解以时间划分阶段的动态过程的优化问题,但是一些与时间无关的静态规划(如线性规划、非线性规划),只要人为地引进时间因素,把它视为多阶段决策过程,也可以用动态规划方法方便地求解。
二。动态规划的根本思想
一般来说,只要问题可以划分成规模更小的子问题,并且原问题的最优解中包含了子问题的最优解〔即满足最优子化原理〕,则可以考虑用动态规划解决。
动态规划的实质是分治思想和解决冗余,因此,动态规划是一种将问题实例分解为更小的、相似的子问题,并存储子问题的解而防止计算重复的子问题,以解决最优化问题的算法策略。
由此可知,动态规划法与分治法和贪心法类似,它们都是将问题实例归纳为更小的、相似的子问题,并通过求解子问题产生一个全局最优解。其中贪心法的当前选择可能要依赖已经作出的所有选择,但不依赖于有待于做出的选择和子问题。因此贪心法自顶向下,一步一步地作出贪心选择;而分治法中的各个子问题是独立的(即不包含公共的子子问题),因此一旦递归地求出各子问题的解后,便可自下而上地将子问题的解合并成问题的解。但缺乏的是,如果当前选择可能要依赖子问题的解时,则难以通过局部的贪心策略到达全局最优解;如果各子问题是不独立的,则分治法要做许多不必要的工作,重复地解公共的子问题。
解决上述问题的方法是利用动态规划。该方法主要应用于最优化问题,这类问题会有多种可能的解,每个解都有一个值,而动态规划找出其中最优(最大或最小)值的解。假设存在假设干个取最优值的解的话,它只取其中的一个。在求解过程中,该方法也是通过求解局部子问题的解到达全局最优解,但与分治法和贪心法不同的是,动态规划允许这些子问题不独立,(亦即各子问题可包含公共的子子问题)也允许其通过自身子问题的解作出选择,该方法对每一个子问题只解一次,并将结果保存起来,防止每次碰到时都要重复计算。
因此,动态规划法所针对的问题有一个显著的特征,即它所对应的子问题树中的子问题呈现大量的重复。动态规划法的关键就在于,对于重复出现的子问题,只在第一次遇到时加以求解,并把答案保存起来,让以后再遇到时直接引用,不必重新求解。
三。动态规划算法的根本步骤
设计一个标准的动态规划算法,通常可按以下几个步骤进展:
1。划分阶段:按照问题的时间或空间特征,把问题分为假设干个阶段。注意这假设干个阶段一定要是有序的或者是可排序的〔即无后向性〕,否则问题就无法用动态规划求解。
2。选择状态:将问题开展到各个阶段时所处于的各种客观情况用不同的状态表示出来。当然,状态的选择要满足无后效性。
确定决策并写出状态转移方程:之所以把这两步放在一起,是因为决策和状态转移有着天然的联系,状态转移就是根据上一阶段的状态和决策来导出本阶段的状态。所以,如果我们确定了决策,状态转移方程也就写出来了。但事实上,我们常常是反过来做,根据相邻两段的各状态之间的关系来确定决策。
3。写出规划方程〔包括边界条件〕:动态规划的根本方程是规划方程的通用形式化表达式。一般说来,只要阶段、状态、决策和状态转移确定了,这一步还是比拟简单的。
动态规划的主要难点在于理论上的设计,一旦设计完成,实现局部就会非常简单。
根据动态规划的根本方程可以直接递归计算最优值,但是一般将其改为递推计算,实现的大体上的框架如下:
标准动态规划的根本框架
对fn+1(*n+1)初始化;
△处理边界条件
fork←ndownto1do
for每一个*k∈*kdo
for每一个uk∈Uk(*k)
dofk(*k)←一个极值
△∞或-∞
*k+1
←Tk(*k,uk)
△状态转移方程
t
←φ(fk+1(*k+1),vk(*k,uk))
△根本方程(9)式
ift比fk(*k)更优
thenfk(*k)←t
△计算fk(*k)的最优值
t←一个极值
△∞或-∞
for每一个*1∈*1
doiff1(*1)比t更优
thent←f1(*1)
△按照10式求出最优指标
输出t;
但是,实际应用当中经常不显式地按照上面步骤设计动态规划,而是按以下几个步骤进展:
1。分析最优解的性质,并刻划其构造特征。
2。递归地定义最优值。
3。以自底向上的方式或自顶向下的记忆化方法〔备忘录法〕计算出最优值。
4。根据计算最优值时得到的信息,构造一个最优解。
步骤(1)--(3)是动态规划算法的根本步骤。在只需要求出最优值的情形,步骤(4)
可以省略,假设需要求出问题的一个最优解,则必须执行步骤(4)。此时,在步骤
(3)中计算最优值时,通常需记录更多的信息,以便在步骤(4)中,根据所记录的信息,快速地构造出一个最优解。
四。动态规划的适用条件任何思想方法都有一定的局限性,超出了特定条件,它就失去了作用。同样,动态规划也并不是万能的。适用动态规划的问题必须满足最优化原理和无后效性。
1.最优化原理〔最优子构造性质〕
最优化原理可这样阐述:一个最优化策略具有这样的性质,不管过去状态和决策如何,对前面的决策所形成的状态而言,余下的诸决策必须构成最优策略。简而言之,一个最优化策略的子策略总是最优的。一个问题满足最优化原理又称其具有最优子构造性质。
例如图2中,假设路线I和J是A到C的最优路径,则根据最优化原理,路线J必是从B到C的最优路线。这可用反证法证明:假设有另一路径J'是B到C的最优路径,则A到C的路线取I和J'比I和J更优,矛盾。从而证明J'必是B到C的最优路径。
最优化原理是动态规划的根底,任何问题,如果失去了最优化原理的支持,就不可能用动态规划方法计算。动态规划的最优化理在其指标函数的可别离性和单调性中得到表达。根据最优化原理导出的动态规划根本方程是解决一切动态规划问题的根本方法。
2.无后向性
将各阶段按照一定的次序排列好之后,对于*个给定的阶段状态,它以前各阶段的状态无法直接影响它未来的决策,而只能通过当前的这个状态。换句话说,每个状态都是过去历史的一个完整总结。这就是无后向性,又称为无后效性。
有些问题乍一看好似有后向性,但如果按照*种合理的方式重新划分阶段,就可以发现其本质上是无后向性的,所以关键是阶段的合理划分,这一点将在动态规划的技巧中详细阐述。
3.子问题的重叠性
动态规划可以将原来具有指数级复杂度的搜索算法改良成具有多项式时间的算法。其中的关键在于解决冗余,这是动态规划算法的根本目的。动态规划实质上是一种以空间换时间的技术,它在实现的过程中,不得不存储产生过程中的各种状态,所以它的空间复杂度要大于其它的算法。以Bitonic旅行路线问题为例,这个问题也可以用搜索算法来解决。动态规划的时间复杂度为O(n^2),搜索算法的时间复杂度为O(n!),但从空间复杂度来看,动态规划算法为O(n^2),而搜索算法为O(n),搜索算法反而优于动态规划算法。选择动态规划算法是因为动态规划算法在空间上可以承受,而搜索算法在时间上却无法承受,所以我们舍空间而取时间。
设原问题的规模为n,容易看出,当子问题树中的子问题总数是n的超多项式函数,而不同的子问题数只是n的多项式函数时,动态规划法显得特别有意义,此时动态规划法具有线性时间复杂性。所以,能够用动态规划解决的问题还有一个显著特征:子问题的重叠性。这个性质并不是动态规划适用的必要条件,但是如果该性质无法满足,动态规划算法同其他算法相比就不具备优势。五。动态规划的实例分析魔法课问题哈里波特终于离开了可怕的舅舅家,来到了Hogwarts的魔法学校学习魔法。魔法的世界是多么的神奇,小哈利对一切都充满了好奇。他想尽可能多的学习魔法。现在的问题是有些魔法课的时间有冲突,哈利无法在一天内上所有的魔法课。所以需要你写一个程序来帮助哈里波特制定一个学习方案,来安排第一天的学习,使得他能尽可能地上更多的魔法课。注意,上课的时间是不能改变的。而且上课的时候不能迟到也不能早退,否则魔法教师会对哈利产生不满。可以假设从一个教室到另一个教室的时间短得忽略不计。另外,在Hogwarts的魔法世界里,是不使用24小时制的计时方法的,它只是简单的使用一个整数来表示当时的时间。输入:每个测试数据开头是一个整数n〔1<=n<=1000〕,表示魔法课的总数。接下来n行,每行包括两个正整数s、t,分别表示该魔法课的上课时间和下课时间。其中s<t。输出:对于每个测试数据,在单独一行内输出哈利所能上的最多魔法课数。样例:输入:31152191517输出:2代码:*include
<iostream>usingnamespace
std;
*define
N
1010int
lesson[N][2];
//记录开课时间
与
下课时间int
num[N];
//
记录上第N堂课的话可上的最大课程int
main()
{
int
n;
int
i,j;
cin>>n;
for(i=1;i<=n;i++)
cin>>lesson[i][0]>>lesson[i][1];
//输入开课时间与课程完毕时间
memset(num,0,sizeof(num));
num[n]
=
1;
//第一阶段,首先上最后一堂课的话,最大上课数为
1int
ma*1;
for(i=n-1;i>=1;i--)
//从后往前遍历
{
ma*1
=
0;
for(
j
=
i+1;j<=n;j++)
//遍历从
i+1
堂课
到最后一场课<span
style="white-space:pre">
</span>(动态规划,求解局部最优)
{
if(lesson[i][1]
<=
lesson[j][0]
&&
ma*1
<num[j])
//比拟i场课的完毕课的时间
与
第j场课(j>i)的开场时间
ma*1
=
num[j];
}
//已经找到了
上过第i场课之后
还能上的课的最大值
num[i]
=
ma*1+1
;
}
for(ma*1=0,i=1;i<=n;i++)
if(ma*1
<
num[i])
ma*1
=
num[i];
cout<<ma*1<<endl;
return
0;
}
六。动态规划的技巧——阶段的划分和状态的表示在动态规划的设计过程中,阶段的划分和状态的表示是非常重要的两步,这两步会直接影响该问题的计算复杂性,有时候阶段划分或状态表示的不合理还会使得动态规划法不适用。有很多的多阶段决策问题都有着不止一种的阶段划分方法,因而往往就有不止一种的规划方法。有时各种方法所产生的效果是差不多的,但更多的时候,就像我们的例子一样,两种方法会在*个方面有些区别。所以,在用动态规划解题的时候,可以多想一想是否有其它的解法。对于不同的解法,要注意比拟,好的算法好在哪里,差一点的算法差在哪里。从各种不同算法的比拟中,我们可以更深刻地领会动态规划的构思技巧。七.动态规划实现中的问题应用动态规划解决问题,在有了根本的思路之后,一般来说,算法实现是比拟好考虑的。但有时也会遇到一些问题,而使算法难以实现。动态规划思想设计的算法从整体上来看根本都是按照得出的递推关系式进展递推,这种递推相对于计算机来说,只要设计得当,效率往往是比拟高的,这样在时间上溢出的可能性不大,而相反地,动态规划需要很大的空间以存储中间产生的结果,这样可以使包含同一个子问题的所有问题共用一个子问题解,从而表达动态规划的优越性,但这是以牺牲空间为代价的,为了有效地已有结果,数据也不易压缩存储,因而空间矛盾是比拟突出的。另一方面,动态规划的高时效性往往要通过大的测试数据表达出来〔以与搜索作比拟〕,因而,对于大规模的问题如何在根本不影响运行速度的条件下,解决空间溢出的问题,是动态规划解决问题时一个普遍会遇到的问题。
对于这个问题,可以考虑从以下一些方面去尝试:
一个思考方向是尽可能少占用空间。如从结点的数据构造上考虑,仅仅存储必不可少的内容,以及数据存储*围上精打细算(按位存储、压缩存储等)。当然这要因问题而异,进展分析。另外,在实现动态规划时,一个我们经常采用的方法是用一个与结点数一样多的数组来存储每一步的决策,这对于倒推求得一种实现最优解的方法是十分方便的,而且处理速度也有一些提高。但是在内存空间紧*的情况下,我们就应该抓住问题的主要矛盾。省去这个存储决策的数组,而改成在从最优解逐级倒推时,再计算一次,选择*个可能到达这个值的上一阶段的状态,直到推出结果为止。这样做,在程序编写上比上一种做法稍微多花一点时间,运行的时效也可能会有一些(但往往很小)的下降,但却换来了很多的空间。因而这种思想在处理*些问题时,是很有意义的。
但有时,即使采用这样的方法也会发现空间溢出的问题。这时就要分析,这些保存下来的数据是否有必要同时存在于内存之中。因为有很多问题,动态规划递推在处理后面的内容时,前面比拟远处的内容实际上是用不着的。对于这类问题,在已经确信不会再被使用的数据上覆盖数据,从而使空间得以重复利用,如果能有效地使用这一手段,对于相当大规模的问题,空间也不至于溢出〔为了求出最优方案,保存每一步的决策仍是必要的,这同样需要空间〕。
一般地说,这种方法可以通过两种思路来实现:一种是递推结果仅使用Data1和Data2这样两个数组,每次将Data1作为上一阶段,推得Data2数组,然后,将Data2通过复制覆盖到Data1之上,如此反复,即可推得最终结果。这种做法有一个局限性,就是对于递推与前面假设干阶段相关的问题,这种做法就比拟麻烦;而且,每递推一级,就需要复制很多的内容,与前面多个阶段相关的问题影响更大。另外一种实现方法是,对于一个可能与前N个阶段相关的问题,建立数组Data[0..N],
其中各项为最近N各阶段的保存数据。这样不采用这种内存节约方式时对于阶段k的只要对应成对数组Data中下标为kmod(N+1)的单元的就可以了。这种处理方法对于程序修改的代码很少,速度几乎不受影响,而且需要保存不同的阶段数也都能很容易实现。
当采用以上方法仍无法解决内存问题时,也可以采用对内存的动态申请来使绝大多数情况能有效出解。而且,使用动态内存还有一点好处,就是在重复使用内存而进展交换时,可以只对指针进展交换,而不复制数据,这在实践中也是十分有效的。八。动态规划与其他算法的比拟
动态规划与其说是一种算法,不如说是一种算法设计的策略,他的根本思想表达于许多其它算法之中。下面我们通过比拟动态规划和其他的一些算法之间的相互联系,来深入理解动态规划的根本思想。
1。动态规划与静态规划——*些情况下可以相互转化
2。动态规划与递推——动态规划是最优化算法
3。动态规划与搜索——动态规划是高效率、高消费算法
4。动态规划与网络流——动态规划是易设计易实现算法
九。动态规划的理论模型
在动态规划算法开展的初期,Bellman从纯粹的逻辑出发给出了最优性原理
--PrincipleofOptimality:
"Anoptimalpolicyhasthepropertythatwhatevertheinitialstate
andinitialdecisionare,thenremainingdecisionsmustconstitutean
optimalpolicywithregardtothestateresultingfromfirstdecision.
"
他给出这个原理作为动态规划适用的条件,后来Morin在1982年证明了这只是一个充分条件而非必要条件。
动态规划开场只是应用于多阶段决策性问题,后来渐渐被开展为解决离散最优化问题的有效手段,进一步应用于一些连续性问题上。然而,动态规划更像是一种思想而非算法,它没有固定的数学模型,没有固定的实现方法,其正确性也缺乏严格的理论证明。因此,一直以来动态规划的数学理论模型是一个研究的热点。
目前比拟流行的主要有两
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 桥梁钢箱梁制作和安装
- 一年级100以内加减混合运算口算题(八)A4-100-
- 植树节活动教案15篇-1
- 二级矿业工程管理与实务复习题集网上增值服务
- 绿色小清新工作总结计划模板
- 2026年毕业设计说明书航空航天结构设计
- 2026届陕西省商洛市高三下学期第一次模拟考试历史试题(含答案)
- 土地使用权转让合同模板
- 【9英一模】2026年安徽省合肥市经济技术开发区中考一模英语试卷
- 广铁累计客运量同增双位数高速磁悬浮加速纪录刷新
- 2024年西安医学院第一附属医院招聘笔试真题
- 人教版八年级物理下册:《第十章浮力-液面高度变化》PP课件
- 第十五届全国交通运输行业“极智杯”公路收费及监控员职业技能大赛考试题库-上(单选题部分)
- DL∕ T 855-2004 电力基本建设火电设备维护保管规程
- 2024二手房独家代理委托协议书模板
- 船舶与海上技术 液化天然气燃料船舶加注规范
- 楼顶发光字采购安装投标方案
- ESD和EMR术临床路径
- 激光纳米散射仪(马尔文)
- 中国古代文学史元明清文学PPT完整全套教学课件
- 《安徒生童话》推荐导读课教学设计
评论
0/150
提交评论