背包问题之动态规划法-.ppt_第1页
背包问题之动态规划法-.ppt_第2页
背包问题之动态规划法-.ppt_第3页
背包问题之动态规划法-.ppt_第4页
背包问题之动态规划法-.ppt_第5页
已阅读5页,还剩49页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

动态规划,1. 概述,3. 图问题中的动态规划法,2. 组合问题中的动态规划法,4. 查找问题中的动态规划法,1. 概 述,1.1 例题(多段图),1.4 最优性原理,1.6 动态规划法的设计思想,1.5 无后效性原则,1.3 动态规划适于解决什么样的问题,1.2 什么是动态规划,1.1 多段图的最短路径问题,设图G=(V, E)是一个带权有向连通图,如果把顶点集合V划分成k个互不相交的子集Vi(2kn, 1ik),使得E中的任何一条边(u, v),必有uVi,vVi+m(1ik, 1i+mk),则称图G为多段图,称sV1为源点,tVk为终点。多段图的最短路径问题是求从源点到终点的最小代价路径。 由于多段图将顶点划分为k个互不相交的子集,所以,多段图划分为k段,每一段包含顶点的一个子集。根据多段图的定义,每个子集中的顶点互不邻接。不失一般性,将多段图的顶点按照段的顺序进行编号,同一段内顶点的相互顺序无关紧要。假设图中的顶点个数为n,则源点s的编号为0,终点t的编号为n-1,并且,对图中的任何一条边(u, v),顶点u的编号小于顶点v的编号。,设G是一个有向加权图,则G从顶点i到顶点j之间的最短路径问题满足最优性原理。 证明:设iipiqj是一条最短路径,但其中子路径 ipiqj不是最优的, 假设最优的路径为ipiqj, 则我们重新构造一条路径:iipiqj 显然该路径长度小于iipiqj,与iipiqj 是顶点i到顶点j的最短路径相矛盾. 所以,原问题满足最优性原理。,对多段图的边(u, v),用cuv表示边上的权值,将从源点s到终点t的最短路径记为d(s, t),则从源点0到终点9的最短路径d(0, 9)由下式确定: d(0, 9)=minc01+d(1, 9), c02+d(2, 9), c03+d(3, 9) 这是最后一个阶段的决策,它依赖于d(1, 9)、d(2, 9)和d(3, 9)的计算结果,而 d(1, 9)=minc14+d(4, 9), c15+d(5, 9) d(2, 9)=minc24+d(4, 9), c25+d(5, 9), c26+d(6, 9) d(3, 9)=minc35+d(5, 9), c36+d(6, 9) 这一阶段的决策又依赖于d(4, 9)、d(5, 9)和d(6, 9)的计算结果:,d(4, 9)=minc47+d(7, 9), c48+d(8, 9) d(5, 9)=minc57+d(7, 9), c58+d(8, 9) d(6, 9)=minc67+d(7, 9), c68+d(8, 9) 这一阶段的决策依赖于d(7, 9)和d(8, 9)的计算,而d(7, 9)和d(8, 9)可以直接获得(括号中给出了决策产生的状态转移): d(7, 9)=c797(79) d(8, 9)=c893(89) 再向前推导,有: d(6, 9)=minc67+d(7, 9), c68+d(8, 9)=min6+7, 5+3=8(68) d(5, 9)=minc57+d(7, 9), c58+d(8, 9)=min8+7, 6+3=9(58) d(4, 9)=minc47+d(7, 9), c48+d(8, 9)=min5+7, 6+3=9(48),d(3, 9)=minc35+d(5, 9), c36+d(6, 9)=min4+9, 7+8=13(35) d(2, 9)=minc24+d(4, 9), c25+d(5, 9), c26+d(6, 9)=min6+9, 7+9, 8+8=15(24) d(1, 9)=minc14+d(4, 9), c15+d(5, 9)=min9+9, 8+9=17(15) d(0, 9)=minc01+d(1, 9), c02+d(2, 9), c03+d(3, 9)=min4+17, 2+15, 3+13=16(03) 得到最短路径为03589,长度为16。,在上例的多阶段决策问题中,各个阶段采取的决策,一般来说是与时间有关的,决策依赖于当前状态,又随即引起状态的转移,一个决策序列就是在变化的状态中产生出来的,故有“动态”的含义,称这种解决多阶段决策最优化问题的方法为动态规划方法。,1.2 什么是动态规划,动态规划是运筹学的一个分支。与其说动态规划是一种算法,不如说是一种思维方法来得更贴切。因为动态规划没有固定的框架,即便是应用到同一道题上,也可以建立多种形式的求解算法。许多隐式图上的算法,例如求单源最短路径的Dijkstra算法、广度优先搜索算法,都渗透着动态规划的思想。 因此,动态规划不像深度或广度优先那样可以提供一套模式,需要的时候,取来就可以使用;它必须对具体问题进行具体分析处理,需要丰富的想象力去建立模型,需要创造性的思想去求解。,准确地说,动态规划不是万能的,它只适于解决一定条件的最优策略问题。 或许,大家听到这个结论会很失望:其实,这个结论并没有削减动态规划的光辉,因为属于上面范围内的问题极多,还有许多看似不是这个范围中的问题都可以转化成这类问题。 上面所说的“满足一定条件”主要指下面两点: (1)状态必须满足最优化原理; (2)状态必须满足无后效性。 这条特征说明什么呢?它说明动态规划适于解决当前决策和过去状态无关的问题。状态,出现在策略的任何一个位置,它的地位都是相同的,都可以实施同样的决策。这就是无后效性的内涵。,1.3 动态规划适于解决什么样的问题,作为整个过程的最优策略具有如下性质:无论过去的状态和决策如何,对前面的决策所形成的当前状态而言,余下的诸决策必须构成最优策略。 可以通俗地理解为子问题的局部最优将导致整个问题的全局最优,即问题具有最优子结构的性质,也就是说一个问题的最优解只取决于其子问题的最优解,非最优解对问题的求解没有影响。在 例题1 最短路径问题中,A到E的最优路径上的任一点到终点E的路径也必然是该点到终点E的一条最优路径,满足最优化原理。下面来讨论另外一个问题。,1.4 最优性原理,例题 余数最少的路径,【分析】在这个问题中,如果还按照例题1中的方法去求解就会发生错误。按照例题1的思想,A的最优取值可以由B的最优取值来确定,而B的最优取值为(1+3) mod 4 = 0,所以A的最优值应为2,而实际上,路径C1C3C5可得最优值为(2+1+1) mod 4 = 0,所以,B的最优路径并不是A的最优路径的子路径,也就是说,A的最优取值不是由B的最优取值决定的,即其不满足最优化原理,问题不具有最优子结构的性质。 由此可见,并不是所有的“决策问题”都可以用“动态规划”来解决,运用“动态规划”来处理问题必须满足最优化原理。,所谓无后效性原则,指的是这样一种性质: 某阶段的状态一旦确定,则此后过程的演变不再受此前各状态及决策的影响。也就是说,“未来与过去无关”,当前的状态是此前历史的一个完整总结,此前的历史只能通过当前的状态去影响过程未来的演变。具体地说,如果一个问题被划分各个阶段之后,阶段 I 中的状态只能由阶段 I+1 中的状态通过状态转移方程得来,与其他状态没有关系,特别是与未发生的状态没有关系,这就是无后效性。,1.5 无后效性原则,1.6 动态规划法的设计思想,动态规划法将待求解问题分解成若干个相互重叠的子问题,每个子问题对应决策过程的一个阶段,一般来说,子问题的重叠关系表现在对给定问题求解的递推关系(也就是动态规划函数)中,将子问题的解求解一次并填入表中,当需要再次求解此子问题时,可以通过查表获得该子问题的解而不用再次求解,从而避免了大量重复计算。为了达到这个目的,可以用一个表来记录所有已解决的子问题的解,这就是动态规划法的设计思想。具体的动态规划法是多种多样的,但他们具有相同的填表形式。,一、划分阶段: 按照问题的时间或空间特征,把问题分为若干个阶段。 二、选择状态: 将问题发展到各个阶段时所处于的各种客观情况用不同的状态表示出来。 三、确定决策并写出状态转移方程: 状态转移就是根据上一阶段的状态和决策来导出本阶段的状态。 四、写出规划方程(包括边界条件): 动态规划的基本方程是规划方程的通用形式化表达式。,动态规划算法的基本步骤,可以用动态规划法求解的问题除了能够分解为相互重叠的若干子问题外,还要满足最优性原理(也称最优子结构性质),这类问题具有如下特征:该问题的最优解中也包含着其子问题的最优解。在分析问题是否满足最优性原理时,通常先假设由问题的最优解导出的子问题的解不是最优的,然后再设法说明在这个假设下可构造出比原问题最优解更好的解,从而导致矛盾。 动态规划法利用问题的最优性原理,以自底向上的方式从子问题的最优解逐步构造出整个问题的最优解。应用动态规划法设计算法一般分成三个阶段: (1)分段:将原问题分解为若干个相互重叠的子问题; (2)分析:分析问题是否满足最优性原理,找出动态规划函数的递推式; (3)求解:利用递推式自底向上计算,实现动态规划过程。,2. 组合问题中的动态规划法,2.1 0/1背包问题,2.2 最长公共子序列问题,2.1 0/1背包问题,给定n种物品和一个背包,物品i的重量是wi,其价值为vi,背包的容量为C。背包问题是如何选择装入背包的物品,使得装入背包中物品的总价值最大?如果在选择装入背包的物品时,对每种物品i只有两种选择:装入背包或不装入背包,即不能将物品i装入背包多次,也不能只装入物品i的一部分,则称为0/1背包问题。,在0/1背包问题中,物品i或者被装入背包,或者不被装入背包,设xi表示物品i装入背包的情况,则当xi=0时,表示物品i没有被装入背包,xi=1时,表示物品i被装入背包。根据问题的要求,有如下约束条件和目标函数:,(式1),(式2),问题归结为寻找一个满足约束条件式1,并使目标函数式2达到最大的解向量X=(x1, x2, , xn)。,首先证明0/1背包问题满足最优性原理。 设(x1, x2, , xn)是所给0/1背包问题的一个最优解,则( x2, , xn)是下面一个子问题的最优解:,如若不然,设(y2, , yn)是上述子问题的一个最优解,则 ,且 。因此, ,这说明(x1, y2, , yn)是所给0/1背包问题比(x1, x2, , xn)更优的解,从而导致矛盾。,0/1背包问题可以看作是决策一个序列(x1, x2, , xn),对任一变量xi的决策是决定xi=1还是xi=0。在对xi-1决策后,已确定了(x1, , xi-1),在决策xi时,问题处于下列两种状态之一: a.背包容量不足以装入物品i,则xi=0背包不增加价值; b.背包容量可以装入物品i,则xi=1背包的价值增加了vi。 这两种情况下背包价值的最大者应该是对xi决策后的背包价值。令V(i, j)表示在前i(1in)个物品中能够装入容量为j(1jC)的背包中的物品的最大值,则可以得到如下动态规划函数: V(i, 0)= V(0, j)=0 (式3),式3表明:把前面i个物品装入容量为0的背包和把0个物品装入容量为j的背包,得到的价值均为0。式4的第一个式子表明:如果第i个物品的重量大于背包的容量,则装入前i个物品得到的最大价值和装入前i-1个物品得到的最大价值是相同的,即物品i不能装入背包;第二个式子表明:如果第i个物品的重量小于背包的容量,则会有以下两种情况:(1)如果把第i个物品装入背包,则背包中物品的价值等于把前i-1个物品装入容量为j-wi的背包中的价值加上第i个物品的价值vi;(2)如果第i个物品没有装入背包,则背包中物品的价值就等于把前i-1个物品装入容量为j的背包中所取得的价值。显然,取二者中价值较大者作为把前i个物品装入容量为j的背包中的最优解。,(式4),第一阶段,只装入前1个物品,确定在各种情况下的背包能够得到的最大价值; 第二阶段,只装入前2个物品,确定在各种情况下的背包能够得到的最大价值;依此类推,直到第n个阶段。 最后,V(n,C)便是在容量为C的背包中装入n个物品时取得的最大价值。为了确定装入背包的具体物品,从V(n,C)的值向前推,如果V(n,C)V(n-1,C),表明第n个物品被装入背包,前n-1个物品被装入容量为C-wn的背包中;否则,第n个物品没有被装入背包,前n-1个物品被装入容量为C的背包中。依此类推,直到确定第1个物品是否被装入背包中为止。由此,得到如下函数:,(式5),例如,有5个物品,其重量分别是2, 2, 6, 5, 4,价值分别为6, 3, 5, 4, 6,背包的容量为10,求装入背包的物品和获得的最大价值。,根据动态规划函数,用一个(n+1)(C+1)的二维表V,Vij表示把前i个物品装入容量为j的背包中获得的最大价值,根据式3把表的第0行和第0列初始化为0,然后一行一行地计算Vij,如图3所示。,10,12,12,可以看到,装入背包的物品的最大价值是15,根据式5,装入背包的物品为X=1, 1, 0, 0, 1。,图3 0/1背包求解(填表)过程,设n个物品的重量存储在数组wn中,价值存储在数组vn中,背包容量为C,数组Vn+1C+1存放迭代结果,其中Vij表示前i个物品装入容量为j的背包中获得的最大价值,数组xn存储装入背包的物品,动态规划法求解0/1背包问题的算法如下:,2.2 最长公共子序列问题,对给定序列X=(x1, x2, xm)和序列Z=(z1, z2, zk),Z是X的子序列当且仅当存在一个严格递增下标序列(i1, i2, ik),使得对于所有j=1, 2, , k,有zj=xij(1ijm)。例如,对于序列X=(a, b, c, b, d, a, b),序列(b, c, d, b)是X的一个长度为4的子序列,相应的递增下标序列为(2, 3, 5, 7),序列(a, c, b, d, b)是X的一个长度为5的子序列,相应的递增下标序列为(1, 3, 4, 5, 7)。可见,一个给定序列的子序列可以有多个。 给定两个序列X和Y,当另一个序列Z既是X的子序列又是Y的子序列时,称Z是序列X和Y的公共子序列。例如,序列X=(a, b, c, b, d, b),Y=(a, c, b, b, a, b, d, b, b),序列(a, c, b)是序列X和Y的一个长度为3的公共子序列,序列(a, b, b, d, b)是序列X和Y的一个长度为5的公共子序列。最长公共子序列问题就是在序列X和Y的公共子序列中查找长度最长的公共子序列。,设序列X=x1, x2, xm和Y=y1, y2, yn的最长公共子序列为Z=z1, z2, zk,记Xk为序列X中前k个连续字符组成的子序列,Yk为序列Y中前k个连续字符组成的子序列,Zk为序列Z中前k个连续字符组成的子序列,显然有下式成立: (1)若xm=yn,则zk=xm=yn,且Zk-1是Xm-1和Yn-1的最长公共子序列; (2)若xmyn且zkxm,则Z是Xm-1和Y的最长公共子序列; (3)若xmyn且zkyn,则Z是X和Yn-1的最长公共子序列。 可见,两个序列的最长公共子序列包含了这两个序列的前缀序列的最长公共子序列。因此,最长公共子序列问题满足最优性原理。 要找出序列X=x1, x2, xm和Y=y1, y2, yn的最长公共子序列,可按下述递推方式计算:当xm=yn时,找出Xm-1和Yn-1,的最长公共子序列,然后在其尾部加上xm即可得到X和Y的最长公共子序列;当xmyn时,必须求解两个子问题:找出Xm-1和Y的最长公共子序列以及Xm和Yn-1的最长公共子序列,这两个公共子序列中的较长者即为X和Y的最长公共子序列。用Lij表示子序列Xi和Yj的最长公共子序列的长度,可得如下动态规划函数:L00=Li0=L0j=0(1im,1jn) (式6) (式7),由此,把序列X=x1, x2, xm和Y=y1, y2, yn的最长公共子序列的搜索分为m个阶段,第1阶段,按照式7计算X1和Yj的最长公共子序列长度L1j(1jn),第2阶段,按照式7计算X2和Yj的最长公共子序列长度L2j(1jn),依此类推,最后在第m阶段,计算Xm和Yj的最长公共子序列长度Lmj(1jn),则Lmn就是序列Xm和Yn的最长公共子序列的长度。,为了得到序列Xm和Yn具体的最长公共子序列,设二维表Sm+1n+1,其中Sij表示在计算Lij的过程中的搜索状态,并且有:,若Sij=1,表明ai=bj,则下一个搜索方向是Si-1j-1; 若Sij=2,表明aibj且Lij-1Li-1j,则下一个搜索方向是Sij-1; 若Sij=3,表明aibj且Lij-1Li-1j,则下一个搜索方向是Si-1j。 如:序列X=(a, b, c, b, d, b),Y=(a, c, b, b, a, b, d, b, b),建立两个(m+1)(n+1)的二维表L和表S,分别存放搜索过程中得到的子序列的长度和状态。首先把表L和表S的第0行和第0列初始化为0,然后根据式6和7逐行计算填入表L和表S中。计算结果如图4所示。,(a) 长度矩阵L (b) 状态矩阵S 图4 最长公共子序列求解示意图,3. 图问题中的动态规划法,3.1 TSP问题,3.2 多段图的最短路径问题,3.1 TSP问题,TSP问题是指旅行家要旅行n个城市,要求各个城市经历且仅经历一次然后回到出发城市,并要求所走的路程最短。 各个城市间的距离可以用代价矩阵来表示,如果(i, j) E,则cij。,假设从顶点i出发,令d(i, V)表示从顶点i出发经过V中各个顶点一次且仅一次,最后回到出发点i的最短路径长度,开始时,VVi,于是,TSP问题的动态规划函数为: d(i,V)=mincik+d(k,Vk)(kV) (式8) d(k,)=cki(ki) (式9),从城市0出发,经城市1、2、3然后回到城市0的最短路径长度是: d(0, 1, 2, 3)=minc01+ d(1, 2, 3), c02+ d(2, 1, 3), c03+ d(3, 1, 2) 这是最后一个阶段的决策,它必须依据d(1, 2, 3)、d(2, 1, 3)和d(3, 1, 2)的计算结果,而:,d(1, 2, 3)=minc12+d(2, 3), c13+ d(3, 2) d(2, 1, 3)=minc21+d(1, 3), c23+ d(3, 1) d(3, 1, 2)=minc31+d(1, 2), c32+ d(2, 1) 这一阶段的决策又依赖于下面的计算结果: d(1, 2)= c12+d(2, ) d(2, 3)=c23+d(3, ) d(3, 2)= c32+d(2, ) d(1, 3)= c13+d(3, ) d(2, 1)=c21+d(1, ) d(3, 1)=c31+d(1, ) 而下式可以直接获得(括号中是该决策引起的状态转移):d(1, )= c10 =5(10) d(2, )= c20 =6(20) d(3, )= c30 =3(30),再向前推导,有: d(1, 2)= c12+d(2, )=2+6=8(12) d(1, 3)= c13+d(3, )=3+3=6(13) d(2, 3)= c23+d(3, )=2+3=5(23) d(2, 1)= c21+d(1, )=4+5=9(21) d(3, 1)= c31+d(1, )=7+5=12(31) d(3, 2)= c32+d(2, )=5+6=11(32) 再向推导,有: d(1, 2, 3)=minc12+d(2, 3), c13+ d(3, 2)=min2+5, 3+11=7(12) d(2, 1, 3)=minc21+d(1, 3), c23+ d(3, 1)=min4+6, 2+12=10(21),d(3, 1, 2)=minc31+d(1, 2), c32+ d(2, 1)=min7+8, 5+9=14(32) 最后有: d(0, 1, 2, 3)=minc01+ d(1, 2, 3), c02+ d(2, 1, 3), c03+ d(3, 1, 2) =min3+7, 6+10, 7+14=10(01) 从顶点0出发的TSP问题的最短路径长度为10,路径是01230。,假设对n个顶点分别用0n-1的数字编号,考虑从顶点0出发求解TSP问题的填表形式。首先,按个数为1、2、n-1的顺序生成1n-1个元素的子集存放在数组V2n-1中,例如当n=4时,V1=1, V2=2, V3=3, V4=1, 2, V5=1, 3, V6=2, 3, V7=1, 2, 3。设数组dn2n-1存放迭代结果,其中dij表示从顶点i经过子集Vj中的顶点一次且仅一次,最后回到出发点0的最短路径长度。首先,根据式9将数组d的第0列初始化,然后根据式8逐列计算,其填表过程如图5所示。,图5 动态规划法的填表过程,设顶点之间的代价存放在数组cnn中,动态规划法求解TSP问题的算法如下:,算法2的时间复杂性为O(2n)。和蛮力法相比,动态规划法求解TSP问题,把原来的时间复杂性是O(n!)的排列问题,转化为组合问题,从而降低了算法的时间复杂性,但它仍需要指数时间。,练,4. 查找问题中的动态规划法,4.1 最优二叉查找树,4.2 近似串匹配问题,设r1, r2, , rn是n个记录的集合,其查找概率分别是p1, p2, , pn,最优二叉查找树(Optimal Binary Search Trees)是以这n个记录构成的二叉查找树中具有最少平均比较次数的二叉查找树,即 最小,其中pi是记录ri的查找概率,ci是在二叉查找树中查找ri的比较次数。 例如,集合A, B, C, D的查找概率是0.1, 0.2, 0.4, 0.3,图6.11给出了三棵二叉查找树,在查找成功的情况下,二叉查找树(a)的平均比较次数是0.110.22+0.43+0.34=2.9,二叉查找树(b)的平均比较次数是0.120.21+0.42+0.33=2.1,最优二叉查找树是(c),平均比较次数是0.130.22+0.41+0.32=1.7。,4.1 最优二叉查找树,将由r1, r2, , rn构成的二叉查找树记为T(1, n),其中rk(1kn)是T(1, n)的根结点,则其左子树T(1, k-1)由r1, , rk-1构成,其右子树T(k+1, n)由rk+1, , rn构成,如图7所示。显然,若T(1, n)是最优二叉查找树,则其左子树T(1, k-1)和右子树T(k+1, n)也是最优二叉查找树,如若不然,假设T(1, k-1)是比T(1, k-1)更优的二叉查找树,则T(1, k-1)的平均比较次数小于T(1, k-1)的平均比较次数,从而由T(1, k-1)、rk和T(k+1, n)构成的二叉查找树T(1, n)的平均比较次数小于T(1, n)的平均比较次数,这与T(1, n)是最优二叉查找树的假设相矛盾。因此最优二叉查找树满足最优性原理。,设T(i, j)是由记录ri, , rj(1ijn)构成的二叉查找树,C(i, j)是这棵二叉查找树的平均比较次数。虽然最后的结果是C(1, n),但遵循动态规划法的求解方法,需要求出所

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论