第4讲数据结构与算法.ppt_第1页
第4讲数据结构与算法.ppt_第2页
第4讲数据结构与算法.ppt_第3页
第4讲数据结构与算法.ppt_第4页
第4讲数据结构与算法.ppt_第5页
已阅读5页,还剩132页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、1,第4章 贪心算法,2,学习要点 理解贪心算法的概念。 掌握贪心算法的基本要素 (1)最优子结构性质 (2)贪心选择性质 理解贪心算法与动态规划算法的差异 动态规划算法: (1)最优子结构性质 (2)重叠子问题性质,3,理解贪心算法的一般理论 通过应用范例学习贪心设计策略。 (1)活动安排问题; (2)最优装载问题; (3)哈夫曼编码; (4)单源最短路径; (5)最小生成树; (6)多机调度问题。,4,贪心算法的基本思想,适用于最优化问题的算法往往包含一系列步骤,每一步都有一组选择。对某些问题动态规划算法不是最简便的方法,因为有时并不需要知道所有子问题的解。 有些问题用动态规划算法有“杀鸡

2、用牛刀”的嫌疑,贪心算法更简捷。,5,例:找零钱问题,假设有四种硬币,它们的面值分别为二角五分、一角、五分和一分。 现在要找给某顾客六角三分钱。 这时,我们会不假思索地拿出2个二角五分的硬 币,1个一角的硬币和3个一分的硬币交给顾客。 这种找硬币方法与其他的找法相比,所拿出的硬币个数是最少的。这里,我们下意识地使用了这样的找硬币算法: 首先选出一个面值不超过六角三分的最大硬币,即二角五分;然后从六角三分中减去二角五分,剩下三角八分;再选出一个面值不超过三角八分的最大硬币,即又一 个二角五分,如此一直做下去。这个找硬币的方法实际上就是贪心算法。,6,在这个例子中,算法获得的结果是整体最优的。 找

3、硬币问题具有最优子结构性质,可以用动态规划算法求解,用贪心算法更简单,更直接,解题效率更高。 找硬币问题和硬币面值的特殊性有关。如果将硬币面值改为一分、五分、一角一分,而要找给顾客一角五分。利用贪心算法,将找给顾客一个一角一分的硬币和四个一分硬币,然而,3个五分硬币显然更优。 顾名思义,贪心算法总是作出在当前看来是最好的选择。也就是说贪心算法并不从整体最优 上加以考虑,它所作出的选择只是在某种意义上的局部最优选择。,7,贪心算法(greedy algorithm):作出在当前看来最好的选择 贪心算法并不从整体最优考虑,它所作出的选择只是在某种意义上的局部最优选择。 希望贪心算法得到的最终结果也

4、是整体最优的。虽然贪心算法不能对所有问题都得到整体最优解,但对许多问题它能产生整体最优解。如单源最短路经问题,最小生成树问题等。 在一些情况下,即使贪心算法不能得到整体最优解,其最终结果却是最优解的很好近似。,8,4.1 活动安排问题,活动安排问题就是要在所给的活动集合中选出最大的相容活动子集合,是可以用贪心算法有效求解的很好例子。该问题要求高效地安排一系列争用某一公共资源的活动。贪心算法提供了一个简单、漂亮的方法使得尽可能多的活动能兼容地使用公共资源。,9,4.1 活动安排问题,设有n个活动的集合E=1,2,n,其中每个活动都要求使用同一资源,如演讲会场等,而在同一时间内只有一个活动能使用这

5、一资源。每个活动i都有一个要求使用该资源的起始时间si和一个结束时间fi,且si fi 。如果选择了活动i,则它在半开时间区间si, fi)内占用资源。 若区间si, fi)与区间sj, fj)不相交,则称活动i与活动j是相容的。也就是说,当sifj或sjfi时,活动i与活动j相容。 要在所给的活动集合中选出最大的相容活动子集合,10,4.1 活动安排问题,template void GreedySelector(int n, Type s, Type f, bool A) A1=true; int j=1; for (int i=2;i=fj) Ai=true; j=i; else Ai=f

6、alse; ,下面给出解活动安排问题的贪心算法GreedySelector :,各活动的起始时间和结束时间存储于数组s和f中且按结束时间的非减序排列,算法用集合A存储所选择的活动,活动i在集合A中,当且仅当Ai=true,变量j记录了最近一次加入A的活动。由于输入的活动以其完成时间的非减序排列,所以fj总是当前集合A中所有活动的最大结束时间。算法一开始选择活动1,并将j初始化为1.,若能相容则将活动i加入已选择活动集合A中,如不相容,则不选择活动i,而继续检查下一个活动与集合A中的活动相容性。,由于fj总是当前集合A中所有活动的最大结束时间,故活动i和当前集合A中所有活动相容的充分必要条件是其

7、开始时间不早于最近加入集合A的活动j的结束时间fj,即sifj。若活动i与之相容,则i成为最近加入集合A中的活动,并取代活动j的位置。,11,4.1 活动安排问题,由于输入的活动以其完成时间的非减序排列,所以算法greedySelector每次总是选择具有最早完成时间的相容活动加入集合A中。 直观上,按这种方法选择相容活动为未安排活动留下尽可能多的时间。也就是说,该算法的贪心选择的意义是使剩余的可安排时间段极大化,以便安排尽可能多的相容活动。 算法greedySelector的效率极高。当输入的活动已按结束时间的非减序排列,算法只需O(n)的时间安排n个活动,使最多的活动能相容地使用公共资源。

8、如果所给出的活动未按非减序排列,可以用O(nlogn)的时间重排。,12,4.1 活动安排问题,例:设待安排的11个活动的开始时间和结束时间按结束时间的非减序排列如下:,13,4.1 活动安排问题,算法greedySelector 的计算过程如左图所示。图中每行相应于算法的一次迭代。阴影长条表示的活动是已选入集合A的活动,而空白长条表示的活动是当前正在检查相容性的活动。,实际运算过程如图: 活动1已经被选入集合A; 活动2、3的开始时间早于A中的最后一个活动,即活动1的结束时间,因此没被选中; 活动4的开示时间晚于活动1的结束时间,因此被选入集合A。,实际运算过程如图: 此时集合A中最后一个活

9、动是4.经过比较剩余活动,活动8被选入; 继续进行比较,将活动11选入,算法结束。,14,4.1 活动安排问题,算法思路:若被检查的活动i的开始时间Si小于最近选择的活动j的结束时间fi,则不选择活动i,否则选择活动i加入集合A中。 结论:贪心算法并不总能求得问题的整体最优解。但对于活动安排问题,贪心算法greedySelector却总能求得的整体最优解,即它最终所确定的相容活动集合A的规模最大。这个结论可以用数学归纳法证明。,15,分析,存在以贪心选择开始的最优活动安排,16,分析,每一步所做出的贪心选择都将问题进一步简化为一个更小的与原问题具有相同形式的子问题,17,4.2 贪心算法的基本

10、要素,本节着重讨论可以用贪心算法求解的问题的一般特征。 对于一个具体的问题,怎么知道是否可用贪心算法解此问题,以及能否得到问题的最优解呢?这个问题很难给予肯定的回答。 但是,从许多可以用贪心算法求解的问题中看到这类问题一般具有2个重要的性质:贪心选择性质和最优子结构性质。,18,4.2 贪心算法的基本要素,贪心算法的特点,贪心算法是通过做一系列选择来给出某个问题的最优解。对算法中每一个决策点,做出一个当前(看起来是)最佳的选择。 这种启发式策略虽然经常能得到最优解,但不能总是保证产生最优解。,19,4.2 贪心算法的基本要素,贪心算法的步骤,决定子问题的最优子结构; 设计一个递归解; 证明在递

11、归的任一阶段,最优选择之一总是贪心选择,那么做贪心选择总是安全的; 证明通过贪心选择,所有子问题规模逐渐变小至空; 设计一个实现贪心策略的递归算法; 将递归算法转换成迭代算法。 可以看出:动态规划是贪心算法的基础;通常可以直接通过设计贪心选择,减小问题规模,找出最优子结构,而不是去证明最优子结构的存在。 在活动安排问题中,首先定义子结构Sij(选定j后,再选定i),其中i和j都是可变。如果总是做出贪心选择,则可以将子问题的形式化限制为Sin+1。,20,更一般地,可以根据如下步骤设计贪心算法: 将优化问题转换为:先做出选择,再解决剩下的一个子问题。 证明原问题总是有一个最优解事做贪心选择得到的

12、,从而证明贪心选择的安全性; 说明在做出贪心选择后,剩余子问题具有这样一个性质,即如果将子问题的最优解和所做的贪心选择联合起来,可以得到原问题的一个最优解。,21,4.2 贪心算法的基本要素,贪心选择性质,所谓贪心选择性质是指所求问题的整体最优解可以通过一系列局部最优的选择,即贪心选择来达到。这是贪心算法可行的第一个基本要素,也是贪心算法与动态规划算法的主要区别。 贪心选择:只考虑对当前问题的最佳选择,不是考虑子问题的结果。 动态规划:每一步都要选择,选择依赖每一个子问题的解; 动态规划算法通常以自底向上的方式解各子问题,而贪心算法则通常以自顶向下的方式进行,以迭代的方式作出相继的贪心选择,每

13、作一次贪心选择就将所求问题简化为规模更小的子问题。 对每个贪心算法,几乎总是会有一个相对更复杂的动态规划解。 对于一个具体问题,要确定它是否具有贪心选择性质,必须证明每一步所作的贪心选择最终导致问题的整体最优解。,22,证明每一步所作的贪心选择最终导致问题的整体最优解:需要技巧。 可以考察一个全局最优解,然后证明可以对该解加以修改,使其采用贪心选择,这个选择将原问题变成一个相似的但规模更小的问题; 然后用数学归纳法证明,通过每一步做出贪心选择可以得到原问题的全局最优解。其中,证明贪心选择后的问题简化为更小的类似子问题的关键在利用该问题的最优子结构性质。 贪心性质在面对子问题做出选择时,通常能帮

14、助我们提高效率,如在活动安排问题中,对排序好的每个活动只需检查一次。,贪心选择性质,23,4.2 贪心算法的基本要素,当一个问题的最优解包含其子问题的最优解时,称此问题具有最优子结构性质。问题的最优子结构性质是该问题可用动态规划算法或贪心算法求解的关键特征。 在活动安排问题中,最优子结构的性质表现在:若A是关于E的活动安排问题包含活动1的一个最优解,则相容活动集合A=A-1是关于E=iE:sif1的活动安排问题的一个最优解。,最优子结构性质,24,4.2 贪心算法的基本要素,贪心算法和动态规划算法都要求问题具有最优子结构性质,这是2类算法的一个共同点。 对于具有最优子结构的问题应该选用贪心算法

15、还是动态规划算法求解?是否能用动态规划算法求解的问题也能用贪心算法求解?下面研究2个经典的组合优化问题,并以此说明贪心算法与动态规划算法的主要差别。,3、贪心算法与动态规划算法的差异,25,4.2 贪心算法的基本要素,0-1背包问题: 给定n种物品和一个背包。物品i的重量是Wi,其价值为Vi,背包的容量为C。应如何选择装入背包的物品,使得装入背包中物品的总价值最大?,在选择装入背包的物品时,对每种物品i只有2种选择,即装入背包或不装入背包。不能将物品i装入背包多次,也不能只装入部分的物品i。,26,4.2 贪心算法的基本要素,背包问题: 与0-1背包问题类似,所不同的是在选择物品i装入背包时,

16、可以选择物品i的一部分,而不一定要全部装入背包,1in。,这2类问题都具有最优子结构性质,极为相似,但背包问题可以用贪心算法求解,而0-1背包问题却不能用贪心算法求解。,27,4.2 贪心算法的基本要素,计算每种物品单位重量的价值Vi/Wi,然后,依贪心选择策略,将尽可能多的单位重量价值最高的物品装入背包。 若将这种物品全部装入背包后,背包内的物品总重量未超过C,则选择单位重量价值次高的物品并尽可能多地装入背包。 依此策略一直地进行下去,直到背包装满为止。,用贪心算法解背包问题的基本步骤:,28,背包问题实例,问题描述 已知有n种物品和一个可容纳W重量的背包,每种物品I的重量为wi,假定将物品

17、I的某一部分xi放入背包就会得到pixi的效益(0 xi1, pi0) ,采用怎样的装包方法才会使装入背包物品的总效益为最大呢? 问题的形式描述 极大化 pixi 约束条件 wi xi W 0 xi1, pi0, wi0, 1in,1in,1in,29,背包问题实例,方案1:按物品价值降序装包,方案2:按物品重量升序装包,方案3:按物品价值与重量比值的降序装包,如果12kg的物品价值是$120,怎么排序装包会有最优解?,30,void Knapsack(int n,float M,float v,float w,float x) Sort(n,v,w); /按单位重量价值排序 int i; /

18、 v为价值,w为重量; for (i=1;ic) break; / 物品超重,退出 xi=1; c-=wi; / 扣除添加的物品重量 if (i=n) xi=c/wi; /装不了完整的,装入部分物品 对0-1背包问题如何改写代码?,算法knapsack的主要计算时间在于将各种物品依其单位重量的价值从大到小排序。因此,算法的计算时间上界为 O(nlogn)。 为了证明算法的正确性,还必须证明背包问题具有贪心选择性质。,31,三件物品,背包容量50磅。物品1重10磅,价值60元;物品2重20磅,价值100元,物品3重30磅,价值120元。,32,物品1每磅价值6元;物品2每磅价值5元,物品3每磅价

19、值4元。对0-1背包问题,按贪心策略要选物品1。然而,最优解应取的物品是2和3.选取物品1的可能解都是次优解。 对部分背包问题,选取物品1可达最优。,33,4.2 贪心算法的基本要素,对于0-1背包问题,贪心选择之所以不能得到最优解是因为在这种情况下,它无法保证最终能将背包装满,部分闲置的背包空间使每公斤背包空间的价值降低了。 事实上,在考虑0-1背包问题时,应比较选择该物品和不选择该物品所导致的最终方案,然后再作出最好选择。由此就导出许多互相重叠的子问题。这正是该问题可用动态规划算法求解的另一重要特征。 因此动态规划算法可以有效地解0-1背包问题。,34,4.3 最优装载,有一批集装箱要装上

20、一艘载重量为c的轮船。其中集装箱i的重量为Wi。最优装载问题要求确定在装载体积不受限制的情况下,将尽可能多的集装箱装上轮船。 问题的描述: 相当于等价值物品的0-1背包问题 1、算法描述 最优装载问题可用贪心算法求解。采用重量最轻者先装的贪心选择策略,可产生最优装载问题的最优解。具体算法描述如下页。,35,4.3 最优装载,template void Loading(int x, Type w, Type c, int n) int *t = new int n+1; Sort(w, t, n); /按集装箱重量从小到大排序 for (int i = 1; i = n; i+) xi = 0;

21、 / 每次装入最轻的物品,使装载容量最大化 for (int i = 1; i = n ,集装箱重量,可装重量,36,4.3 最优装载,2、贪心选择性质 可以证明最优装载问题具有贪心选择性质。 3、最优子结构性质 最优装载问题具有最优子结构性质。 由最优装载问题的贪心选择性质和最优子结构性质,容易证明算法loading的正确性。 算法loading的主要计算量在于将集装箱依其重量从小到大排序,故算法所需的计算时间为 O(nlogn)。,37,哈夫曼编码是广泛地用于数据文件压缩的十分有效的编码方法。其压缩率通常在20%90%之间。哈夫曼编码算法用字符在文件中出现的频率表来建立一个用0,1串表示各

22、字符的最优表示方式。 给出现频率高的字符较短的编码,出现频率较低的字符以较长的编码,可以大大缩短总码长。 例如一个包含100,000个字符的文件,各字符出现频率不同,共有6种字符出现,如下表所示。定长变码需要300,000位,而按表中变长编码方案,文件的总码长为: (451+133+123+163+94+54)1000=224,000。 比用定长码方案总码长较少约45%。,4.4 哈夫曼编码,38,符号概率编码 A0.45 0 B0.13 101 C0.12 100 D0.16 111 E0.09 1101 F0.05 1000,Huffman 编码实例,39,1、前缀码 对每一个字符规定一个

23、0,1串作为其代码,并要求任一字符的代码都不是其它字符代码的前缀。这种编码称为前缀码。 001011101 可以唯一地被分解为:0,0,101,1101 变长码与定长码都是前缀码,40,前缀码二叉树的数据结构: 叶子表示特定字符,将一个字符的编码解释为从根至该字符的路径,其中0表示转向左子结点,1表示转向右子结点。 每个叶节点标以一个字符及其出现频度,每个枝结点标以子树中所有叶节点的频率之和。 图a:固定长度编码对应树(叶子高度一致) 图b:可变长度编码对应树(叶子高度不一致),41,编码的前缀性质可以使译码方法非常简单:开始处确定; 设字母表C中某个字符c出现频率为f(c),对应在二叉树T中

24、的深度是该字符的编码长度,为dT(c) 表示最优前缀码的二叉树总是一棵完全二叉树,即树中任一结点都有2个儿子结点。 平均码长定义为: 使平均码长达到最小的前缀码编码方案称为给定编码字符集C的最优前缀码。,42,2、构造哈夫曼编码 哈夫曼提出构造最优前缀码的贪心算法,由此产生的编码方案称为哈夫曼编码。 哈夫曼算法以自底向上的方式构造表示最优前缀码的二叉树T。 算法以|C|个叶结点开始,执行|C|1次的“合并”运算后产生最终所要求的树T。,43,设Q是一个优先队列,先用字符集C中的每一字符c的频率f(c)初始化队列; 不断从优先队列Q中选取具有最小频率的两棵子树x和y,合并后产生一棵新的树,其频率

25、为合并的2棵树的频率之和,并将新树插入优先队列Q。经过n1次的合并后,优先队列中只剩下一棵树,即所要求的树T。,44,算法huffmanTree用最小堆实现优先队列Q。初始化优先队列需要O(n)计算时间,由于最小堆的removeMin和put运算均需O(logn)时间,n1次的合并总共需要O(nlogn)计算时间。因此,关于n个字符的哈夫曼算法的计算时间为O(nlogn) 。,45,3、哈夫曼算法的正确性 要证明哈夫曼算法的正确性,只要证明最优前缀码问题具有贪心选择性质和最优子结构性质。 (1)贪心选择性质 (2)最优子结构性质,46,哈夫曼编码的正确性,哈夫曼编码的正确性 考察两个问题 贪心

26、选择性质 最优子结构性质,47,贪心选择性质,贪心选择性质 设C是编码字符集,C中字符c的出现概率为f(c)。设x、y是C中具有最小概率的两个字符,存在C的最优前缀码,使得x、y具有相同码长且仅最后一位编码不同。,存在以贪心选择开始的最优编码,48,贪心选择性质证明,49,贪心选择性质证明,50,贪心选择性质证明编码树的变换,问题! 考虑变换前后对平均码长的影响能否保证变换后的平均码长仍是最优的?,51,贪心选择性质证明,52,贪心选择性质证明,53,最优子结构性质,54,最优子结构性质证明,55,最优子结构性质证明,56,Huffman编码的效率问题,效率问题 Huffman 编码字长参差不

27、齐,在信源编码概率分布不均匀时效率高 概率分布比较均匀时,不用Huffman编码。,57,实例说明,符号概率编码 A0.19 01 B0.18 00 C0.17 111 D0.16 110 E0.15 101 F0.15 100,58,4.5 单源最短路径,图的相关概念,enlogn,59,给定带权有向图G =(V,E),其中每条边的权是非负实数。另外,还给定V中的一个顶点,称为源。现在要计算从源到所有其它各顶点的最短路长度。这里路的长度是指路上各边权之和。这个问题通常称为单源最短路径问题。 如从顶点1到5,如何确定最短路径?,60,Dijkstra算法,其基本思想是,设置顶点集合S并不断地作

28、贪心选择来扩充这个集合。一个顶点属于集合S当且仅当从源到该顶点的最短路径长度已知。 集合S的构造: 初始时,S中仅含有源。 设u是G的某一个顶点,把从源到u且中间只经过S中顶点的路称为从源到u的特殊路径,并用数组dist记录当前每个顶点所对应的最短特殊路径长度。 Dijkstra算法每次从V-S中取出具有最短特殊路长度的顶点u,将u添加到S中,同时对数组dist作必要的修改。 一旦S包含了所有V中顶点,dist就记录了从源到所有其它顶点之间的最短路径长度。,61,算法描述,62,实例说明,63,实例说明,64,实例说明,65,实例说明,66,实例说明,Dijkstra算法的迭代求解过程,67,

29、最短路径求解,Prev2=1; Prev3=4; Prev4=1; Prev5=3;,求解方法:倒推,顶点的前一个顶点为,68,顶点到的最短路径求解,从顶点到顶点的最短路径长度30+20+10=60,69,Dijkstra算法的贪心选择性质,70,贪心选择性质证明,71,贪心选择性质证明,由Dijkstra算法所采用的贪心选择策略决定,72,Dijkstra算法的最优子结构性质,Dijkstra算法的最优子结构性质 考察算法所得到的distu确实是从源到顶点的最短特殊路径长度。 需要考察算法在添加到中后, distu值的变化; 当将添加到中后,可能会出现一条到顶点的新的特殊路径。,73,最优子

30、结构性质证明,如果这条特殊路径是先经过老的到达顶点,然后从经一条边直接到达顶点,则这种路的最短长度为distu+aui。 如果distu+auidisti,则算法中用distu+aui作为disti的新值。,S,源,74,最优子结构性质证明,如果该路径经过老的到达后,又回到老的中的某个顶点,最后到达顶点,由于在老的中,因此比先加入,所以从源到的路径长度小于从源到,再从到的路径长度。 这种路径不被考虑。,75,最优子结构性质证明,综上所述,不论算法中dist的值是否变化,它总是关于当前顶点集的到顶点的最短特殊路径长度。 Dijkstra算法具有最优子结构性质,76,Dijkstra算法的算法复杂

31、性分析,算法复杂性分析 Dijkstra算法的主循环体需要O(n)时间 每个循环体需要执行n-1次 Dijkstra算法的算法复杂度为O(n2),77,4.6 最小生成树,设G =(V,E)是无向连通带权图,即一个网络。E中每条边(v,w)的权为cvw。如果G的子图G是一棵包含G的所有顶点的树,则称G为G的生成树。生成树上各边权的总和称为该生成树的耗费。在G的所有生成树中,耗费最小的生成树称为G的最小生成树。,78,网络的最小生成树在实际中有广泛应用。 在设计通信网络时,用图的顶点表示城市,用边(v,w)的权cvw表示建立城市v和城市w之间的通信线路所需的费用,则最小生成树就给出了建立通信网络

32、的最经济的方案。,79,最小生成树性质,用贪心算法设计策略可以设计出构造最小生成树的有效算法。 构造最小生成树的Prim算法和Kruskal算法都可以看作是应用贪心算法设计策略的例子。 尽管这2个算法做贪心选择的方式不同,它们都利用了下面的最小生成树性质: 设G=(V,E)是连通带权图,U是V的真子集。如果(u,v)E,且uU,vV-U,且在所有这样的边中,(u,v)的权cuv最小,那么一定存在G的一棵最小生成树,它以(u,v)为其中一条边。这个性质有时也称为MST性质。,80,MST性质证明,81,性质证明,82,Prim算法,设G=(V,E)是连通带权图,V=1,2,n。 构造G的最小生成

33、树的Prim算法的基本思想是: 置S=1, 只要S是V的真子集,就作如下的贪心选择:选取满足条件iS,jV-S,且cij最小的边,将顶点j添加到S中。 进行到S=V时为止。 在这个过程中选取到的所有边恰好构成G的一棵最小生成树。,83,算法伪代码,算法结束时T中包含G的n-1条边,并且不形成回路,T就构成G的一棵生成树。,84,Prim算法的正确性证明,算法中边集合T始终包含G的某棵最小生成树种中的边, 因此算法结束时T中的所有边构成G的一棵最小生成树。,85,实例说明,86,实例说明,6,5,5,5,6,6,1,3,4,2,87,实例说明,6,5,5,5,6,6,1,3,4,2,88,实例说

34、明,6,5,5,5,6,6,1,3,4,2,89,实例说明,6,5,5,5,6,6,1,3,4,2,90,实例说明,6,5,5,5,6,6,1,3,4,2,91,实例说明,5,1,3,4,2,Prim算法的求解结果,92,在上述Prim算法中,还应当考虑如何有效地找出满足条件iS,jV-S,且权cij最小的边(i,j)。实现这个目的的较简单的办法是设置2个数组closest和lowcost。 在Prim算法执行过程中,先找出V-S中使lowcost值最小的顶点j,然后根据数组closest选取边(j,closestj),最后将j添加到S中,并对closest和lowcost作必要的修改。 用这

35、个办法实现的Prim算法所需的计算时间为,93,算法不是通过扩充连通子集T来进行贪心选择,而是通过选择具有最小权的边集合来进行贪心选择,选择同时进行连通操作以形成生成树。 Kruskal算法构造G的最小生成树的基本思想: 将G的n个顶点看成n个孤立的连通分支。 将所有的边按权从小到大排序。 从第一条边开始,依边权递增的顺序查看每一条边,并按下述方法连接2个不同的连通分支:当查看到第k条边(v,w)时,如果端点v和w分别是当前2个不同的连通分支T1和T2中的顶点时,就用边(v,w)将T1和T2连接成一个连通分支,然后继续查看第k+1条边;如果端点v和w在当前的同一个连通分支中,就直接再查看第k+

36、1条边。 这个过程一直进行到只剩下一个连通分支时为止。 此时的连通分支就是最小生成树,Kruskal算法,94,算法的伪代码描述,95,算法正确性分析,96,实例说明,97,实例说明,6,5,5,5,6,6,1,3,4,2,98,实例说明,6,5,5,5,6,6,1,3,4,2,99,实例说明,6,5,5,5,6,6,1,3,4,2,100,实例说明,6,5,5,5,6,6,1,3,4,2,101,实例说明,6,5,5,5,6,6,1,3,4,2,102,实例说明,5,1,3,4,2,Kruskal算法的求解结果,103,算法比较,关于集合的一些基本运算可用于实现Kruskal算法。 按权的递

37、增顺序查看等价于对优先队列执行removeMin运算。可以用堆实现这个优先队列。 对一个由连通分支组成的集合不断进行修改,需要用到抽象数据类型并查集UnionFind所支持的基本运算。 当图的边数为e时,Kruskal算法所需的计算时间是 。当 时,Kruskal算法比Prim算法差,但当 时,Kruskal算法却比Prim算法好得多。,104,4.7 多机调度问题,多机调度问题: 要求给出一个作业调度方案,使所给的个作业在尽可能短的时间内由台机器加工处理完成。完全问题,105,采用最长处理时间作业优先的贪心选择策略可以设计出解多机调度问题的较好的近似算法。 当 时,只要将机器i的0, ti时

38、间区间分配给作业i即可,算法只需要O(1)时间。 当 时,首先将n个作业依其所需的处理时间从大到小排序。然后依此顺序将作业分配给空闲的处理机。算法所需的计算时间为O(nlogn)。,106,设7个独立作业1,2,3,4,5,6,7由3台机器M1,M2和M3加工处理。各作业所需的处理时间分别为2,14,4,16,6,5,3。按算法greedy产生的作业调度如下图所示,所需的加工时间为17。,107,4.8 贪心算法的理论基础,借助于拟阵工具,可建立关于贪心算法的较一般的理论。 这个理论对确定何时使用贪心算法可以得到问题的整体最优解十分有用。 虽然这种理论没有覆盖贪心算法的所有情况(比如活动安排问

39、题和哈夫曼编码问题),但覆盖了许多有实际意义的情况,并正在发展中,将覆盖更多的应用。,108,1、拟阵 拟阵M定义为满足下面3个条件的有序对(S,I): (1)S是非空有限集。 (2)I是S的一类具有遗传性质的独立子集族,即若BI,则B是S的独立子集,且B的任意子集也都是S的独立子集。空集必为I的成员。 (3)I满足交换性质,即若AI,BI且|A|B|,则存在某一元素xB-A,使得AxI。,109,典型实例,事实上,由于从IG的无循环边集中去掉若干边不会产生循环,即森林的任一子集还是森林,因此IG具有遗传性质。,110,可扩展元素,111,112,极大独立子集 在关于无向图G的图拟阵MG中,

40、MG的极大独立子集就是连接图G中所有顶点且有|V|-1条边的自由树。这种树就是图G的生成树。 带权矩阵 对拟阵M=(S,I),指定权函数W,使得对于任意xS,有W(x)0,则称拟阵M为带权拟阵。 例:在图阵MG中,可以定义W(e)为边e的长度,则W(A)是边集A中所有边的长度之和。 确定S的独立子集AI使得W(A)达到最大。这种使W(A)最大的独立子集A称为拟阵M的最优子集。,113,带权矩阵 许多可以用贪心算法求解的问题可以表示为求带权拟阵的最大权独立子集问题。 给定带权拟阵M=(S,I),确定S的独立子集AI使W(A)达到最大,这样的独立子集A称为拟阵M的最优子集。由于S中任意元素x的权W

41、(x)为正,因此: 最优子集也一定是极大独立子集。 例:最小生成树问题可以表示为确定带权拟阵MG的最优子集问题。求带权拟阵的最优子集A的算法可用于解最小生成树问题。,114,求带权拟阵最优子集的贪心算法,Set greedy(M,W) A=空集; 将S中元素根据权值W(大者优先)组成优先队列; While(S不为空集) S.removeMax(x); if(AxI)A=Ax; return A; ,算法greedy以贪心选择的方式,按权值从大到小的次序依次考虑元素x。 当x是A的可扩展元素时,将x加入独立集A中; 否则,舍弃x,115,算法greedy的算法复杂性分析,116,引理4.2(拟阵的贪心选择性质) 设M=(S,I)是具有权函数W的带权拟阵,且S中元素依权值从大到小排列。又设x S是S中第一个使得x是独立子集的元素,则存在S的最优子集A使得x A。 算法greedy在以贪心选择构造最优子集A时,首次选入集合A中的元素x是单元素独立集中具有最大权的元素。此时可能已经舍弃了S中部分元素。可以证明这些被舍弃的元素不可能用于构造最优子集。,117,引理4.2的证明(1/3),118,引理4.2的证明(2/3),119,引理4.2的证明(3/3),120,引理4.3:设M=(S,I)是拟阵。若S中元素x不是空集的可扩展元素,则x也不可能是S中任一独立子集A

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论