从一道笔试题谈算法优化-_第1页
从一道笔试题谈算法优化-_第2页
从一道笔试题谈算法优化-_第3页
从一道笔试题谈算法优化-_第4页
从一道笔试题谈算法优化-_第5页
已阅读5页,还剩7页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、从一道笔试题谈算法优化引子每年十一月各大IT公司都不约而同、争后恐后地到各大高校进行全国巡回招聘。与此同时,网上也开始出现大量笔试面试题;网上流传的题目往往都很精巧,既能让考查基础知识,又在平淡中隐含了广阔的天地供优秀学生驰骋。这两天在网上淘到一道笔试题目(注1,虽然真假未知,但的确是道好题,题目如下:从10亿个浮点数中找出最大的1万个。这是一道似易实难的题目,一般同学最容易中的陷阱就是没有重视这个“亿”字。因为有10亿个单精度浮点数元素的数组在32位平台上已经达到3.7GB之巨,在常见计算机平台(如Win32上声明一个这样的数组将导致堆栈溢出。正确的解决方法是分治法,比如每次处理100万个数

2、,然后再综合起来。不过这不是本文要讨论的主旨,所以本文把上题的10亿改为1亿,把浮点数改为整数,这样可以直接地完成这个问题,有利于清晰地讨论相关算法的优化(注2。不假思索拿到这道题,马上就会想到的方法是建立一个数组把1亿个数装起来,然后用for循环遍历这个数组,找出最大的1万个数来。原因很简单,因为如果要找出最大的那个数,就是这样解决的;而找最大的1万个数,只是重复1万遍而已。template< class T >void solution_1( T BigArr, T ResArr for( int i = 0; i < RES_ARR_SIZE; +i int idx =

3、 i;for( int j = i+1; j < BIG_ARR_SIZE; +j if( BigArrj > BigArridx idx = j;ResArri = BigArridx;std:swap( BigArridx, BigArri ;设BIG_ARR_SIZE =1亿,RES_ARR_SIZE = 1万,运行以上算法已经超过40分钟(注3,远远超过我们的可接受范围。稍作思考从上面的代码可以看出跟SelectSort算法的核心代码是一样的。因为SelectSort是一个O(n2的算法(solution_1的时间复杂度为O(n*m,因为solution_1没有将整个大数组

4、全部排序,而我们又知道排序算法可以优化到O(nlogn,那们是否可以从这方面入手使用更快的排序算法如MergeSor、QuickSort呢?但这些算法都不具备从大至小选择最大的N个数的功能,因此只有将1亿个数按从大到小用QuickSort排序,然后提取最前面的1万个。template< class T, class I >void solution_2( T BigArr, T ResArr std:sort( BigArr, BigArr + BIG_ARR_SIZE, std:greater_equal( ;memcpy( ResArr, BigArr, sizeof(T *

5、RES_ARR_SIZE ;因为STL里的sort算法使用的是QuickSort,在这里直接拿来用了,是因为不想写一个写一个众人皆知的QuickSort代码来占篇幅(而且STL的sort高度优化、速度快。对solution_2进行测试,运行时间是32秒,约为solution_1的1.5%的时间,已经取得了几何数量级的进展。深入思考压抑住兴奋回头再仔细看看solution_2,你将发现一个大问题,那就是在solution_2里所有的元素都排序了!而事实上只需找出最大的1万个即可,我们不是做了很多无用功吗?应该怎么样来消除这些无用功?如果你一时没有头绪,那就让我慢慢引导你。首先,发掘一个事实:如果

6、这个大数组本身已经按从大到小有序,那么数组的前1万个元素就是结果;然后,可以假设这个大数组已经从大到小有序,并将前1万个元素放到结果数组;再次,事实上这结果数组里放的未必是最大的一万个,因此需要将前1万个数字后续的元素跟结果数组的最小的元素比较,如果所有后续的元素都比结果数组的最小元素还小,那结果数组就是想要的结果,如果某一后续的元素比结果数组的最小元素大,那就用它替换结果数组里最小的数字;最后,遍历完大数组,得到的结果数组就是想要的结果了。template< class T >void solution_3( T BigArr, T ResArr /取最前面的一万个memcpy(

7、 ResArr, BigArr, sizeof(T * RES_ARR_SIZE ;/标记是否发生过交换bool bExchanged = true;/遍历后续的元素for( int i = RES_ARR_SIZE; i < BIG_ARR_SIZE; +i int idx;/如果上一轮发生过交换if( bExchanged /找出ResArr中最小的元素int j;for( idx = 0, j = 1; j < RES_ARR_SIZE; +j if( ResArridx > ResArrj idx = j;/这个后续元素比ResArr中最小的元素大,则替换。if( B

8、igArri > ResArridx bExchanged = true;ResArridx = BigArri;elsebExchanged = false;上面的代码使用了一个布尔变量bExchanged标记是否发生过交换,这是一个前文没有谈到的优化手段用以标记元素交换的状态,可以大大减少查找ResArr中最小元素的次数。也对solution_3进行测试一下,结果用时2.0秒左右(不使用bExchanged则高达32分钟,远小于solution_2的用时。深思熟虑在进入下一步优化之前,分析一下solution_3的成功之处。第一、solution_3的算法只遍历大数组一次,即它是一个

9、O(n的算法,而solution_1是O(n*m的算法,solution_2是O(nlogn的算法,可见它在本质上有着天然的优越性;第二、在solution_3中引入了bExchanged这一标志变量,从测试数据可见引入bExchanged减少了约99.99%的时间,这是一个非常大的成功。上面这段话绝非仅仅说明了solution_3的优点,更重要的是把solution_3的主要矛盾摆上了桌面为什么一个O(n的算法效率会跟O(n*m的算法差不多(不使用bExchanged?为什么使用了bExchanged能够减少99.99%的时间?带着这两个问题再次审视solution_3的代码,发现bExch

10、anged的引入实际上减少了如下代码段的执行次数:for( idx = 0, j = 1; j < RES_ARR_SIZE; +j if( ResArridx > ResArrj idx = j;上面的代码段即是查找ResArr中最小元素的算法,分析它可知这是一个O(n的算法,到此时就水落石出了!原来虽然solution_3是一个O(n的算法,但因为内部使用的查找最小元素的算法也是O(n的算法,所以就退化为O(n*m的算法了。难怪不使用bExchanged使用的时间跟solution_1差不多;这也从反面证明了solution_3被上面的这一代码段导致性能退化。使用了bExcha

11、nged之后因为减少了很多查找最小元素的代码段执行,所以能够节省99.99%的时间!至此可知元凶就是查找最小元素的代码段,但查找最小元素是必不可少的操作,在这个两难的情况下该怎么去优化呢?答案就是保持结果数组(即ResArr有序,那样的话最小的元素总是最后一个,从而省去查找最小元素的时间,解决上面的问题。但这也引入了一个新的问题:保持数组有序的插入算法的时间复杂度是O(n的,虽然在这个问题里插入的数次比例较小,但因为基数太大(1亿,这一开销仍然会令本方案得不偿失。难道就没有办法了吗?记得小学解应用题时老师教导过我们如果解题没有思路,那就多读几遍题目。再次审题,注意到题目并没有要求找到的最大的1

12、万个数要有序(注4,这意味着可以通过如下算法来解决:1将BigArr的前1万个元素复制到ResArr并用QuickSort使ResArr有序,并定义变量MinElemIdx保存最小元素的索引,并定义变量ZoneBeginIdx保存可能发生交换的区域的最小索引;2遍历BigArr其它的元素,如果某一元素比ResArr最小元素小,则将ResArr中MinElemIdx指向的元素替换,如果ZoneBeginIdx = MinElemIdx则扩展ZoneBeginIdx;3重新在ZoneBeginIdx至RES_ARR_SIZE元素段中寻找最小元素,并用MinElemIdx 保存其它索引;4重复2直至

13、遍历完所有BigArr的元素。依上算法,写代码如下:template< class T, class I >void solution_4( T BigArr, T ResArr /取最前面的一万个memcpy( ResArr, BigArr, sizeof(T * RES_ARR_SIZE ;/排序std:sort( ResArr, ResArr + RES_ARR_SIZE, std:greater_equal( ;/最小元素索引unsigned int MinElemIdx = RES_ARR_SIZE - 1;/可能产生交换的区域的最小索引unsigned int Zone

14、BeginIdx = MinElemIdx;/遍历后续的元素for( unsigned int i = RES_ARR_SIZE; i < BIG_ARR_SIZE; +i /这个后续元素比ResArr中最小的元素大,则替换。if( BigArri > ResArrMinElemIdx ResArrMinElemIdx = BigArri;if( MinElemIdx = ZoneBeginIdx -ZoneBeginIdx;/查找最小元素unsigned int idx = ZoneBeginIdx;unsigned int j = idx + 1;for( ; j < R

15、ES_ARR_SIZE; +j if( ResArridx > ResArrj idx = j;MinElemIdx = idx;经过测试,同样情况下solution_4用时约1.8秒,较solution_3效率略高,总算不负一番努力。这次优化从solution_4产生的输出来入手。把solution_4的输出写到文件,查看后发现数组基本无序了。这说明在程序运行一定时间后,频繁的替换几乎将原本有序的结果数组全部换血。结果数组被替换的元素越多,查找最小元素要遍历的范围就越大,当被替换的元素个数接近结果数组的大小时,solution_4就退化成solution_3。因为solution_4很

16、快退化也就直接导致它的效率没有本质上的提高。找出了原因,就应该找出一个解决的办法。通过上面的分析,知道solution_3和solution_4最消耗时间的是查找最小元素这一操作,将它减少(或去除才有可能从本质上提高效率。这样思路又回到保持结果数组有序这一条老路上来。在上一节我们谈到保持数组有序的插入算法将带来大量的元素移动,频繁的插入操作将使这一方法在效率上得不偿失。有没有办法让元素移动去掉呢?答案也是有的那就是使用链表。这时新的问题又来了,链表因为是非随机存取数据结构,插入前寻找位置的算法又是O(n的。解决新的问题的答案是使用AVL 树,但AVL树虽然插入和查找都是O(logn,可是需要在

17、插入后进行调整保持平衡,这又是一个耗费大量时间的操作。分析到现在,发现我们像进了迷宫,左冲右突都找不到突破口。现在请静下来想一想,如果思考结果没有跳出上面这个怪圈,那我不幸地告诉你:你被我误导了。这个故意的误导是要告诫大家:进行算法优化必须时刻保持自己头脑清醒,否则时刻都有可能陷入这样的迷宫当中。现在跳出这个怪圈重新思考,根据前文的分析,可知目标是减少(或去除查找最小元素的操作次数(或查找时间,途径是让ResArr保持有序,难点在于给ResArr排序太费时。反过来想一想,是否需要时刻保持ResArr有序?答案为否,因为当查找最小元素需要遍历的范围较小时,速度还是很快的,这样就犯不着在每替换一个

18、元素的时候都排序一次,而仅需要在无序元素较多的时候适时地排序即可(即保持查找最小元素要遍历的范围较小。这个思想有用吗?写代码来测试一下:template< class T, class I >void solution_5( T BigArr, T ResArr /同solution_4,略/这个后续元素比ResArr中最小的元素大,则替换。if( BigArri > ResArrMinElemIdx ResArrMinElemIdx = BigArri;if( MinElemIdx = ZoneBeginIdx -ZoneBeginIdx;/太多杂乱元素的时候排序if( Z

19、oneBeginIdx < 9400 std:sort( ResArr, ResArr + RES_ARR_SIZE, std:greater( ;ZoneBeginIdx = MinElemIdx = RES_ARR_SIZE - 1;continue;/同solution_4,略代码中的9400是经过试验得出的最好数值,即在有600个元素无序的时候进行一次排序。测试的结果令人惊喜,用时仅400毫秒左右,约为solution_4的五分之一,这也证明了上述思想是正确的。殚思极虑 脚步永远向前,在取得 solution_5 这样的成果之后,仍然有必要分析和优化它。对这一 看似已经完美的算法

20、进行下一次优化要从哪里着手?这时候要借助于性能剖分工具了, 常用 的有 Intel 的 VTune 以及 Microsoft Visual C+自带的 profile 等。 使用 MS profile 对 solution_5 分析产生的报告如下(略去一些无关数据): Func Func+Child Hit Time % Time % Count Function -37.718 1.0 3835.317 99.5 1 _main (algo.obj 111.900 2.9 3220.082 83.6 1 solution_5(int * . 0.000 0.0 3074.063 79.8 1

21、12 _STL:sort(int *,. 可以发现 sort 函数的调用用去了将近 80%的时间,这表明 sort 函数是问题所在,优化 应该从这里着手。但正如前文所说,STL 的 sort 已经高度优化速度很快了,再对他作优化是 极难的;而且 sort 函数里又调用了其它 STL 内部函数,如蛛丝般牵来绕去,读得懂已经不 是一般人可完成的了,优化从何谈起? 我们不能左右天气,但我们可以左右心情;我们不能修改 sort 函数,但我们可以控制 sort 的调用。再看看 solution_5 里对 sort 的调用有没有什么蛛丝马迹可寻: std:sort( ResArr, ResArr + RES_ARR_SIZE, std:greater( ; 这个调用是把结果数组 ResArr 重新排序一遍。 需要把整个 ResArr 完全重新排序吗?答 案是需要的,但可以不使用这个方法

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论