数据结构课程设计内部排序算法性能分析.doc

上传人：w*** IP属地：四川上传时间：2020-04-22 格式：DOC 页数：39 大小：680.50KB 积分：15 举报 版权申诉

已阅读5页，还剩34页未读，继续免费阅读

版权说明：本文档由用户提供并上传，收益归属内容提供方，若内容存在侵权，请进行举报或认领

文档简介

课程名称课程名称数据结构本科学生课程设计论文本科学生课程设计论文题目内部排序算法性能分析姓名学号 104328318117680 学部计算机科学与技术专业年级计科 1003 指导教师 2011 年 12 月 24 日摘要排序是计算机科学中基本的研究课题之一其目的是方便记录的查找插入和删除通过描述冒泡选择插入堆和快速 6 种排序算法内部排序其算法灵活方便因此成为了程序算法中一个必不可少的应用所以在应用之前要经过严谨的思考才不会出错不会造成计算机运算速度的延迟才会完全发挥内部排序的性能内部排序的方法种类繁多但就其全面性能而言很难提出一种被认为是最好的方法但就其全面性能而言很难提出一种被认为是最好的方法每一种方法都有各自的优缺点适合不同的环境如记录的初始排序列状态等下使用如果安排序过程中依据的不同原则对内部排序方法进行分类则大致可分为插入排序交换排序选择排序归并排序和计数排序等五类如果按内部排序过程中所需要的工作量来区分则可分为 3 类 1 简单的排序方法该时间复杂度为 O n n 2 先进的排序方法该时间复杂度为 O nlogn 3 基数排序其时间复杂度为 O d n 主要介绍非常实用而算法又容易接受的的这六类排序由于很多人在使用的过程中不知道那种排序适合他们的程度设计因此导致该算法没有得到充分的应用起泡排序最简单的排序很容易写出代码但运算时间复杂度稍长一些直接排序能够很快的最大和最小的数据但假如数据较多操作比较繁琐简单选择排序稳定比较次数与起泡排序一样则相对之还要慢快速排序速度快数据移动少平均性能比较好但是性能不稳定希尔排序是插入算法的改进由于多次的插入造成了其稳定性不好堆排序在最坏情况下时间复杂度也为 O nlogn 并且它仅需一个记录大小供交换用的辅助存储空间但在记录数较少时不提倡使用但本文主要介绍这 6 类排序起泡排序直接排序简单选择排序快速排序希尔排序堆排序一些优点和缺陷对缺陷加以改进通过对传统算法的性能分析发现其中的缺陷对算法的设想来弥补中间的不足以致算法的性能有所提高关键字数据结构内部排序算法改进性能分析目目录录第 1 章前言 1 1 1 分析问题 1 1 2 研究背景 1 1 3 研究方向 2 1 4 研究方法 2 1 5 结构与安排 2 第 2 章系统功能分析 3 2 1 需求分析及实现目标 3 2 1 1 应用现状及存在的问题 3 2 1 2 实现任务 3 2 2 可行性分析 4 2 2 1 技术可行性 4 2 2 2 工具可行性 4 2 2 3 经济可行性 4 2 2 4 操作可行性 4 第 3 章总体设计 5 3 1 设计需求及描述 5 3 1 1 设计问题描述 5 3 1 2 设计需求分析 5 3 1 3 系统设计的实质功能 5 3 2 设计原理与设计内容 6 3 2 1 系统总体结构 6 3 2 2 内部操作过程菜单设计原理如图所示 6 3 2 2 排序性能分析菜单设计原理 7 3 2 3 设计内容 7 第 4 章详细设计 9 4 1 冒泡排序 9 4 2 直接插入排序 10 4 3 希尔排序 11 4 4 简单选择排序 13 4 5 快速排序 14 4 6 堆排序 16 4 7 六种排序方法讨论 18 第 5 章排序算法的改进 20 5 1 双向冒泡排序算法 20 5 2 双倍快速排序的算法 21 5 3 选择排序的算法 22 5 4 堆排序的改进算法 24 第六章系统实现及数据测试 29 6 1 主界面 29 6 2 排序内部操作过程菜单 29 6 2 1 当用户输入 0 6 的数字时则会随意的进入下一级子菜单 30 6 2 2 输入 2 进行希尔排序 30 6 3 性能分析菜单 31 6 3 1 当用户输入 1 时进行插入与希尔排序之间的性能分析比较 31 6 3 2 当用户输入 1 时进行插入与冒泡排序之间的性能分析比较 32 总结 33 参考文献 34 内部算法性能分析第 1 章前言 1 第 1 章前言 1 1 分析问题排序是指将一个数据元素序列排列成一个有序列的过程排序是计算机的一个重要的领域并广泛应用于数据处理情报检索商业金融及企业管理等许多方面资料表明在当今计算机系统中花费在排序上的时间占了系统运行的时间的很大比重相当多的计算机中有 50 以上的 CPU 时间是用在排序数据上的因此为了提高计算机系统的工作效率研究和发展更有效的排序算法的十分重要的目前人们已经提出了许多不同的排序算法然而如果在不适应的场合的应用那么其平均时间 averageTime 和最差时间 worstTime 就会不理想其排序算效率就会大大的降低如国防系统和生命支持系统如果排序方法性能低下将会令我们大大的失望另外用来衡量排序算法的标准是稳定性在那些比较复杂的排序中其稳定性不是很好容易程序出错就这样造成我们计算机的运算时间加长和内存地址的浪费 1 2 研究背景由于排序是数据结构中的重要的一个部分也是在实际开发中易遇到的问题所以研究各种排序算法的时间消耗对于实际应用当中很有必要通过分析实际结合算法的特性进行选择和使用哪种算法可以使实际问题得到更好更充分的解决该系统通过对各种内部排序算法如直接插入排序冒泡排序简单选择排序快速排序希尔排序堆排序等以关键码的比较次数分析其特点并进行比较估算每种算法的时间消耗从而比较各种算法的优劣和使用情况排序表的数据是多种不一样的情况如随机产生数据极端的数据如已是正序或逆序数据比较的结果用一个直方图来表示然而在本文中我们将选择其中最基本也是最常用的 6 种内部排序直接插入排序冒泡排序简单选择排序快速排序希尔排序堆排序进行讨论介绍它们的基本思想和实现过程分析各种算法的时间空间复杂性比较次数移动次数以及稳定性以期读者能够掌握这些算法及其特点中在实际应用中能够结合具体问题设计出正确而高效率的数据排序程序内部算法性能分析第 1 章前言 2 1 3 研究方向排序算法其种类繁多但还是有一些未解次的问题例如选择排序快速排序希尔排序堆排序仍然面临排序后的不稳定性从而还面临一种稳定的算法也可由不稳定的算法来实现冒泡排序很容易实现但是它的时间复杂度和移动次数的问题仍然存在更让人不可思议的是有些排序这两种缺点都存在同样每一种排序算法都有它的优缺点适合于不同的环境因此在实际应用中应根据具体情况进行选择首先考虑排序对稳定性的要求若要求稳定则只能在稳定的排序方法中选取否则可以在所有的方法中选取其次要考虑待排序的序列记录数目 n 若 n 较大则可以在改进的方法中选取否则在简单方法中选取然后再考虑其他因素本文主要是通过排序来从中发现的稳定性比较次数以及移动次数等问题从而从性能上分析得出不足并加以改进 1 4 研究方法基于 Visual C 6 0 平台编程是当今程序者的青睐它有着强大的性能完全丰富的工具及高速的处理速度和完备的兼容性不仅可以简化编程的设计并且算法应用灵活使应用程序的开发更为简便 C 是为开发大型程序而研制的它比 C 语言困难得多它功能丰富表达能力强使用灵活方便应用面广目标程序效率高可移植性好既具有高级语言的优点又具有低级语言的许多特点完全适合于编写系统软件本人就利用上述 C 开发软件编写了内部排序算法性能分析系统采用人机互动的操作模式系统经过显示主界面功能然后用户的需要操作实现了两种排序相互之间的优缺点从而从中获得一些性能分析结论让人们更好应用各种排序 1 5 结构与安排本文主要是介绍六种排序的性能分析首先前言对研究背景和研究目的作了简单的介绍其次系统功能分析对本系的说明和讲解再次总体设计对本系统做了一个简要引导并且通过总体设计对该系统的运行懂得差不多了详细设计就是对系统有了详细的设计过程更进一步知道设计原理排序算法的改进介绍传统算法的不足经过设想对原算法加以改进系统实现及数据测试不但让我们知道了系统的界面和一些操作的实施让你知道整个算法的设计并且加以理解内部算法性能分析第 1 章前言 3 第 2 章系统功能分析 2 1 需求分析及实现目标 2 1 1 应用现状及存在的问题随着社会的发展计算机科学技术应用又迈进了一大步然而在很多的应用过程中不时产生很多错误或延迟尤其是在钢铁厂天气预报的预测火箭的发射等一些大型的场所这无疑处理器在处理的过程中不能出一些差错因此就要对那些已编制好的程序的算法要求比较严谨排序就是其中之一很多人在运用的过程中对其算法不够了解或者考虑不周因此给处理器造成了不必的误时就拿火箭发射来说如果排序方法性能低下将是非常危险的我们将会看到有几个排序算法能够提供某种保证机制可以消除在最差情况下不可接受的执行性能另外存在一个比较大的问题就是排序的稳定性稳定排序方法保持相等元素的相关顺序例如假设有一个学生数组其中的每一项由学生的姓和其品质总分数组成根据品质总分数排序如果排序方法稳定并且 balan 28 开始时位于比 wang 28 小的索引位置排序后 balan 28 仍然位于比 wang 28 小的索引位置稳定性可以简化工程开发例如假设上面提到的数组已经根据排好序了有一个根据品质总分数排序的应用程序调用对于拥有同样品质总分数的学生他们的顺序还是按字母顺序稳定排序不需要附加其他确保相同品质总分数的学生按字母顺序排列的工作就可以完成了因此对于程序员来说这是必备的重要技能同时掌握它是他们当前一项急迫的任务 2 1 2 实现任务排序数据是由系统随机产生再通过用户根据自已所需的进行对这六种排序的操作简洁清晰容易理解提高了对该六种排序性能的应用用户只需按界面上的提示操作这六种排序的性能分析由系统自动的给予分析并且可以看到整个的排序过程如移动的次数比较的次数以及稳定性好坏在系统随机产生数据是用户最好是多采用几组数据进行比较这样的正确率要高同时测试系统的性能好坏内部算法性能分析第 2 章系统功能分析 4 2 2 可行性分析所谓可行性分析就是用最小的代价在尽可能短的时间内确定问题是否能够解决这步工作的主要是要进行一次大大压缩简化了的系统分析和设计的过程也就是在较高层次上以比较抽象的方式进行系统分析和设计的过程可行性研究的最根本任务是对以后的行动方针提出建议以避免时间资源人力和金钱的浪费推荐一个较好的解决方案并且为工程制定一个初步的计划 2 2 1 技术可行性本系统采用人机操作进行管理用 visual C 6 0 进行前台设计系统随机产生数据用户通过界面操作系统自动给予合理分析由于 visual C 6 0 功能强大使用的灵活良好的可扩展性以及广泛实际应用充分说明本系统在技术方面的可行性 2 2 2 工具可行性软件方面信息时代对于软件的应用已不是人们的难题人们在日常办公中用的计算机操作的系统等都属于软件部分硬件方面计算机普及到今天人们对于它的拥有已不少见它的硬件设备完全能够满足人们的需求而价格也能被人们所接受 2 2 3 经济可行性这是个超小型的性能分析系统从投入的人力财力与物力来讲是非常之小的只要一台电脑一台打印机这个系统就可以搞起来考虑到学校里有电脑现只要购置一台打印机就可以了从节省人力方面可以让管理人员从繁与复杂的工作中解脱出来做更多的工作可以给读者提高到更深的一个层次 2 2 4 操作可行性本系统设计清晰有良好的用户接口操作简洁完全可以给用户解决内部算法性能分析第 2 章系统功能分析 5 并达到操作过程中的直观方便实用安全等要求因此操作方面具有可行性第 3 章总体设计 3 1 设计需求及描述 3 1 1 设计问题描述设计一个测试程序比较起泡排序直接排序简单选择排序快速排序希尔排序堆排序算法的关键字比较次数和移动次数以取得直观感受待排序表的表长不小于 10 表中数据随机产生至少用 5 组不同数据作比较比较指标有关键字参加比较次数和关键字的移动次数关键字交换记为 3 次移动最后输出比较结果 3 1 2 设计需求分析用数组 S 来存放系统随机产生的 100 个数据并放到 R 数组中数据由程序随机产生用户只需查看结果利用全局变量 times 和 changes 来分别统计起泡排序直接排序简单选择排序快速排序希尔排序堆排序算法的比较次数和移动次数然后输出结果并在每一次统计之后将 times 和 changes 都赋值为 0 在主函数中调用用户自定义函数输出比较结果本程序是对几种内部排序算法的关键字进行性能分析的程序它分为以下几个部分 a 建立数组 b 调用函数求比较和移动次数 c 输出结果 3 1 3 系统设计的实质功能用户启动该系统进入主菜单在主菜单中有三个菜单命令可以按照用户的意愿来选择他想要的命令当你选择排序内部操作过程菜单时即可进入一下子菜单你可以看到这六种排序的内部排序过程并且可以知道这六种排序具体的移动次数比内部算法性能分析第 3 章总体设计 6 较次数以及稳定性的好坏当你选择排序性能分析菜单时马上进入下一级子菜单你可以知道这六种排序之间的一些性能相关的知识这一级菜单是用户来安排如果不知道那两种排序的性能那种占优势好一些你可以输入排序的编号然后系统给你分析给出结论 3 2 设计原理与设计内容 3 2 1 系统总体结构系统总体结构如图 4 1 所示图 3 1 系统总体结构 3 2 2 内部操作过程菜单设计原理如图所示 Switch 进行判断 partition 函数进行快速排序 Heapsort 函数进行堆排序 Selectsort 函数进行简单选择排序 Shllinsert 函数进行希尔排序 Insertsort 函数进行直接排序子函数结束 Bubblesort 函数进行直接排序 Point 开始冒泡排序希尔排序直接插入排序堆排序简单选择排序快速排序冒泡性能分析希尔性能分析插入性能分析选择性能分析快速性能分析堆性能分析内部排序算法性能分析排序过程模块性能分析模块内部算法性能分析第 3 章总体设计 7 图 3 2 内部操作过程菜单 3 2 2 排序性能分析菜单设计原理排序性能分析菜单的算法是调用内部操作过程菜单的算法根据这一原理而成的就不一一的介绍了请读者自已去理解内部操作过程的设计过程 3 2 3 设计内容内部排序系统具体实现的功能包括快速排序冒泡排序希尔排序简单选择排序堆排序直接排序等这六大排序的集成六个主要的函数如下快速排序函数 partition 希尔排序函数 Shellsort 简单选择排序函数 selectsort 堆排序函数 heap 直接排序函数 insertsort 起泡排序函数 Bubblesort 排序数据类型定义 ADT paixu 数据对象 D aij aij属于 1 2 3 i j 0 数据关系 R ai 1 ai D i 2 n 基本操作 Insertsort 初始条件数组已经存在操作过程将一个记录插入到已经排好序的有序列表中从而得到了一个新的记录新增 1 的有序表 Bubblesort 初始条件数组已经存在内部算法性能分析第 3 章总体设计 8 操作过程两两比较待排序记录的键值并交换不满足顺序要求的那些偶对知道全部满足顺序要求为止 Shellsort 初始条件数组已经存在操作过程先取定一个正整数 d1 n 把全部记录分成 d1 个组所有距离为 d1 倍数的记录放在一组中在各组内进行插入排序然后取 d2 d1 重复上述分组和排序工作直至取 di 1 即所有记录放在一个组中排序为止 Selectsort 初始条件数组已经存在操作过程每次从待排序的记录中选出键值最小或最大的记录顺序放在已经排序的记录序列的最好直到全部排完 heapsort 初始条件数组已经存在操作过程对一组待排序的的键值首先是把它们按堆的定义排列成一个序列这就找到了最小键值然后把最小的键值取出用剩下的键值再重建堆便得到次小键值如此反复进行知道把全部键值排好序为止 partition 初始条件数组已经存在操作过程在待排序的 n 个记录中任取一个记录以该记录的键值为基准用交换的方法将所有记录分成两部分所有键值比它小的放在一边大的放另一边并把该记录放在中间然后重复至完成 ADT 排序内部算法性能分析第 3 章总体设计 9 第 4 章详细设计 4 1 冒泡排序冒泡排序 BubbleSort 是我们大家都熟知的排序其基本概念是依次比较相邻的两个数将小数放在前面大数放在后面即在第一趟首先比较第 1 个和第 2 个数将小数放前大数放后然后比较第 2 个数和第 3 个数将小数放前大数放后如此继续直至比较最后两个数将小数放前大数放后至此第一趟结束将最大的数放到了最后在第二趟仍从第一对数开始比较因为可能由于第 2 个数和第 3 个数的交换使得第 1 个数不再小于第 2 个数将小数放前大数放后一直比较到倒数第二个数倒数第一的位置上已经是最大的第二趟结束在倒数第二的位置上得到一个新的最大数其实在整个数列中是第二大的数如此下去重复以上过程直至最终完成排序由于在排序过程中总是小数往前放大数往后放相当于气泡往上升所以称作冒泡排序用二重循环实现外循环变量设为 i 内循环变量设为 j 外循环重复 9 次内循环依次重复 9 8 1 次每次进行比较的两个元素都是与内循环 j 有关的它们可以分别用 a j 和 a j 1 标识 i 的值依次为 1 2 9 对于每一个 i j 的值依次为 1 2 10 i 算法 for i 1 i i 1 j 内循环进行每趟比较 times 比较次数 if R j R j 1 如果 R j 小于 R j 1 交换两者的位置内部算法性能分析第 4 章详细设计 10 R 0 R j R j R j 1 R j 1 R 0 exchange TRUE changes 3 移动次数冒泡排序的最好最坏平均情况下的时间复杂度都为 O n2 故算法的平均时间复杂度也为 O n2 但是若在某趟排序中未发现气泡位置的交换则说明待排序的无序区中所有气泡均满足轻者在上重者在下的原则即为正序则冒泡排序过程可在此趟扫描后就终止在每趟排序过程中无序区 R i n 的范围可能会有较大改变而不是递减对某些不对称性情况在排序过程中可改变其扫描方向 4 2 直接插入排序直接插入排序 Straight Insertion Sort 是一种最简单的排序方法它基本操作是将一个记录插入到已排好序的有序表中从而得到一个新的记录数增 1 的有序表每次从无序表中取出第一个元素把它插入到有序表的合适位置使有序表仍然有序第一趟比较前两个数然后把第二个数按大小插入到有序表中第二趟把第三个数据与前两个数从前向后扫描把第三个数按大小插入到有序表中依次进行下去进行了 n 1 趟扫描以后就完成了整个排序过程直接插入排序是由两层嵌套循环组成的外层循环标识并决定待比较的数值内层循环为待比较数值确定其最终位置直接插入排序是将待比较的数值与它的前一个数值进行比较所以外层循环是从第二个数值开始的当前一数值比待比较数值大的情况下继续循环比较直到找到比待比较数值小的并将待比较数值置入其后一位置结束该次循环值得注意的是我们必需用一个存储空间来保存当前待比较的数值因为当一趟比较完成时我们要将待比较数值置入比它小的数值的后一位插入排序类似玩牌时整理手中纸牌的过程插入排序的基本方法是每步将一个待排序的记录按其关键字的大小插到前面已经排序的序列中的适当位置直到全部记录插入完毕为止算法 for i 2 i L i 内部算法性能分析第 4 章详细设计 11 if R i R i 1 R 0 R i j i 1 复制哨兵 while R 0 R j times changes R j 1 R j j 记录后移 R j 1 R 0 插入到正确位置 changes 按以上算法进行直接插入排序的过程如图4 1 所示初始序列 i 1 46 58 15 45 90 18 10 62 i 2 46 58 15 45 90 18 10 62 i 3 15 46 58 45 90 18 10 62 i 4 15 45 46 58 90 18 10 62 i 5 15 45 46 58 90 18 10 62 i 6 15 18 45 46 58 90 10 62 i 7 10 15 18 45 46 58 90 62 i 8 10 15 18 45 46 58 62 90 图 4 1 直接插入排序过程从算法的实现过程可见在最坏情况下线性插入排序每插入一个元素需要进行 i 1 次比较需要插入元素为 N 1 个所以最大比较次数为 N N 1 2 该算法的时间复杂性为 O N N 空间复杂度为 O 1 因此直接插入排序属于稳定的排序 4 3 希尔排序内部算法性能分析第 4 章详细设计 12 希尔排序 Shell Sort 又称缩小增量排序 Diminishing Increment Sort 它也是一种属于插入排序类的方法但在时间效率上跟其他的几种排序方法有了较大的改进希尔排序基本思想先将整个待排记录序列分割成为若干子序列分别进行直接插入排序待整个序列中的记录基本有序时再对全体记录进行一次直接插入排序先看一下希尔排序的过程初始关键字序列如下面所示首先将该序列分成 5 个子序列 R1 R6 R2 R7 R5 R10 如下面所示分别对每个子序列进行直接插入排序排序完后然后进行第二趟希尔排序即分别对下列 3 个子序列 R1 R4 R7 R10 R2 R5 R8 和 R3 R6 R9 进行直接插入排序其结果如第二趟排序所示最后对整个序列进行一趟直接插入排序至此希尔排序结束整个序列的记录已按关键字非递减有序排列如下图 4 2 所示初始关键字 49 38 65 97 76 13 49 55 04 一趟排序结果 13 27 49 55 04 49 38 65 97 76 13 55 38 76 27 04 65 49 49 97 二趟排序结果 13 04 49 38 27 49 55 65 97 76 三趟排序结果 04 13 27 38 49 49 55 65 76 97 图 4 2 希尔排序过程从上述排序过程可见希尔排序的一个特点是子序列的构成不是简单地逐段分割而是将相隔某个增量的记录组成一个子序列如上例中第一趟排序时的增量为 5 第二趟排序时的增量为 3 第三趟排序时的增量为 1 由于在前两趟的插入排序中记录的关键字是和同一子序列中的前一个记录的关键进行比较到越后面排序的数变得越来越有序为此算法如下 4913 3827 6549 9755 7604 内部算法性能分析第 4 章详细设计 13 for i d 1 i n i 将 R d 1 n 分别插入各组当前的有序区 if R i key0i L i n i for j i 1 j L j times if R j 1 i 将二叉树转换成堆 CreateHeap i L 建堆 for i L 1 k 1 i 1 i k temp R i 1 堆 heap 的 root 值和最后一个值交换 R i 1 R 1 R 1 temp changes 3 CreateHeap 1 i 内部算法性能分析第 4 章详细设计 18 从上述分析堆排序的时间主要由建立初始堆和反复重建堆这两部分的时间开销构成它们均是通过调用 CreateHeap 实现的堆排序的最坏时间复杂度为 O nlogn 堆序的平均性能较接近于最坏性能由于建初始堆所需的比较次数较多所以堆排序不适宜于记录数较少的文件堆排序是就地排序辅助空间为 O 1 由它是不稳定的排序方法 4 7 六种排序方法讨论综合比较上述的各种内部排序方法大致有如下结果见下表表 4 1 时间复杂度排序方法最少比较次数最多比较次数最少移动次数最多移动次数最坏情况最好情况平均情况空间复杂度稳定性复杂度直接插入排序 n 1 n 2 n 1 2 0 n 4 n 1 2O n n O n O n n O 1 是简单简单选择排序 n n 1 2n n 1 2 0 3 n 1 O n n O n n O n n O 1 否简单快速排序 O nlogn n n 1 2 O nlogn n n 1 2O n n O nlogn O nlogn O log n 是较复杂希尔排序 O nlogn O nlogn O 1 否较复杂冒泡排序 n 1 n n 1 20 n n 1 2O n n O n O n n O 1 是简单内部算法性能分析第 4 章详细设计 19 堆排序 O nlogn O nlogn O nlogn O nlogn O 1 否较复杂附注 1 堆排序冒泡排序希尔排序和快速排序中在待排序的数据已经基本有序是花费时间最多的反而是快速排序此是最不利于发挥其特长 2 在以比较为基础的排序方法中比较关键字的大小和将关键字从一个位置移动到另一个位置这两种操作的次数决定了算法的时间复杂性它们是算法的时间复杂性的两项指标 3 在局部有序和待排序的关键字序列数目较小时最佳的内部排序方法是直接插入排序 4 在冒泡排序的每一趟中只能将关键字最大或最小的元素移动到正确的置其他关键字有可能在交换的过程中朝着与最终排序相反方向移动快速排序的每一趟中不仅能将枢轴的元素移动到正确的位置而且其他关键字所移动的方向也与其最终排序的位置方向一致 5 设有一个堆取出堆中最大元素后将它重新调整为堆所需要的时间复杂度为 O nlogn 6 假设待排序的关键字序列有 n 例如 n 10000 个元素若仅找出其中最大的 k 例如 k 10 个元素则采有堆排序最省时间若仅找出其中第 k 个最小元素则采用快速排序最省时间如何选择好的排序方法没有哪一种排序方法是绝对好的每一种排序方都有优缺点适合于不同的环境因此在实际应用中应根据具体情况进行选择首先考虑排序对稳定性的要求若要求稳定则只能在稳定的排序方法中选取否则可以在所有的方法中选取其次要考虑待排序列的记录数目 n 若 n 较大则可以在改进的方法中选取否则在简单方法中选取然后再考虑其他因素综上所述可得以上结论 1 当待排序的序列的记录数目 n 较大记录按关键字的值分布比较随机并且对排序稳定必不作要求时宜选用快速排序 2 当待排序的序列的记录数目 n 较大记录按关键字的值分布可能出现升序或逆序的情况并且对排序稳定性不作要求时宜选用堆排序 3 当待排序的序列的记录数目 n 较小记录的关键字的排列基本有序分布比较随机且对排序有稳定性要求时宜选用插入排序内部算法性能分析第 4 章详细设计 20 4 当待排序的序列的记录数目 n 较小并且对排序有稳定性要求进宜选用选择排序若记录的关键字的值不接近逆序也可选用直接插入排序第 5 章排序算法的改进 5 1 双向冒泡排序算法对于输入的子序列 L low High 看成竖着排列的气泡然后分别从上端 Low 向底端 High 扫描在扫描的过程中时刻注意两个相邻元素的顺序保证上端的元素小于下端的元素这样经过一趟扫描后就使较大的元素沉到下面然后再从底端向上端扫描由于在前一趟扫描过程中最大的元素已经沉到最底端所以这次扫描最大的元素不再参加排序将剩下的元素进行排序排序的过程中保证使得底端元素大于顶端元素这样反复的扫描并不断缩小排序空间直到整个序列有序位置这样直观上看双向冒泡排序法先让重的气泡沉到底下然后让轻的气泡浮上来然后再让大的气泡沉下去让次轻的气泡浮上来依次反复直到带排序列有序为止算法是利用两个指针 low 和 high 记录带排序列区域 L low high 用指针变量 t 记录在每趟扫描过程中最近一次交换记录的位置在每次扫描开始 t 的初始值分别为 Low 或 high 并且在扫描结束后再让 t 和 low 或 high 进行比内部算法性能分析第 5 章排序算法的改进 21 较如果发现某次 t 值没有改变则说明序列已经有序并且用 break 跳出循环提前结束排序代码实现 While low high t low t 指向带排序区间的离最底端 For i low i L i 1 m l i l i l i 1 l i 1 m t i 记录最近一次移动的关键字的位置 if t low break 检查是否待排关键字有序如有序则退出循环结束排序 else high t 缩小待排序列的范围 for i high i low i if L i L i 1 m l i l i l i 1 l i 1 m t i 记录最近一次移动的关键字的位置 If t high break 检查是否排关键字有序如有序则退出循环结束排序 else low t 缩小待排序列的范围算法分析双向冒泡排算法是原地置换算法并且由于 L i L i 1 或者 L i L i 1 时才进行交换所以说该算法也是稳定的排序方法但如果改为 L i L i 1 或者 L i L i 1 时才进行交换则改变其的稳定性该算法在执行一趟排序后同时确定两个记录的位置即待排区域的最大和最小的记录而书中提到的冒泡排序在执行行一趟排序后仅能确定一个记录的位置即最大或最小的显然该算法更可取 5 2 双倍快速排序的算法快速排序的基本思想是基于分支策略的思想即对于输入的子序列 L low High 如果规模足够小则直接进行排序否则分三步处理分解 Divide 设输入的序列 L low High 确定支点元素 L low 和 L High 并使 L Low key Ll High key 然后分解 Divide 将序列 L low High 划分成三个子序列 L Low L 1 L 1 H 1 和 L H 1 High 使 L low High 中元素的关系为 L Low L 1 L L L L 1 H 1 L H r high t r row 确保区间内第一个元素的值不大于区间内最后一个元素的值 r row r high r high t l low 小于区间内第一个元素的值数组边界下标 h high 大于区间内最后一个元素的值数组边界下标 for i low 1 i n i if r i r high t r i r i r high 1 r high t 大于区间内最后一个元素的值放置H 区内 i n 下一个比较位置不变循环次数减一 t r L r L r low r low t 将小于区间内第一个元素的边界下标元素与第一个元素互换 t r H r H r high r high t 将大于区间内最后一个元素边界下标元素与最后一个元素互换 QSort L low L 1 对分解后的第一部分递归快速排序 QSort L L 1 H 1 对分解后的第二部分递归快速排序内部算法性能分析第 5 章排序算法的改进 23 QSort L H 1 high 对分解后的第三部分递归快速排序以上分析可知 Low 和 High 分别指向区间的第一个元素和最后一个元素并保证 L Low L High L 和 H 两个折针所指向的元素分别是第一个和第二个枢轴元素同样保证 L L L H 经过一趟排序后即确定了两个枢轴元素的位置然后对三个子序列分别进行递归分解每分解一次就确定两个元素的位置直到整个序列有序为止算法分析双倍快速排序算法在经过一趟快速排序后可以同时确地两个元素的位置而快速排序算法经过一趟快速排序后只能确定一个元素的位置前者将带排序列分解成三个待排序列而后者仅仅分解成两个序列所以就这一点上来看对同数量级的序列双倍快速排序在时间性能上要优于快速排序空间性能上两者上相同的只有一个辅助空间双倍快速排序是一个快速原地置换排序也是一个稳定排序法 5 3 选择排序的算法该算法在一定程度上克服了传统排序算法交换次数过多的缺陷但其效率仍较为低下能否在进行第 i 趟排序时在第 i n 个项目中既选择一个关键字最大的项目又选择一个关键字最小的项目然后将其交换至它们应在的位置以进一步提高效率呢易知若需对第 1 n 个项目组成的序列采用改进后的选择法进行排序无需进行 n 1 趟排序最多只需进行 n 2 趟排序符号 n 2 指不大于 n 2 的最大整数下同第 i 趟排序前关键字最大的 i 1 个项目及最小的 i 1 个项目已被交换至它们应在的位置故第 i 趟排序仅需对剩下的第 i n i 1 个项目进行在第 i 个项目的关键字与其后的第 i 1 n 个项目的关键字都比较完后选择第 i n 个项目中关键字最大项目交换至第 i 个项目的位置并选择关键字第 i 小的元素交换至第 n i 1 个项目的位置所以改进后的选择法排序的关键在于在进行第 i 趟排序时在第 i n i 1 项目中找出关键字最大的项目的下标序号即位置及关键字最小的项目的下标序号然后将关键字最大的项目及关键字最小的项目进行合理高效的移动在进行第 i 趟排序时容易做到在 i n i 1 项目中既找出关键字最大的项目的下标序号 max col 又找出关键字最小的项目的下标序号 mincol 但在进行将关键字最大的项目移至第 i 个项目的位置及将关键字最小的项目移至第 n 1 i 个项目的位置的过程时却须仔细斟酌尤其要注意移动项目的顺序及项目移动过程中其下标序号即位置的动态变化否则极易出现错误下面让我们来深入分析确定项目移动过程的顺序 1 当剩余的未排序项目即内部算法性能分析第 5 章排序算法的改进 24 第 i n i 1 项目中关键字最大的项目不是第 i 个项目即其下标序号 max co l i 时首先应将第 i 个项目与第 max co l 个项目相交换然后若第 i n i 1 项目中关键字最小者即是原来第 i 个项目即 m inco l i 时因原来第个项目已交换至第 max col 个项目故应将第 max co l 个项目与第 n i 1 个项目相交换若第 i n i 1 项目中关键字最小者不是原来第 i 个项目即 mincol i 时应将第 mincol 个项目与第 n i 1 个项目相交换 2 当剩余的未排序项目即第 i n i 1 项目中关键字最大的项目即是第 i 个项目即其下标序号 maxcol i 时故无需将第 i 个项目与第 max co l 个项目相交换此时若第 i n i 1 项目中关键字最小者不是原来第 n 1 i 个项目即 mincol n 1 i 时应将第 mincol 个项目与第 n i 1 个项目相交换这样进行项目的移动才可避免发生错误如上所述对传统的选择排序算法进行改进可使其效率得到一定程度的提高根据其特点姑且将其命名为双向选择排序算法当然若某一趟排序过程中项目间未进行交换操作则意味着所有 n 个项目已排好序无需再进行下一趟排序算法如下 for i 1 i n 2 i times 0 max array i m axco l imin array i mincol i fo r j i 1 j max max array j maxcol i times if array j 1 i shift i n 3 buildheap3 shift int i int n 3 将 k i k n 整理成堆 3 x k i j 23 i while j n if j n k i k j i j j 23 i k i x 3shift3 重新建堆 rebuild int x int n intdeep i 1 j 23 i d 0 while j n d d 1 if j n k i k j i j j 23 i while i 1 i n 2 k i x 3rebuild3 在堆深 h log2 n 时此时堆中的元素一般说来已基本有序重新建堆实际上变成先通过 h 次比较降至堆底然后再适当上升将尾结点放在正确的位置 heapsort buildheap for j n j 2 j x k j k j k 1 rebuild x j 1 log 2 n 算法分析堆排序算法因其比较和所需额外空间少而被广泛地采用最坏的内部算法性能分析第 5 章排序算法的改进 27 情况下有 11 222 22 1 1 log log log 1 1 22 1 nn ii h d t niiddid n d d nhd n d 当d 4时有t n 5 4 nlog 2 n O n 为了确定 d 的最佳取值通过对f d h h d d 求极限可知当 d h时f d 有极小值 h 2 h 又通过对求极限可知当 1 2 2 1 log 1 n i d t nid n d 时 t n 最小再先取 1 1 2 2 log 1 22 1 1 n h i dinnhnh 以后每次重新建堆时都使用d值 dh 1 1 22 1 2 h h t nnhnhnhn hn h 所以可以得出结论在最坏情况下改进算法的时间复杂度为 22 loglog 12t nnncnnc 当时有虽然不是一个常数但相对 n 来说 16n 2 2 logt nnn 2 log n 其增长非常慢所以时所以n越大改进的效果就越明显 400 2n 2 log20n 5 5 2插入改进算法对于数组 A 0 a low a start 1 a start a end a n 1 0 low start end n 1 其中 a 0 a low a start 1 为已排好序的部分 a start a end a n 1 为待插入的部分在原来的插入算法中当我们找到待插入元素 a start 应该插入的位置 low 后先将 a start 暂存然后将 a low a start 1 后移一位再将暂存的 a strat 插入 a low 处在改进的插入算法中我们还要考察在 a start 之后是否还存在一个序列 a start 1 a end 使得 a start a start 1 a end a low 如果确实存在这样的的一个序列则我们可以一次性将 a start a end 插入 a low 处在原有的的基础上作一些改进得出如下算法 for start 1 start n start low 0 high start 1 内部算法性能分析第 5 章排序算法的改进 28 while low high moddle int low high 2 if a moddle a start low moddle 1 else high moddle 1 end start 1 while end n end newmove a low start end start end 新的循环移位插入算法如下 L start low p end low 1 n p m L r p m while r 0 n m m r r n m for i 0 i m i outpos i inpos i temp a i low while outpos inpos L p i a inpos low a outpos low inpos outpos a inpos low temp 性能分析在比较插入过程中若出现一次可插入的部分有序段 a start a end 设插入位置在 a low 开始位置处则涉及移动的序为 a low a start a end 需插入的元素个数为 Q end start 1 涉及移动的元素总数为 P end low 1 插入间距为 L start low 在原插入算法中每插入一内部算法性能分析第 5 章排序算法的改进 29 个元素需移动 start low 2 次故总共需移动 start low 2 end start 1 次而在改进插入算法中只需移动 end low m end start 1 start low m 1 次其中 m gcd P L 两者比值为改进插入算法动次数 1 1 原插入算法移动次数 Q P 一般情况下插入间距 L 远大于待插入的元素个数 Q 所以上式主要取于 1 Q 由此可见只要出现一次有 Q 个元素的可插入的部分有序段该部分的插入效率可提高 Q 倍整个改进插入算法的效率提高取决于出现可插入的部分有序段的概率和可插入的部分有序段的长度而且后者比前者更为积极作用改过算法的稳定性取决于找到有序的 a start a end 时的判断条件如果我们采用 End n a end 1 a end 作为判断条件则改进的算法是稳定的如果为了一次尽可能多的插入元素提高排序速度采用 End n a end 1 a end 作为判断条件则改进算是不稳定的第六章系统实现及数据测试 6 1 主界面当用户启动该程序时进行测试进入主菜单如图 6 1 所示内部算法性能分析参考文献 30 图 6 1 主菜单 6 2 排序内部操作过程菜单当用户输入 1 时进入排序内部操作过程菜单如图 6 2 所示图 6 2 排序内部操作过程菜单 6 2 1 当用户输入 0 6 的数字时则会随意的进入下一级子

人人文库> 全部分类> 教育资料 > 备课教案

温馨提示

1. 本站所有资源如无特殊说明，都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2. 本站的文档不包含任何第三方提供的附件图纸等，如果需要附件，请联系上传者。文件的所有权益归上传用户所有。
3. 本站RAR压缩包中若带图纸，网页内容里面会有图纸预览，若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 人人文库网仅提供信息存储空间，仅对用户上传内容的表现方式做保护处理，对用户上传分享的文档内容本身不做任何修改或编辑，并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容，请与我们联系，我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

数据结构课程设计内部排序算法性能分析.doc

文档简介

温馨提示

最新文档

评论

数据结构课程设计内部排序算法性能分析.doc

文档简介

温馨提示

最新文档

评论

相关文档