第9章：排序.ppt

上传人：s*** IP属地：河南上传时间：2020-01-27 格式：PPT 页数：76 大小：556KB 积分：20 举报 版权申诉

已阅读5页，还剩71页未读，继续免费阅读

版权说明：本文档由用户提供并上传，收益归属内容提供方，若内容存在侵权，请进行举报或认领

文档简介

1 了解排序的定义和各种排序方法的特点熟悉各种方法的排序过程及其依据的原则 2 掌握各种排序方法的时间复杂度的分析方法能从关键字间的比较和移动次数分析排序算法的平均情况和最坏情况的时间性能熟悉各种算法的适用场合 3 理解排序方法稳定或不稳定的含义弄清楚在什么情况下要求应用的排序方法必须是稳定的本章学习要求第9章排序 9 1排序的基本概念 9 2插入排序 9 3选择排序 9 4交换排序 9 5归并排序 9 1概述一排序的定义二内部排序和外部排序三内部排序方法的分类一什么是排序排序整理文件中的记录将一组杂乱无章的数据排列成一个按关键字有序的序列排序是计算机内经常进行的一种操作其目的是将一组无序的记录序列调整为有序的记录序列例如将下列关键字序列 52 49 80 36 14 58 61 23 97 75 调整为 14 23 36 49 52 58 61 75 80 97 一般情况下假设含n个记录的序列为 R1 R2 Rn 其相应的关键字序列为 K1 K2 Kn 这些关键字相互之间可以进行比较即在它们之间存在着这样一个关系 Kp1 Kp2 Kpn 按此固有关系将上式记录序列重新排列为 Rp1 Rp2 Rpn 的操作称作排序数据表 datalist 待排序数据对象的有限集合关键字 key 通常数据对象有多个属性域即多个数据成员组成其中有一个属性域可用来区分对象作为排序依据该域即为关键字每个数据表用哪个属性域作为关键字要视具体的应用需要而定即使是同一个表在解决不同问题的场合也可能取不同的域做关键字主关键字如果在数据表中各个对象的关键字互不相同这种关键字即主关键字按照主关键字进行排序排序的结果是唯一的次关键字数据表中有些对象的关键字可能相同这种关键字称为次关键字按照次关键字进行排序排序的结果可能不唯一即若待排序的序列中存在两个或两个以上关键字相等的记录则排序所得到的结果不唯一排序算法的稳定性如果在对象序列中有两个对象ri和rj 它们的关键字ki kj 且在排序之前对象ri排在rj前面如果在排序之后对象ri仍在对象rj的前面则称这个排序方法是稳定的否则称这个排序方法是不稳定的二内部排序和外部排序若整个排序过程不需要访问外存便能完成则称此类排序问题为内部排序反之若参加排序的记录数量很大整个序列的排序过程不可能在内存中完成则称此类排序问题为外部排序排序的时间开销排序的时间开销是衡量算法好坏的最重要的标志排序的时间开销可用算法执行中的数据比较次数与数据移动次数来衡量各节给出算法运行时间代价的大略估算一般都按平均情况进行估算对于那些受对象关键字序列初始排列状态及对象个数影响较大的需要按最好情况和最坏情况进行估算衡量排序方法的标准排序时所需要的平均比较次数排序时所需要的平均移动次数排序时所需要的平均辅助存储空间三内部排序的方法内部排序的过程是一个逐步扩大记录的有序序列长度的过程大多数排序方法在排序过程中将出现如图所示有序和无序两个区域经过一趟排序有序序列区无序序列区有序序列区无序序列区其中有序区内的记录已按关键字递增有序排列而无序区内为待排记录通常称使有序区中记录数目增加一个或几个的操作过程为一趟排序按何种策略扩大有序区域将导致不同的排序方法内部排序方法大致可分下列几种类型插入类交换类选择类归并类待排序的记录序列可以用顺序表表示也可以用链表表示本章讨论的排序算法一律以顺序表数组为操作对象待排记录的数据类型定义如下 definen1000 待排顺序表最大长度 typedefstruct intkey 关键字项datatypeotherinfo 其它数据项 rectype 记录类型 rectypeR n R为记录类型的数组将无序子序列中的一个记录插入到有序序列中从而以达到扩大有序区的长度的目的一趟排序完成一个记录的插入每一趟都将无序区中的第一个记录按其关键字值的大小插入到有序区中的适当位置直到无序区中的全部记录都插完为止一趟直接插入排序的基本思想在对记录序列R 1 n 的排序过程中区段R 1 i 1 中的记录已按关键字非递减的顺序排列将R i 插入到有序序列R 1 i 1 中使区段R 1 i 中的记录按关键字非递减顺序排列 9 2插入排序方法有序序列R 1 i 1 R i 无序序列R i n 一趟直接插入排序的基本思想有序序列R 1 i 无序序列R i 1 n 直接插入排序基于顺序查找不同的具体实现方法导致不同的算法希尔排序基于逐趟缩小增量由此实现一趟插入排序的步骤为在R 1 i 1 中查找R i 的插入位置即确定j 1 j i 使得R 1 j key R i key R j 1 i 1 key将R j 1 i 1 中的记录后移一个位置将R i 插入到j 1的位置为了避免在查找过程中判别循环变量是否出界设置R 0 为监视哨并方便在查找的同时进行记录后移如动画演示所示例 47 33 61 82 72 11 25 47 初始状态 47 33618272112547 第1遍 i 2 33 3347 618272112547 第2遍 i 3 61 334761 8272112547 第3遍 i 4 82 33476182 72112547 第4遍 i 5 72 3347617282 112547 第5遍 i 6 11 113347617282 2547 第6遍 i 7 25 11253347617282 47 第7遍 i 8 47 1125334747 617282 监视哨R 0 直接插入排序算法实现利用顺序查找实现在R 1 i 1 中查找R i 的插入位置算法的实现要点 1 从R i 1 起向前进行顺序查找监视哨设置在R 0 2 对于在查找过程中找到的哪些关键字不小于R i key的记录并在查找的同时实现记录向后移动从R i 1 起向前进行顺序查找监视哨设置在R 0 R 0 R i 设置哨兵循环结束表明R i 的插入位置为j 1 R 0 j R i while R 0 key R j key R j 1 R j j 从后往前找 j i 1 插入位置 R j 1 R 0 对于在查找过程中找到的哪些关键字不小于R i key的记录并在查找的同时实现记录向后移动 while R 0 key R j key R j 1 R j j R j 1 R 0 R 0 j R i j i 1 上述循环结束后可以直接进行插入插入位置令i 2 3 n 实现整个序列的排序 for i 2 i n i R 0 R i j i 1 while R 0 key R j key R j 1 R j 记录后移R j 1 R 0 插入到正确位置监视哨R 0 的作用 1 进入查找循环之前它保存了R i 的副本使得不致于因为记录的后移而丢失R i 中的内容 2 在while循环或for循环中监视下标变量j是否越界避免循环内部每次都要检测j是否越界直接插入排序的时间复杂度分析从上述排序过程可见排序中的两个基本操作是关键字间的比较和记录的移动因此排序的时间性能取决于排序过程中这两个操作的次数从直接插入排序的算法可见这两个操作的次数取决于待排记录序列的状态当待排记录处于正序即记录按关键字递增排列的情况时所需进行的关键字比较和记录移动的次数最少每趟排序比较1次即R 0 和R i 1 比较记录移动2次 Cmin n 1 Mmin 2 n 1 反之当待排记录处于逆序即记录按关键字递减排列的情况时所需进行的关键字比较和记录移动的次数最多每趟进行i次比较每趟移动次数每趟除了上面的两次移动外还要有i 1次的后移一个位置若待排记录序列处于随机状态则可以最坏和最好的情况的平均值作为插入排序的时间性能的量度一般情况下直接插入排序的时间复杂度为O n2 9 2 2希尔排序希尔排序又称缩小增量排序它的基本思想是先对待排序列进行宏观调整待序列中的记录基本有序时再进行直接插入排序希尔排序 ShellSort 希尔排序方法又称为缩小增量排序该方法的基本思想是先将整个待排对象序列按照一定间隔分割成为若干子序列分别进行直接插入排序然后缩小间隔对整个对象序列重复以上的划分子序列和分别排序工作直到最后间隔为1 此时整个对象序列已基本有序进行最后一次直接插入排序将记录序列分成若干子序列分别对每个子序列进行插入排序其中 d称为增量它的值在排序过程中从大到小逐渐缩小直至最后一趟排序减为1 例如将n个记录分成若干个子序列 R 1 R 1 d R 1 2d R 1 kd R 2 R 2 d R 2 2d R 2 kd R d R 2d R 3d R kd R k 1 d 例1 162512304711233691831 第一趟希尔排序设增量d 5 112312918162536304731 第二趟希尔排序设增量d 3 918121123162531304736 第三趟希尔排序设增量d 1 911121618232530313647 1234567891011 1234567891011 1234567891011 1234567891011 d 3 d 2 123456 开始时d 间隔值的值较大子序列中的对象较少排序速度较快随着排序进展 d值逐渐变小子序列中对象个数逐渐变多由于前面工作的基础大多数对象已基本有序所以排序速度仍然很快 D常选质数 d1 n 2 d2 d1 2 di 1 从上述例子的排序过程可见由于希尔排序在前几趟的排序过程中关键字较大的记录是跳跃式地往后移动从而使得在进行最后一趟插入排序之前序列中记录的关键字已基本有序只需作少量关键字比较和移动记录由此减少了整个排序过程中所需进行的比较和移动的次数 9 3选择排序选择排序基本思想原理每一趟在待排序的记录中选出关键字最小的记录依次放在已经排序好的记录序列的最后直至全部记录排完为止分为直接选择排序和堆排序直接选择排序思想第一趟排序时在无序区R 0 R n 1 中选出关键字最小的记录将它和R 0 交换第二趟排序时在无序区R 1 R n 1 中选出关键字最小的记录将它和R 1 交换第i趟排序时在无序区R i 1 R n 1 中选出关键字最小的记录将它和R i 1 交换以此类推简单选择排序假设排序过程中待排记录序列的状态为有序序列R 1 i 1 无序序列R i n 第i趟简单选择排序从中选出关键字最小的记录有序序列R 1 i 无序序列R i 1 n 21 25 49 25 16 08 012345 21 25 i 1 49 25 16 25 16 08 49 08 25 49 21 i 2 i 3 08 16 25 25 21 初始最小者08交换21 08 最小者16交换25 16 最小者21交换49 21 第一趟结果第二趟结果 i 2 第2趟时选择排序的过程 k赋初值为i 只要R j key R k key 就把j赋给k 每次循环结束如果找到最小的关键字则将j赋值给k 然后判断i和k是否相等不等则将R k 和R i 交换即可 123456 49 16 08 25 49 21 08 25 25 21 ikj 49 25 08 25 16 21 ikj 49 25 25 25 16 25 ikj 16 25 双层循环 49 25 08 25 16 21 012345 ikj k指示当前序列中最小者第2趟选择排序结果直接选择排序的算法描述 voidSelectSort rectypeR inti j k rectypetemp for i 0 i n 1 i 进行n 1趟选择排序 k i for j i 1 j n j if R j key R k key k j if k i 交换R i 和R k temp R i R i R k R k temp 在当前无序区中选择关键字最小的记录R k 直接选择排序的关键字比较次数与对象的初始排列无关第i趟选择具有最小关键字对象所需的比较次数总是n i次因此总的关键字比较次数为由于每趟选择后可能要进行两个记录的交换而每次交换都要进行3次记录的移动因此最大移动次数为3 n 1 最少移动次数为0 时间复杂度为O n2 直接选择排序是一种不稳定的排序方法时间性能分析 9 4交换排序 1 起泡排序 2 快速排序 3 时间分析交换排序交换排序的基本思想两两比较待排序对象的关键字如果发生逆序即排列顺序与排序后的次序正好相反则交换之直到所有对象都排好序为止常用的有起泡排序和快速排序第1趟对所有记录纵向序列从下到上每相邻两个记录的关键字进行比较如果这两个记录的关键字不符合排序要求则进行交换这样一趟做完将关键字最小者放在最上方的位置上第2趟对剩下的n l个待排序记录重复上述过程又将一个关键字放于最终位置上方第2个位置反复进行n l次可将n l个关键字对应的记录放至最终位置剩下的即为关键字最大的记录它放在最下方的位置上因此排序至多需要n 1趟排序如果某一趟排序中没有记录交换则说明排序可以提早结束为此算法设计时可以定义一个变量noswap 根据它的值判断需不需要提前结束循环起泡排序的基本思想将关键字按纵向排列然后自下而上地对每两个相邻的关键字进行比较如果逆序 r j 1 key r j key 则交换两个记录起泡排序例下标12345678 初始序列 4931638575152649 第1趟 1549316385752649 1526493163857549 1526314949 638575 第2趟第3趟第4趟第5趟第6趟第7趟 1526314949 637585 1526314949 637585 1526314949 637585 1526314949 637585 noswap 待排序的9个记录的排序码序列为 312 126 272 226 8 165 123 12 28 使用冒泡下沉排序算法进行的排序过程如下图所示时间性能分析最好的情况关键字在记录序列中递增有序只需进行一趟起泡比较的次数最坏的情况关键字在记录序列中逆序有序需进行n 1趟起泡比较的次数 0 移动的次数移动的次数 n 1 起泡排序需要一个附加变量以实现记录值的对换或者用R 0 起泡排序是一个稳定的排序方法冒泡排序使用说明该算法是专门针对已部分排序的数据进行排序的一种排序方法如果在你的数据清单中只有一两个数据是乱序的话用这种算法就是最快的排序算法如果你的数据清单中的数据是随机排列的那么这种方法可能就成了最慢的算法了例如初始序列是3 6 8 9 15 20 1 则只需一趟冒泡即可实现排序但是对于20 1 3 6 8 9 15 则需要扫描6趟才能完成排序原因扫描方向的单一性导致了两种情况的不对称性快速排序快速排序则是任意选定一个关键字介于中间的记录通过一趟排序使剩余记录分成两个子序列分别继续排序通常称该记录为基准或枢轴R p 一趟排序也称为一次划分假设一趟快速排序之后基准记录的位置为i 则得到的无序记录子序列 1 R s i 1 中记录的关键字均小于基准记录的关键字得到的无序记录子序列 2 R i 1 t 中记录的关键字均大于基准记录的关键字由此这两个子序列可分别独立进行快速排序快速排序首先对无序的记录序列进行一次划分之后分别对分割所得两个子序列递归进行快速排序无序的记录序列无序记录子序列 1 无序子序列 2 基准一次划分分别进行快速排序一趟快速排序一次划分目标找一个记录以它的关键字作为基准凡其关键字小于基准的记录均移动至该记录之前反之凡关键字大于基准的记录均移动至该记录之后致使一趟排序之后记录的无序序列R s t 将分割成两部分 R s i 1 和R i 1 t 且R j key R i key R j key s j i 1 基准 i 1 j t 基准选取可以取待排序列中任何一个记录作为基准但为方便起见通常取序列中第一个记录R s 为基准以它的关键字作为划分的依据划分可如下进行设置两个指针low和high 分别指向待排序列的低端s和高端t 若R high keyR s key 则将它移动至枢轴记录之后并为避免枢轴来回移动可先将枢轴R s 暂存在数组的闲置分量R 0 或者变量pivot中 s t low high 设R s 52为基准将R high key和基准的关键字进行比较要求R high key 基准的关键字向左扫描找到比基准小的就覆盖R low 然后low 开始向右扫描将R low key和基准的关键字进行比较要求R low key 基准的关键字向右扫描找比基准大的就覆盖R high 然后high 向左扫描如此反复左右交替扫描当low high时就找到了基准的位置 high 23 low 80 high 14 low 52 例 R 0 52 low high high high low 可见经过一次划分将关键字序列 52 49 80 36 14 58 61 97 23 75调整为 23 49 14 36 52 58 61 97 80 75 在调整过程中设立了两个指针 low和high 它们的初值分别为 s和t 之后逐渐减小high 增加low 并保证R high key 52和R low key 52 否则进行记录的交换其实是覆盖快速排序的算法是一个递归函数因此算法中必须引入一对参数s和t作为待排序区域的上下界在算法的递归调用过程执行中这两个参数随着区域的划分而不断变化快速排序的核心就是一次划分或者叫一趟快速排序例如关键字序列 52 49 80 36 14 75 58 97 23 61 经第1趟快速排序之后为 23 49 14 36 52 75 58 97 80 61 经第2趟快速排序之后为 14 23 49 36 52 61 58 75 80 97 经第3趟快速排序之后为 14 23 36 49 52 58 61 75 80 97 快速排序具有较好的时间复杂度平均时间复杂度为O nlog2n log2n趟每趟n i次比较 1 i n 1 当待排序列为递增有序时快速排序比冒泡排序更恶化冒泡只需要进行一趟排序即可O n 而快速排序则需要进行n 1次递归调用时间复杂度 O n2 若待排记录的初始状态为按关键字递减时快速排序将蜕化为起泡排序其时间复杂度为O n2 为避免出现这种情况需在进行一次划分之前进行预处理即先对R s key R t key和R s t 2 key 进行相互比较然后取关键字为三者之中的记录为基准记录最好的情况基准居中即每次划分后左右两个子序列长度基本一致此时时间复杂度 O nlogn 快速排序算法 intPARTITION rectypeR intl inth 返回划分后被定位的基准记录的位置对无序区R l 到R h 做划分 inti j rectypetemp i l j h temp R i 初始化 temp为基准do while R j key temp key 递归处理右区间 QUICKSORT 9 5归并排序归并排序的基本操作是将两个或两个以上的记录有序序列归并为一个有序序列最简单的情况是只含一个记录的序列显然是一个有序序列经过逐趟归并使整个序列中的有序子序列的长度逐趟增大直至整个记录序列为有序序列止 2 路归并排序则是归并排序中的一种最简单的情况它的基本操作是将两个相邻的有序子序列归并为一个有序序列如图所示这个操作对顺序表而言是极其容易实现的只要依关键字从小到大进行复制即可归并排序的算法思想和过程算法思想假设初始表含有n个记录则可看成是n个有序的子表每个子表的长度为1 然后两两归并得到 n 2 个长度为2或1的有序子表再两两归并如此重复直至得到一个长度为n的有序子表为止归并排序过程一次2路归并 voidmerge rectypeR rectypeR1 intlow intmid inthigh R low R mid 与R mid 1 R high 是两个有序文件结果放在R1 low R1 high inti j k i low j mid 1 k low while i mid voidmergepass rectypeR rectypeR1 intlength 一趟归并 inti j i 0 i指向第一对子文件的起始点 while i 2 length 1 n 归并长度为length的两个子文件 merge R R1 i i length 1 i 2 length 1 一次归并 i i 2 length 置下一个一次归并的起始位置 if i length 1 n 1 merge R R1 i i length 1 n 1 else 子文件个数为奇数剩一个不需要归并直接复制到R1中 for j i j n j R1 j R j 剩下一个有序子表其长度小于lengh 本算法结束后tabg中的有序段的长度为2 length 一趟归并算法 voidmergesort rectypeR intlength length 1 初始时有序段的长度为1 while length n 有序段的长度小于待排序元素的个数继续归并 mergepass R R1 length 一趟归并结果在R1中 length 2 length 有序段的长度翻倍 mergepass R1 R length 再次归并结果在R中 length 2 length 有序段的长度翻倍归并排序算法归并排序要做log2n上限整数趟归并每趟归并所花时间为O n 故2路归并算法时间复杂度为 O nlog2n 14 6各种排序方法的综合比较一时间性能 1 平均的时间性能平均时间复杂度为O nlog2n 快速排序和归并排序平均时间复杂度为O n2 直接插入排序起泡排序和简单选择排序 2 当待排记录序列按关键字顺序有序时最好情况 3 大致有序大部分递增个别无序选择冒泡排序和直接插入排序 4 N较大且随机分布时快速排序和归并排序时间复杂度相对较低快速排序作为首选其次是归并排序 5 递减时尽量选择归并时间复杂度最低 6 简单选择排序和归并排序的时间性能不随记录序列中关键字的分布而改变跟初始分布无关直接插入排序和起泡排序能达到O n 的时间复杂度快速排序的时间性能蜕化为O n2 二空间性能指的是排序过程中所需的辅助空间大小 1 所有的排序方法包括直接插入希尔排序起泡和简单选择的空间复杂度为O 1 2 快速排序为O log2n 为递归程序执行过程中栈所需的辅助空间 3 归并排序所需辅助空间最多其空间复杂度为O n 三排序方法的稳定性能稳定的排序方法指的是对于两个关键字相等的记录它们在序列中的相对位置在排序之前和经过排序之后没有改变排序之前 Ri K Rj K 排序之后 Ri K Rj K 例如排序前 56 34 47 23 66 18 82 47 若排序后得到结果 18 23 34 47 47 56 66 82 则称该排序方法是稳定的若排序后得到结果 18 23 34 47 47 56 66 82 则称该排序方法是不稳定的选择排序快速排序和希尔排序是不稳定的排序方法直接插入排序冒泡排序和归并排序是稳定的排序回顾与分析直接插入排序简单的插入排序每次比较后最多移掉一个逆序因此与冒泡排序的效率相同但它在速度上还是要高点这是因为在冒泡排序下是进行值交换而在插入排序下是值移动所以直接插入排序将要优于冒泡排序直接插入法也是一种对数据的有序性非常敏感的一种算法在有序情况

人人文库> 全部分类> 应用文书 > 技术指导

温馨提示

1. 本站所有资源如无特殊说明，都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2. 本站的文档不包含任何第三方提供的附件图纸等，如果需要附件，请联系上传者。文件的所有权益归上传用户所有。
3. 本站RAR压缩包中若带图纸，网页内容里面会有图纸预览，若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 人人文库网仅提供信息存储空间，仅对用户上传内容的表现方式做保护处理，对用户上传分享的文档内容本身不做任何修改或编辑，并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容，请与我们联系，我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

第9章：排序.ppt

文档简介

温馨提示

最新文档

评论

第9章：排序.ppt

文档简介

温馨提示

最新文档

评论

相关文档