数据结构C语言版第十章内部排序ppt课件_第1页
数据结构C语言版第十章内部排序ppt课件_第2页
数据结构C语言版第十章内部排序ppt课件_第3页
数据结构C语言版第十章内部排序ppt课件_第4页
数据结构C语言版第十章内部排序ppt课件_第5页
已阅读5页,还剩110页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

10.1概述,10.2插入排序,10.3快速排序,10.4选择排序,10.5归并排序,10.6基数排序,10.7各种排序方法的综合比较,第十章内部排序,1.了解排序的定义和各种排序方法的特点。2.熟悉各种方法的排序过程及其依据的原则。3.掌握各种排序方法的时间复杂度的分析方法。能从“关键字间的比较次数”分析排序算法的平均情况和最坏情况的时间性能。4.理解排序方法“稳定”或“不稳定”的含义,弄清楚在什么情况下要求应用的排序方法必须是稳定的。,学习提要:,重难点内容:直接插入排序、折半插入排序、起泡排序、简单选择排序等排序方法的算法思想、实现和效率分析。希尔排序、快速排序、堆排序、归并排序等高效方法。,10.1概述,一、什么是排序,三、内部排序的方法,二、内部排序和外部排序,一、什么是排序?,排序是计算机内经常进行的一种操作,其目的是将一组“无序”的记录序列调整为“有序”的记录序列。,例如:将下列关键字序列,52,49,80,36,14,58,61,23,97,75,调整为,14,23,36,49,52,58,61,75,80,97,一般情况下,假设含n个记录的序列为R1,R2,,Rn其相应的关键字序列为K1,K2,,Kn,这些关键字相互之间可以进行比较,即在它们之间存在着这样一个关系:Kp1Kp2Kpn,按此固有关系将上式记录序列重新排列为Rp1,Rp2,,Rpn的操作称作排序。,假设Ki=Kj(1i,jn,ij),且在排序前的序列中Ri领先于Rj(即ij)。若排序后的序列中Ri仍领先于Rj,则称所用的排序方法是稳定的;反之,若可能排序后的序列中Rj领先于Ri,则称使用的排序方法是不稳定的。,例如:,(14,36,49,49,52,80),排序后,(14,36,49,49,52,80),稳定,不稳定,二、内部排序和外部排序,若整个排序过程不需要访问外存便能完成,则称此类排序问题为内部排序;,反之,若参加排序的记录数量很大,整个序列的排序过程不可能在内存中完成,则称此类排序问题为外部排序。,三、内部排序的方法,内部排序的过程是一个逐步扩大记录的有序序列长度的过程。,经过一趟排序,有序序列区,无序序列区,有序序列区,无序序列区,基于不同的“扩大”有序序列长度的方法,内部排序方法大致可分下列几种类型:,插入类,交换类,选择类,归并类,其它方法,1.插入类,将无序子序列中的一个或几个记录“插入”到有序序列中,从而增加记录的有序子序列的长度。,2.交换类,通过“交换”无序序列中的记录从而得到其中关键字最小或最大的记录,并将它加入到有序子序列中,以此方法增加记录的有序子序列的长度。,3.选择类,从记录的无序子序列中“选择”关键字最小或最大的记录,并将它加入到有序子序列中,以此方法增加记录的有序子序列的长度。,4.归并类,通过“归并”两个或两个以上的记录有序子序列,逐步增加记录有序序列的长度。,5.其它方法,待排记录的数据类型定义如下:,#defineMAXSIZE1000/待排顺序表最大长度,typedefintKeyType;/关键字类型为整数类型,typedefstructKeyTypekey;/关键字项InfoTypeotherinfo;/其它数据项RcdType;/记录类型,typedefstructRcdTyperMAXSIZE+1;/r0闲置intlength;/顺序表长度SqList;/顺序表类型,10.2插入排序,一、直接插入排序,三、表插入排序,二、折半插入排序,四、希尔(Shell)排序,有序序列R1.i-1,Ri,无序序列Ri.n,一趟插入排序的基本思想:,有序序列R1.i,无序序列Ri+1.n,实现“一趟插入排序”可分三步进行:,3将Ri插入(复制)到Rj+1的位置上。,2将Rj+1.i-1中的所有记录均后移一个位置;,1在R1.i-1中查找Ri的插入位置,R1.j.keyRi.keyRj+1.i-1.key;,一、直接插入排序,利用“顺序查找”实现“在R1.i-1中查找Ri的插入位置”,算法的实现要点:,从Ri-1起向前进行顺序查找,监视哨设置在R0;,R0=Ri;/设置“哨兵”,循环结束表明Ri的插入位置为j+1,R0,j,Ri,for(j=i-1;R0.keyRj.key;-j);/从后往前找,j=i-1,插入位置,对于在查找过程中找到的那些关键字不小于Ri.key的记录,并在查找的同时实现记录向后移动;,for(j=i-1;R0.keyRj.key;-j);Rj+1=Rj,R0,j,Ri,j=i-1,上述循环结束后可以直接进行“插入”,插入位置,第三趟排序后:(38,49,56)40,95,例:待排序序列(56,38,49,40,95),40,56,49,40,第四趟排序后:(38,40,49,56)95,令i=2,3,,n,实现整个序列的排序。,for(i=2;i=n;+i)if(Ri.keyRi-1.key)在R1.i-1中查找Ri的插入位置;插入Ri;,voidInsertionSort(SqList+i)if(L.ri.keyL.ri-1.key)/InsertSort,L.r0=L.ri;/复制为监视哨L.ri=L.ri-1;for(j=i-2;L.r0.keyL.rj.key;-j)L.rj+1=L.rj;/记录后移L.rj+1=L.r0;/插入到正确位置,内部排序的时间分析:,实现内部排序的基本操作有两个:,(2)“移动”记录。,(1)“比较”序列中两个关键字的大小;,对于直接插入排序:,最好的情况(关键字在记录序列中顺序有序):,“比较”的次数:,最坏的情况(关键字在记录序列中逆序有序):,“比较”的次数:,0,“移动”的次数:,“移动”的次数:,T(n)=O(n),稳定的,因为R1.i-1是一个按关键字有序的有序序列,则可以利用折半查找实现“在R1.i-1中查找Ri的插入位置”,如此实现的插入排序为折半插入排序。,二、折半插入排序,voidBiInsertionSort(SqListi=high+1;-j)L.rj+1=L.rj;/记录后移,L.rhigh+1=L.r0;/插入,low=1;high=i-1;while(low=high),m=(low+high)/2;/折半,if(L.r0.keyL.rm.key)high=m-1;/插入点在低半区elselow=m+1;/插入点在高半区,i,low,high,m,m,low,low,m,high,i,low,high,m,high,m,high,m,low,例如:,再如:,插入位置,插入位置,折半插入排序时间分析:,时间复杂度:折半插入排序比直接插入排序明显地减少了关键字间的“比较”次数,但记录“移动”的次数不变。T(n)=O(n)空间复杂度:S(n)=O(1),稳定的,三、表插入排序,为了减少在排序过程中进行的“移动”记录的操作,必须改变排序过程中采用的存储结构。利用静态链表进行排序,并在排序完成之后,一次性地调整各个记录相互之间的位置,即将每个记录都调整到它们所应该在的位置上。,#defineSIZE100/静态链表容量Typedefstruct/表结点类型RcdTyperc;/记录项intnext;/指针项SLNode;Typedefstruct/静态链表类型SLNoderSIZE;/0号单元为表头结点intlength;/链表当前长度SLinkListType;,例如:,voidLInsertionSort(ElemSL,intn)/对记录序列SL1.n作表插入排序SL0.key=MAXINT;SL0.next=1;SL1.next=0;for(i=2;i=n;+i)for(j=0,k=SL0.next;SLk.key=SLi.key;j=k,k=SLk.next)SLj.next=i;SLi.next=k;/结点i插入在结点j和结点k之间/LinsertionSort,算法中使用了三个指针:其中:p指示第i个记录的当前位置i指示第i个记录应在的位置q指示第i+1个记录的当前位置,如何在排序之后调整记录序列?,例如:,voidArrange(SLinkListType/p指示尚未调整的表尾,/为找第i+1个记录作准备/Arrange,表插入排序时间分析:,从表插入排序的过程可见,它的基本操作仍是将一个记录插入到已排好序的有序表中。和直接插入排序相比,不同之处是用修改2n次指针值代替移动记录,但比较次数相同。,T(n)=O(n2),重排记录的过程,最坏的情况是每个记录到位都必须进行一次交换,即移动3(n-1)次。,稳定的,四、希尔排序(又称缩小增量排序),基本思想:对待排记录序列先作“宏观”调整,再作“微观”调整。,所谓“宏观”调整,指的是,“跳跃式”的插入排序。具体做法为:,将记录序列分成若干子序列,分别对每个子序列进行插入排序。,其中,d称为增量,它的值在排序过程中从大到小逐渐缩小,直至最后一趟排序减为1。,例如:将n个记录分成d个子序列:R1,R1+d,R1+2d,R1+kdR2,R2+d,R2+2d,R2+kdRd,R2d,R3d,Rkd,R(k+1)d,162512304711233691831,例如:,第一趟希尔排序,设增量d=5,112312918162536304731,第二趟希尔排序,设增量d=3,918121123162531304736,第三趟希尔排序,设增量d=1,911121618232530313647,1234567891011,voidShellInsert(SqList/插入/if/ShellInsert,voidShellSort(SqList/一趟增量为dltak的插入排序/ShellSort,#defineT3intdlta=5,3,1;,49,13,38,27,27,4,55,38,65,48,97,55,76,4,12345678910,希尔排序时间分析:,希尔排序的时间是所取“增量”序列的函数。,T(n)=O(n1.3),增量序列取法:没有除1以外的公因子,最后一个增量值必须为1。,不稳定的,10.3快速排序,一、起泡排序,三、快速排序,二、一趟快速排序,一、起泡排序,假设在排序过程中,记录序列R1.n的状态为:,第i趟起泡排序,无序序列R1.n-i+1,有序序列Rn-i+2.n,n-i+1,无序序列R1.n-i,有序序列Rn-i+1.n,比较相邻记录,将关键字最大的记录交换到n-i+1的位置上,例,38,49,76,97,13,97,27,97,30,97,13,76,76,76,27,30,13,65,27,65,30,65,13,13,49,49,30,49,27,38,27,38,30,38,voidbubble_sort(SqList,结束条件为:最后一趟没有进行“交换记录”。,起泡排序时间分析:,最好的情况(关键字在记录序列中顺序有序):只需进行一趟起泡,“比较”的次数:,最坏的情况(关键字在记录序列中逆序有序):需进行n-1趟起泡,“比较”的次数:,0,“移动”的次数:,“移动”的次数:,n-1,稳定的,从起泡排序的过程可见,起泡排序是一个增加有序序列长度的过程,也是一个缩小无序序列长度的过程,每经过一趟起泡,无序序列的长度只缩小1。试设想,若能在经过一趟排序,使无序序列的长度缩小一半,则必能加快排序的速度。,二、一趟快速排序(一次划分),目标:找一个记录,以它的关键字作为“枢轴”,凡其关键字小于枢轴的记录均移动至该记录之前,反之,凡关键字大于枢轴的记录均移动至该记录之后。,致使一趟排序之后,记录的无序序列L.rs.t将分割成两部分:L.rs.i-1和L.ri+1.t,且L.rj.keyL.ri.keyL.rj.key(sji-1)枢轴(i+1jt)。,完成一趟排序:(273813)49(76976550),分别进行快速排序:(13)27(38)49(5065)76(97),快速排序结束:1327384950657697,49,27,49,65,13,49,49,97,intPartition(SqList/返回枢轴所在位置/Partition,intPartition(SqListpivotkey=L.rlow.key;/枢轴,while(lowhigh),while(low=pivotkey)-high;/从右向左搜索,L.rlow=L.rhigh;,while(low=”成立,则说明已找到rc的插/入位置s,不需要继续往下调整,H.rs=H.rj;s=j;/否则记录上移,尚需继续往下调整,if(j0;-i)HeapAdjust(H.r,i,H.length);/建大顶堆,for(i=H.length;i1;-i)H.r1H.ri;/将堆顶记录和当前未经排序子序列/H.r1.i中最后一个记录相互交换HeapAdjust(H.r,1,i-1);/对H.r1进行筛选,堆排序的时间复杂度分析:,1.对深度为k的堆,“筛选”所需进行的关键字比较的次数至多为2(k-1);,3.调整“堆顶”n-1次,总共进行的关键字比较的次数不超过2(log2(n-1)+log2(n-2)+log22)2n(log2n),因此,堆排序的时间复杂度为O(nlogn)。,2.对n个关键字,建成深度为h(=log2n+1)的堆,所需进行的关键字比较的次数至多4n;,不稳定的,归并:将两个或两个以上的有序表组合成一个新的有序表。,10.5归并排序,在内部排序中,通常采用的是2-路归并排序。即:将两个位置相邻的记录有序子序列,归并为一个记录的有序序列。,有序序列Rl.n,有序子序列Rl.m,有序子序列Rm+1.n,这个操作对顺序表而言,是轻而易举的。,例:给定待排序序列(49,38,65,97,76,13,27),初始关键字:49386597761327,一趟归并后:38496597137627,二趟归并后:38496597132776,三趟归并后:13273849657697,voidMerge(RcdTypeSR,RcdTypei=m,if(i=m)TRk.n=SRi.m;/将剩余的SRi.m复制到TR,if(j=n)TRk.n=SRj.n;/将剩余的SRj.n复制到TR,归并排序的算法:,如果记录无序序列Rs.t的两部分Rs.(s+t)/2和R(s+t)/2+1.t分别按关键字有序,则利用上述归并算法很容易将它们归并成整个记录序列是一个有序序列。,由此,应该先分别对这两部分进行2-路归并排序。,例如:,52,23,80,36,68,14(s=1,t=6),52,23,8036,68,14,52,2380,52,23,52,23,52,80,36,6814,3668,36,68,14,36,68,14,23,36,52,68,80,23,voidMsort(RcdTypeSR,RcdTypeelse/Msort,m=(s+t)/2;/将SRs.t平分为SRs.m和SRm+1.t,Msort(SR,TR2,s,m);/递归地将SRs.m归并为有序的TR2s.mMsort(SR,TR2,m+1,t);/递归地SRm+1.t归并为有序的TR2m+1.t,Merge(TR2,TR1,s,m,t);/将TR2s.m和TR2m+1.t归并到TR1s.t,voidMergeSort(SqList/MergeSort,容易看出,对n个记录进行归并排序的时间复杂度为(nlogn)。即:每一趟归并的时间复杂度为O(n),总共需进行log2n趟。,稳定的,基数排序是一种借助“多关键字排序”的思想来实现“单关键字排序”的内部排序算法。,10.6.1多关键字的排序,10.6.2链式基数排序,10.6基数排序,例:对52张扑克牌按以下次序排序:23A23A23A23A两个关键字:花色()面值(23A)并且“花色”地位高于“面值”。,10.6.1多关键字的排序,n个记录的序列R1,R2,,Rn对关键字(Ki0,Ki1,Kid-1)有序是指:,其中:K0被称为“最主”位关键字,Kd-1被称为“最次”位关键字,对于序列中任意两个记录Ri和Rj(1ijn)都满足下列(字典)有序关系:(Ki0,Ki1,Kid-1)(Kj0,Kj1,Kjd-1),先对K0进行排序,并按K0的不同值将记录序列分成若干子序列之后,分别对K1进行排序,.,依次类推,直至最后对最次位关键字排序完成为止。,一、最高位优先(MSD)法,先对Kd-1进行排序,然后对Kd-2进行排序,依次类推,直至对最主位关键字K0排序完成为止。,按LSD排序,不必分成子序列,对每个关键字都是整个序列参加排序;并且可不通过关键字比较,而通过若干次分配与收集实现排序。,二、最低位优先(LSD)法,例如:学生记录含三个关键字:系别、班号和班内的序号,其中以系别为最主位关键字。,无序序列,对K2排序,对K1排序,对K0排序,3,2,30,1,2,15,3,1,20,2,3,18,2,1,20,1,2,15,2,3,18,3,1,20,2,1,20,3,2,30,3,1,20,2,1,20,1,2,15,3,2,30,2,3,18,1,2,15,2,1,20,2,3,18,3,1,20,3,2,30,LSD的排序过程如下:,10.6.2链式基数排序,假如多关键字的记录序列中,每个关键字的取值范围相同,则按LSD法进行排序时,可以采用“分配-收集”的方法,其好处是不需要进行关键字间的比较。,对于数字型或字符型的单关键字,可以看成是由多个数位或多个字符构成的多关键字,此时可以采用这种“分配-收集”的办法进行排序,称作基数排序法。,例如:对下列这组关键字209,386,768,185,247,606,230,834,539,首先按其“个位数”取值分别为0,1,9“分配”成10组,之后按从0至9的顺序将它们“收集”在一起;,然后按其“十位数”取值分别为0,1,9“分配”成10组,之后再按从0至9的顺序将它们“收集”在一起;,最后按其“百位数”重复一遍上述操作。,在计算机上实现基数排序时,为减少所需辅助存储空间,应采用链表作存储结构,即链式基数排序,具体作法为:,1.待排序记录以指针相链,构成一个链表;,2.“分配”时,按当前“关键字位”所取值,将记录分配到不同的“链队列”中,每个队列中记录的“关键字位”相同;,3.“收集”时,按当前关键字位取值从小到大将各队列首尾相链成一个链表;,4.对每个关键字位均重复2)和3)两步。,例,提醒注意:,“分配”和“收集”的实际操作仅为修改链表中的指针和设置队列的头、尾指针;,为查找使用,该链表尚需应用算法Arrange将它调整为有序表。,基数排序的时间复杂度为O(d(n+rd),其中:分配为O(n)收集为O(rd)(rd为“基”)d为“分配-收集”的趟数,基数排序时间分析:,10.7各种排序方法的综合比较,一、时间性能,三、排序方法的稳定性能,二、空间性能,四、关于“排序方法的时间复杂度的下限”,一、时间性能,1.平均的时间性能,基数排序,时间复杂度为O(nlogn):,快速排序、堆排序和归并排序,时间复杂度为O(n2):,直接插入排序、起泡排序和简单选择排序,时间复杂度为O(n):,2.当待排记录序列按关键字顺序有序时,3.简单选择排序、堆排序和归并排序的时间性能不随记录序列中关键字的分布而改变。,直接插入排序和起泡排序能达到O(n)的时间复杂度,快速排序的时间性能蜕化为O(n2)。,二、空间性能,指的是排序过程中所需的辅助空间大小。,1.所有的简单排序方法(包括:直接插入、起泡和简单选择)和堆排序的空间复杂度为O(1);,2.快速排序为O(logn),为递归程序执行过程中,栈所需的辅助空间;,3.归并排序所需辅助空间最多

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论