数据结构与算法设计(第二版)课件 第9章 排序_第1页
数据结构与算法设计(第二版)课件 第9章 排序_第2页
数据结构与算法设计(第二版)课件 第9章 排序_第3页
数据结构与算法设计(第二版)课件 第9章 排序_第4页
数据结构与算法设计(第二版)课件 第9章 排序_第5页
已阅读5页,还剩102页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第九章排序西安科技大学计算机学院张小艳数据结构与算法设计排序简单排序方法简单选择排序直接插入排序

希尔排序

起泡排序先进排序方法快速排序归并排序堆排序多关键字排序方法基数排序(了解)排序方法的时间、空间复杂度、排序的稳定性最好、最坏时间复杂度9.1排序的基础知识9.1.1排序的基本概念

排序定义:将一个数据元素(或记录)的任意序列,重新排列成一个按关键字有序的序列叫排序排序的目的:便于查找从第八章的讨论可以看出,在有序表中,可以采用查找效率较高的折半查找。二叉排序树或B树建表的过程本身就是一个排序过程。

为了讨论方便,下面给出排序确切的定义。假设含有n个记录的序列为

{r1,r2,…,rn}(9-1)

它们的关键字相应为{k1,k2,…,kn}。对式(9-1)的记录序列进行排序就是要确定序号1,2,…,n的一种排列:

{p1,p2,…,pn}使其相应的关键字满足如下的非递减(或非递增)的关系:

kp1≤kp2≤…≤kpn(9-2)也就是使式(9-1)的记录序列重新排列成一个按关键字有序的序列:

{rp1≤rp2≤…≤rpn}(9-3)

排序稳定性:若两个记录A和B的关键字值相等,但排序后A、B的先后次序保持不变,则称这种排序算法是稳定的。排序不仅仅针对主关键字,也会对次关键字进行排序。当待排序记录中的关键字ki(i = 1,2,…,n)是主关键字,则任何一个记录的无序序列经排序后得到的结果是唯一的;反之,若待排序的记录的关键字是次关键字,则排序所得到的记录序列的结果不唯一。假设ki=kj (1≤i≤n,1≤j≤n,i≠j),且在排序前的序列中ri领先于rj (即i<j)。若在排序后的序列中ri仍领先于rj,则称所用的排序方法是稳定的;反之,若使排序后的序列中rj领先于ri,则称所用的排序方法是不稳定的。9.1.2排序的分类按待排序记录所在位置内部排序:待排序记录存放在内存外部排序:排序过程中需对外存进行访问的排序注:外部排序时,要将数据分批调入内存来排序,中间结果应及时放入外存,显然外部排序要复杂得多按排序依据原则插入排序:直接插入排序、折半插入排序、希尔排序交换排序:冒泡排序、快速排序选择排序:简单选择排序、堆排序归并排序:2-路归并排序基数排序

按排序算法的时间复杂度来区分,则可分为三类:简单的排序方法,其时间复杂度为O(n2);先进的排序方法,其时间复杂度为O(nlbn);基数排序,其时间复杂度为O(d×n)。我们学习这些算法,并不是为了编程实现,而是通过学习来提高算法设计能力,以便能够灵活运用基本的算法去解决更复杂的问题。对内部排序来说,排序算法的性能主要考虑以下三个方面:

(1)时间性能。在排序过程中,一般进行两种基本操作:①比较两个关键字的大小;②将记录从一个位置移动到另一个位置。其中操作①对于大多数排序方法来说是必要的,而操作②则可以通过采用适当的存储方式予以避免。总之,高效率的内部排序算法应该是具有尽可能少的关键字比较次数和尽可能少的记录移动次数。(2)辅助空间。评价排序算法性能的另一个指标就是算法执行过程中需要的辅助存储空间。辅助存储空间是除了存放待排序序列所占存储空间之外,执行算法所需的额外空间。

(3)算法的复杂度。这里是指算法本身的复杂度,而不是指算法的时间复杂度。9.1.3存储结构对于待排序的记录序列,有三种常见的存储表示方法:

(1)向量结构:将待排序的记录存放在一组地址连续的存储单元中。由于在这种存储方式中,记录之间的次序关系由其存储位置来决定,所以排序过程中一定要移动记录才行。

(2)链表结构:采用链表结构时,记录之间逻辑上的相邻性是靠指针来维持的,这样在排序时,就不用移动记录元素,而只需要修改指针。这种排序方式被称为链表排序。

(3)记录向量与地址向量结合:将待排序记录存放在一组地址连续的存储单元中,同时另设一个指示各个记录位置的地址向量。这样在排序过程中不移动记录本身,而修改地址向量中记录的“地址”,排序结束后,再按照地址向量中的值调整记录的存储位置。这种排序方式被称为地址排序。本章讨论的排序算法大部分采用顺序存储。为了讨论方便,假设待排记录的关键字均为整数,均从数组中下标为1的位置开始存储,下标为0的位置存储监视哨,或空闲不用。

#defineMAXSIZE20/*一个用作示例的小顺序表的最大长度*/

typedefintKeyType;

typedefstruct

{

KeyTypekey;

OtherTypeotherdata;

}RecordType;

typedefstruct

{

RecordTyper[MAXSIZE];

intlength; /*顺序表长度*/

}SqList; /*顺序表类型*/9.2简单排序方法

简单选择排序、直接插入排序、希尔排序和起泡排序。

9.2.1简单选择排序首先,在待排序序列中选择出最小的记录,然后将这个最小的数据元素与第一个记录交换,第一个记录到位,这叫做第一趟排序;第二趟,就是从第二个记录到最后一个记录中选择最小的记录,之后将最小的记录与第二个记录交换,第二个记录到位;以此类推,进行n-1趟,序列就有序了。即第i趟简单选择,就是在n-i+1(i = 1,2,…,n-1)个记录中选择关键字最小的记录作为有序序列中第i个记录。经过n-1趟比较,直到数据表有序为止。例初始:[49386597761327]kjjjjjjkki=11349一趟:13[386597764927]i=2kkjjjjj2738二趟:1327[6597764938]三趟:132738[97764965]四趟:13273849[769765]五趟:1327384965[9776]六趟:1327384965

76[97]排序结束:132738496576971voidSelectSort(SqList*L)2{/*对顺序表L作简单选择排序*/3RecordTypetemp;4for(i=1;i<L->length;++i)5{/*选择第i个小的记录,并交换到位*/6j=i; /*j用于记录最小元素的位置*/7for(k=i+1;k<=L->length;k++)8if(L->r[k].key<L->r[j].key)j=k;9if(i!=j)/*第i个小的记录L->r[j]与第i个记录交换*/10{temp=L->r[j];11L->r[j]=L->r[i];12L->r[i]=temp;13}14}15}/*SelectSort在第i趟选择排序过程中,需进行n-i次关键字间的“比较”,至多3次“移动”记录操作一个额外空间

在简单选择排序过程中,所需移动记录的次数比较少。最好情况下,即待排序记录初始状态就已经是正序排列了,则不需要移动记录,但是记录比较次数没有变化。

(132738491492526576)

最坏情况下,即待排序记录初始状态是按逆序排列的,则需要移动记录的次数最多为3(n-1)。简单选择排序过程中需要进行的比较次数与初始状态下待排序的记录序列的排列情况无关。当i=1时,需进行n-1次比较;当i=2时,需进行n-2次比较;依此类推,共需要进行的比较次数是空间复杂度:S(n)=O(1)

初始关键字:

491386549276132752i=1(13)3865492764912752i=2(1327)6549276491

3852i=3(132738)49276491

6552i=4(132738492)764916552i=5(132738492491)

766552i=6(13273849249152)6576i=7(1327384924915265)

76稳定性:不稳定1.基本思想在一个已排好序的记录子集的基础上,每一步将下一个待排序的记录有序地插入到已排好序的记录子集中,直到将所有待排记录全部插入为止。打扑克牌时的抓牌就是插入排序一个很好的例子,每抓一张牌,插入到合适位置,直到抓完牌为止,即可得到一个有序序列。9.2.2直接插入排序例如,已知待排序的一组记录的初始排列为:

{491,38,65,492,76,13,27,52}

假设在排序过程中,前3个记录按关键字递增的次序重新排列,构成了一个含有3个记录的有序序列:

{38,491,65}

现在要将第四个记录492插入上述序列,得到有序序列:

{38,491,492,65}。再讲76插入到上述序列

{38,491,492,65,76}。

一般情况下,第i趟直接插入排序的操作为:在含有i-1个记录的有序子序列r[1..i-1]中插入一个记录r[i]

后,变成含有i个记录的有序子序列r[1..i]。和顺序查找类似,为了在查找插入位置的过程中避免下标出界,将r[i]

记入r[0]

中,将第i个记录的关键字ki顺次与其前面记录的关键字ki-1,ki-2,…,k1进行比较,将所有关键字大于ki的记录依次向后移动一个位置,直到遇见一个关键字小于或者等于ki的记录kj,此时kj后面必为空位置,将第i个记录插入空位置即可。关键字序列T=(21,25,49,25*,16,08),直接插入排序的具体实现过程。i=121254925*16080123456暂存21i=2i=3i=5i=4i=625252549494925*25*49161625*080849解:假设该序列已存入一维数组R[7]中,将R[0]作为缓冲或暂存单元(Temp)。则程序执行过程为:21254925*21初态:164925*25211608完成!从上面的演示可以得到其具体算法

稳定!1voidInsertSort(SqList*L)2{/*对顺序表L作插入排序*/3for(i=2;i<=L->length;++i)4if(L->r[i].key<L->r[i-1].key)5{/*当“<”时,才需将L->r[i]插入有序表*/6L->r[0]=L->r[i];/*将待插入记录复制为哨兵*/7j=i-1;8while(L->r[0].key<L->r[j].key)9{L->r[j+1]=L->r[j]; /*记录后移*/10j--;11}12L->r[j+1]=L->r[0];/*插入到正确位置*/13}/*if*/14}/*InsertPass*/只需要一个辅助空间L->r[0]主要时间耗费在关键字比较和移动元素上

对于一趟插入排序,假如是第i趟插入排序,算法中的循环的次数主要取决于待插记录与前i-1个记录的关键字的关系上。最好情况为(顺序):L->r[i].key>L->r[i-1].key,关键字比较1次,且不移动记录。{13,27,38,49,52,65,76}{(13),27,38,49,52,65,76}{(13,27),38,49,52,65,76}{(13,27,38),49,52,65,76}{(13,27,38,49),52,65,76}{(13,27,38,49,52),65,76}{(13,27,38,49,52,65),76}{(13,27,38,49,52,65,76)}

对于一趟插入排序,假如是第i趟插入排序,算法中的循环的次数主要取决于待插记录与前i-1个记录的关键字的关系上。最坏情况为(逆序):L->r[i].key<L->r[i-1].key,

关键字比较i次,移动记录的次数为i+1。{76,65,52,49,38,27,13}

对整个排序过程而言,最好情况是待排序记录本身已按关键字有序排列,此时总的比较次数为n-1次,不移动记录;最坏情况是待排序记录按关键字逆序排列,此时总的比较次数达到最大值为记录移动的次数也达到最大值

直接插入排序方法是稳定的排序方法。在直接插入排序算法中,由于待插入元素的比较是从后向前进行的,循环while(L->r[0].key<L->.r[j].key)的判断条件就保证了后面出现的关键字不可能插入到与前面相同的关键字之前。直接插入排序算法简便,比较适用于待排序记录数目较少且基本有序的情况。当待排序数目较大时,直接插入排序的性能就不好,为此我们可以对直接插入排序做进一步的改进。在直接插入排序法的基础上,从减少“比较关键字”和“移动记录”两种操作的次数着手来进行改进。

折半插入排序直接插入排序的基本操作是向有序表中插入一个记录,插入位置的确定是通过对有序表中记录按关键字逐个比较得到的。既然是在有序表中确定插入位置,可以采用折半查找在有序表确定插入位置,即在有序表r[1..i-1] 中用折半查找确定第i个元素的插入位置。

在已形成的有序表中折半查找,并在适当位置插入,把原来位置上的元素向后顺移。新元素插入到哪里?14364952805861123456781voidBinSort(RecordTyper[],intlength)2{3for(i=2;i<=length;++i)4{x=r[i];5low=1;high=i-1;6while(low<=high)/*确定插入位置*/7{mid=(low+high)/2;8if(x.key<r[mid].key)9high=mid-1;10else11low=mid+1;12}13for(j=i-1;j>=low;--j)14r[j+1]=r[j]; /*记录依次向后移动*/15r[low]=x; /*插入记录*/16}17}1436495280586112345678

采用折半插入排序法可减少关键字的比较次数。每插入一个元素,需要比较的次数最大为折半查找判定树的深度,如插入第i个元素时,设i=2j,则需进行lb i次比较,因此插入n-1个元素的平均关键字的比较次数为O(nlbn)。虽然折半插入排序法与直接插入排序法相比较,改善了算法中比较次数的数量级,但其并未改变移动元素的时间耗费,所以折半插入排序的总的时间复杂度仍然是O(n2)。9.2.4起泡排序冒泡(起泡)排序基本思路:每趟不断将记录两两比较,并按“前小后大”(或“前大后小”)规则交换。优点:每趟结束时,不仅能挤出一个最大值到最后面位置,还能同时部分理顺其他元素;一旦下趟没有交换发生,还可以提前结束排序。前提:顺序存储结构例3849657613273097第一趟38496513273076第二趟384913273065第三趟3813273049第四趟13273038第五趟132730第六趟4938659776132730初始关键字n=8384976971397279730971376767627301365276530651313494930492738273830381327第七趟最坏情况下每一趟起泡排序需进行n-i次比较,3i次移动。最好情况下,待排序列已有序,只进行一趟起泡排序,关键字需要n-1次比较,不需移动记录。经过n-1趟起泡排序后,总的比较次数为:总的移动次数为:3n(n-1)/2次在算法中设置一个交换标识change进行控制。1voidBubbleSort(SqList*L)2{/*对记录数组L->r做起泡排序*/3RecordTypetemp;4n=L->length;5change=TRUE;/*设置交换标识为TRUE,便于进入循环*/6for(i=1;i<=n-1&&change;++i)7{change=FALSE; /*在第i趟中先设置记录交换标识为FALSE*/8for(j=1;j<=n-i;++j)9if(L->r[j].key>L->r[j+1].key)/*若相邻两记录逆序,交换*/10{temp=L->r[j];11L->r[j]=L->r[j+1];12L->r[j+1]=temp;13change=TRUE;14}15}16}/*BubbleSort*/算法的时间复杂度为O(n2),空间复杂度为O(1)抓核心问题对内部排序来说,排序算法的性能主要考虑以下三个方面:

(1)时间性能。在排序过程中,一般进行两种基本操作:①比较两个关键字的大小;②将记录从一个位置移动到另一个位置。其中操作①对于大多数排序方法来说是必要的,而操作②则可以通过采用适当的存储方式予以避免。总之,高效率的内部排序算法应该是具有尽可能少的关键字比较次数和尽可能少的记录移动次数。9.2.3希尔排序问题:直接插入排序的优点?关键字序列T=(21,25,49,25*,16,08),直接插入排序的具体实现过程。假设该序列已存入一维数组R[7]中,将R[0]作为缓冲或暂存单元(Temp)。i=121254925*16080123456暂存21i=2i=3i=5i=4i=625252549494925*25*49161625*08084921254925*21初态:164925*25211608稳定!在基本有序的情况下效率比较好!最好情况是有序时,仅仅进行N-1次比较

9.2.3希尔排序

基本思想:先将整个待排记录序列分割成若干子序列,分别进行直接插入排序,待整个序列中的记录“基本有序”时,再对全体记录进行一次直接插入排序。技巧:子序列的构成不是简单地“逐段分割”,而是将相隔某个增量dk的记录组成一个子序列,让增量dk逐趟缩短(例如依次取5,3,1),直到dk=1为止。优点:让关键字值小的元素能很快前移,且序列若基本有序时,再用直接插入排序处理,时间效率会高很多。问题:直接插入排序的优点?在基本有序的情况下效率比较好!最好情况是有序时,仅仅进行N-1次比较

表长比较短时,效率比较好

充分发挥直接插入排序的优势,引入希尔排序尺有所长,寸有所短38

关键字序列T=(49,38,65,97,76,13,27,49*,55,04)0123456789104938659776132749*5504初态:第1趟(dk=5)第2趟(dk=3)第3趟(dk=1)4913134938276549*9755760427386549*9755135576045513270427044949*4949*76387665659797551327044949*3876659713270449*7697r[i]算法分析:开始时dk的值较大,子序列中的对象较少,排序速度较快;随着排序进展,dk

值逐渐变小,子序列中对象个数逐渐变多,由于前面工作的基础,大多数对象已基本有序,所以排序速度仍然很快。增量dk的设置是经验值站在巨人的肩上,打好基础,才能创造未来希尔排序算法如下:1voidShellInsert(SqList*L,intdelta)2{/*对L->r[]做一趟希尔插入排序,delta为增量*/for(i=1+delta;i<=L->length;i++)

/*1+delta为第一个子序列的第二个元素的下标*/4if(L->r[i].key<L->r[i-delta].key)5{L->r[0]=L->r[i]; /*备份r[i]*/6for(j=i-delta;j>0&&L->r[0].key<L->r[j].key;j-=delta)7L->r[j+delta]=L->r[j];8L->r[j+delta]=L->r[0];9}10}delta为每趟排序的增量

希尔排序时效分析是一个复杂的问题,关键字的比较次数与记录移动次数依赖于增量因子序列的选取,特定情况下可以准确估算出关键字的比较次数和记录的移动次数。目前还没有人给出最好的选取增量因子序列的方法。增量因子序列可以有各种取法,有取奇数的,也有取质数的,但需要注意:最后一个增量因子必须为1。voidShellSort(SqList*L)

{for(i=0;i<t;++i)

ShellInsert(L,delta[i]);

}9.3先进排序方法9.3.1快速排序快速排序采用了一种分治的策略。基本思想是:

(1)先从数列中取出一个数作为基准数(该记录称为枢轴)。

(2)将比基准数大的数全放到它的右边,小于或等于基准数的全放到它的左边。

(3)再对左右两部分重复第(2)步,直到各区间只有一个数,达到整个序列有序。快速排序是从起泡排序改进而得的一种“交换”排序方法。通过一趟排序将记录分割成独立的两部分。

快速排序最早是由图灵奖获得者Tony.Hoare于1962年提出的Tony.Hoare致力于编程语言的研究,对计算机科学做出了许多重要贡献。Tony.Hoare领导团队生产了ALGOL60编译器,在编程语言ALGOL60的课程中,他发现递归的概念是快速排序清晰表达的关键。

假设待排序的原始记录序列为

(Rs,Rs+1,…,Rt-1,Rt)

则一趟快速排序的基本操作是:任选一个记录(通常选记录Rs),以它的关键字作为“枢轴”,凡序列中关键字小于枢轴的记录均移动至该记录之前;反之,凡序列中关键字大于枢轴的记录均移动至该记录之后.

(Ri1,Ri2,…,Rs,…,

Rit-1,Rit)……<=Rs.key<=…….分而治之的策略学会提炼核心问题,找到巧妙的解决方法stlowhigh设L.r[s]=52为枢轴high23lowhighlowL.r[0]52lowhighhighhighlow521)将L.r[high].key和枢轴的关键字进行比较,要求L.r[high].key≥枢轴的关键字否则与枢轴元素互换522)将L.r[low].key和枢轴的关键字进行比较,要求L.r[low].key≤枢轴的关键字否则与枢轴元素互换80521452可见:经过“一次划分”将关键字序列:

52,49,80,36,14,58,61,97,23,75调整为:23,49,14,36,(52)58,61,97,80,75

在调整过程中,设立了两个指针:

low和high,它们的初值分别为:s和t

之后逐渐减小

high,增加

low,并保证

L.r[high].key≥52,和L.r[low].key≤52,

否则进行记录的“交换”。一趟快速排序算法如下:1intPartition(RecordTypeR[],intlow,inthigh)2{R[0]=R[low];

/*将枢轴记录移至数组的闲置分量*/3Pivotkey=R[low].key; /*枢轴记录关键字*/4while(low<high) /*从表的两端交替地向中间扫描*/5{while(low<high&&R[high].key>=pivotkey)/*从右向左扫描*/6--high;7R[low++]=R[high];

/*将比枢轴记录小的记录移到低端*/8while(low<high&&R[low].key<=pivotkey)/*从左向右扫描*/9++low;10R[high--]=R[low]; /*将比枢轴记录大的记录移到高端*/11}/*while12R[low]=R[0];

/*枢轴记录移到正确位置*/13returnlow; /*返回枢轴位置*/14}/*Partition细节决定成败!!!基础!!!快速排序的算法如下:1voidQSort(RecordTypeR[],ints,intt)2{/*对记录序列R[s..t]进行快速排序*/3if(s<t-1)/*长度大于1*/4{pivotloc=Partition(R,s,t);5QSort(R,s,pivotloc-1);/*对低端子序列递归排序*/6QSort(R,pivotloc+1,t);/*对高端子序列递归排序*/7}//if8}//Qsort

枢轴元素通常选择序列中的第一个元素,为了改善最坏情况下的时间性能,可以在枢轴的选择上进行改变。一般来说,在序列R[s]~R[t]中,枢轴通常可选:

(1)首元素R[s]或者尾元素R[t]。

(2)中值元素。这里,中值的意思是取首元素R[s]、尾元素R[t]和中间位置的元素三者中“中间大小”的那个元素。

(3)随机元素R[i],i是s~t之间的一个随机整数。为了便于编程,如果选择的枢轴元素不是首元素,则可以先将其与首元素交换,再进行划分。所以,除增加选择划分元素的操作和交换操作外,算法没有其他改变。用快速排序算法对数据表从小到大进行排序

A=(12,5,4,19,25,1,34,7,10,23,8,5)快速排序实例(125419251347102385)x=12用快速排序算法对数据表从小到大进行排序

(1,4,5,7,10,12,19,25,34)快速排序实例(1,4,5,7,10,12,19,25,34)x=1算法评价时间复杂度最好情况(每次总是选到中间值作枢轴,)T(n)=O(nlog2n)最坏情况(每次总是选到最小或最大元素作枢轴)T(n)=O(n²)空间复杂度:需栈空间以实现递归最坏情况:S(n)=O(n)一般情况:S(n)=O(logn)稳定性:不稳定9.3.2归并排序将两个或两个以上的有序表组合成一个新的有序表.2-路归并排序过程设初始序列含有n个记录,则可看成n个有序的子序列,每个子序列长度为1两两合并,得到

n/2个长度为2或1的有序子序列再两两合并,……如此重复,直至得到一个长度为n的有序序列为止算法评价时间复杂度:T(n)=O(nlogn)空间复杂度:S(n)=O(n)稳定性:稳定每一种排序算法都有其各自的优势!([15][18][25][60][18][75][100][23][64][8][150])([1518][2560][1875][23100][864][150])([15182560][182375100][864150])([1518

1823

256075100][864150])([81518

1823

25606475100150])二路归并示例48将下属两个已排序的顺序表合并成一个有序表:顺序比较两者的相应元素,小者移入另一表中,反复如此,直至其中任一表都移入另一表为止。0123 44913659776780AB0123 4567Cijk490123 44913659776780AB0123 4567Cijk7500123 44913659776780AB0123 4567Cijk7510123 44913659776780AB0123 4567Cijk713520123 44913659776780AB0123 4567Cijk71349530123 44913659776780AB0123 4567Cijk71349540123 44913659776780AB0123 4567Cijk7134965550123 44913659776780AB0123 4567Cijk7134965560123 44913659776780AB0123 4567Cijk713496576570123 44913659776780AB0123 4567Cijk713496576580123 44913659776780AB0123 4567Cijk71349657680590123 44913659776780AB0123 4567Cijk71349657680600123 44913659776780AB0123 4567Cijk71349657680至此B表的元素都已移入C表,只需将A表的剩余部分移入C表即可。610123 44913659776780AB0123 4567Cijk71349657680至此B表的元素都已移入C表,只需将A表的剩余部分移入C表即可。97合并两个有序序列的算法如下:1voidMerge(RecordTypeSR[],RcdTypeTR[],inti,intm,intn){/*将有序的SR[i..m]和SR[m+1..n]归并为有序的TR[i..n]*/2for(j=m+1,k=i;k<=m&&j<=n;++k)/*将SR中记录并入TR*/3{4if(SR[i].key<=SR[j].key)TR[k]=SR[i++];5elseTR[k]=SR[j++];6}7while(i<=m)TR[k++]=SR[i++];/*将剩余的SR[i..m]复制到TR*/8while(j<=n)TR[k++]=SR[j++];/*将剩余的SR[j..n]复制到TR*/}//Merge

基础!!!

在待排序的原始记录序列R[s..t] 中取一个中间位置(s+t)/2,先分别对子序列R[s..(s+t)/2] 和R[(s+t)/2+1..t] 进行归并排序,然后调用合并算法实现整个序列R[s..t] 排序。10voidMsort(RecordTypeSR[],RecordTypeTR1[],ints,intt){/*对SR[s..t]进行归并排序,排序后的记录存入TR1[s..t]*/11RecordTypeTR2[t-s+1];/*开设存放归并排序中间结果的辅助空间*/12if(s==t)TR1[s]=SR[s];13else14{m=(s+t)/2;/*将SR[s..t]平分为SR[s..m]和SR[m+1..t]*/15Msort(SR,TR2,s,m);/*递归地将SR[s..m]归并为有序的TR2[s..m]*/16Msort(SR,TR2,m+1,t); /*将SR[m+1..t]归并为有序的TR2[m+1..t]*/17Merge(TR2,TR1,s,m,t);/*将TR2[s..m]和TR2[m+1..t]归并到TR1[s..t]*/18}//else19}//Msort

非递归实现归并排序递归合并排序尽管在代码上比较清晰,容易理解,但这会造成时间和空间上的性能耗损,我们可以用非递归来实现合并排序。非递归过程可以从最小的序列开始归并直至完成。1voidmergesort(SqList*L)2{3intTR[MAXL];4intk=1;5while(k<L->length)6{7mergepass(L->r,TR,k,L->length);/*合并到数组TR*/8k=2*k; /*子序列长度加倍*/9mergepass(TR,L->r,k,L->length);/*合并到数组L->r*/10k=2*k; /*子序列长度加倍*/11}12}合并两个相邻有序序列的算法如下:13voidmergepass(intSR[],intTR[],ints,intn)14{/*合并大小为s的相邻子数组*/15inti=1,j;16while(i<=n-2*s+1)17{18Merge(SR,TR,i,i+s-1,i+2*s-1); /*两相邻有序序列合并*/19i=i+2*s;20}21if(i<n-s+1) /*归并最后两个序列*/22Merge(SR,TR,i,i+s-1,n);23else /*若最后只剩下单个子序列*/24for(intj=i;j<=n;j++)25TR[j]=SR[j];26}

递归合并排序中,一趟归并需要将SR[1]~SR[n] 中相邻的长度为h的有序序列两两归并,并将结果放入TR[1]~TR[n]中,这需要将待排序序列中的记录扫描一遍,耗时O(n)。具有n个记录的序列进行归并排序的递归的深度就是具有n结点完全二叉树的深度,可以看出整个归并排序需要进行lbn次,因此,总的归并排序的时间复杂度为O(nlbn),而且,这是归并排序算法最好、最坏、平均的时间复杂度。

由于归并排序在归并过程中需要与原始记录序列同样数量的存储空间存放归并结果以及递归时深度为lb n的栈空间,因此,空间复杂度为O(n+lbn)。

非递归的合并排序避免了递归时深度为lb n的栈空间,空间只是用到申请归并临时用的TR数组,因此,空间复杂度为O(n)。在时间上也有一定的提升,省去了递归拆分,但是总体时间复杂度还是O(nlbn)。应该说,使用归并排序时,尽量考虑非递归方法。9.3.3堆排序树形选择排序先把待排序的n个记录的关键字两两进行比较,取出较小的,然后再在个较小的记录中,采用同样的方法进行比较,选出每两个中较小的,如此反复,直到选出最小关键字记录为止。可以用一棵有n个结点的树来表示,选出的最小记录就是这棵树的根结点。在输出最小记录后,为再次选出次小记录,将根结点即最小记录所对应的叶子结点的关键字的值置为∞,再进行上述的过程,直到所有的记录全部输出为止。乒乓球比赛变换形式学会变通回忆:二叉树性质5

若对含n个结点的完全二叉树从上到下且从左至右进行1

至n

的编号,则对完全二叉树中任意一个编号为i

的结点:(1)若i=1,则该结点是二叉树的根,无双亲,否则,编号为

i/2

的结点为其双亲结点;(2)若2i>n,则该结点无左孩子,

否则,编号为2i的结点为其左孩子结点;(3)若2i+1>n,则该结点无右孩子结点,

否则,编号为2i+1的结点为其右孩子结点。2.堆排序(heapsort)(90,70,80,60,10,40,50,30,20)(10,20,70,30,50,90,80,60,40)观察规律,提炼特点2.堆排序(heapsort)

堆排序是对树形选择排序的进一步改进。在堆排序中,把待排序的文件逻辑上看做是一棵完全二叉树,并用到堆的概念。在介绍堆排序之前,先引入堆的概念:设有n个元素的序列k1,k2,…,kn,当且仅当满足下述关系之一时,称之为堆

若某数列是堆,则k1必是数列中的最小值或最大值,则分别称满足上式所示关系的序列为小顶堆或大顶堆。rir2i

r2i+1

若将该数列视作完全二叉树,则r2i

是ri

的左孩子;r2i+1

是ri

的右孩子。1236276549817355403498例如:是堆14不

将此序列对应到编号的完全二叉树,则堆的定义可用完全二叉树中的有关术语解释为:每一结点均不大于(或不小于)其左右孩子结点的值。若序列(a1,a2,…,an)是堆,则堆顶(完全二叉树的根)必为序列中的最小或最大值。将根最大的堆称为大根堆,根最小的堆称为小根堆.

是利用堆的特性对记录序列进行排序的一种排序方法。堆排序(若进行增排序,则采用大根堆)如果初始序列是堆,则可通过反复执行如下操作而最终得到一个有序序列:输出根:即将根(第一个元素)与当前子序列中的最后一个元素交换。调整堆:将输出根之后的子序列调整为堆。如果初始序列不是堆,则首先要将其先建成堆,然后再按(1)的方式来实现。

实现堆排序需解决两个问题:①如何将n个元素的序列按关键字建成堆。②输出堆顶元素后,怎样调整剩余n-1个元素,使其按关键字成为一个新堆。首先,讨论②,输出堆顶元素后,对剩余元素重新建成堆的调整过程。例如:升序输出13273849657650979727384965765013输出:132749389765765013输出:139749382765765013输出:13273849502765769713输出:13276549502738769713输出:1327384965502738769713输出:1327387665502738499713输出:132738495065762738499713输出:132738499765762738495013输出:13273849506597762738495013输出:13273849509765762738495013输出:1327384950657665972738495013输出:1327384950659765762738495013输出:132738495065769765762738495013输出:1327384950657697调整剩余n-1个元素,使其按关键字成为一个新堆。假设r[k..m] 是以r[k] 为根的完全二叉树,且分别以r[2k] 和r[2k+1] 为根的左、右子树为小顶堆,调整r[k],使整个序列r[k..m] 满足堆的性质。筛选如下:1voidsift(RecordTyper[],intk,intm)2{t=r[k]; /*暂存“根”记录r[k]*/3x=r[k].key;4i=k;5j=2*i; /*左孩子结点*/6finished=FALSE;7while(j<=m&&!finished)8{if(j<m&&r[j].key>r[j+1].key)/*若存在右子树,且右子树根的关键字小,则沿右分支筛选*/9j=j+1; 10if(x<=r[j].key)11finished=TRUE; /*筛选完毕*/12else /*否则,r[j]计入r[i],继续筛选*/13{r[i]=r[j];14i=j;15j=2*i;16} /*继续筛选*/17}18r[i]=t; /*r[k]填入到恰当的位置*/19}/*sift*/

再来讨论①的实现,即对n个元素初始建堆的过程。建堆方法:对初始序列建堆的过程,就是一个反复进行筛选的过程。若将n个结点序列看成一棵完全二叉树,则最后一个结点是第n/2个结点的孩子结点。建堆算法如下:

voidcrt-heap(RecordTyper[],intlength)

/*对记录数组r建堆,length为数组的长度*/{n=length;for(i=n/2;i>=1;--i)/*自第个记录开始进行筛选建堆*/sift(r,i,n);}堆排序的算法如下:1voidHeapSort(RecordTyper[],intlength)/*对r[1..n]进行堆排序,执行本算法后,r中记录按关键字由大到小有序排列*/2{crt-heap(r,length);3n=length;4for(i=n;i>=2;--i)5{6b=r[1];/*将堆顶记录和堆中的最后一个记录互换*/7r[1]=r[i]8r[i]=b;9sift(r,1,i-1);/*进行调整,使r[1..i-1]变成堆*/10}11}/*HeapSort*/

堆排序的时间主要耗费在建初始堆和调整建新堆时进行的反复筛选上。在构建堆的过程中,是从完全二叉树最下层最右边的非终端结点开始构建,将它与其孩子进行比较和有必要的互换,对于每个非终端结点来说,其实最多进行两次比较和互换操作,因此整个构建堆的时间复杂度为O(n)。堆排序过程中,第i次取堆顶记录后重新建堆的时间复杂度为O(lbi),这是因为完全二叉树的某个结点到根结点的距离为 

lb i

+1,需要取n-1次堆顶记录,因此重新建堆的时间复杂度为O(nlbn)。

堆排序在最坏情况下,其时间复杂度也为O(nlbn),这是堆排序的最大优点。堆排序与树形排序相比较,排序中只需要存放一个记录的辅助空间,因此也将堆排序称做原地排序。

堆排序是一种不稳定的排序方法。堆排序方法对记录较少的文件并不值得提倡,但对n较大的文件还是很有效的。

排序方法有很多,希望大家能掌握每一种方法的特点,灵活运用例如:对52张扑克牌按以下次序排序:

2<3<……<A<

2<

3<……<

A<

2<

3<……<

A<2<3<……<A两个关键字:花色(<

<

<)面值(2<3<……<A)并且“花色”地位高于“面值”9.3.4基数排序**

基数排序是一种借助于多关键字排序的思想,是将单关键字按基数分成“多关键字”进行排序的方法。1.多关键字排序

讨论两种排序方法。

方法1:先对花色排序,将其分为4个组,即梅花组、方块组、红心组、黑桃组。再对每个组分别按面值进行排序,最后,将4个组连接起来即可。

2345678910JQKA

方法2:先按13个面值给出13个编号组,将牌按面值依次放入对应的编号组,分成13堆。再按花色给出4个编号组(梅花、方块、红心、黑桃),将2号组中牌取出分别放入对应花色组,再将3号组中牌取出分别放入对应花色组……这样,4个花色组中均按面值有序,然后,将4个花色组依次连接起来即可。2345678910JQKA22223333

K

KKKAAAA

一般情况下,设n个元素的待排序列{R1,R2,…,Rn},且每个记录包含d个关键字{k1,k2,…,kd},则称序列对关键字{k1,k2,…,kd}有序,即对于序列中任意两个记录R[i]和R[j](1≤i≤j≤n)都满足下列有序关系:其中,k1称为最主位关键字,kd称为最次位关键字。多关键字排序按照从最高位关键字到最低位关键字或从最低位关键字到最高位关键字的顺序逐次排序,分两种方法:(1)最高位优先(mostsignificantdigitfirst)法,简称MSD法(2)最低位优先(leastsignificantdigitfirst)法,简称LSD法:2.链式基数排序将关键字抽象为数字,且其值都在0~999范围内,可把每一个十进制数字看成一个关键字,认为k由3个关键字(k2,k1,k0)组成,其中k2是百位数,k1是十位数,k0是个位数;又若关键字k是由5个字母组成的单词,则可看成是由5个关键字(k4,k3,k2,k1,k0)组成,其中每个字母kj都是一个关键字,k0是最低位,k4是最高位。由于如此分解而得的每个关键字kj都在相同的取值范围内,灵活变通,转变思路。

假设记录的逻辑关键字由d个关键字构成,每个关键字可能取RADIX个值,则只要从最低位关键字起,按关键字的不同值将记录分配到RADIX个队列之后再收集在一起,如此重复d趟,最终完成整个记录序列的排序。按这种方法实现的排序称为基数排序,其中,基数指的是RADIX的取值范围。

以链表存储n个待排记录,从最低位关键字起,按关键字的不同值将序列中的记录分配到RADIX个队列中,然后再收集之,如此重复d次即可。链式基数排序是用RADIX个链队列作为分配队列,关键字相同的记录存入同一个链队列中,收集则是将各链队列按关键字大小顺序连接起来。27810906393058

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论