数据结构chap10.ppt

上传人：f*** IP属地：河南上传时间：2020-02-26 格式：PPT 页数：115 大小：647KB 积分：20 举报 版权申诉

已阅读5页，还剩110页未读，继续免费阅读

版权说明：本文档由用户提供并上传，收益归属内容提供方，若内容存在侵权，请进行举报或认领

文档简介

第十章排序 10 1概述 10 2插入排序 10 3快速排序 10 4堆排序 10 5归并排序 10 6基数排序 10 6各种排序方法的综合比较 10 8外部排序 10 1概述一排序的定义二内部排序和外部排序三内部排序方法的分类一什么是排序排序是计算机内经常进行的一种操作其目的是将一组无序的记录序列调整为有序的记录序列例如将下列关键字序列 52 49 80 36 14 58 61 23 97 75 调整为 14 23 36 49 52 58 61 75 80 97 一般情况下假设含n个记录的序列为 R1 R2 Rn 其相应的关键字序列为 K1 K2 Kn 这些关键字相互之间可以进行比较即在它们之间存在着这样一个关系Kp1 Kp2 Kpn 按此固有关系将上式记录序列重新排列为 Rp1 Rp2 Rpn 的操作称作排序二内部排序和外部排序若整个排序过程不需要访问外存便能完成则称此类排序问题为内部排序反之若参加排序的记录数量很大整个序列的排序过程不可能在内存中完成则称此类排序问题为外部排序三内部排序的方法内部排序的过程是一个逐步扩大记录的有序序列长度的过程经过一趟排序有序序列区无序序列区有序序列区无序序列区基于不同的扩大有序序列长度的方法内部排序方法大致可分下列几种类型插入类交换类选择类归并类其它方法待排记录的数据类型定义如下 constMAXSIZE 1000 待排顺序表最大长度 typedefintKeyType 关键字类型为整数类型 typedefstruct KeyTypekey 关键字项InfoTypeotherinfo 其它数据项 RcdType 记录类型 typedefstruct RcdTyper MAXSIZE 1 r 0 闲置intlength 顺序表长度 SqList 顺序表类型 1 插入类将无序子序列中的一个或几个记录插入到有序序列中从而增加记录的有序子序列的长度 Return 2 交换类通过交换无序序列中的记录从而得到其中关键字最小或最大的记录并将它加入到有序子序列中以此方法增加记录的有序子序列的长度 Return 3 选择类从记录的无序子序列中选择关键字最小或最大的记录并将它加入到有序子序列中以此方法增加记录的有序子序列的长度 Return 4 归并类通过归并两个或两个以上的记录有序子序列逐步增加记录有序序列的长度 5 其它方法 10 2插入排序有序序列R 1 i 1 R i 无序序列R i n 一趟直接插入排序的基本思想有序序列R 1 i 无序序列R i 1 n 实现一趟插入排序可分三步进行 3 将R i 插入复制到R j 1 的位置上 2 将R j 1 i 1 中的所有记录均后移一个位置 1 在R 1 i 1 中查找R i 的插入位置j R 1 j key R i key R j 1 i 1 key 直接插入排序基于顺序查找表插入排序基于链表存储不同的具体实现方法导致不同的算法描述折半插入排序基于折半查找希尔排序基于逐趟缩小增量一直接插入排序利用顺序查找实现在R 1 i 1 中查找R i 的插入位置算法的实现要点从R i 1 起向前进行顺序查找监视哨设置在R 0 R 0 R i 设置哨兵循环结束表明R i 的插入位置为j 1 R 0 R i for j i 1 R 0 key R j key j 从后往前找插入位置对于在查找过程中找到的那些关键字不小于R i key的记录并在查找的同时实现记录向后移动 for j i 1 R 0 key R j key j R j 1 R j R 0 R i 上述循环结束后可以直接进行插入插入位置令i 2 3 n 实现整个序列的排序 for i 2 i n i if R i key R i 1 key 在R 1 i 1 中查找R i 的插入位置插入R i voidInsertionSort SqList i if L r i key L r i 1 key if InsertSort L r 0 L r i 复制为监视哨L r i L r i 1 for j i 2 L r 0 key L r j key j L r j 1 L r j 记录后移L r j 1 L r 0 插入到正确位置内部排序的时间分析实现内部排序的基本操作有两个 2 移动记录 1 比较序列中两个关键字的大小对于直接插入排序最好的情况关键字在记录序列中顺序有序比较的次数最坏的情况关键字在记录序列中逆序有序比较的次数 0 移动的次数移动的次数因为R 1 i 1 是一个按关键字有序的有序序列则可以利用折半查找实现在R 1 i 1 中查找R i 的插入位置如此实现的插入排序为折半插入排序二折半插入排序 voidBiInsertionSort SqList L BInsertSort 在L r 1 i 1 中折半查找插入位置 for i 2 i L length i for L r 0 L r i 将L r i 暂存到L r 0 for j i 1 j low j L r j 1 L r j 记录后移 L r low L r 0 插入 low 1 high i 1 while low high m low high 2 折半 if L r 0 key L r m key high m 1 插入点在低半区elselow m 1 插入点在高半区 i low high m m low low m high i low high m high m high m low 例如再如插入位置插入位置三表插入排序为了减少在排序过程中进行的移动记录的操作必须改变排序过程中采用的存储结构利用静态链表进行排序并在排序完成之后一次性地调整各个记录相互之间的位置即将每个记录都调整到它们所应该在的位置上 voidLInsertionSort ElemSL intn 对记录序列SL 1 n 作表插入排序 SL 0 key MAXINT SL 0 next 1 SL 1 next 0 for i 2 i n i for j 0 k SL 0 next SL k key SL i key j k k SL k next SL j next i SL i next k 结点i插入在结点j和结点k之间 LinsertionSort 算法中使用了三个指针其中 p指示第i个记录的当前位置 i指示第i个记录应在的位置 q指示第i 1个记录的当前位置如何在排序之后调整记录序列 voidArrange ElemSL intn p SL 0 next p指示第一个记录的当前位置for i 1 i n i while p i p SL p next q SL p next q指示尚未调整的表尾if p i SL p SL i 交换记录使第i个记录到位SL i next p 指向被移走的记录 ifp q p指示尚未调整的表尾准备找第i 1个记录 for Arrange 四希尔排序又称缩小增量排序基本思想对待排记录序列先作宏观调整再作微观调整所谓宏观调整指的是跳跃式的插入排序具体做法为将记录序列分成若干子序列分别对每个子序列进行插入排序其中 d称为增量它的值在排序过程中从大到小逐渐缩小直至最后一趟排序减为1 例如将n个记录分成d个子序列 R 1 R 1 d R 1 2d R 1 kd R 2 R 2 d R 2 2d R 2 kd R d R 2d R 3d R kd R k 1 d 例如第一趟希尔排序设增量d 5 第二趟希尔排序设增量d 3 第三趟希尔排序设增量d 1 voidShellInsert SqList 插入 if ShellInsert voidShellSort SqList 一趟增量为dlta k 的插入排序 ShellSort 10 3快速排序一起泡排序二一趟快速排序三快速排序四快速排序的时间分析一起泡排序假设在排序过程中记录序列R 1 n 的状态为第i趟起泡排序无序序列R 1 n i 1 有序序列R n i 2 n n i 1 无序序列R 1 n i 有序序列R n i 1 n 比较相邻记录将关键字最大的记录交换到n i 1的位置上 voidBubbleSort ElemR intn while i 1 while BubbleSort i n i lastExchangeIndex 本趟进行过交换的最后一个记录的位置 if R j 1 key R j key Swap R j R j 1 if for j 1 j i j lastExchangeIndex 1 lastExchangeIndex j 记下进行交换的记录位置注意 2 一般情况下每经过一趟起泡 i减一但并不是每趟都如此例如 2 5 5 3 1 5 7 9 8 9 for j 1 j i j if R j 1 key R j key 1 3 1 起泡排序的结束条件为最后一趟没有进行交换记录时间分析最好的情况关键字在记录序列中顺序有序只需进行一趟起泡比较的次数最坏的情况关键字在记录序列中逆序有序需进行n 1趟起泡比较的次数 0 移动的次数移动的次数 n 1 二一趟快速排序一次划分目标找一个记录以它的关键字作为枢轴凡其关键字小于枢轴的记录均移动至该记录之前反之凡关键字大于枢轴的记录均移动至该记录之后致使一趟排序之后记录的无序序列R s t 将分割成两部分 R s i 1 和R i 1 t 且R j key R i key R j key s j i 1 枢轴 i 1 j t 设R s 52为枢轴暂存在R 0 的位置上将R high key和枢轴的关键字进行比较要求R high key 枢轴的关键字将R low key和枢轴的关键字进行比较要求R low key 枢轴的关键字 23 80 14 52 例如 R 0 52 可见经过一次划分将关键字序列52 49 80 36 14 58 61 97 23 75调整为 23 49 14 36 52 58 61 97 80 75 在调整过程中设立了两个指针 low和high 它们的初值分别为 s和t 之后逐渐减小high 增加low 并保证R high key 52 和R low key 52 否则进行记录的交换 intPartition RedType 返回枢轴所在位置 Partition intPartition RedTypeR intlow inthigh Partition R 0 R low pivotkey R low key 枢轴 while low high while low pivotkey high 从右向左搜索 R low R high while low high 从左向右搜索 R high R low R low R 0 returnlow 三快速排序首先对无序的记录序列进行一次划分之后分别对分割所得两个子序列递归进行快速排序无序的记录序列无序记录子序列 1 无序子序列 2 枢轴一次划分分别进行快速排序 voidQSort RedType R ints intt 对记录序列R s t 进行快速排序if s t 长度大于1 QSort pivotloc Partition R s t 对R s t 进行一次划分 QSort R s pivotloc 1 对低子序列递归排序 pivotloc是枢轴位置 QSort R pivotloc 1 t 对高子序列递归排序 voidQuickSort SqList QuickSort 第一次调用函数Qsort时待排序记录序列的上下界分别为1和L length 四快速排序的时间分析假设一次划分所得枢轴位置i k 则对n个记录进行快排所需时间其中Tpass n 为对n个记录进行一次划分所需时间若待排序列中记录的关键字是随机分布的则k取1至n中任意一值的可能性相同 T n Tpass n T k 1 T n k 设Tavg 1 b 则可得结果结论快速排序的时间复杂度为O nlogn 由此可得快速排序所需时间的平均值为若待排记录的初始状态为按关键字有序时快速排序将蜕化为起泡排序其时间复杂度为O n2 为避免出现这种情况需在进行一次划分之前进行予处理即先对R s key R t key和R s t 2 key 进行相互比较然后取关键字为三者之中的记录为枢轴记录 10 4堆排序简单选择排序堆排序一简单选择排序假设排序过程中待排记录序列的状态为有序序列R 1 i 1 无序序列R i n 第i趟简单选择排序从中选出关键字最小的记录有序序列R 1 i 无序序列R i 1 n 简单选择排序的算法描述如下 voidSelectSort ElemR intn 对记录序列R 1 n 作简单选择排序 for i 1 i n i 选择第i小的记录并交换到位 SelectSort j SelectMinKey R i 在R i n 中选择关键字最小的记录 if i j R i R j 与第i个记录交换时间性能分析对n个记录进行简单选择排序所需进行的关键字间的比较次数总计为移动记录的次数最小值为0 最大值为3 n 1 二堆排序堆是满足下列性质的数列 r1 r2 rn 或堆的定义 12 36 27 65 40 34 98 81 73 55 49 例如是小顶堆 12 36 27 65 40 14 98 81 73 55 49 不是堆小顶堆大顶堆 ri r2i r2i 1 若将该数列视作完全二叉树则r2i是ri的左孩子 r2i 1是ri的右孩子例如是堆 14 不堆排序即是利用堆的特性对记录序列进行排序的一种排序方法例如建大顶堆 98 81 49 73 36 27 40 55 64 12 12 81 49 73 36 27 40 55 64 98 交换98和12 重新调整为大顶堆 81 73 49 64 36 27 40 55 12 98 40 55 49 73 12 27 98 81 64 36 经过筛选 voidHeapSort HeapType H 对顺序表H进行堆排序 HeapSort for i H length 2 i 0 i HeapAdjust H r i H length 建大顶堆 for i H length i 1 i H r 1 H r i 将堆顶记录和当前未经排序子序列 H r 1 i 中最后一个记录相互交换HeapAdjust H r 1 i 1 对H r 1 进行筛选如何建堆两个问题如何筛选定义堆类型为 typedefSqListHeapType 堆采用顺序表表示之所谓筛选指的是对一棵左右子树均为堆的完全二叉树调整根结点使整个二叉树也成为一个堆堆堆筛选例如是大顶堆 12 但在98和12进行互换之后它就不是堆了因此需要对它进行筛选 98 12 81 73 64 12 98 比较比较 voidHeapAdjust RcdType R ints intm 已知R s m 中记录的关键字除R s 之外均满足堆的特征本函数自上而下调整R s 的关键字使R s m 也成为一个大顶堆 HeapAdjust rc R s 暂存R s for j 2 s j m j 2 j初值指向左孩子自上而下的筛选过程 R s rc 将调整前的堆顶记录插入到s位置 if rc key R j key break 再作根和子树根之间的比较若成立则说明已找到rc的插入位置s 不需要继续往下调整 R s R j s j 否则记录上移尚需继续往下调整 if j m 左右子树根之间先进行相互比较令j指示关键字较大记录的位置建堆是一个从下往上进行筛选的过程例如排序之前的关键字序列为 12 36 81 73 49 98 81 73 55 现在左右子树都已经调整为堆最后只要调整根结点使整个二叉树是个堆即可 98 49 40 64 36 12 27 堆排序的时间复杂度分析 1 对深度为k的堆筛选所需进行的关键字比较的次数至多为2 k 1 2 对n个关键字建成深度为h log2n 1 的堆所需进行的关键字比较的次数至多4n 3 调整堆顶 n 1次总共进行的关键字比较的次数不超过2 log2 n 1 log2 n 2 log22 2n log2n 因此堆排序的时间复杂度为O nlogn 10 5归并排序归并排序的过程基于下列基本思想进行将两个或两个以上的有序子序列归并为一个有序序列在内部排序中通常采用的是2 路归并排序即将两个位置相邻的记录有序子序列归并为一个记录的有序序列有序序列R l n 有序子序列R l m 有序子序列R m 1 n 这个操作对顺序表而言是轻而易举的 voidMerge RcdTypeSR RcdType TR inti intm intn 将有序的记录序列SR i m 和SR m 1 n 归并为有序的记录序列TR i n Merge for j m 1 k i i m if i m TR k n SR i m 将剩余的SR i m 复制到TR if j n TR k n SR j n 将剩余的SR j n 复制到TR 归并排序的算法如果记录无序序列R s t 的两部分R s s t 2 和R s t 2 1 t 分别按关键字有序则利用上述归并算法很容易将它们归并成整个记录序列是一个有序序列由此应该先分别对这两部分进行2 路归并排序例如 52 23 80 36 68 14 s 1 t 6 52 23 80 36 68 14 52 23 80 52 23 52 23 52 80 36 68 14 36 36 68 14 36 68 14 23 36 52 68 80 23 52 23 36 68 80 14 68 voidMsort RcdTypeSR RcdTypeelse Msort m s t 2 将SR s t 平分为SR s m 和SR m 1 t Msort SR TR2 s m 递归地将SR s m 归并为有序的TR2 s m Msort SR TR2 m 1 t 递归地SR m 1 t 归并为有序的TR2 m 1 t Merge TR2 TR1 s m t 将TR2 s m 和TR2 m 1 t 归并到TR1 s t voidMergeSort SqList MergeSort 容易看出对n个记录进行归并排序的时间复杂度为 nlogn 即每一趟归并的时间复杂度为O n 总共需进行 log2n 趟 10 6基数排序基数排序是一种借助多关键字排序的思想来实现单关键字排序的内部排序算法多关键字的排序链式基数排序一多关键字的排序 n个记录的序列 R1 R2 Rn 对关键字 Ki0 Ki1 Kid 1 有序是指其中 K0被称为最主位关键字 Kd 1被称为最次位关键字对于序列中任意两个记录Ri和Rj 1 i j n 都满足下列词典有序关系 Ki0 Ki1 Kid 1 Kj0 Kj1 Kjd 1 实现多关键字排序通常有两种作法最低位优先LSD法最高位优先MSD法先对K0进行排序并按K0的不同值将记录序列分成若干子序列之后分别对K1进行排序依次类推直至最后对最次位关键字排序完成为止先对Kd 1进行排序然后对Kd 2进行排序依次类推直至对最主位关键字K0排序完成为止排序过程中不需要根据前一个关键字的排序结果将记录序列分割成若干个前一个关键字不同的子序列例如学生记录含三个关键字系别班号和班内的序列号其中以系别为最主位关键字无序序列对K2排序对K1排序对K0排序 3 2 30 1 2 15 3 1 20 2 3 18 2 1 20 1 2 15 2 3 18 3 1 20 2 1 20 3 2 30 3 1 20 2 1 20 1 2 15 3 2 30 2 3 18 1 2 15 2 1 20 2 3 18 3 1 20 3 2 30 LSD的排序过程如下二链式基数排序假如多关键字的记录序列中每个关键字的取值范围相同则按LSD法进行排序时可以采用分配收集的方法其好处是不需要进行关键字间的比较对于数字型或字符型的单关键字可以看成是由多个数位或多个字符构成的多关键字此时可以采用这种分配收集的办法进行排序称作基数排序法例如对下列这组关键字 209 386 768 185 247 606 230 834 539 首先按其个位数取值分别为0 1 9 分配成10组之后按从0至9的顺序将它们收集在一起然后按其十位数取值分别为0 1 9 分配成10组之后再按从0至9的顺序将它们收集在一起最后按其百位数重复一遍上述操作在计算机上实现基数排序时为减少所需辅助存储空间应采用链表作存储结构即链式基数排序具体作法为待排序记录以指针相链构成一个链表分配时按当前关键字位所取值将记录分配到不同的链队列中每个队列中记录的关键字位相同收集时按当前关键字位取值从小到大将各队列首尾相链成一个链表对每个关键字位均重复2 和3 两步例如 p 369 367 167 239 237 138 230 139 进行第一次分配进行第一次收集 f 0 r 0 f 7 r 7 f 8 r 8 f 9 r 9 p 230 230 367 167 237 367 167 237 138 368 239 139 369 239 139 138 进行第二次分配 p 230 237 138 239 139 p 230 367 167 237 138 368 239 139 f 3 r 3 f 6 r 6 230 237 138 239 139 367 167 368 367 167 368 进行第二次收集进行第三次收集之后便得到记录的有序序列 f 1 r 1 p 230 237 138 239 139 367 167 368 进行第三次分配 f 2 r 2 f 3 r 3 138 139 167 230 237 239 367 368 p 138 139 167 230 237 239 367 368 提醒注意分配和收集的实际操作仅为修改链表中的指针和设置队列的头尾指针为查找使用该链表尚需应用算法Arrange将它调整为有序表基数排序的时间复杂度为O d n rd 其中分配为O n 收集为O rd rd为基 d为分配收集的趟数 10 7各种排序方法的综合比较一时间性能 1 平均的时间性能基数排序时间复杂度为O nlogn 快速排序堆排序和归并排序时间复杂度为O n2 直接插入排序起泡排序和简单选择排序时间复杂度为O n 2 当待排记录序列按关键字顺序有序时 3 简单选择排序堆排序和归并排序的时间性能不随记录序列中关键字的分布而改变直接插入排序和起泡排序能达到O n 的时间复杂度快速排序的时间性能蜕化为O n2 二空间性能指的是排序过程中所需的辅助空间大小 1 所有的简单排序方法包括直接插入起泡和简单选择和堆排序的空间复杂度为O 1 2 快速排序为O logn 为递归程序执行过程中栈所需的辅助空间 3 归并排序所需辅助空间最多其空间复杂度为O n 4 链式基数排序需附设队列首尾指针则空间复杂度为O rd 三排序方法的稳定性能 1 稳定的排序方法指的是对于两个关键字相等的记录它们在序列中的相对位置在排序之前和经过排序之后没有改变 2 当对多关键字的记录序列进行LSD方法排序时必须采用稳定的排序方法排序之前 Ri K Rj K 排序之后 Ri K Rj K 例如排序前 56 34 47 23 66 18 82 47 若排序后得到结果 18 23 34 47 47 56 66 82 则称该排序方法是稳定的若排序后得到结果 18 23 34 47 47 56 66 82 则称该排序方法是不稳定的 2 对于不稳定的排序方法只要能举出一个实例说明即可 3 快速排序堆排序和希尔排序是不稳定的排序方法例如对 4 3 4 2 进行快速排序得到 2 3 4 4 四关于排序方法的时间复杂度的下限本章讨论的各种排序方法除基数排序外其它方法都是基于比较关键字进行排序的排序方法可以证明这类排序法可能达到的最快的时间复杂度为O nlogn 基数排序不是基于比较关键字的排序方法所以它不受这个限制例如对三个关键字进行排序的判定树如下树上的每一次比较都是必要的树上的叶子结点包含所有可能情况一般情况下对n个关键字进行排序可能得到的结果有n 种由于含n 个叶子结点的二叉树的深度不小于 log2 n 1 则对n个关键字进行排序的比较次数至少是 log2 n nlog2n 斯蒂林近似公式所以基于比较关键字进行排序的排序方法可能达到的最快的时间

人人文库> 全部分类> 应用文书 > 技术指导

温馨提示

1. 本站所有资源如无特殊说明，都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2. 本站的文档不包含任何第三方提供的附件图纸等，如果需要附件，请联系上传者。文件的所有权益归上传用户所有。
3. 本站RAR压缩包中若带图纸，网页内容里面会有图纸预览，若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 人人文库网仅提供信息存储空间，仅对用户上传内容的表现方式做保护处理，对用户上传分享的文档内容本身不做任何修改或编辑，并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容，请与我们联系，我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

数据结构chap10.ppt

文档简介

温馨提示

最新文档

评论

数据结构chap10.ppt

文档简介

温馨提示

最新文档

评论

相关文档