数据结构查找.ppt

上传人：y*** IP属地：广东上传时间：2020-01-13 格式：PPT 页数：54 大小：4.06MB 积分：30 举报 版权申诉

已阅读5页，还剩49页未读，继续免费阅读

版权说明：本文档由用户提供并上传，收益归属内容提供方，若内容存在侵权，请进行举报或认领

文档简介

数据结构课程的内容 9 1基本概念9 2静态查找表9 3动态查找表9 4哈希表第9章查找教材第8 11和12章省略因操作系统课程会涉及 9 1基本概念若表中存在特定元素称查找成功应输出该记录否则称查找不成功也应输出失败标志或失败位置查找表查找查找成功查找不成功静态查找动态查找关键字主关键字次关键字由同一类型的数据元素或记录构成的集合查询 Searching 特定元素是否在表中只查找不改变集合内的数据元素既查找又改变增减集合内的数据元素记录中某个数据项的值可用来识别一个记录预先确定的记录的某种标志可以唯一标识一个记录的关键字例如学号例如女是一种数据结构识别若干记录的关键字 2 对查找表常用的操作有哪些查询某个特定的数据元素是否在表中查询某个特定的数据元素的各种属性在查找表中插入一元素从查找表中删除一元素 3 有哪些查找方法查找方法取决于表中数据的排列方式讨论 1 查找的过程是怎样的给定一个值K 在含有n个记录的文件中进行搜索寻找一个关键字值等于K的记录如找到则输出该记录否则输出查找不成功的信息例如查字典针对静态查找表和动态查找表的查找方法也有所不同特定的关键字 4 如何评估查找方法的优劣明确查找的过程就是将给定的K值与文件中各记录的关键字项进行比较的过程所以用比较次数的平均值来评估算法的优劣称为平均查找长度 ASL averagesearchlength 其中 n是文件记录个数 Pi是查找第i个记录的查找概率通常取等概率即Pi 1 n Ci是找到第i个记录时所经历的比较次数统计意义上的数学期望值物理意义假设每一元素被查找的概率相同则查找每一元素所需的比较次数之总和再取平均即为ASL 显然 ASL值越小时间效率越高针对静态查找表的查找算法主要有 9 2静态查找表静态查找表的抽象数据类型参见教材P216 一顺序查找线性查找二折半查找二分或对分查找三静态树表的查找四分块查找索引顺序查找一顺序查找 Linearsearch 又称线性查找 1 顺序表的机内存储结构 typedefstruct ElemType elem 表基址 0号单元留空表容量为全部元素intlength 表长即表中数据元素个数 SSTable 顺序查找即用逐一比较的办法顺序查找关键字这显然是最直接的办法对顺序结构如何线性查找见下页之例或教材P216 对单链表结构如何线性查找函数虽未给出但也很容易编写只要知道头指针head就可以顺藤摸瓜对非线性树结构如何顺序查找可借助各种遍历操作 2 算法的实现技巧把待查关键字key存入表头或表尾俗称哨兵这样可以加快执行速度例若将待查找的特定值key存入顺序表的首部如0号单元则顺序查找的实现方案为从后向前逐个比较 intSearch Seq SSTableST KeyTypekey 在顺序表ST中查找关键字与key相同的元素若成功返回其位置信息否则返回0ST elem 0 key key 设立哨兵可免去查找过程中每一步都要检测是否查找完毕当n 1000时查找时间将减少一半 for i ST length ST elem i key key i 不要用for i n i 0 i 或for i 1 i n i returni 若到达0号单元才结束循环说明不成功返回0值 i 0 成功时则返回找到的那个元素的位置i Search Seq 返回特殊标志例如返回空记录或空指针前例中设立了哨兵就是将关键字送入末地址ST elem 0 key使之结束并返回i 0 讨论查找效率怎样计算用平均查找长度ASL衡量讨论查不到怎么办讨论如何计算ASL 分析查找第1个元素所需的比较次数为1 查找第2个元素所需的比较次数为2 查找第n个元素所需的比较次数为n 总计全部比较次数为 1 2 n 1 n n 2 未考虑查找不成功的情况查找哨兵所需的比较次数为n 1 这是查找成功的情况若求某一个元素的平均查找次数还应当除以n 等概率即 ASL 1 n 2 时间效率为O n 二折半查找又称二分查找或对分查找优点算法简单且对顺序结构或链表结构均适用缺点 ASL太长时间效率太低这是一种容易想到的查找方法先给数据排序例如按升序排好形成有序表然后再将key与正中元素相比若key小则缩小至右半部内查找再取其中值比较每次缩小1 2的范围直到查找成功或失败为止对顺序表结构如何编程实现折半查找算法见下页之例或见教材 P219 对单链表结构如何折半查找无法实现因全部元素的定位只能从头指针head开始对非线性树结构如何折半查找可借助二叉排序树来查找属动态查找表形式如何改进讨论顺序查找的特点运算步骤 1 low 1 high 11 mid 6 待查范围是 1 11 2 若ST elem mid keykey 说明key low mid 1 则令 high mid 1 重算mid 4 若ST elem mid key key 说明查找成功元素序号 mid 结束条件 1 查找成功 ST elem mid key key 2 查找不成功 high low 意即区间长度小于0 解先设定3个辅助标志 low high mid 折半查找举例 Low指向待查元素所在区间的下界 high指向待查元素所在区间的上界 mid指向待查元素所在区间的中间位置已知如下11个元素的有序表 0513192137566475808892 请查找关键字为21和85的数据元素显然有 mid low high 2 讨论若关键字不在表中怎样得知和停止典型标志是当查找范围的上界下界时停止查找讨论二分查找的效率 ASL 1次比较就查找成功的元素有1个 20 即中间值 2次比较就查找成功的元素有2个 21 即1 4处或3 4 处 3次比较就查找成功的元素有4个 22 即1 8处或3 8 处 4次比较就查找成功的元素有8个 23 即1 16处或3 16 处则第m次比较时查找成功的元素会有 2m 1 个为方便起见假设表中全部n个元素 2m 1个此时就不讨论第m次比较后还有剩余元素的情况了全部比较总次数为1 20 2 21 3 22 4 23 m 2m 1 推导过程三分块查找索引顺序查找这是一种顺序查找的另一种改进方法先让数据分块有序即分成若干子表要求每个子表中的数值用关键字更准确都比后一块中数值小但子表内部未必有序然后将各子表中的最大关键字构成一个索引表表中还要包含每个子表的起始地址即头指针索引表最大关键字起始地址第1块第2块第3块 22 48 86 例特点块间有序块内无序查找步骤分两步进行对索引表使用折半查找法因为索引表是有序表确定了待查关键字所在的子表后在子表内采用顺序查找法因为各子表内部是无序表查找效率 ASL Lb Lw 对索引表查找的ASL 对块内查找的ASL S为每块内部的记录个数 n s即块的数目例如当n 9 s 3时 ASLbs 3 5 而折半法为3 1 顺序法为5 特点一二叉排序树的定义二二叉排序树的插入与删除三二叉排序树的查找分析四平衡二叉树 9 3动态查找表表结构在查找过程中动态生成要求对于给定值key 若表中存在其关键字等于key的记录则查找成功返回否则插入关键字等于key的记录典型的动态表二叉排序树一二叉排序树的定义练下列2种图形中哪个不是二叉排序树或是一棵空树或者是具有如下性质的非空二叉树 1 左子树的所有结点均小于根的值 2 右子树的所有结点均大于根的值 3 它的左右子树也分别为二叉排序树讨论对 a 中序遍历后的结果是什么二二叉排序树的查找插入与删除将数据元素构造成二叉排序树的优点查找过程与顺序结构有序表中的折半查找相似查找效率高中序遍历此二叉树将会得到一个关键字的有序序列即实现了排序运算一个无序序列可以通过构造一棵二叉排序树而变成一个有序序列构造树的过程即为对无序序列进行排序的过程如果查找不成功能够方便地将被查元素插入到二叉树的叶子结点上而且插入或删除时只需修改指针而不需移动元素注若数据元素的输入顺序不同则得到的二叉排序树形态也不同这种既查找又插入的过程称为动态查找二叉排序树既有类似于折半查找的特性又采用了链表存储它是动态查找表的一种适宜表示 45 如果待查找的关键字序列输入顺序为 24 53 45 45 12 24 90 24 讨论1 二叉排序树的插入和查找操作则生成二叉排序树的过程为例输入待查找的关键字序列 45 24 53 45 12 24 90 则生成的二叉排序树形态不同二叉排序树的查找插入算法如何实现查找算法参见教材P228算法9 5 a 插入算法参见教材P228算法9 5 b 9 6 一种二合一的算法如下 BiTreeSearchBST BiTreeT KeyTypekey 若查找成功则返回指向该数据元素结点的指针否则返回空指针if T EQ key T data key return T 查找结束elseifLT key T data key 在左子树中继续查找return SearchBST T lchild key elsereturn SearchBST T rchild key 在右子树中继续查找 SearchBST StatusSearchBST BiTreeT KeyTypekey BiTreef BiTree 在右子树中继续查找 SearchBST StatusInsertBST BiTree T ElemTypee if SearchBST T e key NULL p 查找不成功 s BiTree malloc sizeof BiTNode s data e s lchild s rchild NULL 建立新结点if p T s T为空树elseifLT e key p data key p lchild s 被插结点 s为左孩子elsep rchild s 被插结点 s为右孩子returnTRUE elsereturnFALSE 树中已有关键字相同的结点不再插入 InsertBST 对于二叉排序树删除树上一个结点相当于删除有序序列中的一个记录删除后仍需保持二叉排序树的特性对链表进行删除操作是很方便的讨论2 二叉排序树的删除操作如何删除一个结点假设 p表示被删结点的指针 PL和PR分别表示 P的左右孩子指针 f表示 p的双亲结点指针并假定 p是 f的左孩子则可能有三种情况 PR为 S的右子树 SL为Q S的双亲结点右孩子 p为叶子删除此结点时直接修改 f指针域即可 p只有一棵子树或左或右令PL或PR为 f的左孩子即可 p有两棵子树情况最复杂 p有两棵子树时如何进行删除操作分析设删除前的中序遍历序列为 spPR 显然p的直接前驱是s希望删除p后其它元素的相对位置不变有两种解决方法法1 令 p的左子树为 f的左子树 p的右子树为 s的右子树即FL PL FR PR 法2 令 s代替 p s为 p左子树最右下的叶子见课本P230图9 9 法2 法1 例请从下面的二叉排序树中删除结点P S 四平衡二叉树平衡二叉树又称AVL树它是具有如下性质的二叉树为了方便起见给每个结点附加一个数字给出该结点左子树与右子树的高度差这个数字称为结点的平衡因子balance 这样可以得到AVL树的其它性质即左子树深度右子树深度 1 左右子树是平衡二叉树所有结点的左右子树深度之差的绝对值 1 a 平衡树 b 不平衡树例判断下列二叉树是否AVL树任一结点的平衡因子只能取 1 0或1 如果树中任意一个结点的平衡因子的绝对值大于1 则这棵二叉树就失去平衡不再是AVL树对于一棵有n个结点的AVL树其高度保持在O log2n 数量级 ASL也保持在O log2n 量级 1 1 1 1 2 1 1 如果在一棵AVL树中插入一个新结点就有可能造成失衡此时必须重新调整树的结构使之恢复平衡我们称调整平衡过程为平衡旋转现分别介绍这四种平衡旋转平衡旋转可以归纳为四类 LL平衡旋转RR平衡旋转LR平衡旋转RL平衡旋转若在A的左子树的左子树上插入结点使A的平衡因子从1增加至2 需要进行一次顺时针旋转以B为旋转轴 1 LL平衡旋转若在A的右子树的右子树上插入结点使A的平衡因子从 1增加至 2 需要进行一次逆时针旋转以B为旋转轴 2 RR平衡旋转若在A的左子树的右子树上插入结点使A的平衡因子从1增加至2 需要先进行逆时针旋转再顺时针旋转以插入的结点C为旋转轴 3 LR平衡旋转若在A的右子树的左子树上插入结点使A的平衡因子从 1增加至 2 需要先进行顺时针旋转再逆时针旋转以插入的结点C为旋转轴 4 RL平衡旋转例请将下面序列构成一棵平衡二叉排序树 13 24 37 90 53 013 113 124 213 需要RR平衡旋转绕B逆转 B为根 124 137 190 237 需要RL平衡旋转绕C先顺后逆 9 4哈希查找表一哈希表的概念二哈希函数的构造方法三冲突处理方法四哈希表的查找及分析一哈希表的概念哈希表即散列存储结构散列法存储的基本思想建立关键码字与其存储位置的对应关系或者说由关键码的值决定数据的存储地址优点查找速度极快 O 1 查找效率与元素个数n无关例1 若将学生信息按如下方式存入计算机如将2001011810201的所有信息存入V 01 单元将2001011810202的所有信息存入V 02 单元将2001011810231的所有信息存入V 31 单元欲查找学号为2001011810216的信息便可直接访问V 16 例2 有数据元素序列 14 23 39 9 25 11 若规定每个元素k的存储地址H k k 请画出存储结构图注 H k k称为散列函数解根据散列函数H k k 可知元素14应当存入地址为14的单元元素23应当存入地址为23的单元对应散列存储表哈希表如下讨论如何进行散列查找根据存储时用到的散列函数H k 表达式迅即可查到结果例如查找key 9 则访问H 9 9号地址若内容为9则成功若查不到应当设法返回一个特殊值例如空指针或空记录 14 11 9 23 25 39 缺点空间效率低选取某个函数依该函数按关键字计算元素的存储位置并按此存放查找时由同一个函数对给定值k计算地址将k与地址单元中元素关键码进行比确定查找是否成功通常关键码的集合比哈希地址集合大得多因而经过哈希函数变换后可能将不同的关键码映射到同一个哈希地址上这种现象称为冲突若干术语哈希方法杂凑法哈希函数杂凑函数哈希表杂凑表冲突哈希方法中使用的转换函数称为哈希函数杂凑函数按上述思想构造的表称为哈希表杂凑表有6个元素的关键码分别为 14 23 39 9 25 11 选取关键码与元素位置间的函数为H k kmod7 通过哈希函数对6个元素建立哈希表 25 39 23 9 14 冲突现象举例 6个元素用7个地址应该足够 H 14 14 7 0 11 H 25 25 7 4H 11 11 7 4 有冲突所以哈希方法必须解决以下两个问题 1 构造好的哈希函数 a 所选函数尽可能简单以便提高转换速度 b 所选函数对关键码计算出的地址应在哈希地址集中大致均匀分布以减少空间浪费 2 制定一个好的解决冲突的方案查找时如果从哈希函数计算出的地址中查不到关键码则应当依据解决冲突的规则有规律地查询其它相关单元在哈希查找方法中冲突是不可能避免的只能尽可能减少二哈希函数的构造方法常用的哈希函数构造方法有直接定址法除留余数法数字分析法平方取中法折叠法随机数法要求一 n个数据原仅占用n个地址虽然散列查找是以空间换时间但仍希望散列的地址空间尽量小要求二无论用什么方法存储目的都是尽量均匀地存放元素以避免冲突 Hash key a key b a b为常数优点以关键码key的某个线性函数值为哈希地址不会产生冲突缺点要占用连续地址空间空间效率低例关键码集合为 100 300 500 700 800 900 选取哈希函数为Hash key key 100 则存储结构哈希表如下 1 直接定址法 Hash key keymodp p是一个整数特点以关键码除以p的余数作为哈希地址关键如何选取合适的p 技巧若设计的哈希表长为m 则一般取p m且为质数也可以是不包含小于20质因子的合数自练自测卷简答题第4小题 2 除留余数法特点某关键字的某几位组合成哈希地址所选的位应当是各种符号在该位上出现的频率大致相同 34705243491487348269634852703486305349805834796713473919 例有一组例如80个关键码其样式如下 3 数字分析法讨论第1 2位均是 3和4 第3位也只有 7 8 9 因此这几位不能用余下四位分布较均匀可作为哈希地址选用位号若哈希地址取两位因元素仅80个则可取这四位中的任意两位组合成哈希地址也可以取其中两位与其它两位叠加求和后取低两位作哈希地址特点对关键码平方后按哈希表大小取中间的若干位作为哈希地址理由因为中间几位与数据的每一位都相关例 2589的平方值为6702921 可以取中间的029为地址 5 折叠法特点将关键码自左到右分成位数相等的几部分最后一部分位数可以短些然后将这几部分叠加求和并按哈希表表长取后几位作为哈希地址适用于每一位上各符号出现概率大致相同的情况法1 移位法将各部分的最后一位对齐相加法2 间界叠加法从一端向另一端沿分割界来回折叠后最后一位对齐相加例元素42751896 用法1 427 518 96 1041用法2 42751896 724 518 69 1311 4 平方取中法 6 随机数法 Hash key random key random为随机函数适用于关键字长度不等的情况造表和查找都很方便执行速度即计算哈希函数所需时间关键字的长度哈希表的大小关键字的分布情况查找频率小结构造哈希函数的原则三冲突处理方法常见的冲突处理方法有开放定址法开地址法链地址法拉链法再哈希法双哈希函数法建立一个公共溢出区 1 开放定址法开地址法设计思路有冲突时就去寻找下一个空的哈希地址只要哈希表足够大空的哈希地址总能找到并将数据元素存入具体实现 Hi Hash key di modm 1 i m 其中 Hash key 为哈希函数m为哈希表长度di为增量序列1 2 m 1 且di i 1 线性探测法含义一旦冲突就找附近下一个空地址存入关键码集为 47 7 29 11 16 92 22 8 3 设哈希表表长为m 11 哈希函数为Hash key keymod11 拟用线性探测法处理冲突建哈希表如下解释 47 7 以及11 16 92 均是由哈希函数得到的没有冲突的哈希地址 012345678910 例 29 22 8 3 Hash 29 7 哈希地址有冲突需寻找下一个空的哈希地址由H1 Hash 29 1 mod11 8 哈希地址8为空因此将29存入另外 22 8 3同样在哈希地址上有冲突也是由H1找到空的哈希地址的其中3还连续移动了两次二次聚集线性探测法的优点只要哈希表未被填满保证能找到一

人人文库> 全部分类> 教育资料 > 课件下载

温馨提示

1. 本站所有资源如无特殊说明，都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2. 本站的文档不包含任何第三方提供的附件图纸等，如果需要附件，请联系上传者。文件的所有权益归上传用户所有。
3. 本站RAR压缩包中若带图纸，网页内容里面会有图纸预览，若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 人人文库网仅提供信息存储空间，仅对用户上传内容的表现方式做保护处理，对用户上传分享的文档内容本身不做任何修改或编辑，并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容，请与我们联系，我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

数据结构查找.ppt

文档简介

温馨提示

最新文档

评论

数据结构查找.ppt

文档简介

温馨提示

最新文档

评论

相关文档