第9章查找48695

上传人：m*** IP属地：河南上传时间：2020-04-06 格式：PPT 页数：114 大小：1.46MB 积分：15 举报 版权申诉

已阅读5页，还剩109页未读，继续免费阅读

版权说明：本文档由用户提供并上传，收益归属内容提供方，若内容存在侵权，请进行举报或认领

文档简介

第九章查找何谓查找表查找表是由同一类型的数据元素或记录构成的集合由于集合中的数据元素之间存在着松散的关系因此查找表是一种应用灵便的结构对查找表经常进行的操作 1 查询某个特定的数据元素是否在查找表中 2 检索某个特定的数据元素的各种属性 3 在查找表中插入一个数据元素 4 从查找表中删去某个数据元素仅作查询和检索操作的查找表静态查找表有时在查询之后还需要将查询结果为不在查找表中的数据元素插入到查找表中或者从查找表中删除其查询结果为在查找表中的数据元素动态查找表查找表可分为两类根据给定的某个值在查找表中确定一个其关键字等于给定值的数据元素或记录查找若查找表中存在这样一个记录则称查找成功查找结果给出整个记录的信息或指示该记录在查找表中的位置否则称查找不成功查找结果给出空记录或空指针是数据元素或记录中某个数据项的值用以标识识别一个数据元素或记录关键字若此关键字可以识别唯一的一个记录则称之谓主关键字若此关键字能识别若干记录则称之谓次关键字用集合表示查找表数据元素之间的关系不作限定查询时无规律可循只能对集合中的元素一一加以辨认用其它结构表示查找表对查找表的元素人为地附加上某种关系问题如何进行查找查找方法取决于查找表的结构有序表字典索引表电话号码表散列表树表效率低效率高 9 1静态查找表 9 2动态查找树表 9 3哈希表 9 1静态查找表静态查找表的存储结构顺序表线性链表存储结构不同实现查找操作的方法则不同顺序查找 typedefstruct 数据元素存储空间基址建表时按实际长度分配 0号单元留空intlength 表的长度 SSTable 假设静态查找表的顺序存储结构为 ElemType elem 数据元素类型的定义为 typedefstruct keyTypekey 关键字域其它属性域 ElemType TElemType 一顺序查找表二有序查找表三索引顺序表以顺序表或线性链表表示静态查找表一顺序查找表 ST elem 回顾顺序表的查找过程假设给定值e 64 要求ST elem k e 问 k k k intlocation SqListL ElemType location ST elem i ST elem i 60 i key 64 key 60 i 64 elsereturn0 intSearch Seq SSTableL KeyTypekey ST elem 0 key key for i ST length ST elem i key key i if i 0 break if i 0 returni 查找方法评价时间复杂度空间复杂度算法本身复杂程度因为查找算法的基本操作为将记录的关键字同给定值比较所以以关键字同给定值进行过比较的记录的个数的期望值作为衡量查找算法好坏的依据平均查找长度ASL AverageSearchLength 找到第i个记录需比较的次数对含有n个记录的表查找成功时第i个记录被查找的概率 1110987654321 顺序查找的平均查找长度 ASL nP1 n 1 P2 2Pn 1 Pn 假设每个记录的查找概率相等 Pi 1 n则查找不成功时关键字的比较次数总是n 1次 121110987654321 假设 1 查找成功与不成功的概率相同 2 每个记录被查找的概率相同则平均查找长度成功与不成功的平均查找长度之和为 1 记录的查找概率不相等时如何提高查找效率查找表存储记录原则 1 查找概率越高比较次数越少 2 查找概率越低比较次数较多讨论 2 记录的查找概率无法测定时如何提高查找效率方法 1 在每个记录中设一个访问频度域 2 始终保持记录按非递增有序的次序排列 3 每次查找后均将刚查到的记录直接移至表头上述顺序查找表的查找算法简单但平均查找长度较大特别不适用于表长较大的查找表二有序查找表若以有序表表示静态查找表则查找过程可以基于折半进行 ST elem ST length 例如 key 64的查找过程如下 low high mid low mid high mid low指示查找区间的下界high指示查找区间的上界mid low high 2 intSearch Bin SSTableST KeyTypekey low 1 high ST length 置区间初值while low high mid low high 2 if EQ key ST elem mid key returnmid 找到待查元素elseif LT key ST elem mid key high mid 1 继续在前半区间进行查找elselow mid 1 继续在后半区间进行查找 return0 顺序表中不存在待查元素 Search Bin 性能分析 1 2 2 3 3 3 3 4 4 4 4 Ci i 判定树表中一个记录比较次数路径上的结点数比较次数结点4的层数比较次数树的深度 log2n 1 查找成功查找不成功比较次数路径上的内部结点数比较次数 log2n 1 1 3 4 6 7 9 10 1 2 2 3 4 5 5 6 7 8 8 9 10 11 11 平均查找长度ASL 成功时设表长n 2h 1 则h log2 n 1 此时判定树为深度 h的满二叉树且表中每个记录的查找概率相等 Pi 1 n 第j层的每个结点要比较的次数第j层结点数第j层要比较的总次数折半查找优点效率比顺序查找高折半查找缺点只适用于有序表且限于顺序存储结构三索引查找当数据对象个数n很大时如果用无序表形式的静态查找结构存储采用顺序查找则查找效率极低如果采用有序表存储形式的静态查找结构则插入新记录进行排序时间开销也很可观这时可采用索引方法来实现存储和查找查38 索引顺序表的查找分块查找条件 1 将表分成几块且表或者有序或者分块有序索引表查找过程先确定待查记录所在块顺序或折半查找再在块内查找顺序查找若i j 则第j块中所有记录的关键字均大于第i块中的最大关键字 2 建立索引表每个结点含有最大关键字域和指向本块第一个结点的指针且按关键字有序索引顺序表的查找过程 1 由索引确定记录所在区间 2 在顺序表的某个区间内进行查找注意索引可以根据查找表的特点来构造可见索引顺序查找的过程也是一个缩小区间的查找过程性能分析平均查找长度 ASLbs Lb Lw 在块中查找元素的平均查找长度在索引表中查找所在块的平均查找长度若将长度为n的表均分成b块每块含s个记录 b n s 并设表中每个记录的查找概率相等则每块查找的概率为1 b 块中每个记录的查找概率为1 s 1 用顺序查找确定所在块 2 用折半查找确定所在块查找方法比较 9 2动态查找树表 n 1 n nlogn 综合上一节讨论的几种查找表的特性查找插入删除无序顺序表无序线性链表有序顺序表静态查找树表 n n logn logn 1 1 n nlogn 1 从查找性能看最好情况能达 logn 此时要求表有序 2 从插入和删除的性能看最好情况能达 1 此时要求存储结构是链表可得如下结论动态查找表特点表结构本身是在查找过程中动态生成的即对于给定值key 若表中存在关键字等于key的记录则查找成功返回否则插入关键字等于key的记录一二叉排序树二叉查找树 1 定义 2 查找算法 3 插入算法 4 删除算法 5 查找性能的分析 1 若它的左子树不空则左子树上所有结点的值均小于根结点的值 1 定义二叉排序树或者是一棵空树或者是具有如下特性的二叉树 3 它的左右子树也都分别是二叉排序树 2 若它的右子树不空则右子树上所有结点的值均大于根结点的值 50 30 80 20 90 10 85 40 35 25 23 88 例如是二叉排序树 66 不通常取二叉链表作为二叉排序树的存储结构 typedefstructBiTNode 结点结构structBiTNode lchild rchild 左右孩子指针 BiTNode BiTree TElemTypedata 2 二叉排序树的查找算法 1 若给定值等于根结点的关键字则查找成功 2 若给定值小于根结点的关键字则继续在左子树上进行查找 3 若给定值大于根结点的关键字则继续在右子树上进行查找否则若二叉排序树为空则查找不成功 50 30 80 20 90 85 40 35 88 32 例如二叉排序树查找关键字 50 50 50 35 50 30 40 35 50 90 50 80 90 95 从上述查找过程可见在查找过程中生成了一条查找路径从根结点出发沿着左分支或右分支逐层向下直至关键字等于给定值的结点或者从根结点出发沿着左分支或右分支逐层向下直至指针指向空树为止查找成功查找不成功算法描述如下 StatusSearchBST BiTreeT KeyTypekey BiTreef BiTree SearchBST 否则表明查找不成功返回指针p指向查找路径上访问的最后一个结点并返回函数值为FALSE 指针f指向当前访问的结点的双亲其初始调用值为NULL if T elseif EQ key T data key elseif LT key T data key else p f returnFALSE 查找不成功 p T returnTRUE 查找成功 SearchBST T lchild key T p 在左子树中继续查找 SearchBST T rchild key T p 在右子树中继续查找 30 20 10 40 35 25 23 f T 设key 48 f T f T 22 p f T f T T T T f f f p 根据动态查找表的定义插入操作在查找不成功时才进行 3 二叉排序树的插入算法若二叉排序树为空树则新插入的结点为新的根结点否则新插入的结点必为一个新的叶子结点其插入位置由查找过程得到 StatusInsertBST BiTree InsertBST s BiTree malloc sizeof BiTNode 为新结点分配空间s data e s lchild s rchild NULL if p T s 插入s为新的根结点 elseif LT e key p data key p lchild s 插入 s为 p的左孩子elsep rchild s 插入 s为 p的右孩子 returnTRUE 插入成功输入数据建立二叉搜索树的过程输入数据 53 78 65 17 87 09 81 15 53 53 78 53 78 65 1 被删除的结点是叶子 2 被删除的结点只有左子树或者只有右子树 3 被删除的结点既有左子树也有右子树 4 二叉排序树的删除算法可分三种情况讨论和插入相反删除在查找成功之后进行并且要求在删除二叉排序树上某个结点之后仍然保持二叉排序树的特性 50 30 80 20 90 85 40 35 88 32 1 被删除的结点是叶子结点例如被删关键字 20 88 其双亲结点中相应指针域的值改为空 50 30 80 20 90 85 40 35 88 32 2 被删除的结点只有左子树或者只有右子树其双亲结点的相应指针域的值改为指向被删除结点的左子树或右子树被删关键字 40 80 50 30 80 20 90 85 40 35 88 32 3 被删除的结点既有左子树也有右子树 40 40 以其前驱替代之然后再删除该前驱结点被删结点前驱结点被删关键字 50 StatusDeleteBST BiTree 不存在关键字等于key的数据元素else DeleteBST 算法描述如下 if EQ key T data key 找到关键字等于key的数据元素elseif LT key T data key else Delete T returnTRUE DeleteBST T lchild key 继续在左子树中进行查找 DeleteBST T rchild key 继续在右子树中进行查找 voidDelete BiTree p 从二叉排序树中删除结点p 并重接它的左子树或右子树if p rchild elseif p lchild else Delete 其中删除操作过程如下所描述右子树为空树则只需重接它的左子树 q p p p lchild free q p p 左子树为空树只需重接它的右子树 q p p p rchild free q p p q p s p lchild while s rchild q s s s rchild s指向被删结点的前驱左右子树均不空 p data s data if q p q rchild s lchild elseq lchild s lchild 重接 q的左子树free s p q s 5 查找性能的分析对于每一棵特定的二叉排序树均可按照平均查找长度的定义来求它的ASL值显然由值相同的n个关键字构造所得的不同形态的各棵二叉排序树的平均查找长度的值不同甚至可能差别很大由关键字序列3 1 2 5 4构造而得的二叉排序树由关键字序列1 2 3 4 5构造而得的二叉排序树例如 2 1 3 4 5 3 5 4 1 2 ASL 1 2 3 4 5 5 3 ASL 1 2 3 2 3 5 2 2 下面讨论平均情况不失一般性假设长度为n的序列中有k个关键字小于第一个关键字则必有n k 1个关键字大于第一个关键字由它构造的二叉排序树 n k 1 k 的平均查找长度是n和k的函数 P n k 0 k n 1 假设n个关键字可能出现的n 种排列的可能性相同则含n个关键字的二叉排序树的平均查找长度在等概率查找的情况下由此可类似于解差分方程此递归方程有解一哈希表是什么二哈希函数的构造方法三处理冲突的方法四哈希表的查找 9 3哈希表以上两节讨论的表示查找表的各种结构的共同特点记录在表中的位置和它的关键字之间不存在一个确定的关系一哈希表是什么查找的过程为给定值依次和关键字集合中各个关键字进行比较查找的效率取决于和给定值进行比较的关键字个数用这类方法表示的查找表其平均查找长度都不为零不同的表示方法其差别仅在于关键字和给定值进行比较的顺序不同只有一个办法预先知道所查关键字在表中的位置对于频繁使用的查找表希望ASL 0 即要求记录在表中位置和其关键字之间存在一种确定的关系若以下标为000 999的顺序表表示之例如为每年招收的1000名新生建立一张查找表其关键字为学号其值的范围为xx000 xx999 前两位为年份则查找过程可以简单进行取给定值学号的后三位不需要经过比较便可直接从顺序表中找到待查关键字但是对于动态查找表而言因此在一般情况下需在关键字与记录在表中的存储位置之间建立一个函数关系以f key 作为关键字为key的记录在表中的位置通常称这个函数f key 为哈希函数 1 表长不确定 2 在设计查找表时只知道关键字所属范围而不知道确切的关键字 Zhao Qian Sun Li Wu Chen Han Ye Dei 例如对于如下9个关键字设哈希函数f key Ord 第一个字母 Ord A 1 2 Chen Zhao Qian Sun Li Wu Han Ye Dei 问题若添加关键字Zhou 怎么办能否找到另一个哈希函数 1 哈希函数是一个映象即将关键字的集合映射到某个地址集合上它的设置很灵活只要这个地址集合的大小不超出允许范围即可从这个例子可见 2 由于哈希函数是一个压缩映象因此在一般情况下很容易产生冲突现象即 key1 key2 而f key1 f key2 3 很难找到一个不产生冲突的哈希函数一般情况下只能选择恰当的哈希函数使冲突尽可能少地产生因此在构造这种特殊的查找表时除了需要选择一个好尽可能少产生冲突的哈希函数之外还需要找到一种处理冲突的方法哈希表的定义根据设定的哈希函数H key 和所选中的处理冲突的方法将一组关键字映象到一个有限的地址连续的地址集区间上并以关键字在地址集中的象作为相应记录在表中的存储位置如此构造所得的查找表称之为哈希表二构造哈希函数的方法对数字的关键字可有下列构造方法若是非数字关键字则需先对其进行数字化处理 1 直接定址法 3 平方取中法 5 除留余数法 4 折叠法 6 随机数法 2 数字分析法哈希函数为关键字的线性函数H key key或者H key a key b 1 直接定址法此法仅适合于地址集合的大小关键字集合的大小例有一组关键码如下 942148 941269 940527 941630 941805 941558 942047 940001 散列函数为h K K 940000h 942148 2148h 941269 1269h 940527 527h 941630 1630h 941805 1805h 941558 1558h 942047 2047h 940001 1可以按计算出的地址存放记录此方法仅适合于能预先估计出全体关键字的每一位上各种数字出现的频度 2 数字分析法假设关键字集合中的每个关键字都是由s位数字组成 u1 u2 us 分析关键字集中的全体并从中提取分布均匀的若干位或它们的组合作为地址 34705243491487348269634852703486305349805834796713473919 例有一组例如80个关键码其样式如下讨论第1 2位均是 3和4 第3位也只有 7 8 9 因此这几位不能用余下四位分布较均匀可作为哈希地址选用若哈希地址取两位因元素仅80个则可取这四位中的任意两位组合成哈希地址也可以取其中两位与其它两位叠加求和后取低两位作哈希地址以关键字的平方值的中间几位作为存储地址求关键字的平方值的目的是扩大差别同时平方值的中间各位又能受到整个关键字中各位的影响 3 平方取中法此方法适合于关键字中的每一位都有某些数字重复出现频度很高的现象例 2589的平方值为6702921 可以取中间的029为地址将关键字分割成若干部分然后取它们的叠加和为哈希地址有两种叠加处理的方法移位叠加和间界叠加 4 折叠法此方法适合于关键字的数字位数特别多法1 移位法将各部分的最后一位对齐相加法2 间界叠加法从一端向另一端沿分割界来回折叠后最后一位对齐相加例元素42751896 用法1 427 518 96 1041用法2 42751896 724 518 69 1311 5 除留余数法设定哈希函数为 H key keyMODp其中 p m 表长并且p应为不大于m的素数或是不含20以下的质因子给定一组关键字为 12 39 18 24 33 21 若取p 9 则他们对应的哈希函数值将为 3 3 0 6 6 3 例如为什么要对p加限制可见若p中含质因子3 则所有含质因子3的关键字均映射到 3的倍数的地址上从而增加了冲突的可能 H 例有一线性表A 18 75 60 43 54 90 46 哈希函数为 h K K p 取m 13 p 13 h 18 18 13 5h 75 75 13 10h 60 60 13 8h 43 43 13 4h 54 54 13 2h 90 90 13 12h 46 46 13 7 6 随机数法设定哈希函数为 H key Random key 其中 Random 不能是一般的随机函数固定的参数必须返回确定的值通常此方法用于对长度不等的关键字构造哈希函数以上介绍了几种常用的散列函数在实际工作中应根据关键码的特点选用适当的方法有人曾用轮盘赌的统计分析方法对它们进行了模拟分析结论是平方取中法最接近于随机化在应用平方取中法时若关键码不是整数而是字符串时可以把每个字符串转换成整数实际造表时采用何种构造哈希函数的方法取决于建表的关键字集合的情况包括关键字的范围和形态总的原则是使产生冲突的可能性降到尽可能地小三处理冲突的方法有6个元素的关键码分别为 14 23 39 9 25 11 选取关键码与元素位置间的函数为H k kmod7 通过哈希函数对6个元素建立哈希表 25 39 23 9 14 冲突现象举例 6个元素用7个地址应该足够 H 14 14 7 0 11 H 25 25 7 4H 11 11 7 4 有冲突处理冲突的实际含义是为产生冲突的地址寻找下一个哈希地址 1 开放定址法 2 链地址法为产生冲突的地址H key 求得一个地址序列 H0 H1 H2 Hs1 s m 1其中 H0 H key Hi H key di MODmi 1 2 s 1 开放定址法对增量di有三种取法 1 线性探测再散列di c i最简单的情况c 12 平方探测再散列di 12 12 22 22 3 随机探测再散列di是一组伪随机数列或者di i H2 key 又称双散列函数探测关键码集为 47 7 29 11 16 92 22 8 3 设哈希表表长为m 11 哈希函数为Hash key keymod11 拟用线性探测法处理冲突建哈希表如下解释 47 7是由哈希函数得到的没有冲突的哈希地址 012345678910 29 22 8 3 Hash 29 7 哈希地址有冲突需寻找下一个空的哈希地址由H1 Hash 29 1 mod11 8 哈希地址8为空因此将29存入另外 22 8 3同样在哈希地址上有冲突也是由H1找到空的哈希地址的其中3还连续移动了两次二次聚集线性探测法的优点只要哈希表未被填满保证能找到一个空地址单元存放有冲突的元素线性探测法的缺点可能使第i个哈希地址的同义词存入第i 1个哈希地址这样本应存入第i 1个哈希地址的元素变成了第i 2个哈希地址的同义词因此可能出现很多元素在相邻的哈希地址上堆积起来大大降低了查找效率解决方案可采用二次探测法或伪随机探测法以改善堆积问题讨论仍举上例改用二次探测法处理冲突建表如下 012345678910 注只有3这个关键码的冲突处理与上例不同 Hash 3 3 哈希地址上冲突由H1 Hash 3 12 mod11 4 仍然冲突 H2 Hash 3 12 mod11 2 找到空的哈希地址存入 2 二次探测法 Hi Hash k di mod11其中 Hash k 为哈希函数di为增量序列12 12 22 22 q2 关键码集为 47 7 29 11 16 92 22 8 3 H2 key 是另设定的一个哈希函数它的函数值应和m互为素数若m为素数则H2 key 可以是1至m 1之间的任意数若m为2的幂次则H2 key 应是1至m 1之间的任意奇数例如关键字集合 19 01 23 14 55 68 11 82 36 H key keyMOD11 当m 11时可设H2 key 3key MOD10 1 19 01 23 14 55 68 11 82 36 211121213 将所有哈希地址相同的记录都链接在同一链表中 2 链地址法 0123456 14 01 36 19 82 23 11 68 55 ASL 6 1 2 2 3 9 13 9 例如同前例的关键字哈希函数为H key keyMOD7 查找过程和造表过程一致假设采用开放定址处理冲突则查找过程为四哈希表的查找对于给定值K 计算哈希地址i H K 若r i NULL则查找不成功若r i key K则查找成功否则求下一地址Hi 直至r Hi NULL 查找不成功或r Hi key K 查找成功为止 inthashsize 997 typedefstruct ElemType elem intcount 当前数据元素个数intsizeindex hashsize sizeindex 为当前容量 HashTable defineSUCCESS1 defineUNSUCCESS0 defineDUPLICATE 1 开放定址哈希表的存储结构 StatusSearchHash HashTableH KeyTypeK int p int c 在开放定址哈希表H中查找关键码为K的记录 SearchHash p Hash K 求得哈希地址 while H elem p key NULLKEY 求得下一探查地址p if EQ K H elem p key returnSUCCESS 查找成功返回待查数据元素位置p elsereturnUNSUCCESS 查找不成功 StatusInsertHash HashTable H Elemtypee InsertHash c 0 if HashSearch H e key p c SUCCESS returnDUPLICATE 表中已有与e有相同关键字的元素 elseH elem p e H count returnOK 查找不成功时返回p为插入位置 elseRecreateHashTable H 重建哈希表 if c hashsize H sizeindex 2 冲突次数c未达到上限阀值c可调 1 选用的哈希函数 2 选用的处理冲突的方法 3 哈希表饱和的程度装载因子 n m值的大小 n 记录数 m 表的长度决定哈希表查找的ASL的因素哈希表查找的分析从查找过程得知哈希表查找的平均查找长度实际上并不等于零一般情况下可以认为选用的哈希函数是均匀

人人文库> 全部分类> 应用文书 > 技术指导

温馨提示

1. 本站所有资源如无特殊说明，都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2. 本站的文档不包含任何第三方提供的附件图纸等，如果需要附件，请联系上传者。文件的所有权益归上传用户所有。
3. 本站RAR压缩包中若带图纸，网页内容里面会有图纸预览，若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 人人文库网仅提供信息存储空间，仅对用户上传内容的表现方式做保护处理，对用户上传分享的文档内容本身不做任何修改或编辑，并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容，请与我们联系，我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

第9章查找48695

文档简介

温馨提示

最新文档

评论

第9章 查找48695

文档简介

温馨提示

最新文档

评论

相关文档

第9章查找48695