数据结构导论第6章查找表.ppt

上传人：x*** IP属地：四川上传时间：2020-03-26 格式：PPT 页数：68 大小：670KB 积分：15 举报 版权申诉

已阅读5页，还剩63页未读，继续免费阅读

版权说明：本文档由用户提供并上传，收益归属内容提供方，若内容存在侵权，请进行举报或认领

文档简介

第6章查找表查找 Search 的相关概念查找就是在数据集合中寻找满足某种条件的数据对象查找表是由同一类型的数据元素或记录组成的数据集合查找的结果通常有两种可能查找成功即找到满足条件的数据对象查找不成功或查找失败作为结果报告一些信息如失败标志失败位置等对查找表经常进行的操作 1 查询某个特定的数据元素是否在查找表中 2 检索某个特定的数据元素的各种属性 3 在查找表中插入一个数据元素 4 从查找表中删去某个数据元素静态查找表仅作查询和检索操作的查找表动态查找表有时在查询之后还需要将查询结果为不在查找表中的数据元素插入到查找表中或者从查找表中删除其查询结果为在查找表中的数据元素表结构本身可以在查找过程中动态生成关键字 Key 数据元素记录中某个数据项的值用以标识一个数据元素主关键字可唯一地标识一个数据元素的关键字次关键字用以识别若干记录的关键字使用基于主关键字的查找查找结果应是唯一的如何进行查找查找的方法取决于查找表的结构由于查找表中的数据元素之间不存在明显的组织规律因此不便于查找为了提高查找的效率需要在查找表中的元素之间人为地附加某种确定的关系换句话说用另外一种结构来表示查找表 6 2静态查找表6 3动态查找树表6 4哈希表散列表衡量一个查找算法的时间效率的标准是在查找过程中关键字的平均比较次数或平均读写磁盘次数只适合于外部查找这个标准也称为平均查找长度ASL AverageSearchLength 通常它是查找结构中对象总数n或文件结构中物理块总数n的函数算法所需要的存储量和算法的复杂性等问题 6 2静态查找表静态查找表用顺序表作为存储结构在静态查找表中数据对象存放于数组中利用数组元素的下标作为数据对象的存放地址查找算法根据给定值x 在数组中进行查找直到找到x在数组中的存放位置或可确定在数组中找不到x为止 6 2 1顺序表的查找 SequentialSearch 静态查找表的顺序存储结构为 definemaxsize静态查找表的表长typedefstruct ElemTypeitem maxsize 1 存储数据元素的数组空间 0号单元留空intn 表的长度 sqtable 数据元素类型ElemType的定义为 typedefstruct keyTypekey 关键字域其它属性域 ElemType intSearch sqtable sqtableR KeyTypek 顺序查找的算法 0号元素为监视哨inti R item 0 key k for i R n R item i key K i returni 查找过程从表中最后一个元素开始顺序用各元素的关键字与给定值K进行比较若找到与其值相等的元素则查找成功给出该元素在表中的位置否则若直到第一个记录仍未找到关键字与x相等的对象则查找失败顺序查找的时间性能设查找第i个元素的概率为pi 查找到第i个元素所需比较次数为ci 则查找成功的平均查找长度在顺序查找情形 ci n i 1 i 1 n 因此在等概率情形 pi 1 n 6 2 2有序表的查找上述顺序查找表的查找算法简单但平均查找长度较大特别不适用于表长较大的查找表若以有序表表示静态查找表则查找过程可以基于折半进行折半查找二分查找 BinarySearch 折半查找先求位于查找区间正中的对象的下标mid 用其关键字与给定值K比较 R item mid Key K 查找成功 R item mid Key K 把查找区间缩小到表的前半部分再继续进行对分查找 R item mid Key K 把查找区间缩小到表的后半部分再继续进行对分查找每比较一次查找区间缩小一半如果查找区间已缩小到一个对象仍未找到想要查找的对象则查找失败 R item R length 例如 key 64的查找过程如下 low high mid low mid high mid low指示查找区间的下界 high指示查找区间的上界 mid low high 2 折半查找 1 mid low high 2 2 比较R item mid Key K 如果R item mid Key K 则查找成功返回mid值如果R item mid Key K 则置high mid 1如果R item mid Keyhigh时表明查找不成功查找结束 intSearch Bin sqtableR KeyTypeK low 1 high R length 置区间初值while low high mid low high 2 if K R item mid Key returnmid 找到待查元素elseif key R item mid Key high mid 1 继续在前半区间进行查找elselow mid 1 继续在后半区间进行查找 return0 顺序表中不存在待查元素 Search Bin 折半查找的性能分析先看一个具体的情况假设 n 11 判定树与关键字的比较次数不会超过树的深度 log2n 1 一般情况下表长为n的折半查找的判定树的深度和含有n个结点的完全二叉树的深度相同查找第j层的数据要比较j次第j层上共有结点2j 1个假设n 2h 1并且查找概率相等则在n 50时可得近似结果折半查找的效率比顺序查找高但折半查找只适用于有序表且限于顺序存储结构在建立顺序表的同时建立一个索引索引顺序表中的元素分块有序升序或降序第i块中的最大小值小大于第i 1块中的最大小值块间有序块内无序 6 2 3索引顺序表的查找分块查找索引每个索引项有两个域块内最大键值块起始地址查找 1 先查索引表折半查找 2 再查顺序表顺序查找索引顺序查找的平均查找长度查找索引的平均查找长度在块中查找顺序表的平均查找长度对比顺序表和有序表的查找性能 n 1 n 1 nlogn 几种查找表的特性查找插入删除无序顺序表无序线性链表有序顺序表有序线性链表静态查找树表 n n logn n logn 1 1 n 1 nlogn 1 从查找性能看最好情况能达 logn 此时要求表有序 2 从插入和删除的性能看最好情况能达 1 此时要求存储结构是链表可得如下结论 6 3树表动态查找表表结构本身是在查找过程中动态生成的基本操作 InitDSTable 遍历查找表 6 3 1二叉排序树 BinarySortTree 定义二叉排序树二叉查找树或者是一棵空树或者是具有下列性质的二叉树每个结点都有一个作为查找依据的关键字 key 所有结点的关键字互不相同左子树若非空上所有结点的关键字都小于根结点的关键字右子树若非空上所有结点的关键字都大于根结点的关键字左子树和右子树也是二叉排序树例如如果对一棵二叉排序树进行中序遍历可以按从小到大的顺序将各结点关键字排列起来通常取二叉链表作为二叉排序树的存储结构 typedefstructBiTNode 结点结构DataTypedata structBiTNode lchild rchild 左右孩子指针 BiTNode BiTree 1 二叉排序树的查找算法若二叉排序树为空则查找不成功否则1 若给定值等于根结点的关键字则查找成功 2 若给定值小于根结点的关键字则继续在左子树上进行查找 3 若给定值大于根结点的关键字则继续在右子树上进行查找例如二叉排序树查找关键字 50 50 50 35 50 30 40 35 50 90 50 80 90 95 从上述查找过程可见在查找过程中生成了一条查找路径从根结点出发沿着左分支或右分支逐层向下直至关键字等于给定值的结点查找成功或者从根结点出发沿着左分支或右分支逐层向下直至指针指向空树为止查找不成功算法P135 二叉排序树上的构建如何构造二叉排序树构造过程不断插入的过程从空树出发依次插入R1 Rn各数据值 1 如果二叉排序树是空树则插入结点就是二叉排序树的根结点 2 如果二叉排序树是非空的则插入值与跟结点比较若小于根结点的值就插入到左子树中去否则插入到右子树中示例 45 24 53 12 22 90 注意输入的序列不同构造的二叉排序树不同 2 二叉排序树的插入算法根据动态查找表的定义插入操作在查找不成功时才进行若二叉排序树为空树则新插入的结点为新的根结点否则新插入的结点必为一个新的叶子结点其插入位置由查找过程得到是查找不成功时查找路径上访问的最后一个结点的左孩子或右孩子查找算法描述如下 intSearchBST BiTreeT KeyTypekey BiTreef BiTree SearchBST 否则表明查找不成功返回指针p指向查找路径上访问的最后一个结点并返回函数值为0 指针f指向当前访问的结点的双亲其初始调用值为NULL if T elseif key T data key elseif keydata key else p f return0 查找不成功 p T return1 查找成功 returnSearchBST T lchild key T p 在左子树中继续查找 returnSearchBST T rchild key T p 在右子树中继续查找二叉排序树上插入结点的算法 intInsertBST BiTree InsertBST s BiTree malloc sizeof BiTNode 为新结点分配空间s data e s lchild s rchild NULL if p T s 插入s为新的根结点 elseif e keydata key p lchild s 插入 s为 p的左孩子elsep rchild s 插入 s为 p的右孩子 return1 插入成功二叉排序树上的构建如何构造二叉排序树构造过程不断插入的过程从空树出发依次插入R1 Rn各数据值 1 如果二叉排序树是空树则插入结点就是二叉排序树的根结点 2 如果二叉排序树是非空的则插入值与跟结点比较若小于根结点的值就插入到左子树中去否则插入到右子树中示例 45 24 53 12 22 90 注意输入的序列不同构造的二叉排序树不同二叉排序树的删除算法和插入相反删除在查找成功之后进行并且要求在删除二叉排序树上某个结点之后仍然保持二叉排序树的特性可分三种情况讨论 1 被删除的结点是叶子 2 被删除的结点只有左子树或者只有右子树 3 被删除的结点既有左子树也有右子树 1 被删除的结点是叶子结点例如被删关键字 20 88 其双亲结点中相应指针域的值改为空 2 被删除的结点只有左子树或者只有右子树其双亲结点的相应指针域的值改为指向被删除结点的左子树或右子树被删关键字 40 80 3 被删除的结点既有左子树也有右子树 40 40 以其前驱替代之然后再删除该前驱结点被删结点前驱结点被删关键字 50 二叉排序树的删除递归算法算法9 7 intDeleteBST BiTree 其中删除操作过程如下所描述 voidDelete BiTree p 从二叉排序树中删除结点p 并重接它的左子树或右子树if p rchild elseif p lchild else Delete 右子树为空树则只需重接它的左子树 q p p p lchild delete q q q 左子树为空树只需重接它的右子树 q p p p rchild delete q p p q q q p s p lchild while s rchild q s s s rchild s指向被删结点的前驱左右子树均不空 p data s data if q p q rchild s lchild elseq lchild s lchild 重接 q的左子树delete s q s 查找性能的分析折半查找长度为n的判定树是惟一的而含有n个结点的二叉排序树却不惟一含有n个结点的平均查找长度和树的形态有关最差单支树深度为n ASL n 1 2最好形态和折半查找的判定树相同和log2n成正比 4 平衡二叉树 AVL树一棵AVL树或者是空树或者是具有下列性质的二叉查找树它的左子树和右子树都是AVL树且左子树和右子树的高度之差的绝对值不超过1 结点的平衡因子balance balancefactor 每个结点附加一个数字该结点右子树的高度减去左子树的高度所得的高度差根据AVL树的定义任一结点的平衡因子只能取 1 0和1 如果一棵二叉查找树是高度平衡的它就成为AVL树如果它有n个结点其高度可保持在O log2n 平均查找长度也可保持在O log2n 是平衡树不是平衡树构造二叉平衡查找树的方法是在插入过程中采用平衡旋转技术 P235 6 4哈希表 6 4 1什么叫哈希表以上两节讨论的表示查找表的各种结构的共同特点记录在表中的位置和它的关键字之间不存在一个确定的关系查找的过程为给定值依次和关键字集合中各个关键字进行比较查找的效率取决于和给定值进行比较的关键字个数用这类方法表示的查找表其平均查找长度都不为零对于频繁使用的查找表希望ASL 0 办法预先知道所查关键字在表中的位置即要求记录在表中位置和其关键字之间存在一种确定的关系例如为每年招收的1000名新生建立一张查找表其关键字为学号其值的范围为xx000 xx999 前两位为年份若以下标为000 999的顺序表表示则查找过程可以简单进行取给定值学号的后三位不需要经过比较便可直接从顺序表中找到待查关键字因此需在关键字与记录在表中的存储位置之间建立一个函数关系以f key 作为关键字为key的记录在表中的位置通常称这个函数f key 为哈希函数 Zhao Qian Sun Li Wu Chen Han Ye Dei 例如对于如下9个关键字设哈希函数f key Ord 第一个字母 Ord A 1 2 Chen Zhao Qian Sun Li Wu Han Ye Dei 问题若添加关键字Zhou 怎么办能否找到另一个哈希函数 1 哈希 Hash 函数是一个映象即将关键字的集合映射到某个地址集合上它的设置很灵活只要这个地址集合的大小不超出允许范围即可可见 2 由于哈希函数是一个压缩映象因此在一般情况下很容易产生冲突现象即 key1 key2 而f key1 f key2 有相同函数值的关键字称为同义词 3 很难找到一个不产生冲突的哈希函数一般情况下只能选择恰当的哈希函数使冲突尽可能少地产生因此在构造这种特殊的查找表时除了需要选择一个好尽可能少产生冲突的哈希函数之外还需要找到一种处理冲突的方法哈希表的定义根据设定的哈希函数H key 和所选中的处理冲突的方法将一组关键字映象到一个有限的地址连续的地址集区间上并以关键字在地址集中的象作为相应记录在表中的存储位置如此构造所得的查找表称之为哈希表 6 4 2构造哈希函数的方法原则经哈希函数映像到地址集合中任何一个地址的概率是相等的均匀的哈希函数对数字的关键字可有下列构造方法若是非数字关键字则需先对其进行数字化处理哈希函数为关键字的线性函数H key key或者H key a key b 1 直接定址法此法仅适合于地址集合的大小关键字集合的大小此方法仅适合于能预先估计出全体关键字的每一位上各种数字出现的频度 2 数字分析法假设关键字集合中的每个关键字都是由s位数字组成 u1 u2 us 分析关键字集中的全体并从中提取分布均匀的若干位或它们的组合作为地址以关键字的平方值的中间几位作为存储地址求关键字的平方值的目的是扩大差别同时平方值的中间各位又能受到整个关键字中各位的影响 3 平方取中法此方法适合于关键字中的每一位都有某些数字重复出现频度很高的现象将关键字分割成若干部分然后取它们的叠加和为哈希地址有两种叠加处理的方法移位叠加和间界叠加 4 折叠法此方法适合于关键字的数字位数特别多每一位数字分布均匀 5 除留余数法设定哈希函数为 H key keyMODp其中 p m 表长并且p应为不大于m的素数或是不含20以下的质因子 6 随机数法设定哈希函数为 H key Random key 其中 Random为伪随机函数通常此方法用于对长度不等的关键字构造哈希函数实际造表时采用何种构造哈希函数的方法取决于建表的关键字集合的情况包括关键字的范围和形态总的原则是使产生冲突的可能性降

人人文库> 全部分类> 教育资料 > 课件下载

温馨提示

1. 本站所有资源如无特殊说明，都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2. 本站的文档不包含任何第三方提供的附件图纸等，如果需要附件，请联系上传者。文件的所有权益归上传用户所有。
3. 本站RAR压缩包中若带图纸，网页内容里面会有图纸预览，若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 人人文库网仅提供信息存储空间，仅对用户上传内容的表现方式做保护处理，对用户上传分享的文档内容本身不做任何修改或编辑，并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容，请与我们联系，我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

数据结构导论第6章查找表.ppt

文档简介

温馨提示

最新文档

评论

数据结构导论第6章查找表.ppt

文档简介

温馨提示

最新文档

评论

相关文档