




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、哈希表概念及构建方法、哈希表的概念及作用般的线性表,树中,记录在结构中的相对位置是随机的,即和记录的关键字之间不存在确这一类查找方法建立定的关系,因此,在结构中查找记录时需进行一系列和关键字的比较。在比较的基础上,查找的效率依赖于查找过程中所进行的比较次数。理想的情况是能直接找到需要的记录,因此必须在记录的存储位置和它的关键字之间建立一个确定的对应关系f,使每个关键字和结构中一个唯一的存储位置相对应。哈希表最常见的例子是以学生学号为关键字的成绩表,1号学生的记录位置在第一条,10号学生的记录位置在第1。条如果我们以学生姓名为关键字,如何建立查找表,使得根据姓名可以直接找到相应记录呢?abcde
2、fgh242526刘丽刘宏英吴军吴小艳李秋梅陈伟姓名中各字拼音首字母lllhywjwxylqmcw用所有首字母编号值相加求244633724226最小值可能为3最大值可能为78可放75个学生用上述得到的数值作为对应记录在表中的位置,得到下表:和成绩一成绩二.3.24 刘丽829525 .26 陈伟.33吴军.42李秋梅.46刘宏英.72吴小艳78.上面这张表即哈希表。如果将来要查李秋梅的成绩,可以用上述方法求出该记录所在位置:李秋梅:lqm12+17+13=42取表中第42条记录即可。问题:如果两个同学分别叫刘丽刘兰该如何处理这两条记录?这个问题是哈希表不可避免的,即冲突现象:对不同的关键字可
3、能得到同一哈希地址。二、哈希表的构造方法1、直接定址法例如:有一个从1至M00岁的人口数字统计表,其中,年龄作为关键字,哈希函数取关键字自身。地址0102.252627.100年龄12.252627.人数30002000.1050.2、数字分析法有学生的生日数据如下:年.月.日75.10.0375.11.2376.03.0276.07.1275.04.2176.02.15.经分析,第一位,第二位,第三位重复的可能性大,取这三位造成冲突的机会增加,所以尽量不取前三位,取后三位比较好。3、平方取中法取关键字平方后的中间几位为哈希地址。4、折叠法将关键字分割成位数相同的几部分(最后一部分的位数可以不
4、同),然后取这几部分的叠加和(舍去进位)作为哈希地址,这方法称为折叠法。例如:每一种西文图书都有一个国际标准图书编号,它是一个10位的十进制数字,若要以它作关键字建立一个哈希表,当馆藏书种类不到10,000时,可采用此法构造一个四位数的哈希函数。如果一本书的编号为0-442-20586-4,则:5864586442200224+)04+)04100886092H(key)=0088H(key)=6092(a)移位叠加(b)间界叠加5、除留余数法取关键字被某个不大于哈希表表长m的数p除后所得余数为哈希地址。H(key)=keyMODp(p<=m)6、随机数法选择一个随机函数,取关键字的随机
5、函数值为它的哈希地址,即H(key)=random(key),其中random为随机函数。通常用于关键字长度不等时采用此法哈希表及其查找算法12.4.1哈希表的基本概念前边我们所讨论的查找算法中无论是基于线性表结构还是基于二叉排序树结构,都有一个共同的特点就是在搜索过程中,需要通过对给定关键字与查找表中相应元素的关键字进行比较来实现,且都采用平均查找长度作为衡量算法好坏的指标,而一个算法的平均查找长度与关键字的比较次数有着密切的关系,换句话说,就是算法的优劣将取决于关键字的比较次数。由此,我们引入一种想法即是否可以寻求一种不必进行关键字比较而达到查找目的的方法呢?如果可以,则这样的平均查找长度
6、将为零。哈希表给我们实现这样的想法提供了可能。哈希表是一种数据元素以散列方式组织的存储结构,在一块连续的存储空间中采用哈希法建立起来的符号表称为哈希表,其基本思想是:元素的存储位置与它的关键字间建立一个确定的对应关系,即设关键字key与存储位置间的对应关系为H(key),若用一维数组来存放数据元素,则H(key)就表示该数组的下标。这样我们就可以称函数H为哈希(Hash)函数,H(key)为哈希地址,该一维数组就是哈希表。显而易见,哈希表一旦建立,在这样的存储结构上进行查找时,可以用给定的关键字和建立哈希表时所采用的哈希函数直接在给定的哈希表中进行查找。值得注意的是:由于数据元素序列中的各数据
7、元素的关键字的取值可能会在一个很大的范围内,因而即使待查找的数据元素序列中的元素个数不是很多,也很难选取一个合适的哈希函数H,以确彳不同key值的数据元素有不同的函数值。这里我们把具有不同key值的数据元素,得到相同哈希函数值的现象称为冲突。在大多数情况下,哈希函数是一种“压缩映象”,即把关键字取值范围很大的数据元素集合映射到一个范围确定的表中,因此,冲突是在所难免的。尽管如此,我们还是希望尽可能找到产生均匀映射的哈希函数,以有效地降低冲突发生率;此外,在发生冲突时也必须有相应的解决冲突的办法。因此,构造哈希表的两大任务就是:建立哈希函数和找到解决冲突的办法。12.4.2哈希函数的构造方法哈希
8、函数的构造方法很多,通常根据实际需要,遵循使关键字通过哈希函数转换所得到的地址尽可能地均匀分布在给定空间中的原则。因此,如何构造一个“好”的哈希函数就是带有很强的技术性和实践性的问题。这里,我们分别介绍几种常用的构造哈希函数的方法。1 .直接定址法当关键字是整型数时,可以取关键字本身或它的线性函数作为它的哈希地址。即:H(key)=key或者:H(key)=a?key+b(其中a、b都是常数)直接定址法的特点是函数简单,且对于不同的关键字不会发生冲突。但现实问题中,数据元素的关键字很少是连续的,因此,采用该方法可能会造成哈希表空间的浪费。2 .数字分析法这种方法适合于静态数据,即所有的关键字值
9、都能够事先知道,然后检查分析关键字值中所有的数字,分析每一数字是否分布均匀,并将不均匀的数字删除,再根据存储空间的大小确定构造哈希函数。例12.3设有如下8个学生的学号为:20024223412002823587200223718420023692932002521682200276543420021836892002604289观察这一组数据发现,左边的第1、2、3、4位的数值不太均匀,因此删除;第9位中数值8出现次数太多,因此也删除;第6位中数值2出现三次,6出现两次,因此也删除;第8位中数彳12出现2次,假设哈希表长度为1000,因此可以选择第5、7、8位组成哈希地址:得到如下结果:H(
10、key1)=423H(key2)=835H(key3)=271H(key4)=392H(key5)=516H(key6)=754H(key7)=136H(key8)=6423 .平方取中法该方法是先计算出关键字key的平方值即key2,然后取平方值中间的若干位作为哈希地址,即:H(key)=key2的之间几位这是一种常用的较好的构造哈希函数的办法。关键字经过求平方后,其中间的几位和组成关键字的各位值均有关,从而使哈希地址的分布较为均匀,减少了发生冲突的可能性。除了上述三种方法外,还有一些较为常用的方法如:除留余数法,折叠移位法等等。总而言之,构造哈希函数的方法可以多种多样,但以哈希地址分布均匀
11、为优。4 2.4.3冲突解决的方法如前所述,在实际应用中,无论如何构造哈希函数,冲突是无法完全避免的。为了解决冲突,就需要为不同关键字值得到相同地址中的某一个或某几个数据元素寻找另外的存储地址,下面介绍两种解决冲突的办法。1 .开放地址法这个方法的基本思想是:当发生地址冲突时,按照某种方法继续探测哈希表中的其他存储单元,直到找到空位置为止。这个过程可用下式描述:Hi(key)=(H(key)+di)modm(i=1,2,k(k<m-1)其中:H(key)为关键字key的直接哈希地址,m为哈希表的长度,di为每次再探测时的地址增量。采用这种方法时,首先计算出元素的直接哈希地址H(key),
12、如果该存储单元已被其他元素占用,则继续查看地址为H(key)+d2的存储单元,如此重复直至找到某个存储单元为空时,将关键字为key的数据元素存放到该单元。增量d可以有不同的取法,并根据其取法有不同的称呼:(1) di=1,2,3,线性探测再散列;(2) di=12,12,22,-22,二次探测再散列;(3) di=伪随机序列伪随机再散列;例12.4设有哈希函数H(key)=keymod7,哈希表的地址空间为06,对关键字序列(32,13,49,55,22,38,21)按线性探测再散列和二次探测再散列的方法分别构造哈希表。解:(1)线性探测再散列:32%7=4;13%7=6;49%7=0;55%
13、7=6发生冲突,下一个存储地址(6+1)%7=0,仍然发生冲突,再下一个存储地址:(6+2)%7=1未发生冲突,可以存入。22%7=1发生冲突,下一个存储地址是:(1+1)%7=2未发生冲突;38%7=3;21%7=0发生冲突,按照上面方法继续探测直至空间5,不发生冲突,所得到的哈希表对应存储位置:下标:012345649552238322113(2)二次探测再散列:下标:012345649222138325513注意:对于利用开放地址法处理冲突所产生的哈希表中删除一个元素时需要谨慎,不能直接地删除,因为这样将会截断其他具有相同哈希地址的元素的查找地址,所以,通常采用设定一个特殊的标志以示该元
14、素已被删除。2.链地址法链地址法解决冲突的做法是:如果哈希表空间为0m?1,设置一个由m个指针分量组成的一维数组STm,凡哈希地址为i的数据元素都插入到头指针为STi的链表中。这种方法有点近似于邻接表的基本思想,且这种方法适合于冲突比较严重的情况。例12.5设有8个元素a,b,c,d,e,f,g,h,采用某种哈希函数得到的地址分别为:0,2,4,1,0,8,7,2,当哈希表长度为10时,采用链地址法解决冲突的哈希表如图12.4所示。图124链地址法示意图12.4.4哈希查找哈希查找,顾名思义就是基于哈希表结构的查找算法,其基本思想是,按照建立哈希表时的哈希函数,根据给定关键字值,直接求出其哈希地址,若该地址中数据元素为空,则查找失如果败;如果该地址中数据元素不为空,且其关键字值与给定关键字值相等,则查找成功;该地址中数据元素不为空,但其关键字值不等于给定关键字值,则需按照建立哈希表时解决冲突的办法
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 工业产品交易合同3篇
- 兼职医疗保健师聘用协议3篇
- 六年级学期班主任工作总结(4篇)
- 借调员工三方协议3篇
- 保证书承诺健康生活3篇
- 资助育人感恩教育班会总结(4篇)
- 美术亲子活动方案(5篇)
- 自信的课题演讲稿中学(4篇)
- 2024年宿迁市泗洪县村党组织书记选聘乡镇事业编制人员考试真题
- 昭通市永善县医共体水竹分院招聘笔试真题2024
- 2023年浙江省海港投资运营集团有限公司招聘笔试题库及答案解析
- 机器视觉基础课件
- 学校学生评教表
- 部编版语文五年级下册 第四单元复习课件
- 部编版小学六年级语文下册全册教案(详案)
- 浙江省舟山市各县区乡镇行政村村庄村名居民村民委员会明细及行政区划代码
- 逻辑哲学论-英文版
- 特斯拉核心零部件供应链梳理分析课件
- 城市设计导则SOM
- 九年级英语单词默写表(最新可打印)
- 学校办学基本条件评估指标体系修订
评论
0/150
提交评论