数据结构哈希表(共48张PPT)精选_第1页
数据结构哈希表(共48张PPT)精选_第2页
数据结构哈希表(共48张PPT)精选_第3页
数据结构哈希表(共48张PPT)精选_第4页
数据结构哈希表(共48张PPT)精选_第5页
已阅读5页,还剩43页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

数据结构(shùjùjiéɡòu)哈希表第一页,共48页。A[0]A[1]A[2]A[3]A[4]A[5]A[6]A[7]A[8]A[9]A[10]例1:有一批考试成绩,统计(tǒngjì)各分数段的人数。对成绩(chéngjì)Grade,执行:A[grade/10]++什么(shénme)是哈希表第二页,共48页。例2:Ord(Char)=asc(char)–asc(‘a’)+1什么(shénme)是哈希表01(A)345(E)9(I)……

268(H)4(D)19(S)22(V)018(R)7(G)1905(E)HADHASHAVHEHERHEREHIGHIS第三页,共48页。将1000个学生的信息(xìnxī)存放在数组A[0]—A[999]中例3:为每年招收的1000名新生建立一张查找表,其关键字为学号,其值的范围(fànwéi)为xx000~xx999(前两位为年份)。什么(shénme)是哈希表number(substring(学号,3,3))第四页,共48页。建立(jiànlì)查找表:给定关键字key计算f(key)数组下标查找表:使用(shǐyòng)数组存放n个关键字,数组的下标0n-1什么(shénme)是哈希表查找时:给定关键字key计算f(key)数组下标第五页,共48页。建立查找表:给定(ɡěidìnɡ)grade计算f(grade)数组下标例4:统计学生成绩(chéngjì)各分数段的人数什么(shénme)是哈希表查找时:给定grade计算f(grade)数组下标Hash函数:f(grade)=grade/10第六页,共48页。什么(shénme)是哈希表{Zhao,Qian,Sun,Li,Wu,Chen,Han,Ye,Dei}例5:对于(duìyú)如下9个关键字设哈希函数(hánshù)f(key)=(Ord(第一个字母)-Ord('A')+1)/2第七页,共48页。什么(shénme)是哈希表字母ABCDEFGHIJKLM序号12345678910111213字母NOPQRSTUVWXYZ序号14151617181920212223242526ChenZhaoQianSunLiWuHanYeDei序号012345678910111213问题(wèntí):假设添加关键字Zhou,怎么办?第八页,共48页。什么(shénme)是哈希表由此可见,1)哈希(Hash)函数是一个映象,即:将关键字的集合映射到某个地址集合上,它的设置很灵活,只要这个(zhège)地址集合的大小不超出允许范围即可;2)对不同的关键字可能得到同一哈希地址(dìzhǐ),即:key1≠key2,而f(key1)=f(key2),因此,很容易产生“冲突〞现象;第九页,共48页。什么(shénme)是哈希表3)很难找到一个(yīɡè)不产生冲突的哈希函数。一般情况下,只能选择恰当的哈希函数,使冲突尽可能少地产生。因此,在构造这种特殊的“查找表〞时,除了(chúle)需要选择一个“好〞(尽可能少产生冲突)的哈希函数之外;还需要找到一种“处理冲突〞的方法。第十页,共48页。哈希表的定义(dìngyì)根据设定的哈希函数H(key)和所选中的处理冲突的方法,将一组关键字映象到一个有限的、地址连续的地址集(区间)上,并以关键字在地址集中的“象〞作为相应记录在表中的存储位置,如此构造所得(suǒdé)的查找表称之为“哈希表〞。这一过程称为(chēnɡwéi)哈希造表或者散列,所得的存储位置成为哈希地址或者散列地址。第十一页,共48页。哈希函数(hánshù)的构造方法对数字(shùzì)的关键字可有以下构造方法:假设是非数字关键字,那么需先对其进行(jìnxíng)数字化处理。1.直接定址法3.平方取中法5.除留余数法4.折叠法6.随机数法2.数字分析法第十二页,共48页。哈希函数(hánshù)为关键字的线性函数(hánshù)H(key)=key或者H(key)=akey+b1.直接(zhíjiē)定址法哈希函数(hánshù)的构造方法第十三页,共48页。哈希函数(hánshù)的构造方法2.数字(shùzì)分析法假设关键字集合中的每个关键字都是由s位数字组成(u1,u2,…,us),分析(fēnxī)关键字集中的全体,并从中提取分布均匀的假设干位或它们的组合作为地址。此方法仅适合于:

能预先估计出全体关键字的每一位上各种数字出现的频度。第十四页,共48页。哈希函数(hánshù)的构造方法有80个记录(jìlù),关键字为8位十进制数,哈希地址为2位十进制数8134653281372242813874228130136781322817813389678136853781419355…..…..分析(fēnxī):只取8只取1只取3、4只取2、7、5数字分布近乎随机所以:取任意两位或两位与另两位的叠加作哈希地址第十五页,共48页。哈希函数(hánshù)的构造方法以关键字的平方值的中间几位作为存储地址。求“关键字的平方值〞的目的是“扩大差异〞,同时平方值的中间各位又能受到整个(zhěnggè)关键字中各位的影响。3.平方(píngfāng)取中法此方法适合于:关键字中的每一位都有某些数字重复出现频度很高的现象。第十六页,共48页。哈希函数(hánshù)的构造方法4.折叠(zhédié)法将关键字分割成假设干局部,然后取它们的叠加和为哈希地址。有两种叠加处理的方法(fāngfǎ):移位叠加和间界叠加。此方法适合于:关键字的数字位数特别多,而且关键字在每一位上的数字分布大致均匀的情况。第十七页,共48页。哈希函数(hánshù)的构造方法例关键字为:0442205864,哈希地址(dìzhǐ)位数为4586442200410088H(key)=0088移位(yíwèi)叠加5864022404

6092H(key)=6092间界叠加4.折叠法第十八页,共48页。哈希函数(hánshù)的构造方法5.除留余数(yúshù)法设定哈希函数为:H(key)=keyMODp其中,p≤m(表长)并且p应为不大于m的素数或是不含20以下(yǐxià)的质因子第十九页,共48页。哈希函数(hánshù)的构造方法给定一组关键字为:12,39,18,24,33,21假设取p=9,那么它们对应(duìyìng)的哈希函数值将为:3,3,0,6,6,3为什么要对p加限制(xiànzhì)?可见,假设p中含质因子3,那么所有含质因子3的关键字均映射到“3的倍数〞的地址上,从而增加了“冲突〞的可能。第二十页,共48页。哈希函数(hánshù)的构造方法6.随机数法设定哈希函数(hánshù)为:H(key)=Random(key)其中Random为随机函数(hánshù)此方法通常用于对长度不等的关键字构造(gòuzào)哈希函数。第二十一页,共48页。哈希函数(hánshù)的构造方法实际构造哈希表时1.采用哪种构造哈希函数的方法取决于建表的关键字集合的情况(qíngkuàng)(包括关键字的范围和形态)2.总的原那么是使产生冲突的可能性尽可能的小。3.如果哈希造表过程中产生冲突,应当如何处理这些冲突呢?第二十二页,共48页。处理冲突(chōngtū)的方法冲突:由关键字得到的哈希地址为j〔0≤j≤n-1〕的位置(wèizhi)上已存有记录处理冲突:为产生(chǎnshēng)冲突的地址寻找下一个空的哈希地址1.开放定址法2.再哈希法3.链地址法处理冲突方法4.建立一个公共溢出区第二十三页,共48页。处理冲突(chōngtū)的方法1.开放(kāifàng)定址法为产生冲突的地址H(key)求得一个地址序列(xùliè):H0,H1,H2,…,Hs1≤s≤m-1其中:H0=H(key)Hi=(H(key)+di)MODmi=1,2,…,sm为哈希表表长第二十四页,共48页。处理(chǔlǐ)冲突的方法1.线性探测(tàncè)再散列法2.二次探测(tàncè)再散列法3.随机探测再散列法增量di的三种取法第二十五页,共48页。处理(chǔlǐ)冲突的方法1.开放(kāifàng)定址法对增量di的三种(sānzhǒnɡ)取法---①:1)线性探测再散列

di=ci

最简单的情况c=1

di=1,2,3,……m-1第二十六页,共48页。处理冲突(chōngtū)的方法例如(lìrú):关键字集合{19,01,23,14,55,68,11,82,36}设定(shèdìnɡ)哈希函数H(key)=keyMOD11(表长=11)采用线性探测再散列法来构造哈希表。190123456789101901012323231414555568686811821136118236112136251第二十七页,共48页。处理冲突(chōngtū)的方法1.开放(kāifàng)定址法对增量di有三种(sānzhǒnɡ)取法---②:2)平方〔二次〕探测再散列

di=12,-12,22,-22,…,第二十八页,共48页。处理(chǔlǐ)冲突的方法例如(lìrú):关键字集合{19,01,23,14,55,68,11,82,36}19012345678910190101232323141455556868681182113611823636设定(shèdìnɡ)哈希函数H(key)=keyMOD11(表长=11)采用二次探测再散列法来构造哈希表。112121413第二十九页,共48页。处理(chǔlǐ)冲突的方法1.开放(kāifàng)定址法对增量di有三种(sānzhǒnɡ)取法---③:3)随机探测再散列

di是一组随机数列或者

di=i×H2(key)(又称双散列函数探测)第三十页,共48页。处理冲突(chōngtū)的方法即:产生(chǎnshēng)的Hi均不相同,且所产生(chǎnshēng)的m-1个Hi值能覆盖哈希表中所有地址。那么要求:注意:增量di应具有(jùyǒu)“完备性〞※

随机探测时的m

和di没有公因子。※平方探测时的表长m必为形如4j+3的素数〔如:7,11,19,23,…等〕;第三十一页,共48页。处理(chǔlǐ)冲突的方法H2(key)是另设定的一个哈希函数(hánshù),它的函数(hánshù)值应和m互为素数。假设m为素数,那么H2(key)可以(kěyǐ)是1至m-1之间的任意数;假设m为2的幂次,那么H2(key)应是1至m-1之间的任意奇数。第三十二页,共48页。处理(chǔlǐ)冲突的方法例如(lìrú),当m=11时,可设H2(key)=(3key)MOD10+1190123145568118236111121122第三十三页,共48页。处理(chǔlǐ)冲突的方法2.再哈希法Hi=RHi(key)i=1,2,3,……,kRHi均是不同的哈希函数,在同义词产生地址冲突时计算另一个哈希函数地址,直到冲突不再(bùzài)发生。缺点:增加(zēngjiā)了计算时间。第三十四页,共48页。key,p,c)==SUCCESS)哈希函数为H(key)=keyMOD71)选用的哈希函数;线性探测处理冲突时,ASL=第二十三页,共48页。假设r[i]=NULL那么查找不成功可以证明:查找成功时有以下(yǐxià)结果:平方(píngfāng)取中法因此,在构造这种特殊的“查找表〞时,除了(chúle)需要选择一个“好〞(尽可能少产生冲突)的哈希函数之外;假设关键字集合中的每个关键字都是由s位数字组成(u1,u2,…,us),分析(fēnxī)关键字集中的全体,并从中提取分布均匀的假设干位或它们的组合作为地址。根据设定的哈希函数H(key)和所选中的处理冲突的方法,将一组关键字映象到一个有限的、地址连续的地址集(区间)上,并以关键字在地址集中的“象〞作为相应记录在表中的存储位置,如此构造所得(suǒdé)的查找表称之为“哈希表〞。求“关键字的平方值〞的目的是“扩大差异〞,同时平方值的中间各位又能受到整个(zhěnggè)关键字中各位的影响。给定关键字key计算f(key)数组下标从查找过程(guòchéng)得知:什么(shénme)是哈希表{19,01,23,14,55,68,11,82,36}能预先估计出全体关键字的每一位上各种数字出现的频度。处理冲突(chōngtū)的方法3.链地址(dìzhǐ)法所有关键字为同义词的记录(jìlù)存储在同一线性链表中。定义指针型向量ChainChainHash[m];但凡哈希地址为i的记录都插入到头指针为ChainHash[i]的链表中。第三十五页,共48页。处理(chǔlǐ)冲突的方法例如(lìrú):关键字集合{19,01,23,14,55,68,11,82,36}采用链地址(dìzhǐ)法来构造哈希表。哈希函数为H(key)=keyMOD71119826855140136231901231455681182360123456ASL=(6×1+2×2+3×1)/9=13/9第三十六页,共48页。处理(chǔlǐ)冲突的方法4.建立一个(yīɡè)公共溢出区哈希函数的值域[0,m-1]向量HashTable[0..m-1]为根本表,每个分量存放(cúnfàng)一个记录向量OverTable[0..v]为溢出表对于关键字和根本表HashTable中关键字为同义词的记录,只要发生冲突,都填入溢出表。第三十七页,共48页。哈希表的删除(shānchú)操作处理(chǔlǐ)冲突的方法//冲突(chōngtū)次数c未到达上限,〔阀值c可调〕#defineDUPLICATE-1数字分布近乎随机对于关键字和根本表HashTable中关键字为同义词的记录,只要发生冲突,都填入溢出表。给定grade计算f(grade)数组下标对于给定值K,计算(jìsuàn)哈希地址i=H(K)例如(lìrú):关键字集合//冲突(chōngtū)次数c未到达上限,〔阀值c可调〕key,p,c)==SUCCESS)哈希表的删除(shānchú)操作设哈希函数(hánshù)f(key)=即:产生(chǎnshēng)的Hi均不相同,且所产生(chǎnshēng)的直接(zhíjiē)定址法哈希表的查找(cházhǎo)算法查找过程和造表过程一致。假设采用开放(kāifàng)定址处理冲突,那么查找过程为:1.对于给定值K,计算(jìsuàn)哈希地址i=H(K)2.假设r[i]=NULL那么查找不成功3.假设r[i].key=K那么查找成功4.否那么“求下一地址Hi〞,直至r[Hi]=NULL(查找不成功)或r[Hi].key=K(查找成功)为止。第三十八页,共48页。哈希表的查找(cházhǎo)算法inthashsize[]={997,...};typedefstruct{ElemType*elem;intcount;//当前数据(shùjù)元素个数intsizeindex;//为当前容量}HashTable;#defineSUCCESS1#defineUNSUCCESS0#defineDUPLICATE-1//---开放定址(dìnɡzhǐ)哈希表的存储结构---//第三十九页,共48页。哈希表的查找(cházhǎo)算法StatusSearchHash(HashTableH,KeyTypeK,int&p,int&c){//在开放定址(dìnɡzhǐ)哈希表H中查找关键码为K的记录}//SearchHashp=Hash(K);//求得哈希地址(dìzhǐ)while(H.elem[p].key!=NULLKEY&&!EQ(K,H.elem[p].key)〕collision(p,++c);//求得下一探查地址pif(EQ(K,H.elem[p].key))returnSUCCESS;//查找成功,返回待查数据元素位置pelsereturnUNSUCCESS;//查找不成功第四十页,共48页。哈希表的维护(wéihù)算法StatusInsertHash(HashTable&H,Elemtypee){

}//InsertHashc=0;if(SearchHash(H,e.key,p,c)==SUCCESS)returnDUPLICATE;//表中已有与e有相同(xiānɡtónɡ)关键字的元素elseif(c<hashsize[H.sizeindex]/2){//冲突(chōngtū)次数c未到达上限,〔阀值

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论