第八章查找课件_第1页
第八章查找课件_第2页
第八章查找课件_第3页
第八章查找课件_第4页
第八章查找课件_第5页
已阅读5页,还剩63页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

数据结构第八章查找第八章查找知识点查找的基本概念三种基本查找方法:顺序查找、二分查找和分块查找树型查找的基本概念和查找算法散列法、散列函数冲突的基本概念和解决冲突方法难点二叉排序树查找平衡树及平衡树的调整第八章查找要求熟练掌握以下内容:三种基本查找方法的基本思想和算法二叉排序树查找的基本思想和算法散列法基本思想、散列函数的常用构造方法及解决冲突方法了解以下内容:平衡树及平衡树的调整B-树查找第八章查找第八章目录8.1查找的基本概念8.2基本查找方法8.3树型查找8.4散列法8.5应用举例及分析小结习题与练习第八章查找8.1查找的基本概念查找又称为查询或检索,是在一批记录中依照某个域的指定域值,找出相应的记录的操作。在计算机中,被查找的数据对象是由同一类型的记录构成的集合,可称之为查找表(searchtable)。在实际应用问题中,每个记录一般包含有多个数据域,查找是根据其中某一个指定的域进行的,这个作为查找依据的域称为关键字(key)。第八章查找顺序查找的线性表定义如下:Typedefstructrectype{keytypekey;itemtypeitem1……}rectype;第八章查找顺序查找算法intsequsearch(r[],n,k){/*n为线性表r中元素个数*/r[0].key=k;i=n;while(r[i].key!=k)i--;return(i);}第八章查找顺序查找算法分析此函数的主要运算时间是用于循环语句逐单元进行比较判断r[i].key是否等于k,因此顺序查找的速度较慢,最坏的情况查找成功需比较n次,最好的情况是比较1次,如果对每个关键字进行查找的概率相等,则查找成功所需的平均比较次数为(n+1)/2,而查找失败则需比较(n+1)次,时间复杂度为O(n)。顺序查找的优点是算法简单、适应面广,且不要求表中数据有序。缺点是平均查找长度较大,特别是当n较大时,查找效率较低,不宜采用。第八章查找2.折半查找折半查找又称二分查找(Birarysearch),它的查找速度比顺序查找快,但它要求数据在线性表中按查找的关键字域有序排列。设n个数据存放于数组r中,且已经过排序,按由小到大递增的顺序排列。采用二分查找,首先用要查找的给定值k与表正中间元素的关键值相比较,此元素的下标。第八章查找比较结果有三种可能:⑴如果r[m].key>k,说明如果存在欲查找的元素,该元素一定在数组的前半部分,查找范围缩小了一半,修改查找范围的的上界high=m-1,继续对数组的前半部分进行二分查找;⑵如果r[m].key<k,说明如果存在欲查找的元素,该元素一定在数组的后半部分,查找范围缩小了一半,修改查找范围的的下界low=m+1,继续对数组的后半部分进行二分查找;⑶如果r[m].key=k,查找成功,m所指的记录就是查找到的数据。第八章查找重复上述过程,查找范围每次缩小1/2,当范围不断缩小,出现查找范围的下界大于上界时,则查找失败,确定关键字为key的记录不存在。二分查找是一种效率较高的算法,最好的情况是第一次比较即找到所查元素,即使一次比较没有找到,也把进一步查找的范围了缩小一半。与此类似,每比较一次均使查找范围减半,故最坏的情况所需比较次数为O(logn),对于较大的n显然较顺序查找速度快得多。第八章查找例:从下列序列中查找K=21的记录513192137566475808892第八章查找intbinsearch(r[],n,k){intlow=1,hig=n,mid;while(low<=hig){mid=(low+high)/2;if(r[mid].key==k)return(mid);elseif(r[mid].key<k)low=mid+1;elsehig=mid-1;}return(0);}第八章查找3.有序表的其它查找方法斐波那契查找方法插值查找法第八章查找8.2.3分块查找分块查找又称为索引顺序查找,是顺序查找方法的另一种改进,其性能介于顺序查找和二分查找之间。分块查找把线性表分成若干块,每一块中的元素存储顺序是任意的,但块与块之间必须按关键字大小有序排列,即前一块中的最大关键字值小于后一块中的最小关键字值。还需要建立一个索引表,索引表中的一项对应于线性表中的一块,索引项由键域和链域组成,键域存放相应块的最大关键字,链域存放指向本块第一个结点和最末一个结点的指针。索引表按关键字值的递增顺序排列。第八章查找分块查找的算法分两步进行,首先确所查找的结点属于哪一块,即在索引表中查找其所在的块,然后在块内查找待查的数据。由于索引表是递增有序的,可采用二分查找,而块内元素是无序的,只能采用顺序查找。如果块内元素个数较少,则不会对执行速度有太大的影响。例如线性表中关键字为:9,22,12,14,35,42,44,38,48,60,58,47,78,80,77,82其索引如图8.1所示。第八章查找图8.1线性表与索引表第八章查找索引表的定义structindexterm{keytypekey;intlow,high;};typedefstructindextermindex[MAXITEM];这里的keytype可以是任何相应的数据类型,如int、float、或char等,在算法中,我们规定keytype缺省是int类型。第八章查找intblksearch(sqlistr,indexidx,intk,bn){/*bn为块的个数*/inti,j,mid,low=1,high=bn,find=0;while(low<=high&&!find){/*二分查找索引表*/mid=(low+high)/2;if(k<idx[mid].key)high=mid-1;elseif(k>idx[mid].key)low=mid+1;elsefind=1;}第八章查找分块查找算法续if(find==1){i=idx[mid].low;j=idx[mid].high;}elseif(low<bn)/*k小于索引表内最大值*/第八章查找分块查找算法续{i=idx[low].low;j=idx[low].high;}while(i<=j&&r[i].key!=k)i++;if(i>j)i=0;return(i);}返回第八章查找二叉排序树(BST):二叉排序树或是一棵空树,或是具有下列性质的树:若左子树非空,则左子树上的所有结点都小于其根结点的值;若右子树非空,则右子树上的所有结点都大于其根结点的值;左,右子树也都是一棵二叉排序树.例第八章查找8.3.1二叉排序树查找基本思想:查找过程从根结点开始,首先将它的关键字与给定值k进行比较,如果相等,则查找成功,输出有关的信息;如果不等,若根结点关键字大于给定值k,向左子树继续查找,否则向右子树继续查找。第八章查找树型查找是一种递归的查找过程。在二叉排序树上查找关键字为k的结点,成功时返回该结点位置,否则返回NULL,递归函数如下:第八章查找递归函数如下btree*search(btree*b,intk){if(b==NULL)return(NULL);else{if(b->data==k)return(b);if(k<b->data)return(search(b->left,k));elsereturn(search(b->right,k));}}第八章查找非递归算法btree*treesearch(btree*b,intk){btree*p;p=b;while(p!=NULL);{if(p->data==k)return(p);elseif(k<p->data)p=p->left;elsep=p->right;}return(NULL);}第八章查找在二叉排序树上进行查找,若查找成功,则是从根结点出发走了一条从根结点到所查找结点的路径;若查找不成功,则是从根结点出发走了一条从根结点到某个终端叶子结点的路径。与二分查找类似,和关键字比较的次数不超过二叉排序树的深度。但是,含有n个结点的二叉树不是唯一的,由于对其结点插入的先后次序不同,所构成的二叉树的形态和深度也可能不同。例如,图8.2是按不同插入次序得到的两个二叉排序树。第八章查找图8.2两个二叉排序树在查找失败的情况下,在这二个树上所进行的关键字比较次数分别为3和6次。第八章查找二叉排序树查找分析树型查找最坏情况时,需要的查找时间取决于树的高度,当二叉排序树接近满二叉树时,其高度为log2n,最坏情况下查找时间为O(logn),与二分查找是同样数量级的;当二叉排序树为只有一个端结点的所谓“退化树”时,其高度等于n,最坏情况下查找时间为O(n),与顺序查找属于同一数量级。为了保证树型查找有较高的查找速度,我们希望该二叉树接近满二叉树,也就是希望二叉树的每一个结点的左、右子树高度尽量接近平衡,即使按任意次序不断地插入结点,也不要使此树成为退化树。第八章查找在二叉排序树上插入结点基本思想第八章查找插入结点的非递归算法Voidinsertbst(*tptr,*s)/*tptr指向根{……/*s指向要插入的结点s->lchild=s->rchild=null;If(tptr==null){tptr=s;return;}else第八章查找{p=tptr;While(p!=null){if(p->key==s->key)return;/*无需插入q=p;/*q记录p的父亲if(s->key<p->key)/*寻找要插入的位置p=p->lchild;elsep=p->rchild;}If(s->key<q->key)/*至此,q指向的是q->lchild=s;/*要插入结点s的父elseq->rchild=s;/*结点}}第八章查找8.3.2平衡树平衡树(Balancedtree)也称为AVL树,是由阿德尔森—维尔斯基和兰迪斯(Adelson-velskiiandlandis)于1962年首先提出的。这是一种附加了一定限制条件的二叉树。我们定义二叉树中每一结点的左子树高度减右子树高度为该结点的平衡因子(Balancefactor),所谓平衡树,是指一个二叉树其任一结点的平衡因子值只能是+1,0或-1,即任一结点的左、右子树高度之差不超过1。如图8.3所示,图中数字为该结点的平衡因子。第八章查找平衡树平衡二叉树不平衡二叉树第八章查找假设给平衡树某个结点的左子树插入一个新结点,且此新结点使左子树的高度加1,我们可能会遇到以下三种情况:(1)如果原来其左子树高度hl与右子树高度hr相等,即原来此结点的平衡因子等于0,插入新结点后将使平衡因子变成+1,但仍符合平衡树的条件,不必对其加以调整;⑵如果原来hl>hr,即原来此结点的平衡因子等于+1,插入新结点后将使平衡因子变成+2,破坏了平衡树的限制条件,需对其加以调整;⑶如果原来hl<hr,即原来此结点的平衡因子等于-1,插入新结点后将使平衡因子变成0,平衡更加改善,不必加以调整。第八章查找如果给平衡树某结点的右子树插入一个结点,且设此新结点使右子树的高度增加1,则也会遇到与之相对应的三种情况。以图8.4所示的树为例,设原已有关键字为51,29,72,11和46这五个结点,原树符合平衡树条件,图中各结点旁所标数字为该结点的平衡因子。第八章查找图8.4平衡树插入结点第八章查找插入新结点破坏了平衡树条件的情况分为两类,仍以向左子树插入新结点为例,这两类情况分别如图8.5(a)和(c)所示。图中矩形表示子树,矩形的高度表示子树的高度,带阴影线的方形则表示插入新结点后造成的子树高度加1,各结点旁所标数字为该结点的平衡因子。第八章查找图8.5平衡树的调整第八章查找第八章查找平衡树以二叉链表作为存储结构,每个结点还要增加一个平衡因子域。平衡树的查找运算与普通树型查找完全相同,由于平衡树附加了平衡条件,其高度与结点数相同的完全树属于同一数量级,所以有较快的查找速度。在插入新结点时,当确定了新结点应插入的位置后,需向回寻找有关平衡因子变为+2或-2的祖先,如有这种结点,则取其中层数居最低者,根据不同的情况进行单旋转或双旋转,使整个树仍然符合平衡树的条件,每次插入结点后,还需对有关祖先的平衡因子加以修改。第八章查找8.3.3B-树B-树的定义:

一棵m(m≥3)阶的B-树,或者为空树,或者是满足如下条件的m叉树:1.如果树非空,则根至少有1个关键字.2.除根结点外,每个结点中的关键字为

「m/2

-1~m-1.第八章查找3.结点中含有以下内容:n,A0,K1,A1,K2,……Kn,An其中,n为关键字个数Ki是关键字,Ai是指向子树的指针。关键字是递增的,即Ki<Ki+1,且Ai所指子树中所有结点的关键字均小于Ki+1,Ai+1所指子树中所有结点的关键字均大于Ki+1。所有的叶子结点都在同一层上,并且不带任何信息.第八章查找

图8.6一棵4阶B-树返回第八章查找1.B-树的查找例

第八章查找2.B-树的插入

基本思想:在B-树中插入一个关键字K时,要先找到关键字K应插入的结点P。若结点P中的关键字数小于「m/2

-1时,插入即可,否则,要把P分裂成两个结点P和P´。分裂方法:把旧结点P中的关键字和要插入的关键字K按大小顺序分成三部分:中间部分只有一个关键字,左右部分的关键字数量相等或只差一个关键字。中间的关键字上移到父结点中,左右部分为两个新的结点P和P´。例:第八章查找3.B-树的删除若删除的关键字在树的内部结点中,则可以和它的前驱(或后继)交换,再删除其前驱(或后继)。所以,只讨论如何从末端结点中删除关键字的问题。分三种情况:(1)若该结点的关键字个数大于「m/2

-1时,直接删除即可。例:第八章查找(2)若该结点的关键字个数等于「m/2

-1,但左兄弟(或右兄弟)结点的关键字数大于「m/2

-1,则可把左兄弟(右兄弟)中的最大的(最小的)关键字移至父结点中,将父结点中的有关关键字下移至该结点中。

例:第八章查找(3).若该结点的关键字数、左兄弟(或右兄弟)结点的关键字数都等于「m/2

-1,则要把该结点的左兄弟(或右兄弟)和其父结点中的有关关键字合并成一个新的结点。

例:第八章查找B+树定义:1.若结点中有n棵子树,就有n个关键字;2.所有叶子结点中包含了全部关键字的信息,及指向下一个叶子结点的指针,且叶子结点中的关键字按大小排列;3.所有内部结点可以看成索引部分,其中仅含有子树中最大(小)的关键字.

例:第八章查找8.4.1散列法散列法就是也称为哈希查找(Hashedsearch)或杂凑法。散列法的核心思想是将每个记录的地址与该记录的关键字之间建立某种函数关系,可直接由关键字查找到该记录,根据关键字求存储地址的函数称为散列函数,又称为哈希函数(HashedFunction),按散列存储方式构造的动态表又称散列表(hashedtable)。第八章查找设有关键字为1,3,7,12,1,定义一个散列函数为:h(k)=kmodp其中k为关键字,mod取余数,p为一整数。若取p=7,则h(1)=2,h(3)=4,h(7)=1,h(12)=6

第八章查找可能有不同的关键字计算出相同的函数值。例如,h(1)=2,(15)=2也就是不同记录占用同一地址单元,这种情况称为发生了冲突(collision)。若Ki≠Kj,但H(Ki)=H(Kj),则称Ki和Kj为同义词。713120123456第八章查找散列是一种重要的存储方法,又是一种查找方法。应用散列法存储记录的过程是对每个记录的关键字进行散列函数的运算,计算出该记录存储的地址,并将记录存入此地址中。查找一个记录的过程与存储记录的过程一样,就是对待查找记录的关键字进行计算,得到地址,并到此地址中查找记录是否存在。第八章查找8.4.2散列函数构造方法1.直接定址法:直接取关键字本身或者关键字加上一个常数作为散列地址。H(K)=KH(K)=a*K+b2.数字分析法:又称为数字选择法。适用于所有关键字事先都知道,并且关键字的位数比散列地址的位数多的情况,在这种情况下,可将各个关键字列出,分析它们的每一位数字,舍去各关键字取值比较集中的位,仅保留取值比较分散的位作为散列地址。第八章查找数字分析法例子第八章查找3.折叠法:折叠法是将关键字按要求的长度分成位数相等的几段,最后一段如不够长可以短些,然后把各段重叠在一起相加并去掉进位,以所得的和作为地址。第八章查找4.除留余数法:这是一种最简单也最常用的构造散列函数的方法,如h(k)=kmodp(p≤m)m:存放记录的表长

p的选择很重要,若选择的不好,可能产生太多的冲突。一般地,P应选则小于散列表长度的质数,或不包括小于20的质因数的合数。第八章查找8.4.3处理冲突的方法1.开放地址法:当插入的记录时,计算出来的地址已被其它记录占用时,要寻找其它尚未占用的单元。Hi(K)=(H(k)+di)%m(i=1,2,……,m)其

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论