数据结构:chapter4串、数组和广义表_第1页
数据结构:chapter4串、数组和广义表_第2页
数据结构:chapter4串、数组和广义表_第3页
数据结构:chapter4串、数组和广义表_第4页
数据结构:chapter4串、数组和广义表_第5页
已阅读5页,还剩48页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第四章串、数组和广义表可表示为:(a1,a2,……,an)线性结构第2章线性表第3章栈和队列第4章串、数组和广义表

2串比较,strcmp(chars1,chars2)串复制,strcpy(charto,charfrom)串连接,strcat(charto,charfrom)求串长,strlen(chars)

……调用标准库函数#include<string.h>补充:C语言中常用的串运算3第4章串、数组和广义表4.1串4.2数组4.3广义表

教学内容41.掌握串的存储方法,理解串的两种模式匹配算法;2.明确数组和广义表这两种数据结构的特点,掌握数组存储时地址计算方法,了解几种特殊矩阵的压缩存储方法。

教学目标1.了解串的存储方法,理解串的两种模式匹配算法,重点掌握BF、KMP算法。2.明确数组和广义表这两种数据结构的特点,掌握数组地址计算方法,了解几种特殊矩阵的压缩存储方法。3.掌握广义表的定义、性质及其GetHead和GetTail的操作。54.1串串(String)----零个或多个字符组成的有限序列串名串值串长n空串n=06a=‘BEI’,b=‘JING’

c=‘BEIJING’

d=‘BEIJING’子串字符位置主串子串位置串相等空格串7数据对象:数据关系:基本操作:(1)

StrAssign(&T,chars)//串赋值(2)StrCompare(S,T)//串比较(3)StrLength(S)//求串长(4)Concat(&T,S1,S2)//串联ADTString{串的抽象数据类型8

(5)SubString(&Sub,S,pos,len)//求子串

(6)StrCopy(&T,S)//串拷贝

(7)StrEmpty(S)//串判空

(8)ClearString(&S)//清空串

(9)Index(S,T,pos)//子串的位置

(10)Replace(&S,T,V)//串替换

(11)StrInsert(&S,pos,T)//子串插入

(12)StrDelete(&S,pos,len)//子串删除

(13)DestroyString(&S)//串销毁}ADTString9顺序存储链式存储串的存储结构10typedefstruct{char*ch;//若串非空,则按串长分配存储区,//否则ch为NULLintlength;//串长度}HString;

顺序存储表示11链式存储表示12#defineCHUNKSIZE80//可由用户定义的块大小typedefstructChunk{charch[CHUNKSIZE];structChunk*next;}Chunk;typedefstruct{Chunk*head,*tail;//串的头指针和尾指针

intcurlen;//串的当前长度}LString;

链式存储表示13优点:操作方便缺点:存储密度较低可将多个字符存放在一个结点中,以克服其缺点实际分配的存储位串值所占的存储位存储密度=链式存储表示算法目的:BF算法(又称古典的、经典的、朴素的、穷举的)KMP算法(特点:速度快)算法种类:确定主串中所含子串第一次出现的位置(定位)即如何实现教材P72Index(S,T,pos)函数串的模式匹配算法15

S:ababcabcacbabT:abcijS:ababcabcacbab T:abcS:ababcabcacbabT:abci指针回溯BF算法设计思想16将主串的第pos个字符和模式的第一个字符比较,若相等,继续逐个比较后续字符;若不等,从主串的下一字符起,重新与模式的第一个字符比较。直到主串的一个连续子串字符序列与模式相等。返回值为S中与T匹配的子序列第一个字符的序号,即匹配成功。否则,匹配失败,返回值0BF算法设计思想Index(S,T,pos)17intIndex(SstringS,SstringT,intpos){i=pos;j=1;while(i<=S[0]&&j<=T[0]){if(S[i]=T[j]){++i;++j;}else{i=i-j+2;j=1;}if(j>T[0])returni-T[0];elsereturn0;}BF算法描述(算法4.1)18若n为主串长度,m为子串长度,最坏情况是BF算法时间复杂度主串前面n-m个位置都部分匹配到子串的最后一位,即这n-m位各比较了m次最后m位也各比较了1次总次数为:(n-m)*m+m=(n-m+1)*m若m<<n,则算法复杂度O(n*m)例:S=‘0000000001’,T=‘0001’,pos=119字符串的改进模式匹配算法TS≠Tcdabcdbaecdabcdbae例子:T中重复出现abcd,但是e和x不匹配时,可直接向右滑动4个字符开始匹配,可少匹配4趟cdabcdba…x…20字符串的改进模式匹配算法TSp2p3…pj-3pj-2pj-1pjp1p0si+2si+3…si+j-3si+j-2si+j-1si+jsi+1si……≠========p2p3…pj-3pj-2p1p0p2p3…pj-3p1p0设S[i,i+j-1]=T[0,j-1],但S[i,i+j]≠T[0,j]TT若T[0,j-2]≠T[1,j-1],可少匹配1趟若又T[0,j-3]≠T[2,j-1],可少匹配2趟p2…pj-4p1p0T若又T[0,j-4]≠T[3,j-1],可少匹配3趟……类推直到前缀T[0,k+1]≠

后缀T[j-k-2,j-1]但是前缀T[0,k]=后缀T[j-k-1,j-1]时,可少匹配j-k-1趟,相当于T直接向右滑动j-k-1个字符21字符串的改进模式匹配算法对模式串T进行预处理,计算可以滑过多少个字符-1,当

j=

0k+1,当

0≤k<j-1,且使p0p1…pk=pj-k-1pj-k…pj-1的最大数next(j)=0,其他情况Tcdabcdbae下标j234567108next(j)0001230-14next(j)直观含义:[0,j-1]中前缀和后缀相等的最大长度next(j)直观作用:可滑过j-next(j)位不用匹配22字符串的改进模式匹配算法对模式串T进行预处理,计算可以滑过多少个字符-1,当

j=

0k+1,当

0≤k<j-1,且使p0p1…pk=pj-k-1pj-k…pj-1的最大数next(j)=0,其他情况TS≠Tcdabcdbaecdabcdbaecb……next(j)=-1表示匹配失败时,S的指针加1,T的指针指向p[0]next(j)=k+1表示匹配失败时,T的指针指向p[k+1],next(j)=0表示匹配失败时,T的指针指向p[0]此例中模式串T的next[0]=-1,S指针加1,T指向p[0],即S中c与T中p[0]=a进行比较23字符串的改进模式匹配算法对模式串T进行预处理,计算可以滑过多少个字符-1,当

j=

0k+1,当

0≤k<j-1,且使p0p1…pk=pj-k-1pj-k…pj-1的最大数next(j)=0,其他情况TS≠Tcdabcdbaecdabcdbaecdabcdba…x…next(j)=-1表示匹配失败时,T的指针加1,P的指针指向p[0]next(j)=k+1表示匹配失败时,P的指针指向p[k+1],next(j)=0表示匹配失败时,P的指针指向p[0]此例中模式串T的next[8]=4,S中x直接与T中p[4]=a比较24字符串的改进模式匹配算法对模式串T进行预处理,计算可以滑过多少个字符-1,当

j=

0k+1,当

0≤k<j-1,且使p0p1…pk=pj-k-1pj-k…pj-1的最大数next(j)=0,其他情况TS≠Tcdabcdbaecdabcdbaecxba……next(j)=-1表示匹配失败时,T的指针加1,P的指针指向p[0]next(j)=k+1表示匹配失败时,P的指针指向p[k+1],next(j)=0表示匹配失败时,P的指针指向p[0]此例中模式串T的next[3]=0,S中x直接与T中p[0]=a比较25字符串的改进模式匹配算法对模式串T进行预处理,计算可以滑过多少个字符26-1,当

j=

0k+1,当

0≤k<j-1,且使p0p1…pk=pj-k-1pj-k…pj-1的最大数next(j)=0,其他情况可按定义直接计算next,下面介绍一种快速的计算next的方法假设已知next(j)=x,现在计算next(j+1)若px=pj,则next(j+1)=x+1=next(j)+1否则,设next(x)=h,(此时有p[0,h-1]=p[x-h,x-1]=p[j-h,j-1])

若ph=pj,则next(j+1)=h+1

否则,令next(h)=t,(此时有p[0,t-1]=p[h-t,h-1]=p[j-t,j-1])

继续判断是否pt=pj,直到找到或者到next(0)=-1……j=0;k=-1;next[0]=-1;while(j<pLength){if(k==-1||ch[j]==ch[k]){j++;k++;next[j]=k;}elsek=next[k];}字符串的改进模式匹配算法对模式串T进行预处理,计算可以滑过多少个字符-1,当

j=

0k+1,当

0≤k<j-1,且使p0p1…pk=pj-k-1pj-k…pj-1的最大数next(j)=0,其他情况可按定义直接计算next,下面介绍一种快速的计算next的方法j=0;k=-1;next[0]=-1;while(j<pLength){if(k==-1||ch[j]==ch[k]){j++;k++;next[j]=k;}elsek=next[k];}Pabcabababaxnext(j)0120120-134?下标j234567108910≠=next(10)=2+1=327字符串的改进模式匹配算法对模式串T进行预处理,计算可以滑过多少个字符-1,当

j=

0k+1,当

0≤k<j-1,且使p0p1…pk=pj-k-1pj-k…pj-1的最大数next(j)=0,其他情况可按定义直接计算next,下面介绍一种快速的计算next的方法j=0;k=-1;next[0]=-1;while(j<pLength){if(k==-1||ch[j]==ch[k]){j++;k++;next[j]=k;}elsek=next[k];}Pabcabababexnext(j)0120120-134?下标j234567108910≠≠≠,-1next(10)=028KMP(KnuthMorrisPratt)算法/~knuth/《计算机程序设计艺术第1卷基本算法》

《计算机程序设计艺术第2卷半数值算法》《计算机程序设计艺术第3卷排序与查找》29利用已经部分匹配的结果而加快模式串的滑动速度,且主串S的指针i不必回溯!可提速到O(n+m)!S=‘ababcabcacbab’T=‘abcac’S=‘ab

abca

bcacbab’T=‘abca

c’S=‘ab

abcabcacbab’T=‘abcac’iiikk

a

b

aa

b

ckiiKMP算法例子30串操作应用举例--文本编辑文本可被看作一个字符串,称为文本串页则是文本串的子串行又是页的子串。页号起始行号页表…………行号起始地址长度行表…………31本节所讨论的数组与高级语言中的数组区别:高级语言中的数组是顺序结构;而本章的数组既可以是顺序的,也可以是链式结构,用户可根据需要选择。4.2数组32数组的抽象数据类型数据对象:数据关系:ADTArray{33

(1)InitArray(&A,n,bound1,boundn)//构造数组A(2)DestroyArray(&A)//销毁数组A(3)Value(A,&e,index1,…,indexn)//取数组元素值

(4)Assign(A,&e,index1,…,indexn)//给数组元素赋值基本操作:}ADTArray34一维数组352749186054778341020123456789llllllllll

LOC(i)=LOC(i-1)+l=a+i*lLOC(i)=

LOC(i-1)+l=a+i*l,i>0

a,i=0

a+i*la35二维数组36以行序为主序C,PASCAL数组的顺序存储以列序为主序FORTRAN38

a[n][m]设数组开始存放位置LOC(0,0)=a

LOC(j,k)=a+j*m+k二维数组的行序优先表示39②③三维数组按页/行/列存放,页优先的顺序存储

①a[m1][m2][m3]

各维元素个数为

m1,m2,m3

下标为i1,i2,i3的数组元素的存储位置:

LOC(i1,i2,i3)=a+

i1*m2*m3+i2*m3+i3前i1页总元素个数第i1页的前i2行总元素个数第i2行前i3列元素个数三维数组41

各维元素个数为

m1,m2,m3,…,mn

下标为i1,i2,i3,…,in

的数组元素的存储位置:

n维数组42n维数组43设有一个二维数组A[m][n]按行优先顺序存储,假设A[0][0]存放位置在644(10),A[2][2]存放位置在676(10),每个元素占一个空间,问A[3][3](10)存放在什么位置?脚注(10)表示用10进制表示。设数组元素A[i][j]存放在起始地址为Loc(i,j)的存储单元中∵Loc(2,2)=Loc(0,0)+2*n+2=644+2*n+2=676.∴n=(676-2-644)/2=15∴Loc(3,3)=Loc(0,0)+3*15+3=644+45+3=692.练习44设有二维数组A[10,20],其每个元素占两个字节,A[0][0]存储地址为100,若按行优先顺序存储,则元素A[6,6]的存储地址为

,按列优先顺序存储,元素A[6,6]的存储地址为

。练习352232(6*20+6)*2+100=352(6*10+6)*2+100=232451.什么是压缩存储?若多个数据元素的值都相同,则只分配一个元素值的存储空间,且零元素不占存储空间。2.什么样的矩阵能够压缩?

一些特殊矩阵,如:对称矩阵,对角矩阵,三角矩阵,稀疏矩阵等。3.什么叫稀疏矩阵?矩阵中非零元素的个数较少(一般小于5%)特殊矩阵的压缩存储464.3广义表

广义表(列表):n(0)个表元素组成的有限序列,记作LS=(a0,a1,a2,…,an-1)

LS是表名,ai是表元素,它可以是表(称为子表),可以是数据元素(称为原子)。

n为表的长度。n=0的广义表为空表。47线性表的成分都是结构上不可分的单元素广义表的成分可以是单元素,也可以是有结构的表

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论