c语言字符串数组和特殊矩阵.ppt

上传人：1*** IP属地：浙江上传时间：2020-03-24 格式：PPT 页数：65 大小：162.01KB 积分：20 举报 版权申诉

免费预览已结束，剩余60页可下载查看

 下载本文档

版权说明：本文档由用户提供并上传，收益归属内容提供方，若内容存在侵权，请进行举报或认领

文档简介

第4章字符串数组和特殊矩阵字符串字符串的模式匹配稀疏矩阵数组特殊矩阵 4 1字符串4 1 1字符串的基本概念字符串是由零个或多个字符构成的有限序列一般可表示成如下形式 c1c2c3 cn n 0 串中所含字符的个数n称为字符串的长度当n 0时称字符串为空串串中任意个连续的字符构成的子序列称为该串的子串包含子串的串称为主串通常称字符在字符串序列中的序号为该字符在串中的位置子串在主串中的位置以子串的第一个字符在主串中的位置来表示例如 T STUDENT S UDEN 则S是T的子串 S在T中出现的位置为3 两个字符串相等当且仅当两个串的长度相等并且各个对应位置的字符都相等例如 T1 REDROSE T2 REDROSE 由于T1和T2的长度不相等因此T1 T2 若T3 STUDENT T4 STUDENS 虽然T3和T4的长度相等但两者有些对应的字符不同因而T3 T4 值得一提的是若S 此时S由一个空格字符组成其长度为1 它不等价于空串因为空串的长度为0 4 1 2字符串类的定义ADTstring 数据对象D 由零个或多个字符型的数据元素构成的有限集合数据关系R 其中ai ai 1 D i 1 2 n 1 字符串的基本操作如下 1 Strcreate S 2 Strassign S T 3 Strlength S 4 Strempty S 5 Strclear S 6 Strcompare S1 S2 7 Strconcat S1 S2 8 Substring S i len 9 Index P T 10 Strinsert S i T 11 Strdelete S i len 12 Replace S T1 T2 13 Strdestroy S ADTstring 4 1 3字符串的存储及其实现1 串的顺序存储及其部分运算的实现串的顺序存储使用数组存放具体类型定义如下 defineMAXSIZE100typedefstruct charstr MAXSIZE intlength seqstring 1 插入运算strinsert S i T voidstrinsert seqstring S inti seqstringT intk if iS length 1 S length T length MAXSIZE printf connotinsert n else for k S length 1 k i 1 k S str T length k S str k for k 0 kstr i 1 k T str k S length S length T length S str S length 0 2 删除运算strdelete S i len voidstrdelete seqstring S inti intlen intk if iS length i len 1 S length printf cannotdelete n else for k i 1 len klength k S str k len S str k S length S length len S str S length 0 3 连接运算strconcat S1 S2 seqstring strconcat seqstringS1 seqstringS2 inti seqstring r if S1 length S2 length MAXSIZE printf cannotconcate return NULL else r seqstring malloc sizeof seqstring for i 0 istr i S1 str i for i 0 istr S1 length i S2 str i r length S1 length S2 length r str r length 0 return r 4 求子串运算substring S i len seqstring substring seqstringS inti intlen intk seqstring r if iS length i len 1 S length printf error n return NULL else r seqstring malloc sizeof seqstring for k 0 kstr k S str i 1 k r length len r str r length 0 return r 2串的链接存储及其部分运算的实现串的链接存储采用单链表的形式实现其中每个结点的定义如下 typedefstructnode chardata structnode next linkstrnode typedeflinkstrnode linkstring 例如串S abcde 其链接存储结构如下图所示 a b c d e S 1 创建字符串运算strcreate S voidstrcreate linkstring S charch linkstrnode p r S NULL r NULL while ch getchar n p linkstrnode malloc sizeof linkstrnode p data ch if S NULL S p elser next p r p r移向当前链接串的最后一个字符的位置 if r NULL r next NULL 处理表尾结点指针域 2 插入运算strinsert S i T voidstrinsert linkstring S inti linkstringT intk linkstringp q p S k 1 while p 3 删除运算strdelete S i len voidstrdelete linkstring S inti intlen intk linkstringp q r p S q null k 1 用p查找S的第i个元素 q始终跟踪p的前驱 while p else if q r S S p next 被删除的子串位于S的最前面 else 被删除的子串位于的中间或最后 r q next q next p next p next null while r null p r r r next free p 4 连接运算strconcat S1 S2 voidstrconcat linkstring S1 linkstringS2 linkstringp if S1 S1 S2 return elseif S2 S1和S2均不为空串的情形 p S1 用p查找S1的最后一个字符的位置 while p next p p next p next S2 将串S2连接到S1之后 5 求子串运算substring S i len linkstringsubstring linkstringS inti intlen intk linkstringp q r t p S k 1 用p查找S中的第i个字符 while p k 1 q r 用q始终指向子串的最后一个字符的位置 while p next 处理子串的尾部 4 2字符串的模式匹配寻找字符串p在字符串t中首次出现的起始位置称为字符串的模式匹配其中称p为模式 pattern t为正文 text t的长度远远大于p的长度 4 2 1朴素的模式匹配算法朴素模式匹配算法的基本思想是用p中的每个字符去与t中的字符一一比较正文t t1t2 tm tn模式p p1p2 pm如果t1 p1 t2 p2 tm pm 则模式匹配成功否则将p向右移动一个字符的位置重新用p中的字符从头开始与t中相对应的字符依次比较即 t1t2t3 tmtm 1 tnp1p2 pm 1pm如此反复直到匹配成功或者p已经移到使t中剩下的字符个数小于p的长度的位置此时意味着模式匹配失败表示t中没有子串与模式p相等我们约定返回 1代表匹配失败朴素模式匹配算法的具体实现如下 intindex seqstringp seqstringt inti j succ i 0 succ 0 succ为匹配成功的标志 while i t length p length 1 4 2 2快速模式匹配算法 KMP算法首先我们来分析下图所示的情况 t0t1t2 tktk 1tk 2 tr 2tr 1tr p0p1p2 pi 2pi 1pi 4 1 t0t1t2 tktk 1tk 2 tr 2tr 1tr p0p1 pi 2pi 1pi 4 2 t0t1t2 tktk 1tk 2 tr 2tr 1tr p0 pi 3pi 2pi 1pi 4 3 4 1 式表明此次匹配从p0与tk开始比较当比较到pi与tr时出现不等情况于是将模式右移一位变成 4 2 所示的状态若此次比较成功则必有p0 tk 1 p1 tk 2 pi 2 tr 1 且pi 1 pi 而根据 4 1 的比较结果有 p1 tk 1 p2 tk 2 pi 1 tr 1 因此有 p0 p1 p1 p2 pi 2 pi 1 这个性质说明在模式p中pi之前存在一个从p0开始长度为i 1的连续序列p0p1 pi 2和以pi 1为结尾长度同样为i 1的连续序列p1p2 pi 1其值对应相等即 p0p1p2 pi 2pi 1pi 简记为 p0 pi 2 p1 pi 1 称模式p中pi之前存在长度为i 1的真前缀和真后缀的匹配反之若在 4 1 所示的状态下模式p中pi之前存在长度为i 1的真前缀和真后缀的匹配即 p0 pi 2 p1 pi 1 且pi 1 pi 当pi与tr出现不等时根据前面已比较的结果p1 tk 1 p2 tk 2 pi 1 tr 1 于是可得p0 tk 1 p1 tk 2 pi 2 tr 1 因此接下来只需从pi 1与tr开始继续后继对应字符的比较即可再假设在 4 1 所示的状态下模式右移一位成为状态 4 2 后匹配仍然不成功说明 p0 pi 2 p1 pi 1 或pi 1 pi 于是模式再右移一位成为状态 4 3 若此次匹配成功仿照上述分析必有 p0p1p2 pi 3pi 2pi 1pi 即 p0 pi 3 p2 pi 1 说明模式p中pi之前存在长度为i 2的真前缀和真后缀的匹配由 4 3 表明在 4 1 所示的状态下若模式p中pi之前最长真前缀和真后缀匹配的长度为i 2 当pi与tr出现不等时接下来只需从pi 2与tr开始继续后继对应字符的比较考虑一般情况在进行模式匹配时若模式p中pi之前最长真前缀和真后缀匹配的长度为j 当pi tr时则下一步只需从pj与tr开始继续后继对应字符的比较而不应该将模式一位一位地右移也不应该反复从模式的开头进行比较这样既不会失去任何匹配成功的机会又极大地加快了匹配的速度根据上述分析在模式匹配过程中每当出现pi tr时下一次与tr进行比较的pj和模式p中pi之前最长真前缀和真后缀匹配的长度密切相关而模式p中pi之前最长真前缀和真后缀匹配的长度只取决于模式p的组成与正文无关于是我们可以针对模式p定义一个数组next m 其中next i 表示当pi tr时下一次将从pnext i 与tr开始继续后继对应字符的比较显然 next i 的值与模式p中pi之前最长真前缀和真后缀匹配的长度密切相关下面考虑如何根据模式p的组成求数组next的值我们规定 next 0 1这表明当p0 tr时将从p 1与tr开始继续后继对应字符的比较然而p 1是不存在的我们可以将这种情况理解成下一步将从p0与tr 1开始继续后继对应字符的比较以下假设next 0 next 1 next i 的值均已求出现要求next i 1 的值由于在求解next i 时已得到pi之前最长真前缀和真后缀匹配的长度设其值为j 即 p0p1p2 pi j pj 1pj pi 2pi 1pipi 1 如果此时进一步有pj pi 则pi 1之前最长真前缀和真后缀匹配的长度就为j 1 且next i 1 j 1 反之若pj pi 注意到求pi 1之前最长真前缀和真后缀匹配问题本质上仍然是一个模式匹配问题只是在这里模式和正文都是同一个串p而已因此当pj pi时应该检查pnext j 与pi是否相等若相等则next i 1 next j 1 如仍然不相等则再取pnext next j 与pi进行比较直至要将p 1与pi进行比较为止此时next i 1 0 以下给出了根据模式p的组成求数组next值的算法 voidgetnext seqstringp intnext inti j next 0 1 i 0 j 1 while i p length if j 1 p str i p str j i j next i j elsej next j for i 0 i p length i printf d next i 试求以下串的next数组值例1 abaabcac Next数组值 10011201 例2 ababaabab Next数组值 100123123 KMP算法基本思想如下假设以i和j分别指示正文t和模式p中正待比较的字符令i j的初值为0 若在匹配过程中ti pj 则i与j分别加1 否则i不变而j退到next j 的位置继续比较即j next j 若相等则指针各自增加1 否则j再退到下一个next j 值的位置依此类推直至下列两种可能 1 一种是j退到某个next next next j 时 ti与pj字符比较相等则i j指针各自增加1后继续进行比较 2 一种是j退到 1 即模式的第一个字符失配此时需将正文指针i向右滑动一个位置即从正文的下一个字符ti 1起和模式p重新从头开始比较 KMP算法的具体实现如下 intkmp seqstringt seqstringp intnext inti j i 0 j 0 while i t length 4 3数组4 3 1数组和数组元素数组是线性表的一种存储方式其实数组本身也可以看成是线性表的推广数组的每个元素由一个值和一组下标确定在数组中对于每组有定义的下标都存在一个与之相对应的值而线性表是有限结点的有序集合若将其每个结点的序号看成下标线性表就是一维数组向量当数组为多维数组时其对应线性表中的每个元素又是一个数据结构而已例如对于一个m n的二维数组A m n a00a01a02 a0 n 1 a10a11a12 a1 n 1 A a m 1 0a m 1 1 a m 1 n 1 当把二维数组看成是线性表时它的每一个结点又是一个向量一维数组例如上述二维数组A可以看成是如下的线性表 A0 A1 A2 Am 1 即A中每一行成为线性表的一个元素其中每个元素Ai 0 i m 1 都是一个向量 ai0 ai1 ai2 ai n 1 当然也可以将上述二维数组A看成如下的线性表 A0 A1 A2 An 1 即A中每一列成为线性表的一个元素其中每一个元素Ai 0 i n 1 都是一个向量 a0i a1i a2i a m 1 i 二维数组A中的每一个元素aij都同时属于两个向量即第i 1行的行向量和第j 1列的列向量因此每个元素aij最多有两个前驱结点a i 1 j和ai j 1 也最多有两个后继结点a i 1 j和ai j 1 只要这些结点存在特别地 a00没有前驱结点 a m 1 n 1 没有后继结点边界上的结点均只有一个后继结点或一个前驱结点对于m m 2 维数组可以依据上述规律类推 4 3 2数组类的定义ADTarray 数据对象D 具有相同类型的数据元素构成的有序集合数据关系R 对于n维数组其每一个元素均位于n个向量中每个元素最多具有n个前驱结点和n个后继结点数组的基本操作如下 1 Initarray A n index1 index2 indexn 2 Destroyarray A 3 Value A index1 index2 indexn x 4 Assign A e index1 index2 indexn ADTarray 4 3 3数组的顺序存储及实现由于数组是由有限的元素构成的有序集合数组的大小和元素之间的关系一经确定就不再发生变化因此数组均采用顺序存储结构实现它要求一片连续的存储空间存储多维数组数据元素的顺序存储有两种方式按行优先存储按列优先存储例如对于二维数组A m n a00a01 a0 n 1 a10a11 a1 n 1 A a m 1 0a m 1 1 a m 1 n 1 若将A按行优先存储其存储顺序为 a00 a01 a0 n 1 a10 a11 a1 n 1 a m 1 0 a m 1 1 a m 1 n 1 而按列优先存储其顺序为 a00 a10 a m 1 0 a01 a11 a m 1 1 a0 n 1 a1 n 1 a m 1 n 1 对于数组一旦确定了它的维数和各维的长度便可以为它分配存储空间当规定了数组元素的存储次序后便可根据给定的一组下标值求得相应数组元素的存储位置现假设数组中每个元素占用L个存储单元若考虑按行优先存储方式则上述A数组中任何一个元素aij的存储位置可以按以下公式确定 address aij address a00 i n j L若考虑按列优先的存储方式数组中任何一个元素aij存储位置的地址计算公式为 address aij address a00 j m i L 多维数组的存储也和二维数组一样存在两种存储方式按行优先和按列优先但由于多维数组中数据元素间的关系较二维数组复杂因此数据元素的地址计算公式也相对复杂些但两者所采用的原理是相同的考虑n维数组的情形 datatypeA b1 b2 bn 其中b1 b2 bn为数组每一维的长度仍假设每个元素占用L个单元则n维数组A中任何一个元素A j1 j2 jn 在按行优先存储方式下的地址计算公式为 address A j1 j2 jn address A 0 0 0 b2 b3 bn j1 b3 b4 bn j2 bn jn 1 jn L上式可以简写为 address A j1 j2 jn address A 0 0 0 c1 j1 c2 j2 cn jn其中cn L ci 1 bi ci 1 i n 以下以三维数组为例给出三维数组的顺序存储表示及其部分运算的实现 typedefintdatatype 假设数组元素的值为整型 typedefstruct datatype base 数组存储区的首地址指针 intindex 3 存放三维数组各维的长度 intc 3 存放三维数组各维的ci值 array 1 数组初始化运算initarray A b1 b2 b3 intinitarray array A intb1 intb2 intb3 intelements if b1index 0 b1 A index 1 b2 A index 2 b3 elements b1 b2 b3 A base datatype malloc elements sizeof datatype if A base return 0 A c 0 b2 b3 A c 1 b3 A c 2 1 return 1 2 访问数组元素值的运算value A i1 i2 i3 x intvalue arrayA inti1 inti2 inti3 datatype x intoff if i1 A index 0 i2 A index 1 i3 A index 2 return 0 处理下标非法的情况 off i1 A c 0 i2 A c 1 i3 A c 2 x A base off 赋值 return 1 3 数组元素的赋值运算assign A e i1 i2 i3 intassign array A datatypee inti1 inti2 inti3 intoff if i1 A index 0 i2 A index 1 i3 A index 2 return 0 处理下标非法的情况 off i1 A c 0 i2 A c 1 i3 A c 2 A base off e 赋值 return 1 4 4特殊矩阵本节主要研究对称矩阵三角矩阵和带状矩阵的压缩存储所谓压缩存储即为多个相同值的结点只分配一个存储空间值为零的结点不分配空间 4 4 1对称矩阵的压缩存储如果矩阵的行数和列数相等则称该矩阵为方阵若n n阶的方阵A满足 aij aji 0 i n 1 0 j n 1 则称矩阵A为对称矩阵在对称矩阵中几乎有一半元素的值是对应相等的如果将A中所有元素进行存储那将会造成空间的浪费且n值越大浪费将越严重对于对称矩阵压缩存储时只需存储对角线以上或对角线以下的部分未存储的部分可以利用元素之间的对称性来访问现考虑只存储对称矩阵A对角线以下的部分即下标满足i j的数组元素aij a00a10a11A a20a21a22 a n 1 0 a n 1 n 1 若采用按行优先的存储方式 A进行压缩存储后任何一个元素aij的地址计算公式为 address a00 i i 1 2 j L当i jaddress aij address a00 j j 1 2 i L当i j 4 4 2三角矩阵的压缩存储1 下三角矩阵a0000 0a10a110 0A a20a21a22 0 a n 1 0 a n 1 n 1 仍考虑采用按行优先方式 A中下三角部分的任何一个元素aij i j 压缩存储后的地址计算公式为 address aij address a00 i i 1 2 j L当i j与对称矩阵不同的是当i j时 aij的值为0 其没有对应的存储单元 2 上三角矩阵a00a01a02 a0 n 1 0a11a12 a1 n 1 A 00a22 a2 n 1 000 a n 1 n 1 对于上三角矩阵只需考虑存储对角线以上的部分对角线以下为0的部分无需存储仍采用按行优先存储方式矩阵A中被存储元素aij i j 在压缩存储方式下的地址计算公式为 address aij address a00 n n 1 n 2 n i 1 j i L address a00 i n i 1 i 2 j i L而当i j时 aij的值为0 其没有对应的存储空间 4 4 3带状矩阵的压缩存储对于n n阶方阵若它的全部非零元素落在一个以主对角线为中心的带状区域中这个带状区域包含主对角线下面及上面各b条对角线上的元素以及主对角线上的元素那么称该方阵为半带宽为b的带状矩阵带状矩阵的特点是对于矩阵元素aij 若i j b或j i b 即 i j b 则aij 0 b条对角线b条对角线主对角线例 2037200014253045001114354250016202610280071583000291655 带状矩阵进行压缩存储时只存储带状部分内部的元素对于带状区域以外的元素即 i j b的aij 均不分配存储空间为了方便起见我们规定按如下方法进行存储除第一行和最后一行外每行都分配2b 1个元素的空间将带状区域中的元素存储于 2b 1 n 2b L个存储单元之中其中L为每个元素占用空间的大小仍考虑采用按行优先的存储方式于是可以得到带状区域中任何一个元素aij的地址计算公式为 address aij address a00 i 2b 1 b j i b L address a00 i 2b 1 j i L 当 i j b时 address a34 1 3 2 2 1 4 3 1 17 4 5稀疏矩阵如果一个矩阵中很多元素的值为零即零元素的个数远远大于非零元素的个数时称该矩阵为稀疏矩阵 4 5 1稀疏矩阵类的定义ADTspmatrix 数据对象D 具有相同类型的数据元素构成的有限集合数据关系R D中的每个元素均位于2个向量中每个元素最多具有2个前驱结点和2个后继结点且D中零元素的个数远远大于非零元素的个数稀疏矩阵的基本运算如下 1 Createspmatrix A 2 compressmatrix A B 3 Destroyspmatrix A 4 Printspmatrix A 5 Copyspmatrix A B 6 Addspmatrix A B C 7 Subspmatrix A B C 8 Multspmatrix A B C 9 Transpmatrix B C 10 locatespmatrix A x rowx colx ADTspmatrix 4 5 2稀疏矩阵的顺序存储及其实现稀疏矩阵的顺序存储方法包括三元组表示法带辅助行向量的二元组表示法和伪地址表示法其中以三元组表示法最常用故在此主要介绍稀疏矩阵的三元组表示在三元组表示法中稀疏矩阵的每个非零元素可以采用如下形式表示 i j value 其中i表示非零元素所在的行号 j表示非零元素所在的列号 value表示非零元素的值采用三元组表示法表示一个稀疏矩阵时首先将它的每一个非零元素表示成上述的三元组形式然后按行号递增的次序同一行的非零元素按列号递增的次序将所有非零元素的三元组表示存放到一片连续的存储单元中即可以下是稀疏矩阵A7 6及其对应的三元组表示 B012076700 5010102 50002002041300000313200000042031200000540120000046554002100076221稀疏矩阵AA的三元组表示稀疏矩阵A及其对应的三元组表示矩阵B的数据类型定义如下 typedefstruct intdata 100 100 存放稀疏矩阵的二维数组 intm n 分别存放稀疏矩阵的行数和列数 matrix typedefintspmatrix 100 3 稀疏矩阵对应的三元组表示的类型 1 产生稀疏矩阵三元组表示的算法voidcompressmatrix matrixA spmatrixB inti j k 1 for i 0 i A m i for j 0 j A n j if A data i j 0 B k 0 i B k 1 j B k 2 A data i j k B 0 0 A m B 0 1 A n B 0 2 k 1 2 求稀疏矩阵的转置算法transpmatrix B C 按照矩阵转置的定义要实现矩阵的转置只要将矩阵中以主对角线为对称轴的元素aij和aji的值互换但三元组的排列要求采用按行优先方式如果只是简单地将非零元素的行号和列号交换则新产生的三元组表示将不再满足按行优先的原则解决的办法是首先确定B中每一列非零元素的个数也即将来C中每一行非零元素的个数从而可计算出C中每一行非零元素三元组的起始位置这样便可实现将B中的非零元素交换行号和列号后逐一放到它们在C中的最终位置上了为了求B中每一列非零元素的个数和C中每一行非零元素三元组的起始位置可以设置两个数组x和y来实现相应的功能 voidtranspmatrix spmatrixB spmatrixC inti j t m n intx 100 用来存放B中每一列非零元素的个数 inty

人人文库> 全部分类> 行业资料 > 信息产业

温馨提示

1. 本站所有资源如无特殊说明，都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2. 本站的文档不包含任何第三方提供的附件图纸等，如果需要附件，请联系上传者。文件的所有权益归上传用户所有。
3. 本站RAR压缩包中若带图纸，网页内容里面会有图纸预览，若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 人人文库网仅提供信息存储空间，仅对用户上传内容的表现方式做保护处理，对用户上传分享的文档内容本身不做任何修改或编辑，并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容，请与我们联系，我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

c语言字符串数组和特殊矩阵.ppt

文档简介

温馨提示

最新文档

评论

c语言字符串数组和特殊矩阵.ppt

文档简介

温馨提示

最新文档

评论

相关文档