第三章算法与数据结构.ppt

上传人：m*** IP属地：河南上传时间：2020-01-27 格式：PPT 页数：135 大小：2.49MB 积分：20 举报 版权申诉

已阅读5页，还剩130页未读，继续免费阅读

版权说明：本文档由用户提供并上传，收益归属内容提供方，若内容存在侵权，请进行举报或认领

文档简介

第三章算法与数据结构程序为什么能解题就是它能把输入的数据经过表达式计算赋值置换转移等一系列计算步骤最后得到输出编制程序就是要设计数据输入的输出的中间的然后针对这些数据一一安排计算步骤即所谓算法所以很早就有人说程序计算的本质是程序算法数据结构第三章算法与数据结构程序算法数据结构算法和数据结构讨论的是抽象的计算逻辑与具体的表示法无关可以用图形伪代码和汇编语言高级程序设计语言表达它们一般讨论中采用近似于高级语言的伪代码不能上机运行可以方便地转成编程语言代码表达本章讨论编程最重要的两个基础即算法与数据结构 3 1算法算法是什么就字面而言是计算解题的办法是解题策略具体化为计算机的动作即计算机在什么情况下应该怎么做的一系列步骤实施了这些步骤问题得到解决计算机容许的动作是为变量赋值包括初值计算表达式在变量上做四则或逻辑运算计算过程的选择循环转移控制调用函数子程序例如辗转相除法是求两个整数的最大公约数的数学算法它的解题策略是以小数除大数得余数如果余数不为零则小数成被除数余数成除数除后得新余数若余数为零则此除数即为最大公约数否则继续辗转除不妨先拿两个正整数试一试 544和119 544 119的余数是68 119 68的余数是51 68 51的余数是17 51 17的余数是0 所以544和119的最大公约数是17 如何写出计算机算法呢计算机怎么进行辗转相除呢显然只能用计算机容许的动作写出的算法才是可行的看如何写出计算机的辗转相除法见课本62页令变量x为被除数 y为除数 z为余数计算机中有求余函数mod 则 z xmody然后x y y z就换过来了 x依然是被除数 y是除数于是写出最大公约数 GCD 算法 1 设定x y z2 输入x y3 ify xthenz y y x x zfi4 whiley0doA z yB y xmody C x zod5 输出z 即最大公约数其中if then fi whiledo od是分支和循环控制 fi 和 od 是编程语言Endif和Endwhile的简写其实也可以看出if fi do od 是赋值符号其中的序号按1 2 3 和A B C 字母数字相间表示嵌套第5步这一行最后的表示算法结束这种表示法是算法文献上学者们约定的表示法 3 1 1算法的表示从GCD算法的例子看到它的表达比较自由不过是自然语言加上编程语言的基本特征控制结构赋值调用而已很自然地读者就会问到算法描述语言和编程语言有什么关系事实上早期的编程语言ALGOL就叫算法语言后来发现用编程语言描述算法往往使人们陷于表示的细节因为编程语言的形式化即正规性过于严格而在设计程序的早期人们关心的是程序逻辑能否解题而不是立即上机运行于是先用伪代码写设计再用编程语言编码实现这个设计编码这样写的时候要求不那么严格 3 1 1算法的表示算法描述的是程序的计算逻辑编程语言表达的是程序本体源代码更形象地说一个是灵魂一个是包含有灵魂的肉体设计过程也是人们对这个问题更深入了解的过程反复修改是必然的何不先设计修改好了一次翻译编码成功呢于是先设计后编码是早期软件行业不成文的行规直到现在软件开发依然强调设计和编程是两个不同阶段只是由于开发工具的完善伪代码越来越近似于最后实现的编程语言甚至有些简单编程直接用编程语言如VB VC在窗口上进行伪代码始终没有统一的标准类C 类Pascal 类VB之类的伪代码也不尽相同但程序员必须记住用伪代码写算法编程语言写程序还是应该遵循的本书约定的算法描述语言是VC语言的变体称为类VC语言见课本63页这里还需要说一说流程图 FlowChart 因为它在历史上有过巨大的影响在20世纪50 70年代结构化编程语言尚未风行时流程图一直是表达算法的设计工具美国国家标准协会 ANSI 还把它定为标准为了帮助读者阅读历史的软件文档这里做一点简单说明图3 1常用流程图符号如图3 1所示其中带圆弧的框是起止框表示算法的起始终止框内填写文字圆圈一般是连接框连接多个流向箭头大圈中写文字标号无文字时是句号大小的圈平行四边形的输入输出框表示输入数据和输出计算结果框内应填写需要输入或输出的量有的标准将输出画成打印纸形状菱形的判断框根据条件判断执行的走向框内应填上条件矩形的处理框表示执行计算表达式和赋值操作框内用文字或符号表明具体实现的操作双立边矩形框是调用引用框框内写函数过程名注释框表示对操作或数据做必要的说明框内用文字说明注释信息流向线表示算法中控制的流向向下向右可不画箭头其他方向必画画流程图时主流程必须在一条垂直的轴线上特别是起止框要对齐切勿因有多次分支而将主流程画成台阶形或横宽大于纵长 3 1 2算法的定义仍回到上述GCD算法的例子以它来说明E Knuth对算法作的定义一个算法就是一个有穷规则的集合规则规定了解决某类问题的运算序列它是有穷的确定的能行的并有0到多个输入和1到多个输出现解释如下运算序列体现了解题规则GCD算法例子中运算是广义的就是计算机可执行的操作不单指计算值 0到多个输入 1到多个输出没有输入输出的计算是没有意义的这里只需解释 0个输入不是无输入而是变量已有初值或缺省值算法执行时不另要求输入这是极为常见的例如公司的正式文件每页都要打上公司的商标其缺省位置是左上角每次调用打印程序无需输入坐标参数有穷的指算法实施的规则是有穷的也就是执行了有限个步骤即结束无限步骤即不终止就不能称之为算法只能是称为算法模型的计算方法数学中有些计算方法在界定收敛条件之前是不终止的确定的指算法的每一步骤都有确切的定义和解释所以算法描述语言力求形式化无二义性解释编程语言当然是形式语言但如前所述太烦琐多采用伪代码能行的指算法中的每一步骤均能准确实施也指可以证明整个算法实施后可以得到预期的解 3 1 3算法与建模每个程序都包含了算法设计程序首先作算法设计就是把解题策略具体化那么解题策略由何而来这就需要建立计算模型前述的辗转相除求最大公约数既是模型两个整数辗转相除又是解题策略不妨再举个例子例3 1求整数1 N之和这是数学家高斯小时候回答教师求1 100之和是多少的做法数据模型是整数1 100数组求和模型如图所示把 1 99 2 98 3 97 成对先加共49个100 再加上50和100 换成数学表示N N 2 1 N 2 N N N 1 2这就是求和模型的数学描述也称数学模型代入数字得到结果100 101 2 5050 按照这个公式写出算法的伪代码是极简单的 voidsum1 cinns n n 1 2couts 这个题目也可以直接按公式模拟人们做累加伪代码如下 voidsum2 cinni 1 s 0while i n do s s ii i 1loopcouts 算法Sum1和Sum2显然不同一个只做加法一个有加乘除法运算速度不一样一个用三个变量一个只用两个存储单元耗用不同对于复杂的计算它们的差别就非常巨大了算法分析就是专门研究算法时空效率的它们的不同在于所取计算模型不同一个是总结出的数学模型一个是模拟自然数序列增长的过程模型当然最常见的稍微复杂一点算法多采用结构模型有了模型就可以在它上面思考算法请注意同一模型可以有多个不同的改进算法后文的数据结构就是研究有哪些典型的结构关系及其算法建立什么模型才易设计算法呢这要取决于问题的性质和分析人员的水平常见有以下三种模型数学模型最易写算法的模型且准确简单不易出错各种数学类型都有成熟的计算方法可惜并不是所有问题都能找出数学公式建立数学模型过程模拟模型这是处理日常业务问题算法的常用模型结构模型已如前述每个结点可以是一种处理动作每一个边是输出输出反过来每个结点也可以是数据的状态每个边是一种处理的动作结构模型虽没有数学模型简单清晰深刻但比过程模拟模型要明确得多是设计算法时常用的 3 1 4算法的优劣同样模型同样结果可以有不同的算法过程其差别表现在运算次数占用存储多少课本69页有例子例3 3荷兰国旗问题给出了三种不同算法这个例子说明计算模型数据结构算法既相关又独立模型给出算法的思路数据结构是算法作用的对象算法有其自身的好坏时空效率 3 1 4算法的优劣续算法复杂性包含多种评价条件时间空间正确简单算法的时间复杂性单次运行时间长短比较买一次车票排队等待时间多次运行平均运行时间的比较例如你每次去银行等待时间的平均值时间复杂性的度量在实践中很重要的参数与n成正比还是与n 成正比天差地远 3 1 5常用算法设计算法的步骤是先弄清问题建立计算模型设计实现这种模型的数据结构再设计使数据变化达到要求的动作步骤证明或验证算法正确再查看有无更好的改进一个好算法常常是深思熟虑多次改进的结果对于初学者先解决有无再解决好坏为此本小节提供一些常用算法模型既可以解决一些问题又是组合更复杂算法的思路枚举法枚举亦称穷举是最笨但最可靠的办法计算机无知觉它根据你给的条件无一遗漏地做一遍总可以找到解生活中这种办法也不少见如公安局根据少量特征把全市符合该特征的人查一遍以搜捕重要逃犯工作量巨大近乎蛮干但是它是没有其他办法时的最好办法计算机因为速度快可以以快补拙所以常用这种方法枚举法作为一种具体的算法还可以解决常规方法不易解决的问题例如百元买百鸡这个古老的问题例3 4公鸡每只五元母鸡每只三元小鸡三只一元问百元买百鸡有几种买法可以写出代数方程式 x y z 1005x 3y z 3 100再也找不出方程了那么两方程怎么解三个未知数这类问题只好用枚举法因为公鸡最多20只母鸡最多33只一一枚举其组合若余下的只数能与钱数匹配就是一个解全部枚举可以找出所有的解枚举法的程序一般简单但有时运算量大如果能找到明知枚举无结果的限定规则缩小枚举范围这种方法还是很有效的迭代法在科学计算领域人们时常会遇到求解方程f x 0或微分方程的数值解等计算问题可是人们却很难或无法用像一元二次方程的求根公式那样的解析解法又称直接求解法例如一般的一元五次或更高次方程几乎所有的超越方程它们的解都无法用解析方法表达出来为此人们只能用数值方法也称数值计算方法求出问题的近似解若近似解的误差可以估计和控制且迭代的次数也为人们可以接受它就是一种数值近似求解的好方法它既可以用来求解代数方程又可以用来求解微分方程使一个复杂问题的求解过程转化为相对简单的迭代算式的重复执行过程下面以方程求根f x 0为例说明迭代法的基本思想首先把求解方程变换成为迭代算式x g x 然后从事先估计的一个根的初始近似值x0出发用迭代算式xk 1 g xk 求出另一个近似值x1 再由x1确定x2 最终构造出一个迭代序列 x0 x1 x2 xn 来逐次逼近方程f x 0的根显然迭代过程就是通过老值求出新值用新值替代老值的过程对于一个收敛的迭代过程有时也要经过千百次迭代才可以得到准确解但实际计算时只能作有限次迭代因此要精选迭代算式研究算式的收敛性及收敛速度如果一时找不出收敛的算式也可以用迭代算法例3 5终止循环的条件两次得到的近似值之差的绝对值小于预先给定的误差值递归法数学上有许多函数是用函数本身定义的例如阶乘函数 fact n n n n 1 n 2 1 n fact n 1 用其自身定义非常自然递归算法往往是对问题更本质的描述在计算技术中它占有重要地位写递归算法的程序极其简单看上去几乎和递归的数学公式一样只是注意递归出口自己调用自己何时才了阶乘函数写成伪代码是 Funcfact n Integer 这是定义的接口If n 0orn 1 fact 1 出口条件Elsefact n fact n 1 是递归调用 n不断减少EndFunc递归算法一般要先问是否满足出口递归函数放在Else部分可以设想它的执行情况从n n 1 一直连乘到1 而不是相反在非数值计算中用递归建立计算模型写算法也很简单举河内塔为例例3 619世纪欧洲人到东方看到Bramah神庙里有个和尚整天把三根柱子上的金盘倒来倒去原来他是想把一个柱子上64个从下至上逐个缩小的金盘从一个柱子移到另一个柱子规定每次移一个而且小盘永远在大盘上据说全部移完之后就是世界末日梵天再世但是无论他倒了多少天总没有什么进展这个装置引起欧洲人极大兴趣后来传到欧洲作为馈赠的玩物叫河内塔河内塔移动规则简单但移动次数实在惊人 64个盘子其移动的次数是次比以秒计的地球年龄1 89 1017都大当然计算机移动一次不会要一秒钟那么编一个程序让机器作也许能多做几个为找到这个问题的算法先画出图试走几个盘大家很快就可以想到要使n个盘从1柱移到2柱得先把n 1个盘移到3柱那么第n个盘最大盘就可以从1柱移到2柱至于如何把n 1个盘从1柱移动到3柱暂时不管第n盘移完之后按同样方式再将n 1个盘从3柱移到2柱于是n个盘从1柱移到2柱的任务就完成了草拟算法是 MoveTower N 1 2 CallMoveTower N 1 1 3 CallMoveDisk 1 2 CallMoveTower N 1 3 2 其中过程MoveTower的参数依次表示要把几个盘子从起始柱搬到目的柱过程MoveDisk的参数表示把一个盘子从起始柱移到目的柱移动N个盘的任务变成两个移动N 1个盘的任务加上一个有效的移盘动作看来这个问题似乎没解决移动N个和N 1个差不多到底如何移动还是不知道其实这个问题已经解决了把MoveTower N 1 1 3 这个新任务如法炮制把2柱当成过渡柱也可以变为两个子任务加一个MoveDisk 1 3 的动作如此做下去每次移动盘子的任务减1 直到0个盘子时就没有任务了剩下的全部是动作递归算法的内容就这三步递归程序能自动地做到0个任务为止可以拿三个盘子检验一下这个递归算法可以看到当任务为0时剩下的全是动作从上往下数是 1 2 1 3 2 3 1 2 3 1 3 2 1 2和实际复核的完全一样在写算法时只要把柱名改成变量就可以自动改变其值再加上递归终止条件可以得到 MoveTower N From To Using Integer If N 0 PrintFrom ToElseCallMoveTower N 1 From Using To CallMoveDisk From To CallMoveTower N 1 Using To From 这是一个典型的递归算法自己调用自己它从递归给定参数出发如例中N个递归到达边界 N 0 递推法所谓递推法它的数学公式也是递归的只是在实现计算时迭代方向相反从给定边界出发逐步迭代到达指定计算参数它不需反复调用自己节省了很多调用参数匹配开销效率较高还是以解阶乘函数为例其递推过程是 f 0 0 1f 1 1 1 f 0 1f 2 2 2 f 1 2f 3 3 3 f 2 6 f n n n n 1 n f n 1 写出伪代码算法是 Funcfact1 N Integer IntegerIf N 0orN 1 fact1 1Else 1Do fact1 fact1 I I I 1 此处是变量引用而不是函数调用 hile EndFunc再看一个Fibonacci数列的例子 Fib 1 1Fib 2 1Fib n Fib n 1 Fib n 2 写个递归算法的伪代码把以上公式抄进去就可以了写递推算法伪代码只要记住从边界开始都用变量 FuncFib N Integer IntegerF1 1If N 1 ReturnF2 1If N 2 ReturnI 3Do Fib F1 F2F1 F2F2 FibI I 1 While I N EndFunc不难看出递推法就是把迭代法用于递归公式迭代方向正好和递归算法过程相反分治法在算法优劣一节中谈到算法分析它是研究算法的运算次数相对速度和占用空间的研究表明运算对象的多少大小是一个重要指标算法的复杂性运算次数随大小 n 的增长呈线性增长指数增长阶乘增长它们的关系可表示为 f0 n O n 计算次数正比于nf2 n O 2n 计算次数正比于2nf3 n O n 计算次数正比于n 这就得到一个启示把一个大的计算分成两个小的计算其计算量可以很快地降下来 n 2 n 2 6 2 3n2 2 n 2 2 62 36 2 32 18n 2 n 2 6 720 2 3 12这就是分治法的思想基础因为常见的矩阵运算排序查找算法线性复杂度不大只要分小就是有益的 Knuth的快速排序算法 Quicksort 就是这种分治思想的连续运用例3 7设有N个元素的数组请按递增递减次序排序随便取出一个元素A P 和数组其他元素比较凡大于它的放在右边小于它的放在左边 A P 的位置确定后留下左右两个待排序的子数组接着按同样的方法二分递归直到一个元素写成伪代码算法是 QuickSort A Min Max P MinTop Min 1Bot MaxDo Do Top Top 1 While A Top A P Do Bot Bot 1 While A Bot A P Swap A Top A Bot While Top BOT Swap A P A Top A P 找到恰当位置CallQuickSort A Min Top 1 小于A P 的子数组CallQuickSort A Top 1 Max 大于A P 的子数组可以证明其平均比较次数为O Nlog2N 小于一般排序的O N2 这个算法还可以改进如果分出的子数组碰巧已排好序另一个尚需排如何让已排好的子数组跳出运算把一个大的处理对象分割为小对象如果仍用原方法处理小对象就是递归如果分出的各部分用不同的算法处理就是分治分治在人工智能查找检索的算法设计中是经常见到的回溯法算法过程如同下棋每一步都会对结果状态有所影响每一步都正确结果自然正确算法设计就是设计出能得出正确结果的全过程为此规定每一步的约束有时一下子规定不了必然正确的全过程只能根据当时当地情况决策试着来发现不对可以反悔如同悔棋这就是回溯的思想回溯法写成算法是极其有用的回溯法的算法是 Backtracking ByRefsucc Boolean 1 确定起始状态值走第一步本例是c 4 4 12 确定下一步还有几种可能本例是8 其他位置是 2 3 4 6 8 3 选一可能走下一步记住可能和本步特征 I J N 4 做完新一步应做的事本例是c I J N N N 15 While目标未达到DoA 确定下一步有几种可能B While没有可能and还有上一步do1 回退上一步2 查有无下一可能C If上一步没有了Return succ False D 选一可能走一步记住可能和本步特征E 做完新一步应做的事6 Return succ True 读者可按这个框架写出骑士周游的算法 3 2数据结构有些算法的操作对象很简单几个变量就可以了例如方程求根有一些则不然操作的对象是一组相互有关的数据脱离了数据的关联性算法就无从施展例如上节的快速分类骑士周游荷兰国旗问题就是一维数组和二维矩阵上展开的 3 2 1数据的结构关系单个的数据变量虽然能解决不少问题但经常遇到要计算的问题其数据往往是关联的甚至不关联就失去处理的价值先分析几个例子 1 名字串ZhangSan这八个字符串在一起表示张三少一个多一个或次序颠倒都不是张三计算机在处理它时一起存一起取除非张三改名每个字符数据和其他数据是邻接的关系 2 火车行车时刻表这是一个二维表单将车次时间和站名放在一起就可以回答很多问题早上7 8点到武汉可在北京乘T37次 T77次从北京站到武汉站最快要12小时就不单是 T37次北京18 53开一条信息了把这个表输入到计算机连查找的功夫都可以省计算机之所以聪明是因为它会查二维矩阵 3 分配工作图3 4申请职位关系图有五个不同专业的人申请五个不同职位每人填两个志愿申请情况如图3 4所示人名A B C D E 职位a b c d e都是长串的字符串数据的简写申请志愿的联线把它们连成一个图图就是数据结构是写分派工作算法的解题模型分配的结果是每人都满足了志愿而每个职位都有人干图3 4申请职位关系图这个例子小到一眼就看到结果但如果申请人是1275人职类87 职位44 志愿1 3 不用计算机算就太费事了编个程序先按基本条件删去一部分人然后按每个职类计划的职位和申请的人数分配打出一张录用表描述这个图不外乎数据集合D A B C D E a b c d e 和它们的关系集合R 表示前后两数据有关系且次序不能倒如次序可逆就要用数据及其关系构成数据结构由以上例子看出数据结构只由两种集合构成 DS D R 数据集合D 可以是单个数据集合也可以是不同类型子集组成的大集合甚至可以是数据结构第一个例子的字符串本身是字符的数据结构字符串集合也是数据集合关系集合R指数据间的结构关系这里的数据间关系很抽象的两数据只是有关不问具体是什么关系书83页有例子数据结构就是研究数据的结构关系请看下例 DS1 D1 R1 D1 a b c d e R1 a b b c c d d e e a a c a d b e c e 画成图形如图3 5 a 所示 DS1是一个无向图图3 5无向图和有向图若DS2 D1 R2 D1 a b c d e R2 画成图形如图3 5 b 所示 DS2是一个有向图图3 5无向图和有向图若DS3 D3 R3 D3 a1 a2 ak R3 1 i k 1 这个关系R3说明任何两递增下标的数据元素都有相邻关系画出图形如图3 6所示是一个数组图3 6数组数据结构若DS4 D4 R4 D4 a b c d e f R4 它们的结构关系如图3 7所示是一种树型数据结构图3 7树的数据结构 3 2 2数据结构的研究方法从上节的例子可以看出数据结构的基本概念是非常简单的数据元素及其关系由于关系不同可以形成不同的结构它们的计算特性也各不相同如果能找出其中最基本的几种熟知这几种的计算特性那么以数据结构模拟客观世界的数据依托它写算法就十分方便了如上所述数据结构中的数据元素也可以扩充成数据结构圆圈扩充成为一个图或表或树这样极其复杂的结构也能表达其计算特性不外乎叠加所以熟知基础的数据结构是极为重要的按一般文献的介绍数据结构分四大类表元素是线性关系连接图元素间是非线性关系连接树元素间是非线性关系连接不得有回路文件记录的序列研究方法研究每种数据结构可以实施什么算法这些结构都能映象到机器的存储中实施的算法才有意义这四类最基本的数据结构最重要的是表类因为它直接对应为机器对数据的操作找出首地址拉出一长串数据或按首地址位移多少地址即可找到某元素索引如果不是存放在一起每个元素跟下一个元素的地址指针也是线性表因为用高级语言编程写算法不能涉及具体地址只说线性表和线性链表至于其他的数据结构机器是不能直接操作的都得化为简单表来处理研究方法即使是稍微复杂一点的表如二维矩阵每个元素也是按一维数组的数组元素来处理所以在讨论每种数据结构时首先研究它的逻辑结构有什么运算性质用什么表示法表示这种逻辑结构表或链表或复合再按表示法和性质写出求解问题的算法下面都是按这个办法处理的逻辑结构和物理结构数据结构是十分抽象的学会了基本结构表图树文件就可以用它们的复合模型刻画事物的本质这样就形成了逻辑结构它是客观世界数据关系的真实反映但计算机只能处理最简单的结构这就形成了逻辑结构和物理实现结构的分离正如艾菲尔铁塔长江大桥的拱顶是不同的逻辑结构满足不同的用途它们的物理结构都是各型钢铁焊接或铆接的结构讨论问题或程序感兴趣的是逻辑结构而程序的实现非物理结构不行逻辑结构和物理结构这里还要说明逻辑结构和物理结构是相对的直接讨论矩阵的元素写两个下标A i j 非常直观但机器自动把它转为一维下标A n 后才能实现计算前者在逻辑结构上说话后者在物理结构上实现一旦能自动实现就认为它是物理的了在讨论图的表示法时二维数组是实现图的物理数据结构也就是不再说二维到一维的实现了数据结构的图形表示上小节给出图有向图数组树的图形表示法以及对应的基本的集合论定义在实用中不去证明数据结构的某种性质而是直接使用定义好了的结构观察它的宏观性质写算法不再写出基本的形式定义除非要做理论证明工作无论是逻辑的还是物理的都可以用图形表示用一个框表示数据实体圆形方形均可无箭头连线表示双向关系有箭头连线表示单向关系当只有线性关系且不分离时可以不画连线图3 6即为实例以下分别讨论这四类数据结构 3 2 3线性表线性表的逻辑结构是n个数据元素的有限序列 a1 a2 a3 an 表中元素的个数n定义了线性表的长度 n 0 n 0的表称为空表线性表的结构特征是数据元素呈线性关系线性表隐含是有序的它必存在惟一的第一个数据元素和最后一个数据元素除第一个元素外每个元素都有一个且只有一个前驱元素除最后一个元素外每个元素都有且只有一个后继元素在同一个线性表中所有数据元素ai必须是相同的数据结构它可以是同类型的数同一类符号或同样复杂的结构线性表的逻辑图如图3 8所示线性表也可以用机器能直接接受的符号串表示法用括号括着的元素名或值例如可以按问题需要建立以下线性表表1 李研刘丰陈宏英表2 李研 98 99 100 297 99 0 刘丰 97 96 94 287 95 7 陈宏英 94 96 99 289 96 3 表1是名字表表2的数据元素是姓名语文成绩数学成绩英语成绩总分平均分具体的值虽然不是同一类型数据但所有元素均是同一种形式它是由简单表组成的线性表图3 8线性表的示意图线性表的基本运算主要有创建一个新表包括无表元素的空表在两个确定的元素之间插入一个新的元素删除线性表中某个元素按某种要求查找线性表中的一个元素按需要更新表元素计算表长元素个数重排表元素即排序合并两个表第1种操作在高级语言中只要声明编译程序就可以替你完成其余的要先决定表的表示法再写算法顺序表和一维数组没有特殊说明表是隐含顺序存放的如果要插入或删除一个元素那么在这个元素以后的元素存储位置都要改动为了显式地操作存放顺序则定义了数组数组是以一维下标索引的顺序表数组一旦声明其长度不可改变中间也不许删除或插入这就找到了一个不变的舞台让顺序表在其上演绎变动下面是顺序表插入和删除的算法线性表的查找见3 3节其余操作读者可以参考这几个算法写出插入在线性表 a1 a2 ai ai 1 an 的第i个位置插入元素x 使之成为 a1 a2 x ai ai 1 an 其算法描述如下 Insert ByRefA Type n i x 一维数组A 1 n 第i个元素之前插入一个新元素xIf in 1 ERROR 位置不存在插入的位置不合法Elsefor j n j i j A j 1 A j 元素后移A i x 进行插入n n 1 线性表的长度加1从上述算法可见当i n 1 语句A j 1 A j 将不执行因为此时循环变量的终值大于初值即不需要移动元素而直接将x插入到A n 1 的位置上去即可反之当i 1时语句A j 1 A j 将执行n次即需将线性表中原已存在的n个元素均后移一个元素的位置才能进行插入所以若顺序表中元素个数为n 在往每个位置插入的概率相等的情况下插入一个元素的平均移动元素个数为n 2 删除一般情况下在表长为n的线性表 a1 a2 ai 1 ai ai 1 an 中删除第i个数据元素还需将第i 1个至第n个元素向前推动一个位置即 a1 a2 ai 1 ai 1 an 其算法描述如下 Delete ByRefA n i 一维数组A 1 n 中的第i个元素处删除该元素xIf in ERROR 位置不存在删除的位置不合法Elsefor j i j n 1 j A j A j 1 元素前移n n 1 表长减1和插入的情况类似当i n时语句A j A j 1 将不执行因为循环变量的初值大于终值即不要移动元素但当i 1时语句A j A j 1 将执行n 1次此时需将线性表中除第一个元素之外的所有元素均向前移动一个位置所以在等概率的情况下删除顺序表中一个元素平均需要移动的元素个数为 n 1 2 链表以数组实现顺序表插入或删除元素时都不可避免地要作元素的移动每进行一次插入或删除都要移动近乎一半的元素又由于数组是定长的连续存储单元对于长度可变的线性表只好按其可能达到的最大长度预先分配空间这可能由于估计不足造成一部分空间太长而得不到充分利用也可能因空间过短而造成溢出链表恰能有效地克服这些缺点链表一般有单链表双向链表和循环链表等 1 单链表单链表就是链式存储的线性表其元素除信息域外还含有一个指针域用来指出其后继元素的位置元素的结构如图3 9所示单链表的最后一个结点没有后继结点它的指针域为空记为NIL或另外还需要设置一个头指针head 指向单链表的第一个结点图3 9单链表中的结点结构例如上述表1 李研刘丰陈宏英的单链表实现如图3 10所示链表的一个重要特点是插入删除运算灵活方便不需移动元素只要改变元素中指针域的值即可图3 11 a b 分别示出了从单链表中插入一个新元素和删除一个元素的链接虚线表示变化后的指针图3 10单链表逻辑图图3 11单链表的插入和删除链表插入元素的算法如下 InsertLink list Q pointer 每个结点有两个域如图3 9Item Integer CallGetNode P 申请一个结点返回指向该结点的指针PP Info itemIf list Nil list P list Next Nil 如原链表为空ElseP Next Q Next 在Q所指结点之后插入itemQ Next P其他算法读者可以自行写出值得一提的是链表有一个操作是所有指针逆反可以很快得到反向排序的表链表是十分有用的数据结构它有助于快速方便地使用信息例如机器中按顺序录入了10个人的信息人员还在不断增减要保证打印的文件总是按某种原则排序如年龄级别工资等级性别等为了不致大量重排和移动所有数据用链表排序最方便信息只按先后次序存入且次序不变按链表排序后打印即可满足要求排序的工作量是很小的 2 循环链表循环链表是结构形式和单链表稍有不同的一种链表如图3 12所示其差别仅在于链表中最后一个结点的指针域不为 NIL 而是指向头一个结点整个链表成为一个由链指针相链结的环故称之为循环链表其插入删除算法和单链表没有多大区别循环链表应用也是极其广泛的例如要10分钟内公布一次股票涨落行情则把所有股票号接成一个循环链表有一批录入员负责行情变化录入每人只管负责几个号的涨落行情录入报表程序按链表依次处理各股票10分钟之内的变化图3 12循环链表示意图 3 双向链表在实际应用中链表结点可根据需要来设定对于线性表来说除了设有指向后继结点的指针外还可设一个指向前驱结点的指针习惯称这种含有两个指针域的结点构成的链表为双向链表其结构如图3 13所示由于每个结点中都设有两个指针则不仅可直接得到后继结点的信息也容易得到前驱结点的信息这对某些需要逆向查找的算法特别有用还可以增大表的安全性但在作插入删除运算时需要同时修改两个方向上的指针一般情况下称结点含有多个指针域的链表为多重链表双向链表是多重链表的一种图3 13双向链表图例栈除了前面讲的线性表外栈 stack 是一种特殊的线性表对它的操作只能是后进先出 LIFO 也是使用最为广泛的数据结构之一因为它的运算次序受到严格的限定故又称限定性数据结构图3 14栈的逻辑结构栈的结构特点在日常生活中很多事务是按照后到达的比先到达的优先的顺序处理的例如穿衣服的顺序是先衬衫后制服最后是大衣脱衣服的顺序必须反过来最先脱的是最后穿上的大衣若想在衬衫和制服之间加一件毛衣时必须先脱下大衣和制服才能穿上毛衣又如玩具手枪的子弹压入子弹夹时总是要将子弹一粒粒按顺序压入而射击时却是最后压入的一粒先打出来而最先压入的最后一个被射出栈的结构特点正是这些事物的抽象栈的结构特点栈是限定仅在表尾进行插入和删除运算的线性表表尾称为栈顶 top 表头称为栈底 bottom 表中无元素时称为空栈如图3 14所示的栈中元素按a1 a2 a3 an的顺序进栈 a1称为栈底元素新元素进栈要置于an之上删除或退栈必须先对an进行操作栈体的物理存储可以用顺序表结构也可用链表 2 栈的运算通常对栈进行的运算有设置一个空栈判定某个栈是否为空栈进栈退栈以及读取栈顶元素等下面分别给出以顺序表实现的栈和进栈退栈的算法进栈PushStack ByRefstack m top x 在栈Stack 1 m 的栈顶top之上插入元素xIf top m ERROR 栈满 Elsetop top 1 栈顶上移stack top x 将x放入栈顶退栈FuncPopStack ByRefstack top y Bool 当栈空时返回FALSE If top 0 Return False 反之退出栈顶元素赋给变量y并返回TRUEElsey stack top 将栈顶元素赋给变量ytop top 1 栈顶下移Return True EndFunc 当栈的最大容量事先不能估计时也可采用链表作存储结构简称链栈如图3 15所示图中top为栈顶指针指示栈顶元素的位置若top为空则表示空栈显然链栈不出现上溢除非系统中不存在可用结点链栈的算法也比较简单图3 15链栈存储结构队列队列也是一种特殊的线性表在实际生活中经常要靠排队来维护正常的秩序在计算机程序设计中也有类似的问题数据结构中的队列与生活中的排队极为相似也是按先来到先解决的原则行事的并且既不允许加塞儿也不允许中途离队 1 队列的结构特点队列 Queue 是限定所有的插入只能在表的一端进行而所有的删除都是在表的另一端进行的线性表表中允许插入的一端称为队尾 Rear 允许删除的一端称为队头 Front 如图3 16所示的队列中 a1是队头元素 an是队尾元素队列中元素以a1 a2 a3 an的次序依次进入队列则a1是第一个出队列的元素即队列的操作是按先进先出的原则进行的因此队列又称FIFO FirstInFirstOut的缩写表队列的物理实现可以用顺序表也可以用链表队列指针减队尾指针加1即为队体的长度图3 16队列示意图 2 队列的运算通常对队列进行的运算有设置一个空队列判定某个队列是否是空队列插入一个新的队尾元素简称入队列删除队头元素简称出队列读取队头元素 3 循环队列队头队尾指针值只增不减除非是短时工作的队列存储空间总有耗尽的时候而且大量空间浪费于是人们就想到了循环利用空间队列循环队列把存储空间在逻辑上看成一个环当R指向存储空间的末端后就把它重新置成指向存储空间的始端如图3 17所示图3 17循环队列的插入删除示意图循环队列算法如下怎么能在一个数组中让它的下标回头呢用求余函数mod 设数组长N 10 Front Front 1 modNAddCQ Q Array 0 N 1 X Type 插入算法Rear Rear 1 modNIf Rear Front callQueue fullQ Rear XDelCQ Q Array 0 n 1 ByRefitem Type 删除算法If Front Rear callQueue emptyFront Front 1 modNitem Q Front 4 链表实现队列如果队列的容量同时存在于队中元素无法预先估计时可以采用链表存储结构如图3 18 虽然可用链表实现循环队但没有必要因为队列元素一旦删除所占空间即可收回图3 18队列的链表存储结构串串 String 是一种比较特殊的线性表可以看做一维字符数组但其长度不恒定可以作删除插入操作在这点上其结构和链表类似串也可以用链表表示许多高级语言把串作为一种单独的类型其元素不可作四则运算字符串在数据处理中是最常用到的数据结构为了连接删除插入操作用子串有时很方便子串 Substring 是串的一部分具有串的一切特征 3 2 4树和二叉树上面谈的是线性数据结构下面谈一谈非线性数据结构树型结构是一类重要的非线性数据结构在此结构中元素之间存在着明显的层次或嵌套关系树的定义和术语在人们周围存在着很多可以用树结构来描述的实际问题如图3 19所示的Unix的文件系统从图3 19可见树结构类似一棵倒长的树结构中含有一个类似树根的结点和若干子树每个子树又有子子树没有下层子树的结点就是树叶每层元素之间无关系数据元素就安排在各结点之中树的逻辑结构如图3 20所示其中的是退化了的树既是根也是叶子图3 19Unix的文件系统图3 20树的逻辑结构树的结构定义用递归定义最方便每个结点有几个子树m称度 degree 所有结点最大的度称m叉树其中m 2为二叉树是最常用的数据结构结点除与子树关联外与其他结点均无关联每个结点只有一个入度和若干出度树可以用表实现 A B E F C G D H I J A B E F C G D H I J 对应为图3 21的树约定每对括号括着前一结点名下的所有子树同级子树用逗号分隔将这个表输入到机器机器就可以处理了但是机器往往要进一步把它变为链表因为树实质是从根或结点到子树的无环有向图上述表对应的链表如图3 22 a 所示其中是Nil的代号第一个是数据项后面的指针数与最大的出度m相同本例是3 它指向子树或叶子这个链表画得像树一些如图3 22 b 图3 21树结构示例其中是Nil的代号第一个是数据项后面的指针数与最大的出度m相同本例是3 它指向子树或叶子这个链表画得像树一些如图3 22 b 图3 21树结构示例 b 图3 22以多重链表实现的树 b 在释义上述表表示的树时在root指针处指明是一个三叉树结构在分配存储时拿出一个数据域和三个指针并按括号填指针和消除了表的圆括号就可以使用链表了也可以在每个结点处指明该结点的出度这对叶子众多且出度变化大时可省去很多空单元图3 21的例子则可改为图3 23来实现图3 23不定分支树的链表实现树的运算按照图3 22和图3 23建树是不同的约定而按同样约定作树的操作就不会产生问题一般树的操作可归结于下 SetTree T 建树返回树T Root x 数据元素x所在树的根 Parent T x 在树T中找出x结点的父结点 Child T x i 在树T中找出x结点的第i个子结点树 Insert T x i S 将S子树插入树T 作为x结点的第i个子树 Delete T x i 将树T中x结点的第i个子树删去 Depth T h 返回树T的深度h 层估计读者以上例为模型写出链表表示树的以上7种操作的算法不会有太大的困难二叉树二叉树是每个结点最多有两个子树的特殊树由于它简明容易计算层次数和叶子数在某种程度上可与二值逻辑对应非右即左子树所以它特别有用二叉树的定义是不像多叉树它必须指出是左还是右子树可以证明二叉树第i层上的结点数至多为nimax 2i 1 根为第一层深度为k的二叉树结点数至多为nmax 例 k 4 nmax 15 k 3 nmax 7 若二叉树的叶结点数为nf 树中度为2的结点数为n2 则必有nf n2 1 这些性质是常用的二叉树的实现同样可以用链表来表示由于二叉树简单甚至可用一维数组实现例如各层各结点除叶结点外出度均为2称满二叉树它不能再插入了取长度为1 3 7 15 31 2k 1的数组可表示k层满二叉树任何一个元素可立即找到如图3 24所示显然它计算时存取要快于链表中的指针有了这个好处定义完全二叉树即除最后一层不满外其余各层均满且最后一层所有的叶子也是满的如图3 25所示图3 24用一维数表示的满二叉树图3 25用一维数组表示的完全二叉树如果树既不满又不完全仍可以按以上约定表达任意的二叉树如读者可以画出这两棵二叉树显然当结点稀少时存储浪费很大链表又有优越性了如图3 26所示二叉树的遍历二叉树同样可做前述的7种树运算只是找子树时分出左右子树 Child BT x l 找出树BT中结点x的左子树 Insert BT x r s 将子树s插入树BT 作为x结点的右子树 Delete BT x l 删去树BT中 x结点的左子树图3 26二叉树的链表表示二叉树还有它特殊的运算可以解决很多问题请看下例例3 9计算表达式若有表达式赋值A B C D E F其中每个双目运算符可以看做子树的非叶结点左操作数是左子树右操作数是右子树每个变量操作数都是叶子这样就可以建立二叉树的数据模型如图3 27所示计算由下向上执行运算符优先级高的在最下面按照左根右的次序把这棵树装入栈中遵循左子树装完装运算符再装右子树于是得图3 28堆栈其计算过程是图3 27表达式的二叉树模型图3 28表达式计算堆栈按右叶子运算符左叶子弹出如下一元素是运算符且比当前运算符优先级低本例为E F 完成当前运算符的计算结果是右叶子再弹出下一个运算符和左叶子 D 再弹出下一个运算符知比优先级高则先算D C作左叶子再算D C E F结果为右叶子再弹 B和先算得叶子最后弹出A 完成向A赋值读者不难把上述文字的算法过程写成程序完成表达式计算并赋值在解本例时并未把建立的二叉树输入到机器而是把它当作模型在它上面遍历逐个访问结点直至访问完先访问的先入栈入栈后逐个弹出计算按遍历的思想对栈数据结构写算法遍历的规则是左根右中序遍历显然读者自然能想到根左右左右根规

人人文库> 全部分类> 生活休闲 > 科普知识

温馨提示

1. 本站所有资源如无特殊说明，都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2. 本站的文档不包含任何第三方提供的附件图纸等，如果需要附件，请联系上传者。文件的所有权益归上传用户所有。
3. 本站RAR压缩包中若带图纸，网页内容里面会有图纸预览，若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 人人文库网仅提供信息存储空间，仅对用户上传内容的表现方式做保护处理，对用户上传分享的文档内容本身不做任何修改或编辑，并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容，请与我们联系，我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

第三章算法与数据结构.ppt

文档简介

温馨提示

最新文档

评论

第三章 算法与数据结构.ppt

文档简介

温馨提示

最新文档

评论

相关文档

第三章算法与数据结构.ppt