




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、方灿Southwestern University839147计算机科学是一门研究用计算机进行信息表示和处理计算机科学是一门研究用计算机进行信息表示和处理的科学。这里面涉及到两个问题:信息的的科学。这里面涉及到两个问题:信息的表示表示,信息,信息的的处理处理。信息的表示和组织又直接关系到处理信息的程序的效信息的表示和组织又直接关系到处理信息的程序的效率。随着应用问题的不断复杂,导致信息量剧增与信率。随着应用问题的不断复杂,导致信息量剧增与信息范围的拓宽,使许多系统程序和应用程序的规模很息范围的拓宽,使许多系统程序和应用程序的规模很大,结构又相当复杂。因此,必须分析待处理问题中大,结构又相当复杂
2、。因此,必须分析待处理问题中的对象的特征及各对象之间存在的关系,这就是数据的对象的特征及各对象之间存在的关系,这就是数据结构这门课所要研究的问题。结构这门课所要研究的问题。数据结构讨论的范畴(数据结构在软件开发中的地位)系统分析系统实现系统维护系统设计Algorithm + Data Structures = Programs程序设计程序设计: :算法算法: 数据结构数据结构: 为计算机处理问题编制 一组指令集 处理问题的策略处理问题的策略问题的数学模型问题的数学模型By: Niklaus Wirth观察:计算机会花费90%的运算时间在10%的代码执行上 找到并提高这10%部分的效率,可以有效
3、提高整个系统效率(瓶颈效应)高配置的硬件,加上低效率的程序,执行效果远不如一般的硬件加上高效率的程序(NASA的运算能力,人脑VS计算机,密码破解)例:例:旅客登机的管理算法:?模型:?先进后出,后进先出栈例例2 2:铺设城市的煤气管道算法:?模型:?如何规划使得总投资花费最少?最小生成树算法图-树-最小生成树概括地说: 数据结构是一门讨论“描述现实世界实体的数学模型及其上的操作在计算机中如何表示和实现”的学科。基本概念一、数据与数据结构二、数据类型三、抽象数据类型一、数据与数据结构一、数据与数据结构数据数据: :所有能被输入被输入到计算机中,且能被计算机处理的符号处理的符号( (数值、字符等
4、数值、字符等) )的集合是计算机操作的对象计算机操作的对象的总称是计算机处理的信息的信息的某种特定的符号表示形式,表示形式,是客观世界的字符化描述或字符化描述或者符号表示者符号表示 是数据(集合)中的一个“个体个体”,在计算机中通常作为一个整体进行考虑和处理。是数据结构中讨论的基本基本单位。数据元素数据元素: :如:整数“5”,字符“N”等。 -是不可分割的“原子” 其中每个款项称为一个“数据项数据项”它是数据结构中讨论的最小最小单位数据元素也可以由若干款项构成。数据元素也可以由若干款项构成。例如: 描述一个学生的数据元素称之为组合项称之为组合项年 月 日姓 名 学 号 班 号性别 出生日期
5、入学成绩原子项原子项数据对象数据对象(Data Object)(Data Object):是性质相:是性质相同的数据元素的集合,是数据的一个同的数据元素的集合,是数据的一个子集。如字符集合子集。如字符集合C=A,C=A,B,B,C C, , 数据结构:数据结构:带结构结构的数据元素的集合有一个特性相同的数据元素的集合,如果在数据元素之间存在一种或多种特定的关系,则称为一个数据结构。指的是数据元素之间存在的关系当用三个三个 4 4 位的十进制数位的十进制数表示一个含 12 12 位数的十进制数时,位数的十进制数时,3214,6587,9345 a1a1(3214),a2a2(6587),a3a3
6、(9345)则在数据元素 a1、a2 和 a3 之间存在着“次序次序”关系关系 a1, a2a1, a2 、 a2, a3a2, a3 例如例如: :又例,在 2 行 3 列的二维数组中六个元素a1, a2, a3, a4, a5, a6之间存在两个关系:行的次序关系行的次序关系:row = ,col = , a1 a2 a3 a4 a5 a6列的次序关系列的次序关系: :若在 6 个数据元素a1, a2, a3, a4, a5, a6 之间存在如下的次序关系次序关系:| i=1, 2, 3, 4, 5数据结构数据结构是相互之间存在着某种逻辑关系的数相互之间存在着某种逻辑关系的数据元素的集合据
7、元素的集合。可见,不同的“关系关系”构成不同的“结构结构”则构成一维数组一维数组的定义。从关系或结构分,数据结构可归结为以下四类:线性结构树形结构图状结构集合结构数据结构包括“逻辑结构逻辑结构” 和“物理结物理结构构”两个方面(层次):逻辑结构逻辑结构 是对数据元素之间的逻辑关系的描述,它可以应一个数据元素的集合和定义在此集合上的若干关系来表示;物理结构物理结构 是逻辑结构在计算机中的表示和实现,故又称“存储结构存储结构” 。数据结构的形式定义描述数据结构的形式定义描述为:数据结构数据结构是一个二元组 Data_Structures = (D, S)其中:D 是数据元素的有限集数据元素的有限集
8、, S 是 D上关系的有限集关系的有限集。例例2 2:设数据逻辑结构设数据逻辑结构 B=B=(K K,R R) K=kK=k1 1, k, k2 2, , k, , k9 9 R= k R= ,k ,k ,k ,k ,k ,k ,k ,k ,k ,k 画出这逻辑结构的图示,并确定那些画出这逻辑结构的图示,并确定那些是起点,那些是终点是起点,那些是终点数据结构的存储方式数据结构的存储方式 数据结构在计算机内存中的存储包括数据结构在计算机内存中的存储包括数据数据元素的存储元素的存储和和元素之间的关系的表示元素之间的关系的表示。 元素之间的关系在计算机中有两种不同的元素之间的关系在计算机中有两种不同
9、的表示方法:顺序表示和非顺序表示。由此表示方法:顺序表示和非顺序表示。由此得出两种不同的存储结构:得出两种不同的存储结构:顺序存储结构顺序存储结构和和链式存储结构链式存储结构。 顺序存储结构:顺序存储结构:用数据元素在存储器中用数据元素在存储器中的相对位置来表示数据元素之间的逻辑的相对位置来表示数据元素之间的逻辑结构结构( (关系关系) )。 数据元素存放的数据元素存放的地址是连续的地址是连续的 链式存储结构:链式存储结构:在每一个数据元素中增在每一个数据元素中增加一个存放另一个元素地址的指针加一个存放另一个元素地址的指针(pointer )(pointer ),用该指针来表示数据元素,用该指
10、针来表示数据元素之间的逻辑结构之间的逻辑结构( (关系关系) )。 数据元素存放的数据元素存放的地址是否连续没有要求地址是否连续没有要求 数据的逻辑结构和物理结构是密不可分的两个方数据的逻辑结构和物理结构是密不可分的两个方面,一个面,一个算法的设计取决于算法的设计取决于所选定的所选定的逻辑结构逻辑结构,而而算法的实现依赖于算法的实现依赖于所采用的所采用的存储结构存储结构。例:一维数组(顺序),结构体(链式)例:一维数组(顺序),结构体(链式)数据结构的三个组成部分:数据结构的三个组成部分:逻辑结构逻辑结构: 数据元素之间逻辑关系的描述数据元素之间逻辑关系的描述 D_S= D_S=(D D,S
11、S)存储结构存储结构: 数据元素在计算机中的存储及其数据元素在计算机中的存储及其逻辑关系的表现称为数据的存储结构或物理逻辑关系的表现称为数据的存储结构或物理结构。结构。数据操作数据操作: 对数据要进行的运算。对数据要进行的运算。线性表线性表树树图图顺序存储结构顺序存储结构链式存储结构链式存储结构复合存储结构复合存储结构逻辑结构逻辑结构物理结构物理结构逻辑结构与所采用的存储结构数据的逻辑结构数据的逻辑结构非线性结构非线性结构集合图状结构有向图无向图树形结构一般树二叉树线性结构线性结构一般线性表线性表推广广义表数组串受限线性表栈和队列数据逻辑结构层次关系数据逻辑结构层次关系数据类型数据类型(Dat
12、a Type)(Data Type):指的是:指的是一个值的集合一个值的集合和和定义在定义在该值集上的一组操作该值集上的一组操作的总称。的总称。数据类型是和数据结构密切相关的一个概念。数据类型是和数据结构密切相关的一个概念。 在在C C语言中数据类型有:基本类型和构造类型。语言中数据类型有:基本类型和构造类型。数据结构不同于数据类型,也不同于数据对象,数据结构不同于数据类型,也不同于数据对象,它不仅要描述数据类型的数据对象,而且要描它不仅要描述数据类型的数据对象,而且要描述数据对象各元素之间的相互关系。述数据对象各元素之间的相互关系。数据类型数据类型数据类型 在用高级程序语言编写的程序中,必须
13、对程序中出现的每个变量、常量或表达式,明确说明明确说明它们所属的数据类型数据类型 例如,C语言提供的整型,浮点型,双精度型,字符型等等 数据类型不同,操作也不同,字符,数值?各种高级程序设计语言中都拥有“整数”类型,尽管它们在不同处理器上实现的方法不同,但对程序员而言是“相同的”,因为它们的数学特性相同。从“数学抽象”的角度看,可称它为一个“抽象数据类型” 。例如例如: :“整数”是一个抽象数据类型。其数学特性和具体的计算机或语言无关。“抽象”的意义在于强调数据类型的数学特性。抽象数据类型还包括用户在设计软件系统时自己定义的数据类型。在构造软件系统的各个相对独立的模块时,定义一组数据一组数据和
14、施与这些数据之上的一组操一组操作作,并在模块内部内部给出它们的表示和实现细表示和实现细节节,在模块外部外部使用的只是抽象的数据和抽抽象的数据和抽象的操作象的操作。抽象数据类型的描述方法抽象数据类型的描述方法抽象数据类型可用(D D,S S,P P)三元组表示其中,D 是数据对象, S 是 D 上的关系集, P 是对 D 的基本操作集。 ADTADT 抽象数据类型名抽象数据类型名 数据对象:数据对象:数据对象的定义 数据关系:数据关系:数据关系的定义 基本操作:基本操作:基本操作的定义 ADT ADT 抽象数据类型名其中基本操作的定义格式为:基本操作名基本操作名(参数表) 初始条件:初始条件:初
15、始条件描述 操作结果操作结果:操作结果描述 赋值参数赋值参数 只为操作提供输入值;引用参数引用参数 以& &打头,除可提供输入值外,还将返回操作结果。初始条件初始条件 描述了操作执行之前数据结构和参数应满足的条件,若不满足,则操作失败,并返回相应出错信息。操作结果操作结果 说明了操作正常完成之后,数据结构的变化状况和应返回的结果。若初始条件为空,则省略之。例如,例如,定义抽象数据类型“复数复数” 数据对象:数据对象: De1,e2e1,e2RealSet 数据关系:数据关系: R1 | e1是复数的实数部分, | e2 是复数的虚数部分 ADT Complex ADT Comp
16、lex 基本操作:基本操作: AssignComplex( &Z, v1, v2 )AssignComplex( &Z, v1, v2 )操作结果:构造复数 Z,其实部和虚部 分别被赋以参数 v1 和 v2 的值。 DestroyComplex( &Z)DestroyComplex( &Z)操作结果:复数Z被销毁。 GetReal( Z, &realPart )GetReal( Z, &realPart )初始条件:复数已存在。操作结果:用realPart返回复数Z的实部值。 GetImag( Z, &ImagPart )GetImag(
17、 Z, &ImagPart )初始条件:复数已存在。操作结果:用ImagPart返回复数Z的虚部值。 Add( z1,z2, &sum )Add( z1,z2, &sum )初始条件:z1, z2是复数。操作结果:用sum返回两个复数z1, z2 的 和值。 ADT Complex ADT ComplexADT ADT 有两个重要特征:数据抽象数据抽象 用ADTADT描述程序处理的实体时,强调的是其本质的特征本质的特征、其所能完成的功能其所能完成的功能以及它和外部用户的接口外部用户的接口(即外界使用它的方外界使用它的方法法)数据封装数据封装 将实体的外部特性和其内部实现
18、外部特性和其内部实现细节分离细节分离,并且对外部用户隐藏其内部实对外部用户隐藏其内部实现细节现细节抽象数据类型的表示和实现抽象数据类型的表示和实现抽象数据类型需要通过固有数据类型固有数据类型(高级编程语言中已实现的数据类型)来实现。typedef struct typedef struct floatfloat realpart; floatfloat imagpart; complex;例如,上面所提到的复数数据类型例如,上面所提到的复数数据类型/ -/ -存储结构的定义存储结构的定义/ -/ -基本操作的实现基本操作的实现void add( complex z1, complex z2,
19、complex &sum ) / 以 sum 返回两个复数 z1, z2 的和 sum.realpart = z1.realpart + z2.realpart; sum.imagpart = z1.imagpart + z2.imagpart; 算法和算法的衡量算法和算法的衡量一、算法一、算法二、算法设计的原则二、算法设计的原则三、算法效率的衡量方法和准则三、算法效率的衡量方法和准则四、算法的存储空间需求四、算法的存储空间需求算法算法是为了解决某类问题而规定的一个有限长的操作序列操作序列,是求解方法、步骤的一个精精确描述确描述。一个算法必须满足以下五五个重要特特性性:1 1有穷性有穷
20、性 2 2确定性确定性 3 3可行性可行性4 4有输入有输入 5 5有输出有输出算法算法1 1有穷性有穷性 对于任意一组合法输入值,在执行有穷步骤有穷步骤之后一定能结束,即:算法中的每个步骤都能在有限时间有限时间内完成; 2 2确定性确定性 对于每种情况每种情况下所应执行的操作,在算法中都有确切确切的规定,使算法的执行者或阅读者都能明确其含义及如何执行。并且并且在任在任何条件下,算法都只有一条执行路径;何条件下,算法都只有一条执行路径;3 3可行性可行性 算法中的所有操作都必须足够基本,都可以通过已经实现的基本操作运算有限次实现之;4 4有输入有输入 作为算法加工对象的量值,通常体现为算法中的
21、一组变量。有些输入量需要在算法执行过程中输入,而有的算法表面上可以没有输入,实际上已被嵌入算法之中; 5 5有输出有输出 它是一组与“输入”存在确定关系的量值,是算法进行信息加工后得到的结果,这种确定关系即为算法的功能。1 1有穷性有穷性 2 2确定性确定性 3 3可行性可行性4 4有输入有输入 5 5有输出有输出例:解决“灯不亮了”的算法二、算法设计的原则二、算法设计的原则设计算法时,通常应考虑达到以下目标:1 1正确性正确性2. 2. 可读性可读性3 3健壮性健壮性5 5高效率与低存储量需求高效率与低存储量需求4 4通用性通用性1 1正确性正确性首先,首先,算法应当满足满足以特定的“规格规
22、格说明说明”方式给出的需求需求。其次,其次,对算法是否“正确正确”的的理解可以有以下四个层次四个层次:a a程序中不含语法错误;b b程序对于几组输入数据能够得出满足要求的结果; c c程序对于精心选择的、典型、苛刻且程序对于精心选择的、典型、苛刻且带有刁难性的几组输入数据能够得出满足带有刁难性的几组输入数据能够得出满足要求的结果;要求的结果;通常以第 c c 层意义的正确性作为衡量一个算法是否合格的标准。 d d程序对于一切合法的输入数据都能得出满足要求的结果;2. 2. 可读性可读性算法主要是为了人的阅读与交流阅读与交流,其次才是为计算机执行。因此算法应该易于易于人的理解理解;另一方面,晦
23、涩难读的程序易于隐藏较多错误而难以调试;3 3鲁棒性鲁棒性/ /健壮性健壮性当输入的数据非法非法时,算法应当恰当地作出反映或进行相应处理进行相应处理,而不是产生莫名奇妙的输出结果。并且,处理出错处理出错的方法的方法不应是中断程序的执行,而应是返回返回一个表示错误或错误性质的值表示错误或错误性质的值,以便在更高的抽象层次上进行处理。4 4通用性通用性算法应能解决一类问题,而非针对某些特定输入。5 5高效率与低存储量需求高效率与低存储量需求通常,效率指的是算法执行时间;存储量指的是算法执行过程中所需的最大存储空间。两者都与问题的规模有关。三、算法效率的衡量方法和准则三、算法效率的衡量方法和准则通常
24、有两种两种衡量算法效率的方法: 事后统计法事后统计法事前分析估算法事前分析估算法缺点:缺点:1。必须执行程序 2。其它因素掩盖算法本质和算法执行时间时间相关的因素因素:1 1算法算法选用的策略的策略2 2问题的规模问题的规模3 3编写程序的语言语言4 4编译编译程序产生的机器代码的质量的质量5 5计算机计算机执行指令的速度的速度一个给定算法的算法的“运行工作量运行工作量”的大小,只依赖于问题的规模(通常用整数量n表示),或者说,它是问题规模的函数是问题规模的函数。算法的执行时间算法的执行时间 =基本操作的执行次数基本操作的执行次数基本操作的执行时间基本操作的执行时间 算法的执行时间算法的执行时
25、间 与与 基本操作执行次数之和基本操作执行次数之和 成正比成正比 多种基本操作?求和处理假如,随着问题规模 n 的增长,算算法执行时间的增长率和法执行时间的增长率和 f(n) f(n) 的增长的增长率相同率相同,则可记作:T (n) = O(f(n)T (n) = O(f(n)称称T (n) T (n) 为算法的为算法的(渐近)时间复杂时间复杂度度定义: 给定两个非负函数f(n) 和 g(n), 如果存在一个正整数n0 以及一个常数k0 使得f(n)kg(n) 对于任意nn0 的正整数都成立,那么我们说f(n)=O(g(n), 关于“Big Oh”使用正确的“Big Oh”表示 如果f(n)
26、是一个d次多项式,那么f(n) 是 O(nd) 基本原则: 舍弃低阶项 舍弃常数系数 使用最低的可能数量级 正确:“100n 是O(n)” ,错误:“100n 是O(n2)” 使用最简标注 正确:“3n + 5 是 O(n)” ,错误:“3n + 5 是 O(3n)”void mult(int a, int b, int& c ) / 以二维数组存储矩阵元素,c 为 a 和 b 的乘积 for (i=1; i=n; +i) for (j=1; j=n; +j) ci,j = 0; for (k=1; k1 & change; -i) change=false;for (j=0;
27、 jaj+1) aj aj+1 ; change=TURE ; 最好情况:最好情况:0 0次次 最坏情况:最坏情况:1+2+3+1+2+3+ +n-1=n(n-1)/2+n-1=n(n-1)/2 平均时间复杂度为:平均时间复杂度为: O(nO(n2 2) ) 四、算法的存储空间需求四、算法的存储空间需求算法的空间复杂度定义为空间复杂度定义为: :表示随着问题规模表示随着问题规模 n n 的增大,的增大,算法运行所需存储量的增长率算法运行所需存储量的增长率与与 g(n) g(n) 的增长率相同。的增长率相同。S(n) = O(g(n)S(n) = O(g(n)算法的存储量算法的存储量包括:1输入数据输入数据所占空间2程序本身程序本身所
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 普洱市重点中学2025年初三年级统考英语试题含答案
- 有机设计理念在家具行业的应用探索试题及答案
- 思修慕课试题及答案
- 新能源汽车产业政策与法规研究试题及答案
- 教师反思促进班级文化构建的良性循环试题及答案
- 电子经典笔试题目及答案
- 施工现场安全培训对策考题分析题目试题及答案
- 护士口腔笔试题及答案大全
- 工程安全管理软件应用试题及答案
- 物理中考真题试题及答案
- 医学教材 《疟疾》课件
- 比较思想政治教育智慧树知到期末考试答案章节答案2024年西南大学
- JG-T+100-1999塔式起重机操作使用规程
- 山东省济南市高新区2023-2024学年八年级下学期期末物理试题
- DLT 5285-2018 输变电工程架空导线(800mm以下)及地线液压压接工艺规程
- 中国兔子行业上下游产业链全景、发展历程回顾及市场前景预测
- 10以上20以内加减法
- 急产分娩应急演练方案
- JBT 11699-2013 高处作业吊篮安装、拆卸、使用技术规程
- 24春国家开放大学《离散数学》大作业参考答案
- 2024年1月普通高等学校招生全国统一考试适应性测试(九省联考)化学试题(适用地区安徽)(试卷)
评论
0/150
提交评论