付费下载
下载本文档
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、信息工程专业算法与数据结构中北大学信息与通信工程学院主讲: 刘宾 副教授从提出一个实际问题的提出到计算机解出答案,需要经过以下步骤: 实际问题抽象出数学模型解模型的算法编程、调试、调整答案。 因此,要设计出一个好的程序,必须有一个好的算法,而好的算法必须在研究数据的特性及数据之间存在的关系基础上。1.1 数据结构讨论的范畴Niklaus WirthAlgorithm + Data Structures = Programs算法+数据结构=程序设计程序:数据在特定的表示形式和结构的基础上对抽象算法的具体描述,为处理问题编制一组指令集算法:处理问题的策略数据结构:问题的数学模型(组织和访问数据的系
2、统方法)计算机应用的发展: 从最初的科学计算逐步发展到了人类社会的各个领域。 计算机的处理对象不仅仅是简单的数字,现已发展到包括字符、表格、图形、图象、声音等各种非数值数据。 数值计算 -非数值计算数据处理的对象日益复杂和多样化、处理的数据呈海量增长 数据结构的相关研究已经成为编译系统、操作系统和数据库管理系统及其他系统程序、应用程序的重要基础。数据结构讨论的问题概括地说,数据结构是描述现实世界实体的数学模型(非数值计算)及其上的操作在计算机上的表示和实现。(1)数据的逻辑结构(2)数据的存储结构(3)对数据进行操作的各种算法1.2数据结构的基本概念和术语1. 基本术语(1)数据:描述客观事物
3、的数字、字符以及所有能输入到计算机中并被计算机程序处理的符号的集合。是计算机操作的对象的总称。(2)数据元素:数据的基本单位,在计算机程序中常常作为一个整体进行考虑和处理。如:整数“5”,字符“N”等。 -是不可分割的“原子”数据结构的基本概念和术语数据元素也可以由若干款项构成。例如描述一个学生的数据元素:其中每个款项称为一个“数据项”,它是数据结构中讨论的最小单位2. 数据结构 (1)定义:有一个特性相同的数据元素的集合,如果在数据元素之间存在一种或多种特定的关系,则称为一个数据结构。数据之间不是相互独立的,他们之间有某种特定的关系,这种数据元素之间的关系,称为“结构” 结构=数据元素+关系
4、数据结构是相互之间存在着某种逻辑关系的数据元素的集合。例1 当用三个 4 位的十进制数表示一个含 12 位数的十进制数时3214,6587,9345 a1(3214),a2(6587),a3(9345)则在数据元素 a1、a2 和 a3 之间存在着“次序”关系 a1, a2、a2, a33214,6587,9345 6587,3214,9345a1 a2 a3a2 a1 a3例2 在 2 行 3 列的二维数组中六个元素a1, a2, a3, a4, a5, a6之间存在两个关系:行的次序关系:row = ,col = , a1 a2 a3 a4 a5 a6列的次序关系: 若在 6 个数据元素a
5、1, a2, a3, a4, a5, a6 之间存在如下的次序关系:| i=1, 2, 3, 4, 5 可见,不同的“关系”构成不同的“结构”则构成一维数组的定义。(2)从关系或结构分,数据结构可归结为以下四类:线性结构:存在一对一关系,序列相邻,次序关系。树型结构:存在一对多关系,层次关系。图状结构(网状结构) :存在多对多关系,任意性集合:元素仅属于同一个集体,没有其他关系。数据结构的形式定义描述为: 数据结构是一个二元组 Data_Structures = (D, S)其中:D 是数据元素的有限集, S 是 D上关系的有限集。数据结构包括“逻辑结构” 和“物理结构”两个方面(层次):逻辑
6、结构 是对数据元素之间的逻辑关系的描述,它可以用一个数据元素的集合和定义在此集合上的若干关系来表示;物理结构 是逻辑结构在计算机中的表示和实现,故又称“存储结构” 。 逻辑结构(数据结构) 逻辑结构就是数据元素之间的逻辑关系 线性结构 数据逻辑结构中的一类,它的特征是若结构为非空集,则该结构有且只有一个 开始结点和一个终端结点,并且所有结点都最多只有一个直接前趋和一个直接后继。线性表就是一个典型的线性结构。 非线性结构 非线性结构的逻辑特征是该结构中一个数据元素可能有多个直接前趋和直接后继,非线性结构中最普遍的就是图的结构。数据的存储结构 逻辑结构在存储器中的映象“数据元素”的映象 ?“关系”
7、的映象 ?数据元素的映象方法:用二进制位(bit)的位串表示数据元素(321)10 = (501)8 = (101000001)2 A = (101)8 = (001000001)2 顺序映像方法: 该方法把逻辑上相邻的数据元素存储在物理位置上相邻的存储单元里,数据元素间的逻辑关系由存储单元的邻接关系来体现。链接映像方法该方法不要求逻辑上相邻的数据元素在物理位置上亦相邻,数据元素间的逻辑关系由附加的指针字段表示。 索引映像方法: 该方法通常在储存数据元素信息的同时,还建立附加的索引表。索引表由若干索引项组成。稠密索引若每个数据元素在索引表中都有一个索引项,则该索引表称之为稠密索引。 稀疏索引若
8、一组数据元素在索引表中只对应一个索引项,则该索引表称为稀疏索引。 索引项的一般形式 (关键字、地址)(1)关键字 关键字是能唯一标识一个数据元素的那些数据项。(2) 稠密索引中索引项的地址指示数据元素所在的存储位置;(3) 稀疏索引中索引项的地址指示一组结点的起始存储位置。散列映像方法 根据数据元素的关键字直接计算出该结点的存储地址。 在不同的编程环境中,存储结构可有不同的描述方法当用高级程序设计语言进行编程时,通常可用高级编程语言中提供的数据类型描述之。1.3 数据结构、数据类型和抽象数据类型 数据结构 :数据存在的形式。 逻辑上的数据结构 逻辑上的数据结构反映数据元素之间的逻辑关系。 物理
9、上的数据结构 物理上的数据结构反映数据元素在计算机内的存储安排。 数据类型:同一类数据的全体 定义 一组性质相同的值的集合, 以及定义于这个集合上的一组操作的总称。 C+语言中的数据类型双精度型double基本数据类型整型int字符型单字符型char宽字符型w_char实型单精度型float逻辑型bool数组type 指针type * 空类型 void 结构 struct 联合 union 枚举enum 类 class数据类型非基本数据类型数据类型 在高级程序设计语言中已实现了的,或非高级语言直接支持的数据结构。 变量的数据类型 在程序设计语言中,一个变量的数据类型不仅规定了这个变量的取值范围
10、,而且定义了这个变量可用的操作。数据结构与数据类型 基本数据类型对应于简单的数据结构; 数据结构反映数据内部的构成方式,它常常用一个结构图来描述非基本数据类型对应于复杂的数据结构。 数据结构有线性与非线性之分。 在非线性数据结构中又有层次与网状之分。 由于数据类型是按照数据结构划分的,因此,一类数据结构对应着一种数据类型。 数据类型有线性与非线性之分 数据类型按照该类型中的数据所呈现的结构也有线性与非线性之分,层次与网状之分。一个数据变量,在高级语言中的类型说明必须是该变量所具有的数据结构所对应的数据类型。 数组结构的特点 数据元素的个数固定,它们之间的逻辑关系由数据元素的序号(或叫数组的下标
11、)来体现。这些数据元素按照序号的先后顺序一个挨一个地排列起来。 每一个数据元素具有相同的结构(可以是简单结构,也可以是复杂结构),因而属于同一个数据类型(相应地是简单数据类型或构造数据类型)。这种同一的数据类型称为基类型。 所有的数据元素被依序安排在一片连续的存储单元中。 记录结构的特点 与数组结构一样,成分数据的个数固定。但成分数据之间没有自然序,它们处于平等地位。每一个成分数据被称为一个域并赋予域名。不同的域有不同的域名。 不同的域允许有不同的结构,因而允许属于不同的数据类型。 数组结构一样,它们可以随机访问,但访问的途径靠的是域名。 在高级语言中记录结构对应的数据类型是记录类型。记录结构
12、的数据的变量必须说明为记录类型。抽象数据类型(Abstract Data Type,ADT) 抽象数据类型的概念 是带有一些操作的数据元素的集合,它是一种描述用户和数据之间接口的抽象模型。 ADT的主要功能是简单而明确地描述数据结构的操作。抽象数据类型为用户提供了一种定义数据类型的手段,其关键的两要素为数据的结构以及在该结构上相应的操作的集合。 抽象数据类型的目的 把数据类型的表示和数据类型上运算的实现与这些数据类型和运算在程序中的应用隔开,使它们相互独立。例如,定义抽象数据类型“复数” 数据对象: De1,e2e1,e2RealSet 数据关系: R1 | e1是复数的实数部分, | e2
13、是复数的虚数部分 ADT Complex 基本操作: plex ( &Z, v1, v2 )操作结果:构造复数 Z,其实部和虚部 分别被赋以参数 v1 和 v2 的值。 GetReal( Z, &realPart )初始条件:复数已存在。操作结果:用realPart返回复数Z的实部值。 GetImag( Z, &ImagPart )初始条件:复数已存在。操作结果:用ImagPart返回复数Z的虚部值。 Add( z1,z2, &sum )初始条件:z1, z2是复数。操作结果:用sum返回两个复数z1, z2 的和。 ADT Complex Multiply ( z1,z2, &sum )初始
14、条件:z1, z2是复数。操作结果:用sum返回两个复数z1, z2 的积。 bool Division ( z1,z2, &sum )初始条件:z1, z2是复数。操作结果:用sum返回两个复数z1, z2 的商。 # include # include complex.h void main() complex z1,z2,z3,z4,z;float RealPart,ImagPart; plex(z1,8.0,6.0); plex(z2,4.0,3.0);Add(z1,z2,z3);Multiply(z1,z2,z4);if (Division (z4,z3,z) GetReal (z,
15、 RealPart); GetImag (z, ImagPart);/ifADT 有两个重要特征:数据抽象 用ADT描述程序处理的实体时,强调的是其本质的特征、其所能完成的功能以及它和外部用户的接口(即外界使用它的方法)数据封装 将实体的外部特性和其内部实现细节分离,并且对外部用户隐藏其内部实现细节抽象数据类型的描述方法抽象数据类型可用(D,S,P)三元组表示其中,D 是数据对象, S 是 D 上的关系集, P 是对 D 的基本操作集。 ADT 抽象数据类型名 数据对象:数据对象的定义 数据关系:数据关系的定义 基本操作:基本操作的定义 ADT 抽象数据类型名其中基本操作的定义格式为: 基本操
16、作名(参数表) 初始条件:初始条件描述 操作结果:操作结果描述 赋值参数 只为操作提供输入值;引用参数 以&打头,除可提供输入值外,还将返回操作结果。初始条件 描述了操作执行之前数据结构和参数应满足的条件,若不满足,则操作失败,并返回相应出错信息。操作结果 说明了操作正常完成之后,数据结构的变化状况和应返回的结果。若初始条件为空,则省略之。抽象数据类型的表示和实现 抽象数据类型需要通过固有数据类型(高级编程语言中已实现的数据类型)来实现。例如,对以上定义的复数typedef struct float realpart; float imagpart;complex;/ -存储结构的定义/ -基
17、本操作的函数原型说明void plex( complex &Z, float realval, float imagval );/ 构造复数 Z,其实部和虚部分别被赋以参数 / realval 和 imagval 的值float GetReal( cpmplex Z ); / 返回复数 Z 的实部值float Getimag( cpmplex Z ); / 返回复数 Z 的虚部值void add( complex z1, complex z2, complex &sum ); / 以 sum 返回两个复数 z1, z2 的和 / -基本操作的实现void add( complex z1, co
18、mplex z2, complex &sum ) / 以 sum 返回两个复数 z1, z2 的和 sum.realpart = z1.realpart + z2.realpart; sum.imagpart = z1.imagpart + z2.imagpart; 其它省略 1.3 算法和算法的衡量一、算法二、算法设计的原则三、算法效率的衡量方法和准则四、算法的存储空间需求 算法是为了解决某类问题而规定的一个有限长的操作序列。一个算法必须满足以下五个重要特性:1有穷性 2确定性 3可行性4有输入 5有输出一、算法1有穷性 对于任意一组合法输入值,在执行有穷步骤之后一定能结束,即:算法中的每个
19、步骤都能在有限时间内完成;2确定性 对于每种情况下所应执行的操作,在算法中都有确切的规定,使算法的执行者或阅读者都能明确其含义及如何执行。并且在任何条件下,算法都只有一条执行路径;3可行性 算法中的所有操作都必须足够基本,都可以通过已经实现的基本操作运算有限次实现之;4有输入 作为算法加工对象的量值,通常体现为算法中的一组变量。有些输入量需要在算法执行过程中输入,而有的算法表面上可以没有输入,实际上已被嵌入算法之中; 5有输出 它是一组与“输入”有确定关系的量值,是算法进行信息加工后得到的结果,这种确定关系即为算法的功能。二、算法设计的原则设计算法时,通常应考虑达到以下目标1正确性2. 可读性
20、3健壮性4高效率与低存储量需求1正确性 首先,算法应当满足以特定的“规格说明”方式给出的需求。 其次,对算法是否“正确”的理解可以有以下四个层次:a程序中不含语法错误;b程序对于几组输入数据能够得出满足要求的结果; c程序对于精心选择的、典型、苛刻且带有刁难性的几组输入数据能够得出满足要求的结果;通常以第 c 层意义的正确性作为衡量一个算法是否合格的标准。 d程序对于一切合法的输入数据都能得出满足要求的结果;2. 可读性 算法主要是为了人的阅读与交流,其次才是为计算机执行。因此算法应该易于人的理解;另一方面,晦涩难读的程序易于隐藏较多错误而难以调试;3健壮性 当输入的数据非法时,算法应当恰当地
21、作出反映或进行相应处理,而不是产生莫名奇妙的输出结果。并且,处理出错的方法不应是中断程序的执行,而应是返回一个表示错误或错误性质的值,以便在更高的抽象层次上进行处理。4高效率与低存储量需求通常,效率指的是算法执行时间;存储量指的是算法执行过程中所需的最大存储空间。两者都与问题的规模有关。三、算法效率的衡量方法和准则通常有两种衡量算法效率的方法: 事后统计法事前分析估算法缺点:1。必须执行程序 2。其它因素掩盖算法本质和算法执行时间相关的因素:1算法选用的策略2问题的规模3编写程序的语言4编译程序产生的机器代码的质量5计算机执行指令的速度 一个特定算法的“运行工作量”的大小,只依赖于问题的规模(
22、通常用整数量n表示),或者说,它是问题规模的函数。假如,随着问题规模 n 的增长,算法执行时间的增长率和 f(n) 的增长率相同,则可记作:T (n) = O(f(n)称T (n) 为算法的(渐近)时间复杂度如何估算 算法的时间复杂度?一个算法所耗费的时间,应是该算法中每条语句的执行时间之和。每条语句的执行时间就是该语句的执行次数(也称频度)与该语句执行一次所需时间的乘积。一个算法的时间耗费就是该算法中所有语句的频度之和。 例一 两个矩阵相乘求两个n阶矩阵的乘积C=AB,其算法的基本操作部分如下:(1) for(i=1;i=n;i+)(2) for(j=1;j=n;j+)(3) cij=0;(
23、4) for(k=1;k=n;k+)(5) cij=cij+aik*bkj; 语句(1)的循环控制变量i要增加到n+1,测试i=n+1成立时,循环才会终止,因此它的频度为n+1,但它的循环体却只能执行n次语句(2)作为(1)的循环内语句应执行n次,但语句(2)本身要执行n+1 次,所以(2)的频度为n(n+1)同理可得(3)、(4)、(5)的频度分别为n2、n2(n+1)、n3。 该算法中所有语句的频度之和,即运行时间为: T(n)=2n3+3n2+2n+1当n足够大时,T(n)与n3之比是一个不等零的常数,则称T(n)和n3是同阶的,记为T(n)=O(n3)。一般情况下,算法中基本操作重复执行的次数是问题规模的某个函数f(n),因此,算法的时间度量记作:T(n)=O(f(n)为该算法的 渐近时间复杂度,简称时间复杂度。f(n)一般为算法中频度最大的语句频度对于较复杂的算法,我们可以将它分成几个容易估算的部分,然后利用“O”的求和原则和乘法原则计算整个算法的时间复杂度。大“O”下的求和准则:若算法的两部分的时间复杂度为T1(n)=O(f(n)和T2(n)=O(g
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025-2026学年下学期北师大版八年级数学期末考试模拟试卷
- 2025年建筑行业绿色认证与碳中和评估
- 年夜饭外卖预订指南
- 工业互联网协同制造平台建设可行性报告-2026年技术创新驱动因素
- 循证康复实践中的康复-质量创新
- 2026年特色小镇文化旅游IP运营项目与旅游目的地营销的可行性报告
- 影像组学模型在肿瘤治疗疗效预测中的精准度提升
- 高中生物生态学建模教学与生态环境监测技术研究教学研究课题报告
- 2025年锂电池回收环保五年标准分析报告
- 康复评估的循证康复循证实践共识
- (13)普通高中艺术课程标准日常修订版(2017年版2025年修订)
- 水务网络安全培训课件
- 2025年《思想道德与法治》期末考试题库及答案
- 成都市X街道社区网格化治理存在的问题及对策研究
- 鲁迅完整版课件
- 终端安全培训课件
- 汽车维修岗前培训考试题及答案解析
- 江西吉安市市直事业单位选调考试真题2024
- GSK928TE-GSK928TC-编成和操作说明
- 高压配电室设备维护施工方案
- 九年级上册历史单元复习学练案(一至七单元)(含答案)
评论
0/150
提交评论