《数据库原理与应用》北师珠必备复习重点.doc_第1页
《数据库原理与应用》北师珠必备复习重点.doc_第2页
《数据库原理与应用》北师珠必备复习重点.doc_第3页
《数据库原理与应用》北师珠必备复习重点.doc_第4页
《数据库原理与应用》北师珠必备复习重点.doc_第5页
已阅读5页,还剩20页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第1章 数据库系统概述1. 数据库的概念1) 数据库是存储在计算机存储设备上的: 数据库是存在于计算机存储设备上的一个或多个(数据库)文件组成的统一体,是可感知的数据库形体。 2) 数据库是按一定的组织方式存储在一起的: 数据库中的数据是以结构化的形式存储的,这种结构化形式实质上就是数据库的数据模型,是不可感知的数据库形体。3) 数据库是相关的数据集合: 数据库中的数据既有某特定应用领域涉及的各种基本数据,也有反映这些数据之间联系的数据,也是不可感知的数据库形体之一。 DBMS的概念数据库管理系统(DBMS)是建立、管理和维护数据库的软件系统,是一种位于应用软件和操作系统之间,实现数据库管理功能的系统软件。 2. DBMS的主要功能定义、 操纵 、控制、 维护数据库 并有 通信功能3. 数据库应用系统概念成以计算机为开发和应用平台,以OS、DBMS、某种程序语言和实用程序等为软件环境,以某一应用领域的数据管理需求为应用背景,采用数据库设计技术建立的一个可实际运行的,按照数据库方法存储和维护数据的,并为用户提供数据支持和管理功能的应用软件系统。 4. 三个世界对数据的描述现实世界是存在于人们头脑之外的客观世界。可狭义地将现实世界看作为各个事物、各个现象、各个单位的实际情况。计算机世界数据世界 对数据和信息的处理信息世界是现实世界在人们头脑中的反映和解释,是现实世界的概念化。5. 数据模型的概念及组成数据模型是现实世界中的各种事物及各事物之间的联系用数据及数据间的联系来表示的一种方法。一个数据库的数据模型实际上给出了在计算机系统上进行描述和动态模拟现实世界信息结构及其变化的方法。是一组面向计算机的概念集合,由数据结构、数据操作、数据约束三部分组成6. 层次模型、 是一种用树型(层次)结构来组织数据的数据模型。 树中的每个结点代表一种记录类型。 网状模型 (1)至少有一个结点多于一个双亲结点; (2)至少有一个结点无双亲结点。 关系模型 系模型是一种用二维表格结构表示数据及数据之间联系的 (优于上面两个)7. 数据库的三级模式及两级影像与数据独立性数据库的三级模式结构指的是一种从数据库管理系统(DBMS)的角度看到的数据库模式结构和映射关系。内模式 是对数据库表物理存储结构的描述。逻辑模式 是对DB中全部数据的整体逻辑结构的描述, 体现了全局、 整体的数据观点。 外模式 是对数据库用户能看见和使用的局部数据逻辑结构的描述,体现了 应用程序员对数据库的数据观点。 三级数据库结构 :用户级DB 局部逻辑结构概念级DB 全局逻辑结构存储级DB 存储组织结构(1) 数据的体系结构如何保证数据独立性?应用程序是依据数据的外模式编写当逻辑模式改变时候,只需要把 外模式/模式映像 做出相应的改变就行,以至于外模式保持不变,从而可以不必修改应用程序,保证了数据与程序的逻辑独立性(只要没有改变逻辑模式中与外模式定义有关的属性及与其关系模式名的隶属关系,就可使外模式保持不变)当内模式改变的时候,由数据库管理员对 模式/内模式映像 做相应的改变,可以使逻辑模式保持不变,从而应用程序也不必修改,保证了数据与程序的物理独立型。第2章 关系运算1. 关系的定义关系是一张表,表中的每行(即数据库中的每条记录)就是一个元组,每列就是一个属性。 在二维表里,元组也称为记录。 定义2.1 设有属性A1和A2分别在值域D1和D2中取值,则这两个属性的值域集合的笛卡儿积定义为: D1D2=|d1D1且d2D2 其中,序偶d1,d2中的两个元素d1和d2是有序的,也即其次序是不能改变的。进一步讲,D1D2D2D1。但是 不强调其n元组中元素次序的笛卡儿积运算,称为广义笛卡儿积运算比如:设D1=1,2,3,基数为3; D2=a,b,基数为2;则有: D1D2=, , 且基数为32=6。例2.1:设D1=李兵,王芳,D2=男,女, D3=北京,上海。D1D2D3= , , , , , , ,且基数为222=8。笛卡儿积的基数即为笛卡儿积定义的 元组集合中的元组的个数 定义2.2 笛卡儿积D1D2Dn的任一子集称为在域D1,D2, ,Dn上的关系。 其中,值域集合D1,D2, ,Dn是关系中元组的取值范围,称为关系的域(Domain),n称为关系的目或关系的度(Degree)。例如:n=2时,二元关系n=m时,m元关系2. 关系的性质 (1)关系中的每个属性值都是不可再分的数据单位,即关系表中不能再 有子表; (2)关系中任意两行不能完全相同,即关系中不允许出现相同的元组; (3)关系是一个元组的集合,所以关系中元组间的顺序可以任意; (4)每一个关系都有一个主键,用于唯一地标识它的各个元组。3. 关系代数的运算(1) 知道运算的含义及表示符号(2)能够求解关系代数表达式的值(3)能够用关系代数表达式表达查询要求 4.等值连接、自然连接与外连接的含义 略第3章 数据应用系统设计方法1. 数据库设计的主要步骤及每一阶段的主要任务问题定义、可行性研究、需求分析 : 用户需求分析是指分析用户对数据管理的功能需求和应用需求,是进行数据库应用系统设计的基础。数据流图 是一种用于描绘系统逻辑模型的图形工具,是逻辑系统的图形表示。 数据字典 表达出每个数据和处理的具体含义和详细描述信息、总体设计、详细设计、编码与单元测试、综合测试、软件维护2. 数据库各级模式(概念模式、逻辑模式、外模式和物理模式)形成的阶段概念模式 E-R图 步骤 局部E-R图 集成局部的形成一个完整的E-R图 优化(消除命名冲突、消除属性特征冲突、消除结构冲突、消除冗余数据和冗 余联系)逻辑模式 概念结构设计阶段设计好信息结构转换为一组关系模式; 2、步骤 (1)将设计好的概念结构转换成关系模型; (2)利用规范化理论对转换好的关系模型进行规范化设计和处理; (3)对关系模型进行优化处理。物理模式 是指数据库在物理存储设备上的存储结构和存取方法。在物理存储设备上为逻辑结构设计阶段设计好的数据库逻辑结构,选取和设计一个占用存储空间较少、查询效率尽可能高、维护代价较低的数据库物理结构;并对设计好的物理结构从时间和空间效率方面进行评价,以便确定是否对其逻辑结构或物理结构进行进一步的优化设计。 存储数据库信息的物理文件包括:数据文件、日志文件、控制文件三类。外模式又称子模式或用户模式,对应于用户级。它是某个或某几个用户所看到的数据库的数据视图,是与某一应用有关的数据的逻辑表示。外模式是从模式导出的一个子集,包含模式中允许特定用户使用的那部分数据。用户可以通过外模式描述语言来描述、定义对应于用户的数据记录(外模式),也可以利用数据操纵语言(Data Manipulation Language,DML)对这些数据记录进行。外模式反映了数据库的用户观。3. E-R图的设计方法 1、图的基本要素 (1)实体集 正方形 (2)联系集 菱形 (3) 属性集 椭圆形4. E-R图向关系模型的转换方法 1、主要任务 就是按照一定的规则,将概念结构设计阶段设计好的,独立于任何DBMS数据模型的信息结构,转换为一组关系模式;并利用关系数据库的规范化理论对这组关系模式进行规范化设计和优化处理,从而得出满足所有数据要求的关系数据库模型,也即数据库的逻辑结构。 2、步骤 (1)将设计好的概念结构转换成关系模型; (2)利用规范化理论对转换好的关系模型进行规范化设计和处理; (3)对关系模型进行优化处理。5. 索引的概念及作用索引是一种表形式的数据结构,由给定的一个或一组数据项(主键或非主键)组成。对于主键值 Ki(i=1,2,n)和对应记录的地址A(Rki),Ki,A(Rki)称为索引项6. 稠密索引、稀疏索引及聚簇索引1稠密索引(dense index)及其特征 1)按主键值的排序建立索引项,每个索引项包含一个主键值和由该主键值标识的记录的地址指针。 2)每个索引项对应一个记录,记录的存放顺序是任意的 。 3)索引项的个数与记录的个数 相等(也就是说索引项较多,所以称为稠密索引)。2稀疏索引(sparse index) 及其特征 1)所有数据记录按主键值顺序存放在若干个块中 。 2)每个块的最大主键值(即该块最后一个数据记录的主键值)和该块的起始地址组成一个索引项 。 3)每个块中的索引项按主键值顺序排列组成索引表(由于是每个块只有一个索引项,索引项较少,所以称为稀疏索引)。 3、 数据聚簇 是数据库物理结构设计中提高查询性能的另一种有效方法。 使那些经常在一起进行联接查询的表的数据在物理介质上尽量临近存放,也即把它们聚集地存放在一起。 进行联接查询的几个表必定存在公共字段,这些公共字段或者是某个表的主键,或者是某个表的外键,所以就可利用这些公共字段,把相关表中主键与外键相同的记录临近存放,把多个表的数据存储到同一物理块上。这样在进行联接查询操作时,进行联接运算的几个表的数据就可在同一个物理块中同时调到内存中,从而可以减少存储管理中的页面调进调出次数和搜索时间。第5章 关系数据库语言SQL1. SQL的功能及特点 SQL语言有三大功能: 1、数据定义功能 用于定义基本表、定义视图、定义索引等。 2、数据操纵功能 用于实施对数据库的数据查询和数据更新。 3、数据控制功能 用于实现对数据库对象的控制。SQL具有两个特点:1、SQL具有2种工作方式: 交互式命令 用户可以联机在系统提供的查询编辑器窗口上,通过直接键入SQL命令(语句)对数据库进行操作,系统然后会把处理结果显示给用户。嵌入式SQL语句可以被嵌入到某种高级语言(比如,C语言)程序中实现对数据库的操作,并利用主语言的强大计算功能、逻辑判断功能、屏幕控制及输出功能等,实现对数据的处理和输入输出控制等。 2、 SQL支持数据库的三级模式结构 外模式 模式 内模式2. 常用的SQL语句(1) create tableCREATE TABLE ( , , , , );的必须要填 的可选表的主键约束子句,格式为 PRIMARY KEY( , ,) 表的外键约束 格式为: foreign KEY () reference ()(2) Alter table增加列 在表的最后一列后面增加新的一列。 语句格式: ALTER TABLE ADD ;(3) 、drop table 删除列 ALTER TABLE DROP CASCADE | RESTRICT;当选择CASCADE时,表示在删除名为“”的表中的列“”时,所有引用到该列的视图或有关约束也一起被删除。当选择RESTRICT时,表示当没有视图或有关约束引用列“”时,该列才能被删除,否则拒绝该删除操作。(3) create view、drop viewCREATE VIEW () AS WITH READ ONLY | WITH CHECK OPTION;drop view (view name)(4) insert INSERT INTO () ; 用于把从某个或某些表中查询出的数据插入到另 一个表中去数据的导入。例 INSERT INTO S_C(S#,SNAME,SSNAME,CLASS) SELECT S .S#,SNAME,SSNAME,CLASS FROM S,SS WHERE S.SCODE# = SS.SCODE AND S# IN (SELECT S# 学习了信息安全技术课程的学生的学号 FROM SC WHERE C# IN (SELECT C# 信息安全技术课程的课程号 FROM C WHERE CNAME =信息安全技术); (5) 、update、deleteUPDATE SET ,, WHERE ; (6) Select1. COUNT distinct(列名) 计算列名所在列中不同值的个数 COUNT(*) 计算元组的个数 COUNT(列名) 计算列名所在列的值的个数2. 给列名起别名的语句格式为: AS AS 例如 查询所有学生所学课程的最高分数、最低分 数和平均分数。 SELECT MAX(GRADE) AS 最高分数, MIN(GRADE) AS 最低分数, AVG(GRADE) AS 平均分数 FROM SC; 3. 把某数值型列的值限定在某个数值区间的比较查询条件(、=),均可以用比较运算符“BETWEEN AND”来表示。 格式为: BETWEEN AND 4. 分组查询 在SQL语言中,把元组按某个或某些列上相同的值分组,然后再对各组进行相应操作的查询方式称为分组查询。 语句格式: SELECT FROM WHERE GROUP BY HAVING ; GROUP BY子句用来将列的值分成若干组,从而控制查询的结果排序。 5. 按学号递增的顺序(查询)显示学生的基本信 息。 SELECT * FROM S ORDER BY S# ASC; 6. 按学号递增、课程成绩递减的顺序(查询)显 示学生的课程成绩。 SELECT S#,C#,GRADE FROM SCORDER BY S# ASC,GRADE DESC;字符串的匹配 LIKE 字符串1 % 字符串2 % 什么都行多少个都行 LIKE 字符串1 _字符串2(那个下划线要两条才能代表一个汉字)_中间那个字可以是什么都行3. 视图与基本表的区别、视图的作用视图是由数据库中满足一定条件约束的数据组成的“虚表”作用可起到了对数据库中数据进行安全保护的作用 用户视图给数据库应用系统的设计提供了极大的优越性实现了数据库的逻辑数据独立性第6章 关系数据模式设计1. 函数依赖的基本概念及表示 一个关系模式是一个五元组R,U,D,DOM,F:R-关系名U-关系R的属性全集D-属性的值域的集合DOM-属性集U到值域集合D的映射F-关系R中的属性集U上的一组约束,即函数依赖集合简化:R(U,F)函数依赖不是指关系模式R的某个或某些关系实例满足的约束条件,而是指关系模式R的所有实例均要满足的约束条件。一个教员对应一个教研室,课程号与课程名相互联系等。这类依赖是最基本、最重要的一种数据依赖,人们称之为函数依赖。Functional Dependency简称FD函数依赖与属性之间的联系类型有关。属性X与Y有1:1的联系,XY,YX。公司名总裁,总裁公司名,即:公司名总裁属性X与Y有m:1的联系,则只存在XY。 学号与专业之间是m:1,则:学号专业属性X与Y有m:n的联系,则X与Y之间不存在函数依赖关系。a) 平凡函数依赖、非平凡函数依赖、b) 部分函数依赖、完全函数依赖、传递函数依赖c) 决定属性集(决定因素)2. 逻辑蕴含及F的闭包3. X的候选键R的函数依赖定义4. Armstrong公理系统及推论5. X关于F的闭包及计算方法所有被F逻辑蕴涵的函数依赖组成的依赖集称为F的闭包,记为F。 F中的元素是函数依赖; 一般地有FF; 一个FD能够成为F中的元素的条件是:能够从F中推导出该FD。1 那里 Z=EG 是因为 X0=BD 的子集的函数依赖只有D-EG,该依赖的呗决定因素组成的集合记为Z=EG6. 最小函数依赖集满足下列条件的函数依赖集F称为最小函数依赖集。 F中每一个FD的右端都是单个属性; 对F中任何FD:XA,F-XA不等价于F;(F没有多余的FD) 对F中的任何FD:XA和X的任何真子集Z, (F-XA)ZA不等价于F。(每个FD左端无多余的属性)求解方法(1) 用分解规则将F中的所有函数依赖分解成右端为单个属性的函数依赖; (2)去掉F中冗余的函数依赖 (3)去掉左端多余的属性例子:7. 模式分解的概念及等价标准(无损连接、保持函数依赖)关系模式分解是解决数据冗余和操作异常问题的基本途径或者说是常用方法。 无损连接判断定理 设有关系模式R(U,F),=(R1,R2)是R的一个分解,当且仅当 (R1R2)(R1-R2)F+ 或(R1R2)(R2-R1)F+ 时,具有无损连接性。保持函数依赖判断定理R1(F) U R2(F) F+时具有保持函数依赖性8. 范式(1NF、2NF、3NF、BCNF)的定义及应用(1)给定一个关系模式R,能判定最高符合第几范式1、候选键的形式化定义 设有关系模式R(U,F)和属性集U=A1,A2,An的子集X。如果: XA1A2AnF; 不存在X的真子集X,使XA1A2AnF。 则称X是R的一个候选键。2、候选键的求解方法l 若X是L类属性,则X必为R的某一候选键的成员。l 若X是L类属性,且

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论