版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、数据库基础知识,程序员考试大纲,1,一、数据库系统 (DBS DataBase System ),数据库(DB) DB是长期存放在计算机系统内部的一个相互关联的、通用的、综合的(顺序组织、索引、聚集方法组织)、有结构的、可共享的数据集合。它具有较小数据的冗余和较高数据独立性( 数据的组织和存储方式与应用程序是密切相关的)、安全性和完整性,在DBMS控制和管理之下的实现的,可以为用户共享。,1、数据库系统定义,数据库系统是由数据库(DB)、数据库管理系统(DBMS)、数据管理员(DBA)、应用程序、用户和计算机软件/硬件系统等组成的一个集合。,(1)数据库,2,一、数据库系统 (DBS Data
2、Base System ),(2)数据库管理系统(DBMS),是一个数据管理软件,是数据库系统的核心,提供用户与数据之间的接口,并具有数据库的定义和管理功能。,3,一、数据库系统 (DBS DataBase System ),(2)数据库管理系统(DBMS)功能,1)数据库定义 包括外部模式、内部模式、概念模式、模式间映像、数据库完整性、安全性、存取路径定义。这些定义存放在数据字典中,是DBMS 运行的依据 。,2)数据控制功能 数据库访问的安全性、完整性、并发控制。以保证数据可靠性和可用性。,3)数据操纵功能 DBMS接收用户的操作需求,完成对数据库的查询、插入、删除等操作、数据备份与恢复等
3、。,4、查询功能:,5、通信功能:,4,一、数据库系统 (DBS DataBase System ),DBA、系统分析员、程序员、用户,A、DBA:专门负责整个数据库的建立、查询、维护、协调工作的专门人员。 其主要职责有: 1)参与数据库的设计与建立。 参与数据库系统的外模式、概念模式、内部模式的建立。 2)对系统进行监控。 3)定义数据的安全性和完整性约束条件。 4)负责数据库性能的改进和数据的重组及重构工作。 监视系统统性能、对数据库中数据进行重组,根据用户对数据库的需求对数据库进行重构,当数据库出现了故障时,对数据库系统的进行恢复。 B、系统分析员:负责应用系统的需求分析和规范说明。 C
4、、程序设计员 D、用户 。,5,一、数据库系统 (DBS DataBase System ),DBS=DB+DBMS+OS+DBA,6,A、人工管理阶段: 20世纪50年代,操作系统还末出现,数据管理是人工管理方式来实现的。此时数据的逻辑结构和物理结构完全需要用户自己设计,程序依赖于数据,不具独立性;数据面向特定的应用,不能共享;数据并且不需要长期保存。,B、文件系统阶段: 20世纪60年代,出现了操作系统,数据管理通过操作系统来管理(文件系统),数据组织成为若干文件。 它具有如下优点:文件系统可以通过“按名存取”,可以长期保存。 其不足之处:数据独立性差(文件逻辑结构改变对应的程序也需要修改
5、,反之亦然。);数据冗余度大且不一致性(因为文件是面向某个或某组用户,不同用户需要不同的文件);文件内部记录之间无联系;安全性较低;一般不支持应用程序对文件的并发访问。,(3)数据库的发展,7,C、数据库系统阶段: 20世纪60年代后期,出现了快速的大容量的磁盘存储设备,提供了数据管理的物质基础。随着多用户、多应用对数据的共享的需求,出现了数据库管理系统(DBMS),,1、数据库中数据集中化控制 1)将系统中所有要使用的数据按照一定结构集中存放。 2)数据库管理员(DBA) 数据库系统设有DBA,对数据库专门进行管理和维护。 2、数据冗余度小 数据集中存放的结果是数据冗余小。 3、采用一定的数
6、据模型实现数据结构化 数据库中数据是按照一定的数据模型来组织、描述和存放的。数据模型能够描述各种现实数据和之间的联系。数据同是面向系统而不再面向某个具体应用。数据模型有:网状、层次、关系三种,对应于三种不同数据库。,8,4、避免了数据的不一致性 数据的不一致性是指数据不相容性或矛盾性,即同一数据在同一数据库内重复出现,且具有不同的值。例如:职工的工资在职工工资单或职工档案中具有不同的值。是由于数据重复存放(冗余)造成的。 5、实现数据共享 数据库中一组数据集合可为多种语言和多个用户共同使用。 1)当前所有用户(批处理、联机用户) 2)能够新的应用需求。(由于数据与应用独立) 3)具有多种接口(
7、C/C+ 、VF 、PL/SQL等) 6、提供数据保护 提供一系列数据保护功能、如数据安全、数据完整约束、迸发控制等。 7、数据独立性 数据库中的数据独立于应用程序,即数据的逻辑结构、存储结构与存取方式的改变不影响应用程序。 1)逻辑独立性:数据的总体逻辑结构发生改变(如:修改数据定义、新增数据类型等),不影响应用程序。 2)物理独立性:数据的物理结构(存储结构、存取方式)改变不影响数据的逻辑结构。 因为数据模型中有三个层次。,9,8、数据由DBMS统一管理和控制 数据库的共享是并发式的共享,即多个用户同时访问数据库中的数据。在DBMS中提供了以下机制保证此操作能实现: 1)数据安全性: 2)
8、数据完整性: 3)并发控制: 4)数据库恢复:,10,2、数据模型,1)数据的范畴:数据从现实世界进入数据库实际经历可分为三个阶段:现实世界、信息世界、机器世界。,现实世界:客观存在并可以相互区分的事物,称为实体,用E-R模型表示;,信息世界:客观事务物头脑中的反应;,机器世界:对信息世界的数据化,数据化后的信息称为数据;,11,2、数据模型,2)E-R图:,E-R(Entity-Relationship):实体联系方法。是描述现实世界的描述方法。,三个要素:实体、属性、联系。,实体(ENTITY) 实体是客观存在且可以区分的事物。如学生、职工等具体的;也可以是梦、文化艺术等抽象。 具有相同性
9、质的实体的集合称为实体集。如全体职工。 实体用方框表示。,12,2、数据模型,2)E-R图:,E-R(Entity-Relationship):实体联系方法。是描述现实世界的描述方法。,三个要素:实体、属性、联系。,属性(ATTRIBUTE) 实体或联系所具有的特征。实体之间通过特征来区分。用椭圆表示。 属性具有如下特征:,13,2、数据模型,2)E-R图:,E-R(Entity-Relationship):实体联系方法。是描述现实世界的描述方法。,三个要素:实体、属性、联系。,联系(RELATIONSHIP) 联系是实体集之间关系的抽象描述,即对现实世界中事物之间关系的描述。如“读者”与“图
10、书”之间通过借书来联系。“教师”实体和“学生”实体通过“授课”联系。 一般有三种类型:一对一(1:1)、一对多(1:n)、多对多(n:m) 用菱形表示。,14,2)E-R图 E-R图是E-R数据模型的图形表示方法。 A、E-R图的表示方法 矩形表示实体;菱开形表示联系(内有联系名,无向边表示实体之间的接连,边上标明联系的类型);属性用椭圆表示。,15,3)数据库系统的结构 分为: 集中式结构:将数据及数据管理集中在一台计算机上,效率高、可靠性好、数据冗余少,独立性高;,客户/服务器网络结构:客户端通过用户界面或接口提出请求,服务端响应请求, 将执行结果传递给客户端;,分布式结构:数据库的数据分
11、布在不同的计算机上,逻辑上是一个整体,对用户而言是透明的;,16,3)数据模型,表示数据与数据之间联系的方法称为数据模型,有三种方法:层次模型、关系模型、网状模型。,层次模型:层次模型是按照层次结构的形式来组织数据库的数据模型,即用树型结构表示实体集与实集之间的联系。,特点 1:每棵树有且仅有一个结点无双亲,此结点为根(Root) 2:除根以外,每个结点仅有一个双亲结点。 例如:家族关系、行政关系等。,次模型数据结构的型与值 型是指层次型数据模型数据结构对实体集及实体集之间的联系的描述。 值是型的一个实例,具体的一个记录。,17,层次型模型: 1、用树的前序遍历(从上到下,从左到右)的次序作为
12、数据的存储次序。 2:层次路径: 指明从根结点到目标结点的一条查询路径。,数据约束: 1、除根结点以外,任何结点都不能离开双亲结点而孤立存在。插入,删除受限制。 2只限于二元1:n 或1:n的联系。,其代表有:IBM公司的 IMS系统。,18,网状数据模型的数据结构,用网状数据结构表示实体集和实体之间联系的模型称为网状数据模型。其表现为一个双亲记录允许多个子女记录,而且一个子女记录型也允许有多个双亲记录型。,(1)网状模型数据结构的特点,A、允许有一个以上结点无双亲,且至少有一个结点有多于一个双亲。,B、网状模型允许有重复链。,其代表有:CODASYL,19,关系数据模型 是以集合论中的关系概
13、念为基础发展起来的一种数据模型,用二维表格来描述实体集及实体间的联系。,关系数据模型的数据结构,二维表称为关系,表中列称为属性,列中取值所有集合称为域,表中一行称为元组。每个元组用关键字标识。,系数据模型的描述功能,1)用二维表描述实体集及其属性。,关系R,20,用二维表描述实体间的联系。,实体-读者关系,实体-图书关系,联系-借阅关系,实体与联系的表示统一起来。,21,关系的性质 1)关系是一个二维有,一行称为一个元组,一列称为一个属性,有一个域。 2)每一列具有相同的值域。通过属性名来区别。 3)关系中属性不能分解,必须是原子属性。 4)关系中任意两个元组不能完全相同。 5)关系中列、元组
14、的顺序是无关紧要的。 6)每个元组都有一个关键字来标识每个元组。,其代表有:sysbase 、 oracle、 sql server 、 foxpro、 access、 informix,22,关系模式 关系中内容信息的描述。包括关系名、属性名、值域、数据完整性约束、属性间的函数据依赖。记为:,23,在数据模型中有关数据结构及其相互关系的描述称为数据模式(DATA SCHEMA),数据库系统的三级模式结构,数据库从逻辑结构上可以划分三个层次:外部模式(EXTERNAL SCHEMA)、概念模式(CONCEPTUAL SCHEMA)和内部模式(INTERNAL SCHEMA),称为数据库系统的三
15、级模式结构。,24,25,概念模式: 概念模式(简称模式,也称逻辑模式)是对数据库全局逻辑结构的描述,是对数据库所有用户的公共数据视图。一个数据库只有一个概念模式,是三级模式的中间层,不涉及数据的物理存储细节和硬件环境,也与具体的应用程序及程序设计语言无关。 概念模式由DBMS提供的模式DDL语言,字义了数据的逻辑结构(如字段名称、类型、域等,数据之间的联系、安全性、完整性等内容)。是全体数据的描述,本身并不是数据库,只是装配数据的一个框架。,外部模式(EXTENAL SCHEMA) 外部模式(也称子模式或用户模式或外模式)是用户观念下的局部数据结构的逻辑描述,是数据库用户(包括应用程序员和最
16、终用户)能够看见和使用的局部数据的逻辑结构和特征的描述。是概念模式的一个逻辑子集。,26,外部模式由DBMS提供的外部模式语言(外部DD)来定义和描述。其优点如下: A、方便用户使用,简化了用户接口。 用户不必了解数据的存储结构便可在终端上操作数据。 B、保证数据的独立性。 通过模式间的映像数据库的独立性。 C、有利于数据共享。 多个 用户的外模式都可来自于同一概念模式。 D、有利于数据的安全和保密。 用户只能操作其外模式范围内的数据,对于其它的数据用户是看不见的,从而保证了数据安全性。,27,内部模式(INTERNAL SCHEMA) 内部模式(也称存储模式)是地数据库中数据物理结构和存储方
17、式的描述。是数据在数据库内部的表现形式,一个数据库只有一个内部模式。它规定了数据项、记录、键、数据集、指针、索引和存取路径、数据是否加密、压缩以及优化性能。它由DBMS提供的内部模式语言(内部模式DDL)来定义和描述。,总结: 1)数据库的整体逻辑结构和特征的描述(概念)结构是独立于其它的层次结构(内/外模式)来描述的。 2)内部模式依赖于概念模式,将概念模式中定义的数据结构及其联系进行组织,并给出具体的存储策略,独立于存储设备。 3)用户逻辑模式(外部模式)是在全局逻辑结构上编写的,独立于内部模式和存储设备。 4)应用程序是在外模式基础上编写的,依赖于外模式,独立于内部模式和存储设备,并且概
18、念模式的改变不会影响外模式,应用程序也独立于概念模式。 5)关系模式中视图与三级结构中的外模式相对应。,28,数据库模式间的映像与数据独立性 数据库系统的三层模式提供了两层映像: 外部模式 / 概念模式映像 和 概念模式/内部模式映像。 A、外部模式/概念模式映像 定义了外部模式与概念模式之间的对应关系。当需要改变概念模式时(如增加属性、改变属性类型、改变数据间的联系时),DBA重新改变此映像关系,而使外部模式保持不变,保证了数据与程序的逻辑独立性,这种用户数据独立性于全局逻辑数据的特性称为数据逻辑独立性。 B、概念模式/内部模式映像 定义了数据库全局逻辑结构与存储结构之间的对应关系。当改变内
19、部模式(例如增加存取效率,选用另一种存储结构)时,可由DBA改变此映像,从而使概念模式保持不变。这种全局数据逻辑独立性独立于物理数据的特性称为数据物理独立性。,29,3、数据库的抽象层次 数据库的三个层次定义了数据库的三个抽象层次:特刊数据库、概念数据库、逻辑数据库。 A、物理数据库 以内部模式为框架的数据库称为物理数据库。是物理存储设备上实际存储设备上存储的数据的集合,是以文件的形式来存放的,是系统程序员视图或称数据的存储结构。 B、概念数据库 以概念模式 为框架的数据库称为概念数据库。是数据库的整体逻辑表示,并不是一个实际上数据库,而是实际存放在物理数据的一种逻辑描述,它是DBA概念下的数
20、据库或称管理员视图。 C、逻辑数据库 以外部模式为框架的数据库称为逻辑数据库。是用户看到的数据库,称为用户数据或用户视图。用户通过外模式提供的查询语言或应用程序对数据进行所需的操作。,30,总之对数据库系统而言,实际上存在的只是物理数据库,它是数据访问的基础。概念数据库是物理数据库的抽象表示,用户数据库是概念数据库的部分抽取,是用户与数据库的接口。,数据库的数据模式与数据模型的关系,数据模式是定义在数据模型基础上的(概念模式或子模式是定义在层次、网状、关系)上。另一方面数据模式只是基于特定的数据模型的数据结构及相互关系的描述,是数据模型的一部分。,31,关系数据库,基本概念: 关系:一个关系就
21、是一个二维表,表的每列称为属性(字段),每一行称为元组(记录);,关系数据库的三级模式:,候选关键字:能唯一标识一个元组的字段或字段的组合称为候选关键字。当有多个时,从中选一个作为主关键字。,关系模式:表结构(记录结构),外模式:视图,概念模式:关系名、属性名、和属性的取值范围; 如:成绩单(学号,姓名,成绩,),内模式:索引(主索引或辅助索引),32,关系代数,关系运算的总和,分为:传统的集合运算 与 专门的关系运算。,设关系R和S是 n 元关系,且相应的属性值取自同一个值域, 并:记为: R S R S =x | x R x S 交:记为: R S R S =x | x R x S 差:记
22、为: R - S R - S =x | x R x S ,1)传统的集合运算:并、交、差、笛卡尔集。 2)专门的关系运算:选择、投影、自然连接和除法等运算。,33,MANAGER (管理人员)表,DEPTINFO (部门信息),笛卡尔集:MANAGER X DEPTINFO,笛卡尔集:R X S 设有关系R和S ,其目数分别为N 和 M。并且分别有P 和 Q个元组。其笛卡尔积运算是一个具有M+N目关系,共有P*Q个元组。,34,选择、连接和投影,1、选择,根据给定条件从表上选出若干行的操作,其运算对象是一个表;,记为:F( R ) F为逻辑条件表达式,按以下方式组成: 1) ,其中 、 是常量
23、或属性名,但不能同为常量, 是比较运算符()。 2)由若干逻辑条件经过逻辑运算符(与、或、非)连接而成。,35,专业信息表(profinof),1、选择 (select),36,举例:选择专业信息表中三年制专业的信息。 prof_age=3(Profinfo ),1、选择 (select),37,2、投影(project),为单目运算,根据给定条件从表中选出若干列的操作,其运算对象是一个表;,设一个关系R有N个属性A1,A2,AN ,则对R上A1i1,Ai2Ain,(Aij A1 A2,AN) 记为:Ai1,Ai2,Aim ( R ),38,举例:找出专业信息表中 rof_name , pro
24、f_age, prof_doma三列的信息。,2、投影(project),39,3、连接(join),为双目运算符,将两个表按照给定的条件连接而成的。,两个关系通过公共属性或通过属性值的相等(或不等)进行连接。连接一般分为:条件连接、自然连接、半连接三种。,40,3、连接(join),41,关系EMP,关系ELIT,条件连接,42,自然连接是连接的一种特例。其首要条件是两个关系必须有公共属性,且值域相同。连接方法是将公共属性相同的元组联成一个元组,并将元组中相同的属性列去掉。可以这样理解自然连接,是笛卡尔积中选择两个关系中公共属性相等的元组,并去掉重复的属性列。,MANAGER (管理人员)表
25、,DEPTINFO (部门信息),43,除法运算: 设关系R和S,R能被S除的条件有两个: 一是R中属性包含S中的属性; 二是R中的有些属性不再现在S中。,R除以S表示为:R/S 或R S 。设T=R/S,T也是一个关系,叫商。T的属性是由出现在R中,而不出现在S中的属性组成,其元组则是S中所有元组在R中对应值相等的那些元组值。,44,SQL语言,数据定义功能(DDL Data Define Language),是一处高度非过程化语言(只要告诉做什么,而不需要告诉怎么做)、 一体化语言(包括数据定义、数据查询、数据操纵、数据控制等功能)、语言简洁、可以交互式也可嵌入式使用。,数据库定义:cre
26、ate database / alter database / drop database 表定义 : create table /alter table / drop table 视图定义 : create view /alter view /drop view 存储过程 : create procedure /alter procedure /drop procedure 规则定义: create rule / drop rule 索引定义: create index /drop index,45,SQL语言,数据查询功能,SELECT select_list /指定要选择的列或行及其限定
27、 INTO new_table /结果生成新表 FROM table_source /指定表或视图 WHERE search_condition /查询条件 GROUP BY group_by_expression /分组表达式 HAVING search_condition /分组条件 ORDER BY order_expression ASC | DESC /排序,Select_list: ALL | DISTINCT TOP n PERCENT WITH TIES * /当前表或视图的所有列 | table_name | view_name | table_alias .* /表或视图的
28、所有列 | column_name | expression | IDENTITYCOL | ROWGUIDCOL AS column_alias | column_alias = expression ,.n ,46,SQL语言,数据操纵功能,插入记录: insert into 表名(列名,.) values(值1,值2,.),更新记录: update 表名 set 列名=表达式 , 列名=表达式, where 条件表达式,删除记录: delete from 表名 where 条件表达式,47,SQL语言,数据控制功能,授权语句: grant 权限列表 on to | public with
29、 grant option,权限包括: select insert delete update alter 或all,权限回收: removke 权限列表 on from ,48,运算符,1、Between and,2、like 模糊匹配 % 代表任意多个字符,_代表一个字符,3、Not 代表否定运算 ,等价于 、!=,4、any 、some 在子查询的行中只要有一行真,则结果就为真,all则要求所有的行满足要求;,5、exists 、not exists 用来检查子查询中是否有结果返回,若有则为真,否则为假。,常用的统计函数,1、count :统计记录数; 2、 sum:求和; 3、max
30、:求最大值; 4、min:求最小值; 5、avg:计算平均值;,49,举例: 在数据库系统中,用(1)描述全部数据的整体逻辑结构,而负责物理结构与逻辑结构的定义和修改的人员是(2),数据库管理系统提供的数据定义语言功能是(3)。在人事管理系统中,规定工程师的基本工资和奖金不能超过1500元,这样的数据完整性约束条件称之为(4)。在关系数据库的逻辑设计阶段,需将(5)转换为关系数据模型。,A 外模式 B 存储模式 C 内模式 D 概念模式 A DBA B 专业用户 C 应用程序员 D 最终用户 (3) A 实现数据的检索、插入、修改、删除 B 描述数据库的结构,为用户建立数据库提供手段; C 提供数据初始装入,数据转储、数据库恢复、重构; D 用于数据的安全性控制、完整性控制、并发控制和通信控制 (4) 用户定义完整性 B 参照完整性 C 实体完整性 D主键约束完整性 (5) A E-R模型 B 层次模型 C 关系模型 D 网状模型,答案: D A B A A,50,举例: 关系模型用(1)结构表示实体类型和实体间的联系是关系模型的主
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025至2030社交电商发展现状与未来商业模式创新研究报告
- 高中政治课程中的国际视野拓展教学策略研究教学研究课题报告
- 2025-2030医疗健康保险市场趋势解读与产品质量监管方案和用户参与体系发展
- 2025-2030医疗健康产业数字化转型与市场竞争力
- 2025-2030医疗健康产业互联网医院运营模式创新产业链合作规划
- 2025-2030医疗AI辅助诊断系统临床应用障碍突破
- 2025-2030匈牙利酒店业市场供需结构分析及行业投资潜力评估探讨
- 2025-2030匈牙利再生能源政策体系完善与第三方投资管理方案
- 2025-2030动物医疗服务行业市场供需分析及投资评估规划分析研究报告
- 2025-2030出租车行业网约车竞争影响及出租车司机权益分析
- DB21-T 4279-2025 黑果腺肋花楸农业气象服务技术规程
- 2026广东广州市海珠区住房和建设局招聘雇员7人考试参考试题及答案解析
- 2026新疆伊犁州新源县总工会面向社会招聘工会社会工作者3人考试备考题库及答案解析
- 广东省汕头市2025-2026学年高三上学期期末语文试题(含答案)(含解析)
- 110接处警课件培训
- DB15∕T 385-2025 行业用水定额
- 2025四川数据集团有限公司第四批员工招聘5人参考题库含答案解析(夺冠)
- 火箭军教学课件
- 新媒体运营专员笔试考试题集含答案
- 护理不良事件之血标本采集错误分析与防控
- 数字孪生技术服务协议2025
评论
0/150
提交评论