大学数据库技术及应用-陈刚-大学教学资料课件PPT
收藏
资源目录
压缩包内文档预览:(预览前20页/共30页)
编号:21835853
类型:共享资源
大小:15.47MB
格式:ZIP
上传时间:2019-09-06
上传人:QQ24****1780
认证信息
个人认证
王**(实名认证)
浙江
IP属地:浙江
25
积分
- 关 键 词:
-
大学
数据库技术
应用
利用
运用
陈刚
教学
资料
课件
ppt
- 资源描述:
-
大学数据库技术及应用-陈刚-大学教学资料课件PPT,大学,数据库技术,应用,利用,运用,陈刚,教学,资料,课件,ppt
- 内容简介:
-
1,普通高等教育“十一五”国家级规划教材 数据库技术及应用,陈刚 主编 中国水利水电出版社,2,第1章 数据库系统概述,本章重点内容 数据库技术的基本概念、数据库系统的组成 数据模型的概念及分类 数据库管理系统的概念,3,1.1 问题的提出,1.1 数据库理论及其应用技术 数据库理论及其应用技术是计算机学科的一个重要分支,它是在人们运用计算机进行数据处理过程中,产生的一门有关数据采集、整理、存储、分类、排序、检索、维护、加工、统计和传输等一系列操作过程的知识和技术。 数据库技术是计算机科学中最活跃、应用最广泛的分支之一,也是近年得到广泛应用和快速发展的领域。,4,1.1 问题的提出,1.1.2 数据库应用实例分析 教学案例:发票管理系统 发票样本:,5,1.1 问题的提出,发票管理系统的软件设计人员和用户的沟通过程,6,1.2 基本概念,1.2.1 信息与数据 1信息 信息是现实世界中各种事物的存在方式、运动形态以及它们之间的相互联系等诸要素在人脑中的反映,通过人脑的抽象后形成概念。 2数据 数据一般是指信息的一种符号化表示方法,就是说用一定的符号表示信息,而采用什么符号,完全是人为规定。所以数据的概念包括两个方面含义:一是数据的内容是信息,二是数据的表现形式是符号。,7,3信息与数据的关系 数据是承载信息的物理符号或称之为载体,而信息是数据的内涵。 二者的区别是:数据可以表示信息,但不是任何数据都能表示信息,同一数据也可以有不同的解释。信息是抽象的,同一信息可以有不同的数据表示方式。 1.2.2 数据处理 数据处理是指将数据转换成信息的过程。 数据 处理 信息,8,数据处理实例,人们有时说的“信息处理”,其真正含义应该是为了产生信息而处理数据。例如,学生的“出生日期”是有生以来不可改变的基本特征之一,属于原始数据,而“年龄”是当年与出生日期相减而得到的数字,具有相对性,可视为二次数据。同样道理,“参加工作时间”、产品的“购置日期”是职工和产品的原始数据,工龄、产品的报废日期则是经过简单计算得到的结果。 数据处理任务的矛盾焦点不是计算,而是把数据管理好。 数据管理是指:数据的收集、整理、组织、存储、查询、维护和传送等各种操作,是数据处理的基本环节,是任何数据处理任务必有的共性部分,9,1.3 数据库技术的发展,1.3.1 数据库技术发展的阶段划分 1. 人工管理阶段 (1)人工管理阶段的背景 20世纪50年代中期以前 (2)人工管理阶段的特点: 1)数据不保存 2)应用程序管理数据 3)数据不能共享 4)数据不具有独立性,10,(3)人工管理阶段的程序与数据的关系,11,2. 文件系统阶段 (1)文件系统阶段的背景 20世纪50年代后期至60年代中期 在数据文件中常涉及下列术语: 数据项:描述事物性质的最小单位。 记录:若干数据项的集合,一个记录表达一个具体事物。 文件:若干记录的集合。 (2)文件系统阶段的特点: 1)数据可以长期保存 2)文件系统管理数据 3)数据具有较低的共享性差,冗余度大 4)数据独立性差,12,(3)文件系统阶段程序与数据的关系,13,3. 数据库系统阶段 (1)数据库系统阶段的背景 从20世纪60年代后期 (2)数据库系统阶段的特点: 1)数据结构化 是数据库系统与文件系统的本质区别。例:学生人事记录。数据面向整个系统。,14,2)数据共享性高,冗余度低,易扩充 3)数据独立性高 物理数据独立性:指用户的应用程序与存储在磁盘上的数据库数据是相互独立的。数据在磁盘上的数据库存储是由DBMS管理的。 逻辑数据独立性:指用户的应用程序与数据库的逻辑结构是相互独立的。 4)数据由DBMS统一管理和控制,15,3数据库系统阶段程序与数据的关系,16,(4)具有数据控制功能 数据完整性控制:是指存储数据的正确性、有效性,用以将数据控制在有效的范围内。 数据安全性控制:是保护数据不被非法使用,从而造成数据的泄密和破坏。 并发控制:对多用户的并发操作加以控制和协调。 数据库恢复:将数据库从错误状态恢复到某一已知的正确转换。 (5)数据库的概念 数据库是以一定组织方式长期存储在计算机内的、独立于应用并可被多用户、多应用程序共享的数据集合。 1.3.2 现代数据库发展阶段 20世纪80年代以来,数据库技术得到了极大的发展。,17,1.4 数据库系统的组成与结构,1.4.1 数据库系统的组成 数据库系统是指引进数据库技术后的计算机系统。数据库系统一般由支持数据库运行的软硬件、数据库、数据库管理系统、数据库管理员和用户等部分组成的。,18,1硬件与软件 (1)硬件、(2)软件、(3)应用程序 2数据库 数据库是长期存贮在计算机内有组织的大量的共享数据集合。它可以是各种用户互不影响,具有最小冗余度和较高的数据独立性。 3数据库管理员 大型数据库通常由专业人员设计,还要有专职的数据库管理员(DBA:DataBase Administrator)进行管理。 4用户 数据库系统的用户分为以下两类: 最终用户:分为:偶然用户、简单用户和复杂用户。 专业用户:这类用户主要是应用系统开发人员。,19,1.4.2 数据库系统结构 从数据库管理系统的角度,数据库系统通常采用三级模式结构,这是数据库管理系统内部的系统结构。从数据库最终用户的角度看,数据库结构分为集中式、分布式、客户/服务器和并行结构等。 美国国家标准委员会(ANSI)所属的标准计划和要求委员会(SPARC:Standards Planning And Requirements Committee)在1975年公布了关于数据库标准报告,提出了数据库的三级组织结构,称为SPARC分级结构。,20,21,1内模式 内模式也称为存储模式,它是数据库在物理存储器上具体实现的描述,是数据在数据库内部的表示方法,也是数据物理结构和存储方式的描述。一个数据库只有一个内模式。 2模式 模式也称为逻辑模式或概念模式,是对数据库中全体数据的逻辑结构和特征的描述,是数据库系统模式结构的中间层。一个数据库只有一个模式。 模式是数据项值的框架。数据库系统模式通常还包含有访问控制、保密定义、完整性检查等方面的内容。,22,3外模式 外模式也称为子模式或用户模式,它是数据和用户能够看见和使用的局部数据的逻辑结构和特征的描述,是数据和用户的数据视图,是与某一应用有关的数据的逻辑表示。 外模式一般是模式的子集。一个模式可以有多个外模式。一个应用程序只能使用一个外模式。 外模式是保证数据库安全性的一个有力措施。,23,4模式之间的映射 (1)“外模式/模式”之间的映射 这种映射将用户数据库与概念数据库联系起来;实现了数据与程序的逻辑独立性,简称数据的逻辑独立性。 (2)“模式/内模式”之间的映射 这种映射把概念数据库与物理数据库联系起来。模式与内模式的映射使全局逻辑数据独立于物理数据,保证了数据与程序的物理独立性,简称数据的物理独立性。,24,25,1.5 数据模型,1.5.1 数据模型的概念 1数据模型的分类 一种类型是概念模型,也称为信息模型,它是按照用户的观点进行数据信息建模,主要用于数据库的设计。另一种模型是数据模型,这种模型是按计算机系统的观点对数据建模,主要用于DBMS的设计。,26,27,2数据模型的组成 (1)数据结构 数据结构是所研究对象类型的集合,这些对象组成数据库。按照数据结构类型的不同,将数据模型划分为层次模型、网状模型和关系模型。 (2)数据操纵 数据操纵是指对数据库中各种对象实例的操作。 (3)数据的完整性约束 数据的完整性约束是指在给定的数据模型中,数据及其数据关联所遵守的一组规则。用以保证数据库中数据的正确性、一致性。,28,1.5.2 概念模型 概念模型也称为“信息模型”。 信息模型就是人们为正确直观地反映客观事物及其联系,对所研究的信息世界 建立的一个抽象的模型。是现实世界到信息世界的第一层抽象,是数据库设计人员和用户之间进行交流的语言。,29,1概念模型的名词术语 (1)实体(Entity):客观存在并可相互区别的事物称为实体。实体既可以是实际的事物,也可以是抽象的概念或联系。 (2)属性(Attribute):属性就是实体所具有的特性,一个实体可以由若干个属性描述。 (3)域(Domain):属性的取值范围称为该属性的域。 (4)实体集(Entity Set):具有相同属性的实体的集合称为实体集。 (5)键(Key):键是能够惟一地标识出一个实体集中每一个实体的属性或属性组合,键也被称为关键字或码。 (6)联系(Relationship):联系分为两种:一种是实体内部各属性之间的联系,另一种是实体之间的联系。,30,2实体之间的联系 (1)一对一联系:如果对于实体集A中的每个实体,实体集B中至多有一个(可以没有)与之相对应,反之亦然,则称实体集A与实体集B具有一对一联系,记作:1:1。 (2)一对多联系:如果对于实体集A中的每个实体,实体集B中有n个实体(n0)与之相对应,反过来,实体集B中的每个实体,实体集A中至多只有一个实体与之联系, 则称实体集A与实体集B具有一对多联系。记作:1:n。 (3)多对多联系:如果对于实体集A中的每个实体,实体集B中有n个实体(n0)与之相对应,反过来,实体集B中的每个实体,实体集A中也有m个实体(m0)与之联系,则称实体集A与实体集B具有多对多联系,记作:m:n。,31,3ER模型 信息模型有很多种,其中最为流行的一种是由美籍华人陈平山于1976年提出的实体联系模型 (Entity-Relationship Model,简称ER模型),这种图称为实体联系图,简称ER图。 ER图有三个要素: 实体:用矩形表示实体,矩形内标注实体名称。 属性:用椭圆表示属性,椭圆内标注属性名称。并用连线与实体连接起来。 实体之间的联系:用菱形表示,菱形内注明联系名称,并用连线将菱形框分别与相关实体相连,并在连线上注明联系类型。,32,(a) 1:1 联系 (b) 1:n 联系 (c)m:n 联系,33,34,1.5.3 层次模型 层次模型按树型结构组织数据,它是以记录类型为结点,以结点间联系为边的有序树,数据结构为有序树或森林。,35,层次模型有以下两个特点: 有且仅有一个结点无父结点,该结点称为根; 其它结点有且仅有一个父结点。 上面特点就使得用层次模型表示1:n联系非常简便,但是它不能直接表示m:n的联系。,1.5.3 层次模型,36,1.5.4 网状模型 网状模型用网状结构表示实体及其之间的联系,网中结点之间的联系不受层次限制,可以任意发生联系。,37,1.5.4 网状模型,网状模型有如下几个特点: 一个子结点可以有两个或多个父结点。 在两个结点之间可以有两种或多种联系。 可能有回路存在。 网状模型的优点: 能够更为直接地描述现实世界。 具有良好的性能,存取效率高。 主要缺点:结构复杂,不利于扩充;不容易实现。,38,1.5.5 关系模型,关系数据模型是由IBM公司的E.F.Codd于1970年首次提出,以关系数据模型为基础的数据库管理系统,称为关系数据库系统(RDBMS),目前广泛使用。 1关系数据模型的定义 实体和联系均用二维表来表示的数据模型称之为关系数据模型。,39,40,2关系数据模型的基本概念 (1)关系(Relation): 对应于关系模式的一个具体的表称为关系,又称表(Table)。 (2)关系模式(Relation Scheme): 二维表的表头那一行称为关系模式,又称表的框架或记录类型,是对关系的描述。 关系模式可表示为:关系模式名(属性名1,属性名1,.,属性名n)的形式。例如:学生(学号,姓名,性别,出生日期,籍贯) (3)记录(Record): 关系中的每一行称为关系的一个记录,又称行(Row)或元组。,41,(4)属性(Attributes): 关系中的每一列称为关系的一个属性,又称列(Column)。给每一个属性起一个名称即属性名。 (5)变域(Domain): 关系中的每一属性所对应的取值范围叫属性的变域,简称域。 (6)主键(Primary Key): 如果关系模式中的某个或某几个属性组成的属性组能惟一地标识对应于该关系模式的关系中的任何一个记录,这样的属性组为该关系模式及其对应关系的主键。 (7)外键(Foreign Key): 如果关系R的某一属性组不是该关系本身的主键,而是另一关系的主键,则称该属性组是R的外键。,42,3关系数据模型完整性约束 4关系数据模型优缺点 关系数据模型具有如下优点: 由于实体和联系都用关系描述,保证了数据操作语言的一致性; 结构简单直观、用户易理解 有严格的设计理论 存取路径对用户透明,从而具有更高的独立性、更好的安全保密性,也简化了程序员的工作和数据库开发建立的工作量。 主要缺点是:由于存取路径对用户透明,造成查询速度慢,效率低于非关系型数据模型。,43,本章小结,数据库技术代表着当代的先进的数据管理技术,具有非常广泛的应用。随着计算机的软、硬件技术、网络技术和多媒体技术的发展,数据库技术也在不断前进,应用的领域不断扩大。 本章首先从实际的客户需要出发,介绍了用户的需求来源、开发设计人员与用户沟通的过程;又介绍了数据库的发展历程。分析了数据库系统的组成与结构,又进一步提出了数据模型的概念,并介绍了几种常见数据模型。 本章涉及的名词术语较多,它们是进一步学习数据库课程的基础,对于初学者应在理解的基础之上掌握。,普通高等教育“十一五”国家级规划教材数据库技术及应用 陈刚 主编中国水利水电出版社第1章 数据库系统概述本章重点内容数据库技术的基本概念、数据库系统的组成数据模型的概念及分类数据库管理系统的概念1.1 问题的提出1.1 数据库理论及其应用技术数据库理论及其应用技术是计算机学科的一个重要分支,它是在人们运用计算机进行数据处理过程中,产生的一门有关数据采集、整理、存储、分类、排序、检索、维护、加工、统计和传输等一系列操作过程的知识和技术。 数据库技术是计算机科学中最活跃、应用最广泛的分支之一,也是近年得到广泛应用和快速发展的领域。 1.1 问题的提出1.1.2 数据库应用实例分析教学案例:发票管理系统发票样本:1.1 问题的提出发票管理系统的软件设计人员和用户的沟通过程 1.2 基本概念1.2.1 信息与数据1信息信息是现实世界中各种事物的存在方式、运动形态以及它们之间的相互联系等诸要素在人脑中的反映,通过人脑的抽象后形成概念。2数据数据一般是指信息的一种符号化表示方法,就是说用一定的符号表示信息,而采用什么符号,完全是人为规定。所以数据的概念包括两个方面含义:一是数据的内容是信息,二是数据的表现形式是符号。 3信息与数据的关系数据是承载信息的物理符号或称之为载体,而信息是数据的内涵。二者的区别是:数据可以表示信息,但不是任何数据都能表示信息,同一数据也可以有不同的解释。信息是抽象的,同一信息可以有不同的数据表示方式。1.2.2 数据处理数据处理是指将数据转换成信息的过程。数据 处理 信息数据处理实例人们有时说的“信息处理”,其真正含义应该是为了产生信息而处理数据。例如,学生的“出生日期”是有生以来不可改变的基本特征之一,属于原始数据,而“年龄”是当年与出生日期相减而得到的数字,具有相对性,可视为二次数据。同样道理,“参加工作时间”、产品的“购置日期”是职工和产品的原始数据,工龄、产品的报废日期则是经过简单计算得到的结果。 数据处理任务的矛盾焦点不是计算,而是把数据管理好。数据管理是指:数据的收集、整理、组织、存储、查询、维护和传送等各种操作,是数据处理的基本环节,是任何数据处理任务必有的共性部分 1.3 数据库技术的发展1.3.1 数据库技术发展的阶段划分1. 人工管理阶段(1)人工管理阶段的背景20世纪50年代中期以前(2)人工管理阶段的特点:1)数据不保存2)应用程序管理数据3)数据不能共享4)数据不具有独立性(3)人工管理阶段的程序与数据的关系2. 文件系统阶段(1)文件系统阶段的背景20世纪50年代后期至60年代中期在数据文件中常涉及下列术语:数据项:描述事物性质的最小单位。记录:若干数据项的集合,一个记录表达一个具体事物。文件:若干记录的集合。(2)文件系统阶段的特点:1)数据可以长期保存2)文件系统管理数据3)数据具有较低的共享性差,冗余度大4)数据独立性差 (3)文件系统阶段程序与数据的关系 3. 数据库系统阶段(1)数据库系统阶段的背景从20世纪60年代后期(2)数据库系统阶段的特点:1)数据结构化是数据库系统与文件系统的本质区别。例:学生人事记录。数据面向整个系统。2)数据共享性高,冗余度低,易扩充3)数据独立性高物理数据独立性:指用户的应用程序与存储在磁盘上的数据库数据是相互独立的。数据在磁盘上的数据库存储是由DBMS管理的。逻辑数据独立性:指用户的应用程序与数据库的逻辑结构是相互独立的。4)数据由DBMS统一管理和控制 3数据库系统阶段程序与数据的关系 (4)具有数据控制功能数据完整性控制:是指存储数据的正确性、有效性,用以将数据控制在有效的范围内。数据安全性控制:是保护数据不被非法使用,从而造成数据的泄密和破坏。并发控制:对多用户的并发操作加以控制和协调。数据库恢复:将数据库从错误状态恢复到某一已知的正确转换。(5)数据库的概念数据库是以一定组织方式长期存储在计算机内的、独立于应用并可被多用户、多应用程序共享的数据集合。1.3.2 现代数据库发展阶段20世纪80年代以来,数据库技术得到了极大的发展。 1.4 数据库系统的组成与结构1.4.1 数据库系统的组成数据库系统是指引进数据库技术后的计算机系统。数据库系统一般由支持数据库运行的软硬件、数据库、数据库管理系统、数据库管理员和用户等部分组成的。 1硬件与软件(1)硬件、(2)软件、(3)应用程序2数据库数据库是长期存贮在计算机内有组织的大量的共享数据集合。它可以是各种用户互不影响,具有最小冗余度和较高的数据独立性。3数据库管理员大型数据库通常由专业人员设计,还要有专职的数据库管理员(DBA:DataBase Administrator)进行管理。4用户数据库系统的用户分为以下两类:最终用户:分为:偶然用户、简单用户和复杂用户。专业用户:这类用户主要是应用系统开发人员。 1.4.2 数据库系统结构从数据库管理系统的角度,数据库系统通常采用三级模式结构,这是数据库管理系统内部的系统结构。从数据库最终用户的角度看,数据库结构分为集中式、分布式、客户/服务器和并行结构等。美国国家标准委员会(ANSI)所属的标准计划和要求委员会(SPARC:Standards Planning And Requirements Committee)在1975年公布了关于数据库标准报告,提出了数据库的三级组织结构,称为SPARC分级结构。 1内模式内模式也称为存储模式,它是数据库在物理存储器上具体实现的描述,是数据在数据库内部的表示方法,也是数据物理结构和存储方式的描述。一个数据库只有一个内模式。2模式模式也称为逻辑模式或概念模式,是对数据库中全体数据的逻辑结构和特征的描述,是数据库系统模式结构的中间层。一个数据库只有一个模式。模式是数据项值的框架。数据库系统模式通常还包含有访问控制、保密定义、完整性检查等方面的内容。 3外模式外模式也称为子模式或用户模式,它是数据和用户能够看见和使用的局部数据的逻辑结构和特征的描述,是数据和用户的数据视图,是与某一应用有关的数据的逻辑表示。外模式一般是模式的子集。一个模式可以有多个外模式。一个应用程序只能使用一个外模式。外模式是保证数据库安全性的一个有力措施。 4模式之间的映射(1)“外模式/模式”之间的映射这种映射将用户数据库与概念数据库联系起来;实现了数据与程序的逻辑独立性,简称数据的逻辑独立性。(2)“模式/内模式”之间的映射这种映射把概念数据库与物理数据库联系起来。模式与内模式的映射使全局逻辑数据独立于物理数据,保证了数据与程序的物理独立性,简称数据的物理独立性。 1.5 数据模型1.5.1 数据模型的概念1数据模型的分类一种类型是概念模型,也称为信息模型,它是按照用户的观点进行数据信息建模,主要用于数据库的设计。另一种模型是数据模型,这种模型是按计算机系统的观点对数据建模,主要用于DBMS的设计。 2数据模型的组成(1)数据结构数据结构是所研究对象类型的集合,这些对象组成数据库。按照数据结构类型的不同,将数据模型划分为层次模型、网状模型和关系模型。(2)数据操纵数据操纵是指对数据库中各种对象实例的操作。(3)数据的完整性约束数据的完整性约束是指在给定的数据模型中,数据及其数据关联所遵守的一组规则。用以保证数据库中数据的正确性、一致性。 1.5.2 概念模型概念模型也称为“信息模型”。 信息模型就是人们为正确直观地反映客观事物及其联系,对所研究的信息世界 建立的一个抽象的模型。是现实世界到信息世界的第一层抽象,是数据库设计人员和用户之间进行交流的语言。 1概念模型的名词术语(1)实体(Entity):客观存在并可相互区别的事物称为实体。实体既可以是实际的事物,也可以是抽象的概念或联系。(2)属性(Attribute):属性就是实体所具有的特性,一个实体可以由若干个属性描述。(3)域(Domain):属性的取值范围称为该属性的域。(4)实体集(Entity Set):具有相同属性的实体的集合称为实体集。(5)键(Key):键是能够惟一地标识出一个实体集中每一个实体的属性或属性组合,键也被称为关键字或码。(6)联系(Relationship):联系分为两种:一种是实体内部各属性之间的联系,另一种是实体之间的联系。 2实体之间的联系(1)一对一联系:如果对于实体集A中的每个实体,实体集B中至多有一个(可以没有)与之相对应,反之亦然,则称实体集A与实体集B具有一对一联系,记作:1:1。(2)一对多联系:如果对于实体集A中的每个实体,实体集B中有n个实体(n0)与之相对应,反过来,实体集B中的每个实体,实体集A中至多只有一个实体与之联系, 则称实体集A与实体集B具有一对多联系。记作:1:n。(3)多对多联系:如果对于实体集A中的每个实体,实体集B中有n个实体(n0)与之相对应,反过来,实体集B中的每个实体,实体集A中也有m个实体(m0)与之联系,则称实体集A与实体集B具有多对多联系,记作:m:n。 3ER模型信息模型有很多种,其中最为流行的一种是由美籍华人陈平山于1976年提出的实体联系模型 (Entity-Relationship Model,简称ER模型),这种图称为实体联系图,简称ER图。ER图有三个要素:实体:用矩形表示实体,矩形内标注实体名称。属性:用椭圆表示属性,椭圆内标注属性名称。并用连线与实体连接起来。实体之间的联系:用菱形表示,菱形内注明联系名称,并用连线将菱形框分别与相关实体相连,并在连线上注明联系类型。 (a) 1:1 联系 (b) 1:n 联系 (c)m:n 联系 1.5.3 层次模型层次模型按树型结构组织数据,它是以记录类型为结点,以结点间联系为边的有序树,数据结构为有序树或森林。 层次模型有以下两个特点:有且仅有一个结点无父结点,该结点称为根;其它结点有且仅有一个父结点。上面特点就使得用层次模型表示1:n联系非常简便,但是它不能直接表示m:n的联系。 1.5.3 层次模型1.5.4 网状模型网状模型用网状结构表示实体及其之间的联系,网中结点之间的联系不受层次限制,可以任意发生联系。 1.5.4 网状模型网状模型有如下几个特点:一个子结点可以有两个或多个父结点。在两个结点之间可以有两种或多种联系。可能有回路存在。网状模型的优点:能够更为直接地描述现实世界。具有良好的性能,存取效率高。主要缺点:结构复杂,不利于扩充;不容易实现。 1.5.5 关系模型关系数据模型是由IBM公司的E.F.Codd于1970年首次提出,以关系数据模型为基础的数据库管理系统,称为关系数据库系统(RDBMS),目前广泛使用。1关系数据模型的定义实体和联系均用二维表来表示的数据模型称之为关系数据模型。 2关系数据模型的基本概念(1)关系(Relation):对应于关系模式的一个具体的表称为关系,又称表(Table)。(2)关系模式(Relation Scheme):二维表的表头那一行称为关系模式,又称表的框架或记录类型,是对关系的描述。 关系模式可表示为:关系模式名(属性名1,属性名1,.,属性名n)的形式。例如:学生(学号,姓名,性别,出生日期,籍贯)(3)记录(Record):关系中的每一行称为关系的一个记录,又称行(Row)或元组。(4)属性(Attributes):关系中的每一列称为关系的一个属性,又称列(Column)。给每一个属性起一个名称即属性名。(5)变域(Domain):关系中的每一属性所对应的取值范围叫属性的变域,简称域。 (6)主键(Primary Key):如果关系模式中的某个或某几个属性组成的属性组能惟一地标识对应于该关系模式的关系中的任何一个记录,这样的属性组为该关系模式及其对应关系的主键。(7)外键(Foreign Key):如果关系R的某一属性组不是该关系本身的主键,而是另一关系的主键,则称该属性组是R的外键。 3关系数据模型完整性约束4关系数据模型优缺点关系数据模型具有如下优点:由于实体和联系都用关系描述,保证了数据操作语言的一致性;结构简单直观、用户易理解 有严格的设计理论 存取路径对用户透明,从而具有更高的独立性、更好的安全保密性,也简化了程序员的工作和数据库开发建立的工作量。主要缺点是:由于存取路径对用户透明,造成查询速度慢,效率低于非关系型数据模型。 本章小结数据库技术代表着当代的先进的数据管理技术,具有非常广泛的应用。随着计算机的软、硬件技术、网络技术和多媒体技术的发展,数据库技术也在不断前进,应用的领域不断扩大。本章首先从实际的客户需要出发,介绍了用户的需求来源、开发设计人员与用户沟通的过程;又介绍了数据库的发展历程。分析了数据库系统的组成与结构,又进一步提出了数据模型的概念,并介绍了几种常见数据模型。本章涉及的名词术语较多,它们是进一步学习数据库课程的基础,对于初学者应在理解的基础之上掌握。数据库原理及应用“十一五”国家级规划教材,1,第2章 关系数据库理论基础,本章重点内容 关系的数学定义和性质 关系模式的完整性约束条件 关系代数 关系的规范化原则,范式的基本概念和分解方法,数据库原理及应用“十一五”国家级规划教材,2,2.1 关系的基本概念,2.1.1 关系的数学定义 1域(Domain) 域:是一组具有相同数据类型的值集合。例如:自然数,男,女,0,1等都可以是域。 基数:域中数据的个数称为域的基数。 域被命名后用如下方法表示: D1 = 白亚春,陈韬,王雪莲,表示姓名的集合,基数是3; D2 = 计算机系,电子系,数据库原理及应用“十一五”国家级规划教材,3,2笛卡尔积(Cartesian Product) 给定一组域D1,D2,Di,Dn(可以有相同的域),则笛卡尔积定义为: D1D2DiDn = (d1,d2,di,dn)diDi,i = 1,2,n D1D2 = (陈韬,计算机系),(陈韬,电子系),(王雪莲,计算机系),(王雪莲,电子系),(白亚春,计算机系),(白亚春,电子系) 其中每个(d1,d2,di,dn)叫做元组,元组中的每一个值di叫做分量,di必须是Di中的一个值。 显然,笛卡尔积的基数就是构成该积所有域的基数累乘积,若Di(i = 1,2,n)为有限集合,其基数为mi(i = 1,2,n),则D1D2DiDn笛卡尔积的基数M为:,数据库原理及应用“十一五”国家级规划教材,4,该笛卡尔积的基数是M = m1m2 = 3*2 = 6,即该笛卡尔积共有6个元组,它可组成一张二维表,数据库原理及应用“十一五”国家级规划教材,5,3关系(Relation) 关系:笛卡尔积D1D2DiDn的子集R称作在域D1,D2,Dn上的关系,记作: R(D1,D2,Di,Dn) 其中:R为关系名,n为关系的度或目(Degree),Di是域组中的第i个域名. 当n = 1 时,称该关系为单元关系; 当n = 2 时,称该关系为二元关系; 以此类推,关系中有n个域,称该关系为n元关系。 把列称为属性(Attribute)。一般来说,一个取自笛卡尔积的子集才有意义。,数据库原理及应用“十一五”国家级规划教材,6,关系可以分为三种类型: 基本关系(又称基本表):是实际存在的表,它是实际存储数据的逻辑表示; 查询表:是对基本表进行查询后得到的结果表; 视图表:是由基本表或其它视图导出的表,是一个虚表,不对应实际存储的数据。,数据库原理及应用“十一五”国家级规划教材,7,2.1.2 关系的性质 1列是同质的。 2关系中行的顺序、列的顺序可以任意互换,不会改变关系的意义。,数据库原理及应用“十一五”国家级规划教材,8,3关系中的任意两个元组不能相同。 4、关系中的元组分量具有原子性,即每一个分量都必须是不可分的数据项。,数据库原理及应用“十一五”国家级规划教材,9,2.2 关系的完整性,2.2.1 键 1候选键(Candidate key) 若关系中的某一属性组的值能惟一地标识一个元组,则称该属性组为候选键。 2主键(Primary key) 若一个关系中有多个候选键,则选定一个为主键。,数据库原理及应用“十一五”国家级规划教材,10,3主属性(Primary Attribute) 主键的属性称为主属性。 4外键(Foreign key) 设F是基本关系R的一个或一组属性,但不是R的键(主键或候选键),如果F与基本关系S的主键K相对应,则称F是R的外键,并称R为参照关系,S为被参照关系。,2.2 关系的完整性,数据库原理及应用“十一五”国家级规划教材,11,数据库原理及应用“十一五”国家级规划教材,12,2.2.2 实体完整性 实体完整性规则:关系中的主键不能为空值(Null)。空值就是“不知道”或“无意义” 2.2.3 参照完整性 参照完整性规则:表的外键必须是另一个表主键的有效值,或者是空值。,2.2 关系的完整性,数据库原理及应用“十一五”国家级规划教材,13,实体完整性和参照完整性实例,数据库原理及应用“十一五”国家级规划教材,14,2.2.4 用户定义完整性 用户按照实际的数据库运行环境要求,对关系中的数据所定义的约束条件,它反映的是某一具体应用所涉及的数据必须要满足的条件。,2.2 关系的完整性,数据库原理及应用“十一五”国家级规划教材,15,2.3 关系代数,2.3.1 传统的集合运算 当集合运算并、交、差用于关系时,要求参与运算的两个关系必须时相容的,即两个关系的度数一致,并且关系属性的性质必须一致。,数据库原理及应用“十一五”国家级规划教材,16,1并 并:是将两个关系中的所有元组构成新的关系,并运算的结果中必须消除重复值。关系R与S的并运算记作:RS。,数据库原理及应用“十一五”国家级规划教材,17,2交 交:将两个关系中的公共元组构成新的关系。关系R与S的交运算记作:RS。,数据库原理及应用“十一五”国家级规划教材,18,3差 差:运算结果是由属于一个关系并且不属于另一个关系的元组构成的新关系,就是从一个关系中减去另一个关系。关系R与S的差运算记作:RS。,数据库原理及应用“十一五”国家级规划教材,19,2.3.2 专门的关系运算 专门的关系运算包括:选择、投影和连接,用于数据查询服务。 1选择(Selection) 选择:是按照给定条件从指定的关系中挑选出满足条件的元组构成新的关系。或者说,选择运算的结果是一个表的行的子集。记作,数据库原理及应用“十一五”国家级规划教材,20,2投影(Projection) 投影:是从指定的关系中挑选出某些属性构成新的关系。或者说,选择运算的结果是一个表的列的子集。 记作, 其中A为R的属性列。投影的结果将取消由于取消了某些列而产生的重复元组。,数据库原理及应用“十一五”国家级规划教材,21,3连接(Join) 连接:是将两个和多个关系连接在一起,形成一个新的关系。连接运算是按照给定条件,把满足条件的各关系的所有元组,按照一切可能组合成新的关系。或者说,连接运算的结果是在两关系的笛卡尔积上的选择。记作: 自然连接:当连接的两关系有相同的属性名时,称这种连接为自然连接,它是连接的一个特例。记作:,数据库原理及应用“十一五”国家级规划教材,22,学生基本情况表 学生选课表,数据库原理及应用“十一五”国家级规划教材,23,2.4 关系规范化 2.4.1 问题的提出 在设计关系数据库时,经常采用一种自下而上的设计方法。这种方法是对涉及的所有数据进行收集,然后按照栏目进行归纳分类。 插入异常:如果某个教师的所开课程某学期没有,或者学生没有选修他开的该课程,那么就无法将该教师及其所开课程的信息存入数据库。 删除异常:如果某届学生全部毕业,在删除该系学生时会将课程及相关教师删除。 数据冗余:比如,一门课程及其教师要与选修该课程的每一个学生出现的次数一样多 解决这些问题的办法就是重新设计数据库。,数据库原理及应用“十一五”国家级规划教材,24,数据库原理及应用“十一五”国家级规划教材,25,2.4.2 关系模式的规范化 1范式(Normal form) 范式:建立关系时需要满足的约束条件划分成若干标准,这些标准称为范式,简写为NF。范式的级别越高,发生操作异常的可能性越小,数据冗余越小,但由于关联多,读取数据时花费时间也会相应增加。 2第一范式(1NF) 对于给定的关系R,如果R中的所有行、列交点处的值都是不可再分的数据项,则称关系R属于第一范式,记作:R1NF。 1NF是关系数据库中对关系的最低要求,它是从关系的基本性质而来的,任何关系必须遵守。,数据库原理及应用“十一五”国家级规划教材,26,3第二范式(2NF) 如果关系R1NF,并且R的每一个非主属性都决定于主键,则称R属于第二范式,记作:R2NF。 思考:主键没有冗余,非主键存在冗余。 3第三范式(3NF) 第三范式:如果关系R2NF,并且R的每一个非主属性都不间接决定于主键,则称R属于第三范式,记作:R3NF。 达到第三范式的关系仍有可能存在冗余等问题,所以关系数据库理论还有BCNF、4NF、5NF等范式。在实际应用中,一般达到了3NF的关系就可以认为是较为优化的关系。,数据库原理及应用“十一五”国家级规划教材,27,2.4.3 关系分解的原则 关系的规范化就是将关系按照一定的原则不断地分解为多个关系的过程,通过分解使关系逐步达到较高范式。任何一个非规范化的关系经过分解都可以达到3NF。 在实际应用中,数据库设计人员应根据具体情况灵活掌握,千万不要盲目追求规范化的程度。 关系分解的基本原则是: 1关系分解后必须可以无损连接的。 2分解后的关系要相互独立。,数据库原理及应用“十一五”国家级规划教材,28,本章小结,1.关系可以简单的理解为二维表。表中的列称为属性,DBMS中称为列或字段,取自同一个域;行称为元组,DBMS中称为行或记录,代表一个实体的值。关系的若干性质应该从二维表加以理解。 2.“关系完整性”:实体完整性、参照完整性、用户定义的完整性 关系运算:选择、投影和连接,是关系数据库的理论基础。 3.关系的规范化据库设计必须要考虑的问题。在关系数据库设计过程中,怎样建立各个关系,使系统既稳定又灵活,数据库既便于维护又利于使用是个重要问题,设计满足范式的关系模式是经常采用的方法之一。掌握:第一范式(1NF)、第二范式(2NF)、第三范式(3NF)。,第2章 关系数据库理论基础本章重点内容 关系的数学定义和性质关系模式的完整性约束条件关系代数关系的规范化原则,范式的基本概念和分解方法2.1 关系的基本概念2.1.1 关系的数学定义1域(Domain)域:是一组具有相同数据类型的值集合。例如:自然数,男,女,0,1等都可以是域。基数:域中数据的个数称为域的基数。域被命名后用如下方法表示:D1 = 白亚春,陈韬,王雪莲,表示姓名的集合,基数是3;D2 = 计算机系,电子系2笛卡尔积(Cartesian Product)给定一组域D1,D2,Di,Dn(可以有相同的域),则笛卡尔积定义为:D1D2DiDn = (d1,d2,di,dn)diDi,i = 1,2,nD1D2 = (陈韬,计算机系),(陈韬,电子系),(王雪莲,计算机系),(王雪莲,电子系),(白亚春,计算机系),(白亚春,电子系)其中每个(d1,d2,di,dn)叫做元组,元组中的每一个值di叫做分量,di必须是Di中的一个值。显然,笛卡尔积的基数就是构成该积所有域的基数累乘积,若Di(i = 1,2,n)为有限集合,其基数为mi(i = 1,2,n),则D1D2DiDn笛卡尔积的基数M为:该笛卡尔积的基数是M = m1m2 = 3*2 = 6,即该笛卡尔积共有6个元组,它可组成一张二维表3关系(Relation)关系:笛卡尔积D1D2DiDn的子集R称作在域D1,D2,Dn上的关系,记作:R(D1,D2,Di,Dn)其中:R为关系名,n为关系的度或目(Degree),Di是域组中的第i个域名.当n = 1 时,称该关系为单元关系;当n = 2 时,称该关系为二元关系;以此类推,关系中有n个域,称该关系为n元关系。把列称为属性(Attribute)。一般来说,一个取自笛卡尔积的子集才有意义。 关系可以分为三种类型:基本关系(又称基本表):是实际存在的表,它是实际存储数据的逻辑表示;查询表:是对基本表进行查询后得到的结果表;视图表:是由基本表或其它视图导出的表,是一个虚表,不对应实际存储的数据。 2.1.2 关系的性质1列是同质的。 2关系中行的顺序、列的顺序可以任意互换,不会改变关系的意义。 3关系中的任意两个元组不能相同。 4、关系中的元组分量具有原子性,即每一个分量都必须是不可分的数据项。 2.2 关系的完整性2.2.1 键1候选键(Candidate key)若关系中的某一属性组的值能惟一地标识一个元组,则称该属性组为候选键。2主键(Primary key)若一个关系中有多个候选键,则选定一个为主键。3主属性(Primary Attribute)主键的属性称为主属性。4外键(Foreign key)设F是基本关系R的一个或一组属性,但不是R的键(主键或候选键),如果F与基本关系S的主键K相对应,则称F是R的外键,并称R为参照关系,S为被参照关系。 2.2 关系的完整性2.2.2 实体完整性实体完整性规则:关系中的主键不能为空值(Null)。空值就是“不知道”或“无意义”2.2.3 参照完整性参照完整性规则:表的外键必须是另一个表主键的有效值,或者是空值。 2.2 关系的完整性实体完整性和参照完整性实例2.2.4 用户定义完整性用户按照实际的数据库运行环境要求
- 温馨提示:
1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2: 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
3.本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

人人文库网所有资源均是用户自行上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作他用。