数据库(第一章)_第1页
数据库(第一章)_第2页
数据库(第一章)_第3页
数据库(第一章)_第4页
数据库(第一章)_第5页
已阅读5页,还剩46页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、数据库原理与技术,主讲教师:陈朵玲 ,第1章 数据库的基本概念,1.1 数据库管理的历史变迁 1.2 数据模型 1.3 数据库系统结构 1.4 数据库系统的组成 1.5 数据库新技术,1.1 数据库管理的历史变迁,磁盘容量的发展 数据管理技术的发展经历了人工管理、文件系统、数据库阶段和高级数据库阶段。,一、 人工管理阶段,在人工管理阶段(20世纪50年代中期以前),计算机主要用于科学计算,其他工作还没有展开。外部存储器只有磁带、卡片和纸带等,还没有磁盘等字节存取存储设备。软件只有汇编语言,尚无数据管理方面的软件。数据处理的方式基本上是批处理。 人工管理阶段的数据管理有下列特点: 数据不保存。

2、没有管理数据的软件系统,即数据和程序不具有独立性。 基本上没有文件概念。 数据是面向应用的,二、文件系统阶段,在这一阶段(20世纪50年代后期至60年代中期),计算机不仅用于科学计算,还用于信息管理。随着数据量的增加,数据的存储、检索和维护问题成为紧迫的需要,数据结构和数据管理技术迅速发展起来。此时,外部存储器已有磁盘、磁鼓等直接存取存储设备。软件领域出现了高级语言和操作系统。操作系统中的文件系统是专门管理外存的数据管理软件。数据处理的方式有批处理,也有联机实时处理。,文件系统阶段的数据管理有以下特点: 数据存在文件中,文件可长期保存在外存。 程序和数据有了一定的独立性。 文件多样化。 数据的

3、存取基本上以记录为单位。 随着数据管理规模的扩大,数据量急剧增加,文件系统显露出三个缺陷: 数据冗余(redundancy) 数据独立性差 数据联系弱(poor data relationship),三、 数据库阶段,数据管理技术进入数据库阶段的标志是20世纪60年代末的三件大事: 1968年美国IBM公司推出层次模型的IMS系统 。 1969年美国CODASYL组织发布了DBTG报告,总结了当时各式各样的数据库,提出网状模型。 1970年美国IBM公司的E.F.Codd 连续发表论文,提出关系模型,奠定了关系数据库的理论基础。,数据库阶段的数据管理具有以下特点: 整体数据的结构化。 数据独立

4、性高。 数据的共享性高,冗余度低,易扩充。 提供以下四方面的数据控制功能: 数据库的并发控制; 数据库的恢复; 数据的完整性; 数据安全性。,1.2 数据模型,数据模型是客观事物某些特征的数据抽象和模拟。在数据库中普遍采用数据模型这个工具来抽象表示和处理客观事物的数据特征和信息。,一、数据模型的分类,二、概念模型,基本概念,实体(Entity):实体是客观事物的反映,既可以是实 际存在的对象,也可以是某种概念。,属性(Attribute):实体有很多特性,每一个特性称为属性。每一个属性有一个值域,其类型可以是整数型、实数型、字符串型等。,实体集(entity set):性质相同的同类实体的集合

5、,称为实体集。,实体型(Entity Type):实体集的名及其所有属性名的集合,称为实体型。,实体标识符(identifier):能惟一标识实体的属性或属性集,称为实体标识符。也称为关键码(key),或简称为键。,域(Domain):一个属性的取值范围就是这个属性的域。,实体的联系(Relationship),一对一联系:实体集A中每个实体至多和实体集B中的一个实体有联系,反之亦然,那么A和B的联系称为“一对一联系”,记为“1:1”。 一对多联系:实体集A中每个实体可以与实体集B中任意个实体间有联系,而B中每个实体至多和A中一个实体有联系,那么称A对B的联系是“一对多联系”,记为“1:N”。

6、 多对多联系:实体集A中每个实体与实体集B中任意个实体有联系,反之亦然,那么称A和B的联系是“多对多联系”,记为“M:N”。,1,1,1,n,m,n,表示,例:,职 工,部 门,工 作,职 工,职 工,拥 有,工 资,参 加,项 目,1,n,1,1,m,n,三、结构数据模型(逻辑模型),数据模型是数据库系统的核心和基础,任何DBMS都支持一种数据模型。,任何一种数据模型都三部分内容构成,数据结构,数据操作及操作规则,完整性约束,主要的数据模型:,层次模型(Hierarchical Model) 网状模型(Network Model) 关系模型(Relational Model),用树型(层次)

7、结构表示实体类型及实体间联系的数据模型称为层次模型(hierarchical model)。 层次模型的特点是记录之间的联系通过指针来实现,查询效率较高。与文件系统的数据管理方式相比,层次模型是一个飞跃,用户和设计者面对的是逻辑数据而不是物理数据,用户不必花费大量的精力考虑数据的物理细节。逻辑数据与物理数据之间的转换由DBMS完成。 层次模型有两个缺点:一是只能表示1:N联系,虽然系统有多种辅助手段实现M:N联系但较复杂,用户不易掌握;二是由于层次顺序的严格和复杂,引起数据的查询和更新操作很复杂,因此应用程序的编写也比较复杂。,1、层次模型,用有向图结构表示实体类型及实体间联系的数据模型称为网

8、状模型(network model)。 网状模型的特点是记录之间联系通过指针实现,M:N联系也容易实现(一个M:N联系可拆成两个1:N联系),查询效率较高。 网状模型的缺点是数据结构复杂和编程复杂。,2、网状模型,3、关系模型,数据结构,在关系模型中,数据的逻辑结构是一张张二维表。,关系模型 employee(eno,ename,sex,age),关系,属性,域(Domain):属性取值的范围,元组,分量,分量,候选码:若关系中某一属性组的值能够唯一的标识一个元组,而它的任意真子集均不能唯一的标识该元组,则称该属性组为候选码 。包含在任意一个候选码中的属性称谓主属性;不包含在任何候选码中的属性

9、称为非主属性。 主码(Key):若一个关系有多个候选码,则选定其中的一个为主码。 在最简单的情况下,候选码只含有一个属性,称为单码。在最极端的情况下,关系的所有属性是这个关系的候选码,成为全码。,例:Student ( sno,sname,ssex,sage,saddr ) 侯选码:sno (sname,saddr) 主码:sno,外部码(Foreign Key):若A是基本关系R1的属性(组),但不是R的码。若A与基本关系R2的主码K相对应,则称A是R1的外部码。,被参照关系,参照关系,关系模式:一个关系的关系名及其全部属性名的集合简称为该关系的关系模式。一般表示为: 关系名(属性名1,属性

10、名2,属性名n) 关系模式是型,描述了一个关系的结构;关系则是值,是元组的集合,是某一时刻关系模式的状态或内容。 关系模型对二维表的基本限制是: 表中的每一列都必须是不可分的基本数据项。 在一个表中,属性间的顺序、元组间的顺序都是无关紧要的。,数据操作,关系数据操作是对系统动态特性的描述。 关系模型操作的主要内容是选择、投影、连接、除、并、交、差等查询操作和增、删、改等维护两大内容。,关系模型操作的特点: 操作对象和操作结果都是关系,即关系模型中的数据操作是集合操作。 关系模型中,存取路径对用户是隐蔽的。用户只要指出干什么,而不必考虑怎么干。存取路径是由RDBMS自动选择的,从而方便了用户,提

11、高了数据的独立性。,关系数据语言,关系代数语言,关系演算语言,元组关系演算,域关系演算,具有关系代数和关系演算双重特点的语言SQL,完整性约束,实体完整性: 参照完整性: 用户定义的完整性:,若属性A是基本关系R的一个主属性,则任何元组在A上的分量都不能为空。 这里,空是指没有值。,参照完整性是对关系间引用数据的一种限制。 定义:若属性组A是基本关系R1的外码,它与基本关系R2主码K相对应(R1,R2也可以是同一关系),则R1中每个元组在A上的值必须为: 或者等于R2中某元组的主码值; 或者取空值(A的每个属性值都是空值)。,用户自己定义的约束条件,所以称为用户定义的完整性。,1.3 数据库系

12、统的结构,可以从多种角度来分析数据库系统的结构。 数据库系统内部结构(数据库的三级模式结构 ) 数据库系统外部的体系结构,一、数据的三级模式结构,数据模式(Data Schema): 数据模式是对全体数据的逻辑结构,联系和约束的描述。某数据模式下的一组具体的数据值称为数据模式的一个实例(Instance)。因此,数据模式是稳定的,而实例是在不断变化,不断更新的。,三级模式结构,模式(Schema): 模式也称概念模式,是数据库中全体数据在逻辑上的视图。他通常以某种数据模型为基础,定义数据库全部数据的逻辑结构。以及定义与数据有关的安全性、完整性等要求。 模式不是数据库本身,它仅仅描述数据库结构。

13、模式不涉及硬件环境和物理存储细节,也不与任何计算机语言有关。 数据库管理系统提供模式描述语言(模式DDL)来定义模式。用模式DDL给出一个数据库逻辑定义的全都语句,构成了该数据库的模式。,外模式(External Schema) 外模式也称子模式,是个别用户的数据视图,即个别用户涉及到的数据的逻辑结构。外模式是模式的子集。不同用户的外模式是不同的(可相互覆盖)。 一个应用程序只能启用一个外模式,一个外模式可被同一用户的若干应用程序使用。 数据库管理系统提供外模式描述语言(外模式DDL)描述外模式。用外模式DDL给出的用以定义一个用户数据视图的全部语句称为此用户的外模式。,内模式(Interna

14、l Schema) 内模式也称存储模式。他既定义了数据库中全部数据的物理结构,还定义了数据的存储方法、存取策略等。 DBMS提供内模式描述语言(内模式DDL)来描述和定义内模式。,二级映象 在外模式与模式之间通过外模式/模式映象进行转换。当模式改变时,只要相应改变外模式/模式映象,可使外模式保持不变。在模式与内模式之间通过模式/内模式映象进行转换。当数据库的存储结构改变时,只要相应改变模式/内模式映象,可使模式保持不变,从而,外模式也可保持不变。有了这二级转换,使数据库系统的数据具有较高的逻辑独立性和物理独立性。 对于一个数据库系统来说,只有一个模式,一个内模式,但可以有多个外模式。实际的数据

15、库与内模式对应,应用程序则与外模式打交道。 对于一个数据库系统来说,模式/内模式映象是唯一的,但有多个外模式/模式映象,每一个外模式都有一个外模式/模式映象(包含在该外模式定义中)。,二、面对用户的数据库系统体系结构,三级模式结构是数据库系统最本质的系统结构,它是从数据结构的角度来看待问题的。用户是以数据库系统的服务方式来看待数据库系统的,这就是数据库系统的软件体系结构。用这种观点,当今的数据库系统大致可以分为: 单用户数据库系统 主从式结构的数据库系统 分布式结构的数据库系统 客户/服务器系统,三、用户访问数据库的过程,用户在应用程序中发出命令,指明外模式名。 DBMS根据该命令,调出所需外

16、模式,并检查用户的权利。若通过检查,则继续执行;否则拒绝之。 DBMS根据外模式/模式转换,确认所需数据在模式上的有关信息。 DBMS根据模式/内模式转换,确认所需数据在内模式上的有关信息。 DBMS向操作系统发出读相应数据的请求。 操作系统把有关数数据从外存调入到系统缓冲区上。 DBMS把数据按外模式的形式送入用户工作区。 记载系统工作日志。,1.4 数据库系统的组成,一、数据库系统(DBS:DataBase System) 计算机硬件 操作系统 DBMS DB 应用程序 用户,DBA,一般用户,二、数据库管理员(DataBase Administrator) 主要职责有: 协调和沟通用户与

17、数据库开发人员的联系。 参与数据库设计工作。 决定数据的完整性约束条件和不同用户的存取权限。 保证数据库的正常运行,进行数据库的维护工作。 提出数据库的重构计划。,三、数据库管理系统(DBMS),DBMS的主要功能是: 数据库的定义、建立和维护功能。DDL 数据存取功能。DML自主和宿主两种形式 数据库运行管理功能。包括:访问控制(检查访问的合法性)、并发控制(协调多用户对数据库的共同操作,并保证数据的一致性)、保密控制、数据完整性控制、通讯控制以及数据库内部的维护等。DCL,1.5 数据库新技术,一、数据库技术的发展,第一代数据库:层次数据库和网状数据库 第二代数据库:关系数据库技术 第三代

18、数据库:以面向对象模型为主要特征的数据库技术,二、数据库新技术的主要研究领域,数据库管理系统软件的研制 数据库应用系统设计与开发 数据库理论,三、 面向对象新技术,IBM公司的DB2 Oracle公司的Oracle8产品,四、分布式数据库,分布式数据库系统主要有下面三个特点 数据库的数据物理上分布在各个场地,但逻辑上是一个整体。 每个场地既可以执行局部应用(访问本地DB),也可以执行全局应用(访问异地DB)。 各地的计算机由数据通信网络相联系。本地计算机单独不能胜任的处理任务,可以通过通信网络取得其它DB和计算机的支持。,分布式数据库系统,五、数据仓库与数据挖掘,数据事务处理与分析处理 事务处理是指对数据库联机的日常操作,通常对一个或一组记录的查询和修改,主要是为企业的特定数据管理应

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论