




已阅读5页,还剩38页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
数据库原理及应用,蔡舒经济与管理学院,第一章数据库系统概述,1.1数据库系统的发展过程主要包括五个阶段:人工管理阶段文件系统阶段倒排文件系统阶段数据库系统阶段数据库系统发展阶段,1.1.1数据管理技术的发展,数据处理:输入、存储、统计、汇总、查询、删除、更新、输出。在数据库产生之前,数据管理技术经历了三个阶段。1、人工管理阶段:科学计算、汇编语言、磁卡、卡片、穿孔机、批处理。特点:数据不保存无专用软件管理数据(数据与程序不独立)只有程序概念,无文件概念程序与数据紧密相连,1.1.1数据管理技术的发展,2、文件管理阶段:科学计算、信息管理、磁盘、磁鼓、高级语言、操作系统、批处理、联机实时处理。特点:数据以文件形式保存(查询、修改、插入)程序与数据相互独立文件组织多样化(索引文件、链接文件、直接存取文件),但相互独立,没有联系。数据面向应用(数据不属于特定的程序,可重复使用),但文件结构设计具有特定用途,,1.1.1数据管理技术的发展,程序设计具有特定结构和存取方法,所以程序与数据结构关系并没有发生根本改变数据操作以记录为单位(只存取数据,不存储文件结构),所以文件的建立、存取、查询,插入,删除,修改必须由程序来实现。缺点:数据冗余(即数据重复,同样的数据可能在多个文件中存储,因为文件之间无联系)不一致性(由冗余造成,不能同时更新)数据联系弱(文件相互独立,缺乏联系),1.1.1数据管理技术的发展,3、倒排文件系统阶段主要得于索引文件的推广,每个字段都提供单独的索引,适合于信息检索,但是索引空间比较大,更新比较困难,60年代中期,起到了非常大的作用。,1.1.2数据库技术的产生和发展,1.数据库技术的产生数据库管理技术进入数据库阶段的标志是20世纪60年代的三件大事。IMS系统IBM公司研制,层次数据库,1968年研制功,1969年投入使用。DBTG报告1959年,由用户和厂商自发组织美国数据系统语言协会(ConfrenceonDataSystemsLanguages)简称ODASYL)。该组织有两大贡献:1960COBOL语言,1969年DBTG报告,根据该报告,建立了DBTG系统网状数据库系统。,1.1.2数据库技术的产生和发展,E.P.Codd的文章E.P.Codd于1970年在美国计算机协会通信杂志社上发表的文章:大型共享数据库关系模型。即关系数据库的产生。到了20世纪80年代,关系数据库逐步取代层次数据库和网状数据库,而成为数据库的主流。目前比较具有代表性的关系数据库有:DB2、Sybase、Oracle、SQL-server、Informix,VFP等。,1.1.2数据库技术的产生和发展,2.数据库阶段数据管理的特点:采用数据模型表示数据结构采用数据模型来描述数据及数据之间的联系,数据之间的联系通过存取路径来实现。数据不再面向特定应用,而是面向整个系统。从而实现数据共享,大大地减少数据的冗余度。数据独立(逻辑数据独立时)即应用程序与数据库的数据结构之间相互独立。数据库的结构分为:用户局部逻辑结构、数据整体逻辑结构和物理结构。,1.1.2数据库技术的产生和发展,物理结构的改变不影响用户局部逻辑结构整体逻辑结构以及应用程序。逻辑结构的改变也不影响用户局部逻辑结构、物理结构以及应用程序。数据库系统为用户提供了多种接口(通过命令、SQL语言、程序等方式操作数据库)提供数据控制功能A.并发控制B.数据库的恢复C.数据的完整性(正确)D.数据安全性(防止丢失、破坏、窃取),1.1.2数据库技术的产生和发展,增加了系统的灵活性(记录、记录项都可以操作)在数据库阶段,程序与数据通过DBMS(数据库管理系统)来实现。在文件系统阶段,数据处理方式以程序设计为主。,输入数据,程序,输出数据,输入文件,输出文件,1.1.2数据库技术的产生和发展,在数据库阶段,数据处理方式以数据库设计为主。,数据库,查询处理程序,报表生成程序,应用程序,应用程序,输入,输出,输入,输出,联机终端,要求,报表,1.1.2数据库技术的产生和发展,3.数据库技术相关概念数据库DB(DataBase)指长期存储在计算机内、有组织的、统一管理的相关数据的集合。特点:共享、冗余小、联系紧密、独立。数据库管理系统DBMS(DataBaseManagementSystem)是位于用户与操作系统之间的一层数据管理软件,它为用户或应用程序提供访问数据库的方法(建立、查询、更新、控制)。它分为:层次型、关系型、网状型、面向对象型。数据库技术即研究数据库的结构、存储、设计、管理和使用一门学科。,1.1.2数据库技术的产生和发展,数据库系统DBS(DataBaseSystem)是由实现有组织地、动态地、存储大量关联数据、方便多用户访问的计算机硬件、软件和数据资源组成的系统,即采用数据库技术的计算机系统。4.数据库技术的发展20世纪70年代,层次、网状、关系型数据库系统奠定了数据库技术的概念、原理和方法。从20世纪80年代,数据库技术不断从低级向高级发展,产生了一些高级数据库技术。分布式数据库技术与集中式相对立。集中式缺点:一、数据量加大时,系统庞大,操作复杂,开销大。二、集中存储,集中处理,拥挤,堵塞,甚至死机。,1.1.2数据库技术的产生和发展,分布式数据库的特点:A.数据在物理上分布各地,但逻辑上是一个整体。B.各地既可以访问本地DB,也可以访问全局DB。C.各地计算机由网络互连,相互支持,相互处理数据。面向对象数据库技术主要解决由层次、网状、关系型数据库不能处理的数据问题。如:多媒体、多维表格、CAD数据等。由面向对象的程序设计技术与数据库技术相结合。特点:A.面向对象数据模型能完整地描述现实世界的数据结构,能表达数据间嵌套,递归的联系。B.具有面向对象的封装性,继承性。,1.1.2数据库技术的产生和发展,各种新型数据库技术主要包括主动数据库、并行数据库、工程数据库、地理数据库、行业数据库、专用数据库等。,1.2数据库系统结构,1.2.1数据处理的三个领域事物信息数据,现实世界信息世界数据世界。1.现实世界现实世界由组织机构、组织的组成对象以及组织所处的环境组成。任何组织都必须经过内部与外部环境的交往等各种活动实现其目的。这些活动由人、物、设施、时间组成。对组织的管理就是对这些活动的管理,即现实世界的管理,管理的对象称之为“实体”(Entity)。实体既可以是客观存在的事物:汽车、房子、人、产品等;也可以是:制度、通知、规定、户头、航线等。但任何一个实体都必须能够被标识,能够辨别。能够惟一标识实体的属性或属性集,称为实体标识符,也称主码或关键字。,1.2.1数据处理的三个领域,每个实体都具有一定的属性,具有一组公共属性的所有实体的集合称为实体集或实体类型。属性由名称和实例值两方面。按属性的作用可分为两类:标识属性:能够惟一标识实体集中的每一个实体。描述属性:实体本身具有,起着描述作用的属性。2.信息世界信息是现实世界中客观事物在人脑中的反应,通过一定的方法可以对信息进行收集、整理、分类、存储、控制、提取、维护、汇总等即信息管理。在信息世界中,实体记录表示实体,实体记录集表示实体集,属性表示实体集属性,属性名即属性的名称,1.2.1数据处理的三个领域,属性值就是一个实体具有的属性。一个实体记录集由其属性集定义,实体记录由相应实体属性值组成。相应地,有两种类型的属性:标识属性和描述属性。标识属性:关键字属性。主关键字:多个关键字,指定的关键字称为主关键字。侯选关键字:其他所有的关键字,但未指定。次关键字:不能惟一标识实体记录的属性。3.数据世界即计算机世界,既通过计算机来对数据进行管理。在数据世界中:用记录实例值表示实体记录(记录),记录由数据项(字段,属性)组成,数据项名即属性名。,1.2.1数据处理的三个领域,数据处理的三个世界,1.2.1数据处理的三个领域,在数据世界中通常将数据项值排列成一个二维表。表中的列称为数据项,列顶数据项名(属性名)表中的行称为记录(对应实体),所有记录表示一个实体记录集(对应一个实体集)或数据集或文件。,主关键字,次关键字,数据项名,记录实例,数据项值,数据项值集,文件,1.2.2数据结构,传统的数据库有三类:层次数据库、网状数据库、关系数据库。他们分别采用树、图、线性表三种数据结构。,1.2.3层次数据库IMS,在IMS中,实体集组成树型结构,实体之间用链表结构。如下图:代表一个实体集的数据结构称为片段型。如:系、教研室、教师、学生。一个实体的数据称为片段值。如:系(管理系、化工系、计算机系)。根片段的每一个片段值及其子孙片段值构成一颗树称为记录,以链表相互连接。如:经济管理系、电子商务教研室、李强、王文华可以构成一颗树即一条记录,而且通过链表连接起来。,系,教研室,教师,学生,1.2.4关系数据库RDMS,关系数据库采用线性表形式,我们可以将上面的系、教研室、教师、学生组成四个线性表。参见书P12-13中的表1.2表1.5。每一个表称为一个关系;表中的每一行称为一条记录,代表一个实体;表的每一列称为字段或数据项,代表实体的一个属性。学生表,1.2.5网状数据库DBTG,在DBTG中,不同实体集的数据分别存放在不同区域实体的数据称为记录,其数据结构称为记录型。针对不同需求建立不同链表描述实体集与实体集之间的联系,然后根据不同需求,使用不同的链表联系,面向应用的每一个实体集与实体集的联系称为“系”,其数据结构为系型,在一个系中,可以有许多链,一条链链接的所有元素的集合称为“系值”,链的起始记录称为系主记录,其他称为成员记录,系主记录是根,成员记录是叶子,二者构成一颗二级树。如下图:,1.2.5网状数据库DBTG,该图描述了两个系,“学生课程”系及“课程学生”系。在“学生课程”系中,系主记录是“学生”,成员记录是“课程”,“学生”是根,“课程”是叶子,“系值”为一个学生学习多门课程;在“课程学生”系中,系主记录是“课程”,成员记录是“学生”,“课程”是根,“学生”是叶子,“系值”为一门课程多个学生学习。,学生,课程,1.2.5网状数据库DBTG,从上图可以看出,网状数据库中每一个记录型都可能是根,也可能是叶子。针对不同应用,一个记录型可参与多个系,是一些系的根,同时是另一些系的叶子。,1.3数据模型,1.3.1数据模型的定义我们在设计数据库时,一般先用图或表抽象的反映数据彼此之间的关系,即建立数据模型。数据模型有两类:语义数据模型:实体联系模型(E-R模型)、面向对象模型。经典数据模型:层次模型、网状模型、关系模型。语义数据模型强调语义表达能力,建模容易,是数据库和用户之间的接口。(现实世界和信息世界的桥梁)经典数据模型用于数据世界,在机器上可以实现,也就是我们实际使用的数据库。一般来说,设计一个数据库时分为三个步骤:,1.3.1数据模型的定义,模型初步设计(建立语义数据模型)(第一模型)由语义数据模型转换为经典数据模型(第二模型)设计数据库结构(数据结构、数据操作、约束条件。数据结构:描述数据库数据的组成、属性及相互关系,按数据结构类型来命名数据类型(层次、网状、关系)。数据操作:对数据库中各种对象的实例允许执行的操作集合(操作及规则)(查询、录入、删除、更新)。约束条件:数据完整性规则的集合。它是给定数据模型中数据及其联系的制约和依存规则,用以限定符合的数据模型的数据库的状态及变化,以保证数据的完整性。,1.3.2数据之间的联系,1.一对一的联系1:1若对于实体集A中的每一个实体,实体集B中至多只有一个实体与之联系,反之亦然。如:学生学号2.一对多联系1:N若对于实体集A中的每一个实体,实体集B中有N个实体(N=0)与之联系,而对于实体集B中的每一个实体,实体集A中至多只有一个实体与之联系。如:班主任学生3.多对多联系M:N若对于实体集A中的每一个实体,实体集B中有N个实体(N0)与之联系,反之,有M个实体与B联系(M=0)。,1.3.2数据之间的联系,如:学生课程对于一对一,一对多采用层次模型层次数据库。采用网状模型网状数据库。对于多对多采用关系模型关系数据库。,1.3.3实体联系模型(E-R图),P.P.S.chen于1976年提出概念模型,用E-R图描述一个系统中数据及其数据之间的联系。在E-R图中:表示实体集,框内写实体名。:表示实体间的联系,框内写联系名。:表示菱形和实体间相连接,旁边标注联系类型(1:1,1:N,M:N)。:表示实体的属性。我们来看一个例子,一个系的教学管理系统,我们采用E-R图(Entity-RalationshipModel)来表示某个系的教学管理情况。,1.3.3实体联系模型(E-R图),系,教研室,教师,课程,学生,领导,从属,教学,成绩,管理,N,1,N,开课,系代码,系名,1,N,1,N,M,N,M,N,室代码,室名,姓名,性别,教师号,课程号,课程名,性质,分数,学号,姓名,性别,1,1.3.3实体联系模型(E-R图),我们在画E-R图时应该注意以下几点:某些联系具有属性:如:成绩具有属性“分数”。对于M:N:P联系的三个实体教师、学生、课程之间的联系,可以简化。E-R图可以表示一个实体内部一部分成员和另一部分成员之间的联系。如在一个班级中,班干部和一般学生都是学生,但班干部和学生之间又是一对多的联系,这种联系又称为自回路。,教师,课程,学生,教学,学生,领导,1,N,1.3.3实体联系模型(E-R图),E-R图可以表示2个实体之间的多种联系。如:职工和工作的关系时多对多的关系(参加),但有一些职工对一些工作是主要负责人,一个职工可以对多项工作负责,但一项工作只有一个负责人,所以职工和工作之间又是一对多的关系(负责)。如下图:,职工,工作,负责,参加,1,N,M,N,1.3.3实体联系模型(E-R图),画E-R图的一般步骤:找出系统中的所有实体集,用矩形框画出,并在矩形框中标明实体名。找出系统中所有实体间的联系,用菱形框画出,并在菱形框内标明联系类型。画出所有实体及其联系的属性。仔细检查,看有无遗漏,从而形成完整的E-R图。,1.3.关系数据模型(RelationModel),用二维表来表示实体和实体间联系的模型叫关系模型。常用的有:Oracle、Informix、DB2、Sybase、Sql-server、Access、VFP等。关系表由多行和多列组成,列表示实体的属性,列的标识表示属性名,又称为数据项或字段;表中的每一行称为元组,描述一个具体的实体,又称为记录,所有元组的集合构成表,称为关系,关系模型由多个关系表组成。表的表示方法:关系名(属性1,属性2,属性n)如:职工(职工号,姓名,性别,年龄,职称,工资),1.3.关系数据模型(RelationModel),在一个关系的属性中,有的属性或属性组能惟一标识一个元组或记录,称为主码或关键字,属性的取值范围称为域。关系模型的特点:元组(记录)的顺序不影响关系。任意元组不允许全同。属性具有原子性。(即属性不可再分)。属性排列顺序不影响关系。允许属性有空值(NullValue),表示属性未知,不等于零或空格,不允许主码有空值。,1.3.5网状数据模型(NetworkModel),:表示实体集,:表示联系,:表示1,:表示多,如下图:,系,教研室,教师,课程,学生,1.3.5网状数据模型(NetworkModel),1969年美国提出的DBTG网状数据模型,用记录类型表示实体,系类型表示实体之间的联系。根据应用需要建立系,系由实体集为节点构成二级树,树根实体集称为系主,叶节
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 煤矿泵房考试试题及答案
- 2025年口腔执业医师资格考试综合试题及答案
- 壁画制作工安全规范考核试卷及答案
- 内燃机装配工特殊工艺考核试卷及答案
- 2025年口腔执业助理医师资格考试模拟试题及答案
- 矿井维修钳工技能鉴定培训考试题含答案
- 河北省2025年职业病诊断医师资格考试物理因素所致职业病复习题及答案
- 推土机司机职业资格定期复审考核试卷及答案
- 生活垃圾焚烧操作工设备维护与保养考核试卷及答案
- 2025年医院感染控制与预防知识考核模拟试题及答案解析
- 骨科围手术期的护理流程
- 不明原因肺炎病例监测、排查和管理方案2025年修订版
- 呼吸衰竭护理疑难病例讨论
- 熠星创新创业大赛
- 高考英语阅读理解1200个高频
- 2025安全生产法律法规专题知识培训
- 《狼来了》寓言故事演讲课件
- 《瑞吉欧课程模式》课件
- 特种作业电工安全培训
- DB37-T 1933-2022 氯碱安全生产技术规范
- 校园传染病防控班主任培训
评论
0/150
提交评论