数据库基本概念.ppt_第1页
数据库基本概念.ppt_第2页
数据库基本概念.ppt_第3页
数据库基本概念.ppt_第4页
数据库基本概念.ppt_第5页
已阅读5页,还剩60页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第一章 数据库基本概念,数据库的应用,超市购物 手机话费 飞机、火车订票,数据库的地位,数据库技术产生于六十年代末,是数据管理的最新技术,是计算机科学的重要分支 数据库技术是信息系统的核心和基础,它的出现极大地促进了计算机应用向各行各业的渗透 数据库的建设规模、数据库信息量的大小和使用频度已成为衡量一个国家信息化程度的重要标志,1.1 数据库系统概述,1.1.1 数据、数据库、数据库管理系统、数据库系统 一、数据(Data) 数据是描述事物的符号记录,是信息的载体。,例如,学校为了管理学生信息,可能会将学生的学号、姓名、性别、年龄、出生年月、籍贯、所在系、入学时间等数据组织起来,下面就是一个学

2、生有关这些方面的数据集:,(20012502033,李明,男,19,1982,江苏,计算机系,2001),二、数据库(DataBase,简称DB),数据库是指长期存储在计算机内的、有组织的、有结构的、可共享的数据集合。,三、数据库管理系统(DataBase Management System,简称DBMS),对数据进行定义、组织、使用、管理和维护的一个专用系统软件。DBMS主要提供如下几方面功能: 1.数据定义功能(Data Definition Language DDL) 2.数据操纵功能(Data Manipulation Language DML) 3.数据控制功能(Data Contr

3、ol Language DCL),当前主流的数据库管理系统,大型数据库管理系统: oracle,db2,Sybase,sql server 中小型数据库: access,foxpro,dbase,mysql,四、数据库系统(DataBase System,简称DBS),数据库系统指采用数据库技术进行数据处理的计算机系统,由计算机硬件、操作系统、DB、DBMS(及其开发工具)、应用系统、数据库管理员(DBADataBase Administrator)和用户组成。,数据库系统(DBS)结构示意图,数据库技术:对数据进行分类、组织、编码、存储、检索和维护的技术。 数据管理技术的发展是和计算机技术及

4、其应用的发展联系在一起的,经历了由低级到高级的过程。,1.1.2 数据库管理技术的产生和发展,一、人工管理阶段(20世纪50年代中期前),计算机的用途:主要是科学计算 典型外存储设备:磁带、卡片等顺序设备 管理软件:无操作系统和管理软件 工作方式:批处理 结论:无法由计算机管理数据,人工管理具有如下一些特点:,(1)数据不保存,用完即撤走。 (2)数据管理工作由程序员通过应用程序完成,程序员负担极重。 (3)没有文件概念,数据面向应用程序,不共享。 (4)数据与程序间不具有独立性。,二、文件系统阶段(20世纪50年代后期到60年代中期),计算机用途:开始大量用于事务管理 典型外存储设备:磁盘、

5、磁鼓等直接存取存储设备 管理软件:操作系统包含的文件系统 工作方式:联机实时处理 结论:数据可以交给管理软件管理,这一阶段具有如下特点:,(1)数据以文件形式长期保留于外存,以便反复处理。 (2)由文件系统管理数据。 (3)数据与程序间有了一定独立性,但独立性不够高。 (4)数据基本上还是面向应用程序,共享性差,冗余度大。,三、数据库系统阶段(20世纪60年代后期开始),计算机用途:数据处理规模越来越大,应用广泛 典型外存储设备:大容量磁盘 管理软件:专用数据管理软件 工作方式:联机实时处理和分布式处理 结论:文件系统无法承担,出现数据库系统,数据库系统的特点:,一、数据结构化 在数据库系统中

6、,数据被集中统一管理,数据之间的各种复杂联系均有良好体现,因此具有十分复杂的数据结构,且这种数据是面向全组织的,而不是面向单个应用的。,二、数据的共享性高,冗余度低,易扩充,在数据库中,同样的数据,可以被多个用户使用。数据共享提高了数据利用率,同时也节约了空间,减少了数据存取时间。由于数据库从整体观点来看待和描述数据,数据面向整个系统,因此任何数据都可以不重复存储,从理论上讲,可以完全消除数据冗余。同时由于数据的高度共享,可以避免数据间的不相容和不一致。 数据库系统的扩充性能也非常好,在统一的数据集合上,可以根据应用需要增加新的应用,并且不会对已有应用造成不良影响。,三、数据独立性高,由于数据

7、库系统将数据管理与程序设计彻底分离开来,使得DBS中数据与程序间具有非常高的独立性。这种独立性还因为DBS采用三级模式的体系结构而分为两个级别:,物理独立性,用户的应用程序与存储介质上物理数据库中的数据是独立的。在数据库系统中,数据的存储结构与逻辑结构之间由DBMS提供一种映象,当数据的存储结构发生变化时,可以调整映象使数据的逻辑结构保持不变,由于应用程序是建立在数据的逻辑结构上的,因而应用程序不受数据物理存储变化的影响。,逻辑独立性,用户的应用程序与数据库的全局逻辑结构是互相独立的。数据库系统中数据的逻辑结构由一个全局逻辑结构和若干局部逻辑结构组成,它们之间仍然由DBMS提供映象,应用程序是

8、建立在局部逻辑结构之上的,如果数据的全局逻辑结构发生变化,可以通过调整映象使局部逻辑结构不改变,从而不必修改应用程序。,四、数据由DBMS统一管理和控制,DBMS提供了统一的数据控制功能。包括: (1)数据的安全性(Security)保护 此项控制保证数据被合法使用,防止非法使用和破坏数据,控制方法如:设置用户密码、规定用户权限等。 (2)数据的完整性(Integrity)检查 此项控制维护数据的正确性、有效性和相容性。 (3)并发(Concurrency)控制 此项控制在多用户对数据库中的数据同时进行存取操作时,防止数据发生错误和混乱。 (4)数据库恢复(Recovery) 此项控制保证在发

9、生意外造成数据破坏时,DBS能进行应急处理,把数据库恢复到某一时刻的正确状态。,1.2 数据模型,数据库中的数据不是孤立的,而是互相联系的,因为这些数据来源于现实世界中相互关联的信息。数据模型即是对数据(信息)进行抽象、表示和处理的一个工具。对信息进行抽象的模型分为两个层次:一个是概念数据模型(也称信息模型),另一个是面向机器的结构数据模型(如层次模型、网状模型、关系模型)。概念数据模型是按照用户观点对数据和信息建模,结构数据模型则是按照机器观点对数据建模.,数据模型 是数据库系统中用于提供信息表示和操作手段的形式构架,概念模型是现实世界到 信息世界的第一层抽象,1.2.2 概念模型,一、信息

10、世界中的基本概念 (1)实体(Entity) 实体是指被认识的可区分的客观存在。 (2)属性(Attribute) 实体所拥有的某一特性称为实体的属性。 (3)码(Key) 唯一标识实体的属性或属性组合。 (4)域(Domain) 属性取值的范围称为域。,(5)实体型(Entity Type) 具有相同属性的实体所具有的共同特征和性质称为实体型。 (6)实体集(Entity Set) 同型实体的集合称为实体集。 (7)联系(Relationship) 实体内部及实体集之间的相互关系称为联系。实体内部的联系发生在组成实体的各个属性之间,包括函数依赖和多值依赖等数据依赖。实体集之间的联系则分为三类

11、:, 一对一联系 对于实体集A中的每一个实体,实体集B中有且只有一个实体与之联系,则称为一对一联系。记为1:1。 一对多联系 对于实体集A中的每一个实体,实体集B中有若干实体与之对应,反之对于实体集B中的每一个实体,实体集A中只有一个实体与之对应,则称A与B有一对多的联系,记为1:n。 多对多联系 对于实体集A中的每一个实体,实体集B中有若干实体与之对应,反之对于实体集B中的每一个实体,实体集A中也有若干实体与之对应,则称A与B有多对多的联系,记为m:n。,二、概念模型的表示方法,表示概念模型一般采用实体联系方法(EntityRelationship Approach),简称ER方法。此方法将

12、现实世界的事物及联系抽象成信息结构模型,不考虑数据的存储及效率问题。这种方法的表现形式是用ER图。,ER图中包括三种基本成分: 实体型:用方框表示,并在框内写上实体名。 属性:用椭圆框表示,并在框内写上属性名,一个实体和它的属性框间用无向边连接。 实体间联系:用菱形框表示,框内写上联系名,并用无向边将菱形框与有关实体相连接,在连线边上标出联系名称。有时候联系也有属性,这种联系仍然用椭圆框表示,并且也将属性与联系框连接起来。,基本-图要点,1.2.3 结构数据模型,从数据库技术应用于数据处理以来,被普遍采用的结构数据模型有四种: 层次模型(Hierarchical Model) 网状模型(Net

13、work Model) 关系模型(Relational Model) 面向对象模型(Object Oriented Model),1.2.4 层次模型,一、层次模型的数据结构 层次模型是以各记录型为结点的树,它满足下面两个条件: (1)有且只有一个结点无双亲结点,称为父结点; (2)其他结点有且只有一个双亲结点。,二、多对多联系在层次模型中的表示,非关系模型(包括层次模型)只能表示一对一和一对多联系,多对多联系须通过分解转换为多个一对多联系。,三、层次模型的数据操纵与完整性约束,层次模型的数据操纵包含数据查询、插入、删除和修改等。这些操纵都从模型的根结点出发通过各个父子关系找到相应的记录型和记

14、录值,然后完成处理。 对于更新操作(插入、删除和修改),DBMS提供自动的完整性约束。包括插入操作时,缺少双亲结点的记录值禁止插入;删除操作时,如果被删结点是一个双亲结点,则它的子女结点将自动被删除;修改操作时,所有副本数据(由于冗余结点造成)也自动同步修改。,四、层次模型的优缺点,层次模型层次清楚,各结点间的联系简单,只要知道除根结点之外的每个结点的双亲结点,就能描绘出整个模型的结构;采用层次模型的应用系统效率高,性能比关系模型好,同时具有较好的完整性支持。 但是层次模型不能表示两个以上实体间的复杂联系和非层次联系,通过引入冗余数据来解决时会造成维护困难;数据访问始终从根结点出发;对数据的更

15、新操作存在较多限制。,1.2.5 网状模型,一、网状模型的数据结构 网状模型是以记录型为结点的网状结构(连通图)。它满足如下两个条件: (1)可以有一个以上的结点无双亲结点; (2)一个结点可以有一个以上的双亲结点。,二、网状模型的操纵与完整性约束,网状模型和层次模型的数据访问均采用“导航式”,即详细指明数据访问的存取路径,不过层次模型中的存取路径始终从根结点开始,网状模型中没有根结点,存取路径可以从任一结点出发,只要最终能够到达要访问的数据对象。因此,网状模型中对一个数据进行访问的存取路径可能非常多,对数据进行操纵时,需要选择出效率高的一条路径。 网状模型没有一般性的完整性约束条件。但在具体

16、的网状数据库系统中,会有一些约束和限制。,三、网状模型的存储结构 网状模型的结构远远复杂于层次模型,其存储结构一般采用链接法。 四、网状模型的优缺点 网状模型中可以表达实体间的各种复杂联系,其建模能力强于层次模型,能够更好地描述现实世界;同时由于网状模型中可以灵活地确定数据存储路径,数据存取效率比较高。 但网状模型结构复杂,联系数目可能非常大,增大了用户负担;其次网状模型的数据语言复杂,用户不易使用,在设计应用程序时,用户必须确定存储路径。这使得程序设计的难度加大。,1.2.6 关系模型,一、关系模型的数据结构 关系模型是建立在数学概念基础之上的。此模型是关系的集合,所有关系均采用二维表格来表

17、示,即是把所有数据及其它们之间的联系均设计成二维表。,关系模型中的常用术语, 关系(Relation):由行和列构成的二维表。 元组(Tuple):关系中的一行称为一个元组。 属性(Attribute):关系中的一列称为一个属性,每个属性有一个名称即属性名。 主码(Key):能唯一标识关系中一个元组的属性或属性组合。 域(Domain):属性的取值范围。 分量:元组中的一个属性值。 关系模式:对关系所作的描述,关系模式的形式为: 关系名(属性名1,属性名2,属性名n) 例如登记学生信息的关系可用这样一个关系模式表达: 学生(学号,姓名,年龄,性别,系,年级),二、关系模型的操纵与完整性约束,关

18、系模型的数据操纵主要包括查询、插入、删除和修改,这些操作在一张表内部或多个表之间进行,而且均为集合操作。关系模型中的数据访问不是采用“导航式”,而是采用“说明式”,即用户只需说明要做什么,而不指出怎么做,因此用户不用关心数据访问的存取路径,这个工作由DBMS去完成。 在关系模型中作数据操纵时,必须满足若干完整性约束条件。这些条件分为三大类,它们是:实体完整性、参照完整性和用户定义的完整性。,三、关系模型的存储结构,关系模型中的实体以及实体之间的联系都用表格表示,而表格则以文件的形式存储。,四、关系模型的优缺点,关系模型具有严密的数学基础,可以保证数据库系统在理论上的正确性;关系模型概念单一,基

19、本的数据组织方式是表格,结构简单、清晰、易于理解;关系模型中的操作对象和结果都是关系,且存取路径对用户透明,减少了用户的负担,提高了数据独立性。 关系模型存在一个严重问题,就是数据的查询效率非常低,关系这种数据结构使得数据间的联系是隐蔽的,关系模型中在通过联系访问数据时会出现大量无价值的中间数据。在采用关系模型的数据库系统中,通常使用查询优化技术来改善查询效率,但这会增加DBMS的开发难度。,1.2.6 对象模型,对象模型: 使用面向对象技术(Object-Oriented,简称OO)来表示信息世界的实体类型及实体之间联系的模型称为对象模型。,1.3.1 数据库系统外部的体系结构 单用户结构

20、主从式结构 分布式结构 客户/服务器结构 浏览器/应用服务器/数据库服务器结构 并行结构,1.3 数据库系统结构,1.3.1.1 单用户数据库系统,整个数据库系统(应用程序、DBMS、数据)装在一台计算机上,为一个用户独占,不同机器之间不能共享数据。 早期的最简单的数据库系统,1.3.1.2 主从式结构的数据库系统,一个主机带多个终端的多用户结构 数据库系统,包括应用程序、DBMS、数据,都集中存放在主机上,所有处理任务都由主机来完成。 各个用户通过主机的终端并发地存取数据库,共享数据资源。,主从式结构的数据库系统,主机,终端,主从式结构的数据库系统,优点 易于管理、控制与维护。 缺点 当终端

21、用户数目增加到一定程度后,主机的任务会过分繁重,成为瓶颈,从而使系统性能下降。 系统的可靠性依赖主机,当主机出现故障时,整个系统都不能使用。,1.3.1.3 分布式结构的数据库系统,数据库中的数据在逻辑上是一个整体,但物理地分布在计算机网络的不同结点上。 网络中的每个结点都可以独立处理本地数据库中的数据,执行局部应用。 可以同时存取和处理多个异地数据库中的数据,执行全局应用。,分布式结构的数据库系统特点,优点 适应了地理上分散的公司、团体和组织对于数据库应用的需求。 缺点 数据的分布式存放给数据的处理、管理与维护带来困难。 当用户需要经常访问远程数据时,系统效率会明显地受到网络传输的制约。,1

22、.3.1.4 客户服务器结构的数据库系统,把DBMS功能和应用分开 网络中某个(些)结点上的计算机专门用于执行DBMS功能,称为数据库服务器,简称服务器。 其他结点上的计算机安装DBMS的外围应用开发工具,用户的应用系统,称为客户机。,客户服务器结构的数据库系统,集中的服务器结构 一台数据库服务器,多台客户机。 分布的服务器结构 在网络中有多台数据库服务器 分布的服务器结构是客户服务器与分布式数据库的结合。,客户服务器结构的数据库系统,优点: 客户端的用户请求被传送到数据库服务器,数据库服务器进行处理后,只将结果返回给用户,从而显著减少了数据传输量。 数据库更加开放: 客户与服务器一般都能在多

23、种不同的硬件和软件平台上运行。 可以使用不同厂商的数据库应用开发工具。,客户服务器结构的缺点: 系统安装复杂,工作量大。 应用维护困难,难于保密,造成安全性差。 相同的应用程序要重复安装在每一台客户机上,从系统总体来看,大大浪费了系统资源。 系统规模达到数百数千台客户机,它们的硬件配置、操作系统又常常不同,要为每一个客户机安装应用程序和相应的工具模块,其安装维护代价便不可接受了。,1.3.1.5 并行数据库系统,利用并行计算机系统提供的并行处理能力,通过并行地使用多个CPU和硬盘来提高处理速度和I/O速度,从而加速数据库的活动。,1.3 数据库系统模式,1.3.2.1 数据库系统模式的概念 对数据库中全体数据的逻辑结构和特征所作的描述就称为是数据库系统的模式(Schema)。这种描述只刻画了数据集合的“型”,不涉及到具体的数据“值”。和型相对应的值有若干,每一个值称为模式的一个实例(Instance)。 模式反映了数据库系统中数据的结构和相互联系,是一种相对稳定的描述;实例反映了数据库系统在某一时刻的状态,是一种动态的数据集。 数据库系统的典型模式结构是三级模式、两级映象结构。,1.3.2.2 数据库系统的三级模式结构,数据库系统的三级模式结构由外模式、模式、内模式以及外模式/模式映象、模式/内模式映象组成。,数据库系统的三级模式结构,一、模式(Schema),模式也称为逻辑

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论