数据库原理及应用 第一章 数据库系统概论_第1页
数据库原理及应用 第一章 数据库系统概论_第2页
数据库原理及应用 第一章 数据库系统概论_第3页
数据库原理及应用 第一章 数据库系统概论_第4页
数据库原理及应用 第一章 数据库系统概论_第5页
已阅读5页,还剩44页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

一章 数据库系统概论 主要讲解内容 数据 数据库 数据库管理系统 数据库系统 数据库系统的组成 数据库技术的发展历史 数据库系统阶段的主要特点 数据库系统结构 三级模式结构与二级 (层)映象功能 数据的独立性 物理独立性与逻辑独立性 数据库系统的体系结构 数据库管理系统 数据库管理系统的主要功能 数据库管理系统的组成 概念模型 数据模型 层次 网状 关系 工管理阶段 文件系统阶段 据管理技术的发展 应用程序 1 应用程序 2 应用程序 n 数据库系统阶段 数据 1 数据 2 数据 n 文件 系统 物理文件 1 物理文件 2 物理文件 n 数据库 管理系统 数据库 据管理技术的发展 人工管理阶段 文件系统阶段 数据库系统阶段 时间 50年代中期 50年代后期 60年代中期 60年代后期 应用背景 科学计算 科学计算、管理 大规模管理 硬件背景 无直接存取存 储设备 磁盘、磁鼓 大容量磁盘 软件背景 没有操作系统 有操作系统 (文件系统) 有 理方式 批处理 批处理 联机实时处理 批处理 联机实时处理 分布处理 据库技术的三个阶段 (续 1) 人工管理阶段 文件系统阶段 数据库系统阶段 数据保存方式 数据不保存 以文件的形式长期保存,但无结构 以数据形式保存,有结构 数据管理 考虑安排数据的物理存储位置 与数据文件名打交道 对所有数据实行统一、 集中、独立的管理 数据与程序 数据面向程序 数据与程序脱离 数据与程序脱离 实现数据的共享 数据的管理者 人 文件系统 据面向的对象 某一应用程序 某一应用程序 现实世界 据库技术的三个阶段 (续 2) 人工管理阶段 文件系统阶段 数据库系统阶段 数据的共享程度 无共享 共享性差 共享性高 数据的冗余度 冗余度极大 冗余度大 冗余度小 数据的独立性 不独立,完全依赖于程序 独立性差 具有高度的物理独立性和一定的逻辑独立性 数据的结构化 无结构 记录内有结构 整体无结构 整体结构化 用数据模型描述 数据的控制能力 应用程序自己控制 应用程序自己控制 由 整性、并发控制和恢复能力 本概念 数据 描述现实世界中各种事物的符号记录 数据库 长期储存在计算机中的、有组织的、可共享的数据的集合 数据库管理系统 数据库管理系统是为数据库的建立、使用和维护而配置的软件。它建立在操作系统的基础上,对数据库进行统一的管理和控制。 数据库系统 是实现在组织地、动态地存储大量相关的结构化数据,方便各类用户使用数据库的计算机软件 /硬件资源的集合。 数据库系统由 5部分组成:硬件系统、数据库集合、数据库管理系统及相关软件、数据库管理员和用户。 据描述 据描述的 3个领域 从事物的特征到计算机中数据的表示,数据描述要经历 3个不同的领域: 现实世界、信息世界和机器世界。 信息世界 指现实世界在人们头脑中的反映。人们用文字、符号、图形、图像、声音等方式记载下现实世界的信息,我们称之为信息世界。 在信息世界中,常用的术语有以下 4个: 实体( 客观存在可以相互区别的事物称为实体。实体可以是具体的对象,例如:一个员工、一本教材等。也可以是抽象的事件,例如:一次旅游、一场球赛等。 实体集( :性质相同的同类实体的集合称为实体集。例如,学生等。 属性( 实体有很多特性,每一个特性称为一个属性。每个属性有一个数据类型和值域。例如:大学生有学号、姓名、年龄、性别等属性。学号、姓名、性别的数据类型是字符串,而年龄的数据类型是整数,其值域在 13 30之间。 实体标识符 ( 能惟一标识每个实体的属性或属性集称为实体标识符,或简称键。例如,学生的学号可以作为学生实体标识符 器世界 信息世界的信息在机器中以数据形式存储,成为机器世界。在机器世界中,常用的术语有以下 4个: 字段( 标记实体属性的命名单位称为字段或数据项。它是可以命名的最小信息单位,所以又称为数据元素或初等项。字段的命名往往与属性名相同。例如:一个学生记录中有学号、姓名、年龄、性别等字段。 记录( 字段的有序集合称为记录。一般用一个记录描述一个实体,所以记录又可以定义为能完整地描述一个实体的字段集。例如:一个学生记录由有序的字段集组成:(学号,姓名,年龄,性别)。 基本表( : 描述一个实体集的所有记录的集合。有的数据库管理系统,一个基本表就对应一个数据文件( 关键码( 能惟一标识基本表中每个记录的字段或字段集。 数据联系的描述 1对 1、 1对多、多对多 据模型 数据模型是表示实体类型和实体间联系的模型,是现实世界中的事物及其间联系的一种抽象表示,是一种形式化描述数据、数据间联系以及有关语义约束规则的方法。 象的抽象过程 第一级 抽象 现实世界 信息世界 概念模型 机器世界 数据模型 第二级 抽象 事物个体 实体 记录 事物总体 实体集 文件 特征 属性 字段 事物间联系 实体模型 数据模型 认识抽象 转换 一级抽象:概念模型 数据模型是数据库系统的核心和基础。各种机器上实现的 了把现实世界中的具体事物抽象、组织为某一 们常 常首先将现实世界抽象为信息世界,然后将信息世界转换为机器世界。也就是说,首先把现实世界中的客观对象抽象为某一种信息结构,这种信息结构并不依赖于具体的计算机系统,不是某一个 是概念级的模型;然后再把概念模型转换为计算机上某一 不难看出,概念模型实际上是现实世界到机器世界的一个中间层次。 念模型 1) 信息世界中的基本概念 (1) 实体 客观存在并相互区别的事物 (2) 实体集 1. 性质相同的同类实体的集合 2. 实体整体 3. 例子 所有的学生 (3) 属性 1. 实体所具有的某一特性 2. 用若干个属性来描述实体 3. 包含 (1) 属性的型:学生(姓名,系别 ) (2) 属性的值:学生(张三,计算机系 ) (4) 实体型 1. 用若干个属性型所组成的集合表征一个实体类型 2. 用实体名及其属性名集合来抽象和刻画同类实体 3. 例如:学生(学号、姓名、系别 ) (5) 码 1. 唯一标识实体的属性集 2. 实体键、关键字(段) 3. 把某个实体个体与其他实体个体区分来开(成绩表) (6) 域 1. 属性的取值范围 (7) 联系 1. 一对一联系( 1:1) 2. 一对多联系( 1:n) 3. 多对多联系( m:n) ) 概念模型的表示方法 (实体联系方法) ( 1) 实体联系方法( 来 实体 976年提出的一种语义数据模型 不必考虑信息的存储机构 ,存取路径及存取效率如何在计算机中实现 而不是面向机器的实现 . 2)设计 E 不是它在机器中如何实现,因此 E 面介绍 E 个基本的抽象概念:实体、联系和属性。 实体 ( 实体是客观存在的且可以区别的事物。现实世界由各种各样的实体组成。实体可以是有生命的,也可以是无生命的;可以是具体的,也可以是抽象的概念。例如学生、教师、文化艺术、信息技术、梦、爱与恨 都是实体。所以,实体具有客观存在和可区分的墓本特征。 在数据库设计中,常常关心具有相同性质的实体的集合。这种具有相同性质的一类实体的集合称为实体集(如全校学生的集合组成学生实体集。实体集中各个实体是借助实体标识符 (称为关键字 )加以区别的。例如,可以定义学校的“教师”为一实体集,而学校中每个教师都是该实体集的成员。 联系 ( 联系是实体集之间关系的抽象表示,即对现实世界中事物之间关系的描述。如教师实体集与学生实体集间的“讲授”联系,公司实体集与职工实体集之间的“聘任”联系等。如果参与联系的实体集的数目为 n,则称这种联系数为 据联系的元数不同,通常把联系分为如下几类: (1)二元联系:只有两个实体集参与的联系称为二元联系,它是现实世界中大量存在的联系。 E 元联系可进 步区分为 1: 1、 l: n和 m: 在 E ( 2)多元联系:参与联系的实体集个数 =3时,称为多元联系 例:学生 书店和图书 购成“购书”联系是三元联系 ( 3)自反联系:它描述了同一实体集内两部分实体之间的联系,是一种特殊的二元联系。也可区分为 1: 1, 1: : N 例:人中的夫与妻 职工中的领导与被领导 属性 ( 实体或联系所具有的特征称之为属性。实体由特征来 表征和区分,通常一个实体可以由多个属性来描述,即实体可用属性集表示。例如学生实体可用学号、姓名、性别、年龄、系、籍贯等属性来描述。不仅实体可以用属性来描述,联系也可以用属性来描述使其语义更加丰富。例如学生实休集和课程实体集间存在 m: 课”联系,这种联系可以有“成绩”、“选修时间”等属性。有关属性的几点说明如下: 示方法 1. 实体型:矩形实体名 2. 属性:椭圆形,无向边与实体连接 3. 联系:菱形联系名,无向边与实体连接,边上标注联系类型 在 E=有时为了突出各实体集之间的联系 ,略去了实体集或联系的属性 =校长 负责 学校 1 1 系部 聘任 教师 1 n 教师 教学 学生 m n 职工号 姓名 性别 年龄 职称 书号 书名 简介 价格 课程名 学分 课程号 专业系 班编号 成绩 学号 姓名 性别 年龄 教师 参考书 讲授 课程 m n 1 选修 m n 领导 1 n 学生 组成 班级 n 1 实体集 联系 学员 属性 二级抽象 机器世界的数据模型 数据模型 1) 实体模型 数据模型 2) 实体集 文件 3) 实体 记录 4) 实体型 记录型 5) 属性 数据项、字段 数据模型种类 层次模型 ( 网状模型 ( 关系模型 (次模型 代表系统 数据结构 树型结构(一对多关系) 1: 1或 1: N 只有一个根结点:无双亲 其他结点有且只有一个双亲 基本概念 兄弟 同一个双亲的结点称为兄弟 叶子 无子女的结点,称为叶子 校行政机构的层次模型 校 教研室 系 科 处 研究所 研究室 次模型示例 优点 1. 数据模型简单 2. 若实体间的关系固定,性能优于关系模型 3. 良好的完整性支持 缺点 1. 描述现实世界的非层次性很笨拙 2. 插入和删除操作限制较多 3. 必须通过双亲才能找到子结点 4. 由于结构严密,层次命令趋于程序化 状模型 (1) 代表系统 (2) 数据结构:网状结构 1. 允许多个结点无双亲 2. 允许结点有多个双亲 3. 允许结点间有多个联系(复合联系) 操纵与完整性约束 1. 允许插入无双亲的子结点 2. 允许只删除双亲结点 3. 更新操作较简单 存储结构 1. 链接法 优点 1. 能够直接描述现实世界 2. 存取效率较高 缺点 1. 数据描述语言极其复杂 2. 数据独立性差 系模型 (1) 代表系统 1. 2. 3. 4. 5. (2) 数据结构:关系模型(规范的二维表) (3) 概念 1. 关系:整个二维表 2. 关系名:表格名称 3. 元组:行数据(记录) 4. 属性名:列名称(字段名) 5. 属性:列数据(字段) 6. 主码:唯一确定元组的属 性组(关键字) 7. 域:属性的取值范围 8. 分量:元组中的一个属性值 9. 关系模式:关系名(属性 ),如:学生(学号,姓名,性别,系别,年龄,籍贯) (4) 操纵与完整性约束 1. 操纵:查询、更新(插入、修改、删除) 2. 完整性:实体完整性、参照完整性、用户定义完整性 3. 操作的对象与结果都是关系 4. 数据独立性高(隐蔽存取路径) (5) 存储结构 1. 以文件形式存储表 (6) 优点 1. 有严格的数学概念作基础 2. 关系模型的概念单一 3. 存取路径对用户透明 (7) 缺点 1. 查询效率不高 系数据模型 学号 姓名 性别 年龄 籍贯 9901 李勇 男 20 江苏 9902 刘晨 女 19 山东 9903 王明 女 20 北京 9999 张立 男 18 陕西 学生学籍记录表 关系名 关系 元组 (行 ) 属性 (列 ) 主码 男 女 域 分量 关系模式 : 学生(学号、姓名、性别、年龄、籍贯) 属性名 据库中的表 /关系 学 号 姓 名 专 业 选修课程 任课教师 9003105 张 鹏 计算机应用 计算机系统结构 唐 飞 9003212 吴俊武 计算机软件 数据结构 王小栋 9003223 廖 凯 计算机软件 程序设计语言 陆 非 9003214 李 娜 计算机软件 形式语言 蒋 涛 学生选课登记表 表、关系:由关系模式和元组构成 值域: 列数据的取值范围 如,十个汉字以内的文字串 关系模式:由表名和属性名构成 如,学生选课登记表 (学号 ,姓名 ,专业 ,选修课程 ,任课教师 ) 列、字段、属性、数据项: 列有名称 (属性名 ),有值 /数据 (数据项 ) 如,属性名为“专业”,数据项为“计算机应用”,“计算机软件” 行、元组、记录:由数据构成 表名:学生选课登记表 如, (9003212,吴俊武 ,计算机软件 ,数据结构 ,王小栋 ) (9003223,廖凯 ,计算机软件 ,程序设计语言 ,陆非 ) 据库系统的体系结构 注: 我们可以从不同的角度考察数据库体系结构;从数据库管理系统的抽象层次看,数据库系统通常采用三级模式结构。从最终用户角度来看,数据库系统分为单用户结构、主从式结构、分布式结构和客户 /服务器结构。 1) 模式 (1) 数据库中全体数据的逻辑结构和特征的描述 (2) 仅涉及到数据类型的描述,不涉及到具体的数值 (实例 ) (3) 模式是稳定的,实例是相对变动的 (4) 模式反映数据的结构和关系,实例反映数据库某时刻的状态 据库系统的三级模式结构 据库系统的三级模式结构 _外模式 (1) 外模式 ( 也叫子模式或用户模式 ) 1. 是数据库用户看见和使用的局部数据的逻辑结构和特性的描述 2. 是数据库用户的数据视图 3. 描述数据的局部逻辑结构 4. 是概念模式的逻辑子集 5. 有多个外模式(不同的用户有不同的外模式) 6. 用户通过外模式访问数据库 7. 与用户看待数据库方式有关的层 据库系统的三级模式结构 _模式 (2) 概念模式 (逻辑模式或简称模式 ) 1. 是数据库中全体数据的逻辑结构和特性的描述 2. 是所有用户的公共数据视图 3. 所有个别用户视图综合起来的用户共同视图 4. 描述数据的全局逻辑结构 5. 只有一个概念模式,它是数据系统三级模式结构的中间层 据库系统的三级模式结构 _内模式 (3) 内模式 (存储模式 ) 1. 与实际存储数据方式有关的层 2. 数据的物理结构和存储结构的描述 3. 数据在数据库内部的表示方式 4. 描述数据的物理存储结构 5. 存储方式、索引、压缩加密 6. 只有一个内模式 ) 数据库的二层映象功能与数据独立性 正是这两层映像保证了数据库系统中的数据具有较高的数据逻辑独立性与数据物理独立性 (1) 外模式 /概念模式的映象 1. 定义外模式与概念模式的对应关系 2. 概念模式改变 改变映象 外模式不变 应用程序不变 3. 保证数据的逻辑独立性 (2) 概念模式 /内模式的映象 1. 定义数据的全局逻辑结构与存储结构的对应关系 2. 存储结构改变 映象改变 概念模式不变 3. 保证数据的物理独立性 ) 三级结构带来的优点 (1)保证数据的独立性 (2)简化了用户的使用 (3)减少冗余,利于共享 (4)有利于数据的安全操作 ) 数据库系统的体系结构

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论