第章数据库系统概论ppt课件.ppt_第1页
第章数据库系统概论ppt课件.ppt_第2页
第章数据库系统概论ppt课件.ppt_第3页
第章数据库系统概论ppt课件.ppt_第4页
第章数据库系统概论ppt课件.ppt_第5页
已阅读5页,还剩38页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第一章数据库系统概论 1 1数据与数据处理 1 1 1信息与数据信息 信息是对现实世界事物存在方式或运动状态的反映 信息的特点 1 信息可以被感知 不同的信息有不同的感知方式 2 信息的获取和传递不仅需要有载体而且消耗能量 3 信息可以通过载体进行存储 压缩 加工 传递 共享 扩散 再生和增值 数据 数据是将现实世界中的各种信息记录下来的 可识别的符号 是信息的载体 是信息的具体表现形式 1 1 2数据处理将数据转换成信息的过程 对数据的收集 存储 传播 检索 分类 加工和计算等 数据处理的目的有两个 一个是从大量的 原始的数据中抽取对人们有价值的信息 并依此作为行动和决策的依据 二是借助计算机科学地存储和管理复杂的 大量的数据 1 2数据库与数据库系统 1 2 1数据库 Database DB 数据库 数据库就是为了实现一定的目的 按某种规则组织起来的数据的集合 例如 通讯录 工资表等都是最简单的数据库 每个人的姓名 性别 出生日期 地址等都是数据库中的数据 数据库是组织数据的一种手段 数据库就是存放数据的仓库 它是为了实现某种目的 按照某种原则组织起来的数据的集合 在计算机领域 数据库是指长期存储在计算机内的 有组织的 可共享的 统一管理的相关数据的集合 1 2 2数据库系统概述数据库系统是计算机化的能对数据进行加工处理的软硬件环境 1 数据库系统的组成 1 数据 数据是数据库系统的处理对象 2 用户 存储 维护和检索数据库中数据的人员 终端用户 也成为最终用户 一般是不精通计算机和程序设计的人员 这类用户使用数据库系统提供的终端命令语言或菜单命令等对数据库中的数据进行检索 查询等存取操作 应用程序员 也称作系统开发员 是负责设计和编制基于数据库的应用程序的人员 数据库管理员 指全面负责数据库系统的管理 维护和正常使用的人员 其主要职责包括 参与数据库设计的全过程 与用户 应用程序员 系统分析员紧密配合 设计数据库的结构和内容 决定数据库的存储和存取策略 对数据库系统的软硬件环境进行管理 3 硬件 运行和存储数据库管理系统的硬件资源 包括 计算机 网络打印机 联网设备 通讯设备等 4 软件 计算机的操作系统 数据库管理系统 DBMS 2 数据库系统的特点 1 数据冗余低 共享性高 2 数据独立性提高数据的独立性包括逻辑独立性和物理独立性 数据的逻辑独立性是指当数据的总体逻辑结构改变时数据的局部逻辑结构不变 数据的物理独立性是指数据的存储结构改变时数据的逻辑结构不变 3 统一的数据控制功能数据的安全性控制 系统统一设置完整性规则 以确保数据的正确性 相容性和有效性 并发控制 多用户同时存取数据时 防止干扰和脏数据 数据恢复 当数据库数据被破坏或不可靠时 系统有能力将数据库从错误状态恢复到最近某一时刻的正确状态 1 2 3数据库系统的发展历史1 20世纪50年代以前 人工管理阶段特点 1 数据不保存 2 编写程序时要安排数据的物理存储 3 数据面向程序 2 20世纪50年代中期末至60年代末 文件系统阶段特点 1 数据以文件的形式长期保存 2 数据的物理结构和逻辑结构有了区别 但比较简单 3 文件形式多样化 4 程序与数据之间有一定的独立性 3 20世纪60年代末以后 数据库系统阶段特点 1 数据共享 2 数据结构化 3 数据独立性 4 可控制数据冗余度 5 统一数据控制功能能 1 2 4数据库管理系统 DBMS 1 DBMS的功能 1 数据库定义功能 提供相应的数据库定义语言定义数据库结构 2 数据存取功能 提供数据操纵语言实现对数据库数据的检索 插入 修改和删除 3 数据库运行管理功能 提供数据库数据的安全性 完整性和并发性控制功能 4 数据库的建立和维护功能 包括数据库初始数据的装入 数据库的转储 系统性能监视 分析等 5 数据通讯功能 提供数据的传输功能 支持网络 实现用户程序和DBMS之间的数据通讯 2 DBMS的组成 1 语言编译处理程序 2 系统运行控制程序 3 系统建立维护程序 4 数据字典 1 2 5数据库应用系统数据库应用系统是一个软件 是在DBMS基础上针对某一个应用而开发的面向用户的应用软件 1 3数据库系统的体系结构 1 内部体系结构1975年美国国家标准委员会 ANSI 所属的标准计划和要求委员会公布了一个数据库标准报告 提出了数据库的三级结构组织 这就是著名的Sparc分级结构 概念模式 简称模式 是对数据库的整体逻辑结构和特征的描述 不涉及数据的物理存储细节和硬件环境 与具体的应用程序使用的应用开发无关 内模式 又称存储模式 具体描述了数据如何存储在存储介质上 外模式 通常是模式的一个子集 故又称为子模式 外模式面向用户 它是用户能够看到和使用的局部数据的逻辑结构和特征的描述 是与某一应用有关的数据的逻辑表示 数据库的三级模式结构图 1 3 2外部体系结构1 集中式结构数据库结构由两个关键硬件组成 主机和客户终端 数据库和用户应用程序都存放在主机中 数据处理和主要的运算操作也是在主机上进行的 主要特点 数据和应用集中 便于维护和管理 安全性好 但是对主机性能要求高 主机价格昂贵 终端机 终端机 主机 2 文件服务器结构数据库存放在文件服务器中 用户应用程序分散存放在各个客户工作站上 文件服务器指负责数据的集中管理 所有的应用都安排在客户端完成 主要特点 费用低 配置灵活 但计算能力差 客户端的计算机性能要求高 3 客户 服务器 Client Server 结构数据存放在服务器中 应用程序可以根据需要安排在服务器或者客户工作站上 实现了客户终端和服务器端程序的协调工作 1 4数据模型 计算机信息管理的对象是现实生活中的客观事物 但这些事物是无法直接送入计算机进行处理的 必须将现实世界的事物进行信息的规范化 现实世界的事物和联系 信息世界的概念 整理 归类 计算机世界的数据模型 抽象 加工 1 4 1概念模型概念数据模型 ConceptualDataModel 简称为概念模型 概念模型是对现实世界的事物及其联系的抽象成信息世界的概念模型 它强调的是语义表达能力和使用便捷 能直接表达应用中的各种语义和知识 在概念模型中主要用到以下基本术语 1 实体与实体集实体 现实世界中客观上存在且可以区分的事物 可以是人 可以是物 可以是事物与事物之间的联系等 譬如 学生 工厂 学校 企业 销售等都是实体 实体集 具有相同类型以及共享相同性质 属性 的实体的集合 2 属性实体所具有的某一方面的特性 一个实体可以有若干属性 譬如学生实体所具有的属性 学号 姓名 性别 出生年月 班级等 3 关键字和域实体的每个属性都有一个值 属性的取值范围称作该属性的域 例如 特定的学生实体其学号是20120205 姓名是张海潮 性别属性是男 出生年月属性是1992 02 14等 其中20120205是学号属性的一个值 张海潮是姓名属性的一个值 男是性别属性的一个值 实体的某一属性或者属性组合 其所取用的值能唯一标识该实体 称为关键字 例如学生实体的学号属性 4 联系现实世界中的事物总是存在错综复杂的联系 这种联系必须在信息世界中加以反映 一般存在两种联系 一种是实体内部的联系 如组成实体的属性之间的联系 例如 商品实体的属性 编号 名称 单位 单价 数量 金额 产地等 其中金额 单价 数量 另一种是实体之间的联系 譬如 组成学生信息管理系统的实体为 学生 成绩 课程 等 学生实体和成绩实体间联系是 一个学生有若干门课程的成绩 课程实体与学生实体间的联系是 一门课程有若干学生选修 经常用R表示实体与实体之间的联系 实体之间的联系分为三类 1 一对一联系 1 1 实体集A与实体集B通过某个联系R来说 A中每个实体至多与实体集B中某个实体相联系 反之亦然 例如 部门实体集与经理实体集 具有一对一联系 R 实体A 实体Ba x 2 一对多联系 1 n 对于联系R来说 如果实体集A中的一个实体 通过R可以与实体集B中的多个实体相联系 但对实体集B中的每一个实体 A中最多有一个实体与之联系 例如学生实体集和成绩实体集 因为一个学生可以有多门考试成绩 R 实体A 实体BR 1 实体B 实体Aa x y zx a 3 多对多联系 n m 对于联系R来说 如果实体集A中的一个实体 通过R可以与实体集B中的多个实体相联系 反之亦然 例如学生实体和课程实体存在多对多联系 R 实体A 实体BR 1 实体B 实体Aa x y zx a b c 1 4 2E R方法表示概念模型的方法很多 最常用的是E R图方法 所谓E R图方法就是用一些规定的图形来表示现实世界中的事物 实体 及其之间的联系 矩形 表示实体椭圆 表示属性菱形 表示实体间的联系 菱形框内写上联系名 用无向边 线段 分别把菱形与相关实体相连接 在无向边旁标上联系的类型 如果实体之间的联系也有属性 则把属性和菱形用无向边联上 线段 将属性连接到实体集或实体集连接到联系集 双椭圆 表示多值属性 虚椭圆 表示派生属性双线 表示一个实体全部参与到联系集中 双矩形 表示弱实体集 学生 课程 教师 成绩 学号 班级 姓名 性别 生日 选修 课号 名称 教材 编号 姓名 性别 职称 讲授 学号 课号 编号 成绩 学生信息管理系统E R图 1 4 3常用的数据模型数据库中的数据是具有结构的 也就是按照某种数据模型来组织的 当前流行的基本数据模型有三种 层次模型 网状模型和关系模型 1 层次模型特点 1 有且仅有一个结点没有双亲结点 该节点称作根结点 2 其他结点有且仅有一个双亲结点 结点A 结点B 结点C 结点D 结点B 结点B 结点B 结点B 结点B 结点B 2 网状模型特点 1 可以有一个以上的结点没有双亲结点 2 至少有一个结点有多于一个的双亲结点 A B C D F E 3 关系模型关系模型是用二维表格来表示实体以及实体与实体之间的联系 关系模型的数据结构是一个二维表框架组成的集合 如 下面的二维表格就是关系模型中的学生信息表 1 5关系数据库 关系数据库就是用关系模型建立的数据库 是目前世界上主流的数据库 例如 Access Foxpro Paradox Oracle MSSQLServer Sybase DB2 Informix MySql等 都是关系数据库 1 5 1关系模型中的基本术语1 关系 一张二维表 简称为表 每一个表都有一个名称 叫做表名 2 字段 表中的每一个列称作一个字段 属性 每一个字段都有一个名称 称作字段名 一个表的全部字段组成表的结构 3 域 字段的取值范围 4 元组 表中的行 称作表的元组 也称作表的记录 5 分量 元组中的一个属性 关系模型要求关系是规范化的 即 关系的每一个分量必须是不可再分的数据项 6 关系模式 对关系的描述 一般格式为 表名 字段1 字段2 字段3 字段n 例如 student 学号 姓名 性别 出生日期 班级 course 课程号 课程名 学期 score 学号 课程号 成绩 教师编号 7 候选关键字 属性或属性的组合 其值能够唯一标识一个元组 8 主关键字 主键 在一个关系中可以有多个候选关键字 从中选择一个作为主关键字 9 外关键字 如果一个关系的属性或者属性组合不是该关系的关键字 但它是另外一个关系的关键字 则称之为外关键字 10 主属性 包含在任何候选关键字中的属性称作主属性 11 关系数据库 对应于一个关系型的所有关系的集合称作关系数据库 学生信息管理系统数据库中的表 1 学生信息表 student 学号 姓名 性别 出生日期 班级 2 教师信息表 teacher 编号 姓名 性别 出生日期 工作时间 职称 3 课程表 cousre 课号 名称 学期 学分 4 成绩信息表 score 学号 课号 成绩 教师编号 在以上数据库中 哪些字段是主键 外键 1 5 2关系模型的性质1 描述的一致性 不仅用关系描述实体本身 还可以用关系描述实体之间的联系 2 可直接描述多对多的联系 3 关系必须是规范化的 即 每个数据项 字段 不能再分 不允许表中有表 4 关系模型具有较强的数学基础和理论依据 关系的性质 1 每一列 字段 具有相同数据类型 2 不同列 字段 要给与不同的名字 3 列的次序可以任意交换 4 行的次序可以任意交换 5 一个关系中任意两行不能完全相同 6 每一个列 分量 必须是不可分的数据项 1 5 4关系模型的完整性约束1 实体完整性的约束规则是 如果属性A是基本关系R的主属性 则A不能取空值 所谓空值 就是不知道或者不存在的值 说明 1 实体完整性规则是对基本表而言的 2 现实世界中的实体是可区分的 3 关系模型中以主键作为唯一性标识 4 主键中的属性不可取空值 2 参照完整性参照完整性的约束规则为 如果属性或者属性组合F是基本关系R的外键 它与基本关系S的主键Ks相对应 则对于R中每个元组 行 在F中的值必须为空或者等于S中某个元组的主键值 关系R关系S 3 用户定义的完整性约束任何数据库系统都应该支持实体完整性和参照完整性 此外还应该允许用户自己定义一些具体的约束条件 称之为用户定义的完整性约束 例如 关系的某属性取值的约束 学生成绩表中的degree字段 表示的是学生某门课程的考试成绩 显然不能取负数 1 6关系代数 关系代数是一种抽象的查询语言 它用关系的运算来表达查询 关系代数的运算对象是关系 表 运算结果也是关系 表 关系代数用到的运算符有四类 1 集合运算符 并 差 交 笛卡尔积 2 专门的关系运算符 选择 投影 除 连接 3 比较运算符 不等于 4 逻辑运算符 非 与 或 传统的集合运算是将关系看成元组的集合 其运算是从关系的行的角度来进行的 而专门的关系运算同时设计行和列 比较运算和逻辑运算是辅助专门的关系运算符进行操作的 1 6 1传统的逻辑运算假设关系R和关系S都具有n个属性 且相应的属性取值同一个域 t是元组变量 t R表示t是R的一个元组 1 Union R S t t R t S 2 Difference R S t t R t不属于S 3 IntersectionReferentialintegrity R S t t R t S 4 Extendedcartesianproduct 设R是含有n个属性的关系 S是含有m个属性的关系 则R和S的笛卡尔积是一个含有n m个属性的关系 元组的前n列是R的一个元组 后m列是S的一个元组 R S trts tr R ts S 1 6 2专门的关系运算专门的关系运算包括 选择 投影 连接 除运算等 1 选择 从一个关系中选出满足给定的条件的元组的操作称作选择或筛选 其中条件表达式中可以使用比较运算符和逻辑运算符 选择操作记做 F R t t R F t 真 其中 F表示选择的条件 例如 学生信息数据库包含的关系如下 Student Sno Sname Ssex Sage Sdept Course Cno Cname Cpno Credit Score Sno Cno Grade 例1 要查询数学系的全体学生可以表示为 Sdept 数学 R 或 5 数学 R 2 投影从一个关系中选出若干指定字段的值的操作称作投影 投影运算结果中包含的字段个数一般比原来要少 或者字段的排列次序和原来不同 投影操作记做 A R t A t R 其中A是R中的列属性 例2 查询学生的姓名和所在的系可如下表示 Sname Sdept Student 或 2 5 student 例3 查询年龄小于24岁学生的姓名和所在系可如下表示 Sname Sdept sage 24 R 3 连接将两个关系中的记录按照一定的条件横向结合 生成一个新的关系 最常用的连接运算是自然连接 它是利用两个关系中的公有字段 把该字段的值相等的记录连接起来 连接操作记做 1 7规范化理论 1 7 1模式规范化的必要性首先看下面的例子 在一个学生信息管理系统中 定义了一个表内容如下 Stc 学号 姓名 性别 课程号 课程名 成绩 学分 101张敏女1数学分析875102李海江男1数学分析725103王大伟男1数学分析885 分析该表的特点 1 数据冗余度高2 容易产生数据更新不一致性3 插入新数据困难3 删除数据困难 为了在设计数据库时 使得用户不必存储不必要的数据 由可以方便地访问和操作数据 那么用户在设计数据库时必须遵循一定的规则 这个规则就是规范化 1 7 2规范化理论的基本概念1 第一范式 1NF 第一范式是最低的规范化要求 它要求关系满足一种基本的条件 每一个数据项都不可再分 2 第二范式 2NF 如果一个关系属于第一范式 且所有的非主关键字都完全依赖于主关键字 则称作属于第二范式 3 第三范式 3NF 如果一个关系属于第二范式 且每一个非关键字不传递依赖于主关键字 则称属于第三范式 分析下面的数据库设计 商品房销售监管信息管理系统1 企业 编号 名称 地址 电话 法人 资质 2 项目 项目编号 企业编号 项目名称 地址 建筑面积 投资金额 3 银行 项目编号 企业编号 银行编号 银行名称 账号 期初金额 4 申请款项 编号 企业编号 项目编号 取款日期 取款金额 经手人 5 存入款项 编号 项目编号 企业编号 银行编

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论