




已阅读5页,还剩52页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1 第2章 数据管理与数据库 2 第2章数据管理与数据库 2 1数据库的常用术语2 2计算机数据管理技术的产生和发展2 3数据模型2 4数据库系统的模式结构2 5DBMS的功能2 6数据库系统的组成 3 2 1数据库的常用术语 2 1 1数据与信息2 1 2数据独立性2 1 3数据库系统返回 4 2 1 1数据与信息 1 数据 Data 描述客观事物特征或性质的某种符号 描述事物的符号可以是数值 也可以是文字 图形 图像 声音 语言等多种形式 它们都可以经过数字化处理后存入计算机 数据项 ItemofData 数据的基本单元 即最小单位 它是某类客观事物的某个特征或性质的数据抽象 每个数据项都有一个名字 数据项名 和若干可能的取值 数据项值 例如 描述一类学生的 姓名 性别 籍贯 都是数据项名 而 李明 男 江苏 则分别是以上数据项的一个取值 5 2 1 1数据与信息 2 记录型 RecordType 描述一类事物的若干特征或性质的数据项名的集合 即数据结构 例如 描述某校所有学生的记录型为 学生 姓名 性别 出生日期 籍贯 所在系别 入学日期 数据记录 Record 按照记录型的规定描述一个事物的若干特征或性质的数据项值的集合 例如 描述一个学生李明的记录为 李明 男 21 1972 08 21 江苏 计算机系 1990 09 01 6 2 1 1数据与信息 3 数据处理 DataProcessing 对数据进行收集 存储 检索 分类 加工和传输等一系列活动过程的总和 返回 7 2 1 1信息与信息 4 信息 Information 客观事物之间相互联系 相互作用的运动状态和特征的抽象描述 是数据处理的结果 且仍以数据的形式表示出来 数据与信息的关系 信息是数据处理的结果 信息也以数据作为其表现形式 返回 8 2 1 2数据独立性 数据独立性 DataIndependency 是指数据与用户的应用程序之间的依赖关系是独立的 它包括 1 数据的物理独立性 指用户的应用程序与存储在磁盘上数据库中的数据是相互独立的 即当数据的物理存储位置改变时 用户的应用程序不用改变 2 数据的逻辑独立性 指用户的应用程序与数据库的逻辑结构是相互独立的 即当数据的逻辑结构改变时 用户的应用程序不用改变 返回 9 2 1 3数据库系统 数据库系统与数据库 数据库管理系统是三个既有联系又有区别的重要基本概念 数据库 DataBase 简称DB 长期存储在计算机内的 有组织的 可共享的数据集合 其特点是 数据库中的数据按一定的数据模型组织 描述和储存 具有最小的冗余度 较高的数据独立性和易扩展性 并可为各种用户共享等 它是数据库系统的组成部分 10 数据库管理系统 其英文为DataBaseManagementSystem 简称DBMS 是位于用户与操作系统 OS 之间的 使人们能对数据库中的数据进行科学地组织 高效地存取和维护管理的一种数据管理软件 它为用户提供数据定义 数据操纵 数据库控制 数据库的建立和维护等功能 11 数据库系统 其英文为DataBaseSystem 简称DBS 是计算机系统 DB DBMS 应用软件 数据库管理员 DataBaseAdministrator 简称DBA 和用户的总和 所以 DBS一般由硬件 软件 包括开发工具 数据库 数据库管理员和用户构成 在许多不会引起混淆的情况下 人们又常常把数据库系统简称为数据库 12 2 2计算机数据管理技术的产生和发展 2 2 1人工管理阶段1 2 2文件系统阶段2 2 3数据库系统阶段2 2 4数据库技术的发展2 2 5数据库技术的主要研究领域返回 13 2 2 1人工管理阶段 计算机数据管理是指利用计算机对数据进行分类 组织 编码 存储 检索和维护的一系列操作 它是数据处理的前提和中心问题 人工管理阶段 20世纪50年代中期以前 是计算机数据管理技术经历的第一个阶段 其特点是 数据不保存 程序员 人工 管理数据 数据不共享 数据和程序不具有独立性 返回 14 2 2 2文件系统阶段 文件系统阶段 从20世纪50年代后期到20世纪60年代中期 是计算机数据管理技术经历的第二个阶段 其特点是 数据可以长期保存 文件多样化和结构化 文件系统管理数据 文件系统比人工管理阶段有了很大的改进 但仍存数据冗余度大 数据独立性较差和数据联系弱等缺点 返回 15 2 2 3数据库系统阶段 数据库系统阶段 从20世纪60年代后期至今 是计算机数据管理技术经历的第三个阶段 其特点是 整体数据的结构化 数据模型 数据独立性较高 数据的共享性好 冗余度低 易扩充 并提供了数据的安全性 Security 保护 数据的完整性 Integrity 并发控制 ConcurrentControl 和数据库恢复 Recovery 等完整的控制功能 返回 16 2 2 4数据库技术的发展 第一代数据库技术 即层次数据库和网状数据库技术 第二代数据库技术 即关系数据库技术 第三代数据库技术 即新一代数据库技术 以面向对象模型为主要特征的数据库技术 17 第一代数据库技术 即层次数据库和网状数据库技术 这一代的数据库管理系统主要支持层次和网状数据模型 其主要特点是 支持三级模式结构 用存取路径 指针 来表示数据之间的联系 数据定义语言 DataDefinitionLanguage 简称DDL 和数据操纵语言 DataManipulationLanguage 简称DML 相对独立 数据库语言采用过程性 导航式 语言 18 第二代数据库技术 即关系数据库技术 这一代的数据库管理系统主要支持关系数据模型 这种模型有严格的数学理论基础 概念简单 清晰 易于用户理解和使用 其主要特点是 概念单一化 数据及其数据间的联系都用关系来表示 以关系代数为理论基础 数据独立性强 数据库语言采用说明性语言 大大简化了用户的编程难度 19 第三代数据库技术 即新一代数据库技术 它是以面向对象模型为主要特征的数据库技术 这一代的数据库管理系统是基于扩展的关系数据模型或面向对象数据模型的 是尚未完全成熟的一代数据库技术 其主要特点是 支持包括数据 对象和知识的管理 在保持和继承第二代数据库技术基础上引入新技术 如面向对象技术等 对其它系统开放 有良好的可移植性 可扩充性和可互操作性 20 2 2 5数据库技术的主要研究领域 数据库技术大致有三个主要研究领域 数据库管理系统软件的研究 数据库应用系统设计与开发 数据库理论的研究 返回 21 2 3数据模型 2 3 1数据模型的构成2 3 2数据模型的分类2 3 3实体 联系 E R 模型2 3 4常用的结构数据模型返回 22 2 3 1数据模型的构成 数据模型 DataModel 客观事物某些特征的数据抽象和模拟 是一组严格定义的概念集合 它是数据库系统的核心 数据模型的三要素是 数据结构集合 数据操作集合和完整性约束集合 数据结构集合 对计算机数据组织方式和数据之间联系进行框架描述的集合 是对数据库静态特性的描述 数据操作集合 对数据库中各种对象类的实例 或取值 所允许执行的操作的集合 包括操作方法及有关的操作规则等 是对数据库动态特性的描述 完整性约束集合 关于数据状态和状态变化的一组完整性约束条件 规则 的集合 它保证数据的正确性 有效性和相容性 返回 23 2 3 2数据模型的分类 一个数据模型除了应具备前面的三个要素以外 还应满足以下三方面的性能要求 能比较真实地模拟或抽象表示现实世界 容易为人所理解 便于在计算机上实现 但目前还没有找到这样的数据模型 因此 人们常常采取多步抽象的方法 针对不同的抽象层次采用不同的数据模型 24 三类数据模型 概念数据模型 ConceptualDataModel 结构数据模型 StructuralDataModel 又称逻辑数据模型 LogicalDataModel 物理数据模型 PhysicalDataModel 25 概念数据模型 用户容易理解的 对现实世界特征的数据抽象 它与具体的DBMS无关 是数据库设计员与用户之间进行交流的语言 常用的概念数据模型是实体 联系 E R 模型 简称E R模型 26 结构数据模型 又称逻辑数据模型 LogicalDataModel 是用户从数据库中所看到的数据模型 是具体的DBMS所支持的数据模型 如网状数据模型 层次数据模型 关系数据模型和面向对象数据模型等 27 物理数据模型 描述数据在存储介质上组织结构的数据模型 它不但与具体的DBMS有关 而且还与操作系统和硬件有关 是物理层次的数据模型 28 三类数据模型在数据库设计过程中地位和关系 返回 29 2 3 3实体 联系 E R 模型 实体 联系方法 Entity RelationshipApproach 简称E R方法或E R模型 是一种概念数据模型 本节介绍 E R模型中的基本概念 E R图要点 30 E R模型中的基本概念 1 实体 Entity 客观存在并可相互区别的事物都称为实体 如 王涛 计算机系等 属性 Attribute 实体具有若干特征 每个特征称为实体的一个属性 例如 每个学生实体都具有学号 姓名 年龄 性别 系别 年级等属性 实体型 EntityType 对具有相同属性的一类实体的特征和性质的结构描述 例如 学生 学号 姓名 性别 年龄 系 入学时间 就是一个实体型 31 E R模型中的基本概念 2 实体集 EntitySet 若干同型实体的集合称为实体集 例如 信息学院的学生就是一个实体集 关键字 Key 能唯一地标识实体集中每个实体的属性集合称为关键字 码 例如 学号可以作为一个学校的学生实体集的关键字 一个实体集可以有若干个关键字 通常选择一个作为主关键字 PrimaryKey 域 Domain 属性的取值范围称作域 例如 性别的域为集合 男 女 联系 Relationship E R模型中实体之间的联系 它是客观事物之间联系的抽象表示 32 E R模型中的基本概念 3 两个实体集之间的联系可以分为三类 一对一联系 1 1 如果对于实体集A中的每一个实体 实体集B中至多有一个 也可以没有 实体与之联系 反之亦然 则称实体集A与实体集B具有一对一联系 记为1 1 一对多联系 1 n 如果对于实体集A中的每一个实体 实体集B中有n个实体 n 0 与之联系 反之 对于实体集B中的每一个实体 实体集A中至多有一个实体与之联系 则称实体集A与实体集B具有一对多联系 记为1 n 33 多对多联系 m n 如果对于实体集A中的每一个实体 实体集B中有n个实体 n 0 与之联系 反之 对于实体集B中的每一个实体 实体集A中也有m个实体 m 0 与之联系 则称实体集A与实体集B具有多对多联系 记为m n 实体集内部的联系也有1 1 1 n和m n三类联系 E R模型中的基本概念 4 34 E R图要点 1 E R图中的符号约定如下 实体 集 型 用矩形表示 矩形框内写明实体名 联系 用菱形表示 菱形框内写明联系名 并用无向边分别与有关的实体连接起来 同时在无向边旁标上联系的类型 1 1 1 n或m n 如果一个联系具有属性 则这些属性也要用无向边与该联系连接起来 属性 用椭圆形表示 并用无向边将其与相应的实体连接起来 35 E R图要点 2 一个简单实例 学生实体集与课程实体集及其联系的E R图 返回 36 2 3 4常用的结构数据模型 目前 数据库领域中最常用的结构 逻辑 数据模型有四种 它们是 层次模型 HierarchicalModel 网状模型 NetworkModel 关系模型 RelationalModel 面向对象模型 ObjectOrientedModel 返回 37 关系模型 1 关系模型是本书的重点 关系模型的数据结构 数据操作涉及的一些概念如下 关系数据模型的数据结构 逻辑结构是一张二维表 Table 简称表 由行和列组成 其常用术语有 关系模式 RelationalSchema 对应一个二维表的表头 它对应E R模型中的实体型 是相对稳定的 属性 Attribute 二维表中的一列即为一个属性 给每一个属性起一个名称即属性名 它们与E R模型中实体型的属性相同 关系 Relation 对应通常所说的一张二维表 它与E R模型中的实体集对应 38 关系模型 2 元组 Tuple 二维表中除表头以外的一非空行即为一个元组 元组与E R模型中的实体对应 候选键 CandidateKey 二维表中的某些属性的集合 它可以唯一确定一个元组 一个关系可以有若干个候选键 通常选择一个作为主键 PrimaryKey 它们分别与E R模型中的关键字和主关键字对应 域 Domain 属性的取值范围 属性的域同E R模型中属性的域意义相同 分量 AttributeValue 元组中一个属性所取的具体值 39 关系模型 3 表2 3给出了文件系统 E R模型和关系模型中常用术语的对照关系 40 关系模型 4 关系数据模型的操作 关系模型的数据操作是集合操作 即操作的对象和操作的结果都用关系表示 关系数据模型的存储结构 在关系数据模型中 实体及实体间的联系都用关系 二维表 来表示 在数据库的物理组织中 通常数据库作为一个操作系统的文件存储 关系也以文件形式存储在数据库文件中 其文件结构由DBMS系统自己设计和管理 41 关系模型 5 关系数据模型具有下列优点 关系模型与非关系模型不同 它建立在严格的数学理论基础上 关系模型的概念单一 无论实体还是实体之间的联系都用关系表示 关系模型的存取路径对用户透明 有更高的数据独立性 更好的安全保密性 关系模型中的数据操作是集合操作 即操作的对象和操作的结果都用关系表示 关系数据模型的缺点 查询效率往往不如非关系数据模型 42 2 4数据库系统的模式结构 2 4 1数据库的三级模式2 4 2数据库的二级映象功能与数据独立性返回 43 2 4 1数据库的三级模式 三级模式是指数据库管理系统 DBMS 中存在的外模式 逻辑 模式和内模式 它是数据库管理系统 DBMS 对数据库中数据进行有效组织和管理的方法 图2 16 其目的有 为了减少数据冗余 实现数据共享 为了提高存取效率 改善性能 返回 44 数据库系统的三级模式结构示意图 概念 概念 概念 概念 概念 返回 45 模式 模式 Schema 也称结构模式或逻辑模式 是数据库中全体数据的逻辑结构和特征的描述 它与结构数据模型对应 DBMS提供模式定义语言 SchemaDDL 简称模式DDL 来严格地定义模式 RDBMS中的模式与E R模型中实体型对应 返回 46 外模式 外模式 ExtemalSchema 也称子模式 Subschema 或用户模式 它是数据库用户能够看见和使用的局部数据的逻辑结构和特征的描述 外模式是与某一具体应用有关的数据的逻辑结构和特征的描述 返回 47 内模式 内模式 InternalSchema 也称存储模式 StorageSchema 是数据库物理结构和存储方式的描述 是数据在数据库内部的表示方式 说明 现在的DBMS产品基本上可以自动完成内模式的大部分定义工作 几乎不需要用户介入 当用户使用模式DDL定义模式的同时 DBMS也就自动完成了相应的内模式的定义工作 返回 48 2 4 2数据库的二级映象功能与数据独立性 数据库管理系统在这三级模式之间提供了两层映象 外模式 模式映象 存在于外模式与模式之间 用于定义外模式与模式之间的对应关系 其目的是为了提高数据与程序之间的逻辑独立性 简称数据的逻辑独立性 模式 内模式映象 存在于模式与内模式之间 用于定义内模式与模式之间的对应关系 即数据库全局逻辑结构与存储结构之间的对应关系 其目的是为了提高数据与程序之间的物理独立性 即数据的物理独立性 返回 49 例2 13 假设应用程序A 要求从数据库中取出一条记录 则程序应用数据操纵语言 DML 向DBMS提出请求 DBMS接收命令后 系统内部将发生一系列事件 应用程序A向DBMS发出读一个记录的操作命令 一条DML语句 命令中含操作对象和操作条件 当计算机执行该DML语句时 立即启动DBMS 并把读记录的命令传给DBMS DBMS调用应用程序A对应的外模式 检查存取权限 决定是否执行A的操作命令 当确定A的命令是合法之后 DBMS调用模式 并根据模式与外模式的映射关系 确定应读入哪些模式记录 DBMS根据模式与内模式的映射 调出内模式得到组织物理记录的结构和存取信息 DBMS向OS申请读进所需物理记录 OS执行读命令 从存储介质中将指定记录读入系统缓冲区 并在操作之后向DBMS作出应答 DBMS参照模式和外模式的映射 将读入系统缓冲区的数据转换为应用程序所需要的记录形式 DBMS把用户记录从系统缓冲区送到应用程序A的用户工作区 DBMS将读记录操作成功与否的信息作为一种状态送给应用程序A 此后 应用程序A便根据返回的状态信息作出相应的处理 50 2 5DBMS的功能 BMS的主要功能包括 1 数据库定义功能 2 数据操纵功能 3 数据库控制功能 4 数据库维护功能 返回 51 数据库的定义功能 DBMS通过提供数据定义语言 DataDefinitionLanguage DDL 来对外模式 模式和内模式加以描述和定义 即定义数据库的逻辑结构 存储结构 语义信息和保密要求等 返回 52 数据操纵功能 DBMS提供数据操纵语言 DataManipu
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年公共管理职位面试模拟题及答案深度解析
- 2025年供销社农资配送中心招聘面试题难点解析及应对方法
- 拉弯机安全培训课件
- 2025年大数据展现平台合作协议书
- 抢救知识培训课件
- 2025年家用厨房电器具项目发展计划
- 2025年重组抗原诊断试剂项目建议书
- 2025年石英玻璃纤维套管项目合作计划书
- 抗菌素使用课件
- 高2024级2025年秋期开学考试地理试题
- 肾功能衰竭患者的麻醉管理要点
- 食品公司研发部管理制度
- 不等齿宽永磁同步电动机电磁力波特性与振动抑制策略研究
- 首诊负责制试题及答案
- 2024浙江遂昌农商银行新员工招聘笔试历年典型考题及考点剖析附带答案详解
- 学校篮球共建协议书
- 挂名法人股东协议书
- 文件销毁保密协议书
- 高考英语必背688个高频词汇清单
- 企业车间5S培训课件
- 2025年助理医师资格证考试之口腔助理医师通关题库(附带答案)
评论
0/150
提交评论