




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、数据库系统原理与设计,广东海洋大学软件学院 主讲:蔡莉华,1.1 数据库系统概论,数据库技术在软件行业的重要地位 新技术的发展与数据库的进展密不可分 数据库也是综合性很强的一门软件技术 学习本门课程的重要意义,基本术语介绍: 数据,数据库,数据库管理系统,数据库系统。 主要概念介绍: 关系模型,数据模型三要素,三层模式和二级映像体系结构及意义。 需了解的内容介绍: 数据管理的三个阶段,层次模型,网状模型。 需掌握的技能: 能分析现实环境的概念模型,掌握ER图的画法。,本章主要内容,数据库技术,数据库技术:研究如何科学地组织和存储数据;如何高效地获取和处理数据。 数据库系统具有:1.管理长期应用
2、数据的能力;2. 高效地存取大量数据的能力。,1.1.1 基本术语,数据 数据数据是描述信息的符号记录,也是数据库研究和 处理的基本对象。 信息事物的存在方式或运动状态。 数据库中的数据:各种“数字” (数字、图形、图象、声音、字符) (“李明”,“男”,1972-05-12,“计算机系”),数据库 数据库是统一管理的相关数据的集合,即为存放 数据的仓库。 永久存储 有组织 可共享,数据库管理系统(DBMS) 用户与操作系统间的一层系统软件,常用的有SQL SERVER、Access、FoxPro、Oracle、DB2等 数据定义功能(DDL) 数据操纵功能(DML) 数据库的运行管理 数据库
3、的建立和维护 其他功能,数据库系统(DBS) 采用了数据库技术的计算机系统 DB:由DBMS管理的数据的聚集 DBMS:是数据库系统的核心,用户开发的数据库系统 是建立在特定的DBMS之上 应用系统 人员,图1-1 数据库系统,1.1.2 数据管理技术的产生和发展,数据管理:如何对数据进行分类组织储存检索 及维护。 数据管理的三个阶段: 人工管理阶段 文件系统阶段 数据库系统阶段,人工管理阶段 20世纪50年代中期以前,计算机主要用于科学计算。 硬件状况外存只有纸带、卡片、磁带,没有磁盘等直接 存取的存储设备; 软件状况只有汇编语言,没有管理数据的软件; 数据处理方式批处理。其特点是: (1)
4、数据不保存; (2)应用程序管理数据;(3)数据不能共享; (4)数据不具有独立性。,应用程序1,应用程序2,应用程序n,数据集1,数据集2,数据集3,图1-2 人工管理阶段应用程序与数据之间的对应关系,文件系统阶段 20世纪50年代后期到60年代中期 硬件状况有了磁盘、磁鼓等直接存取存储设备; 软件状况出现了高级语言和操作系统; 处理方式不仅有了批处理,而且能够联机实时处理。 其特点是: (1)数据可以长期保存;(2)由文件系统管理数据(3)数据共享性差,冗余度大;(4)数据独立性差。,学生基本信息管理,学生选课管理,应用程序1 应用程序2,学生基本信息 文件F1,课程基本信息 文件F2,学
5、生选课信息 文件F3,F1包含学号、姓名、性别、生日、所在系、专业、班级、地址 F2包含课程号、课程名、授课学期、学分、课程性质 F3包含学号、姓名、课程号、课程名、选课类型、成绩,数据库系统阶段 时间:20世纪60年代末,硬件状况已经有大容量的磁盘; 处理方式也是联机实时处理。 面向全组织的复杂的数据结构。(数据的结构化是数据库 的主要特征,是与文件系统的根本差别。) 数据冗余小,易扩充。 数据独立性高,包括数据的物理独立性和逻辑独立性。 统一的数据控制功能(数据的安全性、完整性、并发控制、 数据库恢复)。,1.1.3 数据库系统的特点,数据结构化 数据系统“整体”结构化,不再针对某一具体应
6、用,而是面向全组织;不仅数据内部结构化,而且整体结构化,且数据之间存在联系。 数据库系统实现整体数据的结构化,是数据库的主要特征之一,也是数据库系统与文件系统的本质区别。,学生基本记录,学生人事记录,奖惩情况记录,学生学籍记录,家庭成员记录,学生选课记录,课程记录,图1-3 学校信息管理系统中的学生数据,数据共享性高,冗余度低,易扩充 从整体看,数据不再面向某个应用而是面向整个系统,因此数据可以被多个用户,多个应用共享。数据共享可以减少数据冗余,节约存储空间。同时能够避免数据之间的不一致性。 有结构的数据,不仅可以被多个应用共享,而且容易增加新的应用,使得数据库系统弹性大,容易扩充,可以适应各
7、种用户的要求。,数据独立性高 数据独立性是数据库领域的一个常用术语,包括数据的物理独立性和数据的逻辑独立性。 物理独立性是用户的应用程序与存储在磁盘上的数据库中的数据时相互独立的。 逻辑独立性是用户的应用程序与数据库的逻辑结构是相互独立的。 数据独立性由DBMS的耳机映像功能来保证。,数据由DBMS统一管理和控制 数据的安全性保护 数据的完整性检查 并发控制 数据库恢复,数据库系统的发展阶段标志,1968:IBM设计了层次数据库系统IMS 1969:CODASYL的DBTG发表了关于网状数据模型的报告,标志着网状数据库系统的产生 1970:IBM的E.F. Codd提出了关系数据模型,奠定了关
8、系数据库理论基础,形成了关系数据库主流 1985:开始研究面向对象数据库技术 1990:M. Stonebraker发表“第三代数据库系统宣言”,提出对象关系数据模型 1998:提出了半结构化数据模型(XML1.0),1.2 数据模型,数据模型:是人们对现实世界的数据特征的抽象。 (真实性易理解易实现)要求较真实地模拟现实世界, 容易为人理解,便于在计算机上实现。,1.2.1 两类数据模型 概念模型 按用户的观点对数据建模(独立于计算机) 数据模型 按计算机的观点对数据建模 1.2.2 数据模型三要素 数据结构 数据操作 完整性约束,1. 数据结构,什么是数据结构 对象类型的集合 两类对象 与
9、数据类型、内容、性质有关的对象 与数据之间联系有关的对象 数据结构是对系统静态特性的描述,2.数据操作,数据操作 对数据库中各种对象(型)的实例(值)允许执行的操作及有关的操作规则 数据操作的类型 检索 更新(包括插入、删除、修改),数据操作(续),数据模型对操作的定义 操作的确切含义 操作符号 操作规则(如优先级) 实现操作的语言 数据操作是对系统动态特性的描述。,3.数据的约束条件,数据的约束条件 一组完整性规则的集合。 完整性规则是给定的数据模型中数据及其联系所具有的制约和储存规则,用以限定符合数据模型的数据库状态以及状态的变化,以保证数据的正确、有效、相容。,数据的约束条件(续),数据
10、模型对约束条件的定义 反映和规定本数据模型必须遵守的基本的通用的完整性约束条件。例如在关系模型中,任何关系必须满足实体完整性和参照完整性两个条件。 提供定义完整性约束条件的机制,以反映具体应用所涉及的数据必须遵守的特定的语义约束条件。,1.2.3 概念模型,概念模型的用途 概念模型用于信息世界的建模 是现实世界到机器世界的一个中间层次 是数据库设计的有力工具 数据库设计人员和用户之间进行交流的语言 对概念模型的基本要求 较强的语义表达能力,能够方便、直接地表达应用中的各种语义知识 简单、清晰、易于用户理解。,1、基本概念 (1) 实体客观存在并可以相互区别的事物 (2) 实体集同类型实体的集合
11、 (3) 属性实体所具有的某一特性 (4) 键(码)能唯一标识实体的属性集 (5) 型与值用实体名及其属性名来抽象同类实体为型 型:学生(学号、姓名、性别) 值: (94001,张平,男) (6) 值域属性的取值范围,2、实体之间的联系 (1)一对一:如果实体集A中的每个实体至多和实体集B中一 个实体有联系,反之亦然,则称A和B之间的联系是1:1。,实体集A 实体集B,(2)一对多:如果实体集A中的每个实体与实体集B中任意 多个实体有联系,而实体集B中的每个实体至多和A中的 一个实体有联系,则称A和B之间的联系是1:N,(3)多对多:如果实体集A中的每个实体与实体集B中任意多 个实体有联系,反
12、之亦然,则称A和B之间的联系是M:N,,3、两个以上实体型之间的联系 一般地,两个以上的实体型之间也存在一对一、一对多和 多对多联系。 例如:对于课程、教师与参考书,如果一门课程可以有若 干个教师讲授,使用若干本参考书,而每一个教师只讲授一 门课程,每一本参考书只能供一门课程使用,则课程与教师 参考书之间的联系是一对多的。,图1-4 3个实体型之间的联系示例,注意:实体间的联系与现实世界的语义环境关系密切。具体 判断时,应根据实际情况分析语义,通过联系的定义来判断 联系的类型。“具体问题,具体分析” 例如:图书馆借阅管理系统,读者与图书的联系问题。 ?图书和读者之间的联系,问题:某读者当前所借
13、的图书信息?固定某个时间点 一位借阅者一次可以借阅多本图书。 一本图书一次只能被一位借阅者借阅。 在此情况下满足1N,可以解决该问题。 但如果需求涉及“某本书在2003年被哪些借阅者借过”, 1N能否满足?,M-N 不在特定时间点,考虑长期因素 通过考虑借阅时间等因素: 一位借阅者可以借阅多本图书 一本图书可以借给多位借阅者 联系类型应由需求,即现实世界的语义来确定 不同角度的不同用户,看问题可能不同,造成冲突,4、概念模型表示方法 概念模型的表示方法很多 实体联系方法(E-R方法) 用E-R图来描述现实世界的概念模型 E-R方法也称为E-R模型,4、概念模型表示方法(续) 实体联系模型(E-
14、R图) ER图提供了表示实体型、属性和联系的方法: 实体型:用矩形表示,矩形框内写明实体名。 属性:用椭圆形表示,并用无向边将其与相应的实体型 连接 联系:用菱形表示,用无向边将其与相应的实体型连接, 同时在无向边旁表上联系的类型(1:1,1:n,m:n),例:为学生成绩管理设计一个E-R模型。主要管理学生及 其课程成绩。 首先抽象实体型 学生(学号、姓名、年龄、性别) 课程(课程号、课程名、学分),题:建立一个关于学生和班级的概念模型(ER图) 描述学生的属性有:学号、姓名、出生年月、系名、宿舍区 描述班级的属性有:班号、专业名、系名、人数、入校年份,1.2.4 常用的数据模型,1、数据模型
15、的三要素 数据结构所研究的对象类型的集合,是对系统静态特性 的描述。 数据操作对数据库仲各种对象(型)和实例(值)运行 执行的操作的集合,是对系统动态特性的描述。 数据的约束条件是一组完整性规则的集合。 (应该由DBMS支持,而非应用程序的功能),2、常用的数据模型 非关系模型 层次模型(Hierarchical Model) 网状模型(Network Model ) 数据结构:以基本层次联系为基本单位 基本层次联系:两个记录以及它们之间的一对 多(包括一对一)的联系,关系模型(Relational Model) 数据结构:表 面向对象模型(Object Oriented Model) 数据结
16、构:对象,层次模型用树形结构表示实体类型及其联系 层次模型的优缺点: 层次模型的数据结构比较简单清晰 层次数据库的查询效率比较高 层次模型提供了很好的完整性支持 表达多对多的联系比较复杂 应用程序的编写比较复杂 查询子女结点必须通过双亲结点 结构严密,层次命令趋于程序化,网状模型用有向图结构表示实体类型及其联系 网状模型的优缺点: 网状能更为直接地描述现实世界 性能良好,存取效率高 结构比较复杂,随着应用环境的扩大,数据库的结构 越来越复杂,不利于最终用户掌握。 网状模型的DDL、DML复杂。用户不容易掌握,不容 易使用。,1.关系模型的数据结构,关系模型建立在严格的数学概念的基础上。每个关系
17、的数 据结构是一张规范化的二维表。,关系:一个关系对应通常所说的一张表 元组:表中的一行为一个元组 属性:表中的一列即为一个属性,每个属性都有属性名。 主码(Key):表中的某个属性组,可以唯一确定一个元组。 域(Domain):属性的取值范围。 分量:元组中的一个属性值。 关系模式:对关系的描述 关系名(属性1,属性2,属性n) 学生(学号,姓名,年龄,性别,系,年级),关系模型用表格表示实体集,外键表示实体间的联系,关系模型,关系必须是规范化的,满足一定的规范条件 最基本的规范条件:关系的每一个分量必须是一个不可分的数据项。,2.关系模型的数据操纵,查询、插入、删除、更新 数据操作是集合操
18、作,操作对象和操作结果都是关系,即若干元组的集合 存取路径对用户隐蔽,用户只要指出“干什么”,不必详细说明“怎么干”,3.关系模型的完整性约束,实体完整性 参照完整性 用户定义的完整性,关系模型的优缺点 1、有严格的数学模型,建立在集合论基础上。 2、概念单一,对实体和实体间联系都用关系表示。 3、存取路径对用户透明。 4、查询效率往往比非关系模型低。,1.3 数据库系统体系结构,两种划分方式: 从DBMS看:三层 从用户看:Client/Server Browser/Server等,1.3.1 数据库系统模式的概念,“型” 和“值” 的概念 型(Type):对某一类数据的结构和属性的说明 值
19、(Value):是型的一个具体赋值 例如:学生记录 记录型: (学号,姓名,性别,系别,年龄,籍贯) 该记录型的一个记录值: (900201,李明,男,计算机,22,江苏),数据库系统模式的概念(续),模式(Schema) 数据库逻辑结构和特征的描述 是型的描述 反映的是数据的结构及其联系 模式是相对稳定的 模式的一个实例(Instance) 模式的一个具体值 反映数据库某一时刻的状态 同一个模式可以有很多实例 实例随数据库中的数据的更新而变动,数据库系统的三级模式结构,1模式(Schema),模式(也称逻辑模式) 数据库中全体数据的逻辑结构和特征的描述 所有用户的公共数据视图,综合了所有用户
20、的需求 一个数据库只有一个模式,模式的地位:是数据库系统模式结构的中间层 与数据的物理存储细节和硬件环境无关 与具体的应用程序、开发工具及高级程序设计语言无关 模式的定义 数据的逻辑结构(数据项的名字、类型、取值范围等) 数据之间的联系 数据有关的安全性、完整性要求,2. 外模式(External Schema),外模式(也称子模式或用户模式) 数据库用户(包括应用程序员和最终用户)使用的局部数据的逻辑结构和特征的描述 数据库用户的数据视图,是与某一应用有关的数据的逻辑表示,外模式的地位:介于模式与应用之间 模式与外模式的关系:一对多 外模式通常是模式的子集 一个数据库可以有多个外模式。反映了不同的用户的应用需求、看待数据的方式、对数据保密的要求 对模式中同一数据,在外模式中的结构、类型、长度、保密级别等都可以不同 外模式与应用的关系:一对多 同一外模式也可以为某一用户的多个应用系统所使用, 但一个应用程序只能使用一个外模式。,3内模式(Internal Schema),内模式(也称存储模式) 是数据物理结构和存储方式的描述 是数据在数据库内部的表示方式 记录的存储方式(顺序存储,按照B树结构存储,按hash方法存储)
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 民乐县供养人员管理办法
- 财经金融标签管理办法
- 金融呆账提取管理办法
- 乡镇畜牧兽医站管理办法
- 流动食品摊贩管理办法
- 酒店采购预算管理办法
- 金融责任转移管理办法
- 重庆公共鱼塘管理办法
- 卫生巾销售管理办法细则
- 乌苏市专项资金管理办法
- 【公开课】三角形的边+课件+2025-2026学年人教版八年级数学上册
- 2025年广东省普通高中学业水平合格性考试模拟一历史试题(含答案)
- 【公开课】+分子动理论的初步知识(教学课件)2025-2026学年初中物理人教版(2024)九年级全一册
- 设备安全培训
- 2025至2030中国角膜塑形镜行业产业运行态势及投资规划深度研究报告
- 2023aki的预防诊断和管理
- 2025年4月自考03346项目管理试题
- 慢性肾衰竭患者心理的护理
- 艾梅乙反歧视培训课件
- 2024年度医患沟通课件
- 工作简报模板
评论
0/150
提交评论