第07章(3)数据库设计_第1页
第07章(3)数据库设计_第2页
第07章(3)数据库设计_第3页
第07章(3)数据库设计_第4页
第07章(3)数据库设计_第5页
已阅读5页,还剩87页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、1数据库系统概论数据库系统概论An Introduction to Database System第七章第七章 数据库设计数据库设计2第七章第七章 数据库设计数据库设计7.1 数据库设计概述数据库设计概述7.2 需求分析需求分析7.3 概念结构设计概念结构设计7.4 逻辑结构设计逻辑结构设计7.5 数据库的物理设计数据库的物理设计7.6 数据库的实施和维护数据库的实施和维护7.7 小结小结37.4 逻辑结构设计逻辑结构设计v逻辑结构设计的任务逻辑结构设计的任务把概念结构设计阶段设计好的基本把概念结构设计阶段设计好的基本E-R图转换为与选用图转换为与选用DBMS产品所支持的数据模型相符合的逻辑结

2、构产品所支持的数据模型相符合的逻辑结构v逻辑结构设计的步骤逻辑结构设计的步骤将概念结构转化为一般的关系、网状、层次模型将概念结构转化为一般的关系、网状、层次模型将转换来的关系、网状、层次模型向特定将转换来的关系、网状、层次模型向特定DBMS支持下支持下的数据模型转换的数据模型转换对数据模型进行优化对数据模型进行优化4 逻辑结构设计逻辑结构设计(续续)逻辑结构设计时的逻辑结构设计时的3个步骤个步骤 57.4 逻辑结构设计逻辑结构设计7.4.1 E-R图向关系模型的转换图向关系模型的转换7.4.2 数据模型的优化数据模型的优化7.4.3 设计用户子模式设计用户子模式67.4.1 E-R图向关系模型

3、的转换图向关系模型的转换v转换内容转换内容v转换原则转换原则7E-R图向关系模型的转换(续)图向关系模型的转换(续)vE-R图向关系模型的转换要解决的问题图向关系模型的转换要解决的问题 如何将实体型和实体间的联系转换为关系模如何将实体型和实体间的联系转换为关系模式式如何确定这些关系模式的属性和码如何确定这些关系模式的属性和码 v转换内容转换内容将将E-R图转换为关系模型:将实体、实体的属图转换为关系模型:将实体、实体的属性和实体之间的联系转换为关系模式。性和实体之间的联系转换为关系模式。8E-R图向关系模型的转换(续)图向关系模型的转换(续)实体型间的联系有以下不同情况实体型间的联系有以下不同

4、情况 :(1)一个一个1:1联系可以转换为一个独立的关系模式,联系可以转换为一个独立的关系模式,也可以与任意一端对应的关系模式合并。也可以与任意一端对应的关系模式合并。转换为一个独立的关系模式转换为一个独立的关系模式与某一端实体对应的关系模式合并与某一端实体对应的关系模式合并(2)一个一个1:n联系可以转换为一个独立的关系模式,联系可以转换为一个独立的关系模式,也可以与也可以与n端对应的关系模式合并。端对应的关系模式合并。 转换为一个独立的关系模式转换为一个独立的关系模式与与n端对应的关系模式合并端对应的关系模式合并9E-R图向关系模型的转换(续)图向关系模型的转换(续)(3) 一个一个m:n

5、联系转换为一个关系模式。联系转换为一个关系模式。例,例,“选修选修”联系是一个联系是一个m:n联系,可以将联系,可以将它转换为如下关系模式,其中学号与课程号它转换为如下关系模式,其中学号与课程号为关系的组合码:为关系的组合码:选修(选修(学号学号,课程号课程号,成绩),成绩)10E-R图向关系模型的转换(续)图向关系模型的转换(续)(4) 三个或三个以上实体间的一个三个或三个以上实体间的一个多元联系多元联系转换为转换为一个关系模式。一个关系模式。例,例,“讲授讲授”联系是一个三元联系,可以将它转联系是一个三元联系,可以将它转换为如下关系模式,其中课程号、职工号和书号换为如下关系模式,其中课程号

6、、职工号和书号为关系的组合码:为关系的组合码:讲授(讲授(课程号,职工号,书号课程号,职工号,书号)11E-R图向关系模型的转换(续)图向关系模型的转换(续)(5) 具有具有相同码相同码的关系模式可合并的关系模式可合并目的:减少系统中的关系个数目的:减少系统中的关系个数合并方法:将其中一个关系模式的全部属性加入到合并方法:将其中一个关系模式的全部属性加入到另一个关系模式中,然后去掉其中的同义属性(可另一个关系模式中,然后去掉其中的同义属性(可能同名也可能不同名),并适当调整属性的次序能同名也可能不同名),并适当调整属性的次序12E-R图向关系模型的转换(续)图向关系模型的转换(续)注意:注意:

7、v从理论上讲,从理论上讲,1:1联系可以与任意一端对应的关系模式合并。联系可以与任意一端对应的关系模式合并。v但在一些情况下,与不同的关系模式合并效率会大不一样。但在一些情况下,与不同的关系模式合并效率会大不一样。因此究竟应该与哪端的关系模式合并需要依应用的具体情况因此究竟应该与哪端的关系模式合并需要依应用的具体情况而定。而定。v由于连接操作是最费时的操作,所以一般应以尽量减少连接由于连接操作是最费时的操作,所以一般应以尽量减少连接操作为目标。操作为目标。 例如,如果经常要查询某个班级的班主任姓名,则将管理联例如,如果经常要查询某个班级的班主任姓名,则将管理联系与教师关系合并更好些。系与教师关

8、系合并更好些。13E-R图向关系模型的转换(续)图向关系模型的转换(续)例例 把图把图7.30中虚线上部的中虚线上部的E-R图转换为关系模型图转换为关系模型 部门实体对应的关系模式部门实体对应的关系模式 部门(部门(部门号部门号,部门名,经理的职工号,部门名,经理的职工号,) 此关系模式已包含了联系此关系模式已包含了联系“领导领导”所对应的关系模式所对应的关系模式 经理的职工号是关系的候选码经理的职工号是关系的候选码 职工实体对应的关系模式职工实体对应的关系模式 职工(职工(职工号职工号、部门号,职工名,职务,、部门号,职工名,职务,) 该关系模式已包含了联系该关系模式已包含了联系“属于属于”

9、所对应的关系模式所对应的关系模式 14E-R 图向关系模型的转换(续)图向关系模型的转换(续)例例 把图把图7.30中虚线上部的中虚线上部的E-R图转换为关系模型图转换为关系模型(续续)产品实体对应的关系模式产品实体对应的关系模式 产品(产品(产品号产品号,产品名,产品组长的职工号,产品名,产品组长的职工号,)供应商实体对应的关系模式供应商实体对应的关系模式 供应商(供应商(供应商号供应商号,姓名,姓名,) 零件实体对应的关系模式零件实体对应的关系模式 零件(零件(零件号零件号,零件名,零件名,) 15E-R图向关系模型的转换(续)图向关系模型的转换(续)例例 把图把图7.30中虚线上部的中虚

10、线上部的E-R图转换为关系模型图转换为关系模型(续)(续) 联系联系“参加参加”所对应的关系模式所对应的关系模式 职工工作(职工工作(职工号,产品号职工号,产品号,工作天数,工作天数,) 联系联系“供应供应”所对应的关系模式所对应的关系模式 供应(供应(产品号,供应商号,零件号产品号,供应商号,零件号,供应量),供应量) 167.4 逻辑结构设计逻辑结构设计7.4.1 E-R图向关系模型的转换图向关系模型的转换7.4.2 数据模型的优化数据模型的优化7.4.3 设计用户子模式设计用户子模式177.4.2 数据模型的优化数据模型的优化v得到初步数据模型后,还应该适当地修改、调整数得到初步数据模型

11、后,还应该适当地修改、调整数据模型的结构,以进一步提高数据库应用系统的性据模型的结构,以进一步提高数据库应用系统的性能,这就是能,这就是数据模型的优化数据模型的优化v关系数据模型的优化通常以关系数据模型的优化通常以规范化理论规范化理论为指导为指导18数据模型的优化(续)数据模型的优化(续)优化数据模型的方法优化数据模型的方法v确定数据依赖确定数据依赖v按需求分析阶段所得到的语义,分别写出每个关系模式内部各属按需求分析阶段所得到的语义,分别写出每个关系模式内部各属性之间的数据依赖以及不同关系模式属性之间数据依赖性之间的数据依赖以及不同关系模式属性之间数据依赖v消除冗余的联系消除冗余的联系v 对于

12、各个关系模式之间的数据依赖进行极小化处理,消除冗余的联对于各个关系模式之间的数据依赖进行极小化处理,消除冗余的联系。系。v确定所属范式确定所属范式按照数据依赖的理论对关系模式逐一进行分析按照数据依赖的理论对关系模式逐一进行分析考查是否存在部分函数依赖、传递函数依赖、多值依赖等考查是否存在部分函数依赖、传递函数依赖、多值依赖等确定各关系模式分别属于第几范式确定各关系模式分别属于第几范式19数据模型的优化(续)数据模型的优化(续)v按照需求分析阶段得到的各种应用对数据处理的按照需求分析阶段得到的各种应用对数据处理的要求,分析对于这样的应用环境这些模式是否合要求,分析对于这样的应用环境这些模式是否合

13、适,确定是否要对它们进行合并或分解。适,确定是否要对它们进行合并或分解。并不是规范化程度越高的关系就越并不是规范化程度越高的关系就越优,优,一般说来,第三范式就足够了一般说来,第三范式就足够了20数据模型的优化(续)数据模型的优化(续)例:在关系模式例:在关系模式 学生成绩单学生成绩单(学号学号,英语英语,数学数学,语文语文,平均成绩平均成绩) 中存在下列函数依赖:中存在下列函数依赖: 学号学号英语英语 学号学号数学数学 学号学号语文语文 学号学号平均成绩平均成绩 (英语英语, 数学数学, 语文语文)平均成绩平均成绩21数据模型的优化(续)数据模型的优化(续) 显然有:显然有: 学号学号(英语

14、英语,数学数学,语文语文)因此该关系模式中存在传递函数信赖,是因此该关系模式中存在传递函数信赖,是2NF关系关系虽然平均成绩可以由其他属性推算出来,但如果应用虽然平均成绩可以由其他属性推算出来,但如果应用中需要经常查询学生的平均成绩,为提高效率,中需要经常查询学生的平均成绩,为提高效率,仍然可保留该冗余数据,对关系模式不再做进一仍然可保留该冗余数据,对关系模式不再做进一步分解步分解22数据模型的优化(续)数据模型的优化(续)v按照需求分析阶段得到的各种应用对数据处理的按照需求分析阶段得到的各种应用对数据处理的要求,对关系模式进行必要的分解,以提高数据要求,对关系模式进行必要的分解,以提高数据操

15、作的效率和存储空间的利用率操作的效率和存储空间的利用率常用分解方法常用分解方法水平分解水平分解垂直分解垂直分解23数据模型的优化(续)数据模型的优化(续)水平分解水平分解什么是水平分解什么是水平分解把把(基本基本)关系的元组分为若干子集合,定义每关系的元组分为若干子集合,定义每个子集合为一个子关系,以提高系统的效率个子集合为一个子关系,以提高系统的效率水平分解的适用范围水平分解的适用范围满足满足“80/20原则原则”的应用的应用(经常被使用的大概占(经常被使用的大概占20%)并发事务经常存取并发事务经常存取不相交的数据不相交的数据24数据模型的优化(续)数据模型的优化(续)垂直分解垂直分解什么

16、是垂直分解什么是垂直分解把关系模式把关系模式R的属性分解为若干子集合,形成若干子关的属性分解为若干子集合,形成若干子关系模式系模式垂直分解的适用范围垂直分解的适用范围取决于分解后取决于分解后R上的所有事务的总效率是否得到了提高上的所有事务的总效率是否得到了提高257.4 逻辑结构设计逻辑结构设计7.4.1 E-R图向关系模型的转换图向关系模型的转换7.4.2 数据模型的优化数据模型的优化7.4.3 设计用户子模式设计用户子模式267.4.3 设计用户子模式设计用户子模式v定义用户外模式时应该注重的问题定义用户外模式时应该注重的问题 包括三个方面:包括三个方面: (1) 使用更符合用户习惯的别名

17、;使用更符合用户习惯的别名; (2) 针对不同级别的用户定义不同的针对不同级别的用户定义不同的View ,以满足系统对安全性的要求;,以满足系统对安全性的要求; (3) 简化用户对系统的使用简化用户对系统的使用27设计用户子模式(续)设计用户子模式(续)例 关系模式产品(产品号,产品名,规格,单价,生产车间,关系模式产品(产品号,产品名,规格,单价,生产车间,生产负责人,产品成本,产品合格率,质量等级),可以在生产负责人,产品成本,产品合格率,质量等级),可以在产品关系上建立两个视图:产品关系上建立两个视图: 为一般顾客建立视图:为一般顾客建立视图: 产品产品1(产品号,产品名,规格,单价)(

18、产品号,产品名,规格,单价) 为产品销售部门建立视图:为产品销售部门建立视图: 产品产品2(产品号,产品名,规格,单价,车间,生产负责人)(产品号,产品名,规格,单价,车间,生产负责人)顾客视图中只包含允许顾客查询的属性顾客视图中只包含允许顾客查询的属性销售部门视图中只包含允许销售部门查询的属性销售部门视图中只包含允许销售部门查询的属性生产领导部门则可以查询全部产品数据生产领导部门则可以查询全部产品数据可以防止用户非法访问不允许他们查询的数据,保证系可以防止用户非法访问不允许他们查询的数据,保证系统的安全性统的安全性28逻辑结构设计小结逻辑结构设计小结v任务任务将概念结构转化为具体的数据模型将

19、概念结构转化为具体的数据模型v逻辑结构设计的步骤逻辑结构设计的步骤将概念结构转化为一般的关系、网状、层次模型将概念结构转化为一般的关系、网状、层次模型将转化来的关系、网状、层次模型向特定将转化来的关系、网状、层次模型向特定DBMS支支持下的数据模型转换持下的数据模型转换对数据模型进行优化对数据模型进行优化设计用户子模式设计用户子模式29逻辑结构设计小结逻辑结构设计小结vE-R图向关系模型的转换内容图向关系模型的转换内容vE-R图向关系模型的转换原则图向关系模型的转换原则30逻辑结构设计小结逻辑结构设计小结优化数据模型的方法优化数据模型的方法 1. 确定数据依赖确定数据依赖 2. 对于各个关系模

20、式之间的数据依赖进行极小化对于各个关系模式之间的数据依赖进行极小化处理,消除冗余的联系。处理,消除冗余的联系。 3. 确定各关系模式分别属于第几范式。确定各关系模式分别属于第几范式。 4. 分析对于应用环境这些模式是否合适,确定是分析对于应用环境这些模式是否合适,确定是否要对它们进行合并或分解。否要对它们进行合并或分解。 5. 对关系模式进行必要的分解或合并对关系模式进行必要的分解或合并31逻辑结构设计小结逻辑结构设计小结v设计用户子模式设计用户子模式 1. 使用更符合用户习惯的别名使用更符合用户习惯的别名 2. 针对不同级别的用户定义不同的外模式,以满针对不同级别的用户定义不同的外模式,以满

21、足系统对安全性的要求。足系统对安全性的要求。 3. 简化用户对系统的使用简化用户对系统的使用32第七章第七章 数据库设计数据库设计7.1 数据库设计概述数据库设计概述7.2 需求分析需求分析7.3 概念结构设计概念结构设计7.4 逻辑结构设计逻辑结构设计7.5 数据库的物理设计数据库的物理设计7.6 数据库的实施和维护数据库的实施和维护7.7 小结小结337.5 数据库的物理设计数据库的物理设计v数据库的物理设计数据库的物理设计数据库在物理设备上的存储结构与存取方法称为数据库在物理设备上的存储结构与存取方法称为数据库的物理结构,它依赖于选定的数据库管理数据库的物理结构,它依赖于选定的数据库管理

22、系统系统为一个给定的逻辑数据模型选取一个最适合应用为一个给定的逻辑数据模型选取一个最适合应用环境的物理结构的过程,就是数据库的物理设计环境的物理结构的过程,就是数据库的物理设计34数据库的物理设计数据库的物理设计(续续)v数据库物理设计的步骤数据库物理设计的步骤确定数据库的物理结构,在关系数据库中主要指存确定数据库的物理结构,在关系数据库中主要指存取方法和存储结构取方法和存储结构 对物理结构进行评价,评价的重点是时间和空间效对物理结构进行评价,评价的重点是时间和空间效率率 如果评价结果满足原设计要求,则可进入到物理实如果评价结果满足原设计要求,则可进入到物理实施阶段,否则,就需要重新设计或修改

23、物理结构,施阶段,否则,就需要重新设计或修改物理结构,有时甚至要返回逻辑设计阶段修改数据模型有时甚至要返回逻辑设计阶段修改数据模型35数据库的物理设计数据库的物理设计(续续)数据库物理设计数据库物理设计确定数确定数据库的据库的物理结物理结构构评价数据评价数据库的物理库的物理结构结构逻辑结逻辑结构设计构设计数据库数据库实施实施物理物理模型模型逻辑逻辑模型模型367.5 数据库的物理设计数据库的物理设计7.5.1 数据库物理设计的内容和方法数据库物理设计的内容和方法7.5.2 关系模式存取方法选择关系模式存取方法选择7.5.3 确定数据库的存储结构确定数据库的存储结构7.5.4 评价物理结构评价物

24、理结构377.5.1 数据库物理设计的内容和方法数据库物理设计的内容和方法v设计物理数据库结构的准备工作设计物理数据库结构的准备工作对要运行的事务进行详细分析,获得选择物理数对要运行的事务进行详细分析,获得选择物理数据库设计所需参数据库设计所需参数充分了解所用充分了解所用RDBMS的内部特征,特别是系统的内部特征,特别是系统提供的存取方法和存储结构提供的存取方法和存储结构38数据库的物理设计的内容和方法(续)数据库的物理设计的内容和方法(续)v选择物理数据库设计所需参数选择物理数据库设计所需参数 数据库查询事务数据库查询事务查询的关系查询的关系 查询条件所涉及的属性查询条件所涉及的属性 连接条

25、件所涉及的属性连接条件所涉及的属性 查询的投影属性查询的投影属性 39数据库的物理设计的内容和方法(续)数据库的物理设计的内容和方法(续)v选择物理数据库设计所需参数选择物理数据库设计所需参数(续续)数据更新事务数据更新事务被更新的关系被更新的关系每个关系上的更新操作条件所涉及的属性每个关系上的更新操作条件所涉及的属性 修改操作要改变的属性值修改操作要改变的属性值 每个事务在各关系上运行的频率和性能要求每个事务在各关系上运行的频率和性能要求40数据库的物理设计的内容和方法(续)数据库的物理设计的内容和方法(续)v关系数据库物理设计的内容关系数据库物理设计的内容为关系模式选择为关系模式选择存取方

26、法存取方法(建立存取路径建立存取路径) 设计关系、索引等数据库文件的设计关系、索引等数据库文件的物理存储结构物理存储结构417.5 数据库的物理设计数据库的物理设计7.5.1 数据库物理设计的内容和方法数据库物理设计的内容和方法7.5.2 关系模式存取方法选择关系模式存取方法选择7.5.3 确定数据库的存储结构确定数据库的存储结构7.5.4 评价物理结构评价物理结构427.5.2 关系模式存取方法选择关系模式存取方法选择v数据库系统是多用户共享的系统,对同一个关系要数据库系统是多用户共享的系统,对同一个关系要建立建立多条存取路径多条存取路径才能满足多用户的多种应用要求才能满足多用户的多种应用要

27、求v物理设计的任务之一就是要确定选择哪些存取方法,物理设计的任务之一就是要确定选择哪些存取方法,即即建立哪些存取路径建立哪些存取路径43关系模式存取方法选择(续)关系模式存取方法选择(续)vDBMS常用存取方法常用存取方法索引方法索引方法目前主要是目前主要是B+树索引方法树索引方法经典存取方法,使用最普遍经典存取方法,使用最普遍 聚簇(聚簇(Cluster)方法)方法HASH方法方法44B-树的概念树的概念B-B-树是一种树是一种多路平衡查找树多路平衡查找树,在文件系统中很常用。,在文件系统中很常用。m m 阶阶B-B-树的概念:或者是空树,或者是满足以下条件的树的概念:或者是空树,或者是满足

28、以下条件的m m叉树:叉树:1 1)树中每个结点至多有)树中每个结点至多有 m m 棵子树;棵子树;2 2)若根结点不是叶结点,则至少有两棵子树;)若根结点不是叶结点,则至少有两棵子树;3 3)除根结点外的所有非终端结点至少有)除根结点外的所有非终端结点至少有m/2m/2棵子树;棵子树;4 4)所有非终端结点都包含下列信息数据:)所有非终端结点都包含下列信息数据: ( n,A0,K1,A2,K2,Kn,An),K( n,A0,K1,A2,K2,Kn,An),Ki 为关键字,为关键字, A Ai 为指针为指针 5 5)所有叶结点都出现在同一层次上,且不带信息;)所有叶结点都出现在同一层次上,且不

29、带信息;查找过程:顺指针找结点、在结点关键字内查找查找过程:顺指针找结点、在结点关键字内查找 交叉进行交叉进行。供参考45 3 12 15 22 2 2 7 2 35 41 3 53 54 63 4 68 69 71 76 3 79 84 93 2 11 30 2 66 78 1 51 一棵一棵5阶阶B-树树46B-树的用途树的用途当内存中不可能容纳所有记录时,当内存中不可能容纳所有记录时,B-B-树通常作为外存树通常作为外存文件的索引结构被保存在外存上。文件的索引结构被保存在外存上。B-B-树及其所有记录的存储树及其所有记录的存储结构可以根据需要按以下形式灵活组织:结构可以根据需要按以下形式

30、灵活组织:(1 1)B-B-树的每一个非叶结点是外存读取单位(页树的每一个非叶结点是外存读取单位(页/ /块)存储块)存储在外存上。在对在外存上。在对B-B-树操作期间,首先读入根结点,使其常住树操作期间,首先读入根结点,使其常住内存;操作过程中,读取其他需要的结点。内存;操作过程中,读取其他需要的结点。(2 2)每个记录的所有信息可以与关键字一起存储,则查到)每个记录的所有信息可以与关键字一起存储,则查到关键字即可获取记录的完整信息;也可以采取将记录的外存关键字即可获取记录的完整信息;也可以采取将记录的外存地址(页指针)与关键字一起存储,则查到关键字时,还需地址(页指针)与关键字一起存储,则

31、查到关键字时,还需根据该页指针访问外存。根据该页指针访问外存。供参考47B+树的概念树的概念B+B+树是树是B-B-树的变型树。树的变型树。m m阶阶B+B+树与树与B-B-树的区别:树的区别:1 1)有)有 n n 棵子树的结点中含有棵子树的结点中含有n n个关键字;个关键字;2 2)所有叶结点中包含了全部关键字的信息,以及指向这些关)所有叶结点中包含了全部关键字的信息,以及指向这些关键字记录的指针,且叶结点本身依关键字的大小以升序顺序键字记录的指针,且叶结点本身依关键字的大小以升序顺序链接;链接;3 3)所有的非终端结点可以看成是索引部分,结点中仅含有子)所有的非终端结点可以看成是索引部分

32、,结点中仅含有子树中的最大(或最小)关键字。树中的最大(或最小)关键字。B+B+树有树有两个头指针两个头指针:从根开始从根开始随机查找随机查找,从叶结点开始,从叶结点开始顺序查找顺序查找。不管查找成功与否,每次查找都是从根到叶结点不管查找成功与否,每次查找都是从根到叶结点,非,非终端结点上的关键字等于给定值也不终止。终端结点上的关键字等于给定值也不终止。供参考48 33 18 23 48 10 12 15 18 19 20 21 22 23 30 31 33 45 47 48 50 52 一棵一棵4阶的阶的B+树树 49一、索引存取方法的选择一、索引存取方法的选择v根据应用要求确定根据应用要求

33、确定 对哪些属性列建立索引对哪些属性列建立索引 对哪些属性列建立组合索引对哪些属性列建立组合索引 对哪些索引要设计为唯一索引对哪些索引要设计为唯一索引50索引存取方法的选择(续)索引存取方法的选择(续)v选择索引存取方法的一般规则选择索引存取方法的一般规则如果一个如果一个(或一组或一组)属性经常在查询条件中出现,则考虑在这个属性经常在查询条件中出现,则考虑在这个(或这组或这组)属性上建立索引属性上建立索引(或组合索引或组合索引)如果一个属性经常作为最大值和最小值等聚集函数的参数,则如果一个属性经常作为最大值和最小值等聚集函数的参数,则考虑在这个属性上建立索引考虑在这个属性上建立索引如果一个如果

34、一个(或一组或一组)属性经常在连接操作的连接条件中出现,则考属性经常在连接操作的连接条件中出现,则考虑在这个虑在这个(或这组或这组)属性上建立索引属性上建立索引v关系上定义的索引数过多会带来较多的额外开销关系上定义的索引数过多会带来较多的额外开销 维护索引的开销维护索引的开销 查找索引的开销查找索引的开销51二、聚簇存取方法的选择二、聚簇存取方法的选择v聚簇聚簇为了提高某个属性(或属性组)的查询速度,把这为了提高某个属性(或属性组)的查询速度,把这个或这些属性(称为聚簇码)上个或这些属性(称为聚簇码)上具有相同值的元组具有相同值的元组集中存放在连续的物理集中存放在连续的物理块称为聚簇块称为聚簇

35、52聚簇存取方法的选择(续)聚簇存取方法的选择(续)v聚簇的用途聚簇的用途1. 大大提高按聚簇码进行查询的效率大大提高按聚簇码进行查询的效率 例:假设学生关系按所在系建有索引,现在要查询例:假设学生关系按所在系建有索引,现在要查询信息系的所有学生名单。信息系的所有学生名单。信息系的信息系的500名学生分布在名学生分布在500个不同的物理块上时,个不同的物理块上时,至少要执行至少要执行500次次I/O操作操作如果将同一系的学生元组集中存放,则每读一个物理如果将同一系的学生元组集中存放,则每读一个物理块可得到多个满足查询条件的元组,从而显著地减少块可得到多个满足查询条件的元组,从而显著地减少了访问

36、磁盘的次数了访问磁盘的次数53聚簇存取方法的选择(续)聚簇存取方法的选择(续)2. 节省存储空间节省存储空间聚簇以后,聚簇码相同的元组集中在一起了,因而聚聚簇以后,聚簇码相同的元组集中在一起了,因而聚簇码值不必在每个元组中重复存储,只要在一组中存簇码值不必在每个元组中重复存储,只要在一组中存一次就行了一次就行了54聚簇存取方法的选择(续)聚簇存取方法的选择(续)v聚簇的局限性聚簇的局限性1. 聚簇只能提高某些特定应用的性能聚簇只能提高某些特定应用的性能2. 建立与维护聚簇的开销相当大建立与维护聚簇的开销相当大对已有关系建立聚簇,将导致关系中元组移动其物理对已有关系建立聚簇,将导致关系中元组移动

37、其物理存储位置,并使此关系上原有的索引无效,必须重建存储位置,并使此关系上原有的索引无效,必须重建当一个元组的聚簇码改变时,该元组的存储位置也要当一个元组的聚簇码改变时,该元组的存储位置也要做相应移动做相应移动55聚簇存取方法的选择(续)聚簇存取方法的选择(续)v聚簇的适用范围聚簇的适用范围1. 既适用于单个关系独立聚簇,也适用于多个既适用于单个关系独立聚簇,也适用于多个关系组合聚簇关系组合聚簇例:假设用户经常要按系别查询学生成绩单,这一例:假设用户经常要按系别查询学生成绩单,这一查询涉及学生关系和选修关系的连接操作,即需要查询涉及学生关系和选修关系的连接操作,即需要按学号连接这两个关系,为提

38、高连接操作的效率,按学号连接这两个关系,为提高连接操作的效率,可以把具有相同学号值的学生元组和选修元组在物可以把具有相同学号值的学生元组和选修元组在物理上聚簇在一起。这就相当于把多个关系按理上聚簇在一起。这就相当于把多个关系按“预连预连接接”的形式存放,从而大大提高连接操作的效率。的形式存放,从而大大提高连接操作的效率。56聚簇存取方法的选择(续)聚簇存取方法的选择(续)2. 当通过聚簇码进行访问或连接是该关系的主要当通过聚簇码进行访问或连接是该关系的主要应用,与聚簇码无关的其他访问很少或者是次要应用,与聚簇码无关的其他访问很少或者是次要的时,可以使用聚簇。的时,可以使用聚簇。尤其当尤其当SQ

39、L语句中包含有与聚簇码有关的语句中包含有与聚簇码有关的ORDER BY,GROUP BY,UNION,DISTINCT等子句或短语时,使等子句或短语时,使用聚簇特别有利,可以省去对结果集的排序操作用聚簇特别有利,可以省去对结果集的排序操作57聚簇存取方法的选择(续)聚簇存取方法的选择(续)v设计候选聚簇设计候选聚簇对经常在一起进行连接操作的关系可以建立聚簇对经常在一起进行连接操作的关系可以建立聚簇如果一个关系的一组属性经常出现在相等比较条件如果一个关系的一组属性经常出现在相等比较条件中,则该单个关系可建立聚簇中,则该单个关系可建立聚簇如果一个关系的一个如果一个关系的一个(或一组或一组)属性上的

40、值属性上的值重复率重复率很高,很高,则此单个关系可建立聚簇。即对应每个聚簇码值的则此单个关系可建立聚簇。即对应每个聚簇码值的平均元组数不太少。太少了,聚簇的效果不明显平均元组数不太少。太少了,聚簇的效果不明显58聚簇存取方法的选择(续)聚簇存取方法的选择(续)v优化聚簇设计优化聚簇设计从聚簇中删除经常进行全表扫描的关系;从聚簇中删除经常进行全表扫描的关系;从聚簇中删除更新操作远多于连接操作的关系;从聚簇中删除更新操作远多于连接操作的关系;不同的聚簇中可能包含相同的关系,一个关系可不同的聚簇中可能包含相同的关系,一个关系可以在某一个聚簇中,但不能同时加入多个聚簇以在某一个聚簇中,但不能同时加入多

41、个聚簇 从这多个聚簇方案从这多个聚簇方案(包括不建立聚簇包括不建立聚簇)中选择一个较优的,即中选择一个较优的,即在这个聚簇上运行各种事务的总代价最小在这个聚簇上运行各种事务的总代价最小59三、三、HASH存取方法的选择存取方法的选择v选择选择HASH存取方法的规则存取方法的规则当一个关系满足下列两个条件时,可以选择当一个关系满足下列两个条件时,可以选择HASH存取方法存取方法该关系的属性主要出现在该关系的属性主要出现在等值连接等值连接条件中或主要出条件中或主要出现在现在相等比较相等比较选择条件中选择条件中该关系的大小可预知,而且不变;该关系的大小可预知,而且不变; 或或 该关系的大小动态改变,

42、但所选用的该关系的大小动态改变,但所选用的DBMS提供了动提供了动态态HASH存取方法存取方法607.5 数据库的物理设计数据库的物理设计7.5.1 数据库物理设计的内容和方法数据库物理设计的内容和方法7.5.2 关系模式存取方法选择关系模式存取方法选择7.5.3 确定数据库的存储结构确定数据库的存储结构7.5.4 评价物理结构评价物理结构617.5.3 确定数据库的存储结构确定数据库的存储结构v确定数据库物理结构的内容确定数据库物理结构的内容1. 确定数据的存放位置和存储结构确定数据的存放位置和存储结构 关系关系 索引索引 聚簇聚簇 日志日志 备份备份2. 确定系统配置确定系统配置621.

43、确定数据的存放位置确定数据的存放位置v确定数据存放位置和存储结构的因素确定数据存放位置和存储结构的因素存取存取时间时间存储存储空间空间利用率利用率维护代价维护代价 这三个方面常常是相互矛盾的这三个方面常常是相互矛盾的 例:消除一切冗余数据虽能够节约存储空间和例:消除一切冗余数据虽能够节约存储空间和减少维护代价,但往往会导致检索代价的增加减少维护代价,但往往会导致检索代价的增加 必须进行权衡,选择一个必须进行权衡,选择一个折中折中方案方案63确定数据的存放位置(续)确定数据的存放位置(续)v基本原则基本原则根据应用情况将根据应用情况将易变易变部分与部分与稳定稳定部分分开存放部分分开存放存取频率较

44、高存取频率较高部分与部分与存取频率较低存取频率较低部分,分开存放部分,分开存放64确定数据的存放位置(续)确定数据的存放位置(续)例:例:数据库数据备份、日志文件备份等由于只在故数据库数据备份、日志文件备份等由于只在故障恢复时才使用,而且数据量很大,可以考虑障恢复时才使用,而且数据量很大,可以考虑存放在磁带上存放在磁带上如果计算机有多个磁盘或磁盘阵列如果计算机有多个磁盘或磁盘阵列 ,可以考,可以考虑将表和索引分别放在不同的磁盘上,在查询虑将表和索引分别放在不同的磁盘上,在查询时,由于磁盘驱动器并行工作,可以提高物理时,由于磁盘驱动器并行工作,可以提高物理I/O读写的效率读写的效率 65确定数据

45、的存放位置(续)确定数据的存放位置(续)例(续):例(续):可以将比较大的表分别放在两个磁盘上,可以将比较大的表分别放在两个磁盘上,以加快存取速度,这在多用户环境下特别以加快存取速度,这在多用户环境下特别有效有效可以将日志文件与数据库对象(表、索引可以将日志文件与数据库对象(表、索引等)放在不同的磁盘以改进系统的性能等)放在不同的磁盘以改进系统的性能662. 确定系统配置确定系统配置vDBMS产品一般都提供了一些存储分配参数产品一般都提供了一些存储分配参数 同时使用数据库的用户数同时使用数据库的用户数 同时打开的数据库对象数同时打开的数据库对象数 内存分配参数内存分配参数 使用的缓冲区长度、个

46、数使用的缓冲区长度、个数 存储分配参数存储分配参数 .677.5 数据库的物理设计数据库的物理设计7.5.1 数据库物理设计的内容和方法数据库物理设计的内容和方法7.5.2 关系模式存取方法选择关系模式存取方法选择7.5.3 确定数据库的存储结构确定数据库的存储结构7.5.4 评价物理结构评价物理结构687.5.4 评价物理结构评价物理结构v评价内容评价内容对数据库物理设计过程中产生的多种方案进行细对数据库物理设计过程中产生的多种方案进行细致的评价,从中选择一个较优的方案作为数据库致的评价,从中选择一个较优的方案作为数据库的物理结构的物理结构69评价物理结构评价物理结构(续续)v评价方法(完全

47、依赖于所选用的评价方法(完全依赖于所选用的DBMS )定量估算各种方案定量估算各种方案 存储空间存储空间 存取时间存取时间 维护代价维护代价对估算结果进行权衡、比较,选择出一个较优对估算结果进行权衡、比较,选择出一个较优的合理的物理结构的合理的物理结构如果该结构不符合用户需求,则需要修改设计如果该结构不符合用户需求,则需要修改设计70第七章第七章 数据库设计数据库设计7.1 数据库设计概述数据库设计概述7.2 需求分析需求分析7.3 概念结构设计概念结构设计7.4 逻辑结构设计逻辑结构设计7.5 数据库的物理设计数据库的物理设计7.6 数据库的实施和维护数据库的实施和维护7.7 小结小结717

48、.6数据库实施和维护数据库实施和维护7.6.1 数据的载入和应用程序的调试数据的载入和应用程序的调试7.6.2 数据库的试运行数据库的试运行 7.6.3 数据库的运行和维护数据库的运行和维护 727.6.1 数据的载入和应用程序的数据的载入和应用程序的调试调试v 数据的载入数据的载入 v 应用程序的编码和调试应用程序的编码和调试73 数据的载入数据的载入 v数据库结构建立好后,就可以向数据库中装载数据数据库结构建立好后,就可以向数据库中装载数据了。组织数据入库是数据库实施阶段最主要的工作。了。组织数据入库是数据库实施阶段最主要的工作。v数据装载方法数据装载方法人工方法人工方法计算机辅助数据入库

49、计算机辅助数据入库74应用程序的编码和调试应用程序的编码和调试v数据库应用程序的设计应该与数据设计并数据库应用程序的设计应该与数据设计并行进行行进行v在组织数据入库的同时还要调试应用程序在组织数据入库的同时还要调试应用程序 757.6数据库实施和维护数据库实施和维护7.6.1 数据的载入和应用程序的调试数据的载入和应用程序的调试7.6.2 数据库的试运行数据库的试运行 7.6.3 数据库的运行和维护数据库的运行和维护 767.6.2 数据库的试运行数据库的试运行v在原有系统的数据有一小部分已输入数据库后,就可以在原有系统的数据有一小部分已输入数据库后,就可以开始对数据库系统进行联合调试,称为数

50、据库的试运行开始对数据库系统进行联合调试,称为数据库的试运行 v数据库试运行主要工作包括:数据库试运行主要工作包括:1)功能测试功能测试实际运行数据库应用程序,执行对数据库的各种操作,测实际运行数据库应用程序,执行对数据库的各种操作,测试应用程序的功能是否满足设计要求试应用程序的功能是否满足设计要求 如果不满足,对应用程序部分则要修改、调整,直到达到如果不满足,对应用程序部分则要修改、调整,直到达到设计要求设计要求2)性能测试性能测试测量系统的性能指标,分析是否达到设计目标测量系统的性能指标,分析是否达到设计目标如果测试的结果与设计目标不符,则要返回物理设计阶段,如果测试的结果与设计目标不符,

51、则要返回物理设计阶段,重新调整物理结构,修改系统参数,某些情况下甚至要返重新调整物理结构,修改系统参数,某些情况下甚至要返回逻辑设计阶段,修改逻辑结构回逻辑设计阶段,修改逻辑结构 77数据库的试运行(续)数据库的试运行(续)强调两点:强调两点:v分期分批组织数据入库分期分批组织数据入库 重新设计物理结构甚至逻辑结构,会导致数据重新设计物理结构甚至逻辑结构,会导致数据重新入库。重新入库。由于数据入库工作量实在太大,费时、费力,由于数据入库工作量实在太大,费时、费力,所以应分期分批地组织数据入库所以应分期分批地组织数据入库先输入小批量数据供调试用先输入小批量数据供调试用待试运行基本合格后再大批量输

52、入数据待试运行基本合格后再大批量输入数据逐步增加数据量,逐步完成运行评价逐步增加数据量,逐步完成运行评价78数据库的试运行(续)数据库的试运行(续)v数据库的转储和恢复数据库的转储和恢复在数据库试运行阶段,系统还不稳定,硬、软件在数据库试运行阶段,系统还不稳定,硬、软件故障随时都可能发生故障随时都可能发生系统的操作人员对新系统还不熟悉,误操作也不系统的操作人员对新系统还不熟悉,误操作也不可避免可避免因此必须做好数据库的转储和恢复工作,尽量减因此必须做好数据库的转储和恢复工作,尽量减少对数据库的破坏。少对数据库的破坏。797.6数据库实施和维护数据库实施和维护7.6.1 数据的载入和应用程序的调

53、试数据的载入和应用程序的调试7.6.2 数据库的试运行数据库的试运行 7.6.3 数据库的运行和维护数据库的运行和维护 807.6.3 数据库的运行与维护数据库的运行与维护v数据库试运行合格后,数据库即可投入正式运行。数据库试运行合格后,数据库即可投入正式运行。v数据库投入运行标志着开发任务的基本完成和维护数据库投入运行标志着开发任务的基本完成和维护工作的开始工作的开始v对数据库设计进行评价、调整、修改等维护工作是对数据库设计进行评价、调整、修改等维护工作是一个长期的任务,也是设计工作的继续和提高。一个长期的任务,也是设计工作的继续和提高。应用环境在不断变化应用环境在不断变化数据库运行过程中物理存储会不断变化数据库运行过程中物理存储会不断变化81数据库的运行与维护(续)数据库的运行与维护(续)v在数据库运行阶段,对数据库经常性的维在数据库运行阶段,对数据库经常性的维护工作主要是由护工作主要是由DBA完成的,包括:完成的,包括: v数据库的转储和恢复数据库的转储和恢复v数据库的安全性、完整性控制数据库的安全性、完整性控制v数据库性能的监督、分析和改进数据库性能的监督、分析和改进1.数据库的重组织和重构造数据库的重组织和重构造82数据库的运行与维护(续)数据库的运行与维护(续)v数据库的重组织和重构造数据库的重组织和重构造重组织的形式重组织的形式全部重组织全部重组织部

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论