版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、1,第五章 关系数据库规范化理论,2,5.1 关系规范化的必要性 5.2 函数依赖 5.3 范式 5.4 关系模式的规范化,第五章 关系数据库规范化理论,3,一、关系数据库逻辑设计问题 二、规范化理论研究的内容,5.1 关系规范化的必要性,4,关系数据库逻辑设计问题 构造几个关系模式? 每个关系由哪些属性组成? 例:教学管理系统,需要存储下列信息 学号,姓名,系名,系主任名,课程名,成绩 Sno, Sname, Sdept, Mname, Cname, Score 设计一个关系模式: SLC=Sno,Sname,Sdept,Mname,Cname,Score,一、关系数据库逻辑设计问题(1 o
2、f 6),5,SLC中的样本数据,一、关系数据库逻辑设计问题(2 of 6),6,该关系模式存在四个主要问题: 数据冗余度大 插入异常 删除异常 更新异常 解决方法: 将该关系模式分解为三个,一、关系数据库逻辑设计问题(3 of 6),D,SC,S,7,则在以上三个关系模式中,实现了信息的某种程度的分离: S中存储学生基本信息,与所选课程及系主任无关; D中存储系的有关信息,与学生无关; SC中存储学生选课的信息,而与学生及系的有关信息无关。,一、关系数据库逻辑设计问题(4 of 6),8,与SLC相比,分解为三个关系模式后,数据的冗余度明显降低。 学生选课信息存储在关系SC中,选课的行为不会
3、影响系名、系主任名的存储次数,不存在上文所分析的数据冗余问题; 若某个系尚未招生,仍可以在关系中添加系名和系主任名,这就避免了插入异常; 当一个系的学生全部毕业时,只需在S中删除该系的全部学生记录,而关系D中有关该系的信息仍然保留,从而不会引起删除异常; 同时,由于数据冗余度的降低,数据没有重复存储,也不会引起更新异常。,一、关系数据库逻辑设计问题(5 of 6),9,从而得出结论,一个好的关系模式应该具备以下四个条件: 尽可能少的数据冗余; 没有插入异常; 没有删除异常; 没有更新异常。,一、关系数据库逻辑设计问题(6 of 6),10,关系数据库的规范化理论主要包括三个方面的内容: 函数依
4、赖 范式 模式设计 其中,函数依赖起着核心的作用,是模式分解和模式设计的基础,范式是模式分解的标准。,二、规范化理论研究的内容,11,一、数据依赖 二、函数依赖 三、键的形式化定义 四、候选键的求解理论和算法,5.2 函数依赖,12,关系模式回顾 一个关系模式可写成一个五元组 : R(U, D, DOM, F) 其中 R: 关系名, U: 属性组,D:属性域, DOM: 属性到域的映射。 F: 数据依赖集(属性间) 为简化起见,把关系模式看作一个三元组: R(U, F) 仅当定义在U上的集合r满足F时,r才称为关系模式R的一个关系。,一、数据依赖(1 of 2),13,数据依赖 数据依赖:是通
5、过一个关系中属性间值的相等与否体现出来的数据间的相互关系 数据依赖是现实世界属性间相互联系的抽象,是数据内在的性质 数据依赖是语义的体现 数据依赖共有三种: 函数依赖(Functional Dependency,FD) 多值依赖(Multivalued Dependency,MVD) 连接依赖(Join Dependency,JD),一、数据依赖(2 of 2),14,函数依赖定义: 设R(U)是一个关系模式,U是R的属性集合(如U=A1,An。X,Y为U的子集。如果R(U)的的所有关系r 都存在着:X的每一个值,都有Y的唯一值与之相对应,则称: X函数决定Y,或Y函数依赖X。记作XY。 否则
6、,记作XY称为X不能函数决定Y。 XY可理解为: X有一个值,则Y有唯一的值与之相对应;而Y的一个值是否与唯一的X值对应,不去管。,二、函数依赖(1 of 2),15,二、函数依赖(2 of 2),16,候选键和主键 设K是关系模式R(U,F)中的属性或属性组。若K f U,则K为R的候选键(Candidate Key) 若候选键多于一个,则选其中的一个为主键(Primary Key) 外键: 设有两个关系R和S,X是R的属性或属性组,并且X不是R的键,但X是S的键(或与S的键意义相同),则称X是R的外部键(Foreign Key),简称外键或外码。,三、键的形式化定义(1 of 2),17,
7、闭包(Closure) 对于给定关系模式R(U,F),F的闭包是由F所逻辑蕴涵的所有函数依赖的集合,记为F +。 例如,从F=A B,B C中可以推导出A C,所以A C是F +中的成员。 由F所逻辑蕴涵的函数依赖可以由下面的公理系统(称为Armstrong公理系统)推导出来: 自反律 若Y X,则X Y; 增广律 若X Y ,则XZ YZ ; 传递律 若X Y , Y Z ,则X Z 。 其中,假设X,Y,Z都是关系R的属性集U的子集。,三、键的形式化定义(2 of 2),18,对于给定的关系模式R(U)和函数依赖集F,可将其属性分为4类: L类 仅出现在的函数依赖左部的属性。 R类 仅出现
8、在的函数依赖右部的属性。 N类 在的函数依赖左右两边均未出现的属性。 LR类 在的函数依赖左右两边均出现的属性。,四、候选键的求解理论和算法 (1 of 3),19,四、候选键的求解理论和算法 (2 of 3),定理5.1 对于给定的关系模式R(U)及其函数依赖集F,若X(X R)是L类属性,则X必为R的任一侯选键的成员。 推论5.1 对于给定的关系模式R(U)及其函数依赖集F,若X(X R)是L类属性,且X+包含了R的全部属性,则X必为R的的惟一侯选键 。,20,四、候选键的求解理论和算法 (3 of 3),定理5.2 对于给定的关系模式R(U)及其函数依赖集F,若X(X R)是R类属性,则
9、X不在任何侯选键中。 定理5.3 对于给定的关系模式R(U)及其函数依赖集F,若X(X R)是N类属性,则X必为R的任一侯选键的成员。 推论5.2 对于给定的关系模式R(U)及其函数依赖集F,若X是N类和L类组成的属性集,且X+包含了R的全部属性,则X必为R的的惟一侯选键 。,21,一、范式定义 二、第一范式(1NF) 三、第二范式(2NF) 四、第三范式(3NF) 五、改进的3NF(BCNF) 六、多值依赖与第四范式(4NF),5.3 范式,22,范式定义 范式(NF)是符合某一种级别的关系模式的集合。 5NF4NFBCNF3NF2NF1NF 若R(U,F)符合x范式的要求,则称R为x范式,
10、记作:RxNF,一、范式定义,23,第一范式(1NF) 如果一个关系模式R的所有属性都是不可分的基本数据项,则 R 1NF 不满足1NF的数据库模式不能称为关系数据库 满足1NF的数据库并一定是一个好的关系模式,二、第一范式(1NF) (1 of 2),24,SLC2 (Sno,Sdept,Sloc,Cname,Score) 1NF,但存在下列问题: 插入异常:若学生没有选课,键值未定,则他的个人信息、所在系的信息等就无法插入; 删除异常:若删除学生的选课信息,则有关他的个人信息及所在系的信息也随之删除了; 更新异常:如果某个学生转系,若他选修了门课,则需要修改条记录,如果有一条没有修改,就会
11、出现更新异常; 数据冗余大:如果一个学生选修了门课,则有关他的所在系、所在宿舍信息重复。,二、第一范式(1NF) (2 of 2),25,第二范式(2NF) 满足第一范式的关系模式R, 如果所有非主属性都完全依赖于键, 则称R属于第二范式。 记为R2NF。 例:将属于第一范式的SLC进行投影分解,消除其中的部分函数依赖,就可达到第二范式。 SC2(Sno, Cname, Score) 2NF SL2(Sno, Sdept, Sloc) 2NF,三、第二范式(2NF) (1 of 2),26,SL2(Sno,Sdept,Sloc) 2NF 但存在下列问题: 插入异常 删除异常 修改复杂 数据冗余
12、度大,三、第二范式(2NF) (2 of 2),27,第三范式(3NF) 若R2NF, 且它的任何一个非主属性都不传递依赖于键, 则称关系R满足第三范式。记为R3NF 将属于第二范式的SL2进行投影分解,消除其中的传递函数依赖, 就可达到第三范式。 SD2(Sno, Sdept) 3NF DL2(Sdept, Sloc) 3NF,四、第三范式(3NF),28,改进的3NF -BCNF(BoyeeCodd Normal Form) 设关系模式R(U,F)1NF,若XY且Y X时X必包含键,则称RBCNF。 推论:如果RBCNF,则: R中所有非主属性对每一个键都是完全函数依赖; R中所有主属性对
13、每一个不包含它的键,都是完全函数依赖; R中没有任何属性完全函数依赖于非键的任何一组属性。 定理:如果RBCNF,则R3NF一定成立。,五、改进的3NF(BCNF),29,Teaching(C,T,B)的二维表表示,六、多值依赖与第四范式(4NF) (1 of 6),30,TeachBCNF, 但仍存在下列问题: 数据冗余度大 增加操作复杂 删除操作复杂 修改操作复杂 原因: 关系模式Teaching中存在一种称为多值依赖数据依赖。,六、多值依赖与第四范式(4NF) (2 of 6),31,多值依赖 定义:设R(U)是属性集U上的一个关系模式,X,Y,Z是U的子集,且ZU-X-Y,多值依赖 X
14、Y成立当且仅当对R(U)的任一关系r,r在(X,Z)值上的每个值对应一组Y的值,这组Y的值仅仅决定于X值而与Z值无关。 称Y多值依赖于X,或X多值决定Y,记作:XY。 在关系模式Teaching中: 对于一个(C,B)值对应一组T值,而且这种对应与B的值无关,仅决定于C的值,即CT 。,六、多值依赖与第四范式(4NF) (3 of 6),32,多值依赖的性质 多值依赖具有对称性 即若XY,则XZ,其中ZUXY。 多值依赖的传递性 即若XY,YZ, 则XZY。 函数依赖可以看作是多值依赖的特殊情况。 即若XY,则XY。这是因为当XY时,对X的每一个值x,Y有一个确定的值y与之对应,所以XY。 若
15、XY,XZ,则XYZ 若XY,XZ,则XYZ 若XY, XZ, 则XYZ,XZY,六、多值依赖与第四范式(4NF) (4 of 6),33,多值依赖与函数依赖的区别: 多值依赖的有效性与属性集的范围有关。 XY在U上成立, 则在W(XYWU)上一定成立;反之则不然,即XY在W(WU)上成立,在U上并不一定成立。这是因为多值依赖的定义中不仅涉及属性组X和Y,而且涉及U中其余属性Z。 但是在关系模式R(U)中函数依赖XY的有效性仅决定于X,Y这两个属性集的值。 若函数依赖XY在R(U)上成立, 则对于任何YY均有XY成立。而多值依赖XY若在R(U)上成立, 我们却不能断言对于任何YY有XY成立。,
16、六、多值依赖与第四范式(4NF) (5 of 6),34,第四范式(4NF) 如果关系模式R1NF,对于R的每个非平凡的多值依赖XY(Y X),X含有键,则称R是第四范式,即R4NF 例: Teaching(C,T,B),其中(C,T,B)是一个键,有C T,而C不含键,所以Teach不是4NF 解决方法:分解为下列两个关系模式: CT(C,T)4NF CB(C,B)4NF,六、多值依赖与第四范式(4NF) (6 of 6),35,一、关系模式规范化的目的和基本思想 二、关系模式规范化的步骤 三、关系模式规范化的要求,5.4 关系模式的规范化,36,关系模式规范化的基本思想是逐步消除数据依赖中
17、不合适的部分,使模式中的各个关系模式达到某种程度的“分离”,即采用“一事一地”的模式设计原则,让一个关系描述一个概念、一个实体或实体间的一种联系。若多于一个概念就把它“分离”出去。因此,所谓规范化实质上是概念的单一化。,一、关系模式规范化的目的和基本思想,37,关系模式规范化的定义 从一个低一级的范式的关系模式,通过模式分解转换为若干个高一级范式的关系模式集合,这种过程就叫关系模式的规范化。 规范化的目的 解决关系模式中存在的数据冗余、插入和删除异常、更新繁琐等问题。 关系模式规范化的基本思想 逐步消除数据依赖中不合适的部分,使模式中的各个关系模式达到某种程度的“分离”,达到概念的单一化。,二、关系模式规范化的步骤(1 of 2),38,关系模式的规范化步骤,二、关系模式规范化的步骤(2 of 2),39,模式分解的定义 关系模式R的一个分解是指 = R1, R2, , Rn 其中U = U1UU2UUUn ,并且没有Ui Uj , 1i,j n, Fi是F在Ui上的投影。 模式分解的要求 分解前后的模式要等价 等价的标准常用的有: 分解要具有无损连接性 分解要保持函数依赖 分解既要保持函数依赖又要具有无损连接性,三、关系模式的分解(1 of 3),40,无损
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 数据分析与决策支持工具手册
- 市场部门新客户合作确认通知7篇
- 2026年道路运输企业主要负责人备考押题试卷(带答案)
- 河道工程巡查维护方案
- 2026年四川评标专家考试题库及答案解析
- 河道园林景观绿化工程绿化苗木种植施工方案
- 儿科院感爆发应急救援预案演练脚本
- 桥梁-旧桥改造施工组织设计方案
- 公路收费系统施工方案及技术措施
- 关于产房用药错误的应急预案演练脚本
- 家用电器-5个问题理清海信集团旗下家电业务
- 2026年中国中医科学院广安门医院医护人员招聘笔试参考试题及答案详解
- 广东省广州市广大附中教育集团2022-2023学年九年级上学期自主招生数学试题(含答案解析)
- 2026 春三年级语文下册期末必考知识点完整版
- 2026全球及中国金红石行业需求态势与前景动态预测报告
- 工程技术人员建筑工程助理工程师考试复习题库(附答案)
- 红色中国风《红楼梦》读书分享模板
- 科颜氏的行业分析报告
- 足球守门员培训
- 成人惊厥性癫痫持续状态诊治指南2026
- GB/T 34524-2025风能发电系统风力发电机组主轴
评论
0/150
提交评论