chp关系数据理论+-newPPT课件_第1页
chp关系数据理论+-newPPT课件_第2页
chp关系数据理论+-newPPT课件_第3页
chp关系数据理论+-newPPT课件_第4页
chp关系数据理论+-newPPT课件_第5页
已阅读5页,还剩240页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、 广东工业大学计算机学院广东工业大学计算机学院数据库系统概论数据库系统概论An Introduction to Database System第六章第六章 关系数据理论关系数据理论1/240第1页/共245页第六章第六章 关系数据理论关系数据理论6.1 问题的提出问题的提出6.2 规范化规范化6.3 数据依赖的公理系统数据依赖的公理系统*6.4 模式的分解模式的分解6.5 小结小结2/240第2页/共245页6.1 问题的提出问题的提出关系数据库逻辑设计 针对具体问题,如何构造一个适合于它的数据模式 数据库逻辑设计的工具关系数据库的规范化理论3/240第3页/共245页问题的提出问题的提出一、

2、概念回顾二、关系模式的形式化定义三、什么是数据依赖四、关系模式的简化定义五、数据依赖对关系模式影响4/240第4页/共245页一、概念回顾一、概念回顾 关系 关系模式 关系数据库 关系数据库的模式5/240第5页/共245页二、关系模式的形式化定义二、关系模式的形式化定义关系模式由五部分组成,即它是一个五元组: R(U, D, DOM, F)R: 关系名U: 组成该关系的属性名集合D: 属性组U中属性所来自的域DOM: 属性向域的映象集合F: 属性间数据的依赖关系集合6/240第6页/共245页三、什么是数据依赖三、什么是数据依赖1. 完整性约束的表现形式 限定属性取值范围:例如学生成绩必须在

3、0-100之间 定义属性值间的相互关连(主要体现于值的相等与否),这就是数据依赖,它是数据库模式设计的关键7/240第7页/共245页什么是数据依赖(续)什么是数据依赖(续)2. 数据依赖 一个关系内部属性与属性之间的约束关系 现实世界属性间相互联系的抽象 数据内在的性质 语义的体现8/240第8页/共245页什么是数据依赖(续)什么是数据依赖(续)3. 数据依赖的类型 函数依赖(Functional Dependency,简记为FD) 多值依赖(Multivalued Dependency,简记为MVD) 其他9/240第9页/共245页四、关系模式的简化表示四、关系模式的简化表示 关系模式

4、R(U, D, DOM, F) 简化为一个三元组: R(U, F) 当且仅当U上的一个关系r满足F时,r称为关系模式 R(U, F)的一个关系10/240第10页/共245页五、五、数据依赖对关系模式的影响数据依赖对关系模式的影响例1建立一个描述学校教务的数据库:学生的学号(Sno)、所在系(Sdept)系主任姓名(Mname)、课程名(Cname)成绩(Grade)单一的关系模式 : Student U Sno, Sdept, Mname, Cname, Grade 11/240第11页/共245页五、五、数据依赖对关系模式的影响数据依赖对关系模式的影响学校数据库的语义: 一个系有若干学生,

5、 一个学生只属于一个系; 一个系只有一名主任; 一个学生可以选修多门课程, 每门课程有若干学生选修; 每个学生所学的每门课程都有一个成绩。 12/240第12页/共245页数据依赖对关系模式的影响(续)数据依赖对关系模式的影响(续) 属性组U上的一组函数依赖F: F Sno Sdept, Sdept Mname, (Sno, Cname) Grade SnoCnameSdeptMnameGrade13/240第13页/共245页关系模式关系模式Student中存在的问题中存在的问题 数据冗余太大 浪费大量的存储空间 例:每一个系主任的姓名重复出现 更新异常(Update Anomalies)

6、数据冗余 ,更新数据时,维护数据完整性代价大。例:某系更换系主任后,系统必须修改与该系学生有关的每一个元组14/240第14页/共245页关系模式关系模式Student中存在的问题中存在的问题 插入异常(Insertion Anomalies) 该插的数据插不进去 例,如果一个系刚成立,尚无学生,我们就无法把这个系及其系主任的信息存入数据库。 删除异常(Deletion Anomalies) 不该删除的数据不得不删除例,如果某个系的学生全部毕业了, 我们在删除该系学生信息的同时,把这个系及其系主任的信息也丢掉了。15/240第15页/共245页数据依赖对关系模式的影响(续)数据依赖对关系模式的

7、影响(续)结论:nStudent关系模式不是一个好的模式。n“好”的模式:不会发生插入异常、删除异常、更新异常,数据冗余应尽可能少原因:由存在于模式中的某些数据依赖引起的解决方法:通过分解关系模式来消除其中不合适 的数据依赖16/240第16页/共245页分解关系模式分解关系模式 把这个单一模式分成3个关系模式: S(Sno,Sdept,Sno Sdept); SC(Sno,Cno,Grade,(Sno,Cno) Grade); DEPT(Sdept,Mname,Sdept Mname)17/240第17页/共245页六、关系数据库理论的内容六、关系数据库理论的内容关系数据库理论是关系数据库逻

8、辑设计的理论工具,涉及以下内容:1、数据依赖2、规范化 范式范式:规范化的关系模式称为范式 规范化程度规范化程度:关系模式按属性的数据依赖情况来区分它的规范化程度,分为若干级别,如第一范式、第二范式等18/240第18页/共245页六、关系数据库理论的内容六、关系数据库理论的内容2、规范化 模式分解模式分解:将一个低级范式的关系模式转换为若干个高一级的关系模式集合称为模式分解; 规范化规范化:模式分解的过程3、关系数据库理论的发展 19/240第19页/共245页第六章第六章 关系数据理论关系数据理论6.1 问题的提出问题的提出6.2 规范化规范化6.3 数据依赖的公理系统数据依赖的公理系统*

9、6.4 模式的分解模式的分解6.5 小结小结20/240第20页/共245页6.2 规范化规范化 规范化理论正是用来改造关系模式,通过分解关系模式来消除其中不合适的数据依赖,以解决插入异常、删除异常、更新异常和数据冗余问题。21/240第21页/共245页6.2 规范化规范化6.2.1 函数依赖函数依赖6.2.2 码码6.2.3 范式范式6.2.4 2NF6.2.5 3NF6.2.6 BCNF6.2.7 多值依赖多值依赖6.2.8 4NF6.2.9 规范化小结规范化小结22/240第22页/共245页6.2.1 函数依赖函数依赖 函数依赖 平凡函数依赖与非平凡函数依赖 完全函数依赖与部分函数依

10、赖 传递函数依赖23/240第23页/共245页一、函数依赖一、函数依赖定义定义 设R(U)是一个属性集U上的关系模式,X和Y是U的子集。 若对于R(U)的任意一个可能的关系r,r中不可能存在两个元组在X上的属性值相等, 而在Y上的属性值不等, 则称 “X函数确定Y” 或 “Y函数依赖于X”,记作XY。 X称为这个函数依赖的决定属性集(Determinant)。 Y=f(x) 24/240第24页/共245页说明说明 1. 函数依赖不是指关系模式R的某个或某些关系实例满足的约束条件,而是指R的所有关系实例均要满足的约束条件。2. 函数依赖是语义范畴的概念。只能根据数据的语义来确定函数依赖。 例

11、如“姓名年龄”这个函数依赖只有在不允许有同名人的条件下成立3. 数据库设计者可以对现实世界作强制的规定。例如规定不允许同名人出现,函数依赖“姓名年龄”成立。所插入的元组必须满足规定的函数依赖,若发现有同名人存在, 则拒绝装入该元组。25/240第25页/共245页说明:说明:2. 函数依赖是函数依赖是语义范畴语义范畴的概念。只能根据数的概念。只能根据数据的语义来确定函数依赖。据的语义来确定函数依赖。属性间的联系 因为函数依赖反映的是现实世界中属性的联系,同实体之间的联系。1、一对一联系 设A、B是某个关系模式的两个属性集。如果对于A的任意具体值,B中至多有一个值与之对应,且对于B的任意具体值,

12、 A中至多有一个值与之对应,则称A、B这两个属性集之间是一对一联系。26/240第26页/共245页2. 函数依赖是函数依赖是语义范畴语义范畴的概念。只能根据数据的语的概念。只能根据数据的语义来确定函数依赖义来确定函数依赖。2、一对多联系 设A、B是某个关系模式的两个属性集。如果对于A的任意具体值,B中至多有一个值与之对应,且对于B的任意具体值, A中有多个值与之对应,则称A、B这两个属性集之间是从B到A的一对多联系。3、多对多联系 设A、B是某个关系模式的两个属性集。如果对于A的任意具体值,B中有多个值与之对应,且对于B的任意具体值, A中有多个值与之对应,则称A、B这两个属性集之间是多对多

13、联系。27/240第27页/共245页2. 函数依赖是函数依赖是语义范畴语义范畴的概念。只能根据数据的语的概念。只能根据数据的语义来确定函数依赖。义来确定函数依赖。4、在一个关系模式中设有属性集X、Y, 如果 X和Y之间是一对一联系,则XY,且YX; 如果 X和Y之间是一对多联系,则YX; 如果 X和Y之间是多对多联系,则X和Y之间不存在函数依赖关系。28/240第28页/共245页举例举例(根据语义推出函数依赖根据语义推出函数依赖)例2: Student(Sno, Sname, Ssex, Sage, Sdept) 语义)学号唯一,学生不重名;)一个学生只有一种性别,只有一个年龄,只能在一个

14、系学习;则Student关系的函数倚赖有:Sno SnameSno Ssex,Sno Sage, Sno Sdept, Sname Ssex, Sname Sage,Sname Sdept但Ssex Sage29/240第29页/共245页举例举例(根据语义推出函数依赖根据语义推出函数依赖)例3:在关系SC(Sno, Cno, Grade)中,语义)一个学生可以选修多门课程,一门课程可以被多个学生选修,某个学生选修某一门课程,会获得一个成绩;则SC关系的函数倚赖有: (Sno, Cno) Grade 30/240第30页/共245页举例举例(根据语义推出函数依赖根据语义推出函数依赖)例4:在关

15、系Std(Sno, Sdept, Mname)中, 语义:)一个学生只能在一个系学习,一个系有若干个学生;)一个系只有一名负责人;则Std关系的函数依赖有:Sno Sdept,Sdept Mname 31/240第31页/共245页练习练习 (根据语义推出函数依赖根据语义推出函数依赖)关系模式 SLC(Sno, Sdept, Sloc, Cno, Grade) 学生的学号(Sno)、所在系(Sdept)、学生住处(SLOC)、课程号(Cno)、成绩(Grade)语义: 一个系有若干学生, 一个学生只属于一个系; 每个系的学生住在同一个地方; 一个学生可以选修多门课程, 每门课程有若干学生选修;

16、 每个学生所学的每门课程都有一个成绩。 5、一间宿舍可以住多个学生,一个学生只能住在一间宿舍。32/240第32页/共245页练习练习1答案答案 Sno Sdept Sno Sloc Sdept Sloc (Sno, Cno) Grade33/240第33页/共245页二、平凡函数依赖与非平凡函数依赖二、平凡函数依赖与非平凡函数依赖在关系模式R(U)中,对于U的子集X和Y,如果XY,但Y X,则称XY是非平凡的函数依赖若XY,但Y X, 则称XY是平凡的函数依赖例5:在关系SC(Sno, Cno, Grade)中, 非平凡函数依赖: (Sno, Cno) Grade 平凡函数依赖: (Sno,

17、 Cno) Sno (Sno, Cno) Cno34/240第34页/共245页平凡函数依赖与非平凡函数依赖(续)平凡函数依赖与非平凡函数依赖(续) 若XY,则X称为这个函数依赖的决定属性组,也称为决定因素(Determinant)。 若XY,YX,则记作XY。 若Y不函数依赖于X,则记作XY。35/240第35页/共245页平凡函数依赖与非平凡函数依赖(续)平凡函数依赖与非平凡函数依赖(续) 于任一关系模式,平凡函数依赖都是必然成立的,它不反映新的语义,因此若不特别声明, 我们总是讨论非平凡函数依赖。36/240第36页/共245页三、完全函数依赖与部分函数依赖三、完全函数依赖与部分函数依赖

18、定义定义 在R(U)中,如果XY,并且对于X的任何一个真子集X,都有X Y, 则称Y对X完全函数依赖,记作 X F Y。 若XY,但Y不完全函数依赖于X,则称Y对X部分函数依赖,记作X P Y。 37/240第37页/共245页完全函数依赖与部分函数依赖(续)完全函数依赖与部分函数依赖(续)例6 在关系SC(Sno, Cno, Grade)中, 由于:Sno Grade,Cno Grade, 因此:(Sno,Cno) Grade 由于: Sno Sdept成立,且Sno是(Sno,Cno)的真子集因此: (Sno,Cno) Sdept,是部分函数依赖SdeptFFP38/240第38页/共24

19、5页四、传递函数依赖四、传递函数依赖定义定义 在R(U)中,如果XY,(Y X) ,YX YZ, 则称Z对X传递函数依赖。 记为:X Z 注: 如果YX, 即XY,则Z直接依赖于X。例: 在关系Std(Sno, Sdept, Mname)中,有: Sno Sdept,Sdept Mname Mname传递函数依赖于Sno即 Sno Mname传递传递39/240第39页/共245页举例举例(根据语义推出函数依赖根据语义推出函数依赖)例例7 7、设有关系模式Student(学号,姓名,出生日期,所在系,班号,宿舍区)语义: 一个系有若干班, 一个班只属于一个系; 每个系的学生住在同一个宿舍区,一

20、个宿舍区可以住多个系的学生; 一个班有若干学生, 一个学生只属于一个班;、一个系有多个学生,一个学生只能属于一个系。、学号是唯一的,学生可以重名,一个学生只有一个出生日期;请分析Student中 :)函数依赖)传递函数依赖)部分函数依赖40/240第40页/共245页例例7答案答案)函数依赖学号姓名,学号出生日期,学号系名,学号班号,系名宿舍区,班号系名)传递函数依赖传递因为学号班号,班号系名所以学号系名因为班号系名,系名宿舍区所以班号宿舍区因为学号系名,系名宿舍区所以学号宿舍区)部分函数依赖没有41/240第41页/共245页6.2 规范化规范化6.2.1 函数依赖函数依赖6.2.2 码码6

21、.2.3 范式范式6.2.4 2NF6.2.5 3NF6.2.6 BCNF6.2.7 多值依赖多值依赖6.2.8 4NF6.2.9 规范化小结规范化小结42/240第42页/共245页6.2.2 码码定义定义 设K为R中的属性或属性组合。若K U, 则K称为R的侯选码(Candidate Key)。 若候选码多于一个,则选定其中的一个做为主码(Primary Key)。F43/240第43页/共245页码(续)码(续) 主属性与非主属性 包含在任何一个候选码中的属性 ,称为主属性(Prime attribute) 不包含在任何码中的属性称为非主属性(Nonprime attribute)或非码

22、属性(Non-key attribute) 全码 整个属性组是码,称为全码(All-key) 44/240第44页/共245页举例(码的定义)举例(码的定义)例1: 在关系SC(Sno, Cno, Grade)中, 由于:Sno Grade,Cno Grade, 因此:(Sno, Cno) Grade 因此: (Sno, Cno) 是关系模式SC的侯选码,也是主码 45/240第45页/共245页码(续)码(续)例2 关系模式S(Sno,Sdept,Sage),单个属性Sno是码, SC(Sno,Cno,Grade)中,(Sno,Cno)是码例3 关系模式R(P,W,A) P:演奏者 W:作品

23、 A:听众 一个演奏者可以演奏多个作品 某一作品可被多个演奏者演奏 听众可以欣赏不同演奏者的不同作品 码为(P,W,A),即All-Key 46/240第46页/共245页外部码外部码定义定义 关系模式 R 中属性或属性组X 并非 R的码,但 X 是另一个关系模式的码,则称 X 是R 的外部码(Foreign key)也称外码 如在SC(Sno,Cno,Grade)中,Sno不是码,但Sno是关系模式S(Sno,Sdept,Sage)的码,则Sno是关系模式SC的外部码 主码与外部码一起提供了表示关系间联系的手段47/240第47页/共245页举例(外码的定义)举例(外码的定义)例9: 在关系

24、SC(Sno, Cno, Grade)和Course(Cno,Cname,)中, Cno 不是SC的侯选码,但Cno是关系模式Course的侯选码,所以Cno是SC的外码。 48/240第48页/共245页6.2 规范化规范化6.2.1 函数依赖函数依赖6.2.2 码码6.2.3 范式范式6.2.4 2NF6.2.5 3NF6.2.6 BCNF6.2.7 多值依赖多值依赖6.2.8 4NF6.2.9 规范化小结规范化小结49/240第49页/共245页6.2.3 范式范式 范式是符合某一种级别的关系模式的集合 关系数据库中的关系必须满足一定的要求。满足不同程度要求的为不同范式 范式的种类:第一

25、范式(1NF)第二范式(2NF)第三范式(3NF)BC范式(BCNF)第四范式(4NF)第五范式(5NF)50/240第50页/共245页6.2.3 范式范式 各种范式之间存在联系: 某一关系模式R为第n范式,可简记为RnNF。 一个低一级范式的关系模式,通过模式分解可以转换为若干个高一级范式的关系模式的集合,这种过程就叫规范化 NF5NF4BCNFNF3NF2NF151/240第51页/共245页6.2 规范化规范化6.2.1 函数依赖函数依赖6.2.2 码码6.2.3 范式范式6.2.4 2NF6.2.5 3NF6.2.6 BCNF6.2.7 多值依赖多值依赖6.2.8 4NF6.2.9

26、规范化小结规范化小结52/240第52页/共245页6.2.4 2NF 1NF的定义如果一个关系模式R的所有属性都是不可分的基本数据项不可分的基本数据项,则R1NF 第一范式是对关系模式的最起码的要求。不满足第一范式的数据库模式不能称为关系数据库 但是满足第一范式的关系模式并不一定是一个好的关系模式53/240第53页/共245页2NF(续)(续)例4 关系模式 S-L-C(Sno, Sdept, Sloc, Cno, Grade)学生的学号(Sno)、所在系(Sdept)、学生住处(SLOC)、课程号(Cno)、成绩(Grade)语义: 一个系有若干学生, 一个学生只属于一个系; 每个系的学

27、生住在同一个地方; 一个学生可以选修多门课程, 每门课程有若干学生选修; 每个学生所学的每门课程都有一个成绩。 5、一间宿舍可以住多个学生,一个学生只能住在一间宿舍。54/240第54页/共245页2NF根据语义关系模式 SLC(Sno, Sdept, Sloc, Cno, Grade) 的函数依赖包括: (Sno, Cno) f Grade Sno Sdept Sno Sloc Sdept Sloc55/240第55页/共245页2NF又 因为 (Sno, Cno) Sdept Sno Sdept 所以(Sno, Cno) P Sdept 因为 (Sno, Cno) Sloc Sno Slo

28、c (Sno, Cno) P Sloc 56/240第56页/共245页2NF所以关系模式 SLC(Sno, Sdept, Sloc, Cno, Grade) 的函数依赖包括: (Sno, Cno) f Grade Sno Sdept Sno Sloc Sdept Sloc (Sno, Cno) P Sdept (Sno, Cno) P Sloc57/240第57页/共245页 2NF(续)(续) S-L-C的码为(Sno, Cno) S-L-C满足第一范式。 非主属性Sdept和Sloc部分函数依赖于码(Sno, Cno)SnoCnoGradeSdeptSlocS-L-C58/240第58页

29、/共245页SLC不是一个好的关系模式不是一个好的关系模式(1) 插入异常假设Sno95102,SdeptIS,SlocN的学生还未选课,因课程号是主属性,因此该学生的信息无法插入SLC。(2) 删除异常 假定某个学生本来只选修了3号课程这一门课。现在因身体不适,他连3号课程也不选修了。因课程号是主属性,此操作将导致该学生信息的整个元组都要删除。 59/240第59页/共245页SLC不是一个好的关系模式不是一个好的关系模式(3) 数据冗余度大 如果一个学生选修了10门课程,那么他的Sdept和Sloc值就要重复存储了10次。(4) 修改复杂 例如学生转系,在修改此学生元组的Sdept值的同时

30、,还可能需要修改住处(Sloc)。如果这个学生选修了K门课,则必须无遗漏地修改K个元组中全部Sdept、Sloc信息。 60/240第60页/共245页S-L-C不是一个好的关系模式(续)不是一个好的关系模式(续) 原因 Sdept、 Sloc部分函数依赖于码。 解决方法(投影分解法) S-L-C分解为两个关系模式,以消除这些部分函数依赖 SC(Sno, Cno, Grade) S-L(Sno, Sdept, Sloc)61/240第61页/共245页2NF(续)(续)函数依赖图:SnoCnoGradeSCS-LSnoSdeptSlocv关系模式SC的码为(Sno,Cno)v关系模式S-L的码

31、为Snov这样非主属性对码都是完全函数依赖 62/240第62页/共245页 2NF(续)(续) 2NF的定义定义定义 若R1NF,且每一个非主属性完全函数依赖于R的任意候选码,则R2NF。例:S-L-C(Sno, Sdept, Sloc, Cno, Grade) 1NF S-L-C(Sno, Sdept, Sloc, Cno, Grade) 2NF SC(Sno, Cno, Grade) 2NF S-L(Sno, Sdept, Sloc) 2NF63/240第63页/共245页 2NF(续)(续) 采用投影分解法投影分解法将一个1NF的关系分解为多个2NF的关系,可以在一定程度上减轻原1NF

32、关系中存在的插入异常、删除异常、数据冗余度大、修改复杂等问题。 将一个1NF关系分解为多个2NF的关系,并不能完全消除关系模式中的各种异常情况和数据冗余。64/240第64页/共245页练习练习2(第二范式)(第二范式)工程号工程号材料号材料号数量数量开工日期开工日期完工日期完工日期价格价格P1I140980599023000P2I2298059902220P3I31298059902250P4I1498059902300P4I4498059902300如图给出的关系r对应的关系模式R属于第几范式?是否存在操作异常?若存在,将其分解为高一级范式。65/240第65页/共245页练习答案(第二范

33、式)练习答案(第二范式)关系模式R侯选关键字是(工程号,材料号), 因为工程号 开工日期(工程号,材料号) 开工日期P所以(工程号,材料号) 开工日期 所以 R2NF RNF分解(投影分解法):R1(工程号,开工日期,完工日期) R2(工程号,材料号,数量,价格) 66/240第66页/共245页6.2 规范化规范化6.2.1 函数依赖函数依赖6.2.2 码码6.2.3 范式范式6.2.4 2NF6.2.5 3NF6.2.6 BCNF6.2.7 多值依赖多值依赖6.2.8 4NF6.2.9 规范化小结规范化小结67/240第67页/共245页 6.2.5 3NF 3NF的定义定义定义 关系模式

34、R 中若不存在这样的码X、属性组Y及非主属性Z(Z Y), 使得XY,YZ成立, Y X,则称R 3NF。n 若R3NF,则每一个非主属性非主属性既不部分依赖于码码也不传递依赖于码码。 68/240第68页/共245页3NF(续)(续)例:2NF关系模式S-L(Sno, Sdept, Sloc)中 函数依赖: SnoSdept Sdept Sno SdeptSloc 可得: SnoSloc,即S-L中存在非主属性对码的传递函数依 赖,S-L 3NF传递69/240第69页/共245页 3NF(续)(续)函数依赖图:S-LSnoSdeptSloc70/240第70页/共245页3NF(续)(续)

35、 解决方法 采用投影分解法,把S-L分解为两个关系模式,以消除传递函数依赖: S-D(Sno, Sdept) D-L(Sdept,Sloc)S-D的码为Sno, D-L的码为Sdept。n分解后的关系模式S-D与D-L中不再存在传递依赖 71/240第71页/共245页3NF(续)(续)S-D的码为Sno, D-L的码为SdeptSnoSdeptS-DSdeptSlocD-Lv S-L(Sno, Sdept, Sloc) 2NF S-L(Sno, Sdept, Sloc) 3NF S-D(Sno,Sdept) 3NFD-L(Sdept, Sloc) 3NF72/240第72页/共245页3NF

36、(续)(续) 采用投影分解法将一个2NF的关系分解为多个3NF的关系,可以在一定程度上解决原2NF关系中存在的插入异常、删除异常、数据冗余度大、修改复杂等问题。 将一个2NF关系分解为多个3NF的关系后,仍然不能完全消除关系模式中的各种异常情况和数据冗余。73/240第73页/共245页练习练习3(第三范式)(第三范式)课程名教师名教师地址C1I1D1C2I2D1C3I3D2C4I1D1如图给出的关系r对应的关系模式R属于第几范式?是否存在操作异常?若存在,将其分解为高一级范式。74/240第74页/共245页练习练习3(第三范式)答案(第三范式)答案关系模式R侯选关键字是课程名, 因为课程名

37、 教师名,教师名课程名教师名教师地址传递所以课程名教师地址 所以 RNF RNF分解(根据“一事一地”模式设计原则):R1(课程名, 教师名) R2(教师名,教师地址) 75/240第75页/共245页练习练习4(第三范式)(第三范式)例14:在关系模式STJ(S,T,J)中,S表示学生,T表示教师,J表示课程。 语义:每一教师只教一门课。每门课由若干教师教,某一学生选定某门课,就确定了一个固定的教师。某个学生选修某个教师的课就确定了所选课的名称 : (S,J)T,(S,T)J,TJ 请问STJ属于第几模式?是否存在操作异常?76/240第76页/共245页第三范式练习第三范式练习4答案答案:

38、 RNF SJTSTJSTJ77/240第77页/共245页第三范式练习答案第三范式练习答案没有任何非主属性非主属性对码码部分函数依赖和传递函数依赖 所以 RNF存在问题:、有n个学生选修了一门课程,该课程的任课老师存储了n次;(数据冗余)、某门课程不开,没有学生选课,则无法插入(J,T)即教师上这门课的信息;(插入异常)、78/240第78页/共245页 在不考虑主属性对码的部分依赖和传递依赖时,可以认为是实现了彻底的分离,已消除了插入异常,删除异常,修改异常,冗余等问题 但是,当关系中存在两个或更多的候选码时,尤其是有几个候选码、且候选码内的属性又有部分复合或交迭时,仅仅满足3NF仍有问题

39、,需要进一步分解成BCNF79/240第79页/共245页6.2 规范化规范化6.2.1 函数依赖函数依赖6.2.2 码码6.2.3 范式范式6.2.4 2NF6.2.5 3NF6.2.6 BCNF6.2.7 多值依赖多值依赖6.2.8 4NF6.2.9 规范化小结规范化小结80/240第80页/共245页 6.2.6 BC范式(范式(BCNF) 定义定义 关系模式R1NF,若XY且Y X时X必含有码,则R BCNF。 等价于:每一个决定属性因素都包含码(而不是被包含)81/240第81页/共245页BCNF(续)(续) 若RBCNF 每一个决定属性集(因素)都包含(候选)码 所有非主属性对每

40、一个码都是完全函数依赖 所有的主属性对每一个不包含它的码,也是完全函数依赖(R2NF) 没有任何属性完全函数依赖于非码的任何一组属性 R BCNF R 3NF (若R3NF 则 R不一定BCNF)充分不必要82/240第82页/共245页 6.2.6 BC范式(范式(BCNF) 参考定义 设关系模式R3NF,如果对于R的每个非平凡的函数依赖XY,X必含有候选码,那么RBCNF。 另一个说法:如果关系模式R(U,F)的所有属性(包括主属性和非主属性)都不传递依赖于R的任何候选关键字,那么称关系R是属于BCNF的83/240第83页/共245页BCNF(续)(续)例5 SJP(学生S, 课程J,

41、名次P) (S,J)和(J,P) 均为候选码 函数依赖为(S,J)P, (J,P) S其中,两个决定因素均包含(是)候选码可见SJP BCNF例6 STJ(学生S, 教师T, 课程J) (S,T)和(S,J) 均为候选码 函数依赖为(S,J) T, (S,T) J, T J其中,T为决定因素,但不包含任何一个候选码可见STJ 3NF, 但STJ BCNF 84/240第84页/共245页BCNF(续)(续)例7关系模式SJP(S,J,P)n函数依赖:(S,J)P;(J,P)Sn(S,J)与(J,P)都可以作为候选码,属性相交nSJP3NF,nSJPBCNF85/240第85页/共245页 BC

42、NF例8:在关系模式STJ(S,T,J)中,S表示学生,T表示教师,J表示课程。 每一教师只教一门课。每门课由若干教师教,某一学生选定某门课,就确定了一个固定的教师。某个学生选修某个教师的课就确定了所选课的名称 : (S,J)T,(S,T)J,TJ (S,J)和(S,T)都是候选码86/240第86页/共245页 BCNF(续)(续) JSJTSTSTJ中的函数依赖87/240第87页/共245页BCNF(续)(续) STJ3NF 没有任何非主属性对码传递依赖或部分依赖 STJBCNF T是决定因素,T不包含码88/240第88页/共245页BCNF(续)(续) 解决方法:将STJ分解为二个关

43、系模式: ST(S,T) BCNF, TJ(T,J) BCNF 没有任何属性对码的部分函数依赖和传递函数依赖SJSTTJTJ89/240第89页/共245页3NF与与BCNF的关系的关系 R BCNF R 3NF (如果关系模式RBCNF,必定有R3NF) 如果R3NF,且R只有一个候选码 R BCNF R 3NF充分不必要充分必要90/240第90页/共245页BCNF的关系模式所具有的性质的关系模式所具有的性质 所有非主属性都完全函数依赖于每个候选码 所有主属性都完全函数依赖于每个不包含它的候选码 没有任何属性完全函数依赖于非码的任何一组属性91/240第91页/共245页小结小结 分析侯

44、选码:由F,由语义,由r; 判断属于第几范式:从1NF逐步到高一级的范式,直到R不属于某一范式; 插入异常,删除异常,数据冗余,范式由低到高,异常越来越少,关系模式越来越理想。92/240第92页/共245页数据库应用:范式数据库应用:范式第一范式(第一范式(1NF):):属性不可分。下例不为1NF 第二范式(第二范式(2NF):):所有非关键字段都完全依赖于任意一组候选关键字 例:假定选课关系表为SelectCourse(学号, 姓名, 年龄, 课程名称, 成绩, 学分),关键字为组合关键字(学号, 课程名称),因为存在如下决定关系:(学号, 课程名称) (姓名, 年龄, 成绩, 学分)这个

45、数据库表不满足第二范式,因为存在如下决定关系:(课程名称) (学分)(学号) (姓名, 年龄)即存在组合关键字中的字段决定非关键字的情况。即存在组合关键字中的字段决定非关键字的情况。93/240第93页/共245页数据库应用:范式数据库应用:范式 第三范式(第三范式(3NF):):在第二范式的基础上,数据表中如果不存在非关键字段对任一候选关键字段的传递函数依赖则符合第三范式。因此,满足第三范式的数据库表应该不存在不存在如下依赖关系:关键字段关键字段 非关键字段非关键字段x 非关键字段非关键字段y 假定学生关系表为Student(学号, 姓名, 年龄, 所在学院, 学院地点, 学院电话),关键字

46、为单一关键字学号,因为存在如下决定关系:(学号) (姓名, 年龄, 所在学院, 学院地点, 学院电话)这个数据库是符合2NF的,但是不符合3NF,因为存在如下决定关系:(学号) (所在学院) (学院地点, 学院电话)即存在非关键字段学院地点、学院电话对关键字段学号的传递函数依赖。 94/240第94页/共245页数据库应用:范式数据库应用:范式 BCNF(鲍依斯鲍依斯-科得范式科得范式) :符合3NF,并且,数据库数据库表中如果不存在任何字段对任一候选关键字段的传递函表中如果不存在任何字段对任一候选关键字段的传递函数依赖则符合数依赖则符合BCNF。 假设仓库管理关系表为StorehouseMa

47、nage(仓库ID, 存储物品ID, 管理员ID, 数量),且有一个管理员只在一个仓库工作;一个仓库可以存储多种物品。这个数据库表中存在如下决定关系:(仓库ID, 存储物品ID) (管理员ID, 数量)(管理员ID, 存储物品ID) (仓库ID, 数量)所以,(仓库ID, 存储物品ID)和(管理员ID, 存储物品ID)都是StorehouseManage的候选关键字,表中的唯一非关键字段为数量,它是符合第三范式的。但是,由于存在如下决定关系:(仓库ID) (管理员ID)(管理员ID) (仓库ID)即存在关键字段决定关键字段的情况,所以其不符合BCNF范式。 95/240第95页/共245页数据

48、库应用:范式数据库应用:范式 一般,一个数据库设计符合3NF或BCNF就可以了。在BC范式以上还有第四范式、第五范式。 第四范式:要求把同一表内的多对多关系删除。 第五范式:从最终结构重新建立原始结构。 但在绝大多数应用中不需要设计到这种程度。并且,某些情况下,过于范式化甚至会对数据库的逻辑可读性和使用效率起到阻碍。数据库中一定程度的冗余并不一定是坏事情。96/240第96页/共245页数据库应用:范式数据库应用:范式我们来逐步设计一个论坛的数据库,有如下信息:(1) 用户:用户名,email,主页,电话,联系地址(2) 帖子:发帖标题,发帖内容,回复标题,回复内容 第一次我们将数据库设计为仅

49、仅存在表:97/240第97页/共245页数据库应用:范式数据库应用:范式这个数据库表符合第一范式,但是没有任何一组候选关键字能决定数据库表的整行,唯一的关键字段用户名也不能完全决定整个元组。我们需要增加“发帖ID”、“回复ID”字段,即将表修改为:这样数据表中的关键字(用户名,发帖ID,回复ID)能决定整行:(用户名,发帖ID,回复ID) (email,主页,电话,联系地址,发帖标题,发帖内容,回复标题,回复内容)98/240第98页/共245页数据库应用:范式数据库应用:范式 但是,这样的设计不符合第二范式(部分函数依赖),因为存在如下决定关系:(用户名) (email,主页,电话,联系地

50、址)(发帖ID) (发帖标题,发帖内容)(回复ID) (回复标题,回复内容)即非关键字段部分函数依赖于候选关键字段,很明显,这个设计会导致大量的数据冗余和操作异常。99/240第99页/共245页数据库应用:范式数据库应用:范式 我们将数据库表分解为(带下划线的为关键字):(1) 用户信息:用户名,email,主页,电话,联系地址(2) 帖子信息:发帖ID,标题,内容(3) 回复信息:回复ID,标题,内容(4) 发贴:用户名,发帖ID(5) 回复:发帖ID,回复ID这样的设计是满足第1、2、3范式和BCNF范式要求的 ,但是这样的设计是不是最好的呢?100/240第100页/共245页数据库应

51、用:范式数据库应用:范式 不一定。观察可知,第4项发帖中的用户名和发帖ID之间是1:N的关系,因此我们可以把发帖合并到第2项的帖子信息中;第5项回复中的发帖ID和回复ID之间也是1:N的关系,因此我们可以把回复合并到第3项的回复信息中。这样可以一定量地减少数据冗余,新的设计为:(1) 用户信息:用户名,email,主页,电话,联系地址(2) 帖子信息:用户名,发帖ID,标题,内容(3) 回复信息:发帖ID,回复ID,标题,内容101/240第101页/共245页数据库应用:范式数据库应用:范式 数据库表1显然不满足所有范式的要求; 数据库表2中存在非关键字段“标题”、“内容”对关键字段“发帖I

52、D”的部分函数依赖,即不满足第二范式的要求,但是这一设计并不会导致数据冗余和操作异常; 数据库表3中也存在非关键字段“标题”、“内容”对关键字段“回复ID”的部分函数依赖,也不满足第二范式的要求,但是与数据库表2相似,这一设计也不会导致数据冗余和操作异常。 由此可以看出,并不一定要强行满足范式的要求,对于1:N关系,当1的一边合并到N的那边后,N的那边就不再满足第二范式了,但是这种设计反而比较好 对于M:N的关系,不能将M一边或N一边合并到另一边去,这样会导致不符合范式要求,同时导致操作异常和数据冗余。 对于1:1的关系,我们可以将左边的1或者右边的1合并到另一边去,设计导致不符合范式要求,但

53、是并不会导致操作异常和数据冗余。102/240第102页/共245页数据库应用:范式数据库应用:范式 满足范式要求的数据库设计是结构清晰的,同时可避免数据冗余和操作异常。这并意味着不符合范式要求的设计一定是错误的,在数据库表中存在1:1或1:N关系这种较特殊的情况下,合并导致的不符合范式要求反而是合理的。在我们设计数据库的时候,一定要时刻考虑范式的要求。103/240第103页/共245页6.2 规范化规范化6.2.1 函数依赖函数依赖6.2.2 码码6.2.3 范式范式6.2.4 2NF6.2.5 3NF6.2.6 BCNF6.2.7 多值依赖多值依赖6.2.8 4NF6.2.9 规范化小结

54、规范化小结104/240第104页/共245页6.2.7 多值依赖多值依赖例9 学校中某一门课程由多个教师讲授,他们使用相同的一套参考书。每个教员可以讲授多门课程,每种参考书可以供多门课程使用。 关系模式Teaching(C, T, B) 课程C、教师T 和 参考书B105/240第105页/共245页课 程 C教 员 T参 考 书 B 物理数学 计算数学李 勇王 军 李 勇张 平 张 平 周 峰 普通物理学光学原理 物理习题集数学分析微分方程高等代数数学分析. 多值依赖(续)v 非规范化关系106/240第106页/共245页普通物理学光学原理物理习题集普通物理学光学原理物理习题集数学分析微

55、分方程高等代数数学分析微分方程高等代数李 勇李 勇李 勇王 军王 军王 军李 勇李 勇李 勇张 平张 平张 平 物 理物 理物 理物 理物 理物 理数 学数 学数 学数 学数 学数 学 参考书B教员T课程C多值依赖(续)多值依赖(续)v 用二维表表示Teaching107/240第107页/共245页多值依赖(续)多值依赖(续) TeachingBCNF Teaching具有唯一候选码(C,T,B), 即全码 108/240第108页/共245页多值依赖(续)多值依赖(续) Teaching模式中存在的问题(1)数据冗余度大:有多少名任课教师,参考书就要存储多少次(2)插入操作复杂:当某一课程

56、增加一名任课教师时,该课程有多少本参照书,就必须插入多少个元组.例如物理课增加一名教师刘关,需要插入两个元组:(物理,刘关,普通物理学) (物理,刘关,光学原理)(3) 删除操作复杂:某一门课要去掉一本参考书,该课程有多少名教师,就必须删除多少个元组(4) 修改操作复杂:某一门课要修改一本参考书,该课程有多少名教师,就必须修改多少个元组 产生原因:存在多值依赖存在多值依赖109/240第109页/共245页多值依赖(续)多值依赖(续) 定义定义 设R(U)是一个属性集U上的一个关系模式, X、 Y和Z是U的子集,并且ZUXY。关系模式R(U)中多值依赖 XY成立,当且仅当对R(U)的任一关系r

57、,给定的一对(x,z)值,有一组Y的值,这组值仅仅决定于x值而与z值无关 例 Teaching(C, T, B) 对于C的每一个值,T有一组值与之对应,而不论B取何值110/240第110页/共245页多值依赖(续)多值依赖(续) 多值依赖的另一个等价的形式化的定义: 在R(U)的任一关系r中,如果存在元组t,s 使得tX=sX,那么就必然存在元组 w,v r,(w,v可以与s,t相同),使得wX=vX=tX,而wY=tY,wZ=sZ,vY=sY,vZ=tZ(即交换s,t元组的Y值所得的两个新元组必在r中),则Y多值依赖于X,记为XY。 这里,X,Y是U的子集,Z=U-X-Y。111/240第

58、111页/共245页多值依赖(续)多值依赖(续) 平凡多值依赖和非平凡的多值依赖若XY,而Z,则称 XY为平凡的多值依赖否则称XY为非平凡的多值依赖112/240第112页/共245页多值依赖的性质多值依赖的性质*(1)多值依赖具有对称性 若XY,则XZ,其中ZUXY 多值依赖的对称性可以用完全二分图直观地表示出来。(2)多值依赖具有传递性 若XY,YZ, 则XZ -Y113/240第113页/共245页多值依赖的对称性多值依赖的对称性* XiZi1 Zi2 ZimYi1 Yi2 Yin114/240第114页/共245页多值依赖的对称性多值依赖的对称性* 物 理普通物理学 光学原理 物理习题

59、集李勇 王军115/240第115页/共245页多值依赖(续)多值依赖(续)*(3)函数依赖是多值依赖的特殊情况。 若XY,则XY。(4)若XY,XZ,则XY Z。(5)若XY,XZ,则XYZ。(6)若XY,XZ,则XY-Z,XZ -Y。116/240第116页/共245页多值依赖与函数依赖的区别多值依赖与函数依赖的区别*(1) 有效性 多值依赖的有效性与属性集的范围有关若XY在U上成立,则在W(X Y W U)上一定成立;反之则不然,即XY在W(W U)上成立,在U上并不一定成立 多值依赖的定义中不仅涉及属性组 X和 Y,而且涉及U中其余属性Z。 一般地,在R(U)上若有XY在W(W U)上

60、成立,则称XY为R(U)的嵌入型多值依赖117/240第117页/共245页多值依赖与函数依赖的区别多值依赖与函数依赖的区别* 只要在R(U)的任何一个关系r中,元组在X和Y上的值满足定义(函数依赖), 则函数依赖XY在任何属性集W(X Y W U)上成立。118/240第118页/共245页多值依赖(续)多值依赖(续)*(2) 若函数依赖XY在R(U)上成立,则对于任何Y Y均有XY 成立 多值依赖XY若在R(U)上成立,不能断言对于任何Y Y有XY 成立119/240第119页/共245页多值依赖(续)多值依赖(续)例10关系模式WSC(W,S,C)n W表示仓库,S表示保管员,C表示商品

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论