




已阅读5页,还剩77页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
数据库原理和应用地理信息系统042,3.1问题的提出3.2函数依赖3.3关系模式的规范化3.4函数依赖的公理系统(选),第三章关系数据库设计理论,3.1规范化问题的提出,3.1规范化问题的提出,1.规范化理论的主要内容关系数据库的规范化理论最早是由关系数据库的创始人E.F.Codd提出的,后经许多专家学者对关系数据库理论作了深入的研究和发展,形成了一整套有关关系数据库设计的理论。在该理论出现以前,层次和网状数据库的设计只是遵循其模型本身固有的原则,而无具体的理论依据可言,因而带有盲目性,可能在以后的运行和使用中发生许多预想不到的问题。,在关系数据库系统中,关系模型包括一组关系模式,各个关系不是完全孤立的,数据库的设计较层次和网状模型更为重要。如何设计一个适合的关系数据库系统,关键是关系数据库模式的设计,一个好的关系数据库模式应该包括多少关系模式,而每一个关系模式又应该包括哪些属性,又如何将这些相互关联的关系模式组建一个适合的关系模型,这些工作决定了到整个系统运行的效率,也是系统成败的关键所在,所以必须在关系数据库的规范化理论的指导下逐步完成。,关系数据库的规范化理论主要包括三个方面的内容:函数依赖范式(NormalForm)模式设计其中,函数依赖起着核心的作用,是模式分解和模式设计的基础,范式是模式分解的标准。关系模式的存储异常问题数据库的逻辑设计为什么要遵循一定的规范化理论?什么是好的关系模式?某些不好的关系模式可能导致哪些问题?下面通过例子进行分析:,例如,要求设计教学管理数据库,其关系模式SCD如下:SCD(SNO,SN,AGE,DEPT,MN,CNO,SCORE)其中,SNO表示学生学号,SN表示学生姓名,AGE表示学生年龄,DEPT表示学生所在的系别,MN表示系主任姓名,CNO表示课程号,SCORE表示成绩。根据实际情况,这些数据有如下语义规定:1.一个系有若干个学生,但一个学生只属于一个系;2.一个系只有一名系主任,但一个系主任可以同时兼几个系的系主任;3.一个学生可以选修多门功课,每门课程可有若干学生选修;4.每个学生学习课程有一个成绩。在此关系模式中填入一部分具体的数据,则可得到SCD关系模式的实例,即一个教学管理数据库,如图4.1所示。,图3.1关系SCD,根据上述的语义规定,并分析以上关系中的数据,我们可以看出:(SNO,CNO)属性的组合能唯一标识一个元组,所以(SNO,CNO)是该关系模式的主关系键。但在进行数据库的操作时,会出现以下几方面的问题。1.数据冗余。每个系名和系主任的名字存储的次数等于该系的学生人数乘以每个学生选修的课程门数,同时学生的姓名、年龄也都要重复存储多次,数据的冗余度很大,浪费了存储空间。2.插入异常。如果某个新系没有招生,尚无学生时,则系名和系主任的信息无法插入到数据库中。因为在这个关系模式中,(SNO,CNO)是主关系键。根据关系的实体完整性约束,主关系键的值不能为空,而这时没有学生,SNO和CNO均无值,因此不能进行插入操作。另外,当某个学生尚未选课,即CNO未知,实体完整性约束还规定,主关系键的值不能部分为空,同样不能进行插入操作。,3.删除异常。某系学生全部毕业而没有招生时,删除全部学生的记录则系名、系主任也随之删除,而这个系依然存在,在数据库中却无法找到该系的信息。另外,如果某个学生不再选修C1课程,本应该只删去C1,但C1是主关系键的一部分,为保证实体完整性,必须将整个元组一起删掉,这样,有关该学生的其它信息也随之丢失。4.更新异常。如果学生改名,则该学生的所有记录都要逐一修改SN;又如某系更换系主任,则属于该系的学生记录都要修改MN的内容,稍有不慎,就有可能漏改某些记录,这就会造成数据的不一致性,破坏了数据的完整性。,由于存在以上问题,我们说,SCD是一个不好的关系模式。产生上述问题的原因,直观地说,是因为关系中“包罗万象”,内容太杂了。那么,怎样才能得到一个好的关系模式呢?我们把关系模式SCD分解为下面三个结构简单的关系模式,如图3.2所示。学生关系S(SNO,SN,AGE,DEPT)选课关系SC(SNO,CNO,SCORE)系关系D(DEPT,MN),SSC,图3.2分解后的关系模式,在以上三个关系模式中,实现了信息的某种程度的分离,S中存储学生基本信息,与所选课程及系主任无关;D中存储系的有关信息,与学生无关;SC中存储学生选课的信息,而与所学生及系的有关信息无关。与SCD相比,分解为三个关系模式后,数据的冗余度明显降低。当新插入一个系时,只要在关系D中添加一条记录。当某个学生尚未选课,只要在关系S中添加一条学生记录,而与选课关系无关,这就避免了插入异常。当一个系的学生全部毕业时,只需在S中删除该系的全部学生记录,而关系D中有关该系的信息仍然保留,从而不会引起删除异常。同时,由于数据冗余度的降低,数据没有重复存储,也不会引起更新异常。,经过上述分析,我们说分解后的关系模式是一个好的关系数据库模式。从而得出结论,一个好的关系模式应该具备以下四个条件:1.尽可能少的数据冗余。2.没有插入异常。3.没有删除异常。4.没有更新异常。,但要注意,一个好的关系模式并不是在任何情况下都是最优的,比如查询某个学生选修课程名及所在系的系主任时,要通过连接,而连接所需要的系统开销非常大,因此要以实际设计的目标出发进行设计如何按照一定的规范设计关系模式,将结构复杂的关系分解成结构简单的关系,从而把不好的关系数据库模式转变为好的关系数据库模式,这就是关系的规范化。规范化又可以根据不同的要求而分成若干级别。我们要设计的关系模式中的各属性是相互依赖、相互制约的,这样才构成了一个结构严谨的整体。因此在设计关模式时,必须从语义上分析这些依赖关系。数据库模式的好坏和关系中各属性间的依赖关系有关,因此,我们先讨论属性间的依赖关系,然后再讨论关系规范化理论。,3.2函数依赖,关系模式中的各属性之间相互依赖、相互制约的联系称为数据依赖。这种约束关系是通过属性值之间的依赖关系来体现的。数据依赖一般分为函数依赖、多值依赖和连接依赖。其中,函数依赖是最重要的数据依赖。函数依赖(FunctionalDependency)是关系模式中属性之间的一种逻辑依赖关系。属性间的这种依赖关系类似于数学中的函数y=f(x),自变量x确定之后,相应的函数值y也就惟一地确定了。,现在我们建立一个描述学校教务的数据库,该数据库涉及的对象包括学生的学号(Sno)、所在系(Sdept)、系主任姓名(Mname)、课程名(Cname)成绩(Grade)假设我们用一个单一的关系模式Student来表示,则该关系模式的属性集为:USno,Sdept,Mname,Cname,Grade,现实世界的已知事实(语义)告诉我们:(1)一个系有若干学生,但一个学生只属于一个系。(2)一个系只有一名主任。(3)一个学生可以选修多门课程,每门课程有若干学生选修。(4)每个学生所学的每门课程都有一个成绩。,从上述事实我们可以得到属性集U上的一组函数依赖F:FSnoSdept,SdeptMname,(Sno,Cname)Grade如果只考虑函数依赖这一种数据依赖,我们就得到了一个描述学生的关系模式:Student,函数依赖的定义:设关系模式R(U,F),U是属性全集,F是U上的函数依赖集,X和Y是U的子集,如果对于R(U)的任意一个可能的关系r,对于X的每一个具体值,Y都有唯一的具体值与之对应,则称X决定函数Y,或Y函数依赖于X,记作XY。我们称X为决定因素,Y为依赖因素。当Y不函数依赖于X时,记作:XY。当XY且YX时,则记作:XY。对于关系模式SCDU=SNO,SN,AGE,DEPT,MN,CNO,SCOREF=SNOSN,SNOAGE,SNODEPT,有关函数依赖的几点说明:1平凡的函数依赖与非平凡的函数依赖。当属性集Y是属性集X的子集时,则必然存在着函数依赖XY,这种类型的函数依赖称为平凡的函数依赖。如果Y不是X的子集,则称XY为非平凡的函数依赖。若不特别声明,我们讨论的都是非平凡的函数依赖。2函数依赖是语义范畴的概念。我们只能根据语义来确定一个函数依赖,而不能按照其形式化定义来证明一个函数依赖是否成立。例如,对于关系模式S,当学生不存在重名的情况下,可以得到:SNAGESNDEPT这种函数依赖关系,必须是在没有重名的学生条件下才成立的,否则就不存在函数依赖了。所以函数依赖反映了一种语义完整性约束。,3函数依赖与属性之间的联系类型有关。(1)在一个关系模式中,如果属性X与Y有1:1联系时,则存在函数依赖XY,YX,即XY。例如,当学生无重名时,SNOSN。(2)如果属性X与Y有1:m的联系时,则只存在函数依赖XY。例如,SNO与AGE,DEPT之间均为1:m联系,所以有SNOAGE,SNODEPT。(3)如果属性X与Y有m:n的联系时,则X与Y之间不存在任何函数依赖关系。例如,一个学生可以选修多门课程,一门课程又可以为多个学生选修,所以SNO与CNO之间不存在函数依赖关系。由于函数依赖与属性之间的联系类型有关,所以在确定属性间的函数依赖关系时,可以从分析属性间的联系类型入手,便可确定属性间的函数依赖。,4函数依赖关系的存在与时间无关。因为函数依赖是指关系中的所有元组应该满足的约束条件,而不是指关系中某个或某些元组所满足的约束条件。当关系中的元组增加、删除或更新后都不能破坏这种函数依赖。因此,必须根据语义来确定属性之间的函数依赖,而不能单凭某一时刻关系中的实际数据值来判断。例如,对于关系模式S,假设没有给出无重名的学生这种语义规定,则即使当前关系中没有重名的记录,也只能存在函数依赖SNOSN,而不能存在函数依赖SNSNO,因为如果新增加一个重名的学生,函数依赖SNSNO必然不成立。所以函数依赖关系的存在与时间无关,而只与数据之间的语义规定有关。,5函数依赖可以保证关系分解的无损连接性。设R(X,Y,Z),X,Y,Z为不相交的属性集合,如果XY或XZ,则有R(X,Y,Z)=RX,Y*RX,Z,其中,RX,Y表示关系R在属性(X,Y)上的投影,即R等于其投影在X上的自然连接,这样便保证了关系R分解后不会丢失原有的信息,称作关系分解的无损连接性。例如,对于关系模式SCD,有SNO(SN,AGE,DEPT,MN),SCD(SNO,SN,AGE,DEPT,MN,CNO,SCORE)=SCDSNO,SN,AGE,DEPT,MN*SCDSNO,CNO,SCORE,也就是说,用其投影在SNO上的自然连接可复原关系模式SCD。这一性质非常重要,在后一节的关系规范化中要用到。,函数依赖的基本性质1投影性。根据平凡的函数依赖的定义可知,一组属性函数决定它的所有子集。例如,在关系SCD中,(SNO,CNO)SNO和(SNO,CNO)CNO。2扩张性。若XY且WZ,则(X,W)(Y,Z)。例如,SNO(SN,AGE),DEPTMN,则有(SNO,DEPT)(SN,AGE,MN)。3合并性。若XY且XZ则必有X(Y,Z)。例如,在关系SCD中,SNO(SN,AGE),SNO(DEPT,MN),则有SNO(SN,AGE,DEPT,MN)。4分解性。若X(Y,Z),则XY且XZ。很显然,分解性为合并性的逆过程。由合并性和分解性,很容易得到以下事实:XA1,A2,,An成立的充分必要条件是XAi(i=1,2,n)成立。,完全函数依赖与部分函数依赖定义:设关系模式R(U),U是属性全集,X和Y是U的子集,如果XY,并且对于X的任何一个真子集X,都有XY,则称Y对X完全函数依赖(FullFunctionalDependency),记作XY。如果对X的某个真子集X,有XY,则称Y对部分函数依赖(PartialFunctionalDependency),记作XY。例如,在关系模式SCD中,因为SNOSCORE,且CNOSCORE,所以有:(SNO,CNO)SCORE。而SNOAGE,所以(SNO,CNO)AGE。由定义可知:只有当决定因素是组合属性时,讨论部分函数依赖才有意义,当决定因素是单属性时,只能是完全函数依赖。例如,在关系模式S(SNO,SN,AGE,DEPT),决定因素为单属性SNO,有SNO(SN,AGE,DEPT),不存在部分函数依赖。,传递函数依赖定义:设有关系模式R(U),U是属性全集,X,Y,Z是U的子集,若XY,但YX,而YZ(YX,ZY),则称Z对X传递函数依赖(TransitiveFunctionalDependency),记作:XZ。如果YX,则XY,这时称Z对X直接函数依赖,而不是传递函数依赖。例如,在关系模式SCD中,SNODEPTN,但DEPTNSNO,而DEPTNMN,则有SNOMN。当学生不存在重名的情况下,有SNOSN,SNSNO,SNOSN,SNDEPTN,这时DEPTN对SNO是直接函数依赖,而不是传递函数依赖。综上所述,函数依赖分为完全函数依赖、部分函数依赖和传递函数依赖三类,它们是规范化理论的依据和规范化程度的准则,下面我们将以介绍的这些概念为基础,进行数据库的规范设计。,3.3规范化-范式,规范化的基本思想是消除关系模式中的数据冗余,消除数据依赖中的不合适的部分,解决数据插入、删除时发生异常现象。这就要求关系数据库设计出来的关系模式要满足一定的条件。我们把关系数据库的规范化过程中为不同程度的规范化要求设立的不同标准称为范式(NormalForm)。由于规范化的程度不同,就产生了不同的范式。满足最基本规范化要求的关系模式叫第一范式,在第一范式中进一步满足一些要求为第二范式,以此类推就产生了第三范式等概念。每种范式都规定了一些限制约束条件。,范式的概念最早由E.F.Codd提出。从1971年起,Codd相继提出了关系的三级规范化形式,即第一范式(1NF)、第二范式(2NF)、第三范式(3NF)。1974年,Codd和Boyce以共同提出了一个新的范式的概念,即Boyce-Codd范式,简称BC范式。1976年Fagin提出了第四范式,后来又有人定义了第五范式。至此在关系数据库规范中建立了一个范式系列:1NF,2NF,3NF,BCNF,4NF,5NF,一级比一级有更严格的要求。各个范式之间的联系可以表示为:5NF4NFBCNF3NF2NF1NF,第一范式(FirstNormalForm)第一范式是最基本的规范形式,即关系中每个属性都是不可再分的简单项。定义3.1:如果关系模式R,其所有的属性均为简单属性,即每个属性都城是不可再分的,则称R属于第一范式,简称1NF,记作R1NF。在讨论关系的性质时,我们把满足这个条件的关系称为规范化关系。在关系数据库系统中只讨论规范化的关系,凡是非规范化的关系模式必须化成规范化的关系。在非规范化的关系中去掉组合项就能化成规范化的关系。每个规范化的关系都属于1NF,这也是它之所以称为“第一”的原因。,第二范式(SecondNormalForm)-消除部分依赖如果关系模式R1NF,且每个非主属性都完全函数依赖于R的每个关系键,则称R属于第二范式(SecondNormalForm),简称2NF,记作R2NF。在关系模式SCD中,SNO,CNO为主属性,AGE,DEPT,MN,MN,SCORE均为非主属性,经上述分析,存在非主属性对关系键的部分函数依赖,所以SCD不属于2NF。而如图3.2所示的由SCD分解的三个关系模式S,D,SC,其中S的关系键为SNO,D的关系键为DEPT,都是单属性,不可能存在部分函数依赖。(doc文档中)而对于SC,(SNO,CNO)SCORE。所以SCD分解后,消除了非主属性对关系键的部分函数依赖,S,D,SC均属于2NF。,第二范式(SecondNormalForm)-消除部分依赖经以上分析,可以得到两个结论:1从1NF关系中消除非主属性对关系键的部分函数依赖,则可得到2NF关系。2如果R的关系键为单属性,或R的全体属性均为主属性,则R2NF。,第二范式(SecondNormalForm)的缺点2NF的关系模式解决了1NF中存在的一些问题,2NF规范化的程度比1NF前进了一步,但2NF的关系模式在进行数据操作时,仍然存在着一些问题:1数据冗余。每个系名和系主任的名字存储的次数等于该系的学生人数。2插入异常。当一个新系没有招生时,有关该系的信息无法插入。3删除异常。某系学生全部毕业而没有招生时,删除全部学生的记录也随之删除了该系的有关信息。4更新异常。更换系主任时,仍需改动较多的学生记录。之所以存在这些问题,是由于在SCD中存在着非主属性对主键的传递依赖。分析SCD中的函数依赖关系,SNOSN,SNOAGE,SNODEPT,DEPTMN,SNOMN,非主属性MN对主键SNO传递依赖。为此,对关系模式SCD还需进一步简化,消除这种传递依赖,得到3NF。,第三范式(ThirdNormalForm)-消除传递依赖如果关系模式R2NF,且每个非主属性都不传递依赖于R的每个关系键,则称R属于第三范式(ThirdNormalForm),简称3NF,记作R3NF。第三范式具有如下性质:1如果R3NF,则R也是2NF。2如果R2NF,则R不一定是3NF。,第三范式(ThirdNormalForm)-消除非主属性传递依赖3NF规范化是指把2NF关系模式通过投影分解转换成3NF关系模式的集合。和2NF的规范化时遵循的原则相同,即“一事一地”,让一个关系只描述一个实体或者实体间的联系。下面以2NF关系模式SD为例,来说明3NF规范化的过程。(doc文档),第三范式(ThirdNormalForm)-消除非主属性传递依赖但是,3NF只限制了非主属性对键的依赖关系,而没有限制主属性对键的依赖关系。如果发生了这种依赖,仍有可能存在数据冗余、插入异常、删除异常和修改异常。这时,则需对3NF进一步规范化,消除主属性对键的依赖关系,为了解决这种问题,Boyce与Codd共同提出了一个新范式的定义,这就是Boyce-Codd范式,通常简称BCNF或BC范式。它弥补了3NF的不足。消除主属性对键的依赖关系。BCNF规范化是指把3NF关系模式通过投影分解转换成BCNF关系模式的集合。,BC范式(Boyce-CoddNormalForm)-完全消除传递依赖和部分依赖BC范式的定义定义:如果关系模式R1NF,且所有的函数依赖XY(YX),决定因素X都包含了R的一个候选键,则称R属于BC范式(Boyce-CoddNormalForm),记作RBCNF。BCNF具有如下性质:1满足BCNF的关系将消除任何属性(主属性或非主属性)对键的部分函数依赖和传递函数依赖。也就是说,如果RBCNF,则R也是3NF。2如果R3NF,则R不一定是BCNF。,如果一个关系数据库中所有关系模式都属于3NF,则已在很大程度上消除了插入异常和删除异常,但由于可能存在主属性对候选键的部分依赖和传递依赖,因此关系模式的分离仍不够彻底。如果一个关系数据库中所有关系模式都属于BCNF,那么在函数依赖的范畴内,已经实现了模式的彻底分解,消除了产生插入异常和删除异常的根源,而且数据冗余也减少到极小程度。,关系模式的规范化到目前为止,规范化理论已经提出了六类范式(有关4NF和5NF的内容不再详细介绍)。各范式级别是在分析函数依赖条件下对关系模式分离程度的一种测度,范式级别可以逐级升高。一个低一级范式的关系模式,通过模式分解转化为若干个高一级范式的关系模式的集合,这种分解过程叫作关系模式的规范化(Normalization)。关系模式规范化的目的和原则一个关系只要其分量都是不可分的数据项,就可称作规范化的关系,但这只是最基本的规范化。这样的关系模式是合法的。但人们发现有些关系模式存在插入、删除、修改异常、数据冗余等弊病。规范化的目的就是使结构合理,消除存储异常,使数据冗余尽量小,便于插入、删除和更新。,关系模式规范化的原则规范化的基本原则就是遵从概念单一化“一事一地”的原则,即一个关系只描述一个实体或者实体间的联系。若多于一个实体,就把它“分离”出来。因此,所谓规范化,实质上是概念的单一化,即一个关系表示一个实体。,关系模式规范化的步骤规范化就是对原关系进行投影,消除决定属性不是候选键的任何函数依赖。具体可以分为以下几步:1对1NF关系进行投影,消除原关系中非主属性对键的部分函数依赖,将1NF关系转换成若干个2NF关系。2对2NF关系进行投影,消除原关系中非主属性对键的传递函数依赖,将2NF关系转换成若干个3NF关系。3对3NF关系进行投影,消除原关系中主属性对键的部分函数依赖和传递函数依赖,也就是说使决定因素都包含一个候选键。得到一组BCNF关系。,关系模式规范化的要求关系模式的规范化过程是通过对关系模式的投影分解来实现的,但是投影分解方法不是唯一的,不同的投影分解会得到不同的结果。在这些分解方法中,只有能够保证分解后的关系模式与原关系模式等价的方法才是有意义的。下面先给出两个定义:无损连接性(LosslessJoin):设关系模式R(U,F)被分解为若干个关系模式R1(U1,F1),R2(U2,F2),,Rn(Un,Fn),其中U=U1U2UN,且不存在UNUj式,Fi为F在Uj上的投影,如果R与R1,R2,Rn自然连接的结果相等,则称关系模式R的分解具有无损连接性。函数依赖保持性(PreserveDependency):设关系模式R(U,F)被分解为若干个关系模式R1(U1,F1),R2(U2,F2),,Rn(Un,Fn),其中U=U1U2UN,且不存在UNUj式,Fi为F在Uj上的投影,如果F所蕴含的函数依赖一定也由分解得到的某个关系模式中的函数依赖Fi所蕴含,则称关系模式R的分解具有函数依赖保持性。,关系模式规范化的要求判断对关系模式的一个分解是否与原关系模式等价可以有三种不同的标准:1分解要具有无损连接性。2分解要具有函数依赖保持性。3分解既要具有无损连接性,又要具有函数依赖保持性。对于关系模式SD(SNO,SN,AGE,DEPT,MN),规范到3NF,可以有以下三种不同的分解方法,分析各种方法是否符合规范化要求(doc文档),规范化理论提供了一套完整的模式分解方法,按照这套算法可以做到:如果要求分解既具有无损连接性,以具有函数依赖保持性,则分解一定能够达到3NF,但不一定能够达到BCNF。所以在3NF的规范化中,既要检查分解是否具有无损连接性,又要检查分解是否具有函数依赖保持性。只有这两条都满足,才能保证分解的正确性和有效性,才既不会发生信息丢失,又保证关系中的数据满足完整性约束。,选:多值依赖与第4范式(4NF)设学校中某一门课程由多个教员讲授,他们使用相同的一套参考书。我们可以用一个关系模式Teach(C,T,B)来表示。,把这张表变成一张规范化的二维表,如表7.2所示。(1)数据冗余度大。(2)增加操作复杂。(3)删除操作复杂。(4)修改操作复杂。,多值依赖定义:设R(U)是一个属性集U上的一个关系模式,X、Y和Z是U的子集,并且ZUXY。多值依赖XY成立,当且仅当对R的任一关系r,r在(X,Z)上的每个值对应一组Y值,这组值仅仅决定于X值而与Z值无关。多值依赖具有下列性质:(1)多值依赖具有对称性。即若XY,则XZ,其中ZUXY。,(2)函数依赖可以看作是多值依赖的特殊情况。即若XY,则XY。多值依赖与函数依赖相比,具有下面两个基本区别:,(1)多值依赖的有效性与属性集的范围有关。若XY在U上成立则在W(XYWU)上一定成立;反之则不然,即XY在W(WU)上成立,在U上并不一定成立。这是因为多值依赖的定义中不仅涉及属性组X和Y,而且涉及U中其余属性Z。(2)若函数依赖XY在R(U)上成立,则对于任何YY均有XY成立。而多值依赖XY若在R(U)上成立,却不能断言对于任何YY有XY成立。,7.4.2第4范式(4NF)定义7.9关系模式RlNF,如果对于R的每个非平凡多值依赖XY(YX),X都含有候选码,则称R4NF。,3.4函数依赖的公理化系统,数据依赖的公理系统,Armstrong公理系统。定义7.10对于满足一组函数依赖F的关系模式R,其任何一个关系r,若函数依赖XY都成立(即r中任意两元组t,s,若tX=sX,则tY=sY),则称F逻辑蕴含XY。,Armstrong公理系统设U为属性集总体,F是U上的一组函数依赖,于是有关系模式R。对R来说有以下的推理规则:Al.自反律(Reflexivity):若YXU,则XY为F所蕴含。A2.增广律(Augmentation):若XY为F所蕴含,且ZU,则XZYZ为F所蕴含。A3.传递律(Transitivity):若XY及YZ为F所蕴含,则XZ为F所蕴含。,定理7.lArmstrong推理规则是正确的。证(l)设YXU。对R的任一关系r中的任意两个元组t,s:若tX=sX,由于YX,有ty=sy,所以XY成立,自反律得证。,(2)设XY为F所蕴含,且ZU。设R的任一关系r中任意的两个元组t,s;若tXZ=sXZ,则有tX=sX和tZ=sZ;由XY,于是有tY=sY,所以tYZ=sYZ,所以XZYZ为F所蕴含,增广律得证。,(3)设XY及YZ为F所蕴含。对R的任一关系r中的任意两个元组t,s。若tX=sX,由于XY,有tY=sY;再由YZ,有tZ=sZ,所以XZ为F所蕴含,传递律得证。根据A1,A2,A3这3条推理规则可以得到下面3条很有用的推理规则:,合并规则:由XY,XZ,有XYZ。伪传递规则:由XY,WYZ,有XWZ。分解规则:由XY及ZY,有XZ。根据合并规则和分解规则,很容易得到这样一个重要事实:引理7.lXA1A2Ak成立的充分必要条件是XAi成立(i=l,2,k)。,定义7.l1在关系模式R中为F所逻辑蕴含的函数依赖的全体叫作F的闭包,记为F+。人们把自反律、传递律和增广律称为Armstrong公理系统。Armstrong公理系统是有效的、完备的。Armstrong公理的有效性指的是:由F出发根据Armstrong公理推导出来的每一个函数依赖一定在F+中;完备性指的是F+中的每一个函数依赖,必定可以由F出发根据Armstrong公理推导出来。,要证明完备性,首先要解决如何判定一个函数依赖是否属于由F根据Armstrong公理推导出来的函数依赖的集合。当然,如果能求出这个集合,问题就解决了。但不幸的是,这是一个NP完全问题。比如从F=XA1,XAn出发,至少可以推导出2n个不同的函数依赖为此引入了下面的概念:,定义7.12设F为属性集U上的一组函数依赖,XU,XF+=A|XA能由F根据Armstrong公理导出,XF+称为属性集X关于函数依赖集F的闭包。由引理7.1容易得出:引理7.2设F为属性集U上的一组函数依赖,X,YU,XY能由F根据Armstrong公理导出的充分必要条件是YXF+。于是,判定XY是否能由F根据Armstrong公理导出的问题,就转换为求出XF+,判定Y是否为XF+的子集的问题。这个问题由算法7.l解决了。,算法7.l求属性集X(XU)关于U上的函数依赖集F的闭包XF+。输入:X,F输出:XF+,步骤:(1)令X(0)=X,i=0(2)求B,这里B=A|(V)(W)(VWFVX(i)AW);(3)X(i+1)=BX(i)(4)判断X(i+1)=x(i)吗?(5)若相等或X(i)=U则X(i)就是XF+,算法终止。(6)若否,则i=i+l,返回第(2)步。,例1已知关系模式R,其中U=A,B,C,D,E;F=ABC,BD,CE,ECB,ACB。求(AB)F+。解由算法7.1,设X(0)=AB;计算X(1);逐一扫描F集合中各个函数依赖,找左部为A,B或AB的函数依赖,得到两个:ABC,BD,于是X(1)=ABCD=ABCD。,因为X(0)X(1),所以再找出左部为ABCD子集的那些函数依赖,又得到CE,ACB,于是X(2)=X(1)BE=ABCDE。因为X(2)已等于全部属性集合,所以(AB)F+=ABCDE。对于算法7.l,令ai=|X(i)|,ai形成一个步长大于1的严格递增的序列,序列的上界是|U|,因此该算法最多|U|X|次循环就会终止。,定理7.2Armstrong公理系统是有效的、完备的。Armstrong公理系统的有效性可由定理7.l得到证明。完备性的证明从略,有兴趣的读者请参考7。Armstrong公理的完备性及有效性说明了“导出”与“蕴含”是两个完全等价的概念。于是F+也可以说成是由F出发借助Armstrong公理导出的函数依赖的集合。从蕴含(或导出)的概念出发,又引出
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年工业互联网平台同态加密技术在地质勘探领域的应用与可行性研究报告
- 2025年社区心理健康服务在社区应急响应中的应对机制报告
- 涉水产品知识培训内容课件
- 做菜配料知识培训课件
- 2025年物流行业射频识别(RFID)技术应用深度研究及市场前景预测报告
- 疟原虫检查培训课件
- 涉外律师基础知识培训课件
- gis内部连锁培训课件
- 涉企社保知识培训课件
- 福彩资金使用效率-洞察及研究
- 2025年学历类自考专业(学前教育)学前儿童发展-学前教育原理参考题库含答案解析(5套)
- 日本设备销售合同范本
- (2024)大学生宪法知识竞赛题库及答案
- 2025年芜湖市鸠江区医院招聘16名工作人员笔试参考题库附答案解析
- T-CBDA 86-2025 建筑幕墙、采光顶及金属屋面工程质量验收标准
- 厨房消防安全培训
- 小陈 税务风险应对常见指标与答复思路
- 2025云南昭通昭阳区住房和城乡建设局招聘编外工作人员5人笔试备考题库及答案解析
- 2025年《中华人民共和国档案法》知识培训试题及答案
- 新高一数学暑假检测卷(学生版)-2025年新高一数学暑假衔接讲练 (人教A版)
- 2025至2030年中国建筑膜行业市场调查研究及发展趋势预测报告
评论
0/150
提交评论