数据库原理-2关系数据库.ppt_第1页
数据库原理-2关系数据库.ppt_第2页
数据库原理-2关系数据库.ppt_第3页
数据库原理-2关系数据库.ppt_第4页
数据库原理-2关系数据库.ppt_第5页
已阅读5页,还剩94页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

数据库系统原理(第2章),第二章 关系数据库,2-5章为本课程重点与难点 关系数据库的理论基础 1970, E.F.Codd “A Relational Model of Data for Shared Data Banks” 现代主流数据库几乎全部支持关系模型 Oracle(甲骨文),Sybase, IBM DB2, MS SQL Server, Ingres,2.1 关系模型概述,关系模型由关系数据库、关系操作集合和关系完整性约束三部分组成。 单一的数据结构关系 实体和实体之间的联系都用关系描述,二. 关系操作 就关系模型而言,仅仅给出了关系操作的能力,并不给定(限定)RDBMS语言的语法要求。 关系操作的特点:一次一集合的操作方式 Set-at-a-Time 操作的对象和结果都是关系。,三种具有相同表达能力的抽象查询语言: 关系代数 ISBL 元组关系演算语言 ALPHA,QUEL 域关系演算语言 QBE,SQL则是介于关系代数和关系演算之间的标准查询语言。 由IBM提出,是应用得最广泛的关系数据库标准语言。,三. 关系的三类完整性约束条件 关系模型必须满足:实体完整性和参照完整性约束。 应用领域中的大量语义约束则由DBMS实现的用户定义完整性保证。 注意:这是由DBMS来保证的,而非应用程序保证。,2.2 关系数据结构及其形式化定义,从集合论的角度给出关系数据结构的形式化定义。(需要离散数学集合论的概念) 2.2.1 关系 (Relation) 1.域 定义2.1: 域是具有相同数据类型的值的集合。 如自然数,全班同学的名字等。,2.2 笛卡儿集(卡氏集) 定义2.2 给定一组域D1,D2,Dn,这些域中可以有相同的, D1,D2,Dn的笛卡儿集为: D1D2Dn(d1,d2,dn)| diDi, i=1,2,n,其中每一个元素称为一个n元组,元素中的每个值称为一个分量。,例:D1=大,中,小,D2=红,绿,例:D1=大,中,小,D2=红,绿 D1D2=(大,红),(大,绿),(中,红),(中,绿),(小,红),(小,绿) 共有326个2元组,注意:集合论中笛卡儿集不满足交换率,即笛卡儿集的元组有序。 基数的概念: 若Di(i=1,2,n)为有限集,其基数为|Di|,则D1D2 Dn的基数为: |D1|D2| |Dn|,3. 关系 定义2.3 D1D2 Dn的任意子集叫做在域D1,D2, ,Dn上的关系,可记做: R(D1,D2, ,Dn),R为关系名,n是关系的目或度(degree)。,注意: 1. 这里的“子集”是“任意子集”,包括空集。 2. 笛卡儿集不满足交换率,而关系通过给关系的列附加属性名的方式取消元组的有序性。 3. 按2.3的定义,关系可以是无限集。通常我们在关系数据模型中限定关系为有限关系。,候选码若关系中的某一属性组的值能唯一地标识一个元组,则称该属性组为该关系的一个候选码(Candidate Key)。 一个关系可能有多个候选码,则选定其中一个作为主码(Primary Key)。 包含在任何候选码中的属性称为主属性,不包含在任何候选码中的属性称为非主属性。 全码(All-Key)关系模式的所有属性组构成此关系模式的唯一候选码。,基本关系六性质 列是同质的; 不同列可出自同一个域,每一列为一个属性,不同属性(列)给不同属性名; 列的顺序可任意交换; 任意两个元组不能完全相同; 行的顺序可任意交换; 每一分量是不可分的数据项。 记忆方法:三列两行一分量。,注意:在许多实际关系数据库产品中,基本表并不完全具有这六条性质,例如,有的数据库产品(如FoxPro)仍然区分了属性顺序和元组的顺序;许多关系数据库产品中,例如Oracle,FoxPro等,它们都允许关系表中存在两个完全相同的元组。,2.2.2 关系模式 关系模式是对关系的描述。(是对型的描述) 需描述元组集合的结构:由哪些属性构成,这些属性来自哪些域,以及属性与域之间的映象关系。 此外,关系模式应刻划出完整性约束条件。,定义2.4 关系的描述称为关系模式,可表述为:R(U,D,dom,F) 其中R为关系名,U为组成该关系地属性名集合,D为属性组U中属性所来自的域,dom为属性向域的映象集合,F为属性间数据的依赖关系集。,关系模式通常可以简记为: R(U)或R(A1,A2, ,AN) 其中R为关系名,A1,A2, ,AN为属性名。而域名及属性向域的映象常常直接说明为属性的类型、长度。 关系模式是静态度、稳定的,而关系是动态的、随时间变化的,两者是型与值的关系。,2.2.3 关系数据库 在给定应用领域中,用于描述所有实体和实体间的联系的关系的集合构成一个关系数据库。同样,关系数据库也有型和值之分。 型:关系数据库模式 是对关系数据库的描述。 值:一般就称为关系数据库。,2.3 关系的完整性,关系模型的完整性规则是对关系的某种约束条件。 关系模型的三类完整性: 实体完整性 参照完整性 用户定义的完整性,其中实体完整性和参照完整性是关系模型必须满足的完整性约束条件,被称为是关系的两个不变性,应该由关系系统自动支持。 一、实体完整性 实体完整性规则(规则2.1):每一关系必有一主码,构成主码的各属性值均不能取空值。 实体完整性规则规定基本关系的所有主码的各属性都不能取空值,而不仅是主码整体不能取空值。,例如学生选课关系“选修(学号,课程号,成绩)”中,“学号、课程号”为主码,则“学号”和“课程号”都不能取空值,而不是整体不为空。 实体完整性可以引申一下,主码也不能取重复值。,有关实体完整性的说明: (1)实体完整性规则是针对基本关系而言的。一个基本表通常对应现实世界的一个实体集。(名字怎么来的) (2) 现实世界中的实体是可区分的,即它们具有某种唯一性标识。 (3) 相应地,关系模型中以主码作为唯一标识。 (4) 主码中的属性即主属性不能取空值。所谓空值就是“不知道”或“不确定”的值。,二、参照完整性 现实世界中的实体之间往往存在某种联系,在关系模型中实体及实体间的联系都是用关系来描述的。这样就自然存在着关系与关系之间的引用。 引用的时候,必须取基本表中已经存在的值。由此引出参照的引用规则。 参照完整性规则就是定义外码与主码之间的引用规则。,定义2.5 设F是基本关系R的一个或一组属性,但不是关系R的码,如果F与基本关系S的主码Ks相对应,则称F是基本关系R的外码(Foreign key),并称基本关系R为参照关系(Referencing relation),基本关系S为被参照关系(Referenced relation)或目标关系(Target relation)。关系R和S不一定是不同的关系。,参照完整性规则(规则2.2):若属性(或属性组)F是基本关系R的外码,它与基本关系S的主码Ks相对应(基本关系R和S不一定是不同的关系),则对于R中每个元组在F上的值必须为: 或者取空值(F的每个属性值均为空值); 或者等于S中某个元组的主码值。,例如,学生选课系统,选课关系的学号按实体完整性要求,不能为空;按参照完整性要求,只能选学生关系中的学号,表示语义关系“只有注册的学生才能选课”。课程号也类似(请同学们自己考虑)。,三、用户定义的完整性(User-defined integrity) 实体完整性和参照性适用于任何关系数据库系统。除此之外,不同的关系数据库系统根据其应用环境的不同,往往还需要一些特殊的约束条件。用户定义的完整性就是针对某一具体关系数据库的约束条件,它反映某一具体应用所涉及的数据必须满足的语义要求。关系模型应提供定义和检验这类完整性的机制,以便用统一的系统的方法处理它们,而不要由应用程序承担这一功能。,2.4 关系代数,本节要求 给定关系和关系代数表达式,要会算。 给定关系模式和查询(语义)要求,要会写关系代数表达式。,关系代数是一种抽象的查询语言,用对关系的运算来表达查询,作为研究关系数据语言的数学工具。 关系代数的运算对象是关系,运算结果亦为关系。关系代数用到的运算符包括四类:集合运算符、专门的关系运算符、算术比较符和逻辑运算符。,比较运算符和逻辑运算符是用来辅助专门的关系运算符进行操作的,所以关系代数的运算按运算符的不同,主要分为传统的集合运算和专门的关系运算两类。,2.4.1 传统的集合运算,是四种二目运算: ,把关系看作元组的集合,于是,这四种运算与传统集合运算类似。,其中, 三种运算要求参与运算的两个关系R,S具有相同的目n,且相应属性取自同一个域。 并 :RSt|tRtS 交 :RSt|tRtS 差 :RSt|tRtS, 广义笛卡尔积(Extended cartesian product) 元组连接的记号: R为n目关系,S为m目关系。 tr ts 称为元组的连接(Concatenation)。它是一个(n+m)列的元组,前n个分量为R中的一个n元组,后m个分量为S中的一个m元组。,两个分别为n目和m目的关系R和S的广义笛卡尔积是一个(n+m)列的元组的集合。元组的前n列是关系R的一个元组,后m列是关系S的一个元组。记作: RStr ts|trRtsS 若R有k1个元组,S有k2个元组,则关系R和关系S的广义笛卡尔积有k1k2个元组。,2.4.2 专门的关系运算,一般包括选择、投影、连接和除。,1.选择 选择又称为限制(Restriction)。它是在关系R中选择满足给定条件的诸元组,记作: F(R) = t|tR F(t)=真 其中F表示选择条件,它是一个逻辑表达式,取逻辑值真或假。,逻辑表达式F的基本形式为: X1 Y1 X2 Y2 表示比较运算符,它可以是、或。X1、Y1等是属性名或常量或简单函数。属性名也可以用它的序号来代替。表示逻辑运算符,它可以是、或。 因此选择运算实际上是从关系R中选取使逻辑表达式F为真的元组。这是从行的角度进行的运算。,设有一个学生-课程关系数据库,包括学生关系Student、课程关系Course和选修关系SC。(下面的例子都针对这三个关系进行运算。) 例1 查询信息系(IS系)全体学生 Sdept=IS(Student) 或 4=IS(Student) 例2 查询年龄小于20岁的元组 Sage20(Student) 或420(Student) 。,补充例1: 查询信息系的年龄小于20岁的学生,补充例1: 查询信息系的年龄小于20岁的学生 Sdept=IS Sage20(Student),补充例1: 查询信息系的年龄小于20岁的学生 Sdept=IS Sage20(Student) 当然也可以表示为 Sdept=IS (Student) Sage20(Student) (注:双目运算符的优先级低于单目运算符),2. 投影(Projection) 先介绍与投影有关的两个记号: 一. (元组属性分量记号) 设关系模式为R(A1, A2, , An)。它的一个关系设为R。tR表示t是R的一个元组。tAi则表示元组t中相应于属性Ai的一个分量 。,二. (元组属性列分量记号) 若A=Ai1, Ai2, , Aik,其中Ai1, Ai2, , Aik是A1, A2, , An中的一部分,则A称为属性列或域列。A则表示A1, A2, , An中去掉Ai1, Ai2, , Aik后剩余的属性组。tA=(tAi1, tAi2, , tAik)表示元组t在属性列A上诸分量的集合。,关系R上的投影是从R中选择出若干属性列组成新的关系。记作: A(R) = tA | tR 其中A为R中的属性列。 基本思想是从关系中消除某些属性,投影也可能消除掉某些行。 因为取消了某些属性列后,就可能出现重复行,应取消这些完全相同的行。,例3 查询学生关系Student在学生姓名和所在系两个属性上的投影 Sname,Sdept(Student) 或 2,5(Student),例4 查询学生关系Student中都有哪些系,即查询学生关系Student在所在系属性上的投影 : Sdept(Student),补充例2: (投影与选择的混合运算) 查询信息系学生的姓名和年龄。,补充例2: (投影与选择的混合运算) 查询信息系学生的姓名和年龄。 Sname,Sage Sdept=IS(Student) (注:单目运算为右结合),3. 连接 连接也称为连接。它是从两个关系的笛卡尔积中选取属性间满足一定条件的元组。记作: R S=tr ts | tr R tsS trA tsB AB 其中A和B分别为R和S上度数相等且可比的属性组。是比较运算符。连接运算从R和S的笛卡尔积RS中选取(R关系)在A属性组上的值与(S关系)在B属性组上值满足比较关系的元组。,连接运算中有两种最为重要也最为常用的连接,一种是等值连接(equi-join),另一种是自然连接(Natural join)。 为“”的连接运算称为等值连接(equi-join) 。它是从关系R与S的笛卡尔积中选取A、B属性值相等的那些元组。 自然连接(Natural join)是一种特殊的等值连接,它要求两个关系中进行比较的分量必须是相同的属性组,并且要在结果中把重复的属性去掉。 一般的连接操作是从行的角度进行运算。但自然连接还需要取消了重复列,所以是同时从行和列的角度进行运算。,连接的计算 首先根据连接的类型(连接、自然连接),确定结果的属性。 计算过程类似二重循环。 如P50.图2.6(c) (d) (e),补充例3:求选了2号课程的学生的学号和姓名。,补充例3:求选了2号课程的学生的学号和姓名。 Sno,SName(Student Cno=2 SC),补充例4:求选修数据库原理的学生的学号和姓名。 Sno,SName(Student SC Cname=数据库原理 Course),注意:自然连接在没有相同的属性组时退化为广义笛卡儿集运算。,4. 除 () 先介绍与除有关的记号:(象集记号) 给定一个关系R(X,Y),X和Y为属性组。我们定义,当tX=x时,x在R中的象集(Images Set)为:Yx=tY|tR, tX=x 它表示R中属性组X上值为x的诸元组在Y上分量的集合。,补充例5: 象集的计算。设R(A,B)如下 A B - 1 aa 1 ab 2 st 1 mm 求 B1,计算过程 考察r的每一个元组t 如果tA=1,则把tB放入结果。 得如下: B - aa ab mm,除的定义: 给定关系R(X,Y)和S(Y,Z),其中X, Y, Z为属性组。R中的Y与S中的Y可以有不同的属性名,但必须出自相同的域集。R与S的除运算得到一个新的关系P(X),P是R中满足下列条件的元组在X属性列上的投影:元组在X上分量值x的象集Yx包含S在Y上投影的集合。记作: RS = tX|tR Y(S) Yx 其中Yx为x在R中的象集,x=tX。,书例6.(p62) 分析:R的A相当于X,B和C相当于Y S的B和C相当于Y,D相当于Z(与结果无关)。 除的结果只有A一个属性。 a1出现在R的第1,4,7行,所以象集为(b1,c2),(b2,c3),(b2,c1) 而S在(B,C)上的投影为(b1,c2), (b2,c1),(b2,c3) a1的象集包含量S在(B,C)上的投影,所以a1出现在结果中,类似的,a2,a3,a4 的象集均不包含S在(B,C)上的投影。所以它们不出现在结果中。,例7. (不用临时关系,改用完整表达式) Sno,Cno(SC) CnoCno=1 Cno=3 (SC) 可以看出,除运算有“包含”的语义。 对于同一个查询,关系代数表达式可能不唯一。,关系运算的第二种划分方法:5种基本运算和3种附加运算。 交()的基本运算表达: RS = R-(R-S) RS = S-(S-R) RS = (R-(R-S) (S-(S-R),连接的表达: R S= F (RS) F,除的表达: R S= x(R)- x(x(R)y(S)-R),2.5 关系演算,关系演算是以数理逻辑中的谓词演算为基础的。按谓词变元的不同,关系演算可分为元组关系演算和域关系演算。本节我们通过两个实际的关系演算语言来介绍关系演算的思想。 本节内容仅要求了解。,2.5.1 元组关系演算语言ALPHA (简单了解) 元组关系演算以元组变量作为谓词变元的基本对象。一种典型的元组关系演算语言是E.F.Codd提出ALPHA语言,这一语言虽然没有实际实现,但关系数据库管理系统INGRES所用的QUEL语言是参照ALPHA语言研制的,与ALPHA十分类似。,ALPHA语言主要有GET、PUT、HOLD、UPDATE、DELETE、DROP六条语句,语句的基本格式是: 操作语句 工作空间名(表达式):操作条件,一、检索操作 检索操作用GET语句实现。 (1)简单检索(即不带条件的检索) 例1 查询所有被选修的课程号码。 GET W (SC.Cno) 注意与“查询所有的课程号码”的区别。 GET W (Course.Cno),(2)限定的检索(即带条件的检索) 例2 GET W (Student.Sno,Student.Sage): Student.Sdept=ISStudent.Sage20,(3)带排序的检索 例4 查询计算机科学系(CS)学生的学号、年龄,结果按年降序排序。 GET W (Student.Sno, Student.Sage):Student.Sdept=CS DOWN Student.Sage,(4)带定额(指定结果数量)的检索 例6 查询信息系(IS)年龄最大的学生的学号及其年龄,结果按年龄降序排序。 GET W (3) (Student.Sno, Student.Sage):Student.Sdept=IS DOWN Student.Sage,(5)用元组变量的检索 格式:RANGE 表名 变量名 元组变量两个用处: 1. 简化关系名; 2. 操作条件中使用量词时必须使用元组变量。一般情况下,操作条件中如果用到了不出现在结果表达式中的表时,必须使用量词。例如,一般连接查询常用到存在量词。,例7 查询信息系学生的名字 RANGE Student X GET W (X.Sname):X.Sdept=IS,(6)用存在量词的检索 注意语义要求,“有一个”,“任意”等语义。 例8 查询选修2号课程的学生的名字 RANGE SC X GET W (Student.Sname): X(X.Sno=Student.SnoX.Cno=2) (理解:存在一条选课记录SC(即X),使得X是要求的学生Student所选的,且X的课程号是2),(7)带有多个关系的表达式的检索 例:查询成绩在90分以上的学生名字与课程名字。 RANGE SC SCX GET W (Student.Sname,Course.Cname): SCX(Student.Sno=SCX.SnoCSX.Cno= Course.Cno CSX.Grade=90) (注:结果表达式中出现的表不需要存在量词),(8)用全称量词的检索 例:不选1号课程的学生的姓名,类似上例: GET W (Student.Sname):SCX(Student.Sno =SCX.SnoSCS.Cno=1) (理解:要求的学生不存在1号课程的选课记录),也可改为全称量词: RANGE SC SCX GET W (Student.Sname): SCX(Student.SnoSCX.Sno CS.Cno1) (理解:对于要求的学生,每一条选课记录要么不是他选的,要么不是选的1号课程),(9)用两种量词的检索 根据语义分清使用全称和存在量词的条件。 例13 查询选修了全部课程的学生姓名 RANGE Course CX RA

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论