数据库系统概论复习资料王珊版_第1页
数据库系统概论复习资料王珊版_第2页
数据库系统概论复习资料王珊版_第3页
数据库系统概论复习资料王珊版_第4页
数据库系统概论复习资料王珊版_第5页
已阅读5页,还剩71页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

数据库系统概论笔记数据(Data):是数据库中存储的基本对象数据的定义:描述事物的符号记录数据的种类:文字、图形、图象、声音等数据的特点:数据与其语义是不可分的数据库(Database,简称DB):是长期储存在计算机内、有组织的、可共享的大量数据集合数据库的特征:数据按一定的数据模型组织、描述和储存可为各种用户共享冗余度较小数据独立性较高易扩展数据库管理系统(DatabaseManagementSystem,简称DBMS):是位于用户与操作系统之间的一层数据管理软件。DBMS的用途:科学地组织和存储数据、高效地获取和维护数据DBMS的主要功能:数据库的运行管理保证数据的安全性、完整性、多用户对数据的并发使用发生故障后的系统恢复数据库的建立和维护功能(实用程序)数据库数据批量装载数据库转储介质故障恢复数据库的重组织性能监视等数据库系统(DatabaseSystem,简称DBS)是指在计算机系统中引入数据库后的系统构成。数据库系统的构成由数据库、数据库管理系统(及其开发工具)、应用系统、数据库管理员(和用户)构成。数据管理对数据进行分类、组织、编码、存储、检索和维护,是数据处理的中心问题数据模型这个工具来抽象、表示和处理现实世界中的数据和信息。数据模型应满足三方面要求 能比较真实地模拟现实世界容易为人所理解便于在计算机上实现数据模型分成两个不同的层次(1)概念模型 也称信息模型,它是按用户的观点来对数据和信息建模。(2)数据模型 主要包括网状模型、层次模型、关系模型等,它是按计算机系统的观点对数据建模客观对象的抽象过程---两步抽象现实世界中的客观对象抽象为概念模型;把概念模型转换为某一 DBMS支持的数据模型。数据结构对象类型的集合数据结构是对系统静态特性的描述两类对象与数据类型、内容、性质有关的对象与数据之间联系有关的对象数据操作对数据库中各种对象(型)的实例(值)允许执行的操作及有关的操作规则数据操作的类型检索更新(包括插入、删除、修改)数据模型对操作的定义操作的确切含义操作符号操作规则(如优先级)实现操作的语言数据操作是对系统动态特性的描述。数据模型对约束条件的定义反映和规定本数据模型必须遵守的基本的通用的完整性约束条件。提供定义完整性约束条件的机制,以反映具体应用所涉及的数据必须遵守的特定的语义约束条件。信息世界中的基本概念(1)实体(Entity)客观存在并可相互区别的事物称为实体。(2)属性(Attribute)实体所具有的某一特性称为属性。一个实体可以由若干个属性来刻画。(3)码(Key)唯一标识实体的属性集称为码。(4)域(Domain)属性的取值范围称为该属性的域。(5)实体型(EntityType)用实体名及其属性名集合来抽象和刻画同类实体称为实体型(6)实体集(EntitySet)同型实体的集合称为实体集联系(Relationship)现实世界中事物内部以及事物之间的联系在信息世界中反映为实体内部的联系和实体之间的联系实体型间联系两个实体型 一对一联系(1:1)三个实体型 一对多联系(1:n)一个实体型 多对多联系(m:n)两个实体型间的联系一对一联系如果对于实体集A中的每一个实体,实体集B中至多有一个实体与之联系, 反之亦然,则称实体集A与实体集B具有一对一联系。记为1:1。一对多联系如果对于实体集A中的每一个实体, 实体集B中有n个实体(n?0)与之联系,反之,对于实体集B中的每一个实体,实体集A中至多只有一个实体与之联系,则称实体集A与实体集B有一对多联系记为1:n多对多联系(m:n)如果对于实体集A中的每一个实体,实体集B中有n个实体(n?0)与之联系,反之,对于实体集B中的每一个实体,实体集A中也有m个实体(m?0)与之联系,则称实体集A与实体B具有多对多联系。记为m:n概念模型的表示方法实体一联系方法(E-R方法)用E-R图来描述现实世界的概念模型E-R方法也称为E-R模型常用数据模型非关系模型层次模型(HierarchicalModel)网状模型(NetworkModel)数据结构:以基本层次联系为基本单位基本层次联系:两个记录以及它们之间的一对多(包括一对一)的联系关系模型(RelationalModel)数据结构:表面向对象模型(ObjectOrientedModel)数据结构:对象层次模型满足下面两个条件的基本层次联系的集合为层次模型。.有且只有一个结点没有双亲结点,这个结点称为根结点.根以外的其它结点有且只有一个双亲结点表示方法实体型:用记录类型描述。每个结点表示一个记录类型。属性:用字段描述。每个记录类型可包含若干个字段。联系:用结点之间的连线表示记录(类)型之间的一对多的联系网状数据模型的数据结构网状模型满足下面两个条件的基本层次联系的集合为网状模型。.允许一个以上的结点无双亲;.一个结点可以有多于一个的双亲。表示方法(与层次数据模型相同)实体型:用记录类型描述。每个结点表示一个记录类型。属性:用字段描述。每个记录类型可包含若干个字段。联系:用结点之间的连线表示记录(类)型之间的一对多的父子联系。关系模型的基本概念关系(Relation)一个关系对应通常说的一张表。元组(Tuple)表中的一行即为一个元组。属性(Attribute)表中的一列即为一个属性,给每一个属性起一个名称即属性名。关系必须是规范化的,满足一定的规范条件最基本的规范条件:关系的每一个分量必须是一个不可分的数据项。查询、插入、删除、更新数据操作是集合操作,操作对象和操作结果都是关系,即若干元组的集合存取路径对用户隐蔽,用户只要指出“干什么”,不必详细说明“怎么干”关系模型的完整性约束实体完整性参照完整性用户定义的完整性关系数据模型的存储结构表以文件形式存储有的DBMS一个表对应一个操作系统文件有的DBMS自己设计文件结构关系模型的优缺点优点建立在严格的数学概念的基础上概念单一。数据结构简单、清晰,用户易懂易用实体和各类联系都用关系来表示。对数据的检索结果也是关系。关系模型的存取路径对用户透明具有更高的数据独立性,更好的安全保密性简化了程序员的工作和数据库开发建立的工作缺点存取路径对用户透明导致查询效率往往不如非关系数据模型为提高性能,必须对用户的查询请求进行优化增加了开发数据库管理系统的难强数据库系统外部的体系结构单用户结构主从式结构分布式结构客户/服务器结构浏览器/应用服务器/数据库服务器结构分布式结构的数据库系统数据库中的数据在逻辑上是一个整体,但物理地分布在计算机网络的不同结点上。网络中的每个结点都可以独立处理本地数据库中的数据,执行局部应用同时也可以同时存取和处理多个异地数据库中的数据,执行全局应用优点适应了地理上分散的公司、团体和组织对于数据库应用的需求。缺点数据的分布存放给数据的处理、管理与维护带来困难。当用户需要经常访问远程数据时,系统效率会明显地受到网络传输的制约数据库管理员(DBA)决定数据库中的信息内容和结构决定数据库的存储结构和存取策略定义数据的安全性要求和完整性约束条件关系数据库关系模型的组成关系数据结构关系操作集合关系完整性约束1)常用的关系操作查询选择、投影、连接、除、并、交、差数据更新插入、删除、修改查询的表达能力是其中最主要的部分2)关系操作的特点集合操作方式,即操作的对象和结果都是集合。非关系数据模型的数据操作方式:一次一记录文件系统的数据操作方式3)关系数据语言的种类关系代数语言用对关系的运算来表达查询要求4)关系数据语言的特点关系语言是一种高度非过程化的语言存取路径的选择由DBMS的优化机制来完成用户不必用循环结构就可以完成数据操作能够嵌入高级语言中使用关系代数、元组关系演算和域关系演算三种语言在表达能力上完全等价关系.域(Domain).笛卡尔积(CartesianProduct).关系(Relation)域是一组具有相同数据类型的值的集合。例:整数实数介于某个取值范围的整数长度指定长度的字符串集合{,男?,,女?)介于某个取值范围的日期笛卡尔积给定一组域D1,D2,…,Dn,这些域中可以有相同的。D1,D2,…,Dn的笛卡尔积为:D1xD2x…xDn={(dl,d2,…,dn)|di•:Di,i=1,2,…,n}所有域的所有取值的一个组合不能重复2)元组(Tuple)笛卡尔积中每一个元素(d1,d2,…,dn)叫作一个n元组(n-tuple)或简称元组。3)分量(Component)笛卡尔积元素(d1,d2,…,dn)中的每一个值di叫作一个分量。)基数(Cardinalnumber)若Di(i=1,2,…,n)为有限集,其基数为mi(i=1,2,…,n),则D1xD2x…xDn的基数M为:5)笛卡尔积的表示方法笛卡尔积可表示为一个二维表。表中的每行对应一个元组,表中的每列对应一个域。关系(Relation)关系D1xD2x…xDn的子集叫作在域D1,D2,…,Dn上的关系,表示为R(D1,D2,…,Dn)R:关系名n:关系的目或度(Degree)元组关系中的每个元素是关系中的元组,通常用t表示。3)单元关系与二元关系当n=1时,称该关系为单元关系 Unaryre1ati0n)。(当n=2时,称该关系为二元关系 Binaryrelation)(4)关系的表示关系也是一个二维表,表的每行对应一个元组,表的每列对应一个域。5)属性关系中不同列可以对应相同的域,为了加以区分,必须对每列起一个名字,称为属性( Attribute)。n目关系必有n个属性。6)码候选码(Candidatekey若关系中的某一属性组的值能唯一地标识一个元组,则称该属性组为候选码在最简单的情况下,候选码只包含一个属性。称为全码(All-key)在最极端的情况下,关系模式的所有属性组是这个关系模式的候选码,称为全码( Allkey)主码若一个关系有多个候选码,则选定其中一个为主码(Primarykey)主码的诸属性称为主属性( Primeattribute)。不包含在任何侯选码中的属性称为非码属性(Non-keyattribute)7)三类关系基本关系(基本表或基表)实际存在的表,是实际存储数据的逻辑表示查询表查询结果对应的表视图表由基本表或其他视图表导出的表,是虚表,不对应实际存储的数据基本关系的性质①列是同质的(Homogeneous)每一列中的分量是同一类型的数据,来自同一个域②不同的列可出自同一个域其中的每一列称为一个属性不同的属性要给予不同的属性名③列的顺序无所谓列的次序可以任意交换遵循这一性质的数据库产品(如ORACLE),增加新属性时,永远是插至最后一列但也有许多关系数据库产品没有遵循这一性质,例如FoxPro仍然区分了属性顺序④任意两个元组不能完全相同由笛卡尔积的性质决定但许多关系数据库产品没有遵循这一性质。例如:Oracle,FoxPro等都允许关系表中存在两个完全相同的元组,除非用户特别定义了相应的约束条件。⑤行的顺序无所谓行的次序可以任意交换遵循这一性质的数据库产品(如ORACLE),插入一个元组时永远插至最后一行但也有许多关系数据库产品没有遵循这一性质,例如FoxPro仍然区分了元组的顺序⑥分量必须取原子值每一个分量都必须是不可分的数据项。这是规范条件中最基本的一条关系模式(RelationSchema)是型关系是值关系模式是对关系的描述元组集合的结构属性构成属性来自的域属性与域之间的映象关系元组语义以及完整性约束条件属性间的数据依赖关系集合定义关系模式关系模式可以形式化地表示为:R(U,D,dom,F)R 关系名U 组成该关系的属性名集合D 属性组U中属性所来自的域dom 属性向域的映象集合F 属性间的数据依赖关系集合关系模式通常可以简记为R(U)或R(A1,A2,…,An)R关系名A1,A2,…,An属性名注:域名及属性向域的映象常常直接说明为属性的类型、长度关系模式对关系的描述静态的、稳定的关系关系模式在某一时刻的状态或内容动态的、随时间不断变化的关系模式和关系往往统称为关系通过上下文加以区别.关系数据库在一个给定的应用领域中,所有实体及实体之间联系的关系的集合构成一个关系数据库。.关系数据库的型与值关系数据库也有型和值之分关系数据库的型称为关系数据库模式,是对关系数据库的描述若干域的定义在这些域上定义的若干关系模式关系数据库的值是这些关系模式在某一时刻对应的关系的集合,通常简称为关系数据库3关系的完整性关系模型的完整性规则是对关系的某种约束条件。关系模型中三类完整性约束:实体完整性参照完整性用户定义的完整性实体完整性和参照完整性是关系模型必须满足的完整性约束条件,被称作是关系的两个 不变性,应该由关系系统自动支持。实体完整性实体完整性规则(EntityIntegrity)若属性A是基本关系R的主属性,则属性A不能取空值关系模型必须遵守实体完整性规则的原因(1)实体完整性规则是针对基本关系而言的。一个基本表通常对应现实世界的一个实体集或多对多联系。(2)现实世界中的实体和实体间的联系都是可区分的,即它们具有某种唯一性标识。(3)相应地,关系模型中以主码作为唯一性标识。关系模型必须遵守实体完整性规则的原因 (续)(4)主码中的属性即主属性不能取空值。空值就是“不知道”或“无意义”的值。主属性取空值,就说明存在某个不可标识的实体,即存在不可区分的实体,这与第( 2)点相矛盾,因此这个规则称为实体完整性。注意实体完整性规则规定基本关系的所有主属性都不能取空值参照完整性1.关系间的引用2.外码3.参照完整性规则1.关系间的引用在关系模型中实体及实体间的联系都是用关系来描述的,因此可能存在着关系与关系间的引用。2.夕卜码(ForeignKey)设F是基本关系R的一个或一组属性,但不是关系R的码。如果F与基本关系S的主码Ks相对应,则称F是基本关系R的外码基本关系R称为参照关系(ReferencingRelation)基本关系S称为被参照关系(ReferencedRelation)或目标关系(TargetRelation)。说明关系R和S不一定是不同的关系目标关系S的主码Ks和参照关系的外码F必须定义在同一个(或一组)域上外码并不一定要与相应的主码同名当外码与相应的主码属于不同关系时,往往 取相同的名字,以便于识别.参照完整性规则若属性(或属性组)F是基本关系R的外码它与基本关系S的主码Ks相对应(基本关系R和S不一定是不同的关系),则对于R中每个元组在F上的值必须为:■或者取空值(F的每个属性值均为空值)■或者等于S中某个元组的主码值。2.3.3用户定义的完整性用户定义的完整性是针对某一具体关系数据库的约束条件,反映某一具体应用所涉及的数据必须满足的语义要求。关系模型应提供定义和检验这类完整性的机制,以便用统一的系统的方法处理它们,而不要由应用程序承担这一功能。Operation运算,操作Operator算子Operand操作数.关系代数一种抽象的查询语言用对关系的运算来表达查询.关系代数运算的三个要素运算对象:关系运算结果:关系运算符:四类关系代数运算符隹乱集合运算符J・]X并差交广义笛卡尔积比较运算符:>■?<?土大于大于等于小于小于等于等于不等于专门的关系运算符0n.选择投影连接除逻辑运算符—1八V非与或.关系代数运算的分类传统的集合运算并、差、交、广义笛卡尔积专门的关系运算选择、投影、连接、除.表示记号(1)R,t田,t[Ai]设关系模式为R(A1,A2,…,An)它的一个关系设为R。t-R表示t是R的一个元组t[Ai]则表示元组t中相应于属性Ai的一个分量(2)A,t[A],A若A={Ail,Ai2,…,Aik},其中Ail,Ai2,…,Aik是A1,A2,…、An中的一部分,则A称为属t性列或域列。t[A]=(t[Ai1],t[Ai2],…,t[Aik]表示元组在属性列A上诸分量的集合。A则表示{A1,A2,…,An}中去掉{Ai1,Ai2,…,Aik}后剩余的属性组。(3)trtsR为n目关系,S为m目关系。trR-,tsS,trts称为元组的连接。它是一个n+m列的元组,前n个分量为R中的一个n元组,后m个分量为S中的一个m元组。4)象集Zx给定一个关系R(X,Z),X和Z为属性组。当t[X]=x时,x在R中的象集(ImagesSet)为:Zx={t[Z]ltR,t[X]=x}它表示R中属性组X上值为x的诸元组在Z上分量的集合。1.并(Union)R和S具有相同的目n(即两个关系都有n个属性)相应的属性取自同一个域仍为n目关系,由属于R或属于S的元组组成RUS={tit;RVt.S)R和S具有相同的目n相应的属性取自同一个域R-S仍为n目关系,由属于R而不属于S的所有元组组成R-S={titRAt/s)R和S具有相同的目 n相应的属性取自同一个域RnS仍为n目关系,由既属于R又属于S的元组组成RnS={titRAt-S}RnS=R-(R-S)4.广义笛卡尔积(ExtendedCartesianProduct)Rn目关系,k1个元组Sm目关系,k2个元组RxS列:(n+m)列的元组的集合元组的前n列是关系R的一个元组后m列是关系S的一个元组行:k1xk2个元组RxS={trtsitrRAtsS}专门的关系运算.选择(Selection)1)选择又称为限制(Restriction)2)选择运算符的含义在关系R中选择满足给定条件的诸元组OF(R)={titRAF(t)='真'}F:选择条件,是一个逻辑表达式,基本形式为:[(]X10Y1[)][①[-(]X20Y2[)]] …0:比较运算符(>, ?,v,?,=或<>)X1,Y1等:属性名、常量、简单函数;属性名也可以用它的序号来代替;①:逻辑运算符(A或V)□:表示任选项…:表示上述格式可以重复下去3)选择运算是从行的角度进行的运算.投影(Projection)1)投影运算符的含义从R中选择出若干属性列组成新的关系nA(R)={t[A]It:R}A:R中的属性列2)投影操作主要是从列的角度进行运算但投影之后不仅取消了原关系中的某些列,而且还可能取消某些元组(避免重复行).连接(Join))连接也称为e连接2)连接运算的含义从两个关系的笛卡尔积中选取属性间满足一定条件的元组R S={ Itr:R△ts,"SAtr[A]ets[B]}A和B:分别为R和S上度数相等且可比的属性组e:比较运算符连接运算从R和S的广义笛卡尔积RXS中选取(R关系)在A属性组上的值与(S关系)在B属性组上值满足比较关系的元组。3)两类常用连接运算等值连接(equijoin)什么是等值连接e为“=”的连接运算称为等值连接等值连接的含义从关系R与S的广义笛卡尔积中选取 A、B属性值相等的那些元组, 即等值连接为:Rs={ |tr.RAts「3Atr[A]=ts[B]}4)一般的连接操作是从行的角度进行运算。自然连接还需要取消重复列,所以是同时从行和列的角度进行运算。4)象集Z给定一个关系R(X,Z),X和Z为属性组。当t[X]=x时,x在R中的象集(ImagesSet)为:Zx={t[Z]It•;R,t[X]=x}它表示R中属性组X上值为x的诸元组在Z上分量的集合。.除(Division)给定关系R(X,Y)和S(Y,Z),其中X,Y,Z为属性组。R中的Y与S中的Y可以有不同的属性名,但必须出自相同的域集。R与S的除运算得到一个新的关系 P(X),P是R中满足下列条件的元组在X属性列上的投影:元组在X上分量值x的象集Yx包含S在Y上投影的集合。R;S={tr[X]ItrRAnY(S),一Yx}Yx:x在R中的象集,x=tr[X]2)除操作是同时从行和列角度进行运算第三章关系数据库标准语言SQL3.1SQL概述SQL的特点.综合统一.高度非过程化.面向集合的操作方式.以同一种语法结构提供两种使用方法.语言简洁,易学易用5.语言简捷,易学易用表3.1SQL语言的动词数据定义CREATE数据查询 ,DROP数据定义CREATE数据查询 ,DROP,ALTERSELECT数据操纵INSERT,UPDATE

DELETE数据控制GRANT,REVOKE3.2数据定义表3.2SQL的数据定义语句操作对操作方式象仓1」建删除修改表CREATETABLEDROPTABLEALTERTABLE视图CREATEVIEWDROPVIEW索引CREATEINDEXDROPINDEX3.2.1定义语句格式CREATETABLE<表名>(<列名><数据类型>[<列级完整性约束条件 >][,<列名><数据类型>[<列级完整性约束条件>]] …[,<表级完整性约束条件>]);〈表名>:所要定义的基本表的名字列名>:组成该表的各个属性(列)列级完整性约束条件>:涉及相应属性列的完整性约束条件表级完整性约束条件>:涉及一个或多个属性列的完整性约束条件常用完整性约束主码约束: PRIMARYKEY唯一性约束:UNIQUE非空值约束:NOTNULL参照完整性约束三、删除基本表DROPTABLE<表名>;基本表删除 数据、表上的索引都删除表上的视图往往仍然保留,但 无法引用

删除基本表时,系统会从数据字典中删去有关该基本表及其索引的描述(标准中没有,认为表建立后就永久存在)二、修改基本表ALTERTABLE<表名>[ADD<新列名><数据类型>[完整性约束]][DROP<完整性约束名>][MODIFY<列名><数据类型>];〈表名>:要修改的基本表ADD子句:增加新列和新的完整性约束条件DROP子句:删除指定的完整性约束条件MODIFY子句:用于修改列名和数据类型ALTERTABLEStudentADDScomeDATE;不论基本表中原来是否已有数据,新增加的列一律为空值。删除属性列直接/间接删除把表中要保留的列及其内容复制到一个新表中删除原表再将新表重命名为原表名直接删除属性列:(新)例:ALTERTABLEStudentDropScome;ALTERTABLEStudentMODIFYSageSMALLINT注:修改原有的列定义有可能会破坏已有数据建立与删除索引建立索引是加快查询速度的有效手段建立索引DBA或表的属主(即建立表的人)根据需要建立有些DBMS自动建立以下列上的索引PRIMARYKEYUNIQUE维护索引使用索引DBMS自动完成DBMS自动完成DBMS自动选择是否使用索引以及使用哪些索引一、建立索引语句格式CREATE[UNIQUE][CLUSTER]INDEX<索引名>ON<表名>(<列名>[<次序>][,<列名>[<次序>]]…);用〈表名>指定要建索引的基本表名字索引可以建立在该表的一列或多列上,各列名之间用逗号分隔用<次序>指定索引值的排列次序,升序: ASC,降序:DESC。缺省值:ASCUNIQUE表明此索引的每一个索引值只对应唯一的数据记录CLUSTER表示要建立的索引是聚簇索引唯一值索引对于已含重复值的属性列不能建 UNIQUE索引对某个列建立UNIQUE索引后,插入新记录时DBMS会自动检查新记录在该列上是否取了重复值。这相当于增加了一个 UNIQUE约束聚簇索引建立聚簇索引后,基表中数据也需要按指定的聚簇属性值的升序或降序存放。也即聚簇索引的索引项顺序与表中记录的物理顺序一致例:CREATECLUSTERINDEXStusnameONStudent(Sname);在Student表的Sname(姓名)列上建立一个聚簇索引,而且Student表中的记录将按照Sname值的升序存放在一个基本表上最多只能建立一个聚簇索引聚簇索引的用途:对于某些类型的查询,可以提高查询效率聚簇索引的适用范围很少对基表进行增删操作很少对其中的变长列进行修改操作二、删除索引DROPINDEX<索引名>;删除索引时,系统会从数据字典中删去有关该索引的描述。3.3查询语句格式SELECT[ALL|DISTINCT]< 目标列表达式>[,<目标列表达式>]…FROM<表名或视图名>[,<表名或视图名>] …[WHERE<条件表达式>][GROUPBY<列名1>[HAVING<条件表达式>]][ORDERBY<列名2>[ASC|DESC]];SELECT子句:指定要显示的属性列FROM子句:指定查询对象(基本表或视图)WHERE子句:指定查询条件GROUPBY子句:对查询结果按指定列的值分组,该属性列值相等的元组为一个组。通常会在每组中作用集函数。HAVING短语:筛选出只有满足指定条件的组ORDERBY子句:对查询结果表按指定列值的升序或降序排序3.3.2单表查询查询仅涉及一个表,是一种最简单的查询操作一、选择表中的若干列二、选择表中的若干元组三、对查询结果排序四、使用集函数五、对查询结果分组查询经过计算的值SELECT子句的<目标列表达式>为表达式算术表达式字符串常量函数列别名等二、选择表中的若干元组消除取值重复的行查询满足条件的元组.消除取值重复的行在SELECT子句中使用DISTINCT短语假设SC表中有下列数据.查询满足条件的元组WHERE子句常用的查询条件(1)比较大小在WHERE子句的<比较条件>中使用比较运算符=,>,<,>=,<=,!=或<>,!>,!<,逻辑运算符NOT+比较运算符(2)确定范围使用谓词BETWEEN…AND …NOTBETWEEN …AND…(3)确定集合使用谓词 IN<值表>, NOTIN<值表><值表>:用逗号分隔的一组取值(4)字符串匹配[NOT]LIKE,<匹配串>?[ESCAPE,<换码字符>?]〈匹配串>:指定匹配模板匹配模板:固定字符串或含通配符的字符串当匹配模板为固定字符串时,可以用=运算符取代LIKE谓词用!=或<>运算符取代NOTLIKE谓词通配符%(百分号)代表任意长度(长度可以为0)的字符串,addgb,ab等都满足acb,afb等都满足该匹例:,addgb,ab等都满足acb,afb等都满足该匹该匹配串_(下横线)代表任意单个字符例:a_b表示以a开头,以b结尾的长度为3的任意字符串。如配串查询DB_Design课程的课程号和学分。SELECTCnoCcreditSELECTCnoCcreditFROMCourseWHERECnameLIKE'DB\_Design'ESCAPE'\'(5)涉及空值的查询使用谓词ISNULL或ISNOTNULL“ISNULL”不能用 “二NULL”代替(6)多重条件查询用逻辑运算符AND和OR来联结多个查询条件AND的优先级高于OR可以用括号改变优先级可用来实现多种其他谓词[NOT]IN[NOT]BETWEEN…AND…三、对查询结果排序使用ORDERBY子句可以按一个或多个属性列排序升序:ASC;降序:DESC;缺省值为升序当排序列含空值时ASC:排序列为空值的元组最后显示DESC:排序列为空值的元组最先显示四、使用集函数5类主要集函数计数COUNT([DISTINCT|ALL]* )COUNT([DISTINCT|ALL]<列名>)计算总和SUM([DISTINCTIALL]<列名>)计算平均值AVG([DISTINCTIALL]<列名>)求最大值MAX([DISTINCTIALL]<列名>)求最小值MIN([DISTINCTIALL]<列名>)DISTINCT短语:在计算时要取消指定列中的重复值ALL短语:不取消重复值ALL为缺省值五、对查询结果分组使用GROUPBY子句分组细化集函数的作用对象未对查询结果分组,集函数将作用于整个查询结果对查询结果分组后,集函数将分别作用于每个组GROUPBY子句的作用对象是查询的中间结果表分组方法:按指定的一列或多列值分组,值相等的为一组使用GROUPBY子句后,SELECT子句的列名列表中只能出现分组属性和集函数使用HAVING短语筛选最终输出结果只有满足HAVING短语指定条件的组才输出HAVING短语与WHERE子句的区别:作用对象不同WHERE子句作用于基表或视图,从中选择满足条件的元组。HAVING短语作用于组,从中选择满足条件的组。连接查询同时涉及多个表的查询称为连接查询用来连接两个表的条件称为连接条件或连接谓词一般格式:[<表名1>.]<列名1> 〈比较运算符> [<表名2>.]<列名2>比较运算符: =、>、<、>=、<=、!=[<表名1>.]<列名1>BETWEEN[<表名2>.]<列名2>AND[<表名2>.]<列名3>连接字段连接谓词中的列名称为连接字段连接条件中的各连接字段类型必须是可比的,但不必是相同的连接操作的执行过程嵌套循环法(NESTED-LOOP)首先在表1中找到第一个元组,然后从头开始扫描表 2,逐一查找满足连接件的元组,找到后就将表1中的第一个元组与该元组拼接起来,形成结果表中一个元组。表2全部查找完后,再找表1中第二个元组,然后再从头开始扫描表 2,逐一查找满足连接条件的元组,找到后就将表 1中的第二个元组与该元组拼接起来,形成结果表中一个元组。重复上述操作,直到表1中的全部元组都处理完毕排序合并法(SORT-MERGE)常用于=连接首先按连接属性对表 1和表2排序对表1的第一个元组,从头开始扫描表 2,顺序查找满足连接条件的元组,找到后就将表1中的第一个元组与该元组拼接起来,形成结果表中一个元组。当遇到表 2中第一条大于表1连接字段值的元组时,对表 2的查询不再继续找到表1的第二条元组,然后从刚才的中断点处继续顺序扫描表2,查找满足连接条件的元组,找到后就将表1中的第一个元组与该元组拼接起来,形成结果表中一个元组。直接遇到表2中大于表1连接字段值的元组时,对表2的查询不再继续重复上述操作,直到表1或表2中的全部元组都处理完毕为止索引连接(INDEX-JOIN)对表2按连接字段建立索引对表1中的每个元组,依次根据其连接字段值查询表 2的索引,从中找到满足条件的元组,找到后就将表 1中的第一个元组与该元组拼接起来,形成结果表中一个元组SQL中连接查询的主要类型广义笛卡尔积等值连接(含自然连接)非等值连接查询自身连接查询外连接查询复合条件连接查询一、广义笛卡尔积不带连接谓词的连接很少使用二、等值与非等值连接查询等值连接连接运算符为=[<的连接操作表名1>.]<列名1> =[<表名2>.]<列名2>任何子句中引用表1和表以2中同名属性时,都必须加表名前缀。引用唯一属性名时可加也可以省略表名前缀。自然连接等值连接的一种特殊情况,把目标列中重复的属性列去掉。非等值连接查询连接运算符不是=的连接操作三、自身连接一个表与其自己进行连接,称为表的自身连接需要给表起别名以示区别由于所有属性名都是同名属性,因此必须使用别名前缀四、夕卜连接(OuterJoin)外连接与普通连接的区别普通连接操作只输出满足连接条件的元组外连接操作以指定表为连接主体,将主体表中不满足连接条件的元组一并输出在表名后面加外连接操作符(*)或(+)指定非主体表非主体表有一“万能”的虚行,该行全部由空值组成虚行可以和主体表中所有不满足连接条件的元组进行连接由于虚行各列全部是空值,因此与虚行连接的结果中,来自非主体表的属性值全部是空值左外连接外连接符出现在连接条件的左边右外连接外连接符出现在连接条件的右边五、复合条件连接WHERE子句中含多个连接条件时,称为复合条件连接嵌套查询概述一个SELECT-FROM-WHERE 语句称为一个查询块将一个查询块嵌套在另一个查询块的WHERE子句或HAVING短语的条件中的查询称为嵌套查询子查询的限制不能使用ORDERBY子句层层嵌套方式反映了 SQL语言的结构化有些嵌套查询可以用连接运算替代不相关子查询子查询的查询条件不依赖于父查询相关子查询子查询的查询条件依赖于父查询不相关子查询是由里向外逐层处理。即每个子查询在上一级查询处理之前求解,子查询的结果用于建立其父查询的查找条件。相关子查询首先取外层查询中表的第一个元组,根据它与内层查询相关的属性值处理内层查询,若WHERE子句返回值为真,则取此元组放入结果表;然后再取外层表的下一个元组;重复这一过程,直至外层表全部检查完为止引出子查询的谓词带有IN谓词的子查询带有比较运算符的子查询带有ANY或ALL谓词的子查询带有EXISTS谓词的子查询一、带有IN谓词的子查询二、带有比较运算符的子查询•当能确切知道内层查询返回单值时,可用比较运算符( >,<,=,>=,<=,!=或<>)。与ANY或ALL谓词配合使用三、带有ANY或ALL谓词的子查询谓词语义ANY:任意一个值ALL:所有值需要配合使用比较运算符>ANY 大于子查询结果中的某个值>ALL 大于子查询结果中的所有值<ANY 小于子查询结果中的某个值<ALL小于子查询结果中的所有值>=ANY 大于等于子查询结果中的某个值>=ALL 大于等于子查询结果中的所有值<=ANY 小于等于子查询结果中的某个值<=ALL 小于等于子查询结果中的所有值=ANY 等于子查询结果中的某个值=ALL 等于子查询结果中的所有值(通常没有实际意义)!=(或<>)ANY 不等于子查询结果中的某个值!=(或<>)ALL 不等于子查询结果中的任何一个值四、带有EXISTS谓词的子查询.EXISTS谓词.NOTEXISTS谓词.不同形式的查询间的替换.相关子查询的效率.用EXISTS/NOTEXISTS 实现全称量词.用EXISTS/NOTEXISTS 实现逻辑蕴函•1.EXISTS谓词-存在量词-带有EXISTS 谓词的子查询不返回任何数据,只产生逻辑真值 “true”或逻辑假值“false”。•若内层查询结果非空,则返回真值•若内层查询结果为空,则返回假值-由EXISTS 引出的子查询,其目标列表达式通常都用 *,因为带EXISTS的子查询只返回真值或假值,给出列名无实际意义•2.NOTEXISTS谓词.不同形式的查询间的替换一些带EXISTS或NOTEXISTS 谓词的子查询不能被其他形式的子查询等价替换所有带IN谓词、比较运算符、ANY和ALL谓词的子查询都能用带 EXISTS 谓词的子查询等价替换。.用EXISTS/NOTEXISTS 实现全称量词难点)SQL语言中没有全称量词 -(Forall)可以把带有全称量词的谓词转换为等价的带有存在量词的谓词:(-x)P三一(二1x(—P)).用EXISTS/NOTEXISTS 实现逻辑蕴函难点)SQL语言中没有蕴函(Implication)逻辑运算可以利用谓词演算将逻辑蕴函谓词等价转换为:p>q三一pVq.3.5集合查询标准SQL直接支持的集合操作种类并操作(UNION)一般商用数据库支持的集合操作种类并操作(UNION)交操作(INTERSECT)差操作(MINUS).并操作形式<查询块>UNION<查询块>参加UNION操作的各结果表的列数必须相同;对应项的数据类型也必须相同.交操作标准SQL中没有提供集合交操作,但可用其他方法间接实现。.差操作.对集合操作结果的排序ORDERBY 子句只能用于对最终查询结果排序,不能对中间结果排序任何情况下,ORDERBY 子句只能出现在最后对集合操作结果排序时, ORDERBY 子句中用数字指定排序属性.4数据更新3.4.1插入数据两种插入数据方式插入单个元组插入子查询结果1.插入单个元组语句格式INSERTINTO<表名>[(属性列1〉,嘱性列2>・•)]VALUES(<常量1>[,〈常量2〉]功能将新元组插入指定表中。INTO子句指定要插入数据的表名及属性列属性列的顺序可与表定义中的顺序不一致没有指定属性列:表示要插入的是一条完整的元组,且属性列属性与表定义中的顺序一致指定部分属性列:插入的元组在其余属性列上取空值VALUES子句提供的值必须与INTO子句匹配值的个数值的类型2.插入子查询结果语句格式INSERTINTO<表名〉[(<属性列1>[嘱性列2〉… )]子查询;功能将子查询结果插入指定表中INSERTINTODeptage(Sdept,Avgage)SELECTSdept,AVG(Sage)FROM StudentGROUPBYSdept;INTO子句与插入单条元组类似)指定要插入数据的表名及属性列属性列的顺序可与表定义中的顺序不一致没有指定属性列:表示要插入的是一条完整的元组指定部分属性列:插入的元组在其余属性列上取空值子查询SELECT子句目标列必须与INTO子句匹配值的个数值的类型3.4.2修改数据语句格式UPDATE<表名>SET<列名>=<表达式>,<列名>=<表达式>]…[WHERE<条件>];功能修改指定表中满足WHERE 子句条件的元组三种修改方式修改某一个元组的值修改多个元组的值带子查询的修改语句UPDATESCSETGrade=0WHERE'CS'=(SELETESdeptFROMStudentWHEREStudent.Sno=SC.Sno);SET子句指定修改方式要修改的列修改后取值WHERE子句指定要修改的元组缺省表示要修改表中的所有元组DBMS在执行修改语句时会检查修改操作是否破坏表上已定义的完整性规则实体完整性主码不允许修改用户定义的完整性NOTNULL约束UNIQUE约束值域约束DELETEFROM <表名>[WHERE<条件>];功能删除指定表中满足WHERE 子句条件的元组WHERE子句指定要删除的元组缺省表示要修改表中的所有元组三种删除方式删除某一个元组的值删除多个元组的值带子查询的删除语句DBMS在执行插入语句时会检查所插元组是否破坏表上已定义的完整性规则-参照完整性? 不允许删除? 级联删除更新数据与数据一致性DBMS在执行插入、删除、更新语句时必须保证数据库一致性必须有事务的概念和原子性完整性检查和保证3.5视图视图的特点虚表,是从一个或几个基本表(或视图)导出的表只存放视图的定义,不会出现数据冗余基表中的数据发生变化,从视图中查询出的数据也随之改变基于视图的操作查询删除受限更新定义基于该视图的新视图1.建立视图语句格式CREATEVIEW<视图名>AS<子查询>[WITHCHECK[(<列名>[,<列名>]・・•)]OPTION]DBMS执行CREATEVIEW视图的定义存入数据字典的SELECT语句。语句时只是把并不执行其中在对视图查询时,按视图的定义从基本表中将数据查出。组成视图的属性列名全部省略或全部指定(1)⑵⑶⑷省略:由子查询中SELECT 目标列中的诸字段组成明确指定视图的所有列名 :某个目标列是集函数或列表达式目标列为*多表连接时选出了几个同名列作为视图的字段需要在视图中为某个列启用新的更合适的名字WITHCHECKOPTION透过视图进行增删改操作时,不得破坏视图定义中的谓词条件(即子查询中的条件表达式)带表达式的视图定义一个反映学生出生年份的视图。CREATEVIEWBT_S(Sno,Sname,Sbirth)ASSELECTSno,Sname,2000-SageFROMStudent设置一些派生属性列,也称为虚拟列--Sbirth带表达式的视图必须明确定义组成视图的各个属性列名一类不易扩充的视图以SELECT* 方式创建的视图可扩充性差,应尽可能避免图DROPVIEW<视图名>;该语句从数据字典中删除指定的视图定义由该视图导出的其他视图定义仍在数据字典中,但已不能使用,必须显式删除删除基表时,由该基表导出的所有视图定义都必须显式删除查询视图从用户角度:查询视图与查询基本表相同DBMS 实现视图查询的方法实体化视图(ViewMaterialization)有效性检查:检查所查询的视图是否存在执行视图定义,将视图临时实体化,生成临时表查询视图转换为查询临时表查询完毕删除被实体化的视图 (临时表)视图消解法(ViewResolution)进行有效性检查,检查查询的表、视图等是否存在。如果存在,则从数据字典中取出视图的定义把视图定义中的子查询与用户的查询结合起来,转换成等价的对基本表的查询执行修正后的查询视图实体化法视图消解法更新视图用户角度:更新视图与更新基本表相同DBMS 实现视图更新的方法视图实体化法(ViewMaterialization)视图消解法(ViewResolution)指定WITHCHECKOPTION 子句后DBMS在更新视图时会进行检查,防止用户通过视图对不属于视图范围内的基本表数据进行更新更新视图的限制一些视图是不可更新的,因为对这些视图的更新不能唯一地有意义地转换成对相应基本表的更一些视图是不可更新的,新对两类方法均如此)允许对行列子集视图进行更新对其他类型视图的更新不同系统有不同限制DB2对视图更新的限制:(1)若视图是由两个以上基本表导出的,则此视图不允许更新。(2)若视图的字段来自字段表达式或常数, 则不允许对此视图执行 INSERT和UPDATE操作,但允许执行DELETE操作。若视图的字段来自集函数,则此视图不允许更新。(4)若视图定义中含有GROUPBY子句,则此视图不允许更新。(5)若视图定义中含有DISTINCT短语,则此视图不允许更新。(6)若视图定义中有嵌套查询,并且内层查询的FROM子句中涉及的表也是导出该视图的基本表,则此视图不允许更新。(7)一个不允许更新的视图上定义的视图也不允许更新视图对重构数据库提供了一定程度的逻辑独立性物理独立性与逻辑独立性的概念视图在一定程度上保证了数据的逻辑独立性视图只能在一定程度上提供数据的逻辑独立性由于对视图的更新是有条件的,因此应用程序中修改数据的语句可能仍会因基本表结构的改变而改变。视图能够对机密数据提供安全保护对不同用户定义不同视图,使每个用户只能看到他有权看到的数据通过WITHCHECKOPTION 对关键数据定义操作时间限制3.6数据控制授权收回权限数据控制亦称为数据保护,包括数据的:安全性控制完整性控制并发控制恢复SQL语言的数据控制功能SQL语言提供了数据控制功能,能够在一定程度上保证数据库中数据的完全性、完整性,并提供了一定的并发控制及恢复能力。.完整性数据库的完整性是指数据库中数据的正确性与相容性。SQL语言定义完整性约束条件CREATETABLE语句ALTERTABLE语句取值唯一的列参照完整性其他约束条件.并发控制并发控制:当多个用户并发地对数据库进行操作时,对他们加以控制、协调,以保证并发操作正确执行,保持数据库的一致性。SQL语言并发控制能力:提供事务、事务开始、事务结束、提交等概念.恢复恢复:当发生各种类型的故障导致数据库处于不一致状态时,将数据库恢复到一致状态的功能。SQL语言恢复功能:提供事务回滚、重做等概念(UNDO、REDO).安全性安全性:保护数据库,防止不合法的使用所造成的数据泄露和破坏。保证数据安全性的主要措施存取控制:控制用户只能存取他有权存取的数据规定不同用户对于不同数据对象所允许执行的操作DBMS实现数据安全性保护的过程用户或DBA把授权决定告知系统SQL的GRANT和REVOKEDBMS 把授权的结果存入数据字典当用户提出操作请求时,DBMS 根据授权定义进行检查,以决定是否执行操作请求授权GRANT 语句的一般格式:GRANT<权限>[,<权限>]...[ON<对象类型><对象名>]TO<用户>[,<用户>]...[WITHGRANTOPTION];谁定义?DBA和表的建立者(即表的属主)REVOKE 功能:将对指定操作对象的指定操作权限授予指定的用户。(1)操作权限对象对象类型操作权限属性列TABLESELECT,INSERT,UPDATE,DELETE,ALLRIVIEGES视图TABLESELECT,INSERT,UPDATE,DELETE,ALLRIVIEGES基本表TABLESELECT,INSERT,UPDATE,DELETEALTER,INDEX,ALLPRIVIEGES数据库」DATABASECREATETAB(2)用户的权限建表(CREATETAB)的权限属于DBADBA授予--漕通用户基本表或视图的属主拥有对该表或视图的一切操作权限接受权限的用户:一个或多个具体用户PUBLIC (全体用户)(4)WITHGRANTOPTION子句指定了WITHGRANTOPTION 子句:获得某种权限的用户还可以把这种权限再授予别的用户。没有指定WITHGRANTOPTION子句:获得某种权限的用户只能使用该权限,不能传播该权限查询Student表权限授给用户 U1GRANTSELECTON TABLE StudentTO U1;把对Student表和Course表的全部权限授予用户 U2和U3GRANTALLPRIVILIGESONTABLEStudent,CourseTOU2,U3;收回权限REVOKE 语句的一般格式为:REVOKE<权限>[,<权限>]...[ON<对象类型>对象名>]FROM<用户>[,<用户>]...;功能:从指定用户那里收回对指定对象的指定权限3.7嵌入式SQLSQL语言提供了两种不同的使用方式:交互式嵌入式为什么要引入嵌入式 SQLSQL语言是非过程性语言事务处理应用需要高级语言这两种方式细节上有差别,在程序设计的环境下, SQL语句要做某些必要的扩充嵌入式SQL的一般形式为了区分SQL语句与主语言语句,需要:前缀:EXECSQL结束标志:随主语言的不同而不同以C为主语言的嵌入式SQL语句的一般形式EXECSQL<SQL 语句>;DBMS处理宿主型数据库语言SQL的方法预编译修改和扩充主语言使之能处理 SQL语句预编译.由DBMS的预处理程序对源程序进行扫描,识别出SQL语句.把它们转换成主语言调用语句,以使主语言编译程序能识别它.最后由主语言的编译程序将整个源程序编译成目标码。嵌入SQL语句说明性语句嵌入SQL语句 数据定义可执行语句 数据控制数据操纵允许出现可执行的高级语言语句的地方,都可以写可执行 SQL语句允许出现说明语句的地方,都可以写说明性 SQL语句嵌入式SQL语句与主语言之间的通信将SQL嵌入到高级语言中混合编程,程序中会含有两种不同计算模型的语句SQL语句描述性的面向集合的语句负责操纵数据库高级语言语句过程性的面向记录的语句负责控制程序流程工作单元之间的通信方式.SQL通信区向主语言传递SQL语句的执行状态信息主语言能够据此控制程序流程.主变量)主语言向SQL语句提供参数)将SQL语句查询数据库的结果交主语言进一步处理.游标解决集合性操作语言与过程性操作语言的不匹配为什么要使用游标SQL语言与主语言具有不同数据处理方式SQL语言是面向集合的,一条SQL语句原则上可以产生或处理多条记录主语言是面向记录的,一组主变量一次只能存放一条记录仅使用主变量并不能完全满足SQL语句向应用程序输出数据的要求嵌入式SQL引入了游标的概念,用来协调这两种不同的处理方式什么是游标游标是系统为用户开设的一个数据缓冲区,存放SQL语句的执行结果每个游标区都有一个名字用户可以用SQL语句逐一从游标中获取记录,并赋给主变量,交由主语言进一步处理使用游标的步骤.说明游标.打开游标.移动游标指针,然后取当前记录.关闭游标.说明游标使用DECLARE语句语句格式EXECSQLDECLARE<游标名>CURSORFOR<SELECT语句>;功能是一条说明性语句,这时DBMS 并不执行 SELECT指定的查询操作。.打开游标使用OPEN语句语句格式EXECSQLOPEN<游标名>;功能打开游标实际上是执行相应的SELECT语句,把所有满足查询条件的记录从指定表取到缓冲区中这时游标处于活动状态,指针指向查询结果集中第一条记录之前.移动游标指针,然后取当前记录使用FETCH语句语句格式EXECSQLFETCH[[NEXT|PRIORFIRST|LAST]FROM]<游标名>INTO<主变量>[<指示变量>][,主变量>[今指示变量>]]...;功能指定方向推动游标指针,然后将缓冲区中的当前记录取出来送至主变量供主语言进一步处理。NEXT|PRIOR|FIRST|LAST:指定推动游标指针的方式。NEXT:向前推进一条记录PRIOR:向回退一条记录FIRST:推向第一条记录LAST:推向最后一条记录缺省值为NEXT说明(1)主变量必须与 SELECT语句中的目标列表达式具有一一对应关系(2)FETCH语句通常用在一个循环结构中,通过循环执行 FETCH 语句逐条取出结果集中的行进行处理(3)为进一步方便用户处理数据,现在一些关系数据库管理系统对FETCH语句做了扩充,允许用户向任意方向以任意步长移动游标指针4.关闭游标使用CLOSE语句语句格式EXECSQLCLOSE<游标名>;功能关闭游标,释放结果集占用的缓冲区及其他资源说明游标被关闭后,就不再和原来的查询结果集相联系被关闭的游标可以再次被打开,与新的查询结果相联系第四章关系系统及其查询优化关系系统能够在一定程度上支持关系模型的数据库管理系统是关系系统。由于关系模型中并非每一部分都是同等重要的并不苛求一个实际的关系系统必须完全支持关系模型。关系数据结构域及域上定义的关系关系操作并、交、差、广义笛卡尔积、选择、投影、连接、除等关系完整性实体完整性、参照完整性、用户自己定义的完整性一个数据库管理系统可定义为关系系统,当且仅当它至少支持:.关系数据库(即关系数据结构)系统中只有表这种结构.支持选择、投影和(自然)连接运算对这些运算不要求用户定义任何物理存取路径对关系系统的最低要求关系系统的查询优化查询优化概述查询优化的必要性查询优化极大地影响RDBMS的性能。查询优化的可能性关系数据语言的级别很高,使 DBMS可以从关系表达式中分析查询语义。用户不必考虑如何最好地表达查询以获得较好的效率系统可以比用户程序的优化做得更好(1)优化器可以从数据字典中获取许多统计信息,而用户程序则难以获得这些信息⑵如果数据库的物理统计信息改变了,系统可以自动对查询重新优化以选择相适应的执行计划。在非关系系统中必须重写程序,而重写程序在实际应用中往往是不太可能的。⑶优化器可以考虑数百种不同的执行计划,而程序员一般只能考虑有限的几种可能性。⑷优化器中包括了很多复杂的优化技术查询优化的总目标选择有效策略,求得给定关系表达式的值实际系统的查询优化步骤.将查询转换成某种内部表示,通常是语法树.根据一定的等价变换规则把语法树转换成标准(优化)形式.选择低层的操作算法对于语法树中的每一个操作计算各种执行算法的执行代价选择代价小的执行算法.生成查询计划查询执行方案)查询计划是由一系列内部操作组成的。.2.4关系代数等价变换规则关系代数表达式等价指用相同的关系代替两个表达式中相应的关系所得到的结果是相同的上面的优化策略大部分都涉及到代数表达式的变换.2.6优化的一般步骤.把查询转换成某种内部表示.代数优化:把语法树转换成标准(优化)形式.物理优化:选择低层的存取路径.生成查询计划,选择代价最小的第五章关系数据理论二、关系模式的形式化定义关系模式由五部分组成,即它是一个五元组:R(U,D,DOM,F)R: 关系名U: 组成该关系的属性名集合D: 属性组U中属性所来自的域DOM:属性向域的映象集合F: 属性间数据的依赖关系集合三、什么是数据依赖.完整性约束的表现形式限定属性取值范围:定义属性值间的相互关连(主要体现于值的相等与否),这就是数据依赖,它是数据库模式设计的关键.数据依赖是通过一个关系中属性间值的相等与否体现出来的数据间的相互关系是现实世界属性间相互联系的抽象是数据内在的性质是语义的体现.数据依赖的类型函数依赖(FunctionalDependency,简记为FD)多值依赖(MultivaluedDependency,简记为MVD)其他四、关系模式的简化表示•关系模式R(U,D,DOM,F)简化为一个三元组:R(U,F)•当且仅当U上的一个关系r满足F时,r称为关系模式 R(U,F)的一个关系五、数据依赖对关系模式的影响.数据冗余太大浪费大量的存储空间例:每一个系主任的姓名重复出现.更新异常(UpdateAnomalies)数据冗余,更新数据时,维护数据完整性代价大。例:某系更换系主任后,系统必须修改与该系学生有关的每一个元组.插入异常(InsertionAnomalies)该插的数据插不进去例,如果一个系刚成立,尚无学生,我们就无法把这个系及其系主任的信息存入数据库。.删除异常(DeletionAnomalies)不该删除的数据不得不删原因:由存在于模式中的某些数据依赖引起的解决方法:通过分解关系模式来消除其中不合适的数据依赖。.2规范化函数依赖一、函数依赖定义5.1设R(U)是一个属性集U上的关系模式,X和Y是U的子集。若对于R(U)的任意一个可能的关系r,r中不可能存在两个元组在X上的属性值相等,而在Y上的属性值不等,则称“X函数确定Y”或“Y函数依赖于X”,记作X-Y。X称为这个函数依赖的决定属性集 (Determinant)□Y=f(x).函数依赖不是指关系模式 R的某个或某些关系实例满足的约束条件,而是指 R的所有关系实例均要满足的约束条件。.函数依赖是语义范畴的概念。只能根据数据的语义来确定函数依赖。例如“姓名一年龄”这个函数依赖只有在不允许有同名人的条件下成立.数据库设计者可以对现实世界作强制的规定。二、平凡函数依赖与非平凡函数依赖在关系模式R(U)中,对于U的子集X和Y,如果X-Y,但YNotX,则称X-Y是非平凡的函数依赖若X一Y,但YX,则称X-Y是平凡的函数依赖在关系SC(Sno,Cno,Grade)中,非平凡函数依赖: (Sno,Cno)-Grade平凡函数依赖: (Sno,Cno)-Sno(Sno,Cno)fCno三、完全函数依赖与部分函数依赖定义5.2在关系模式R(U)中,如果X-Y,并且对于X的任何一个真子集 X:都有X,Y,则称Y完全函数依赖于 X,记作XLY。若X一Y,但Y不完全函数依赖于 X,则称Y部分函数依赖于X,记作XPY。四、传递函数依赖定义5.3在关系模式R(U)中,如果XfY,一Z,且:X,Y-X,则称Z传递函数依赖于 X。注:注:如果Y-X,即X-fY,则Z直接依赖于码定义5.4设K为关系模式R<U,F>中的属性或属性组合。若KfU,则K称为R的一个侯选码(CandidateKey)。若关系模式R有多个候选码,则选定其中的一个做为主码( Primarykey)。主属性与非主属性ALLKEY外部码定义5.5关系模式R中属性或属性组 X并非R的码,但X是另一个关系模式的码,则称 X是R的外部码(Foreignkey)也称夕卜码范式某一关系模式R为第n范式,可简记为R£nNF。2NF1NF的定义如果一个关系模式R的所有属性都是不可分的基本数据项,则 R£1NF。第一范式是对关系模式的最起码的要求。不满足第一范式的数据库模式不能称为关系数据库。(1)插入异常(2)删除异常(3)数据冗余度大(4)修改复杂2NF的定义定义5.6若关系模式R£1NF,并且每一个非主属性都完全函数依赖于 R的码,则R£2NF。3NF的定义, (一)定义5.8关系模式R<Uf>中若不存在这样的码 X、属性组Y及非主属性 ZZ\Y,使得X一Y,Y-XY-Z,成立,则称R<U,F>£3NF。若R£3NF,则R的每一个非主属性既不部分函数依赖于候选码也不传递函数依赖于候选码。如果R£3NF,则R也是2NF。采用投影分解法将一个 2NF的关系分解为多个3NF的关系,可以在一定程度上解决原 2NF关系中存在的插入异常、删除异常、数据冗余度大、修改复杂等问题。将一个2NF关系分解为多个 3NF的关系后,并不能完全消除关系模式中的各种异常情况和数据冗余。BC范式(BCNF)定义5.9设关系模式R<U,F>£1NF,如果对于R的每个函数依赖X-Y,若Y不属于X,则X必含有候选码,那么 R£BCNF。若R£BCNF每一个决定属性集(因素)都包含(候选)码R中的所有属性(主,非主属性)都完全函数依赖于码R£3NF(证明)若R£3NF则R不一定£BCNFSTJ£3NF(S,J和(ST)都可以作为候选码S、T、J都是主属性£BCNFT-J,T是决定属性集,T不是候选码解决方法:将STJ分解为二个关系模式:SJ(S,J)£BCNF,TJ(T,J纭BCNF没有任何属性对码的部分函数依赖和传递函数依赖3NF与BCNF的关系如果关系模式R£BCNF,必定有R£3NF如果Re3NF,且R只有一个候选码,则R必属于BCNF。BCNF的关系模式所具有的性质.所有非主属性都完全函数依赖于每个候选码.所有主属性都完全函数依赖于每个不包含它的候选码.没有任何属性完全函数依赖于非码的任何一组属性5.2.5多值依赖与第四范式(4NF)一、多值依赖定义5.10设R(U)是一个属性集U上的一个关系模式,X、Y和Z是U的子集,并且Z=U-X—Y,多值依赖X一一Y成立当且仅当对R的任一关系r,r在(X,Z)上的每个值对应一组Y的值,这组值仅仅决定于X值而与Z值无关平凡多值依赖和非平凡的多值依赖若X一一Y,而Z=@,则称X一一Y为平凡的多值依赖否则称X--Y为非平凡的多值依赖多值依赖的性质(1)多值依赖具有对称性若X一—Y,则X一—Z,其中Z=U-X-Y多值依赖的对称性可以用完全二分图直观地表示出来。(2)多值依赖具有传递性若X一—Y,Y一一Z,则X一一Z-Y3)函数依赖是多值依赖的特殊情况。若X-Y,则X-—Y。(4)若X一— Y, X一一 Z,则 X一— Y一Z。(5)若X一— Y, X一一 Z,则 X一— YHZ。(6)若X一一 Y, X一一 Z,则 X一一 Y-Z, X一一Z-Y。二、第四范式(4NF)定义5.10关系模式R<U,F>e1NF,如果对于 R的每个非平凡多值依赖XffY(Y\ x),X都含有候选码,则 Re4NF。(X-Y)如果Re4NF,则ReBCNF不允许有非平凡且非函数依赖的多值依赖允许的是函数依赖(是非平凡多值依赖)第六章数据库设计数据库设计数据库设计是指对于一个给定的应用环境,构造最优的数据库模式,建立数据库及其应用系统,使之能够有效地存储数据,满足各种用户的应用需求(信息要求和处理要求)在数据库领域内,常常把使用数据库的各类系统统称为数据库应用系统。数据库和信息系统数据库是信息系统的核心和基础把信息系统中大量的数据按一定的模型组织起来提供存储、维护、检索数据的功能使信息系统可以方便、及时、准确地从数据库中获得所需的信息数据库是信息系统的各个部分能否紧密地结合在一起以及如何结合的关键所在数据库设计是信息系统开发和建设的重要组成部分数据库设计的特点数据库建设是硬件、软件和干件的结合三分技术,七分管理,十二分基础数据技术与管理的界面称之为 “干件”数据库设计应该与应用系统设计相结合结构(数据)设计:设计数据库框架或数据库结构行为(处理)设计:设计应用程序、事务处理等结构和行为分离的设计传统的软件工程忽视对应用中数据语义的分析和抽象,只要有可能就尽量推迟数据结构设计的决策早期的数据库设计致力于数据模型和建模方法研究,忽视了对行为的设计数据库设计的基本步骤.需求分析阶段准确了解与分析用户需求(包括数据与处理)是整个设计过程的基础,是最困难、最耗费时间的一步.概念结构设计阶段是整个数据库设计的关键通过对用户需求进行综合、归纳与抽象,形成一个独立于具体 DBMS的概念模型.逻辑结构设计阶段将概念结构转换为某个DBMS所支持的数据模型对其进行优化.数据库物理设计阶段为逻辑数据模型选取一个最适合应用环境的物理结构(包括存储结构和存取方法).数据库实施阶段运用DBMS提供的数据语言、工具及宿主语言,根据逻辑设计和物理设计的结果建立数据库编制与调试应用程序组织数据入库并进行试运行.数据库运行和维护阶段数据字典、全系统中数据项、数据流图和判定表(判定树)、数据概念模型(E-R图)系统说明书包括:逻辑结构设计①新系统要求、方案和概图②反映新系统信息概念结

构设计某种数据模型系统结构图关系物理设计存储安排方法选择存取路径建立非关系Creat Load (模块结构)阶段编写模式装入数据模块设计IPO表程序编码、数据字典、全系统中数据项、数据流图和判定表(判定树)、数据概念模型(E-R图)系统说明书包括:逻辑结构设计①新系统要求、方案和概图②反映新系统信息概念结

构设计某种数据模型系统结构图关系物理设计存储安排方法选择存取路径建立非关系Creat Load (模块结构)阶段编写模式装入数据模块设计IPO表程序编码、编译联结、IPO表输入:输出:Main()if….then数据库应用系统经过试运行后即可投入正式运行。在数据库系统运行过程中必须不断地对其进行评价、调整与修改。设计设计描述设计运行、维护性能监测、转储恢复运行、维护性能监测、转储恢复新旧系统转换、运行、维护(修正性、

适应性、改善性维护)数据库各级模式的形成过程需求分析阶段综合各个用户的应用需求概念设计阶段形成独立于机器特点,独立于各个 DBMS 产品的概念模式(E-R图)逻辑设计阶段首先将E-R图转换成具体的数据库产品支持的数据模型,如关系模型,形成数据库逻辑模式然后根据用户处理的要求、安全性的考虑,在基本表的基础上再建立必要的视图(View),形成数据的外模式物理设计阶段根据DBMS特点和处理的需要,进行物理存储安排,建立索引,形成数据库内模式需求分析的重点是调查、收集与分析用户在数据管理中的信息要求、处理要求、安全性与完整性要求。一、数据字典的用途数据字典是各类数据描述的集合数据字典是进行详细的数据收集和数据分析所获得的主要结果二、数据字典的内容数据字典的内容数据项数据结构数据流数据存储处理过程数据项是数据的最小组成单位若干个数据项可以组成一个数据结构数据字典通过对数据项和数据结构的定义来描述数据流、数据存储的逻辑内容。.数据项数据项是不可再分的数据单位对数据项的描述数据项描述={数据项名,数据项含义说明,别名,数据类型,长度,取值范围,取值含义,与其他数据项的逻辑关系}取值范围、与其他数据项的逻辑关系定义了数据的完整性约束条件.数据结构数据结构反映了数据之间的组合关系。一个数据结构可

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论