关系数据库设计基础.ppt_第1页
关系数据库设计基础.ppt_第2页
关系数据库设计基础.ppt_第3页
关系数据库设计基础.ppt_第4页
关系数据库设计基础.ppt_第5页
已阅读5页,还剩25页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第3章 关系数据库设计基础(3+1学时),数据库设计的4个环节,1. 需求分析:了解业务范围、流程、细节和数据库存储环境;收集、归纳和分析资料。,2. 概念设计:用概念模型描述事务及其关系。如E R方法。,3. 逻辑设计:将概念模型转成规范化的关系模型,减少数据冗余,避免操作异常操作。主要将人工表优化成数据库表。,4. 物理设计:确定数据库存储路径,建数据库、表、表间联系、数据完整性和安全性规则,建主索引(主键)和普通索引(外键)。,3.1.1 人工表与数据库表,1. 人工表:纸介质表格和某些电子表格。如Word表或Excel表。,2. 主要特点:无格式性;数据类型的不确定性;嵌套性等。,3.1.1 人工表与数据库表,. 数据库表:存于外存储器的二维电子表。,4. 主要特点: 列原子性;单元格值的单一性;关键字值惟一;主属性值非空性等。,3.1.1 人工表与数据库表,5. 数据库设计:是研究如何将人工表转换成数据库表,即规范表的过程。,3.1.1 人工表与数据库表,6. 规范化方法:通过投影分解将一个表规范成功能等价的多个表。,2. 作用:由语义可确定关键字、字段有效性规则、冗余属性等。,3.1.2 数据语义,1. 数据语义:是对数据项含义的规定与解释。,5.主关键字:选用的关键字,也称为主键(码) 。一个表只有1个。,2.关键字:能惟一地标识元组、最少属性的集合。也称键、候选键或候选码。1个表可有多个。,3.主属性:包含在某关键字中的属性。,4.外码:关系R的一组非关键字属性F,若F与关系S的主键对应,则F是R的外码或外键。用于建立表间关联。,3.2.1 关系模式,1.关系模式:关系名及所有属性的集合,描述表结构。CJB(学号,课程码,考试成绩,课堂成绩,实验成绩 )。,3.2.2 函数依赖,1.函数依赖:X和Y是R中两组属性,对R中任意两个元组,如对X的投影值相等,则对Y的投影就相等。记为:XY。例: 学号姓名 (学号,课程)姓名 ;(学号,课程)考试成绩 学号考试成绩,3.2.2 函数依赖,3.2.2 函数依赖,3.2.2 函数依赖,4. 传递函数依赖 :X、Y和Z是不同属性集合,有XY,YZ,但YX且Y不是X的子集 , 则称Z传递函数依赖于X 。,如: (学号, 课程)(考试成绩, 课堂成绩, 实验成绩),(考试成绩, 课堂成绩, 实验成绩) 总分,因此,总分传递函数依赖于(学号,课程),3.3 关系模式的规范化,1. 数据依赖引发的问题:数据冗余和操作(更新、插入和删除)异常。解决办法是分解关系模式,即规范化关系模式。,2. 规范化目标:减少数据冗余,便于数据更新、插入和删除,提高时空效率,满足应用要求。,3. 规范化方法: 投影分解关系模式,去掉冗余属性,得到更多、较理想的关系模式 。,4. 范式:满足特定要求的关系模式集合。有第一、第二、第三、BCNF、第四和第五范式,条件逐渐增强。,5. 总体原则:概念单一化 ,1个关系模式对应1个实体型或之间的联系(如学生 、学院 、课程 、成绩学生与课程);无损分解,即对新关系模式自然连接后可还原原关系模式。,3.3 关系模式的规范化,规范化方法:将嵌套列横向展开成多列,将多值单元格纵向展开成多行,某些数据项重复存储 。,3.3.1 第一范式,可能存在 数据冗余度大、操作(更新、插入和删除)异常。,1. 数据冗余度大:1个学生选多门课程要重复存储学号、姓名等,产生冗余数据。,3.3.1 第一范式存在的问题,2. 更新异常:修改某对象的数据,可能要改多个记录,否则,可能造成数据不一致性。如:学生转学院要改该学生所有记录的学院和地址。,3. 插入异常:由于缺少主属性的值,无法添加新元组。如:主关键字是(学号,课程),新生选课前(课程为空)不能添加学生记录。,3.3.1 第一范式存在的问题,4. 删除异常:删除某些记录,可能丢失有价值的数据。如:选课人数太少,从关系中删除与该课程相关的记录时,将删除课程的信息(课程名和学分)。,导致 (学号, 课程) 学分 (学号, 课程) 姓名 (学号, 课程) 性别等。,如: 课程学分 学号姓名 学号性别,一级范式中可能存在非主属性(姓名、性别或学分等)部分函数依赖关键字(学号,课程)。,3.3.1 第一范式存在问题的原因,属于第一范式,非主属性都完全函数依赖于任意关键字,即,消除非主属性对任何关键字的部分函数依赖 。,3.3.1 第二范式,对关系模式按实体型及其联系投影分解,消除非主属性对关键字的部分函数依赖,转为多个关系模式。如:学生、课程及其联系(成绩)。,3.3.2 第二范式规范化方法,原因:非主属性(如:学院地址)传递函数依赖关键字(学号) 。,存在的问题 :有数据冗余、操作异常。如:某院学生都毕业,丢失学院信息,即删除异常;重复存储学院地址、总分。,还原验证:用Select自然连接 验证。,3.3.2 第二范式,属于第二范式,非主属性对任何关键字都不存在传递函数依赖,简记为3NF 。,3.3.3 第三范式,规范化方法:投影、分解关系模式,消除非主属性对关键字的传递函数依赖,去冗余属性。如:将XS分解成学生和学院两个关系模式,例如 :输出学号、姓名、学院名、课程名和总分 ,用一级范式无连接,而用三级范式需要4个关系连接。,问题 :在少数关系模式中仍然存在数据冗余、数据操作异常问题。,3.3.3 第三范式,进一步规范化 :在设计实用数据库时,三级范式基本满足要求。如果需要进一步规范化,可以用BCNF、4NF和5NF 。,总体原则 :关系模式必须满足某级范式。范式级别高,数据冗余小,关系数多,数据操作异常少,关系连接操作次数多,系统时间开销大。,3.4.1 数据编码,数据编码:表示事物对象的一种符号,是对象在某一范围内的唯一标识。如学号、身份证号、性别码、民族码、书号、车牌号等。,数据编码的作用 :数据规范化,增强通用性、准确性,易自动化获取、节省存储空间。,单体编码:用于标识对象,编码中各位没有特定含义。通常有国家统一标准。例如,性别码:1男,2女;民族码:01汉族,11满族;省市码:11北京,22吉林 。,3.4.1 数据编码,复合编码:由若干段编码组成,每段编码表示不同的含义。如学号、身份证号、书号等。,分段方法 :有按位分段(如身份证号)、分隔符(如或)分段(如图书或期刊号)。按位分段法更适合计算机数据处理 。 如 身份证:,3.4.1 数据编码,又如 学生教学号:,3.4.2 数据编码对关系模式的影响,单体编码:可

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论