第7章数据库设计-2_第1页
第7章数据库设计-2_第2页
第7章数据库设计-2_第3页
第7章数据库设计-2_第4页
第7章数据库设计-2_第5页
已阅读5页,还剩81页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、地球物理与信息工程学院计算机系1数据库系统概论数据库系统概论An Introduction to Database System第七章第七章 数据库设计数据库设计( (续续-1)-1)地球物理与信息工程学院计算机系2第七章第七章 数据库设计数据库设计7.1 数据库设计概述数据库设计概述7.2 需求分析需求分析7.3 概念结构设计概念结构设计7.4 逻辑结构设计逻辑结构设计7.5 数据库的物理设计数据库的物理设计7.6 数据库实施和维护数据库实施和维护7.7 小结小结地球物理与信息工程学院计算机系37.3 概念结构设计概念结构设计7.3.1 概念结构设计概述概念结构设计概述7.3.2 概念结构设

2、计的方法与步骤概念结构设计的方法与步骤7.3.3 数据抽象与局部视图设计数据抽象与局部视图设计7.3.4 视图的集成视图的集成地球物理与信息工程学院计算机系47.3.1 概念结构设计概述概念结构设计概述什么是概念结构设计什么是概念结构设计需求分析阶段描述的用户应用需求是现实世界需求分析阶段描述的用户应用需求是现实世界的具体需求的具体需求将需求分析得到的用户需求抽象为信息结构即将需求分析得到的用户需求抽象为信息结构即概念模型的过程就是概念结构设计概念模型的过程就是概念结构设计概念结构是各种数据模型的共同基础,它比数概念结构是各种数据模型的共同基础,它比数据模型更独立于机器、更抽象,从而更加稳定。

3、据模型更独立于机器、更抽象,从而更加稳定。概念结构设计是整个数据库设计的关键概念结构设计是整个数据库设计的关键地球物理与信息工程学院计算机系5现实世界现实世界机器世界机器世界信息世界信息世界需求分析需求分析概念结构设计概念结构设计地球物理与信息工程学院计算机系6概念结构设计的特点概念结构设计的特点(1)能真实、充分地反映现实世界,包括事)能真实、充分地反映现实世界,包括事物和事物之间的联系,能满足用户对数据的物和事物之间的联系,能满足用户对数据的处理要求。是对现实世界的一个真实模型。处理要求。是对现实世界的一个真实模型。(2)易于理解,从而可以用它和不熟悉计算)易于理解,从而可以用它和不熟悉计

4、算机的用户交换意见,用户的积极参与是数据机的用户交换意见,用户的积极参与是数据库的设计成功的关键。库的设计成功的关键。地球物理与信息工程学院计算机系7(3)易于更改,当应用环境和应用要求改变时,容)易于更改,当应用环境和应用要求改变时,容易对概念模型修改和扩充。易对概念模型修改和扩充。(4)易于向关系、网状、层次等各种数据模型转换。)易于向关系、网状、层次等各种数据模型转换。描述概念模型的工具描述概念模型的工具E-R模型模型地球物理与信息工程学院计算机系87.3.2 概念结构设计的方法与步骤概念结构设计的方法与步骤设计概念结构的四类方法设计概念结构的四类方法自顶向下自顶向下l 首先定义全局概念

5、结构的框架,然后逐步首先定义全局概念结构的框架,然后逐步细化细化自底向上自底向上l 首先定义各局部应用的概念结构,然后将首先定义各局部应用的概念结构,然后将它们集成起来,得到全局概念结构它们集成起来,得到全局概念结构地球物理与信息工程学院计算机系9逐步扩张逐步扩张l 首先定义最重要的核心概念结构,然后向外首先定义最重要的核心概念结构,然后向外扩充,以滚雪球的方式逐步生成其他概念结扩充,以滚雪球的方式逐步生成其他概念结构,直至总体概念结构构,直至总体概念结构混合策略混合策略l 将自顶向下和自底向上相结合,用自顶向下将自顶向下和自底向上相结合,用自顶向下策略设计一个全局概念结构的框架,以它为策略设

6、计一个全局概念结构的框架,以它为骨架集成由自底向上策略中设计的各局部概骨架集成由自底向上策略中设计的各局部概念结构。念结构。地球物理与信息工程学院计算机系10 自顶向下策略自顶向下策略地球物理与信息工程学院计算机系11 自底向上策略自底向上策略 地球物理与信息工程学院计算机系12 逐步扩张逐步扩张地球物理与信息工程学院计算机系13常用策略(常用策略(P215图图6.8)自顶向下地进行需求分析自顶向下地进行需求分析自底向上地设计概念结构自底向上地设计概念结构地球物理与信息工程学院计算机系14自底向上设计概念结构的步骤自底向上设计概念结构的步骤 (P216图图6.9)第第1步:抽象数据并设计局部视

7、图步:抽象数据并设计局部视图第第2步:集成局部视图,得到全局概念结构步:集成局部视图,得到全局概念结构地球物理与信息工程学院计算机系157.3.3 数据抽象与局部视图设计数据抽象与局部视图设计数据抽象数据抽象局部视图设计局部视图设计地球物理与信息工程学院计算机系16一、数据抽象一、数据抽象概念结构是对现实世界的一种抽象概念结构是对现实世界的一种抽象从实际的人、物、事和概念中抽取所关心的共从实际的人、物、事和概念中抽取所关心的共同特性,忽略非本质的细节同特性,忽略非本质的细节把这些特性用各种概念精确地加以描述把这些特性用各种概念精确地加以描述这些概念组成了某种模型这些概念组成了某种模型地球物理与

8、信息工程学院计算机系17三种常用抽象三种常用抽象1. 分类(分类(Classification)定义某一类概念作为现实世界中一组对象的类定义某一类概念作为现实世界中一组对象的类型型这些对象具有某些共同的特性和行为这些对象具有某些共同的特性和行为它抽象了对象它抽象了对象值和型值和型之间的之间的“is member of”的语义的语义在在E-R模型中,实体型就是这种抽象模型中,实体型就是这种抽象例:下图所示。例:下图所示。地球物理与信息工程学院计算机系18地球物理与信息工程学院计算机系192. 聚集(聚集(Aggregation)定义某一类型的组成成分定义某一类型的组成成分它抽象了对象内部类型和成

9、分之间它抽象了对象内部类型和成分之间“is part of”的语义的语义在在E-R模型中若干属性的聚集组成了实体型,模型中若干属性的聚集组成了实体型,就是这种抽象就是这种抽象例:下图所示。例:下图所示。地球物理与信息工程学院计算机系20地球物理与信息工程学院计算机系21 复杂的聚集,某一类型的成分仍是一个聚集,如下图:地球物理与信息工程学院计算机系223. 概括(概括(Generalization)定义类型之间的一种子集联系定义类型之间的一种子集联系它抽象了类型之间的它抽象了类型之间的“is subset of”的语义的语义概括有一个很重要的性质:继承性。子类继承概括有一个很重要的性质:继承性

10、。子类继承超类上定义的所有抽象。超类上定义的所有抽象。 例:下图所示。例:下图所示。地球物理与信息工程学院计算机系23地球物理与信息工程学院计算机系24注:原注:原E-R模型不具有概括,本书对模型不具有概括,本书对E-R模型作了扩模型作了扩充,允许定义超类实体型和子类实体型。充,允许定义超类实体型和子类实体型。l 用双竖边的矩形框表示子类,用双竖边的矩形框表示子类,l 用直线加小圆圈表示超类用直线加小圆圈表示超类-子类的联系子类的联系地球物理与信息工程学院计算机系25数据抽象的用途数据抽象的用途对需求分析阶段收集到的数据进行分类、组织对需求分析阶段收集到的数据进行分类、组织(聚集),形成(聚集

11、),形成l实体实体l实体的属性,标识实体的码实体的属性,标识实体的码l确定实体之间的联系类型确定实体之间的联系类型(1:1,1:n,m:n)地球物理与信息工程学院计算机系26二、局部视图设计二、局部视图设计设计分设计分E-R图的步骤图的步骤:选择局部应用选择局部应用逐一设计分逐一设计分E-R图图地球物理与信息工程学院计算机系27 选择局部应用选择局部应用需求分析阶段,已用多层数据流图和数据字典描需求分析阶段,已用多层数据流图和数据字典描述了整个系统。述了整个系统。设计分设计分E-R图首先需要根据系统的具体情况,在图首先需要根据系统的具体情况,在多层的数据流图中多层的数据流图中选择选择一个一个适

12、当层次的数据流图适当层次的数据流图,让这组图中每一部分对应一个局部应用,然后以让这组图中每一部分对应一个局部应用,然后以这一层次的数据流图为出发点,设计分这一层次的数据流图为出发点,设计分E-R图。图。 地球物理与信息工程学院计算机系28通常以中层数据流图作为设计分通常以中层数据流图作为设计分E-R图图的依据。原因:的依据。原因:高层数据流图只能反映系统的概貌高层数据流图只能反映系统的概貌中层数据流图能较好地反映系统中各局部应用中层数据流图能较好地反映系统中各局部应用的子系统组成的子系统组成低层数据流图过细低层数据流图过细地球物理与信息工程学院计算机系29设计分E-R图的出发点地球物理与信息工

13、程学院计算机系30 逐一设计分逐一设计分E-R图图任务任务标定局部应用中的实体、属性、码,实体间标定局部应用中的实体、属性、码,实体间的联系的联系l将各局部应用涉及的数据分别从数据字典将各局部应用涉及的数据分别从数据字典中抽取出来,参照数据流图,标定各局部中抽取出来,参照数据流图,标定各局部应用中的实体、实体的属性、标识实体的应用中的实体、实体的属性、标识实体的码,确定实体之间的联系及其类型(码,确定实体之间的联系及其类型(1:1,1:n,m:n)地球物理与信息工程学院计算机系31两条准则:两条准则:(1)属性不能再具有需要描述的性质。即属)属性不能再具有需要描述的性质。即属性必须是不可分的数

14、据项,不能再由另一些属性必须是不可分的数据项,不能再由另一些属性组成性组成(2)属性不能与其他实体具有联系。联系只)属性不能与其他实体具有联系。联系只发生在实体之间发生在实体之间例:例:地球物理与信息工程学院计算机系32职称作为一个实体地球物理与信息工程学院计算机系33病房作为一个实体地球物理与信息工程学院计算机系34仓库作为一个实体地球物理与信息工程学院计算机系35实例销售管理子系统分E-R图的设计销售管理子系统的主要功能:处理顾客和销售员送来的订单工厂是根据订货安排生产的交出货物同时开出发票收到顾客付款后,根据发票存根和信贷情况进行应收款处理地球物理与信息工程学院计算机系36下图是第一层数

15、据流图,虚线部分划出了系统边界图7.18 销售管理子系统第一层数据流图地球物理与信息工程学院计算机系37上图中把系统功能又分为4个子系统,下面四个图是第二层数据流图图7.19 接收订单地球物理与信息工程学院计算机系38图7.20 处理订单地球物理与信息工程学院计算机系39图7.21 开发票地球物理与信息工程学院计算机系40图7.22 支付过账地球物理与信息工程学院计算机系41分E-R图的框架地球物理与信息工程学院计算机系42参照第二层数据流图和数据字典,遵循两个准则,进行如下调整:l(1) 订单与订单细节是1 n的联系l(2) 原订单和产品的联系实际上是订单细节和产品的联系。l (3) 图7.

16、21中“发票主清单”是一个数据存储,不必作为实体加入分E-R图。l(4) 工厂对大宗订货给予优惠地球物理与信息工程学院计算机系43得到分E-R图:销售管理子系统的分E-R图地球物理与信息工程学院计算机系44对每个实体定义的属性如下:顾客:顾客号,顾客名,地址,电话,信贷状况,账目余额订单:订单号,顾客号,订货项数,订货日期,交货日期,工种号,生产地点订单细则:订单号,细则号,零件号,订货数,金额应收账款:顾客号,订单号,发票号,应收金额,支付日期,支付金额,当前余额,货款限额产品描述:产品号,产品名,单价,重量折扣规则:产品号,订货量,折扣地球物理与信息工程学院计算机系457.3.4 视图的集

17、成视图的集成各个局部视图即分各个局部视图即分E-R图建立好后,还需要图建立好后,还需要对它们进行合并,集成为一个整体的数据对它们进行合并,集成为一个整体的数据概念结构即总概念结构即总E-R图。图。地球物理与信息工程学院计算机系46视图集成的两种方式视图集成的两种方式一次集成一次集成l一次集成多个分一次集成多个分E-R图图l通常用于局部视图比较简单时通常用于局部视图比较简单时地球物理与信息工程学院计算机系47逐步累积式逐步累积式l首先集成两个局部视图(通常是比较关键的首先集成两个局部视图(通常是比较关键的两个局部视图)两个局部视图)l以后每次将一个新的局部视图集成进来以后每次将一个新的局部视图集

18、成进来地球物理与信息工程学院计算机系48集成局部集成局部E-R图的步骤图的步骤1. 合并合并2. 修改与重构修改与重构地球物理与信息工程学院计算机系49地球物理与信息工程学院计算机系50一、合并分一、合并分E-R图,生成初步图,生成初步E-R图图各分图存在冲突各分图存在冲突各个局部应用所面向的问题不同,由不同的设各个局部应用所面向的问题不同,由不同的设计人员进行设计计人员进行设计各个分各个分E-R图之间必定会存在许多不一致的地图之间必定会存在许多不一致的地方方合并分合并分E-R图的主要工作与关键所在:合理消图的主要工作与关键所在:合理消除各分除各分E-R图的冲突图的冲突地球物理与信息工程学院计

19、算机系51冲突的种类冲突的种类属性冲突属性冲突命名冲突命名冲突结构冲突结构冲突地球物理与信息工程学院计算机系52 属性冲突属性冲突两类属性冲突两类属性冲突属性域冲突属性域冲突:属性值的类型、取值范围或取值:属性值的类型、取值范围或取值集合不同。集合不同。例例1, 由于学号是数字,因此某些部门(即局部由于学号是数字,因此某些部门(即局部应用)将学号定义为整数形式,而由于学号不用应用)将学号定义为整数形式,而由于学号不用参与运算,因此另一些部门(即局部应用)将学参与运算,因此另一些部门(即局部应用)将学号定义为字符型形式。号定义为字符型形式。例例2, 某些部门(即局部应用)以出生日期形式某些部门(

20、即局部应用)以出生日期形式表示学生的年龄,而另一些部门(即局部应用)表示学生的年龄,而另一些部门(即局部应用)用整数形式表示学生的年龄。用整数形式表示学生的年龄。地球物理与信息工程学院计算机系53属性取值单位冲突属性取值单位冲突。例:学生的身高,有的以米为单位,有的以厘例:学生的身高,有的以米为单位,有的以厘米为单位,有的以尺为单位。米为单位,有的以尺为单位。地球物理与信息工程学院计算机系54属性冲突的解决方法属性冲突的解决方法通常用讨论、协商等行政手段加以解决通常用讨论、协商等行政手段加以解决地球物理与信息工程学院计算机系55 命名冲突命名冲突两类命名冲突两类命名冲突同名异义同名异义:不同意

21、义的对象在不同的局部应用:不同意义的对象在不同的局部应用中具有相同的名字中具有相同的名字 例,局部应用例,局部应用A中将教室称为房间中将教室称为房间 局部应用局部应用B中将学生宿舍称为房间中将学生宿舍称为房间异名同义(一义多名)异名同义(一义多名):同一意义的对象在不:同一意义的对象在不同的局部应用中具有不同的名字同的局部应用中具有不同的名字 例,有的部门把教科书称为课本例,有的部门把教科书称为课本 有的部门则把教科书称为教材有的部门则把教科书称为教材地球物理与信息工程学院计算机系56命名冲突可能发生在属性级、实体级、联命名冲突可能发生在属性级、实体级、联系级上。其中属性的命名冲突更为常见。系

22、级上。其中属性的命名冲突更为常见。命名冲突的解决方法命名冲突的解决方法通过讨论、协商等行政手段加以解决通过讨论、协商等行政手段加以解决地球物理与信息工程学院计算机系57 结构冲突结构冲突三类结构冲突三类结构冲突同一对象在不同应用中具有不同的抽象同一对象在不同应用中具有不同的抽象 例,例,“课程课程”在某一局部应用中被当作实体在某一局部应用中被当作实体 在另一局部应用中则被当作属性在另一局部应用中则被当作属性l解决方法:通常是把属性变换为实体或把实解决方法:通常是把属性变换为实体或把实体变换为属性,使同一对象具有相同的抽象。体变换为属性,使同一对象具有相同的抽象。变换时要遵循两个准则。变换时要遵

23、循两个准则。地球物理与信息工程学院计算机系58同一实体在不同局部视图中所包含的属性不完同一实体在不同局部视图中所包含的属性不完全相同,或者属性的排列次序不完全相同全相同,或者属性的排列次序不完全相同。l产生原因:不同的局部应用关心的是该实体产生原因:不同的局部应用关心的是该实体的不同侧面。的不同侧面。l解决方法:使该实体的属性取各分解决方法:使该实体的属性取各分E-R图中图中属性的并集,再适当设计属性的次序属性的并集,再适当设计属性的次序。地球物理与信息工程学院计算机系59学生学生学号学号 姓名姓名性别性别平均成绩平均成绩(a)在局部应用在局部应用A中中地球物理与信息工程学院计算机系60学生学

24、生学号学号 姓名姓名出生日期出生日期年级年级(b)在局部应用在局部应用B中中所在系所在系 地球物理与信息工程学院计算机系61学生学生学号学号 姓名姓名 政治面貌政治面貌 (c)在局部应用在局部应用C中中地球物理与信息工程学院计算机系62学生学生 政治政治面貌面貌 学号学号出生出生日期日期年级年级(d)合并后合并后所在系所在系 平均平均成绩成绩姓名姓名性别性别地球物理与信息工程学院计算机系63实体之间的联系在不同局部视图中呈现不同的实体之间的联系在不同局部视图中呈现不同的类型类型例例1, 实体实体E1与与E2在局部应用在局部应用A中是多对多联中是多对多联系,而在局部应用系,而在局部应用B中是一对

25、多联系中是一对多联系例例2, 在局部应用在局部应用X中中E1与与E2发生联系,而在发生联系,而在局部应用局部应用Y中中E1、E2、E3三者之间有联系。三者之间有联系。l解决方法:根据应用语义对实体联系的类型解决方法:根据应用语义对实体联系的类型进行综合或调整。进行综合或调整。(P226图图6.27)地球物理与信息工程学院计算机系64二、修改与重构二、修改与重构基本任务基本任务消除不必要的冗余,设计生成基本消除不必要的冗余,设计生成基本E-R图图合并合并初步初步E-R图图分分E-R图图可能存在冗余的数据可能存在冗余的数据和冗余的实体间联系和冗余的实体间联系基本基本E-R图图消除不必要的冗余消除不

26、必要的冗余地球物理与信息工程学院计算机系651冗余冗余2消除冗余的方法消除冗余的方法地球物理与信息工程学院计算机系661冗余冗余冗余的数据是指可由基本数据导出的数据,冗余的数据是指可由基本数据导出的数据,冗余的联系是指可由其他联系导出的联系。冗余的联系是指可由其他联系导出的联系。 冗余数据和冗余联系容易破坏数据库的完整性,冗余数据和冗余联系容易破坏数据库的完整性,给数据库维护增加困难给数据库维护增加困难并不是所有的冗余数据与冗余联系都必须加以消并不是所有的冗余数据与冗余联系都必须加以消除,有时为了提高某些应用的效率,不得不以冗除,有时为了提高某些应用的效率,不得不以冗余信息作为代价。余信息作为

27、代价。 地球物理与信息工程学院计算机系67设计数据库概念结构时,哪些冗余信息必须消除,设计数据库概念结构时,哪些冗余信息必须消除,哪些冗余信息允许存在,需要根据用户的整体需哪些冗余信息允许存在,需要根据用户的整体需求来确定。求来确定。消除不必要的冗余后的初步消除不必要的冗余后的初步E-R图称为基本图称为基本E-R图。图。地球物理与信息工程学院计算机系682消除冗余的方法消除冗余的方法分析方法分析方法以数据字典和数据流图为依据,根据数据字典以数据字典和数据流图为依据,根据数据字典中关于数据项之间逻辑关系的说明来消除冗余。中关于数据项之间逻辑关系的说明来消除冗余。地球物理与信息工程学院计算机系69

28、地球物理与信息工程学院计算机系70如果是为了提高效率,人为地保留了一些冗余如果是为了提高效率,人为地保留了一些冗余数据,则应把数据字典中数据关联的说明作为数据,则应把数据字典中数据关联的说明作为完整性约束条件。完整性约束条件。例如:例如: Q4=Q5,一旦Q5修改后就应当触发完整性检查,对Q4进行修改。一种更好的方法是把冗余数据定义在视图中一种更好的方法是把冗余数据定义在视图中地球物理与信息工程学院计算机系71规范化理论规范化理论函数依赖的概念提供了消除冗余联系的形式化函数依赖的概念提供了消除冗余联系的形式化工具工具地球物理与信息工程学院计算机系72方法方法1. 确定分确定分E-R图实体之间的

29、数据依赖图实体之间的数据依赖FL 。实体之。实体之间一对一、一对多、多对多的联系可以用实体间一对一、一对多、多对多的联系可以用实体码之间的函数依赖来表示。码之间的函数依赖来表示。地球物理与信息工程学院计算机系73上图中:部门和职工之间一对多的联系可表示为:职工号部门号职工和产品之间多对多的联系可表示为:(职工号,产品号)工作天数得到函数依赖集FL地球物理与信息工程学院计算机系742. 求求FL的最小覆盖的最小覆盖GL ,差集为,差集为 D = FL-GL。 逐一考察逐一考察D中的函数依赖,确定是否是冗余的中的函数依赖,确定是否是冗余的联系,若是,就把它去掉。联系,若是,就把它去掉。由于规范化理

30、论受到泛关系假设的限制,应注由于规范化理论受到泛关系假设的限制,应注意下面两个问题:意下面两个问题:1)冗余的联系一定在)冗余的联系一定在D中,而中,而D中的联系不一定中的联系不一定是冗余的;是冗余的;2)当实体之间存在多种联系时要将实体之间的)当实体之间存在多种联系时要将实体之间的联系在形式上加以区分。联系在形式上加以区分。地球物理与信息工程学院计算机系75实例 某工厂管理信息系统的视图集成。书中图1.14(c)、图7.24、图7.29分别为该厂物资、销售和劳动人事管理的分E-R图,图7.30为该系统的基本E-R图。地球物理与信息工程学院计算机系76图1.14(c) 工厂物资管理E-R图地球物理与信息工程学院计算机系77图7.24 销售管理子系统的分E-R图地球物理与信息工程学院计算机系78图7.29 劳动人事管理的分E-R图地球物理与信息工程学院计算机系79图7.30 某工厂管理信息系统的基本E-R图地球物理与信息工程学院计算机系80集成过程,解决了以下问题:异名同义,项目和产品含义相同库存

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论