《数据仓库》-第 6 章 数据库设计_第1页
《数据仓库》-第 6 章 数据库设计_第2页
《数据仓库》-第 6 章 数据库设计_第3页
《数据仓库》-第 6 章 数据库设计_第4页
《数据仓库》-第 6 章 数据库设计_第5页
已阅读5页,还剩24页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

6.1数据库设计过程数据库设计就是根据业务系统的要求,选择合适的DBMS(数据库管理系统),建立最有效的数据存储模型,并建立数据库中表结构以及表与表之间关联关系的过程。使之能有效地存储、高效地访问。数据库的设计过程如图6-1所示,具体如下。1.需求分析调查应用领域,对应用领域各种应用的信息要求和操作要求进行详细分析,输出一份《需求分析说明书》。2.概念数据库设计以需求分析阶段所识别的数据项和应用领域的未来改变信息为基础,使用高级数据模型建立概念数据库模式。这也是数据库设计阶段认识现实世界的过程。下一页返回6.1数据库设计过程3.逻辑数据库设计概念数据库模式或者概念模型是计算机无法理解的世界,因此需要把概念设计阶段产生的概念数据库模式变换为逻辑数据库模式。4.物理数据库设计在逻辑数据库设计的基础上,为每个关系模式选择合适的存储结构和存取方法,使数据上的事务能够高效地运行。上一页返回6.2需求分析需求分析的基本步骤如下。(1)调查分析应用领域的组织结构、业务流程和数据流程。①调查给定应用领域的组织结构,列出各职能部门以及相互关系。②调查每个职能部门的业务活动情况,抽象出每个职能部门各种应用的功能和所需信息的定义,并确定职能部门内单个应用之间的信息依赖关系及信息流通路径。③协助用户明确对系统的各种要求,包括信息要求、处理要求、安全性和完整性要求。④对以上结果进行初步分析,确定系统边界,确定哪些功能由计算机完成或将来由计算机完成,哪些由人工完成。(2)根据上一个阶段的分析,抽象出下列信息。①定义应用领域的流程信息。下一页返回6.2需求分析②定义应用领域的存储信息。③确定应用领域中各种流动信息的源点和终点。④定义应用领域的各种应用,包括输入信息、输出信息和应用功能定义。⑤定义上述四者之间的联系。(3)通过数据流图的方法抽象出逻辑模型。数据流图(DataFlowDiagram,DFD),从数据传递和加工角度,以图形方式来表达系统的逻辑功能、数据在系统内部的逻辑流向和逻辑变换过程,是结构化系统分析方法的主要表达工具及用于表示软件模型的一种图示方法。数据流图从顶层开始,依次为第0层(见图6-3)、第1层、第2层等,逐级层次化,分解到系统的工作过程表达清楚为止。其基本符号如图6-2所示。上一页下一页返回6.2需求分析(4)定义数据库系统支持的信息与应用。考察数据流图中的每个数据处理应用,确定正在设计的数据库是否应用且可能支持这个应用,将这些应用进行严格定义,内容包括应用名、应用功能定义、输入信息和输出信息,如表6-2所列。考察数据流图中每个存储信息,确定其应用是否由数据库存储,将需要由数据库存储的信息进行严格定义,内容包括信息集合名、信息表内容定义、产生此信息集的应用和引用此信息集的应用,如表6-3所列。(5)定义数据库操作任务。(6)定义数据项,如表6-4所列。(7)预测现行系统未来的改变。上一页返回6.3概念数据库设计数据模型主要用来抽象、表示和处理现实世界中的数据和信息,以便于采用数据库技术对数据进行集中管理和应用,是对客观事物及其联系的数学描述(见图6-4)。关系型数据库管理的数据模型是关系模型。人认识信息世界是从概念模型开始的,因此要先进行概念数据库设计。产生反映组织信息需求的数据库概念结构,即概念模型。概念模型独立于数据库逻辑结构、DBMS及计算机系统。概念模型以一组E-R图形式表示。概念设计侧重于数据内容的分析和抽象,以用户的观点描述应用中的实体以及实体间的联系。概念数据库设计通常使用E-R(Entity-Relationship,实体−联系)方法来进行概念数据库设计。通过E-R图可以描述实现世界。下一页返回6.3概念数据库设计6.3.1E-R模型相关概念1.实体(Entity)现实世界中实实在在存在的各种事物的抽象,是E-R模型中的基本对象。一个数据库常有很多类似的实体,如图书管理系统中就有读者、图书等实体。实体型是一个具有相同属性的实体集合,由一个实体型名字和一组属性来定义,也称为实体模式。实例:表示实体集合中任一实体,简称实体。键:每个实体型都由一个或多个属性组成,用于区别不同的实体。2.属性(Attribute)属性即某一实体的特征。在E-R模型中,实体必须由一组属性来描述,属性又分为以下几种。上一页下一页返回6.3概念数据库设计1)复合属性某些属性可以划分成多个具有独立意义的子属性,这类属性则称为复合属性。2)单值属性对于同一个实体只能取一个值的属性。3)多值属性可能取多个值的属性。4)导出属性可以从另一个属性中导出或者可以从有关的实体导出的属性。上一页下一页返回6.3概念数据库设计3.联系(Relationship)联系即实体与实体间的对应关系。联系分为以下3种类型。1)一对一联系(1:1)如果实体集A中每个实体至多和实体集B中一个实体有联系,反之亦然,则称实体集A和实体集B为一对一的联系,记作1:1联系。2)一对多联系(1:N)如果实体集A中每个实体可以和实体集B中任意个(零个或者多个)有联系,而实体集B中每个实体至多和实体集A中一个实体有联系,则称实体集A和实体集B为一对多的关系,记作1:N联系。3)多对多联系(M:N)如果实体集A中每个实体可以与实体集B中任意个(零个或者多个)实体有联系,反之亦然,则称实体集A和实体集B为多对多的联系,记作M:N联系。上一页下一页返回6.3概念数据库设计6.3.2E-R模型表示方法E-R模型的表示方法如图6-5和图6-6所示。(1)用矩形(□)表示实体,框内注明实体名称。(2)用椭圆形(○)表示实体的属性,注明属性名称。(3)用菱形(

)表示实体间的联系,注明联系名称。(4)用无向边线“—”连接实体与属性。上一页返回6.4逻辑数据库设计逻辑数据库设计步骤如图6-7所示,包括以下步骤。(1)E-R模型转换成关系数据库模式。(2)关系数据库模式的规范化。(3)模式评价。(4)模式修正。(5)最终产生一个优化的全局关系数据库模式。(6)子模式设计。下一页返回6.4逻辑数据库设计6.4.1初始关系数据库模式的形成将E-R图向关系模型转换的步骤如下。(1)一个实体转换成一个关系,实体的属性转换为关系的属性,实体所对应的键就是关系所对应的码。(2)1:1联系可以转换为一个独立的关系模式,也可以与任意一端所对应的关系模式合并。如果转换为一个独立的关系模式,则与联系相连的各实体的码以及联系本身的属性均转换为关系的属性,每个实体的码均是该关系的候选码。如果将联系与任意一端实体所对应的关系模式合并,则需要在被合并的关系中增加属性,其新增的属性为联系本身的属性和与联系相关的另一个实体集的码。上一页下一页返回6.4逻辑数据库设计(3)1:N联系可以转换为一个独立的关系模式,也可以与N段所有对应的关系模式合并。如果转换为一个独立的关系模式,则与该联系相连的各实体的码以及联系本身的属性均转换为联系模式,而关系的码为N端的码。如果是在N端实体集中增加新属性,新属性由联系对应的1端实体集的码和联系自身的属性构成,新增属性后原关系的码不变。(4)M:N联系转换为一个关系模式,与该联系相连的各实体的码以及联系本身的属性均转换为关系的属性,新关系的码为两个相连实体码的组合。(5)3个或3个以上实体间的多元联系转换为一个关系模式,与该多元联系相连的各实体的码以及联系本身的属性均转换为关系的属性,而关系的码为各实体码的组合。上一页下一页返回6.4逻辑数据库设计(6)具有相同码的关系可以合并,如果两个关系模式具有相同的主码,可以考虑将它们合并为一个关系模式,将其中一个关系模式的全部属性加入到另一个关系模式中,然后去掉其中的同义属性,并适当调整属性的次序。6.4.2数据库的规范化数据库的规范化定义在2.6节有详细介绍。那么在对数据库进行规范化时,首先确定范式级别,再根据数据依赖确定已有的范式级别,根据需求写出数据库模式中存在的所有函数依赖,消除冗余数据依赖,求出最小的依赖集。上一页下一页返回6.4逻辑数据库设计1.确定范式级别根据实际应用的需要(处理需求)确定要达到的范式级别、时间效率和模式设计问题之间的权衡;范式越高,模式设计问题越少,但连接运算越多,查询效率越低;如果根据应用要求对数据只是查询,没有更新操作,则非BCNF范式也不会带来实际影响;如果根据应用要求对数据更新操作较频繁,则要考虑高一级范式以避免数据不一致。实际应用中一般以3NF为最高范式。2.规范化处理确定了初始数据模式的范式,以及应用要达到的范式级别后,按照规范化处理过程分解模式,达到目标范式。上一页下一页返回6.4逻辑数据库设计6.4.3模式评价和修正检查规范化后的数据库模式是否完全满足用户需求,并确定要修正的部分,然后进行以下步骤。1.功能评价检查数据库模式是否支持用户所有的功能要求;必须包含用户要存取的所有属性,如果某个功能涉及多个模式,要保证无损连接性。2.性能评价检查查询响应时间是否满足规定的需求。由于模式分解导致连接代价不满足时,则要重新考虑模式分解的适当性,可采用模拟的方法评价性能。上一页下一页返回6.4逻辑数据库设计6.4.4用户外模式的设计使用更符合用户习惯的别名,E-R图集成时要消除命名冲突以保证关系和属性名的唯一,在子模式设计时可以重新定义这些名称,以符合用户习惯给不同级别的用户定义不同的子模式,保证系统安全性,如图6-8所示。上一页返回6.5数据库的物理设计数据库物理设计是后半段。将一个给定逻辑结构实施到具体的环境中时,逻辑数据模型要选取一个具体的工作环境,这个工作环境提供了数据存储结构与存取方法,这个过程就是数据库的物理设计。物理结构依赖于给定的DBMS和硬件系统,因此设计人员必须充分了解所用RDBMS的内部特征、存储结构、存取方法。数据库的物理设计通常分为两步:确定数据库的物理结构;评价实施空间效率和时间效率。确定数据库的物理结构包含以下4方面的内容。(1)确定数据的存储结构。(2)设计数据的存取路径。(3)确定数据的存放位置。下一页返回6.5数据库的物理设计(4)确定系统配置。数据库物理设计过程中需要对时间效率、空间效率、维护代价和各种用户要求进行权

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论