版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、数据库系统概论数据库设计基本概念n软件生存周期:是指软件的规划、研制、实现和投入运行后的维护,直到它被新的软件所取代而停止使用的整个期间。n数据库系统的生存期:是指应用系统从开始规划、分析、设计、实现、投入运行及维护直到它被新系统取代而停止使用的整个期间。n数据库设计:指对于一个给定的应用环境,构造最优的数据库模式,建立数据库及应用系统,使之能够有效的存储数据,满足用户的需求。数据库和信息系统n数据库是信息系统的核心和基础。n对于从是数据库设计的专业人员来讲,应具备多方面的技术和知识:n数据库的基本知识和数据库设计技术n计算机科学的基础知识和程序设计的方法和技巧n软件工程的原理和方法n应用领域
2、的知识数据库设计的任务(1)n根据一个单位的信息需求、处理需求和数据库的支撑环境,设计数据模式以及典型的应用程序。数据库设计数据库设计处理需求处理需求DBMS特性特性硬件、硬件、OS特性特性信息需求信息需求典型应用程序典型应用程序数据模式数据模式数据库设计的任务(1)n信息要求:表示一个单位所需要的数据及其结构 对数据库的内容和结构上的要求n处理要求:表示一个单位经常需要进行的数据处理 对于数据库的数据处理要求nDBMS、OS和硬件:是建立数据库的软硬件基础,也是其制约因素。n数据库设计的成果:数据模式,是最基本的成果;典型应用程序。数据库设计的规律n“三分技术,七分管理,十二分基础数据”是最
3、基本规律。n数据库设计是硬件、软件和干件的结合n整个设计过程中要把结构(数据)设计和行为(处理)设计密切集合起来数据库设计的特征n反复性:数据库的设计要反复推敲和修改才能完成n试探性n分步进行:一是由于技术分工上的需要,二是为了分段把关,逐级审查,保证设计的质量和进度。数据库设计的方法n手工试凑法n新奥而良方法n基于E-R模型的数据库设计方法n基于3NF的设计方法n基于抽象语法规范的设计方法n计算机辅助设计的方法(CASE)数据库设计的基本步骤(1)n需求分析:主要是对一个单位的组织、各部门的联系、有关的事物和活动以及描述它们的数据、信息流程、政策制度、报表及其格式和有关的文档等资料进行收集和
4、分析。n概念结构设计:通过对用户需求进行综合、归纳与抽象,形成一个独立于具体DBMS的概念模型。n逻辑结构设计:将概念结构转换成为某个DBMS所支持的数据模型,并对其进行优化。数据库设计的基本步骤(2)n物理结构设计:是为逻辑数据模型选取一个最适合应用环境的物理结构(包括存储结构和存取方法)n数据库实施:运用DBMS提供的语言及宿主语言,据逻辑设计和物理设计的结果建立数据库,编制与调试应用程序,组织数据入库,试运行n数据库运行和维护:在数据库系统运行过程中必须不断的对其进行评价、调整和修改。需求分析的任务n通过详细调查现实世界要处理的对象,充分了解原系统工作概况,明确用户的各种要求,然后在此基
5、础上确定新系统的功能。n调查的重点:数据和处理n信息要求:用户需要从数据库中获得信息的内容与性质。可导出数据要求,即需存储哪些数据。n处理要求:指用户要完成什么处理功能、处理的响应时间、处理方式n安全性与完整性要求调查用户需求的步骤n调查组织机构情况n调查各部门的业务活动情况n协助用户明确对新系统的各种要求n确定新系统的边界常用的调查方法n跟班作业:比较准确的了解需求,但耗费时间n开调查会:参加者之间可以相互启发n请专人介绍n询问:对调查中的问题找专人询问n用户填写调查表:如果表格设计合理,这种方法有效且用户易于接受n查阅记录分析整理信息要求n即把收集的各种信息转为下一阶段设计可用的形式化信息
6、。n方法:结构化分析方法(SA)n描述方法n自然语言n数据流程图、数据字典数据字典(1)n数据字典是系统中各类数据描述的集合。n优点:不仅可以减少设计者的负担,也有利于保持数据的一致性和提供各种统计数据n数据字典通常包括:数据项、数据流、数据结构、数据存储、数据处理五个部分n数据项:不可再分的数据单位 数据项描述=数据项名、数据项含义说明、别名、数据类型、长度、取值范围、取值含义、与其他数据项的逻辑关系、数据项之间的联系数据字典(2)n数据结构:反映数据之间的组合关系数据结构描述:数据结构名、含义说明、组成:数据项或数据结构n数据流:是数据结构在系统内传输的路径 数据流描述=数据流名、说明、数
7、据流来源、数据流去向、组成:数据结构、平均流量、高峰期流量数据字典(3)n数据存储:数据结构停留或保存的地方 数据存储描述=数据存储名、说明、边号、输入的数据流、输出的数据流、组成:数据结构、数据量、存取频度、存取方式n数据处理:处理过程的说明性信息 数据处理描述=数据处理名、说明、输入:数据流、输出:数据流、处理:简要说明需求分析小结n需求分析阶段设计人员应充分考虑到可能的扩充和改变,使设计易于修改,系统易于扩充。n必须强调用户的参与。概念结构设计n将需求分析得到的用户需求抽象为信息结构即概念模型的过程就是概念结构设计。n概念结构的特点:n能真实、充分地反映现实世界n易于理解n易于更改n易于
8、向关系、网状、层次等各种数据模型转换n描述概念模型的有力工具:E-R模型概念结构设计的方法n自顶向下:首先定义全局概念结构的框架,然后逐步细化。n自底向上:首先定义各局部应用的概念结构,然后见他们集成起来,得到全局结构。n逐步扩张:首先定义最重要的核心概念结构,然后向外扩充,逐步生成其他概念结构,直至总体概念结构。n混合策略:将上述两种方法结合起来。概念结构设计的步骤n自底向上方法的步骤:n抽象数据并设计局部视图n集成局部视图,得到全局的概念结构数据抽象n分类:定义某一概念作为现实世界中一组对象的类型。这些对象具有某些共同的特性和行为抽象了“is member of ”的语义。n聚集:定义某一
9、类型的组成成分。抽象了对象内部类型和成分之间“is part of”的语义。n概括:定义类型之间的一种子集关系。抽象了类型之间的“is subset of”的语义。其一个重要性质是:继承性。 设计分E-R图的方法(1)n选择局部应用:根据某个系统的具体情况,在多层的数据流图中选择一个适当层次的数据流图作为设计分E-R图的出发点 。n逐一设计分E-R图:将数据字典中的数据抽取出来,参照数据流图,设计出E-R图,再作必要的调整。设计分E-R图的方法(2)n调整原则:n作为“属性”,不能再具有描述的性质。n“属性”不能与其他实体具有联系n例:职工实体中的职称 病房 仓库视图的集成n集成的方式主要有两
10、种:n多个分E-R图一次集成,这种方式比较复杂,难度较大n逐步集成,用累加的方式一次集成两个分E-R图n集成视图的步骤:n合并:解决各分E-R图之间的冲突,将各分E-R图合并起来生成初步E-R图。n修改和重构:消除不必要的冗余,生成基本E-R图合并n确定公共实体类:合并可从公共实体类开始。n一般把同名实体类作为公共实体类的一种候选n把具有相同标识的实体类作为公共实体类的另一种候选n消除冲突:各个分E-R图之间存在的不一致的地方称为冲突。消除冲突是合并分E-R图的关键。冲突的类别(1)n属性冲突:n属性域冲突,即属性值的类型、取值范围或取值集合不同。n属性取值单位冲突n命名冲突:n同名异义,即不
11、同意义的对象在不同的局部应用中具有相同的名字n异名同义,即同一意义的对象在不同的局部应用中具有不同的名字冲突的类别(2)n结构冲突:n同一个对象在不同的应用中具有不同的抽象,解决办法是:把属性变换为实体或把实体变换为属性。n同一实体在不同分E-R图中所包含的属性个数和 属性排列次序不完全相同。解决办法是使该实体的属性取各分E-R图中属性的并集,在适当调整属性的次序。n实体间的联系在不同的分E-R图中为不同的类型。n解决方法是据应用的语义对实体联系的类型进行综合或调整。全局E-R模式的优化(1)n优化:实体类型的合并;冗余联系的消除;冗域属性的消除。n冗余的数据指可由基本数据导出的数据,冗余的联
12、系指可由其他联系导出的联系。n消除冗余的方法主要是分析法:即以数据字典和数据流图为依据,根据数据字典中关于数据项之间逻辑关系的说明来消除冗余。n具体情况要根据用户的整体需求来确定。逻辑结构设计n任务:把概念结构设计阶段设计好的基本E-R图转换位与选用DBMS产品所支持的数据模型相符合的逻辑结构。n步骤:一般分三步进行:n将概念结构转换为一般的关系、网状、层次模型n将转换来的关系、网状、层次模型向特定DBMS支持下的数据模型转换n对数据模型进行优化E-R图向关系模型的转换(1)n解决的问题:如何将实体和实体间的联系转换为关系模式,如何确定这些关系模式的属性和码。n转换遵循的规则:n一个实体型转换
13、为一个关系模式n一个1:1联系可以转换为一个独立的关系模式 ,也可以与任意一端对应的关系模式合并。如转换为一个独立的模式,则两端关系的码及联系的属性为该关系的属性,若与一端合并,则将另一端的码及联系的属性合并到该端。n1:1联系 厂长(厂长号,厂号,姓名,年龄) 工厂(厂号,厂名,地点) 厂长厂长工厂工厂管理管理厂长号厂长号姓名姓名年龄年龄厂号厂号厂名厂名地点地点E-R图向关系模型的转换(2)n一个1:n联系可以转换为一个独立的关系模式 ,也可以与n端对应的关系模式合并。如转换为一个独立的模式,则于该联系相连的各实体的码及联系的属性均转换为该关系的属性,关系的码为n端实体的码。n一个m:n联系
14、转换为一个独立的关系模式 。与该联系相连的各实体的码及联系的属性均转换为该关系的属性,关系的码为各实体码的组合。n1:n联系 仓库(仓库号,地点,面积) 产品(货号,品名,价格, 仓库号,数量) 仓库仓库产品产品存放存放仓库号仓库号地点地点面积面积货号货号品名品名价格价格数量数量nm:n联系 学生(学号,姓名,性别) 课程(课程号,课程名,学时) 学习(学号,课程号,成绩) 学生学生课程课程学习学习学号学号姓名姓名性别性别课程号课程号课程名课程名学时学时成绩成绩E-R图向关系模型的转换(3)n实体间的一个多元联系可以转换为一个关系模式。与该多元联系相连的各实体的码及联系的属性均转换为该关系的属
15、性。n具有相同码的关系模式可合并。数据模型的优化(1)n根据需要适当的修改、调整数据模型的结构,这就是数据模型的优化。n方法:以规范化理论为指导n确定函数依赖n对于各个关系模式之间的数据依赖进行极小化处理,消除冗余的联系n按照数据依赖的理论对关系模式逐一分析,考察依赖关系,确定关系模式属于第几范式。数据模型的优化(2)n根据需求分析得到的处理要求,分析这些模式对于这样的应用环境是否合适,确定是否要对这些模式进行合并或分解n对关系模式进行必要的分解,提高数据操作的效率和存储空间的利用率。n水平分解:把基本关系的元组分为若干子集合,定义每个子集合为一个子关系。原则:“80/20原则”n垂直分解:把
16、关系模式的属性分解为若干子集合,形成若干子关系模式。原则:经常在一起使用的属性从中分解出来形成一个子关系模式。设计用户子模式n主要作用:n提供一定的逻辑数据独立性n更好地适应不同用户对数据的需求n有利于数据保密n实现:视图。在定义时可以注重考虑用户的习惯与方便:n使用更符合用户习惯的别名n可以多不同级别的用户定义不同的视图n简化用户对系统的使用数据库物理设计n任务:选择合适的存储结构和存取路径,既设计数据库的内模式。n目标:n提高数据库性能,特别是满足主要应用性能要求n有效利用存储空间n步骤:n确定数据库的物理结构:存取方法和存储结构n对物理结构进行评价,重点是时间和空间效率内容和方法n确定关
17、系的存取方法的依据:n对进行的事务进行详细分析,获取选择物理数据库设计所需要的参数n充分了解所用的RDBMS的内部特征,特别是系统提供的存取方法和存储结构n还需知道每个事务在各关系上运行的频率和性能要求n内容:关系模式的存取方法和数据库文件的物理存储结构B+树索引存取方法n索引存取方法:根据应用要求确定对关系的哪些属性列建立索引,哪些属性列建立组合索引哪些索引设计为唯一索引等n如果某属性(组)经常在查询条件中出现,则考虑在其上建立索引(或组合索引)n如果某属性(组)经常在作为最大值和最小值等函数的参数,则考虑在其上建立索引n如果某属性经常在连接操作的连接条件中出现,则考虑在其上建立索引(或组合
18、索引)聚簇存取方法(1)n聚簇存取方法:为提高某属性(组)的查询速度,把这个或这些属性上具有相同值的元组集中存放在连续的物理块中。n把多个连接关系的元组按连接属性值聚集存放,聚簇中的连接属性称为聚簇码。n一个关系只能加入一个聚簇聚簇存取方法(2) n设计候选聚簇n对经常在一起进行连接操作的关系可以建立聚簇n如果一个关系的一组属性经常出现在相等比较条件中,则该单个关系可以建立聚簇n如果一个关系的一个(组)属性上的值重复率很高,则该单个关系可以建立聚簇聚簇存取方法(3)n检查候选聚簇中的关系,取消不必要的关系:n从聚簇中删除经常进行全表扫描的关系n从聚簇中删除更新操作远多于连接操作的关系n不同的聚
19、簇中可能包含相同的关系,一个关系可以在某一个聚簇中,但不能同时加入多个聚簇。选择代价最小的。HASH存取方法n如果一个关系的属性主要出现在等连接条件中或主要出现在相等比较选择条件中,满足下列条件之一,可选择HASH存取方法:n如果一个关系的大小可预知,而且不变n如果关系的大小动态改变,而且数据库管理系统提供动态HASH存取方法确定数据库存储结构n确定数据的存储位置和存储结构,包括确定关系、索引、聚簇、日志、备份等的存储安排和存储结构,确定系统配置等。n影响因素:时间、空间利用率、维护代价n确定数据的存放位置:根据应用情况将数据的易变部分与稳定部分、经常存取部分和存取频率较低的部分分开存放n确定
20、系统配置:系统配置变量、存储分配参数评价物理结构n方法完全依赖于所选的DBMS,主要从定量估算各种方案的存储空间、存取时间和维护代价入手,对估算结果进行权衡、比较,选择一个较优的合理的物理结构。数据库的实施n用数据定义语言和其他实用程序将数据库逻辑设计和物理设计结果严格描述出来,成为DBMS可以接受的源代码,再经过调试产生目标模式。n任务:n数据的载入n应用程序的编码和调试数据库的试运行n在原有系统的数据有一小部分已输入数据库后,就可以开始对数据库系统进行联合调试,即试运行。n注意:n分期分批的组织数据入库,待试运行基本合格后,再大批量输入数据n应首先是运行DBMS的恢复功能,做好数据库的转储
21、和恢复工作。数据库的运行和评价n日常维护工作由DBA完成:n数据库的转储和恢复n数据库的安全性、完整性控制n数据库性能的监督、分析和改造n数据库的重组织和重改造小结n数据库设计是指对于一个给定的应用环境,构造最优的数据库模式,建立数据库及其应用系统,使之能有效的存储数据,满足各种用户的需求(信息需求和处理需求)。n通过学习本章,应重点掌握:n数据库设计的概念n需求分析阶段的任务n概念结构设计阶段的任务与实现方法n逻辑结构设计阶段的任务与实现方法n物理结构设计阶段要考虑的任务n数据库的实现与维护习题nE-R方法的三要素是( )。 A 实体、属性、实体集 B 实体、键、联系 C 实体、属性、联系
22、D 实体、域、候选键n所谓概念模型( )。 A 客观存在的事物及其相互联系 B 将信息世界中的信息数据化 C 实体模型在计算机中的数据化表示 D 现实世界到机器世界的一个中间层次,即信息世界 习题n如果采用关系数据库实现应用,在数据库的设计阶段需将( )转换为关系数据模型。 A E-R模型 B 层次模型 C 关系模型 D 网状模型n在数据库设计的需求分析阶段,业务流程一般采用( )表示。 A E-R模型 B 数据流图 C 程序结构图 D 程序框图n如果采用关系数据库实现应用,在数据库设计( )阶段将关系模式进行规范化处理。 A 需求分析 B 概念设计 C 逻辑设计 D 物理设计习题n概念设计的结果是( )。 A 一个与DBMS相关的概念模式 B一个与DBMS无关的概念模式 C 数据库系统的公用视图 D 数据库系统的数据字典n在数据库的物理结构中,将具有相同值的元组集中存放在连续的物理块称为( )存取方法。 A HASH B B+树索引 C 聚簇 D 其它习题n在数据库设计中,当合并局部E-R图时,学生在某一局部应用中被当作实体,而在另一局部应用中被当作属性,那么称之为( )冲突。 A 属性冲突 B 命名冲突 C 联系冲突 D 结构冲突n在数据库设计中,学生的学号在某一局部应用中被定义为字符型,而在另一局部应用中被定义为整型
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2026马踏春风筑梦行
- 微量氧传感研究-洞察与解读
- 多模态图像融合识别-洞察与解读
- 智能感知在田间监控中的应用-洞察与解读
- 基于智能合约的结算-洞察与解读
- 多维度绩效评价体系构建-洞察与解读
- 状态远程诊断-洞察与解读
- 多源遥感数据配准-洞察与解读
- 正念之师说课材料
- 2025 九年级道德与法治下册新发展格局构建策略课件
- 2026年春节后复工复产安全培训第一课
- 2026年中国银发经济深度报告:8万亿市场下的细分赛道机会
- 藤县介绍教学课件
- 2026年部编版新教材语文小学三年级下册教学计划(含进度表)
- (正式版)DB51∕T 3320-2025 《地震灾害损失精细化预评估规范》
- GB/T 8642-2025热喷涂抗拉结合强度的测定
- 期末冲刺备考总动员校长在教师会议上讲话:五字诀精实盯严稳
- 秋季学期末会议分管德育工作副校长讲话:勇担职责强德育凝心聚力助发展
- 2025年数字化货运物流平台运营项目可行性研究报告
- 2026年中国头皮健康行业发展展望及投资策略报告
- 安全生产管理奖惩制度
评论
0/150
提交评论