数据库系统原理-7数据库设计.ppt_第1页
数据库系统原理-7数据库设计.ppt_第2页
数据库系统原理-7数据库设计.ppt_第3页
数据库系统原理-7数据库设计.ppt_第4页
数据库系统原理-7数据库设计.ppt_第5页
已阅读5页,还剩92页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

数据库系统 第六章数据库设计 目录 7 1数据库设计概述7 2需求分析7 3概念结构设计7 4逻辑结构设计7 5数据库的物理设计7 6数据库实施和维护 数据库设计概述 数据库设计 对于一个给定的应用环境 构造 设计 优化的数据库逻辑模式和物理结构 并据此建立数据库及其应用系统 使之能够有效地存储和管理数据 满足各种用户的应用需求 包括信息管理要求和数据操作要求 目标 为用户和各种应用系统提供一个信息基础设施和高效率的运行环境 数据库设计概述 结构和行为分离的设计方法 现实世界 数据库设计概述 数据库设计方法 新奥尔良 NewOrleans 方法将数据库设计分为若干阶段和步骤基于E R模型的数据库设计方法概念结构设计阶段广泛采用3NF 第三范式 的设计方法逻辑阶段可采用的有效方法ODL ObjectDefinitionLanguage 方法面向对象的数据库设计方法计算机辅助设计ORACLEDesigner2000SYBASEPowerDesigner 规范设计法基本思想 过程迭代和逐步求精 数据库设计的基本步骤 需求分析阶段概念结构设计阶段逻辑结构设计阶段数据库物理设计阶段数据库实施阶段数据库运行阶段 数据库设计概述 数据库设计的基本步骤 一 数据库设计的准备工作 选定参加设计的人1 系统分析人员 数据库设计人员自始至终参与数据库设计2 用户和数据库管理员主要参加需求分析和数据库的运行维护3 应用开发人员 程序员和操作员 在系统实施阶段进来 负责编制程序和准备软硬件环境 需求分析和概念结构设计独立于任何数据库管理系统逻辑设计和物理设计与选用的DBMS密切相关 数据库设计概述 数据库设计的六个阶段 需求分析阶段准确了解与分析用户需求 包括数据与处理 概念结构设计阶段 整个数据库设计的关键 通过对用户需求进行综合 归纳与抽象 形成一个独立于具体DBMS的概念模型 逻辑结构设计阶段将概念结构转换为某个DBMS所支持的数据模型对其进行优化 数据库物理设计阶段为逻辑数据模型选取一个最适合应用环境的物理结构 包括存储结构和存取方法 数据库实施阶段根据逻辑设计和物理设计的结果建立数据库编制与调试应用程序组织数据入库进行试运行 数据库运行和维护阶段数据库应用系统经过试运行后即可投入正式运行在数据库系统运行过程中不断对其进行评价 调整与修改 数据库设计阶段成果 Creat Load Main If Then end IPO表 输入 输出 处理 数据库设计概述 数据库的各级模式 需求分析 需求分析的任务 详细调查现实世界要处理的对象 组织 部门 企业等 充分了解原系统 手工系统或计算机系统 明确用户的各种需求确定新系统的功能充分考虑今后可能的扩充和改变 需求分析 需求分析过程 需求分析 详细的需求分析步骤 一 问题识别 功能需求 性能需求 环境需求 可靠性需求 安全保密需求 用户界面需求 资源使用需求 软件成本消耗和开发进度需求 预先估计以后系统会达到的目标 调查需求达成共识分析表达需求 二 分析与综合三 编制需求分析的档案四 需求分析评审 系统定义的目标是否与用户的要求一致 需求分析阶段提供的文档是否齐全 文档中的描述是否完整 清晰 准确反映用户要求 与所有其它系统成分的重要接口是否已经描述 所开发项目的数据流与数据结构是否都已经描述 所有图表是否清楚 在不补充说明时能否理解 主要功能是否已经包括在规定的软件范围内 是否已充分说明 设计的约束或限制条件是否符合实际 开发的技术风险是什么 是否考虑软件需求的其它方案 详细的需求分析步骤 需求分析 详细的需求分析步骤 相当专业 相当复杂 需求分析工作流程 需求分析 调查用户需求的方法 跟班作业 开调查会 请专人介绍 询问 设计调查表请用户填写 查阅记录 多数行业的调查都是这样的 需求分析 系统高层抽象图 首先把任何一个系统都抽象为 信息要求 处理要求 结构化分析方法 StructuredAnalysis 简称SA方法 从最上层的系统组织机构入手自顶向下 逐层分解分析系统 医院是干什么的 医院有哪些业务科室和管理部门 医院的管理机构和制度如何 各个科室和部门负责什么工作 各个岗位负责什么工作 每件工作是怎样完成的 干这些工作有哪些附加条件 哪些约束 用户有什么要求 其中涉及到哪些数据 现有业务流程和管理制度可以做什么改进 需求分析 进一步分析和表达用户需求 2 分解处理功能和数据 1 分解处理功能 将处理功能的具体内容分解为若干子功能 2 分解数据 处理功能逐步分解的同时 逐级分解所用数据 形成若干层次的数据流图 3 表达方法数据流图 数据字典3 将分析结果再次提交给用户 征得用户的认可 需求分析 描述工具 数据流图 处理 数据 数据流向 数据存储文件 需求分析 多个数据流与加工之间的关系 有 则有 或 或两者都有 有 则有 与 两者同时有 有 则有 或 但不会同时有 与 当 或 有一个存在 就有 当 与 都存在 就有 需求分析 分层数据流图 需求分析 数据流图画法 自顶向下 逐层细化 完善求精 找出系统的数据源与汇点 它们是外部实体 由它们确定系统与外界的接口 找出外部实体的输出数据流与输入数据流 在图的边上画出系统的外部实体 从外部实体的输出数据流 系统源点 出发 按系统逻辑需要 逐步画出逻辑加工 直到找到外部实体所需的输入数据流 系统汇点 形成数据的封闭 进行检查和修改 按照上述步骤 从各加工出发 画出所需的子图 需求分析 数据流图示例 办理取款手续的数据流图 需求分析 进行检查和修改的原则 1 数据流图上所有图形符号只限于前述4种基本图形元素2 主图必须包括前述4种基本元素3 主图上的数据必须封闭在外部实体之间 外部实体可不只一个4 每个加工至少有一个输入数据流和一个输出数据流5 需要按曾2给加工框编号6 任何一个数据流子图必须与它上一层的一个加工对应 两者的输入数据流和输出数据流必须一致 7 图上没个元素必须有名字8 不可夹带控制流9 初画时可以忽略细节 集中精力于主要数据流 需求分析 表明修改区域的数据流图 需求分析 数据字典 数据字典是关于数据库中数据的描述 是元数据 而不是数据本身数据字典在需求分析阶段建立 在数据库设计过程中不断修改 充实 完善 需求分析 数据字典的定义 1 数据项描述 数据项名 数据项含义说明 别名 数据类型 长度 取值范围 取值含义 与其它数据项的逻辑关系 数据项之间的联系 数据字典的任务是对数据流图中出现的所有被命名的图形元素在数据字典中作为一个词条加以定义 不可再分的数据单位 2 数据结构描述 数据结构名 含义说明 组成 数据项或数据结构 反映数据之间的组合关系 可由若干数据项组成 也可由若干数据结构组成 或由若干数据项和数据结构混合组成 需求分析 数据字典的定义 4 数据存储描述 数据存储名 说明 编号 输入的数据流 输出的数据流 组成 数据结构 数据量 存储频度 存储方式 3 数据流描述 数据流名 说明 数据流来源 数据流去向 组成 数据结构 平均流量 高峰期流量 反映数据结构在系统内系统内的传输路径 数据结构停留或保存的地方 也是数据流的来源和去向 5 处理过程说明 处理过程名 说明 输入 数据流 处理 简要说明 处理过程的具体处理逻辑一般用判定表或判定树来描述 数据字典中只需要描述处理过程的说明性信息 需求分析 数据字典的定义 需求分析 数据字典举例 例 学生学籍管理子系统的数据字典 数据项 以 学号 为例 数据项 学号含义说明 唯一标识每个学生别名 学生编号类型 字符型长度 8取值范围 至取值含义 前两位标别该学生所在年级 后六位按顺序编号与其他数据项的逻辑关系 需求分析 处理过程 续 数据结构 以 学生 为例 学生 是该系统中的一个核心数据结构 数据结构 学生含义说明 是学籍管理子系统的主体数据结构 定义了一个学生的有关信息组成 学号 姓名 性别 年龄 所在系 年级 需求分析 处理过程 续 数据流 体检结果 可如下描述 数据流 体检结果说明 学生参加体格检查的最终结果数据流来源 体检数据流去向 批准组成 平均流量 高峰期流量 需求分析 处理过程 续 数据存储 学生登记表 可如下描述 数据存储 学生登记表说明 记录学生的基本情况流入数据流 流出数据流 组成 数据量 每年3000张存取方式 随机存取 需求分析 处理过程 续 处理过程 分配宿舍 可如下描述 处理过程 分配宿舍说明 为所有新生分配学生宿舍输入 学生 宿舍输出 宿舍安排处理 在新生报到后 为所有新生分配学生宿舍 要求同一间宿舍只能安排同一性别的学生 同一个学生只能安排在一个宿舍中 每个学生的居住面积不小于3平方米 安排新生宿舍其处理时间应不超过15分钟 概念结构设计 概念结构 概念结构设计的特点 1 能真实 充分地反映现实世界 2 易于理解 3 易于更改 4 易于向关系 网状 层次等各种数据模型转换 将需求分析得到的用户需求抽象为信息结构 概念模型 的过程概念结构是各种数据模型的共同基础 比数据模型更抽象 更稳定 无需专业知识 告诉你就会做 概念结构设计 设计概念结构的方法 自顶向下首先定义全局概念结构的框架 然后逐步细化 抱歉 我一时难以了解细节 概念结构设计 设计概念结构的方法 自底向上首先定义各局部应用的概念结构 然后将它们集成起来 得到全局概念结构 抱歉 我一时难以了解全部业务 概念结构设计 设计概念结构的方法 逐步扩张首先定义最重要的核心概念结构 然后向外扩充 以滚雪球的方式逐步生成其他概念结构 直至总体概念结构 实在太复杂 擒贼先擒王 概念结构设计 设计概念结构的方法 混合策略将自顶向下和自底向上相结合 用自顶向下策略设计一个全局概念结构的框架 以它为骨架集成由自底向上策略中设计的各局部概念结构 常用策略自顶向下地进行需求分析自底向上地设计概念结构 概念结构设计 设计概念结构的方法 自底向上设计概念结构的步骤第1步 抽象数据并设计局部视图第2步 集成局部视图 得到全局概念结构 概念结构设计 数据抽象 分类 ismemberof 定义某一类概念作为现实世界中一组对象的类型 概念结构设计 数据抽象 更复杂的聚集 2 聚集 ispartof 定义某一类型的组成成分 概念结构设计 数据抽象 3 概括 issubsetof 复杂的聚集 某一类型的成分仍是一个聚集 概念结构设计 概念结构设计第一步 局部视图设计 在多层的数据流图中选择一个适当层次的数据流图 作为设计分E R图的出发点通常以中层数据流图作为设计分E R图的依据 利用以上介绍的抽象机制 对需求分析阶段收集到的数据进行分类 组织 形成实体 实体的属性 标识实体的码 确定实体之间的联系类型 设计 图 概念结构设计 概念结构设计第一步 选择局部应用 设计分E R图的出发点 概念结构设计 概念结构设计第一步 逐一设计分E R图 职称作为 个实体 在现实世界中 能作为属性对待的事物 尽量作为属性对待 属性不能与其他实体具有联系 E R图中所表示的联系是实体联系 概念结构设计 概念结构设计第一步 逐一设计分E R图 病房作为一个实体 概念结构设计 概念结构设计第一步 逐一设计分E R图 仓库作为一个实体 概念结构设计 实例 实例 销售管理子系统分E R图的设计销售管理子系统的主要功能 处理顾客和销售员送来的订单工厂是根据订货安排生产的交出货物同时开出发票收到顾客付款后 根据发票存根和信贷情况进行应收款处理 概念结构设计 实例 下图是第一层数据流图 虚线部分划出了系统边界 图7 18销售管理子系统第一层数据流图 概念结构设计 实例 上图中把系统功能又分为4个子系统 下面四个图是第二层数据流图 图7 19接收订单 概念结构设计 实例 图7 20处理订单 概念结构设计 实例 图7 21开发票 概念结构设计 实例 图7 22支付过账 概念结构设计 实例 分E R图的框架 概念结构设计 实例 参照第二层数据流图和数据字典 遵循两个准则 进行如下调整 1 订单与订单细节是1 n的联系 2 原订单和产品的联系实际上是订单细节和产品的联系 3 图7 21中 发票主清单 是一个数据存储 不必作为实体加入分E R图 4 工厂对大宗订货给予优惠 概念结构设计 实例 得到分E R图如下图所示 销售管理子系统的分E R图 概念结构设计 实例 对每个实体定义的属性如下 顾客 顾客号 顾客名 地址 电话 信贷状况 账目余额 订单 订单号 顾客号 订货项数 订货日期 交货日期 工种号 生产地点 订单细则 订单号 细则号 零件号 订货数 金额 应收账款 顾客号 订单号 发票号 应收金额 支付日期 支付金额 当前余额 货款限额 产品描述 产品号 产品名 单价 重量 折扣规则 产品号 订货量 折扣 概念结构设计 第二步 视图的集成 视图集成的两种方式 多个 图一次集成 初步 基本 合并 解决冲突 修改和合并 通常用于局部视图比较简单时 各个局部视图即分E R图建立好后 还需要对它们进行合并 集成为一个整体的数据概念结构即总E R图 概念结构设计 视图的集成 逐步集成 用累加的方式一次集成两个分E R图 概念结构设计 视图的集成 合并分 图 解决冲突 视图集成 各分E R图存在冲突各个分E R图之间必定会存在许多不一致的地方合并分E R图的关键合理消除各分E R图的冲突 概念结构设计 视图的集成 合并分 图 解决冲突 两类属性冲突属性域冲突属性值的类型取值范围取值集合不同属性取值单位冲突 两类命名冲突同名异义 不同意义的对象在不同的局部应用中具有相同的名字异名同义 一义多名 同一意义的对象在不同的局部应用中具有不同的名字 三类结构冲突同一对象在不同应用中具有不同的抽象同一实体在不同分E R图中所含属性个数和属性次序不完全相同实体之间的联系在不同局部视图中呈现不同的类型 概念结构设计 视图的集成 合并分 图 消除冗余 以数据字典和数据流图为依据 效率VS冗余信息 需要根据用户的整体需求来确定若人为地保留了一些冗余数据 则应把数据字典中数据关联的说明作为完整性约束条件Q4 Q5一旦Q5修改后就应当触发完整性检查 对Q4进行修改 函数依赖的概念提供了消除冗余联系的形式化工具 概念结构设计 验证整体概念结构 视图集成后形成一个整体的数据库概念结构 对该整体概念结构还必须进行进一步验证 确保它能够满足下列条件 内部必须具有一致性 不存在互相矛盾的表达准确反映原来每个视图结构 包括属性 实体及实体间的联系能满足需要分析阶段所确定的所有要求 自己不能打自己 概念结构设计 验证整体概念结构 整体概念结构最终还应该提交给用户 征求用户和有关人员的意见 进行评审 修改和优化 然后把它确定下来 作为数据库的概念结构 作为进一步设计数据库的依据 用户是上帝 他们说了算 否则拿不到开发费 上帝愤怒的时候要冷静沟通 巧妙地让上帝理解你 概念结构设计 概念结构设计小结 概念结构设计的步骤抽象数据并设计局部视图集成局部视图 得到全局概念结构验证整体概念结构 数据抽象分类聚集概括 设计局部视图 选择局部应用2 逐一设计分E R图标定局部应用中的实体 属性 码 实体间的联系用E R图描述出来 概念结构设计 概念结构设计小结 集成局部视图1 合并分E R图 生成初步E R图消除冲突属性冲突命名冲突结构冲突2 修改与重构消除不必要的冗余 设计生成基本E R图分析方法规范化理论 逻辑结构设计 一 图向关系模型的转化二 数据模型的优化三 设计用户子模式 实体关系模式实体的属性关系的属性实体的码关系的码 逻辑结构设计 关系的转化 在对方加入自己的关键字 如 厂长 厂长号 厂号 姓名 年龄 工厂 厂号 厂名 地点 或厂长 厂长号 姓名 年龄 工厂 厂号 厂长号 厂名 地点 本例关系没有属性 引进一个新的关系 如 厂长 厂长号 姓名 年龄 工厂 厂号 厂名 地点 管理 厂长号 厂号 逻辑结构设计 联系的转化 将 方的关键字纳入 方实体对应的关系中作为外部关键字 同时把联系的属性也一并纳入 方对应的关系中 如 仓库 仓库号 地点 面积 产品 货号 品名 价格 仓库号 数量 逻辑结构设计 联系的转化 实体内部 在该实体对应的关系中多设一个属性 用来表示与该实体相联系的上级个体的关键字 如 职工 工号 姓名 年龄 性别 工资 领导者工号 民意测验 逻辑结构设计 联系的转化 对联系单独建立一个关系 用来联系双方实体 该关系的属性中至少包括被它所联系的双方实体的关键字 如果联系有属性 也要归入该关系 如 学生 学号 姓名 年龄 课程 课程号 课程名 学时数 选修 学号 课程号 成绩 逻辑结构设计 联系的转化 实体内 如 零部件 代号 名称 价格 组装 代号 组装件代号 数量 对联系单独建立一个关系 用来联系双方实体 该关系的属性中至少包括被它所联系的双方个体的关键字 如果联系有属性 也要归入该关系 逻辑结构设计 联系的转化 两个以上实体 对联系单独建立一个关系 用来联系多个实体 该关系的属性中至少包括被它所联系的各个实体的关键字 如果联系有属性 也要归入该关系 数据模型的优化 逻辑结构设计 设计用户子模式 定义用户外模式时应该注重的问题包括三个方面 1 使用更符合用户习惯的别名 2 针对不同级别的用户定义不同的View 以满足系统对安全性的要求 3 简化用户对系统的使用 回顾前面学习的SQL和视图 逻辑结构设计 设计用户子模式 例 关系模式产品 产品号 产品名 规格 单价 生产车间 生产负责人 产品成本 产品合格率 质量等级 可以在产品关系上建立两个视图 为一般顾客建立视图 产品1 产品号 产品名 规格 单价 为产品销售部门建立视图 产品2 产品号 产品名 规格 单价 车间 生产负责人 顾客视图中只包含允许顾客查询的属性销售部门视图中只包含允许销售部门查询的属性可以防止用户非法访问不允许他们查询的数据 保证系统的安全性 数据库的物理设计 主要工作 数据库的物理设计数据库在物理设备上的存储结构与存取方法称为数据库的物理结构 它依赖于选定的数据库管理系统为一个给定的逻辑数据模型选取一个最适合应用环境的物理结构的过程 就是数据库的物理设计 确定数据库的物理结构 存取方法和存储结构 对物理结构进行评价 时间和空间效率 数据库物理设计 准备工作 设计物理数据库结构的准备工作对要运行的事务进行详细分析 获得选择物理数据库设计所需参数充分了解所用RDBMS的内部特征 特别是系统提供的存取方法和存储结构 数据库物理设计 选择物理数据库设计所需参数 数据库查询事务查询的关系查询条件所涉及的属性连接条件所涉及的属性查询的投影属性 数据更新事务被更新的关系每个关系上的更新操作条件所涉及的属性修改操作要改变的属性值每个事务在各关系上运行的频率和性能要求 数据库物理设计 DBMS常用存取方法 索引方法目前主要是B 树索引方法经典存取方法 使用最普遍聚簇 Cluster 方法HASH方法 根据应用要求确定对哪些属性列建立索引对哪些属性列建立组合索引对哪些索引要设计为唯一索引 数据库物理设计 选择索引方法的一般规则 如果一个 或一组 属性经常在查询条件中出现 则考虑在这个 或这组 属性上建立索引 或组合索引 如果一个属性经常作为最大值和最小值等聚集函数的参数 则考虑在这个属性上建立索引如果一个 或一组 属性经常在连接操作的连接条件中出现 则考虑在这个 或这组 属性上建立索引 老弟 老婆多了开销大哦 大哥 索引多了负担重啊 数据库物理设计 聚簇 为了提高某个属性 或属性组 的查询速度 把这个或这些属性 称为聚簇码 上具有相同值的元组集中存放在连续的物理块称为聚簇 聚簇的用途1 大大提高按聚簇码进行查询的效率 2 节省存储空间聚簇以后 聚簇码相同的元组集中在一起了 因而聚簇码值不必在每个元组中重复存储 只要在一组中存一次就行了 我叫王晓燕 住在王家村 你到王家村可以找到所有姓王的人 我在蓓蕾幼儿园上学 想找我玩的话 你懂的 数据库物理设计 聚簇 索引 索引 物理块 数据库物理设计 聚簇 索引 索引 物理块 关键何在 数据库物理设计 聚簇 聚簇的局限性1 聚簇只能提高某些特定应用的性能2 建立与维护聚簇的开销相当大 领了结婚证 想改变就动静大了 数据库物理设计 聚簇 聚簇的适用范围1 单个关系 多个关系组合都可以 我家住花园小区 我夫人 孩子当然也住花园小区 单个关系 我家 我住花园小区 为了亲戚来往方便 我父母 姐妹 兄弟 阿姨 叔叔 都在花园小区买了房 搬到花园小区来住了 多个关系 我家 我父母家 亲戚家 2 当通过聚簇码进行访问或连接是该关系的主要应用 与聚簇码无关的其他访问很少或者是次要的时 可以使用聚簇 尤其当SQL语句中包含有与聚簇码有关的ORDERBY GROUPBY UNION DISTINCT等子句或短语时 使用聚簇特别有利 可以省去对结果集的排序操作 对经常在一起进行连接操作的关系可以建立聚簇如果一个关系的一组属性经常出现在相等比较条件中 则该单个关系可建立聚簇如果一个关系的一个 或一组 属性上的值重复率很高 则此单个关系可建立聚簇 即对应每个聚簇码值的平均元组数不太少 太少了 聚簇的效果不明显 数据库物理设计 聚簇 优化聚簇设计从聚簇中删除经常进行全表扫描的关系 从聚簇中删除更新操作远多于连接操作的关系 不同的聚簇中可能包含相同的关系 一个关系可以在某一个聚簇中 但不能同时加入多个聚簇从这多个聚簇方案 包括不建立聚簇 中选择一个较优的 即在这个聚簇上运行各种事务的总代价最小 数据库物理设计 HASH Addr dz001 Addr dz003 Addr dz002 key dz001 key dz002 key dz003 Addr ob HASH key ob 数据库物理设计 HASH 选

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论