版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、第四章第四章: 数据管理技术数据管理技术本章主要内容本章主要内容第四章第四章 数据管理技术数据管理技术4.14.1引言引言4.24.2数据管理技术的发展数据管理技术的发展数据库环境下的数据管理数据库环境下的数据管理4.44.4数据库设计数据库设计4.4.1 4.4.1 数据库设计的步骤数据库设计的步骤4.4.2 4.4.2 实体联系模型(实体联系模型(E ER R模型)模型)4.4.34.4.3数据模型数据模型4.4.44.4.4关系数据库的规范化关系数据库的规范化4.4.54.4.5数据库操作数据库操作4.4.64.4.6常见关系型数据库系统介绍常见关系型数据库系统介绍4.54.5数据库技术
2、的发展数据库技术的发展4.5.14.5.1数据仓库数据仓库4.5.24.5.2数据集市数据集市4.5.34.5.3数据挖掘数据挖掘了解传统的文件组织和管理技术了解传统的文件组织和管理技术了解传统文件管理环境下存在的问题了解传统文件管理环境下存在的问题了解数据库管理系统中数据的组织方法了解数据库管理系统中数据的组织方法理解三种不同的数据库组织模型理解三种不同的数据库组织模型掌握掌握E-R模型和模型和E-R图的画法图的画法掌握三范式理论掌握三范式理论掌握基本的数据库操作方法掌握基本的数据库操作方法了解数据库技术的发展了解数据库技术的发展 本章学习目的本章学习目的第四章第四章 数据管理技术数据管理技
3、术 国际著名调查机构国际著名调查机构Gartner GroupGartner Group在高在高级技术调查报告中,将级技术调查报告中,将数据分析数据分析和和人工智能人工智能列为列为“未来三到五年内将对工业产生深远影未来三到五年内将对工业产生深远影响的五大关键技术响的五大关键技术”之首,还将之首,还将并行处理体并行处理体系和数据分析系和数据分析列为未来五年内投资焦点的十列为未来五年内投资焦点的十大新兴技术前两位。大新兴技术前两位。GartnerGartner的调查报告预的调查报告预计:到计:到20102010年,数据分析在相关市场的应用年,数据分析在相关市场的应用将从目前少于将从目前少于5%5%
4、增加到超过增加到超过80%80%。在国外,。在国外,数据分析已在金融、证券、电信、制造、统数据分析已在金融、证券、电信、制造、统计、零售业等数据密集型行业实施,并取得计、零售业等数据密集型行业实施,并取得巨大的效益。巨大的效益。数据存储技术数据存储技术 数据检索技术数据检索技术 数据挖掘技术数据挖掘技术 数据仓库技术数据仓库技术 内容管理产生于内容管理产生于2020世纪世纪8080年代中后期,其年代中后期,其需求主要来自于非结构需求主要来自于非结构化数据管理的需要化数据管理的需要 。目。目前,前,在大多数情况下,在大多数情况下,内容管理特指用于非结内容管理特指用于非结构化数据管理的技术。构化数
5、据管理的技术。 内容管理是借助信内容管理是借助信息技术,通过收集、创息技术,通过收集、创建、管理和发布内容,建、管理和发布内容,实现内容在企业内部以实现内容在企业内部以及企业之间的传播和共及企业之间的传播和共享的过程。享的过程。数据组织层次数据组织层次描描 述述字段:字段:属性的特定值。属性的特定值。记录:记录:记录由字段组成,其中字段记录由字段组成,其中字段代表了实体对象的各种属性。一条代表了实体对象的各种属性。一条记录由一个或者多个字段组成。记录由一个或者多个字段组成。文件:文件:多个相关记录的集合形成多个相关记录的集合形成数据库:数据库:由多个在系统执行过程中由多个在系统执行过程中相互关
6、联的文件组成。相互关联的文件组成。1.1.位位2.2.字符字符3.3.数据元(字段)数据元(字段)4.4.记录记录5.5.文件文件6.6.数据库数据库文件记录字段字符 计算机系统是按层次组织数据的,首先由计算机系统是按层次组织数据的,首先由位位组成组成字节字节,字节组成字节组成字段(数据元)字段(数据元),向上依次组成,向上依次组成记录记录、文件文件和和数据数据库库。位(。位(Bit)Bit)是计算机中最小的数据单位,其值为是计算机中最小的数据单位,其值为0 0或或1 1。计。计算机只能检测到电脉冲信号的有无。电脉冲信号出现高电平算机只能检测到电脉冲信号的有无。电脉冲信号出现高电平表示表示11
7、, 电脉冲信号为低电平表示电脉冲信号为低电平表示00。一个位表示。一个位表示二进制数据二进制数据00或或11,多个位组成字节(,多个位组成字节(ByteByte), ,一个字一个字节代表一个字符,字符可以是字母、数字或其他符号;多个节代表一个字符,字符可以是字母、数字或其他符号;多个字符组成一个词或一个完整的数字,称为字段、数据项或域字符组成一个词或一个完整的数字,称为字段、数据项或域(FieldField); ;若干个相关的字段组成一个记录(若干个相关的字段组成一个记录(RecordRecord););若若干同类型的记录组成一个文件干同类型的记录组成一个文件( (File);File);若干
8、相关文件的集合组若干相关文件的集合组成一个数据库(成一个数据库(DatabaseDatabase)。)。如下图所示,比特、字符、字如下图所示,比特、字符、字段、记录、文件和数据库构成了数据层次,数据库中不仅包段、记录、文件和数据库构成了数据层次,数据库中不仅包括了所有这些数据层次,还包括了它们之间的关系。括了所有这些数据层次,还包括了它们之间的关系。数据元数据元 描述数据元的最好办法是举例说明。一个人的社会保险号描述数据元的最好办法是举例说明。一个人的社会保险号、姓名、信用卡号、街道地址和婚姻状况等都是数据元。在数、姓名、信用卡号、街道地址和婚姻状况等都是数据元。在数据的层次体系中,数据元是最
9、低一层的逻辑单位,为了形成一据的层次体系中,数据元是最低一层的逻辑单位,为了形成一个逻辑单位,需要将若干位和若干字节组合在一起。一个日期个逻辑单位,需要将若干位和若干字节组合在一起。一个日期不一定是一个数据元,它可以是三个数据元:年、月、日。对不一定是一个数据元,它可以是三个数据元:年、月、日。对地址来说,也是同样的。一个地址中可以包括省、城市、街道地址来说,也是同样的。一个地址中可以包括省、城市、街道和门牌号等数据元。从逻辑上可以把日期和地址都看成是一个和门牌号等数据元。从逻辑上可以把日期和地址都看成是一个数据元。根据上下文的需要,有时也把数据元称作为字段数据元。根据上下文的需要,有时也把数
10、据元称作为字段( (记录记录中的字段中的字段) )。数据元是泛指的。数据元是泛指的。为了节省输入数据时敲打键盘的时间和存储空间,在输入数据为了节省输入数据时敲打键盘的时间和存储空间,在输入数据时通常将数据元编码。例如,通常将职工主文件中的时通常将数据元编码。例如,通常将职工主文件中的“性别性别”数据元编码,这样,数据录入员就可以简单的输入数据元编码,这样,数据录入员就可以简单的输入“M”M”或或“F”F”来代替来代替“Male”(Male”(男男) )或或“Female”(Female”(女女) )。在输出时再将。在输出时再将“M”M”和和“F”F”分别翻译成分别翻译成“男男”或或“女女”。指
11、必须保存信息的人、地点、事物或事件,如员工、客户、订单等。实体是个体的集合,实体中的个体称为实例。指对特定实体特征或性质的描述,如订单的订单号、日期、数量,员工的姓名、年龄、性别等。记录中用于标识该记录的一个或多个字段。主键是唯一标识该记录的一个或多个字段。不能唯一标识记录的字段叫次键。数据访问应用模型数据访问应用模型 数据访问的发展史数据访问的发展史一层一层( (单机单机) )客户端逻辑客户端逻辑业务逻辑业务逻辑数据存储数据存储三层三层“瘦客户端瘦客户端”n 层层两层两层“胖客户端胖客户端”InternetInternetXML Web XML Web ServiceService发展阶段发
12、展阶段描描 述述数据和程序相互依赖:数据保存在处理程序中或随程序进行人机交互地输入,数据处理后将结果输出。数据存放在永久性的系统文件中,供与之相对应的应用程序调用,应用程序和数据文件相互独立,数据文件可以长期保存。. 奖金文件奖金文件 工资文件工资文件 . 产品文件产品文件 销售文件销售文件 . 物料文件物料文件 计划文件计划文件 数据数据文件文件 工资程序销售程序计划程序应用应用程序程序 用户用户 数数据据报报表表发展阶段发展阶段缺缺 点点程序不具有独立性,灵活性差。应用程序之间无法共享数据。 数据不能永久保存数据冗余和不一致并发访问异常缺乏灵活性安全性差数据库数据库 数据库(DB-Data
13、base)是以一定的组织方式存储在一起的互相关联的数据的集合(逻辑相关的记录和文件的集合)。数据库管理系统数据库管理系统 数据库管理系统(DBMS-Database Management System)是对数据库进行管理的特定软件。通常所说的数据库管理系统是指DBMS,而不是指具体的数据库Database。一、数据库、数据库管理系统和数据库系统一、数据库、数据库管理系统和数据库系统口语中常说的“数据库系统”在大多数时候都是指DBMS。但是严格来说,数据库系统(DBS-Database System是指在计算机系统中引入数据库之后的系统,一般由数据库、数据库管理系统(及其开发工具)、应用系统、数
14、据库管理员(DBA-Database Administrator)和用户构成。即:DBS= DB + DBMS + APPLICATION + DBA + USER 数据库管理系统的目的数据库管理系统的目的: :就是为了解决前面提到的在文件处理系统中存在的一些问题: 数据冗余和不一致 数据访问困难 数据孤立 灵活性差 并发访问异常 安全性问题 由于这些问题,数据库管理系统提出了很多新的概念和算法,加速了DBMS的发展。二、数据库管理系统二、数据库管理系统(DBMS) 数据库管理系统的功能就是数据库管理系统的功能就是: :创建和修改数据库。创建和修改数据库。存储和检索数据。存储和检索数据。操纵数
15、据和生成报表。操纵数据和生成报表。保证所存储数据的安全性。保证所存储数据的安全性。数据被多用户共享时,要数据被多用户共享时,要 避免可能产生的异常结果避免可能产生的异常结果( (并发控制并发控制) )。Windows 2000UnixDBMS (OraccleDB2SQL ServerSybase )财务管理程序财务管理程序Windows 2000Unix销售部销售部财务部财务部计划部计划部计划数据计划数据工资数据工资数据销售数据销售数据销售管理程序销售管理程序计划管理程序计划管理程序数据共享减少数据冗余提高了数据的一致性数据与应用程序之间的独立性提高了数据的安全性三、数据库管理的优点三、数据
16、库管理的优点 数据库设计是建立数据库及其应用系统的技术,是信息系统开发和建设中的核心技术。具体说,数据库设计是指对于一个给定的应用环境,构造最优的数据库模式,建立数据库及其应用系统,使之能够有效地存储数据,满足各种用户的应用需求(信息要求和处理要求)。 数据库合理的结构和组织是信息系统分析、设计时需要考虑的一个重要方面。一、什么是数据库设计一、什么是数据库设计转换转换12信息世界信息世界( (观念世界观念世界) )概念模型概念模型3数据世界数据世界( (机器世界机器世界) )数据模型数据模型 字段记录文件实体集实体属性现现实实世世界界事物类事物性质认认识识抽抽象象二、人们对客观事物的认识和描述
17、过程二、人们对客观事物的认识和描述过程现实世界的自行车现实世界的自行车 观念世界的自行车观念世界的自行车 信息模型(概念模型)信息模型(概念模型)数据世界的自行车数据世界的自行车 中国铁路网络图中国铁路网络图信息模型(概念模型)信息模型(概念模型)需求分析分析用户的需求:数据、功能和性能概念结构设计根据用户需求设计概念数据模型,主要使用E-R模型,画E-R图逻辑结构设计将概念模型转换成DBMS支持的数据模型,主要是将E-R模型转换成关系模型数据库物理结构设计选择合适的存储结构和存取路径数据库的实施包括编程、测试和试运行数据库运行与维护系统运行与数据库的日常维护按规范的设计方法,一个完整的数据库
18、设计一般分为以下六个阶段:三、数据库设计的步骤三、数据库设计的步骤需求收集和分析需求收集和分析设计概念结构设计概念结构设计逻辑结构设计逻辑结构数据模型优化数据模型优化评价设计,性能预测评价设计,性能预测物理实现物理实现试验性运行试验性运行使用、维护数据库使用、维护数据库四、数据库设计的流程四、数据库设计的流程v需求信息收集需求信息收集初步调查初步调查详细调查(目的、内容、方法)详细调查(目的、内容、方法)v需求信息的分析整理需求信息的分析整理业务流程业务流程数据流程、数据字典数据流程、数据字典五、数据库设计各阶段的任务:需求分析五、数据库设计各阶段的任务:需求分析v目标目标 是把现实世界中的客
19、观对象抽象为某种信息结构是把现实世界中的客观对象抽象为某种信息结构,设计出反映某个组织部门信息需求的数据库系统概,设计出反映某个组织部门信息需求的数据库系统概念模式,它独立于数据库系统的逻辑结构、独立于数念模式,它独立于数据库系统的逻辑结构、独立于数据库管理系统(据库管理系统(DBMSDBMS)、)、独立于计算机系统。独立于计算机系统。v设计方法设计方法 是在需求分析的基础上,用概念数据模型(例如是在需求分析的基础上,用概念数据模型(例如E-RE-R模型)表示数据及数据之间的相互联系,设计出反模型)表示数据及数据之间的相互联系,设计出反映用户信息需求和处理需求的数据库系统概念模式。映用户信息需
20、求和处理需求的数据库系统概念模式。五、数据库设计各阶段的任务:概念结构设计五、数据库设计各阶段的任务:概念结构设计EntityRelationshipE-RE-R模型模型是这样认识现实世界的:现实世界是由一组是这样认识现实世界的:现实世界是由一组称作实体的基本对象以及这些对象间的联系构成的。称作实体的基本对象以及这些对象间的联系构成的。实体(实体(EntityEntity):):“实体实体”是观念世界中描述客观事物是观念世界中描述客观事物的概念。实体可以是人,也可以是物或事件;可以指的概念。实体可以是人,也可以是物或事件;可以指事物本身,也可指事物之间的联系,例如一个人、一事物本身,也可指事物
21、之间的联系,例如一个人、一件物品、一个部门、一个银行帐户等都是一个实体。件物品、一个部门、一个银行帐户等都是一个实体。实体可以通过属性集合来描述。实体可以通过属性集合来描述。“属性属性”是指实体具有的某种特性。如人有身是指实体具有的某种特性。如人有身高、体重、年龄、性别等属性。高、体重、年龄、性别等属性。联系:联系:“联系联系”是事物间的相互关联。在信息世界中是事物间的相互关联。在信息世界中,事物之间的联系可分为两类:一是实体内部的联系,事物之间的联系可分为两类:一是实体内部的联系,一是实体之间的联系,一是实体之间的联系. .(2)实体之间的联系)实体之间的联系 一对一联系(一对一联系(1:1
22、)对于实体集对于实体集A A中的每一实体,实体集中的每一实体,实体集B B中至多有一中至多有一个实体与之联系。反之亦然。个实体与之联系。反之亦然。 一对多联系(一对多联系(1:N)对于实体集对于实体集A A中的每一实体,实体集中的每一实体,实体集B B中有中有N N个实体个实体与之联系。反之,对于实体集与之联系。反之,对于实体集B B中每一实体,实体中每一实体,实体集集A A中至多只有一个实体与之联系。中至多只有一个实体与之联系。 多对多联系(多对多联系(M:N)对于实体集对于实体集A A中的每一实体,实体集中的每一实体,实体集B B中有中有N N个实体个实体与之联系,对于实体集与之联系,对于
23、实体集B B中每一个实体,实体集中每一个实体,实体集A A中有中有M M个实体与之联系。个实体与之联系。(3)(3)实体联系方法实体联系方法(EntityRelation Approach) 概念模型最常用的表示方法是概念模型最常用的表示方法是实体联系方法实体联系方法( (EntityEntityRelationRelation Approach Approach,简称简称E ER R方法方法) )。E ER R方法通过方法通过E ER R图图来描述某一组织的信息模型。来描述某一组织的信息模型。E-RE-R图图由以下元素构成:由以下元素构成:矩形:矩形:代表代表实体集实体集(具有相同属性或特征
24、的实体集合);(具有相同属性或特征的实体集合); 椭圆:椭圆:代表实体属性;代表实体属性;菱形:菱形:代表实体间的代表实体间的联系集联系集(同一类型的所有联系的集合);(同一类型的所有联系的集合);线段:线段:将属性与实体集相连或将实体集与联系集相连。将属性与实体集相连或将实体集与联系集相连。E-RE-R图示例图示例客户客户帐户帐户存款存款/取取款款身份证号身份证号客户名客户名客户街道客户街道客户城市客户城市帐户号帐户号余额余额电电话话联系名联系名联系名实体A实体B实体A实体B实体A实体B11m1nn(4)实体之间联系类型的)实体之间联系类型的E-R表示表示管理管理厂长厂长工厂工厂帐号帐号厂名
25、厂名地点地点11代号代号姓名姓名性别性别年龄年龄职称职称存放存放仓库仓库商品商品1n代号代号地点地点面积面积名称名称规格规格产地产地代码代码价格价格数量数量时间时间如对于学生、课程和教师这三个实体,若规定每个如对于学生、课程和教师这三个实体,若规定每个学生可以选择多门课程,每门课程可以被多个学生选学生可以选择多门课程,每门课程可以被多个学生选修,每门课程惟一对应一个任课教师,一个教师可以修,每门课程惟一对应一个任课教师,一个教师可以讲授多门课程。则学生、课程和教师这三个实体之间讲授多门课程。则学生、课程和教师这三个实体之间的的E-RE-R图可表示为:图可表示为:学生教师课程学习讲授学号成绩课程
26、号教材教师号mnp1(5)三个或更多实体相互联系的情况)三个或更多实体相互联系的情况(6 6)设计)设计E-RE-R图的过程图的过程E-RE-R图设计过程实际是对数据进行归纳、分析、抽图设计过程实际是对数据进行归纳、分析、抽象的过程,首先把企业的有关数据综合组织象的过程,首先把企业的有关数据综合组织, , 然后根然后根据不同用户对数据的使用需求进行分组,再从局部入据不同用户对数据的使用需求进行分组,再从局部入手,建立局部手,建立局部E-RE-R模型,再综合成总体模型,再综合成总体E-RE-R模型。模型。确定实体集确定实体集确定联系和联系类型(确定联系和联系类型(1 1:1 1或或1 1:n n
27、)设计局部及整体的设计局部及整体的E-RE-R图图确定属性确定属性将将E-RE-R图优化图优化在数据分析的基础上,就可以着手设计概念结构。在数据分析的基础上,就可以着手设计概念结构。设计初步设计初步E-RE-R图的步骤图的步骤先设计局部先设计局部E-RE-R图,也称用户视图图,也称用户视图 综合各局部综合各局部E-RE-R图,形成总的图,形成总的E-RE-R图,即用户视图图,即用户视图的集成。也称的集成。也称基本基本E-RE-R图图( (全局全局E-RE-R图图) ) 在设计初步在设计初步E-RE-R图时,要尽量能充分地把组织中图时,要尽量能充分地把组织中各部门对信息的要求集中起来,而不需要考
28、虑数据的各部门对信息的要求集中起来,而不需要考虑数据的冗余问题。冗余问题。 局部概念模型设计是从用户的观点出发,设计符局部概念模型设计是从用户的观点出发,设计符合用户需求的概念结构。局部概念模型设计的就是组合用户需求的概念结构。局部概念模型设计的就是组织、分类收集到的数据项,确定哪些数据项作为织、分类收集到的数据项,确定哪些数据项作为实体实体,哪些数据项作为哪些数据项作为属性属性,哪些数据项是同一实体的属性哪些数据项是同一实体的属性等。等。确定实体与属性的原则:确定实体与属性的原则: 能作为属性的尽量作为属性而不要划为实体;能作为属性的尽量作为属性而不要划为实体; 作为属性的数据项不能再用其他
29、属性加以描述,作为属性的数据项不能再用其他属性加以描述, 也不能与其他实体或属性发生联系。也不能与其他实体或属性发生联系。 设计局部设计局部E-RE-R图图仓库仓库存放存放物资物资1n代号代号地点地点面积面积名称名称规格规格产地产地编号编号单价单价数量数量时间时间存放仓库存放仓库物资物资名称名称规格规格产地产地编号编号单价单价数量数量a. a. 仓库作为属性仓库作为属性b. b. 仓库作为实体仓库作为实体学 生选 课课程学 生选 课课程出生日期学号姓名性别系别出生日期何时入学奖学金成绩课程号选/必教师课程名学分学号姓名性别系别入学时间硕/博成绩课程号学分教师课程名学位课 教务处学生管理的教务处
30、学生管理的E-RE-R模型图模型图 研究生院学生管理的局部研究生院学生管理的局部E-RE-R模型图模型图 设计全局设计全局E-RE-R图图 局部局部E-RE-R图的设计从局部的需求出发,比一开始图的设计从局部的需求出发,比一开始就设计全局就设计全局E-RE-R图要简单得多、单纯得多。有了各个图要简单得多、单纯得多。有了各个局部局部E-RE-R图,就可通过局部图,就可通过局部E-RE-R图的集成设计全局图的集成设计全局E-RE-R图。在进行局部图。在进行局部E-RE-R图集成时,需按照下面三个步骤图集成时,需按照下面三个步骤来进行来进行: : 确认局部确认局部E-RE-R模型图中的对应关系和冲突
31、模型图中的对应关系和冲突 对应关系是指局部对应关系是指局部E-RE-R图中语义都相同的概念,图中语义都相同的概念,也就是它们的共同部分;冲突指相互之间有矛盾的概也就是它们的共同部分;冲突指相互之间有矛盾的概念。常见的冲突有下列念。常见的冲突有下列4 4种:种: 命名冲突命名冲突 命名冲突有同名异义和同义异名两种。例如,命名冲突有同名异义和同义异名两种。例如,在例在例1 1给出的图中,给出的图中,“学生学生”和和“课程课程”这两个实体这两个实体集在教务处的局部集在教务处的局部E-RE-R图和研究生院的局部图和研究生院的局部E-RE-R图中图中含义是不同的:在教务处的局部含义是不同的:在教务处的局
32、部E-RE-R图中学生是指大图中学生是指大学生、大学生的课程,在研究生院的局部学生、大学生的课程,在研究生院的局部E-RE-R图中是图中是指研究生和研究生课程,这属于同名异义;在教务指研究生和研究生课程,这属于同名异义;在教务处的局部处的局部E-RE-R图中学生实体集有图中学生实体集有“何时入学何时入学”这一个这一个属性,在研究生院的局部属性,在研究生院的局部E-RE-R图中有图中有“入学日期入学日期”这这一属性,两者是同义异名。一属性,两者是同义异名。 概念冲突概念冲突 同一个概念在一个局部同一个概念在一个局部E-RE-R图中可能作为实体图中可能作为实体集,在另一局部集,在另一局部E-RE-
33、R图中可能作为属性或联系。例图中可能作为属性或联系。例如,在上面给出的图中,如果用户要求,选课也可如,在上面给出的图中,如果用户要求,选课也可以作为实体集,而不作为联系。以作为实体集,而不作为联系。域冲突域冲突 相同的属性在不同的局部相同的属性在不同的局部E-RE-R图中有不同的域图中有不同的域,例如,学号在一个局部,例如,学号在一个局部E-RE-R图中可能当作字符串图中可能当作字符串,在另一个局部,在另一个局部E-RE-R图中可能当作整数。相同的属图中可能当作整数。相同的属性采用不同的度量单位,称为域冲突。性采用不同的度量单位,称为域冲突。 约束冲突约束冲突 不同局部不同局部E-RE-R图可
34、能有不同的约束;例如,对于图可能有不同的约束;例如,对于“选课选课”这个联系,大学生和研究生对选课的最少这个联系,大学生和研究生对选课的最少门数和最多门数的限定可能不一样。门数和最多门数的限定可能不一样。 对局部对局部E-RE-R图进行某些修改,解决部门冲突图进行某些修改,解决部门冲突 解决部门的冲突是对各个部门中存在的命名冲解决部门的冲突是对各个部门中存在的命名冲突、概念冲突、域冲突、约束冲突按照统一的规范突、概念冲突、域冲突、约束冲突按照统一的规范定义。如在例定义。如在例1 1的图中,的图中,“入学日期入学日期”和和“何时人何时人学学”两个属性名可以统一成两个属性名可以统一成“入学日期入学
35、日期”,学号统,学号统一用字符串表示,学生分为大学生和研究生两类,一用字符串表示,学生分为大学生和研究生两类,课程也分为本科生课程和研究生课程两类等。课程也分为本科生课程和研究生课程两类等。合并局部合并局部E-RE-R图,形成全局模式图,形成全局模式 学 生选 课课程学号姓名性别系别出生日期入学时间学生类别成绩课程号学分教师课程名课程类别产品零件组成产品号产品名性能参数零件数零件号材料名耗用量产产品品使用材材料料存放仓仓库库产品号产品名价格用量材料号材料名价格存放量仓库名仓库号地点技术部门技术部门E-RE-R图图供应部门供应部门E-RE-R图图消耗产品产品零件零件材料材料仓库仓库消耗产品号产品
36、名性能参数零件号材料名价格耗用量2存放量材料号材料名价格仓库号仓库名地点耗用量1数量合并后的合并后的E-RE-R模型图模型图 存放组成综合后的综合后的E-RE-R模型图模型图 组成消耗产品产品零件零件材料材料仓库仓库产品号产品名性能参数零件数零件号材料名价格耗用量2存放量材料号材料名价格仓库号仓库名地点存量1n1n1nn11n1n1n1nn1n1物料需物料需求计划求计划报价报价采购订单采购订单供应商供应商请购单请购单采购订单采购订单明细明细物料代码物料代码检验单检验单入库单入库单供应商评供应商评估表估表收货单收货单生成生成送货送货合并合并参照参照2入库入库参照参照1收货收货检验检验评估评估组成
37、组成采购系统采购系统E-R图图 设计某工厂物资管理的概念模型(画出设计某工厂物资管理的概念模型(画出E-RE-R图)。图)。物资管理涉及的实体有:物资管理涉及的实体有: 仓库(仓库号,仓库面积,仓库地点)仓库(仓库号,仓库面积,仓库地点) 材料(材料编号,名称,规格,单价)材料(材料编号,名称,规格,单价)供应商(供应商编号,联系人,地址,电话,帐号)供应商(供应商编号,联系人,地址,电话,帐号)采购员(编号,姓名,电话采购员(编号,姓名,电话, ,邮箱)邮箱)实体间的联系:实体间的联系: 一个仓库可以一个仓库可以存放存放多种材料,一种材料可以存放在多个仓库中。多种材料,一种材料可以存放在多个
38、仓库中。 一种材料只能一个采购员一种材料只能一个采购员采购采购,一个采购员可以采购多种材料。,一个采购员可以采购多种材料。 一个供应商只能一个供应商只能供应供应一种材料,一种材料可由多个供应商供应。一种材料,一种材料可由多个供应商供应。作业题作业题作业题作业题作业题作业题实体及其属性图实体及其属性图仓库面积地点仓库号采购员电话姓名邮箱编号供应商地址联系人电话号供应商号帐号材料规格名称单价材料编号供应商材料采购员供应供应量采购量采购11nm存放仓库pm实体联系图实体联系图 数据模型是描述计算机世界中数据及数据数据模型是描述计算机世界中数据及数据之间的关系及存储、处理特征的模型,它依赖之间的关系及
39、存储、处理特征的模型,它依赖于具体的计算机。在数据库系统,对现实世界于具体的计算机。在数据库系统,对现实世界中数据的抽象、描述以及处理等都是通过数据中数据的抽象、描述以及处理等都是通过数据模型来实现的,数据模型是数据库系统实现的模型来实现的,数据模型是数据库系统实现的基础。目前,在实际数据库系统中支持的数据基础。目前,在实际数据库系统中支持的数据模型主要有三种:模型主要有三种:、和和五、数据库设计各阶段的任务五、数据库设计各阶段的任务关系模型是用表的集合来表示数据和数据间的联系。每关系模型是用表的集合来表示数据和数据间的联系。每个表有多个列,每列有唯一的列名。在关系模型下,数个表有多个列,每列
40、有唯一的列名。在关系模型下,数据的逻辑结构是一张二维表。据的逻辑结构是一张二维表。关系模型中的有关术语:关系模型中的有关术语:关系:一个关系对应一张二维表关系:一个关系对应一张二维表元组:表中一行称为一个元组;元组:表中一行称为一个元组;属性:表中一列称为一个属性,列名即为属性名;属性:表中一列称为一个属性,列名即为属性名;主码:表中的某个属性组,它的值惟一地标识一个元组。主码:表中的某个属性组,它的值惟一地标识一个元组。域:属性的取值范围;域:属性的取值范围;分量:元组中的一个属性值。分量:元组中的一个属性值。关系模式:对关系的描述,用关系名(属性关系模式:对关系的描述,用关系名(属性1 1
41、,属性,属性2 2,属属性性n)n)来表示。来表示。Primary KeyEmployeeIDNameagesex1001张兴张兴22男1002李静李静26女1003王进王进28男1004黄三黄三28男EmployeeID学号学号姓名姓名课程代码课程代码课程名称课程名称成绩成绩1001张三张三005电子商务电子商务901001张三张三006企业管理企业管理951002李四李四005电子商务电子商务951002李四李四006企业管理企业管理90Primary KeyProduct_quantity元组元组B0001D000195 B0002D000215B0003D00035B0004D0004
42、10B0005D000535B0006D000610B0007D000725B0008D000845B0009D000915B00010D0001030Product_quantity ()Primary Key 用树型结构表示实体集之间的联系(描述用树型结构表示实体集之间的联系(描述数据)。数据)。IBMIBM的的IMS(Information IMS(Information Management System)Management System)就是采用层次数据模型就是采用层次数据模型的数据库管理系统。层次数据模型的主要特的数据库管理系统。层次数据模型的主要特征是一棵有向树征是一棵有向树,
43、 ,树的节点是记录类型树的节点是记录类型, ,最上最上层的节点叫根节点,根节点只有一个,上下层的节点叫根节点,根节点只有一个,上下层的节点之间的关系为父层的节点之间的关系为父-子关系,一个父子关系,一个父节点可以有多个子节点,而一个子节点有且节点可以有多个子节点,而一个子节点有且只有一个父结点。只有一个父结点。 父节点 一级子节点二级子节点二级子节点二级子节点二级子节点一级子节点一级子节点一级子节点一级子节点处处室室1 1处处室室2 2处处室室1 1处处室室 2 2处处室室1 1 处处室室2 2处处室室1 1 处处室室2 2处处室室1 1 处处室室2 2集团公司集团公司 网状模型是层次数据模型
44、的变形。事实网状模型是层次数据模型的变形。事实上,为了使处理速度更快、处理更方便,可上,为了使处理速度更快、处理更方便,可根据需要将层次数据库转换成网状数据库,根据需要将层次数据库转换成网状数据库,或将网状数据库转换成层次数据库。层次数或将网状数据库转换成层次数据库。层次数据模型主要用来描述一对多的数据逻辑关系据模型主要用来描述一对多的数据逻辑关系,而网状模型能够更好地描述多对多的数据,而网状模型能够更好地描述多对多的数据逻辑关系,也就是说父节点可以有多个子节逻辑关系,也就是说父节点可以有多个子节点,子节点也可以有多个父节点。点,子节点也可以有多个父节点。课程课程1 1课程课程2 2课程课程3
45、 3 三类数据模型在企业中都有应用,它们三类数据模型在企业中都有应用,它们各有自己的优缺点。层次模型的主要优点在各有自己的优缺点。层次模型的主要优点在于其处理效率。因为层次模型中的数据关系于其处理效率。因为层次模型中的数据关系比较简单,因此层次数据库系统较其他数据比较简单,因此层次数据库系统较其他数据模型花费更少的处理时间。当数据自然形成模型花费更少的处理时间。当数据自然形成层次时,就很适合采用层次模型。但层次模层次时,就很适合采用层次模型。但层次模型在数据组织上缺乏灵活性,修改困难,且型在数据组织上缺乏灵活性,修改困难,且不易安装。一些组织中由于已采用的层次数不易安装。一些组织中由于已采用的
46、层次数据库系统的高效率或巨额投资而在继续使用据库系统的高效率或巨额投资而在继续使用层次模型。层次模型。 网状模型网状模型在数据组织上较层次模在数据组织上较层次模型有更大的灵活性,但由于数据关系的型有更大的灵活性,但由于数据关系的复杂性,网状模型更难开发和使用。这复杂性,网状模型更难开发和使用。这种模型的数据库管理系统在企业中应用种模型的数据库管理系统在企业中应用已不多。已不多。 关系数据模型关系数据模型是应用最广泛的数据是应用最广泛的数据模型。数据组织直观,查询方便,能够模型。数据组织直观,查询方便,能够在数据之间建立各种关系满足一些特殊在数据之间建立各种关系满足一些特殊的查询,并且设计、维护
47、简单。的查询,并且设计、维护简单。学生(学号,姓名,性别,班级)学生(学号,姓名,性别,班级)课程(课号,课名,学分)课程(课号,课名,学分)选课(学号,课号,成绩)选课(学号,课号,成绩)选课选课学生学生课程课程M MN N成绩成绩一个实体型转换为一个关系模型,实体的一个实体型转换为一个关系模型,实体的属性就是关系的属性,实体的键就是关系属性就是关系的属性,实体的键就是关系的键;的键;一个联系转换为一个关系模式,与该联系一个联系转换为一个关系模式,与该联系相连的每个实体型的键以及联系的属性都相连的每个实体型的键以及联系的属性都转换为关系的属性。这个关系的键分为以转换为关系的属性。这个关系的键
48、分为以下三种不同的情况:下三种不同的情况:转换原则转换原则若联系为若联系为1 1:1 1,则相连的每个实体型的键均,则相连的每个实体型的键均 是该关系模式的侯选键。是该关系模式的侯选键。若联系为若联系为1 1:n n,则联系对应的关系模式的键,则联系对应的关系模式的键 取取n n端实体型的键。端实体型的键。若联系为若联系为m m:n n,则联系对应的关系模式的键,则联系对应的关系模式的键 为参加联系的诸实体型的键的组合。为参加联系的诸实体型的键的组合。 零件零件消耗消耗材料材料11零件编号零件编号名称名称规格规格名称名称规格规格材料编号材料编号单价单价重量重量零件零件( (零件编号,名称,规格
49、零件编号,名称,规格) )消耗消耗( (零件编号零件编号,材料编号材料编号, ,重量重量) )材料材料( (材料编号材料编号, ,名称,规格名称,规格, ,单价单价) )概念模型概念模型关系模型关系模型转换转换1 : 1 产品(产品编号,名称,型号)产品(产品编号,名称,型号)零件(零件编号,名称,规格)零件(零件编号,名称,规格)组成(组成(零件编号零件编号,产品编号,产品编号, ,数量)数量)零件零件组成组成产品产品1n零件编号零件编号名称名称规格规格名称名称型号型号产品编号产品编号数量数量概念模型概念模型关系模型关系模型转换转换1 : n学习学习( (学号学号, ,课程编号课程编号, ,
50、成绩成绩, ,时间时间) )学生学生( (学号,姓名,班级学号,姓名,班级) )课程课程( (课程编号,名称,学分课程编号,名称,学分) )学生学生学习学习课程课程nm学号学号姓名姓名班级班级名称名称学分学分课程编号课程编号成绩成绩时间时间概念模型概念模型关系模型关系模型转换转换n : m数据库物理设计的内容主要包括:数据库物理设计的内容主要包括: 确定数据的存储结构,选择确定数据的存储结构,选择DBMSDBMS 为数据选择和调整存取路径,即索引的设计为数据选择和调整存取路径,即索引的设计 调整和优化数据库的性能,如调整调整和优化数据库的性能,如调整DBMSDBMS的某的某 些系统参数。些系统
51、参数。五、数据库设计各阶段的任务五、数据库设计各阶段的任务商业数据库管理系统商业数据库管理系统我们常用的大型商业数据库管理系统有:我们常用的大型商业数据库管理系统有:OracleOracle:目前的版本是目前的版本是Oracle 10iOracle 10i;在全球在全球和中国的销量都是第一;我国的主要用户是和中国的销量都是第一;我国的主要用户是公安系统、金融系统和大的企业;系统非常公安系统、金融系统和大的企业;系统非常复杂,可以按照用户的要求进行组装。支持复杂,可以按照用户的要求进行组装。支持WebWeb功能,支持在数据库中存储大对象的数功能,支持在数据库中存储大对象的数据,如图象和图形、视频
52、和音频数据等等。据,如图象和图形、视频和音频数据等等。我们常用的大型商业数据库管理系统有:我们常用的大型商业数据库管理系统有:SybaseSybase:主打产品有两种:主打产品有两种: Sybase Adaptive Server Enterprise Sybase Adaptive Server Enterprise Sybase Adaptive Server Anywhere Sybase Adaptive Server Anywhere 在中国的销量是第二,其主要用户有铁道部在中国的销量是第二,其主要用户有铁道部、金融系统和大型企业;成功的案例有、金融系统和大型企业;成功的案例有“98
53、“98世界杯网站系统世界杯网站系统”,“全国铁路售票系统全国铁路售票系统”(”(与民航售票系统完全不同与民航售票系统完全不同) )。这些系统主。这些系统主要采用要采用SybaseSybase公司的数据复制技术和主键冲公司的数据复制技术和主键冲突解决方案。突解决方案。我们常用的大型商业数据库管理系统有:我们常用的大型商业数据库管理系统有:MicrosofMicrosof SQL Server: SQL Server:它最早是从它最早是从SybaseSybase公公司买的核心技术,目前的版本是司买的核心技术,目前的版本是20052005;在全;在全球的销量处于第三位,处于第四位的是球的销量处于第三
54、位,处于第四位的是IBMIBM的的DB2DB2,它主要用于它主要用于IBMIBM大型机大型机, ,用于并行存用于并行存储与计算;储与计算;MicrosoftMicrosoft公司的公司的SQL ServerSQL Server在在我国的主要用户是中小型企业和教育机构。我国的主要用户是中小型企业和教育机构。 在关系数据库中,所有的数据文件都以在关系数据库中,所有的数据文件都以二维表的形式存在,这些二维表之间通常会二维表的形式存在,这些二维表之间通常会产生数据冗余,这样容易造成数据的不一致产生数据冗余,这样容易造成数据的不一致或不完整,从而使数据的检索、插入、删除或不完整,从而使数据的检索、插入、
55、删除和更新和等操作可能会出现错误。解决这种和更新和等操作可能会出现错误。解决这种问题的一个办法就是将这些关系进一步的分问题的一个办法就是将这些关系进一步的分解。这种分解的过程就叫做规范化。解。这种分解的过程就叫做规范化。 关系的规范化关系的规范化五、数据库设计各阶段的任务五、数据库设计各阶段的任务 规范化是规范化是可逆可逆的转换处理过程。在此过程中,数的转换处理过程。在此过程中,数据之间非规范化的关系逐步转换成规范化的关系。据之间非规范化的关系逐步转换成规范化的关系。由于这样一个过程是可逆的,由于这样一个过程是可逆的,因此转换的过程中并因此转换的过程中并没有丢失信息没有丢失信息。规范化可以使任
56、何一个关系数据库。规范化可以使任何一个关系数据库的操作都变得十分简单方便。规范化的主要目标就的操作都变得十分简单方便。规范化的主要目标就是能够让用户使用简单的操作检索出有用的信息,是能够让用户使用简单的操作检索出有用的信息,并且使数据的不规则、不连贯的程度达到最小。并且使数据的不规则、不连贯的程度达到最小。 规范化的程度可用范式来表示,如满足最低要规范化的程度可用范式来表示,如满足最低要求,则称为第一范式,依次还有第二、三、四、五求,则称为第一范式,依次还有第二、三、四、五范式,在五种范式中,通常只使用前三种。范式,在五种范式中,通常只使用前三种。 属于第一范式的关系应满足的基本条件是元属于第
57、一范式的关系应满足的基本条件是元组中的每一个分量都必须是不可分割的数据项。组中的每一个分量都必须是不可分割的数据项。(一)第一范式(一)第一范式员工员工编号编号姓名姓名工资工资基本基本工资工资附附加工资加工资10000001100000021000000310000004张兴张兴李明李明王进王进赵赵强强30003000300030002500100020001500如下面的职工工资关系就不符合第一如下面的职工工资关系就不符合第一范式范式员工员工编号编号姓名姓名电话电话家庭家庭电话电话办公办公电话电话10000001100000021000000310000004张兴张兴李明李明王进王进赵赵强强
58、6024780760247808602578076025780860227806602278076022780860227809下面的职工电话关系不符合第一下面的职工电话关系不符合第一范式范式员工员工编号编号姓名姓名基本基本工资工资附附加工资加工资10000001100000021000000310000004张兴张兴李明李明王进王进赵赵强强30003000300030002500100020001500员工员工编号编号姓名姓名家庭家庭电话电话办公办公电话电话10000001100000021000000310000004张兴张兴李明李明王进王进赵赵强强60247807602478086025
59、78076025780860227806602278076022780860227809下面的职工工资和电话关系符合第一下面的职工工资和电话关系符合第一范式范式100001100001100001100002100002100002100003100003100003张三张三张三张三张三张三李李四四李李四四李李四四王王五五王王五五王王五五181818181818171717男男男男男男男男男男男男男男男男男男XG0001XG0002XG0003XG0001XG0002XG0003XG0001XG0002XG0003高等数学高等数学电子电子商务商务企业企业管理管理高等数学高等数学电子电子商务商务
60、企业企业管理管理高等数学高等数学电子电子商务商务企业企业管理管理322322322989092929692939590主属性主属性不满足第二范式不满足第二范式(二)第二范式(二)第二范式 这种关系这种关系不仅满足第一范式不仅满足第一范式,而且,而且所有所有非主属性非主属性完全依赖完全依赖于其主键。于其主键。100001100001100001100002100002100002100003100003100003王王五五17男男张三张三张三张三张三张三李李四四李李四四李李四四王王五五王王五五1818181818181717男男男男男男男男男男男男男男男男李李四四李李四四1818男男男男张三张三
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 分级护理的护理沟通与协作
- 自体干细胞移植护理中的沟通技巧
- 冠心病患者心理护理技巧培训
- 经验与启示类试题及答案
- 2026年中考考前模拟-语文(安徽卷)(考试版A4)
- 《ISO9000-2026 质量管理- 基础和术语》之术语“3.8有关数据、信息和文件的术语”专业深度解读与应用指导材料(雷泽佳编制-2026A0)
- 特殊群体性病筛查服务
- 陶瓷成型施釉工岗位安全意识考核试卷含答案
- 物业管理师操作技能能力考核试卷含答案
- 煤层气排采工岗前基础能力考核试卷含答案
- 2026年广西继续教育公需科目试题及答案
- 2026年玉溪市中医医院公开招聘编外工作人员(17人)笔试备考试题及答案解析
- 政治+答案【一六八最后一卷】安徽合肥市第一六八中学等校2026届高三年级最后一卷(5.14-5.15)
- 山东省东营市2026年中考三模物理试题(含答案解析)
- 2026年今年征兵心理测试题及答案
- 摩根士丹利 -半导体:中国AI加速器-谁有望胜出 China's AI Accelerators – Who's Poised to Win
- 市政设施损坏快速维修与抢修方案
- 2025-2026学年北师大版七年级数学下册期中达标测试卷(含答案)
- 灯火里的中国混声四部合唱谱冯
- 电动汽车充电桩建设合同能源管理协议
- JJF 2370-2026建筑运行阶段碳排放计量技术规范
评论
0/150
提交评论