管理数据资源_第1页
管理数据资源_第2页
管理数据资源_第3页
管理数据资源_第4页
管理数据资源_第5页
已阅读5页,还剩64页未读 继续免费阅读

付费下载

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第六章 管理数据资源 (1)了解传统的文件组织和管理技术;(2)分析传统的文件环境下的问题;(3)弄清数据库管理系统是如何组织信息;(4)区分三种数据库模型;(5)学习关系数据库的设计原理;(6)探讨数据库发展的新趋势;(7)弄清建立数据库环境在管理上和组织上的需求。第一节 传统的数据组织一、有关文件组织的术语和概念位(Bit):是计算机中最小的数据单位,其值为0或1。字节(Byte):是由若干位组成的,代表一个字符,字符可以是字母、数字或者是其他的符号。字段(Field):多个字符组成一个词或者一个完整的数字(如人名或年龄),称做字段。记录(Recod):若干个相关的字段,如学生姓名、所选课

2、程、日期及年级组成一个记录。文件(File):若干个同类型的记录组成一个文件。术语和概念数据库:若干个相关的文件组成一个数据库。实体:一个记录描述一个实体。实体可以是一个人、一个地方、一个事物或者一个事件,有关实体的信息需要管理和维护。属性:分别描述每一个特定实体的特征或性质。关键字:唯一标识记录的字段(组)。数据库位字节字段文件记录层 次事 例 学生数据库课程文件、简历文件、财务文件.课程文件课程号 课程名 学分 学时J101 数学 10 160 Y201 英语 12 184W301 物理 6 96课程号 课程名 学分 学时J101 数学 10 160 J101 (课程号字段)1010101

3、0 (字母J的ASCII码)0图6-1 数据结构二、存取计算机文件中记录顺序文件组织方式:数据记录是按着它在存储介质中的物理顺序来查找的。直接或随机文件组织:允许用户按自己希望的顺序访问记录,不需考虑它在存储介质中的实际物理顺序。三、传统文件环境存在的问题传统文件环境存在一系列问题:数据冗余和混淆程序与数据相互依赖缺乏灵活性安全性差缺少数据的共享性和有效性。1数据的冗余和混淆数据冗余指的是在多个数据文件中重复出现相同的数据。当不同的决策或职能部门单独地搜集相同的信息时,就出现了数据冗余。2程序与数据的依赖性程序与数据的依赖性:数据文件和使用该数据文件的应用程序之间过分依赖。应用程序要对它所处理

4、的数据文件的性质进行描述。数据的任何改变都需要相应地修改使用它的应用程序。3缺乏灵活性传统的文件系统只能通过程序处理固定的报表,不能处理特殊的报表。无法根据特殊需要在系统中检索数据。所有的数据使用,必须由程序员编程解决。用户开始疑惑计算机到底有没有用。4极差的安全性传统的文件系统对数据缺乏控制和管理功能,数据访问和分发权限没有控制。5缺少数据的共享性和有效性不同部门中的数据文件格式不同,相互间没有联系,各个部门不能共享和及时访问。第二节 现代数据库环境集成的人力资源数据库员工档案 姓名 地址 性别 职务工资单 基础工资 奖金 交税 其他支出 实发工资福利 人身保险 养老金计划 保健计划 退休保

5、障数据库管理系统工资应用程序工资部员工档案应用程序人事部福利应用程序福利部图6-2 数据库环境一、数据库管理系统(DBMS)数据库管理系统(DBMS)是一组软件,它允许组织集中并有效地管理数据以供应用程序访问。数据库管理系统包括三个部分:数据定义语言(Data Definition Language,DDL)数据操作语言(Data Manipulation language,DML)数据字典(Data Dictionary)。数据定义语言数据操作语言DBMS应用程序1应用程序3应用程序2数据字典物理数据库图6-3 DBMS的组成数据定义语言数据定义语言:程序员用来详细描述数据库内容和结构的正式

6、语言。数据操作语言数据操作语言:为用户和程序员提供了一组对数据库进行操作的命令,以满足信息访问和开发应用程序的需求。功能包括:排序、索引、查询、删除、增加、筛选、投影、插入、显示、打印、复制、合并SQL(Structured Query Language)。SELECT ALL | DISTINCT TOP nExpr PERCENTAlias. Select_Item AS Column_Name, Alias. Select_Item AS Column_Name .FROM FORCEDatabaseName!Table AS Local_AliasINNER | LEFT OUTER

7、| RIGHT OUTER | FULL OUTER JOINDatabaseName!Table AS Local_AliasON JoinCondition INTO Destination| TO FILE FileName ADDITIVE | TO PRINTER PROMPT | TO SCREEN PREFERENCE PreferenceNameNOCONSOLEPLAINNOWAITWHERE JoinCondition AND JoinCondition .AND | OR FilterCondition AND | OR FilterCondition .GROUP BY

8、 GroupColumn , GroupColumn .HAVING FilterConditionUNION ALL SELECTCommandORDER BY Order_Item ASC | DESC , Order_Item ASC | DESC .SQL语言中Select语句的语法:数据字典数据字典: 用来存储数据元素的定义和特性,如用途、物理表现、所属关系,授权及安全。二、数据的逻辑视图和物理视图物理视图:数据的实际组织形式以及它在物理存储介质上的结构。逻辑视图:用户使用数据时,直观看到的形式。模式:整个数据库的逻辑描述出所有的数据项以及它们之间的关系,叫做模式。子模式:按某个应用

9、程序的要求对数据库的某一部分做特定的描述叫子模式。三、数据库管理系统的优点(1)数据、访问、使用和安全性的集中管理可以降低组织的信息系统的复杂性;(2)消除所有单独文件中数据项的重复可以减少数据的冗余及不一致性;(3)集中控制数据的建立和定义可以消除数据的混淆;(4)将数据的逻辑视图与物理视图分开可以减少程序-数据的依赖性;(5)程序的开发和维护费用会大幅度下降;(6)允许快速地和临时性地查询大块信息使得信息系统的灵活性大大提高;(7)信息的访问能力和信息的有效性增强。第三节 数据库的设计DBMS用三种逻辑数据库模型来组织数据、表示数据库中数据的关系:层次模型网状模型关系模型一、层次数据模型层

10、次数据模型以树状结构描述数据。记录中的数据元素组成一个个记录块这些记录块叫做节点。每一记录就像一个组织图,最上层的节点叫做根。上下层的节点以父-子逻辑关系关联。父节点可以有多个子节点,而子节点只能有一个父节点。员工福利工作分配收入历史工资绩效工资保健人身保险退休金根节点第一层子节点第二层子节点图6-4 层次数据模型例子二、网状数据模型网状数据模型是层次数据模型的变种。层次结构描述的是一对多的关系,而网状结构描述的是多对多关系,换句话说,父母可以有多个“孩子”,而孩子也可以有多对父母。课程 2课程 3课程 1学生 5学生 4学生 3学生 2学生 1图6-5 网状数据模型三、关系数据模型把数据库中

11、所有数据都以二维表(称为关系)的形式来表示。行(记录)定货表零件表供应商表定单编号163416351636定货日期02/02/9302/12/9302/13/93发货日期02/22/9302/29/9302/01/93零件号152137145零件数量231金额144.5079.7024.30零件号137145152零件名称门锁门把手压缩机单价26.2522.5070.00供应商编号405820381125供应商编号112520384058供应商姓名光明公司先锋公司智远公司供应商地址人民路44号五四路32号海滨路51号邮编116044114321112324表列(字段)图6-6 关系数据模型四、

12、三个数据库模型的优缺点层次和网状数据库模型的优缺点优点:处理的有效性。适合大型的数据库。缺点:缺少灵活性,所有的访问路径、目录、索引必须事先指定。一旦指定了就不容易改变,除非修改主要的程序。程序量大、费时和不易安装的,一旦发生设计错误是不易补救的。信息查询不方便。关系数据库模型的优缺点优点:很灵活地响应特殊查询,能综合不同的信息源。设计和维护简单,在不妨碍已存在的程序和应用的情况下也能增加新记录。理论基础完善。完整的关系理论支持。缺点:是处理效率低,其慢的原因是查询要通过运行选择、连接、投影等命令而反复访问磁盘。五、建立数据库要建立数据库需要做两个设计:概念设计:根据实际业务导出抽象模型。设计

13、中需要业务过程及信息的详细描述,因此需要最终用户的参与。物理设计:在物理存储设备上的组织方式。物理设计由数据库专家完成。1.用E-R图表示数据概念模型矩形表示实体菱形表示关系圆形表示属性供应商零件关系图6-7 “购置零件”数据库的实体-关系图* 零件号零件名称规格*供应商编号供应商名称供应商地址供应商电话单价* 零件号*供应商编号日期供应量2. 关系数据库的规范化技术关系数据库的规范化解决下列问题:实体应该拥有哪些属性?按照什么原则规定这些属性?这些属性之间有什么关系?通常,E-R图的绘制和规范化是同时进行的。数据库的规范化是通过几个“范式”条件的判断,不断修订数据库结构来完成的。关系数据库的

14、结构:“零件数据库”的结构表示为:零件(#零件号,名称,规格,生产厂家,生产日期,单价)有关的基本概念#零件号 名称 规格 生产厂家 生产日期 单价A20-01 电阻器 WH-5W 上海第二电器厂 1990.12.23 54.30A40-31 电阻器 TH-Y3 郑州红房热电厂 1989.02.13 34.40R4-801 电位器 R-T-W 南宁广播器材厂 1995.02.23 153.00PY-090 灯泡 40W/S 上海灯泡三厂 1998.10.13 78.20A20-01 电话机 SWH-5 长春电器厂 1993.11.06 234.20关系的概念这种结构的一般表示为: R(A,B,

15、C,D,E)在数学上,称为“关系”。 R(A,B,C,D,E)关系名属性主属性和非主属性 能够唯一识别一个元组的一组属性称为“主属性”,其他的属性称为“非主属性”。函数依赖函数依赖: 在关系R中,对于属性A的每一个取值,属性B都有一个值与它对应,则称,属性B函数依赖于属性A。也称:A决定B。举例: 前边数据库示例中: “零件号”决定“规格”、“生产厂家”等。完全函数依赖和部分函数依赖定义: 在关系R中,若一个非主属性B函数依赖于整个主属性A,则称,B完全函数依赖于A;如果B仅函数依赖于主属性A中的部分属性,则称,B部分函数依赖于A。举例:订货(#商品号,#供应商号,商品名,订货量,订货日期)完

16、全函数依赖部分函数依赖传递依赖定义: 在关系R中有三个属性A、B、C,如果有AB,又有BC,则称,C传递依赖于A。举例:商品(#商品号,商品名,规格,生产日期,生产厂家,厂长,厂家电话)传递依赖第一范式、第二范式和第三范式定义一:如果关系R的每一个属性都是不可再分的,称R满足第一范式。记作:R1NF。定义二:若R1NF,且它的每个非主属性都完全函数依赖于主属性,则R2NF。定义三:若R2NF,且它的每个非主属性都不传递依赖于主属性,则R3NF。向第三范式转化1FN2FN3FN消除非主属性消除非主属性对主属性的部分依赖对主属性的传递依赖示例某车配件公司销售好几种汽车的主要配件,打算开发一个管理信

17、息系统,把汽车配件的库存情况、销售情况、客户情况以及供货商情况等R(配件编号,配件名称,配件规格,适用车型, 配件存量,销售单价,销售量,销售日期, 供应商编号,供应商名称,供货商地址,供货数量, 供货单价,供货日期,客户编号,客户名称, 客户地址,客户电话,购货日期,客户经手人)确定函数依赖关系1. 已经满足第一范式:标识出关键字:R(#配件编号,配件名称,配件规格,适用车型, 配件存量,销售单价,销售量,销售日期, #供应商编号,供应商名称,供货商地址,供货数量, 供货单价,供货日期,#客户编号,客户名称, 客户地址,客户电话,购货日期,客户经手人)2. 存在部分依赖:将部分依赖关系单独列

18、出:转换为第二范式零配件(#配件编号,配件名称,配件规格,适用车型, 配件存量 )客 户(#客户编号,客户名称,客户地址,客户电话)供应商(#供应商编号,供应商名称,供货商地址)销 售(#配件编号,#客户编号,销售单价,销售量, 销售日期,客户经手人)供 应(#配件编号,#供应商编号,供货数量, 供货单价,供货日期)向第三范式转换检查是否存在传递依赖。已经满足第三范式。第四节 数据库发展趋势一、分布式处理和分布式数据库分布式处理:通过计算机网络,将计算机分散在不同的地区,各地计算机主要用于满足当地的处理需要。分布式数据库:指的是数据可以被存储到多个不同地理位置的数据库中。(1)分立式数据库(P

19、artitioned database)将中心数据库分为多个部分;每个部分都有自己的数据库;数据库只为本地区服务。本地数据库在晚上成批地传递到中心数据库以实现数据的一致性。中心数据库主CPU远程CPU远程数据库第一部分远程数据库第三部分图 6-10 分布式数据库(a) 分立式数据库远程数据库第二部分(2)副本式数据库(Duplicate database)复制中心数据库到各个远程地点;每个远程数据库都是中心数据库的一个副本按时修改中心数据库。中心数据库主CPU远程CPU远程数据库副本远程数据库副本图 6-10 分布式数据库(a) 分立式数据库远程CPU用户请求(3)集中索引分布式数据库(Cen

20、tral index distributed database)只需在中心维护名字索引而把完整的记录存在本地当查询一条记录时,通过查找中心的名字索引就会确定记录所存放的位置。这里没有中心数据库,因而也就没有数据更新成本。在这样的数据库当中,用户可以通过保存在中心的总目录访问网络上的所有数据库。中心数据库主CPU图 6-10 分布式数据库(c) 集中索引分布式数据库远程CPU远程CPU远程CPU远程CPU远程数据库远程数据库远程数据库远程数据库用户请求 (4)“网络请求”分布式数据库(“Ask-the-network”distributed database)没有中心名字索引,而是通过遍访网络上的所有远程处理器来查找所需的记录,然后整个记录被传送到发出请求的处理器。中心通讯处理器图 6-10 分布式数据库(d)“网络请求”分布式数据库远程CPU远程CPU远程CPU远程数据库用 户远程数据库远程数据库分布式处理和分布式数据库的优缺点优点:可以购买更小、更便宜的小型机来提高系统功能。给本地用户提高了服务和响应速度。缺点:分布系统需要高质量的通讯线路,而通讯线路本身是脆弱的。本地数据库有时会脱离中央数据的标准和定义,广泛地分布式访问敏感的数据会造成安全问题。二、多媒体数据库多媒体数据库:数据库不但能存

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论