版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、本章要点:数据处理数据库技术 (数据库系统的构成、数据库设计主要内容、E-R图、数据模型、关系的规范化)计算机网络第二章 管理信息系统的技术基础2.1数数据处处理指把来自自科学研研究、生生产实践践和社会会经济活活动等领领域中的的原始数据据,用一定定的设备备和手段段,按一一定的使使用要求求,加工成另一种种形式的的数据。一、概念念二、数据据处理的的目的把数据转转换成便便于观察察分析、传送或或进一步步处理的的形式。从大量的的原始数数据中抽抽取、推推导出对对人们有有价值的的信息以以作为行行动和决决策的依依据。科学地保保存和管管理已经经过处理理(如校校验、整整理等)的大量量数据,以便人人们能方方便而充充
2、分地利利用这些些宝贵的的信息资资源。2.1数数据处处理数据收集集数据转换换数据的筛筛选、分分组和排排序数据的组组织数据的运运算数据的存存储数据的检检索数据输出出三、数据据处理的的基本内内容2.1数数据处处理简单应用用(20世纪50年代代以前)无外存;无操作作系统;数据是是程序的的组成部部分四、发展展过程文件系统统(50年代后后期到60年代代中期)出现大容容量的硬硬盘;出出现操作作系统;数据有有结构,组织在在文件内内。数据库系系统(60年代代后期开开始)2.1数数据处处理四、发展展过程特点文件系统阶段 数据库管理阶段程序与数据的关系数据共享 数据独立数据结构一致性 存取方法应用程序1应用程序2应
3、用程序n文件1文件2文件n较少共享(冗冗余小)工资:BH ,XM ,BM ,JB ,JBGZ人事:BH ,XM ,BM ,JB ,出身,籍贯工资:BH ,XM ,BM ,JB ,JBGZ人事:BH,出身,籍贯数据面向向一个或或几个应应用程序序独立性差差应用程序序与数据据基本无无关独立性好好内部有结结构;整整体无结结构整体结构构化不好可以避免免数据不不一致数据库DBMS程序1程序2程序n2.2数数据库库技术一、数据据库系统统的构成成计算机软硬件系统目的手段、工具数据库DBMS用户2.2数数据库库技术二、数据据库设计计的内容容现实世界界客观事物物及联系系映射抽象表达实体属性联系实体1实体2实体3联
4、系联系联系111nnm变换关系层次网状变换数据结构用户要求用户视图概念结构模型(E-R图)逻辑结构模型物理模型数据世界数据化信息世界概念化客观事事物物类:事物相相关关性质集集合人实体实实体集集合及实实体联系相相关关属性集集合加工、转转换数文文件据记记录库相相关数数据项集集合加工转换存储二进制数数据集合合结构计算机世世界DBMS数据世界界信息世界界认识选择择描述现实世界界E-R模型信息的转转换数据模型型2.2数数据库库技术1976年,P.P.S.Chen提出-模型(Entity-Relationship Model),用-图来描描述概念念模型。观点:世世界是由由一组称称作实体的基本对对象和这这些
5、对象象之间的的联系构成的。三、实体体联系(Entity Relation)图,即E-R图2.2数数据库库技术三、实体体联系(Entity Relation)图,即E-R图实体:客观存在在并可相相互区分分的事物物叫实体体。可以是人人、物、抽象的的概念,可以指指事物的的本身,也可指指事物之之间的联联系。如学生张张三、工工人李四四、计算算机系、数据库库概论。属性:实体具有有的某种种特征。实体型(Entity Type):实体名与与其属性性名集合合共同构构成实体体型。例例,学生生(学号号、姓名名、年龄龄、性别别、系、年级)。注意实体体型与实实体(值值)之间间的区别别,后者者是前者者的一个个特例。如(9
6、808100,王平,21,男,计计算机系系,2)是一个实实体。2.2数数据库库技术三、实体体联系(Entity Relation)图,即E-R图实体集(Entity Set):同型实体体的集合合称为实实体集。如全体体学生。联系:联系(Relationship):实体之间间的相互互关联。如学生与与老师间间的授课课关系,学生与与学生间间有班长长关系。联系也可可以有属属性,如如学生与与课程之之间有选选课联系系,每个个选课联联系都有有一个成成绩作为为其属性性。同类联系系的集合合称为联联系集。2.2数数据库库技术三、实体体联系(Entity Relation)图,即E-R图联系的种种类实体之间间的联系系
7、的数量量,即一一个实体体通过一一个联系系集能与与另一实实体集相相关联的的实体的的数目。可以有一一对一的的(1:1),一对对多的(1:m),多对多的的(m:n)几种情况况。例如:管理组成班主任班级学生111n2.2数数据库库技术学生课程选修学号姓名系别课程名先修课主讲老师成绩用矩形表示实体集,在框内写上实体名用椭圆表示实体的属性用无向边把实体与其属性连接起来用菱形表示实体间的联系将参与联系的实体用线段连接例:学生选修课程mn联系的数量三、实体体联系(Entity Relation)图,即E-R图2.2数据库技技术E-R模型示例例(教学实体体联系模模型)学工部:学号,姓名,性别,年龄,籍贯,入校时
8、间间,各科成绩绩教务科:学号,姓名,课程,学时,学分,成绩,任课教师师,职称人事部:教师姓名名,性别,年龄,职称,评价课程学生教师mnmnnm选修教学授课课号课名学分成绩学号姓名评价教号姓名职称2.2数数据库库技术四、数据据模型层次模型型有且仅有有一个节节点无双双亲(根根)其它节点点有且仅仅有一个个双亲网状模型型可有一个个以上节节点无双双亲至少有一一个节点点有多于于一个的的双亲关系模型型2.2数数据库库技术关系模型型每一个关关系为一一张二维维表,相相当于一一个文件件。实体体间的联联系均通通过关系系进行描描述。下表用m行n列列的二维维表表示示了具有有n元组组(n-Tuple)的付付款关关系。每每
9、一行即即一个n元组,相当于于一个记记录,用用来描述述一个实实体。结 算 编 码合 同 号数 量金 额J0012HT1008100030000J0024HT110760012000J0036HT111520004000关系模式式的描述述:关系名(属性1,属性2,属性n)2.2数数据库库技术实体关关系属性关关系的的属性学生(学号,姓名,系别)E-R模型向关关系模式式的转换换学生学号姓名系别2.2数数据库库技术E-R模型向关关系模式式的转换换一对一联联系:若联系一一方全部部参与,则将联联系另一一方的关关键字作作为全部部参与一一方的属属性。例如:班班级(班班号,人人数教师编号号)或教教师(教师编号号,
10、职称班号)例如:班主任班级管理11管理(教教师编号号,班级级号)若联系双双方均部部分参与与,则将将联系定定义为一一个新的的关系,属性为为参与双双方的关关键字。2.2数数据库库技术E-R模型向关关系模式式的转换换一对多联联系:班级学生组成1n学生(学号,姓名班级号)多对多联联系:将将联系定定义为新新的关系系,双方方的关键键字作为为联系实实体的属属性。学生课程选修mn选修(学号,课程号,成绩)将一方的的关键字字作为多多方实体体的属性性。2.2数数据库库技术E-R模型向关关系模式式的转换换E-R模型示例例学工部:学号,姓名,性别,年龄,籍贯,入校时间间,各科成绩绩教务科:学号,姓名,课程,学时,学分
11、,成绩,任课教师师,职称人事部:教师姓名名,性别,年龄,职称,评价课程学生教师mnmnnm选修教学授课课号课名学分成绩学号姓名评价教号姓名职称2.2数数据库库技术E-R模型向关关系模式式的转换换E-R模型示例例转换为5个关系选修(学号,课程号,成绩)授课(教师号,课程号,评价)学生(学号,姓名,)课程(课程号,课程名,学分)教师(教师号,教师姓名名,职称)学生课程教师选修授课2.2数数据库库技术五、关系的规规范化关系模式式的设计计问题示例:考虑为管管理职工工的工资资信息而而设计一一个关系系模式。2.2数数据库库技术五、关系的规规范化问题:麻麻烦!麻烦!好麻烦!唉,剪不不断,理理还乱关系模式式的
12、设计计问题插入异常常:如果没有有职工具具有8级工资,则8级工资的的工资数数额就难难以插入入。删除异常常:如果仅有有职工赵赵明具有有4级工资,如果将将赵明删删除,则则有关4级工资的的工资数数额信息息也随之之删除了了。数据冗余余:职工很多多,工资资级别有有限,每每一级别别的工资资数额反反复存储储多次。更新异常常:如果将5级工资的的工资数数额调为为620,则需要要找到每每个具有有5级工资的的职工,逐一修修改。2.2数数据库库技术解决之道道:分解解!分解!再分解!关系模式式的设计计问题级别工资450056006700哇,原来来生活可可以如此此简单五、关系的规规范化2.2数数据库库技术五、关系的规规范化
13、有关学生生的关系系模式S(S# ,SN,SD, DEAN,C#, G)快速热身身:它有哪些些数据冗冗余?望闻问切切:不良的数据依赖赖关系模式式的设计计问题2.2数数据库库技术五、关系的规规范化函数依赖赖如果在一一个关系系R中,数据据元素B的取值依依赖于数数据元素素A的取值,我们称称B函数依赖赖于A。句话说,A决定B。用“AB”表示。2.2数数据库库技术五、关系的规规范化范式(NormalForm)定义:范式是对对关系的的不同数据依赖赖程度的要求。通过模模式分解解将一个个低级范范式转换换为若干干个高级级范式的的过程称称作规范范化。2.2数数据库库技术五、关系的规规范化第一范式式(1NF)定义关系
14、中每每一分量量不可再再分。S#C#S1C1 C2S1C1C22.2数数据库库技术数据冗余余:如果一个个学生选选修了k门课,则则有关他他的所在在系的信信息重复复。五、关系的规规范化第二范式式(2NF)关系模式式S(S# ,SN,SD, DEAN,C#, G)不良特性性插入异常常:如果学生生没有选选课,关关于他的的个人信信息及所所在系的的信息就就无法插插入。删除异常常:如果删删除学生生的选课课信息,则有关关他的个个人信息息及所在在系的信信息也随随之删除除了。更新异常常:如果学生生转系,若他选选修了k门课,则则需要修修改k次。2.2数数据库库技术五、关系的规规范化第二范式式(2NF)定义如果一个个符
15、合1NF的关系,它所有有的非关关键字数数据元素素都完全全函数依依赖于整整个关键键字,我我们称它它是第二二规范化化形式,简称2NF。2.2数数据库库技术五、关系的规规范化第二范式式(2NF)学号S#姓名SN系名SD系主任DEAN课程号C#成绩G改造将S分解SC(S# , C# , G)S_SD(S# , SN , SD , DEAN)非主属性性有两种种,一种种完全依依赖于关关键字,一种部部分依赖赖于关键键字。根据2NF的定义,如果一一个满足足1NF的关系,其关键键字仅由由一个数数据元素素组成,那么它它必然属属于2NF。2.2数数据库库技术五、关系的规规范化第三范式式(3NF)数据冗余余:每个学生
16、生都存储储了所在在系的系系主任的的信息。S_SD(S# ,SN,SD, DEAN)不良特性性插入异常常:如果系中中没有学学生,则则有关系系的信息息就无法法插入。删除异常常:如果学生生全部毕毕业了,则在删删除学生生信息的的同时有有关系的的信息也也随之删删除了。更新异常常:如果学生生转系,不但要要修改SD,还要修改改DEAN,如果换系系主任,则该系系每个学学生元组组都要做做相应修修改。2.2数数据库库技术五、关系的规规范化学号S#姓名SN系名SD系主任DEAN改造将S分解STUDENT(S# , SN , SD)DEPT(SD , DEAN)第三范式式(3NF)传递依赖赖:假设设A,B,C分别是同同一个关关系R中的三个个数据元元素,或或分别是是R中若干个个数据元元素的集集合。如如果C函数依赖赖于B,而B又函数依依赖于A,那么C函数也函函数依赖赖于A,我们称“C传递依赖赖于A”。定义:满满足2NF,且它的任任何一个个非主属属性都不不传递依依赖于主主关键字字。2.2数数据库库技术五、关
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 浙江省义乌地区2026年初三3月统一质量检测试题英语试题含解析
- 黄石市2026年初三一轮复习阶段性考试(英语试题文)试题含解析
- 2026年四川省成都市天府第七中学初三下期中考试(英语试题文)试题含解析
- 2026年四川省部分地区重点中学中考英语试题原创模拟卷(六)含解析
- 卒中患者康复护理中的护理管理
- 学校学群众路线活动心得体会
- 统计学在经济学中的实际应用
- 客房营销活动方案(3篇)
- 临沧营销方案餐饮(3篇)
- 商铺包装营销方案(3篇)
- 初中语文八年级上册《春望》教学设计
- 2025年中智江西水务项目综合岗招聘备考题库含答案详解
- IATF-16949培训课件教学课件
- 朝鲜战争课件
- 评标应急预案
- 焊工设备保养维护方案
- 2025年广东省专业技术公需课《人工智能赋能制造业高质量发展》及答案
- 小学生防诈骗安全教育课件
- 《柔性电路板基材挠性覆铜板(FCCL)》
- 2025年纪检监察业务知识题库(附含答案)
- 山西众辉供电服务有限公司考试题
评论
0/150
提交评论