




已阅读5页,还剩37页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
管理信息系统(ManagementInformationSystem),同济大学经济与管理学院,管理信息系统精品课程课程组网站:,第6章数据库与数据仓库,学习目的,理解信息系统与数据管理;掌握文件环境和数据库环境下的数据组织;掌握数据模型、关系模式规范化、数据视图概念和数据库设计;了解面向对象及其他高级数据库系统;了解数据仓库与数据挖掘。,本讲内容,6.1信息系统的数据管理6.2文件环境下的数据组织6.3数据库环境下的数据组织6.4数据模型6.5关系模式规范化6.6数据视图概念6.7数据库设计6.8面向对象及其他高级数据库系统6.9数据仓库与数据挖掘,6.1信息系统的数据管理,6.1.1数据管理概念美国学者詹姆斯马丁提出数据环境的概念,认为只要企业的性质和目标不变,尽管企业的数据加工处理过程是多变,但数据是稳定的,企业任何业务活动都离不开对数据的存取。MIS是有目的地对企业生产经营活动产生的原始数据进行收集、组织、加工处理,直至生成信息的系统。管理人员则利用信息控制企业各项经营活动并作出决策。组织数据的逻辑存储结构,将逻辑存储结构转换成计算机物理存储结构,以及根据需要准确、迅速地存取数据等,这些问题都是数据管理技术的主要研究内容。,6.1信息系统的数据管理,6.1.1数据管理概念随着计算机技术的产生和发展,企业的数据管理技术经历了人工管理,文件管理技术和数据库管理技术三个阶段。目前数据库是企业信息系统组织、管理数据的最常用技术。,6.1信息系统的数据管理,6.1.2MIS的数据管理要求需要有效的数据库技术需要稳定的数据基础需要良好的数据环境,本讲内容,6.1信息系统的数据管理6.2文件环境下的数据组织6.3数据库环境下的数据组织6.4数据模型6.5关系模式规范化6.6数据视图概念6.7数据库设计6.8面向对象及其他高级数据库系统6.9数据仓库与数据挖掘,6.2文件环境下的数据组织,6.2.1文件的基本概念数据项数据项是组成数据处理对象的最小单位,如表中的订单代码、订单日期等记录它是由一个或多个数据项所组成。记录是描述一个客观事物或对象的属性值的总和,也是计算机一次处理的数据逻辑单元。文件具有相同性质的记录的集合称为文件。,6.2文件环境下的数据组织,6.2.2文件组织方式顺序组织顺序组织方式是指文件中的记录的物理顺序和逻辑顺序相一致的形式。索引文件索引文件是按照记录关键字排序的文件。索引文件通常由两部分组成:数据区和索引区。其数据区存放主文件的数据记录,索引区存放索引。(1)索引非顺序文件:数据文件中记录不按顺序存放,而索引是按顺序存放的。(2)索引顺序文件:数据区的记录按关键字值的大小排序,并带有索引的文件。直接存取组织直接存取文件组织中的记录都是随机存放的,故又称随机文件。倒排文件如果按某非关键字项值的大小排列,并将该值对应的记录地址一并列入索引表中,这种表称为倒排表,这样组成的文件称为倒排文件。,本讲内容,6.1信息系统的数据管理6.2文件环境下的数据组织6.3数据库环境下的数据组织6.4数据模型6.5关系模式规范化6.6数据视图概念6.7数据库设计6.8面向对象及其他高级数据库系统6.9数据仓库与数据挖掘,6.3数据库环境下的数据组织,6.3.1数据库定义数据库的定义长期储存在计算机内的、有组织的、可共享的数据集合。数据库中的数据按一定的数据模型组织、描述和储存,具有较小的冗余度、较高的数据独立性和易扩展性,并可为各种用户共享。数据库的特点数据结构化、数据共享性、数据独立性,6.3数据库环境下的数据组织,6.3.2数据库管理系统数据库管理系统数据库管理系统(DBMS)是位于用户与操作系统之间的一层数据管理软件。DBMS的分类按数据模型、按所支持的用户数、按允许数据库可以分布的站点数、按用途。数据库管理系统的组成数据定义语言及其翻译程序;数据操纵(或查询)语言及其编译(或解释)程序;数据库管理例行程序。,6.3数据库环境下的数据组织,6.3.3数据库系统结构硬件CPU、内存、磁盘、磁带以及其它外部设备。软件操作系统(OS)、数据库管理系统(DBMS)、应用于开发应用程序的具有数据库接口的高级语言及其编译系统、以DBMS为核心的应用开发工具、为某应用环境开发的数据库应用系统。人员数据库管理员(DataBaseAdministrator,DBA)、系统分析员和数据库设计人员、应用程序员和最终用户。,本讲内容,6.1信息系统的数据管理6.2文件环境下的数据组织6.3数据库环境下的数据组织6.4数据模型6.5关系模式规范化6.6数据视图概念6.7数据库设计6.8面向对象及其他高级数据库系统6.9数据仓库与数据挖掘,6.4数据模型,6.4.1信息描述,6.4数据模型,6.4.1信息描述现实世界是指存在于人们头脑之外的客观世界,事物及其相互间联系就处在这个世界之中。信息世界信息是现实世界中的客观事物在人们头脑中的反映。人的头脑对于这些事物经过认识、选择、描述之后进入信息世界。它包括:实体、属性、域、实体型、实体集、码、联系等概念。数据世界数据世界中研究的对象是数据,数据是对信息的符号化表示。计算机世界数据世界中的数据经过编码、加工后就进入计算机世界。,6.4数据模型,6.4.2实体-联系模型(E-R)基本E-R图形E-R模型有三个基本元素,即实体、实体之间的联系和属性,它们分别用矩形框、棱型框和椭园形框表示,并且将对应的名字填入框内以作标识,用无向边把实体与其属性连接起来,将参与联系的实体用线段连接,并标上联系的数量,见图6.5所示的学生选修课程的E-R图。构造E-R模型构造E-R模型实质上就是根据现实世界客观存在的“事物”及其关系所给出的语义要求,组合基本E-R图形为E-R模型。它包括如下步骤:标识实体集;标识联系集;标识属性值集;标识关键字。,6.4数据模型,6.4.3数据模型层次模型用树结构表示实体之间联系的模型叫层次模型。树由节点和连线组成,节点代表实体型,连线表示两实体型间的一对多联系,见图6.6(a)网状模型网状模型是一个满足条件的有向图,条件是:可以有一个以上的节点无父节点;至少有一个节点有多于一个的父节点(排除树结构);节点代表实体型,有向边(从箭尾到箭头)表示两实体型间的一对多联系,见图6.6(b)层次模型关系模型用二维表来表示实体,用外码表示实体间的联系。见表6.9、6.10、6.11面向对象面向对象的数据模型中对象(Object)是现实世界中实体的模型化,与记录(元组)对应。每个对象有一个唯一的标识符,把属性和行为封装在一起。类(Class)是具有相同属性和行为的对象的集合。系统中所有类构成一个有向无环图。类之间有继承关系,见图6.7,本讲内容,6.1信息系统的数据管理6.2文件环境下的数据组织6.3数据库环境下的数据组织6.4数据模型6.5关系模式规范化6.6数据视图概念6.7数据库设计6.8面向对象及其他高级数据库系统6.9数据仓库与数据挖掘,6.5关系模式规范化,6.5.1问题的提出一个企业销售记录的关系模式PEQ(订单代码、订购日期、客户、发货日期、产品、单价、数量、雇员),如表6.12所示。如果关系模式设计得不好会带来以下问题:,6.5关系模式规范化,6.5.1问题的提出冗余度高如果“雇员”与客户的联系是固定的,而当该客户每购买一种产品时,“雇员”就重复存放一次。修改问题如果在PEQ中,某客户的联系雇员变动时,就需要对所涉及的雇员进行修改,这不仅增加了更新代价,而且有可能造成数据的不一致性。删除问题如果某客户暂时不需要任何产品,则删除时就丢失了其所联系雇员的一些信息,而该雇员可能在以后可能再次用到。插入问题在这个关系中,关键字由“订单代码、客户、产品”组成。如果新增一个客户的有关数据,而所购买产品未定,那么这个客户的数据无法插入,因为缺少关键字其他数据。,6.5关系模式规范化,6.5.2函数依赖函数依赖的概念定义:设有关系模式R(A1,A2,Ak),X和Y都是A1,A2,Ak的子集,如果是R的任一具体关系(元组)。如果R的所有关系r都存在着:对于x的每一个具体值,都有Y的唯一的具体值与之对应,则称X函数地决定Y,或Y函数依赖于X。记为:XY函数依赖与属性关系在前面所介绍的属性间三种联系中,并不是所有的联系都存在函数依赖。设有关系模式R,属性集为A,X和Y是A的子集,X和Y之间有如下情况:如果X与Y之间是“l:l”的联系,则存在函数依赖:XY,YX这种依赖称为互为函数依赖。如果X与Y之间是“N:1”的联系,则存在函数依赖:XY如果反过来就不一定存在函数依赖,因为同样的“工资”可以对应多个职工。如果X与Y之间是“M:N”的联系,那就不存在函数依赖关系。,6.5.3规范关系第一范式(1NF)定义:如果一个关系模式R的每个具体关系r的每个属性值都是不可分的最小数据单位,则称R为第一范式,简称1NF(FirstNormalForm),r为1NF关系。第二范式(2NF)定义:如果满足第一范式的关系模式R,它的所有属性都完全函数依赖于主关键字,则称R为第二范式,记为2NF。第三范式(3NF)定义:如果关系模式R满足2NF,并且它的任何一个属性都不传递依赖于任一主关键字,则称R是第三范式,记为3NF。,6.5关系模式规范化,本讲内容,6.1信息系统的数据管理6.2文件环境下的数据组织6.3数据库环境下的数据组织6.4数据模型6.5关系模式规范化6.6数据视图概念6.7数据库设计6.8面向对象及其他高级数据库系统6.9数据仓库与数据挖掘,6.6数据视图概念,6.4.3数据模型用户看到的数据到计算机内的物理数据之间经过了两次转换。第一次是系统为了实现数据共享、减少冗余,把所有用户视图的数据进行综合,抽象成一个统一视图全局数据。第二次是系统为了提高存取效率,把全局视图的数据按照物理组织的最优方式来存放。图6.8给出了数据库的分层结构。一般来说,数据库系统的基本结构大体上是一致的,可以用三级模式和两级映像来概括描述。,6.6数据视图概念,6.6数据视图概念,6.6.1三级模式外模式(ExternalSchema)外模式对应于用户级数据库,又称子模式。它用子模式定义语言来定义,而且是用户与数据库的接口,因此,一个子模式中包含了相应用户的记录类型的描述以及与概念模式中相应记录的映像定义。这里,每个用户都必须使用一个子模式,但多个用户也可以使用同一个子模式。概念模式(ConceptualSchema)概念模式对应于概念级数据库,又称模式。它用模式定义语言定义。模式的主体是数据库的数据模型,它是所有用户视图数据库的一个最小并集。内模式(InternalSchema)内模式对应于物理级数据库,又称存储模式,用物理模式描述语言描述。物理级数据库包括数据库的全部存储数据,是用户操作的对象。从系统程序员的角度看,这些数据是按一定的文件方式组织起来的。,6.6数据视图概念,6.6.2两级映象在每两级模式之间存在着从一种模式结构到另一种模式结构的映像,这种功能是由DBMS支持的。从外模式到概念模式的映像的作用在于:当整个系统要求改变模式时,只需改变映像关系而保持外模式不变。这种用户级数据独立于全局的逻辑数据的特性称为逻辑数据独立性。从概念模式到内模式的映像作用在于:当物理数据库改变时,只需修改这种映像关系而保持概念模式和外模式不变。这种全局的逻辑数据独立于物理数据的特性叫物理数据独立性。,本讲内容,6.1信息系统的数据管理6.2文件环境下的数据组织6.3数据库环境下的数据组织6.4数据模型6.5关系模式规范化6.6数据视图概念6.7数据库设计6.8面向对象及其他高级数据库系统6.9数据仓库与数据挖掘,6.7数据库设计,6.7.1数据库设计概述数据库设计的含义数据库设计在管理信息系统的开发中占有非常重要的位置,它涉及多学科的综合性技术。数据库设计的好坏将直接影响整个系统的效率。同时数据库设计者的知识和经验还是非常重要的。规范设计法中主要有新奥尔良(NewOrleans)的四个阶段方法,它将数据库设计分为:需求分析(分析用户要求)、概念设计(信息分析和定义)、逻辑设计(设计实现)和物理设计(物理数据库设计)。后来S.B.Yao等人又将数据库设计分为五个步骤,以及L.R.Palmer等人认为数据库设计应该为一步接一步的过程,并采用一些辅助手段实现每一过程。,6.7数据库设计,6.7.2数据库设计步骤,数据库设计主要包括如下步骤:需求分析;概念结构设计;逻辑结构设计;物理结构设计。数据库实施阶段的设计步骤为:应用程序设计与调试;系统性能测试与试运行。数据库使用阶段的设计步骤包括:数据库系统运行;数据库系统维护;数据库系统重构。本节主要讨论数据库设计阶段的四个步骤,6.7数据库设计,6.7.2数据库设计步骤需求分析需求分析的任务是详细调查现实世界要处理的对象,充分了解原系统工作概况,明确用户的各种需求,以确定新系统的功能。概念结构设计概念结构设计的任务是对用户的需求进行综合、归纳和抽象,产生一个独立于DBMS的概念数据模型。逻辑结构设计逻辑结构设计的任务是将概念模型(如E-R模型)转换为某个DBMS支持的数据模型,然后再对转换后的模型进行定义描述,并对其进行优化,最终产生一个优化的数据库模式。物理结构设计物理结构设计是为逻辑结构选取最适合应用环境的物理结构,包括存储结构和存取方法。,6.7数据库设计,6.7.3应用实例,本讲内容,6.1信息系统的数据管理6.2文件环境下的数据组织6.3数据库环境下的数据组织6.4数据模型6.5关系模式规范化6.6数据视图概念6.7数据库设计6.8面向对象及其他高级数据库系统6.9数据仓库与数据挖掘,6.8面向对象及其他高级数据库系统,6.8.1面向对象数据库系统(OODBS)OODBS的概念对象标识,面向对象的数据库基于面向对象的程序设计范例,其每个实体被看作一个对象。封装,涉及个对象的数据和代码封装在一个单元中。每一对象是其状态和行为的封装。数据库里除了存放数据还有行为。类和类层次,共享公共特性集的对象可以归入一个对象类。我们从所有具有相同属性和方法的对象抽象出类。继承,一个类可以继承类层次中其直接或间接祖先的所有属性和方法。OODBS的实现方式纯种OODBS技术、传统数据库的改进。OODBS存在的问题标准化问题、数据库语言缺乏形式化基础,6.8.2其他一些高级数据库技术对象-关系数据库是以对象-关系数据模型为基础,通过提供处理复杂对象的丰富数据类型和对象定位,扩充关系模型。空间数据库是涉及空间信息的数据库,它主要包括地理数据库、医疗和卫星图像数据库。时间数据库和时间序列数据库时间数据库和时间序列数据库都存放与时间有关的数据。时间数据库通常存放包含时间相关属性的数据。文本数据库和多媒体数据库文本数据库包含对象文字描述的数据库。,6.8面向对象及其他高级数据库系统,本讲内容,6.1信息系统的数据管理6.2文件环境下
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 海平面上升与特克斯岛海岸防护-洞察及研究
- 灿甘草提取物联合靶向血管内皮保护的抗动脉粥样硬化治疗研究-洞察及研究
- 情感分析在旅游口碑中的应用-洞察及研究
- 2025年麻醉科复杂手术麻醉方案设计实操考试卷答案及解析
- 2025年神经内科神经疾病诊断治疗方案设计评估答案及解析
- 土石方工程安全管理方案详解
- 医院护士岗位面试题库及答题技巧
- 小学秋季开学活动实施方案
- 银行员工业务操作风险防范指南
- 全地形履带轮椅设计方案解析
- 坚持以人民为中心 课件
- 物业服务提升方案模板
- 不同茶叶的冲泡方法
- 人教版高中地理必修第一册第一章宇宙中的地球第一节地球的宇宙环境练习含答案
- 信息科技风险安全
- 中建幕墙工程安全专项施工方案
- 诊所中药饮片清单汇编
- 红木文化智慧树知到答案2024年广西大学
- 招标代理机构遴选投标方案(技术标)
- 吊车施工专项方案
- 肺栓塞患者护理查房课件
评论
0/150
提交评论