《管理信息系统》2版-第7章_第1页
《管理信息系统》2版-第7章_第2页
《管理信息系统》2版-第7章_第3页
《管理信息系统》2版-第7章_第4页
《管理信息系统》2版-第7章_第5页
已阅读5页,还剩34页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第7章数据库与数据仓库学习目的理解信息系统与数据管理;掌握数据库环境下的数据组织;掌握数据模型、关系模式标准化、数据视图概念和数据库设计;了解数据仓库与数据挖掘。本讲内容信息系统的数据管理数据库环境下的数据组织数据模型关系模式标准化数据视图概念数据库设计数据仓库与数据挖掘案例阅读

信息系统的数据管理数据管理概念美国学者詹姆斯•马丁提出数据环境的概念,认为只要企业的性质和目标不变,尽管企业的数据加工处理过程是多变,但数据是稳定的,企业任何业务活动都离不开对数据的存取。MIS是有目的地对企业生产经营活动产生的原始数据进行收集、组织、加工处理,直至生成信息的系统。管理人员那么利用信息控制企业各项经营活动并作出决策。组织数据的逻辑存储结构,将逻辑存储结构转换成计算机物理存储结构,以及根据需要准确、迅速地存取数据等,这些问题都是数据管理技术的主要研究内容。

信息系统的数据管理数据管理概念随着计算机技术的产生和开展,企业的数据管理技术经历了人工管理,文件管理技术和数据库管理技术三个阶段。。目前数据库是企业信息系统组织、管理数据的最常用技术。

信息系统的数据管理MIS的数据管理要求需要有效的数据库技术需要稳定的数据根底需要良好的数据环境本讲内容信息系统的数据管理数据库环境下的数据组织数据模型关系模式标准化数据视图概念数据库设计数据仓库与数据挖掘案例阅读

数据库环境下的数据组织数据库定义数据库的定义长期储存在计算机内的、有组织的、可共享的数据集合。数据库中的数据按一定的数据模型组织、描述和储存,具有较小的冗余度、较高的数据独立性和易扩展性,并可为各种用户共享。数据库的特点数据结构化、数据共享性、数据独立性

数据库环境下的数据组织数据库管理系统数据库管理系统数据库管理系统〔DBMS〕是位于用户与操作系统之间的一层数据管理软件。DBMS的分类按数据模型、按所支持的用户数、按允许数据库可以分布的站点数、按用途。数据库管理系统的组成数据定义语言及其翻译程序;数据操纵〔或查询〕语言及其编译〔或解释〕程序;数据库管理例行程序。

数据库环境下的数据组织数据库系统结构硬件CPU、内存、磁盘、磁带以及其它外部设备。软件操作系统〔OS〕、数据库管理系统〔DBMS〕、应用于开发应用程序的具有数据库接口的高级语言及其编译系统、以DBMS为核心的应用开发工具、为某应用环境开发的数据库应用系统。人员数据库管理员〔DataBaseAdministrator,DBA〕、系统分析员和数据库设计人员、应用程序员和最终用户。本讲内容信息系统的数据管理数据库环境下的数据组织数据模型关系模式标准化数据视图概念数据库设计数据仓库与数据挖掘案例阅读

数据模型信息描述

数据模型

信息描述现实世界是指存在于人们头脑之外的客观世界,事物及其相互间联系就处在这个世界之中。

信息世界信息是现实世界中的客观事物在人们头脑中的反映。人的头脑对于这些事物经过认识、选择、描述之后进入信息世界。它包括:实体、属性、域、实体型、实体集、码、联系等概念。数据世界数据世界中研究的对象是数据,数据是对信息的符号化表示。计算机世界数据世界中的数据经过编码、加工后就进入计算机世界。

数据模型实体-联系模型〔E-R〕根本E-R图形E-R模型有三个根本元素,即实体、实体之间的联系和属性,它们分别用矩形框、棱型框和椭园形框表示,并且将对应的名字填入框内以作标识,用无向边把实体与其属性连接起来,将参与联系的实体用线段连接,并标上联系的数量,见图所示的学生选修课程的E-R图。构造E-R模型构造E-R模型实质上就是根据现实世界客观存在的“事物”及其关系所给出的语义要求,组合根本E-R图形为E-R模型。它包括如下步骤:标识实体集;标识联系集;标识属性值集;标识关键字。

数据模型数据模型在数据库系统中,除了描述记录内部的联系外,还必须考虑记录之间,即文件之间的联系。数据模型就是反映这种联系的结构,它是数据库系统的一个重要特征。在数据库系统中,根本的数据模型有三种:层次模型、网络模型和关系模型。本讲内容信息系统的数据管理数据库环境下的数据组织数据模型关系模式标准化数据视图概念数据库设计数据仓库与数据挖掘案例阅读关系模式标准化问题的提出一个企业销售记录的关系模式PEQ〔订单代码、订购日期、客户、发货日期、产品、单价、数量、雇员〕,如表7.8所示。如果关系模式设计得不好会带来以下问题:关系模式标准化问题的提出冗余度高如果“雇员”与客户的联系是固定的,而当该客户每购置一种产品时,“雇员”就重复存放一次。修改问题如果在PEQ中,某客户的联系雇员变动时,就需要对所涉及的雇员进行修改,这不仅增加了更新代价,而且有可能造成数据的不一致性。删除问题如果某客户暂时不需要任何产品,那么删除时就丧失了其所联系雇员的一些信息,而该雇员可能在以后可能再次用到。插入问题在这个关系中,关键字由“订单代码、客户、产品”组成。如果新增一个客户的有关数据,而所购置产品未定,那么这个客户的数据无法插入,因为缺少关键字其他数据。关系模式标准化函数依赖函数依赖的概念定义:设有关系模式R〔A1,A2,……,Ak〕,X和Y都是{A1,A2,…,Ak}的子集,如果是R的任一具体关系〔元组〕。如果R的所有关系r都存在着:对于x的每一个具体值,都有Y的唯一的具体值与之对应,那么称X函数地决定Y,或Y函数依赖于X。记为:X→Y函数依赖与属性关系在前面所介绍的属性间三种联系中,并不是所有的联系都存在函数依赖。设有关系模式R,属性集为A,X和Y是A的子集,X和Y之间有如下情况:〔1〕如果X与Y之间是“l:l”的联系,那么存在函数依赖:X→Y,Y→X这种依赖称为互为函数依赖。〔2〕如果X与Y之间是“N:1”的联系,那么存在函数依赖:X→Y如果反过来就不一定存在函数依赖,因为同样的“工资”可以对应多个职工。〔3〕如果X与Y之间是“M:N”的联系,那就不存在函数依赖关系。标准关系第一范式〔1NF〕定义:如果一个关系模式R的每个具体关系r的每个属性值都是不可分的最小数据单位,那么称R为第一范式,简称1NF〔FirstNormalForm〕,r为1NF关系。第二范式〔2NF〕定义:如果满足第一范式的关系模式R,它的所有属性都完全函数依赖于主关键字,那么称R为第二范式,记为2NF。第三范式〔3NF〕定义:如果关系模式R满足2NF,并且它的任何一个属性都不传递依赖于任一主关键字,那么称R是第三范式,记为3NF。关系模式标准化本讲内容信息系统的数据管理数据库环境下的数据组织数据模型关系模式标准化数据视图概念数据库设计数据仓库与数据挖掘案例阅读数据视图概念用户看到的数据到计算机内的物理数据之间经过了两次转换。第一次是系统为了实现数据共享、减少冗余,把所有用户视图的数据进行综合,抽象成一个统一视图――全局数据。第二次是系统为了提高存取效率,把全局视图的数据按照物理组织的最优方式来存放。图给出了数据库的分层结构。一般来说,数据库系统的根本结构大体上是一致的,可以用三级模式和两级映像来概括描述。数据视图概念数据视图概念三级模式外模式〔ExternalSchema〕外模式对应于用户级数据库,又称子模式。它用子模式定义语言来定义,而且是用户与数据库的接口,因此,一个子模式中包含了相应用户的记录类型的描述以及与概念模式中相应记录的映像定义。这里,每个用户都必须使用一个子模式,但多个用户也可以使用同一个子模式。概念模式〔ConceptualSchema〕概念模式对应于概念级数据库,又称模式。它用模式定义语言定义。模式的主体是数据库的数据模型,它是所有用户视图数据库的一个最小并集。内模式〔InternalSchema〕内模式对应于物理级数据库,又称存储模式,用物理模式描述语言描述。物理级数据库包括数据库的全部存储数据,是用户操作的对象。从系统程序员的角度看,这些数据是按一定的文件方式组织起来的。数据视图概念两级映象在每两级模式之间存在着从一种模式结构到另一种模式结构的映像,这种功能是由DBMS支持的。从外模式到概念模式的映像的作用在于:当整个系统要求改变模式时,只需改变映像关系而保持外模式不变。这种用户级数据独立于全局的逻辑数据的特性称为逻辑数据独立性。从概念模式到内模式的映像作用在于:当物理数据库改变时,只需修改这种映像关系而保持概念模式和外模式不变。这种全局的逻辑数据独立于物理数据的特性叫物理数据独立性。本讲内容信息系统的数据管理数据库环境下的数据组织数据模型关系模式标准化数据视图概念数据库设计数据仓库与数据挖掘案例阅读数据库设计数据库设计概述数据库设计的含义数据库设计在管理信息系统的开发中占有非常重要的位置,它涉及多学科的综合性技术。数据库设计的好坏将直接影响整个系统的效率。同时数据库设计者的知识和经验还是非常重要的。标准设计法中主要有新奥尔良〔NewOrleans〕的四个阶段方法,它将数据库设计分为:需求分析〔分析用户要求〕、概念设计〔信息分析和定义〕、逻辑设计〔设计实现〕和物理设计〔物理数据库设计〕。后来等人又将数据库设计分为五个步骤,以及等人认为数据库设计应该为一步接一步的过程,并采用一些辅助手段实现每一过程。数据库设计数据库设计步骤数据库设计主要包括如下步骤:需求分析;概念结构设计;逻辑结构设计;物理结构设计。数据库实施阶段的设计步骤为:应用程序设计与调试;系统性能测试与试运行。数据库使用阶段的设计步骤包括:数据库系统运行;数据库系统维护;数据库系统重构。本节主要讨论数据库设计阶段的四个步骤数据库设计数据库设计步骤需求分析需求分析的任务是详细调查现实世界要处理的对象,充分了解原系统工作概况,明确用户的各种需求,以确定新系统的功能。概念结构设计概念结构设计的任务是对用户的需求进行综合、归纳和抽象,产生一个独立于DBMS的概念数据模型。逻辑结构设计逻辑结构设计的任务是将概念模型〔如E-R模型〕转换为某个DBMS支持的数据模型,然后再对转换后的模型进行定义描述,并对其进行优化,最终产生一个优化的数据库模式。物理结构设计物理结构设计是为逻辑结构选取最适合应用环境的物理结构,包括存储结构和存取方法。数据库设计应用实例下面结合一家公司的销售管理业务来说明E-R模型的设计过程,见P164。本讲内容信息系统的数据管理数据库环境下的数据组织数据模型关系模式标准化数据视图概念数据库设计数据仓库与数据挖掘案例阅读数据仓库与数据挖掘数据仓库定义数据仓库是一个面向主题的、集成的、随时间变化的、相对稳定的数据集合,用于支持管理决策。体系结构包含四个层次的体系结构:数据源、数据存储与管理、OLAP效劳器、前端工具数据仓库与数据挖掘OLAP和数据挖掘OLAP技术根本概念Codd认为用户决策分析需要对关系数据库进行大量计算才能得到结果,而简单查询不能满足决策者需求。也就是说,传统的OLTP和SQL对大数据库的简单查询不能满足用户分析的要求。因此提出多维数据库和多维分析概念,即OLAP。它有两个特点:一是在线性〔On-Line〕,二是采用多维数据库进行多维分析〔Multi-Analysis〕。数据仓库与数据挖掘OLAP和数据挖掘数据挖掘概念数据挖掘〔DataMining〕就是从大量的、不完全的、有噪声的、模糊的、随机的实际应用数据中,提取隐含在其中的、人们事先不知道的、但又是潜在有用的信息和知识的过程。数据挖掘和数据仓库大局部情况下,数据挖掘都要先把数据从数据仓库或数据集市中拿到数据挖掘

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论