《管理信息系统》管理类课件4_第1页
《管理信息系统》管理类课件4_第2页
《管理信息系统》管理类课件4_第3页
《管理信息系统》管理类课件4_第4页
《管理信息系统》管理类课件4_第5页
已阅读5页,还剩30页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

【本章内容】4.1数据处理基础4.2数据库技术4.3数据仓库和数据挖掘【本章重点】1数据资源管理基本概念;2数据管理技术发展阶段的特点;3数据库,数据仓库,数据挖掘方面的基本知识,4数据库技术与数据资源管理,4.1.1计算机中信息的表示方法4.1.2数据描述及层次组织4.1.3数据管理技术的发展过程,4.1数据处理基础,概念,信息:数值、文字、语音、图形和图像。二进制:信息必须进行二进制的数字化编码,才能传送、存储和处理。优点:物理上容易实现,可靠性强,运算简单,通用性强。,4.1.1计算机中信息的表示方法,4.1.1计算机中信息的表示方法,1、数值型数据的表示2、字符型数据的表示ASCII码(AmericanStandardCodeforInformationInterchange)汉字编码音频和视频信息在计算机中的表示,(1)R进制数与十进制数的相互转换,1).R(R=2,8,16)进制数转换为十进制数,方法:,按Rn权值展开求和,2).十进制数转换为R(2,8,16)进制数,方法:,整数除以R倒取余数小数乘以R正取整数,4.1.1计算机中信息的表示方法,例,不同数制间的转换(续),(101.01)2=(?)10,(101.01)2=12202112002-112-2=22+20+2-2=4+1+0.25=(5.25)10,?,5.25,按权展开法,(101101.101)2=252322202-12-3=328410.50.125=(45.625)10,注!记住权值,例,不同数制间的转换(续),(49.58)10=(?)2,?,110001.,方法:整数除以2倒取余数小数乘以正取整数,100,例,不同数制间的转换(续),所有的十进制整数都能准确地转换成二进制整数,十进制小数不一定能精确地转换成二进制小数,数据描述是数据处理中的一个重要环节,从事物的特性到计算机中的具体表示,实际上经历了三个领域:现实世界、信息世界和机器世界。,组织(事物及其联系)实体及其联系数据库(概念模型)事物类(总体)实体集文件事物(对象、个体)实体记录特征(性质)属性数据项,1、数据描述,4.1.2数据描述及层次组织,客观事物类:事物相关性质集合,人,实体实体集合及实体联系相关属性集合,加工、转换,数文件据记录库相关数据项集合,加工转换,存储二进制数据集合结构,计算机世界,DBMS,数据世界,DBMS的数据模型,信息世界,认识选择描述,现实世界,E-R模型,信息的转换,4.1.2数据描述及层次组织,2、数据描述的主要工具E-R图,实体及其联系,概念模型,ER图,4.1.2数据描述及层次组织,现实世界中,事物是相互联系的。这种联系必然在信息世界中体现出来,即实体是相互关联的。两个不同实体集的实体间的联系,它有以下三种情形:一对一联系,记为1:1。例如工厂与厂长之间,科研任务与课题组长之间都是1:1联系。一对多联系,记为1:N。例如一个学校有若干学生,而每个学生都在一个学校学习,学校与学生之间是一对多的联系。多对多联系,记为M:N。例如课程与学生之间,一个学生可选多门课程,而每一门课程可有多个学生选修,课程与学生之间是多对多的联系。,实体间的联系:,4.1.2数据描述及层次组织,实体:属性:联系:一对一联系一对多联系多对多联系,实体,属性,联系,线段,E-R图描述现实世界的概念模型,图书,作者,写作,出版社,类别,页数,ISBN,书名,姓名,出生地,身份证号,定稿时间,价格,包含实体“图书”和“作者”的ER图,E-R图绘制,1、简单应用(20世纪50年代以前)基本特征:无数据管理及完全分散的手工方式。应用背景:硬件无外存或只有磁带外存,输入输出设备简单。软件无操作系统,无文件管理系统,无管理数据的软件。主要特点:数据是程序的组成部分,数据不独立。修改数据必须修改程序。处理时,数据随程序一道送入内存,用完后全部撤出计算机,不能保留。数据大量重复,不能共享。,4.1.3数据管理技术的发展过程,、文件系统(50年代后期到60年代中期),基本特征:具有面向应用的数据管理功能,工作方式是仍然是分散、非手工的。主要特点:数据管理方面,实现了数据对程序的一定的独立性,数据不再是程序的组成部分,修改数据不必修改程序,数据有结构,被组织到文件内,存储在磁带、磁盘上,可以反复使用和保存。文件逻辑结构向存储结构的转换由软件系统自动完成,系统开发和维护工作得到减轻。,4.1.3数据管理技术的发展过程,、数据库系统(60年代后期开始),应用背景:硬件大容量磁盘已经出现、硬件价格大幅下降软件联机实时处理业务增多、面向全组织的复杂数据结构、数据冗余度小,易于扩充、数据与程序独立、统一的数据控制功能。特点:面向全组织的复杂数据结构。数据冗余度小,易于扩充。数据与程序独立。统一的数据控制功能。,4.1.3数据管理技术的发展过程,4.2.1数据库概述4.2.2数据库的种类4.2.3数据库设计4.4.4数据库系统的管理需求,4.2数据库技术,数据库管理系统DBMS(databasemanagementsystem)是指用户与操作系统之的一层数据管理软件,它为用户应程序提供访问数据库的方法,包括数据库的建立、查询、更新及各种数据控制。数据库管理系统功能包括:定义数据库的功能。管理数据库的功能。维护数据库的功能。数据通信的功能。,1、数据库管理系统(DBMS),4.2.1数据库概述,学校图书馆的运作方式?,书号,书名写在小纸片上,交给图书管理员。(数据库管理系统的作用)存在那个磁盘,哪个磁道,扇区?(数据库管理系统-Access),数据库系统DBS(databasesystem)是实现有组织、动态在存储尤其是关联数据、方便多用户访问的计算机软件、硬件和数据资源组成的系统,即它是采用了数据库技术的计算机系统。数据库系统构成:硬件软件(主要包括:操作系统、数据库管理系统(DBMS)、应用软件包和应用程序)人员(主要包括:系统分析员、系统程序员应用程序员、数据库管理员(DBA),2数据库系统(DBS),4.2.1数据库概述,数据模型是从计算机系统的观点对数据建模,主要用于数据库管理系统的实现,它主要包括层次模型、关系模型、网状模型和面向对象模型等。DB的分类是依据数据模型进行的。(1)层次模型(层次结构):用树型结构表示。,4.2.2数据库的种类,(2)网状模型:用有向图结构表示。(3)关系模型:用二维表结构表示。,4.2.2数据库的种类,数据库设计包含两方面内容,一是数据模型与数据库结构的设计,二是应用程序的设计。1.数据库设计步骤对现实世界进行需求分析建立信息世界中E-R(概念)模型从E-R图导出计算机世界的关系数据模型2.设计案例:某学院教学管理数据库模型的设计,4.2.3数据库设计,1数据管理2数据规划和建模方法3数据库技术、管理和用户,4.2.4数据库系统的管理需求,4.3.1数据库技术新发展4.3.2数据仓库4.3.3数据挖掘,4.3数据仓库和数据挖掘,1面向对象的数据库技术2超多媒体数据库系统3分布式数据库系统4数据仓库,4.3.1数据库技术新发展,传统的数据库技术是以单一的数据资源为中心,同时进行从事务处理,批处理到决策分析的各类处理;数据库主要是为自动化,精简工作任务和高速数据采集服务的。它的运行是事务驱动,面向应用的,数据库的根本任务是完成数据操作,即及时安全地将当前事务所产生的记录保存下来。操作型处理分析型处理随着时间的推移,人们开始对数据库中的原始数据进行再加工,形成一个综合的、面向分析的环境以支持决策的产生;数据库由操作性环境发展成一种新的体系化环境,数据仓库则是体系化环境的核心。数据仓库即为面向主题的、集成的、稳定的、用以支持经营管理中的决策制定过程的不同时间的数据集合。,4.3.2数据仓库,1数据挖掘的定义,数据挖掘,又称数据库中的知识发现,是指从大型数据库或数据仓库中提取有潜在应用价值的信息或模式。为达到这样的商业目标,数据挖掘可以帮助用户处理大量的数据,以期在数据仓库中得到“意外”的发现,这些发现是潜在带来更高利润的顾客,富有和战略性竞争性,对企业的未来有方向性的指引。,4.3.3数据挖掘,2数据挖掘的目标和基本特征横向关联是挖掘表面看似独立的事件间的相互关系,例如“90%的顾客在一次购买活动中购买商品A的同时购买商品B”之类的知识。比如经典的“尿布和啤酒”的故事,就是利用这种方法,发现二者之间有很高的相关系数,引起重视,然后深入分析后才找出内在原因的。,全球最大的零售商沃尔玛(Walmart)通过对顾客购物的数据分析后发现,很多周末购买尿布的顾客也同时购买啤酒。经过深入研究后发现,美国家庭买尿布的多是爸爸。爸爸们下班后要到超市买尿布,同时要“顺手牵羊”带走啤酒,好在周末看棒球赛的同时过把酒瘾。后来沃尔玛就把尿布和啤酒摆放得很近,从而双双促进了尿布和啤酒的销量。这个故事被公认是商业领域数据挖掘的诞生,4.3.3数据挖掘,次序关联-这种分析的侧重点在于分析事件的前后序列关系,发现诸如“在购买A商品后,一段时间里顾客会接着购买商品B,而后购买商品C”的知识,形成一个客户行为的“ABC”模式。可以想见的是,一个顾客在买了电脑之后,就很有可能购买打印机、扫描仪等配件。不过,要是通过数据挖掘找出“刮胡刀抽水马桶钻石戒指”这样的模式,估计企业客户服务部门就要忙乎一阵搞明白其中潜在的联系了。,4.3.3数据挖掘,分类分类分析就是通过分析样本客户数据库中的数据,为每个类别作出准确的描述或建立分析模型或挖掘出分类规则,然后用这个分类规则对其它客户的记录进行分类。比如,信用卡公司根据顾客的信用记录,把持卡人分成不同等级,并把等级标记赋与数据库中的每个记录。对于每一等级,找出它们共同点,比如:“年收入在10万元以上,年龄在4050岁之间的外企白领”总体上信用记录最高。有了这样的挖掘结果,客户服务部门就知道一个新的客户的潜在价值,在客户服务投入上就心中有底。聚类这是分类的逆向方法。聚类把没有分类的记录,在不知道应分成几类的情况下,按照数据内在的差异性大小,合理地划分成几类,并确定每个记录所属类别。它采用的分类规刚是按统计学的聚类分析方法决定的。比如,面对数据库中“消费额”、“购买频率”、“收入水平”等多个评价指标,没有办法按照一个指标去分类,就可以通过聚类按照数据间的自然联系把分散的记录“聚”成几“堆”,然后再对每堆进行深入分析。,4.3.3数据挖掘,某些具有特定的应用问题和应用背景的领域,是最能体现数据挖掘作用的应用领域。对这些应用领域中应用问题的了解,将有助于对数据挖掘技术的了解。(1)金融业对帐户进行信用等级评估股票交易规律分析信用卡使用模式分析金融市场的分析和预测(2)保险业保险费率的确定:可以从大量客户投保数据中分析并取得不同条件、不同人员、不同险种、不同时间与年龄的保险费率,使保险业主能获得合理的利润。险种关联分析:可以分析客户在购买了某种保险后是否同时还会购买另一种保险。认购险种的预测:可以通过数据挖掘预测新险种的客户群以及新险种的前

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论