下载本文档
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、经济与管理实验教学中心,第八章 支持物流决策的模型 及信息分析技术,利用物流管理信息系统解决了物流数据处理的基本问题,进一步利用其数据与信息进行分析、支持物流企业领导决策是物流信息系统进一步发展的必然要求。 本章介绍决策以及决策支持的相关概念,以及物流决策的一般方法、物流决策模型和预测技术,然后介绍决策支持系统、物流信息分析技术和物流系统模拟。其目的是使读者掌握基于决策的支持方法。,经济与管理实验教学中心,第一节 概 述,一、决策支持与模型 自20世纪70年代DSS的概念提出以来,随着决策理论、信息技术等相关技术的发展,决策支持系统的研究与应用水平不断提高,尤其是人工智能、Internet、D
2、W、DM、OLAP等的发展,为DSS提供了强大的技术支持,DSS的应用取得了显著的成效。,经济与管理实验教学中心,(一)典型决策支持系统的组成 一个典型的决策支持系统(即“三库”系统)主要由数据管理子系统、模型库管理子系统、方法库管理子系统、用户界面子系统和用户组成,,经济与管理实验教学中心,数据管理子系统由数据库(DB)和数据管理库系统(DBMS)组成,完成对数据仓库的维护、使用等功能。 数据仓库的数据通常从内部和外部数据源中抽取。,经济与管理实验教学中心,模型库管理子系统由模型库(MB:Model Base)和模型库管理系统(MBMS:Model Base Management Syste
3、ms)组成。模型库中存储了包含描述决策问题的相对独立的子模型。,经济与管理实验教学中心,方法库管理子系统由方法库(M*B:Method Base)和方法库管理系统(M*BMS:Method Base Management Systems)组成。 方法库存储了解决决策模型的各种方法,例如各种寻优方法等。方法库管理系统则是对方法库中方法进行管理(包括描述、增加、删除、修改、使用等),为决策模型求解的需要提供方法的支持。,经济与管理实验教学中心,用户界面子系统(User Interface)是用户与DSS决策支持系统之间交流的界面,用户和系统进行交互式对话,用户向系统完成问题的描述,而系统将处理的结
4、果报告给用户。 DSS的用户主要是指企业各层次的管理者和分析人员。,经济与管理实验教学中心,许多非结构化和半结构化的问题非常复杂,以至于除了通常的DSS能力外,它们还需要特别的专业知识。因此DSS也由“三库”结构,发展为“四库”结构(增加知识库,即IDSS)、“五库”结构(增加知识库、数据仓库)。,经济与管理实验教学中心,(二) 模型,所谓模型就是对问题的要素以及要素之间关系的一种抽象表示, 例如简单的二元一次方程组就可以用来描述具有两个要素,且要素之间是线性关系的某问题。,经济与管理实验教学中心,模型集(如财务风险分析模型集)都有特定的职能,灵敏度分析模型是其中应用最为广泛的模型之一。它通过
5、重复的“如果则”的方法来确定一个或多个要素的变化对其他要素(如支出额)的影响或影响程度。 为了在标准变化的情况下更好地预测支出情况“如则”问题,从已知条件或假设条件出发,允许用户根据标准的不同检测结果,“如果把售价提高5或把广告预算增加100,000美元将会怎样呢?”“如果保持价格和广告预算不变则又如何呢?”后向型灵敏度分析软件应用于目标搜索:如果想在明年售出一百万个产品单位,那么产品的价格应降多少?,经济与管理实验教学中心,(三)管理信息系统和DSS的决策支持能力的比较,由于高层管理具有非结构化和流动性因素的特点,管理信息系统对高层的决策支持能力较弱。如高级管理人员对公司的关键成功因素法产生
6、分歧或者公司面临一场危机而急需战略变更,而原有的关键成功因素法已不适宜进行决策。在现存系统的基础上整合决策支持系统,即系统的创建者确实知道决策支持系统的信息需求,但想利用现有的管理信息系统来满足这些信息需求也许是不可能的,这是因为管理信息系统早已用不同方法定义了重要的数据。,经济与管理实验教学中心,管理信息系统集中于结构化的信息流,而决策支持系统强调的是变化、灵活和快速反应。决策支持系统较少涉及用户联结结构化信息流和相应的较强调模式、假设、随机访问、列示图表的需求。,经济与管理实验教学中心,决策支持系统和管理信息系统都依赖于专业化的分析设计,然而不同之处在于管理信息系统通常遵循传统系统开发的方
7、法论(如:生命周期法),在设计前及其整个生命周期中确定信息需求,而决策支持系统则是自觉地反复地并且不会被中断确定用户需求。,经济与管理实验教学中心,二 决策支持的方式,(一)两种基本的决策支持方式 当今存在两种基本的决策支持系统:模型驱动型和数据驱动型 早期的决策支持系统从公司数据库抽取数据、建立模型,是典型的模型驱动型的决策支持系统。近来随着数据处理和数据库技术的发展决策支持系统正向数据驱动型的系统发展。,经济与管理实验教学中心,1模型驱动型决策支持 模型驱动型决策支持系统是发现问题的影响要素和内在关联,利用模型和数据,建立问题的模型,然后求解模型,以达到找到决策问题的方法,或者按照构造的模
8、型指导行动。,经济与管理实验教学中心,2数据驱动型决策支持 第二种决策支持系统是数据驱动型的。这种系统的分析来自主要组织系统的大量数据。它允许用户从原来隐藏的大量信息中选取有用的信息。,经济与管理实验教学中心,例如可以从DW里得到,然后利用在线分析程序和DM技术可用来分析这些数据,回答用户关心的问题,如“编号为403的产品在2002年5月装运出多少?”“以季度为单位比较编号为403的相关产品的实际销量与计划销量”。 根据决策支持层度和难度的分析,可知数据驱动型的DSS比模型驱动型的DSS应用更广。,经济与管理实验教学中心,(二)以数据驱动型的决策支持系统的元素 数据驱动型的决策支持系统包括一个
9、应用于查询和分析的数据单元、一定模式的软件、数据分析技术和用户界面,如图81所示。,经济与管理实验教学中心,1数据单元 决策支持系统的数据单元是当前和历史资料的汇总。它可能是存处于一台个人电脑上的公司数据资料的一部分,它可能包括一部分外部信息。 另外,决策支持系统也可能连接的是一个被组织传输协议系统不断更新的超大数据库。决策支持系统中的数据单元大多是产品数据单元的复本,以便使用起来不会影响其他系统的运行。,经济与管理实验教学中心,2分析软件系统 分析软件系统包含用于数据分析的软件工具,它包括各种在线分析程序、DM工具等分析模型,并且这些工具很容易为用户所用。,经济与管理实验教学中心,3用户界面
10、 用户界面具有简单易用的画面、灵活的用户支持界面支持用户和系统间的对话,使用户可以容易地使用这些软件工具。,经济与管理实验教学中心,三、决策支持系统应用实例 决策支持系统已经应用许多方面,表81给出了部分应用实例。沃尔马采用的是数据驱动型的决策支持系统,加拿大卡普国际系统(Carp Systems International of KanataOntario)销售的高级策划系统(APS)能使用原有的MRP中的数据并使其具备决策支持功能。,经济与管理实验教学中心,经济与管理实验教学中心,第二节 物流的决策模型与预测模型,一、物流决策的种类 在第二章,通过对物流系统以及主要业务和业务流程的分析可知
11、,物流系统中除了数据处理和结构化决策外,还有大量的半结构化和非结构化决策。,经济与管理实验教学中心,运输中的决策主要包括选择较合理的运输方式和路线、具体物品的运输物流计划。 储存中的决策信息主要是物品出库规则、最低库存量、安全库存量、最高库存量、订货策略等。 物流加工中的决策主要有加工方式、加工周期、加工报价以及相关的配套决策。 配送中的决策主要是如何按用户的需求,在充分利用资源的前提下,确定备货规模、物资来源、配送方式、配送路线等。按配送商品的种类和数量分类:少品种(或单品种)、大批量配送;多种品种、少批量、多批次配送;成套配套配送。按配送时间及数量分类:定时配送;定量配送;定时定量定点配送
12、;即时配送。按配送的组织形式不同分类:集中配送;共同配送;分散配送。不同的配送有不同的决策要求。,经济与管理实验教学中心,二、物流决策的相关模型,每个模型有各自应用的假设或者前提,因此模型有各自适应的应用范围。而不同的决策问题有不同的特点和结构,不同的决策者有不同要求,有自己的决策偏好和决策风格,因此在采取模型驱动型的决策支持时,应该根据上述因素,选择合适的模型。,经济与管理实验教学中心,表82从决策问题、可采用的相关模型、模型使用的效果、模型使用的条件、模型使用需要的主要相关数据以及求解方法等方面,对物流中的部分决策可用的主要相关模型进行了描述。,经济与管理实验教学中心,经济与管理实验教学中
13、心,经济与管理实验教学中心,三、预测模型,决策离不开预测,预测能够在一定程度上反映客观事物发展的趋势,因此能为正确的决策提供一定信息。物流预测能为科学地编制物流经营计划和物流业务计划、调度提供参考。只有通过物流预测,才能了解宏观物流活动发展动态,分析对象发展趋势从而避免盲目地编制物流企业的作业计划和宏观计划,有利于提高现代物流经营管理水平,为正确地经营决策打下基础,有利于分析各种变化对物流企业的影响,有利于为物流企业的管理现代化创造良好的条件。,经济与管理实验教学中心,(一)预测的概念,1预测的概念 预测是一门掌握对象变化动态的科学,它是对对象变动趋势的预见、分析和判断,也是一种动态分析方法。
14、,经济与管理实验教学中心,2预测的基本步骤 (1)确定预测目标,包括预测对象、目的、对象范围; (2)搜集分析内部和外部资料; (3)数据的处理及模型的选择; (4)预测模型的分析,修正; (5)确定预测值。,经济与管理实验教学中心,(二)预测的方法,预测的准确程度不仅取决于对错综复杂的对象发展变化情况掌握的程度,而且还在于采取怎样的预测方法,特别在占有资料的同时要选定适合的预测方法。预测方法一般有定性分析预测法和定量预测法,其中定性预测包括集合意见、用户意见法(对象调查法)、员工意见法、专家评估法、类推法、判断预测和目标分解法等;定量预测方法包括:情景分析法、时间序列分析法(移动平均,指数平
15、滑,季节系数,DOxTENKENS法)、因果分析法(线性,回归,非线性模型:含生命周期法,经济计量模型,灰色系统模型, 状态转移分析法,模拟法,系统模型)等。,经济与管理实验教学中心,1定性预测 它是在对象调查的基础上,根据预测者个人经验,阅历,学识和智慧,采用类比分析和综合的方法对对象进行直观判断的方法。根据对象,可分为: (1)集合意见法(三种估计加权预测法),它是一种加权综合判断法; (2)用户意见调查法(设计调查表); (3)员工意见法; (4)专家意见法; (5)类推法。,经济与管理实验教学中心,2定量(分析预测) (1)时间序列分析法。这种预测对时间序列的原始数据要求:在时间上具有
16、连续性(如果15月中除4月都有数据,可采用合适的平均值办 法补足);数据之间的可比性(例如,每个月天数是不同的,可化为相同的天数先求出某月每天的平均销售量);应可采用交叉预测如预测9月,可用1月9月也可用不同年份9月数据)。,经济与管理实验教学中心,时间序列可划为四种变化特征:趋势性(T)、季节性(s)、周期性(c)、不规则性(I),可以利用散点图识别来变化特征。 时间序列分析法一般有方法:简单平均、移动平均、加权移动平均、指数平滑、一元线性回归、相关比例推算。例如: 一元线性回归(趋势外推)Y=a0+a1*x 系数用最小二乘法确定系数:a0 a1,经济与管理实验教学中心,相关比例推算(首先找
17、出影响产品销售量,主要因素,再据各种比例关系,推出预测值)。例如,某第三方物流企业市场的需求预测(如表84所示)。,经济与管理实验教学中心,2)回归预测: 一元线性回归(趋势外推):Y=ao+a1x 多元回归(因果关系) :Y=ao+al。X1+a2x2+anx。 系数用最小二乘法确定系数:a0 a1aIl,经济与管理实验教学中心,(3)非线性模型: Y=A+B*LOG(X) Y=1(A+B。EXP(一X) Y=1(A+B”X) Y=X(A+BX) Y=A。)(B,(A0) Y=AEXP(B。X),(A0) Y=AEXP(BX),(A0) Y=AExP(B。x“2),(A0) 将以上模型进行线
18、性处理再转化为一元回归模型。,经济与管理实验教学中心,(4)灰色预测模型GM(1,1)。 (5)组合预测。采用不同合理的模型预测后,再进行回归得出组合预测模型。,经济与管理实验教学中心,(三)预测模型选取的原则 据有关研究资料表明,以预测方法应用多少为标准进行从大到小排序是: 回归分析、指数平滑、数量经济模型、专家会议、主观概率法、多变量时间序列模型、趋势外推、抽样调查、移动平均、投入产出、相关数、类推法等;在高层次经济预测方面以国家统计为例,主要应用数量经济模型、其他有投入产出模型、回归分析、移动平均等;在低层次方面为专家会议、类推法、移动平均、主观概率法、指数平滑、回归分析等。,经济与管理
19、实验教学中心,定量预测、定性预测和计算机相结合是当今预测的主导方向。神经网络预测理论、基于规则的预测系统、专家预测系统、判断预测、组合预测是当今世界预测科学发展的最新动向。,经济与管理实验教学中心,模型选择的原则:要在数据识别上建模、建立何种模型,并不取决于预测者意图;应考虑适用、数据易采集和时效的原则;定量与定性相结合的原则等。 对数据选取选用的原则:数据应该具有代表性,有一定客观规律。对于异常的数据可采用比例法、移动平均、指数平滑等方法进行适当的修正。,经济与管理实验教学中心,第三节 支持物流决策的信息分析技术,一、数据仓库 (一)基本概念 1数据仓库的定义 什么是数据仓库,有不同的看法:
20、 “DW是作为DSS服务基础的分析型DB,用来存放大容量的只读数据,为制订决策提供所需的信息。” “DW是与操作型系统相分离的、基于标准企业模型集成的、带有时间属性的(即与企业定义的时间区段相关)、面向主题及不可更新的数据集合。”,经济与管理实验教学中心,综合对数据仓库多种理解以及其作用,数据仓库可以定义为支持管理决策过程的、面向主题的、集成的、稳定的、不可更新的、随时间变化的、分层次的数据集合。它是一个综合的、面向分析的数据环境,利用现有的数据进行分析和推理,从而为决策提供依据而建立的综合体系。,经济与管理实验教学中心,2数据仓库的作用 数据仓库具有两个主要作用: 一是从各信息源提取决策需要
21、的数据,加工处理后,存储到数据仓库中; 二是用户的查询和决策分析的基础。,经济与管理实验教学中心,(二)数据仓库的分析 1主题与面向主题 数据库面向应用进行的数据组织,DW中的数据是面向主题进行数据的组织。 主题是一个抽象的概念,是在较高层次上将企业信息系统中的数据综合、归类并进行分析利用的抽象,每一个主题是决策者关心的问题。,经济与管理实验教学中心,面向应用进行数据组织方式的特点如下: 第一,面向应用进行数据组织,是指对企业中相关的组织、部门等进行详细调查,搜集数据库的基础数据以及其处理的过程。调查的重点是“数据”和“处理”,在进行数据组织时充分了解企业的部门组织结构,考虑到企业各部门的业务
22、活动特点。,经济与管理实验教学中心,第二,面向应用进行数据组织应反映一个企业内数据的动态特征,即要表达每个部门的实际业务处理数据流程:即从哪儿获取输人数据,在部门内进行什么样的数据处理,以及向什么地方输出数据。按照实际应用即业务处理流程来组织数据,其主要目的是为了进行联机事务处理,以提高日常业务处理的速度和准确性等,提高服务质量。,经济与管理实验教学中心,第三,这种数据组织方式生成的各项数据库模式与企业中实际的业务处理流程中所涉及的单据或文档有很好的对应关系,这种对应关系使得数据库模式具有很强的操作性,因而可以较好地在这些数据库模式上建立起各项实际的应用处理。,经济与管理实验教学中心,第四,面
23、向应用进行数据组织的方式并没有体现数据库这一概念提出的原本意图;数据与数据处理的分离;要将数据从数据处理或应用中抽象出来、解放出来,组织成一个和具体的应用独立的数据世界。,经济与管理实验教学中心,按照面向主题的方式数据的组织应该分为两个步骤:抽取主题以及确定每个主题所应包含的数据内容。主题是对应某一分析领域的分析对象,所以主题的抽取,应该是按照分析的要求来确定的。这与按照数据处理或应用的要求来组织数据的主要不同在于关心的数据内容不同。,经济与管理实验教学中心,面向主题的数据组织方式是根据分析要求将数据组织成一个完备的分析领域,即主题域。主题域应该具有: (1)独立性,如分析所要求的是“商品”主
24、题域,这一主题域可以和其他的主题域有交叉,但它必须具有独立内涵,有明确的界限,规定某项数据是否该属于“商品”主题。,经济与管理实验教学中心,经济与管理实验教学中心,(2)完备性,如,在“商品”这一主题内找到该分析处理所要求的一切内容;如果涉及现存“商品”主题之外的数据,就应增加新数据到“商品”主题中来,从而逐步完善“商品”主题。,经济与管理实验教学中心,主题只是一个逻辑上的概念,实现时,主题的数据项多了,可以采取化大为小。主题是一个在较高层次上对数据的抽象,这使得面向主题的数据组织可以独立于数据的处理逻辑,因而可以在这种数据环境上方便地开发新的分析型应用。同时,这种独立性也是建设企业全局数据库
25、所要求的,所以面向主题不仅是适用于分析型数据环境的数据组织方式,且是适用于建设企业全局数据库的数据组织方式。,经济与管理实验教学中心,2Dw数据的集成性 Dw的数据是从原有的分散的数据库的数据中抽取来的。两者之间的差别:第一,Dw的每一个主题所对应的源数据在原有的各自分散数据库中有许多重复和不一致的地方,且来源于不同的联机系统的数据都和相同的应用逻辑捆绑在一起;第二,Dw中的综合数据不能从原有的数据库系统直接得到。,经济与管理实验教学中心,因此在数据进入Dw之前,必然要经过统一与综合,这是DW建设中最关键、最复杂的一步,所要完成的工作有: (1)要统一源数据中所有矛盾之处,如字段的同名异义、异
26、名同义、单位不统一、字长不一致,等等。 (2)进行数据综合和计算。DW中的数据综合工作可以从原有数据库抽取数据时生成,但许多是在DW内部生成的,即进入DW以后进行综合生成的。,经济与管理实验教学中心,3DW数据的不可更新性 DW的数据主要供企业决策分析之用,所涉及的数据操作主要是数据查询,一般情况下并不进行修改操作。DW的数据反映的是一段相当长的时间内历史数据的内容,是不同时点的数据库快照的集合,以及基于这些快照进行统计、综合和重组的导出数据,而不是联机处理的数据。数据库中进行联机处理的数据经过集成输入到DW中,一旦DW存放的数据已经超过DW的数据存储期限,这些数据将从当前的DW中删去。因为D
27、W只进行数据查询操作,所以DW管理系统(DWMS)相比DBMS而言要简单得多。但是由于DW的查询数据量往往很大,所以就对数据查询提出了更高的要求,它要求采用各种复杂的索引技术。,经济与管理实验教学中心,4DW数据的时态性 DW中的数据不可更新是针对应用来说的,即DW的用户进行分析处理时不是进行数据更新操作的。,经济与管理实验教学中心,DW的数据是随时间的变化而不断变化的,这是DW数据的第四个特征。这一特征表现在以下三个方面: (1)DW随时间变化不断增加新的数据内容,要不断地生成数据库的快照,经统一集成后增加到数据库中,但对于每次的数据库快照是不再变化的,捕捉到新的变化数据,只不过又生成一个数
28、据库的快照增加进去,而不会对原来的数据库快照进行修改。,经济与管理实验教学中心,(2)DW的数据也有存储期限,一旦超过了这一期限,过期数据就要被删除。只是DW内的数据时限要远远长于操作型环境中的数据时限。 在操作型环境中一般只保存有6090天的数据,而在DW中则需要保存较长的时限的数据(如510年),以适应DSS进行趋势分析的要求。,经济与管理实验教学中心,(3)DW中包含有大量的综合数据,这些综合数据中很多跟时间有关,如数据经常按照时间段进行综合,或每隔一定的时间片进行抽样等等。这些数据要随着时间的变化不断地进行重新综合。因此,DW数据的码键都包含时间项,以标明数据的历史时期。,经济与管理实
29、验教学中心,二、联机分析处理,(一)联机分析处理的定义与特点 1定义 通过专门的数据综合引擎,辅之以更加直观的数据方问界面,力图统一分散的公共应用逻辑,在短时间内响应非数据处理专业人员的复杂查询要求。1993年,EFCodd将这类技术定义为“OLAP。,经济与管理实验教学中心,2特点 一般数据库由于主要用于企业的日常事务处理工作,存放在数据库中的数据也就大体符合操作型数据的特点。而为适应数据分析处理要求而产生的Dw中所存放的数据就应该是分析型的数据。,经济与管理实验教学中心,经济与管理实验教学中心,(二) OLAP的基本术语,OLAP是针对特定问题的联机访问和分析数据。通过对信息(这些信息已经
30、从原始的数据进行了转换,以反映用户所能理解的企业的真实的“维”)的很多种可能的观察形式进行快速、稳定一致和交互性的存取,允许管理决策人员对数据进行深观察。,经济与管理实验教学中心,1变量 变量是数据的实际意义,描述数据“是什么”。一般情况下,变量总是一个数值度量指标。 2维 维是人们观察数据的特定角度。 例如,企业常常关心服务收入随着服务水平提高而产生的变化情况,这时该企业是从服务水平的角度来观察产品的服务收入,所以服务水平就是一个维(服务维)。,经济与管理实验教学中心,3维的层次 人们观察数据的特定角度(即某个维)还可以存在细节程度不同的多个描述方面,我们称这多个描述方面为维的层次。 例如描
31、述维时间,可以从日期、月份、季度、年等不同层次来描述,那么日期、月份、季度、年等就是时间维的层次;同样,城市、地区、国家等构成了一个地理维的多个层次。,经济与管理实验教学中心,4维成员 维的一个取值称为该维的一个维成员。如果一个维是多层次的,那么,该维的维成员是在不同维层次的取值的组合。,经济与管理实验教学中心,5多维数组 一个多维数组可以表示为:(维1,维2,维n,变量)。 例如,日用品销售数据是按时间、地区和销售渠道组织起来的三维立方体,加上变量“销售额”,就组成了一个多维数组(地区、时间、销售渠道、销售额)。如果我们扩展一个维、产品维,就得到一个四维的结构。,经济与管理实验教学中心,6数
32、据单元 多维数组的取值称为数据单元。当多维数组的各个维选中一个维成员,这些维成员的组合就惟一确定了一个变量的值。那么数据单元就可以表示为:(维1成员,维2成员,维n成员,变量的值)。,经济与管理实验教学中心,(三)OLAP的基本分析方法,多维分析是指对以多维形式组织起来的数据采取切片、切换、旋转等各种分析方法,以求剖析数据,使最终用户能从多个角度、多侧面地观察数据库中的数据,从而深入地了解包含在数据中的信息、内涵。,经济与管理实验教学中心,多维分析方式符合了人的思维模式,使分析人员能够迅速、一致、交互地从多个角度、多个侧面来剖析反映企业维的特性数据,使人们在观察数据时减少混淆与错误,发现数据后
33、面隐藏的有价值并能被用户理解的信息、内涵,能更深刻地反映企业的真实面目和企业所处的环境,因此减少了混淆,降低了出现错误解释的可能性。,经济与管理实验教学中心,1切片 定义1:在多维数组的某一维上,选定一维成员的方法称为切片,即在多维数组(维1,维2,维n,变量)中选一维,即维Vi,维n,变量称为在维I上的一个切片。,经济与管理实验教学中心,定义2:选定多维数组的一个二维子集的方法叫做切片,即选定多维数组(维1,维2,维n,变量)中的两个维:维I和维J,在这两个维上取某一区间或任意维成员,而将其余的维都取定一个维成员,则得到的就是多维数组在维I和j上一个二维子集,称这个二维子集为多维数在维I和维
34、J上的一个切片,表示为:(维I,维i,变量)。,经济与管理实验教学中心,2切块 定义l:在多维数组的某一维上,选定某一区间的维成员的方法称为切块,即限制多维数组的某一维的取值区间。显然,当这一区间只取一个维成员时,好得到一个切片(切片的定义1)。,经济与管理实验教学中心,定义2:选定多维数的一个三维子集的方法称切块。即选定多维数组(维1,维2,维n,变量)中的三个维:维I、维i和维r,在这三个维上取某一区间或任意的维成员,而将其余的维都取定一个维成员,则得到的就是多维数组在维I、维i和维r上一个三维子集,我们称这个三维子集为多维数组在维I、维i和r上的一个切块,表示为:(维I,维i,维r,变量
35、)。切块与切片的作用与目的是相似的。,经济与管理实验教学中心,3旋转 旋转即是改变一个报告或页面显示的维方向。例如,旋转可能包含了交换行和列;或是把某一个行维移到列维中去,或是把页面显示中的一个维和页面的维进行交换(令其成为新一行或列中的一个)把一个横向为时间、维向维产品的报表旋转成为横向为产品、维向为时间的报表。,经济与管理实验教学中心,(四)OLAP的衡量标准 1993年,EFCodd在Providing OLAP(OnLine Analytical Processing)to User Analysts中提出了有关OLAP的十二条准则,其多维数据分析、客户服务器结构、多用户支持及一致的报
36、表性能等得到了在多数人的认可。,经济与管理实验教学中心,他所阐述的有关OLAP产品及其所依赖的数据分析模型的一系列概念及衡量标准对OLAP产品的识别及后来发展方向的确立都有着重要的作用,尽管Codd提出的十二条准则也在不断的完善,但仍可以 作为评价和购买OLAP产品的参考标准。,经济与管理实验教学中心,准则1 OLAP模型必须提供多维概念视图 从用户分析员的角度来看,整个企业的视图本质上是多维的,因此OLAP的概念模型也应是多维的。 准则2透明性准则 无论OLAP是否是前端产品的一部分,对用户来说,它都是透明的;如果在客户服务器结构中提供OLAP产品,那么对最终分析员来说,它同样也应透明。,经
37、济与管理实验教学中心,准则3存取能力准则 OLAP系统不仅能进行开放的存取,而且还提供高效的存取策略。OLAP用户分析员不仅能在公共概念视图的基础上对关系数据库和外部存储的数据进行分析。 准则4稳定的报表性能 当数据维数和数据综合层次增加时,提供给最终分析员的报表能力和响应速度不应该有明显的降低和减慢,这对维护OLAP产品的易用性和低复杂性至关重要。即便是企业模型改变时,关键数据的计算方法也无需更改。也就是说,OLAP系统模型对企业模型应该具有“鲁棒”性。,经济与管理实验教学中心,准则5客户服务器体系结构 OLAP是建立在客户服务器体系结构上的。这要求它的多维数据服务器能够被不同的应用工具访问
38、到。 准则6维的等同性准则 每一数据维在数据结构和操作能力上都是等同的。系统可以将附加的操作能力授给所选维,但必须保证该操作能力可以授给任意的其他维,即要求维上的操作是公共的。该准则实际上是准l的一个补充,是对维的基本结构和维上的操作的要求。,经济与管理实验教学中心,准则7动态的稀疏矩阵处理准则 OLAP工具的物理模型必须充分适应指定的分析模型,提供“最优”的稀疏矩阵处理,这是OLAP工具的应遵循的最重要的准则之一。,经济与管理实验教学中心,准则8多用户支持能力准则 多个用户分析员可以同时工作于同一分析模型上或是可以在同一企业数据上建立不同的分析模型。该准则可由准则5推出。OLAP工具必须提供
39、并发访问、数据完整性及安全性机制。 准则9非受限的跨维操作 多维数据之间存在固有的层次关系,这就要求OLAP工具能自己推导出而不是最终用户明确定义出相关的计算。对于无法从固有关系中得出的计算,要求系统提供计算完备的语言来定义各类计算公式。该准则是对准则l的一个补充,对操作能力和操作范围做出了要求。,经济与管理实验教学中心,准则10直观的数据操纵 这一准则要求数据操纵。这一准则要求数据操纵直观易懂。综合路径重定位、向上综合、向下挖掘和其他操作都可以通过直观、方便的点击操作完成。 准则11灵活的报表生成 报表必须从各种可能的方面显示出从数据模型中综合出的数据和信息,充分反映数据分析模型的多维特征。
40、,经济与管理实验教学中心,准则12不受限维与聚集层 OLAP工具的维数应不小于15维,用户分析员可以在任意给定的综合路径上建立任意多个聚集层次。,经济与管理实验教学中心,三、数据挖掘(DM),(一)概念 1定义 DM是一个从大型数据库中抽取隐含的、从前未知的、潜在有用的信息或关系的过程。 它是从各种相关数据库的大量数据中提取出人们感兴趣的知识和规则,这些知识和规则是可信的、新颖的、有效的,并能容易被人理解的。,经济与管理实验教学中心,2作用 自动智能地分析数据库中的大量数据,以获取信息,是推动数据挖掘型工具产生并发展的强大动力。超级对象的经理人员希望能从过去几年的销售记录中分析出顾客的消费习惯
41、和行为,以便及时变换营销策略。,经济与管理实验教学中心,3与知识发现的关系 DM和知识发现(KDD:Knowledge Discovery in Database)有密切的联系。知识发现是指从数据库中发现有用知识的整个过程,DM则是这一过程中的一个特定步骤。,经济与管理实验教学中心,4特点,DM的特点有: (1)处理的数据规模十分庞大; (2)由于用户不能形成精确的查询要求,因此需要靠DM技术来寻找其可能感兴趣的东西; (3)DM对数据的迅速变化应作出快速响应,以提供决策支持信息; (4)DM既要发现潜在规则,还要管理和维护规则,随着新数据的不断加入,规则需要随之更新; (5)DM中规则的发现
42、基于统计规律,发现的规则不必适合于所有数据,而且当达到某一阈值时,便认为有此规则。,经济与管理实验教学中心,(二) DM的技术,DM涉及面相当广泛,从机器学习、模式识别、统计学、智能数据库、知识获取直到数据可视化、高性能计算、专家系统等各个领域。DM主要任务通常有分类、聚类、预测和关联等,以便从浩瀚的数据海洋中采掘出有价值的求知信息来支持决策,提高决策支持系统的正确性和可行性。DM技术应用诸如:神经网络、模糊逻辑、遗传算法之类的统计分析工具。,经济与管理实验教学中心,1人工神经网络方法 人工神经网络方法是由大量的简单处理单元(即神经元)所构成的一种能模仿延伸人脑认知功能的新型信息处理系统,它具
43、有巨量并行处理信息和推理能力、存储分布性、结构可变性、高度非线性、自学习性和自组织性等特点,是DM技术中最重要的方法之一。,经济与管理实验教学中心,2遗传算法 遗传算法(Genetic Algorithms)可起到产生优化后代的作用。这些后代需满足适应值,经过若干代的遗传,将得到满足要求的后代(即问题的解)。遗传算法已在优化计算和分类机器学习方面发挥了显著作用。,经济与管理实验教学中心,3决策树方法 决策树方法(Decision Trees)是利用信息论中的互信息(信息增益)寻找数据库中具有最大信息量的属性字段,建立决策树的一个结点,再根据该属性字段的不同取值建立树的分支;在每个分支子集中重复
44、建立树的下层结点和分支的过程。,经济与管理实验教学中心,(三)DM的分析方法,DM系统利用的技术越多,得出的结果精确性就越高。原因很简单,对于某技术不适用的问题,其他方法却可能奏效。这主要取决于问题的类型以及数据的类型和规模。无论采用哪几种技术来完成任务,从功能上可以将DM的分析方法划分为以下四种(根据IBM的划分方法):关联分析、序列模式分析、分类分析、聚类分析。,经济与管理实验教学中心,1关联分析 关联分析(Associations)的目的就是为了挖掘出隐藏在数据间的相互关系。 2序列模式分析 序列模式分析(sequential Patterns)和关联分析法相似,其目的也是为了挖掘出数据
45、之间的联系,但序列模式分析的侧重点在于分析数据间的前后(因果)关系。,经济与管理实验教学中心,3分类分析 分类分析(classifiers)。假定记录集合和一组标记(TAG),所谓标记是指一组具有不同特征的类别。 4聚类分析 聚类分析(clustering)。与分类分析不同,聚类分析法的输入集是一组未标定的记录,也就是说此时输入的记录还没有被进行任何分类。其目的是根据的这些规则是由聚类分析工具定义的。由于聚类分析可以采用不同的算法,所以对于相同的记录集合可能有不同的划分。可以看出,许多在分类分析法中适用的算法同样适用于聚类分析法。,经济与管理实验教学中心,(四)DM系统的实施,DM的核心技术是
46、人工智能、机器学习、统计等,但一个DM系统不是多项技术的简单组合,而是一个完整的整体,它还需要其他辅助技术的支持,才能完成数据采集、预处理、数据分析、结果表述这一系列任务,最后将分析结果呈现在用户面前。根据功能,整个DM系统可以大致划分为三级结构。,经济与管理实验教学中心,DM的数据分析过程可以分成四个步骤: 1数据准备 数据准备(Data Preparation):本阶段又可进一步细分两步数据集成、数据选择和预分析。 (1)集成(Integration): (2)数据选择和预分析(Data Selection and PreAnalysis):,经济与管理实验教学中心,2挖掘 挖掘(Mini
47、ng):DM处理器(Data Mining Processor)综合利用前面提到的四种DM方法分析数据中的数据。 3表述 表述(Presentation):与验证型工具一样,DM将获取的信息以便于用户理解和观察的方式反映给用户,这时可以利用可视化工具。,经济与管理实验教学中心,4评价 评价(Asess):如果分析人员对分析结果不满意,可以递归地执行上述三个过程,直到满意为止。,经济与管理实验教学中心,(五)DM与OLAP的区别和联系,DM与OLAP都属于分析型工具,但两者之间有着明显的区别。 DB工具(包括查询工具、报表生成器等)都属于操作型工具,它们建立在操作型数据之上,主要是为了满足日常信
48、息提取之需。,经济与管理实验教学中心,DM是一种挖掘型工具,它能有效地从大量数据中自动地发现隐藏在数据中的模式。DM与其他分析型工具最大的不同在于:它的分析过程是自动的。个成熟的DM系统除了具有良好的核心的技术外,还应该具有开放性的结构,友好的用户接口。DM的用户不必提出确切的问题,而只需DM去挖掘隐藏的模式并预测未来的趋势,这样更有利于发现未知的事实。,经济与管理实验教学中心,OLAP是一种自上而下、不断深入的分析工具:用户提出问题或假设,OLAP负责从上至下深入地提取出关于该问题的详细信息,并以可视化的方式呈现给用户。与DM相比,OLAP更多地依靠用户输入问题和假设,但用户先入为主的局限性
49、可能会限制问题和假设的范围,从而影响最终的结论。因此,作为验证型分析OLAP更需要对用户需求有全面而深入的了解。显然,从对数据分析的深度的角度来看,OLAP位于较浅的层次,而DM所处的位置则较深。如果按前面所介绍的EFCodd的数据分析模型来区分这两者,那么应该说OLAP实现了解释模型和思考模型,而DM则实现了更深的第四层一解析模型。所处分析模型层次的不同决定了这两者的分析能力和所能回答的问题种类也不相同。,经济与管理实验教学中心,四、空间分析,由于物流的主要目的之一是实现物品的空间转移,因此空间分析对物流来说是一类非常重要的分析内容。 说是一类非常重要的分析内容。 由于数字概念与方法的引入,
50、并从统计方法扩展到运筹学、拓扑学等方法的应用,进一步促进了空间分析、定量分析的能力。,经济与管理实验教学中心,(一)空间分析层次,GIS的空间分析可分为三个不同的层次。 一是空间检索,包括从空间位置检索空间物体及其属性和从属性条件集检索空间物体。 二是空间拓扑叠加分析,空间拓扑叠加实现了输入特征的属性的合并以及特征属性在空间上的连接。空间拓扑叠加本质是空间意义上的布尔运算。 三是空间模拟分析,空间模拟分析刚刚起步。,经济与管理实验教学中心,(二)GIS与空间模型分析,目前多数研究工作着重于如何将GIS与空间模型分析相结合,其研究可分三类: 第一类是GIS外部魄窝间模型分析,将GIS当作一个通用的空间数据库,而空间模型分析功能借助于其他软件;,经济与管理实验教学中心,第二类是GIS内部的空间模型分析,试图利用GIS软件来提供空间分析模拟以及发展适用于问题解决模型的宏语言,这种方法一般基于空间分析的复杂性与多样性,易于理解和应用,但由于GIS软件所能提供空间分析功能极为有限,这种紧密结合的空间模型分析方法在实际GIS的设计中较少使用;,经济与管理实验教学中心,中较少使用; 第三类是混合型的空间模型分析,其宗旨在于尽可能地利用GIS所提供的功
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年大学大二(植物营养学)肥料施用期末测试试题及答案
- 2025年中职(仓储实务综合实训)管理实操试题及答案
- 2025年大学汉语言文学(文学概论基础)试题及答案
- 2025年高职第一学年(工商管理)企业管理综合试题及答案
- 2026年家电维修(洗衣机检修)试题及答案
- 2025年高职健康管理(慢病管理)试题及答案
- 《潮流玩偶服饰设计》动漫玩具设计专业全套教学课件
- 运营中心管理制度新
- 中国银行大学生培训课件
- 养老院老人疾病预防措施制度
- 2025年中考数学二轮复习专题系列圆与无刻度直尺作图
- 《直肠癌NCCN治疗指南》课件
- 预防老年人失能
- 百色市2024-2025学年高二上学期期末考试英语试题(含答案详解)
- 福建省龙岩市连城一中2025届高考英语五模试卷含解析
- 耳聋护理学习
- 幼儿园入学准备指导要点试题
- 《机械常识(第2版)》中职技工全套教学课件
- 小岛经济学(中文版)
- 矿卡司机安全教育考试卷(带答案)
- 设备预防性维修维护培训课件
评论
0/150
提交评论