版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、河北北方学院:赵志升,数据仓库与数据挖掘 Data Warehouse and Data Mining,41 OLAP概念、特点与分类 42 OLAP的基本操作 43 OLAP的数据模型 44 基于多维数据库的OLAP(MOLAP) 45 基于关系数据库的OLAP(ROLAP) 46 OLAP实现 47 OLAP的衡量和特性,第4章 联机分析处理,4.1 OLAP的定义、特点,OLAP(On-Line Analysis Processing)定义 是数据仓库上的分析展示工具,它建立在数据多维视图的基础上。联机分析处理。 OLAP的主要特点 一是在线性(On Line),体现为对用户请求的快速响
2、应和交互式操作; 二是多维分析(Multi_Analysis),这是OLAP技术的核心所在。,4.1 OLAP的定义和特点,Codd提出了多维数据库和多维分析的概念,即OLAP。OLAP委员会对联机分析处理的定义为:使分析人员、管理人员或执行人员能够从多种角度对从原始数据中转化出来的、能够真正为用户所理解的、并真实反映企业维特性的信息进行快速、一致、交互地存取,从而获得对数据的更深入了解的一类软件技术。OLAP的目标是满足决策支持或多维环境特定的查询和报表需求,它的技术核心是“维”这个概念,因此OLAP也可以说是多维数据分析工具的集合。,4.1 OLAP的定义和特点,整个数据(仓)库系统的工具
3、层大致可以分为三类,或者说三个发展阶段: (1)以MIS为代表的查询、报表类工具 (2)以OLAP为代表的验证型工具 (3)以及以DM为代表的挖掘型工具,4.1 OLAP的分类,OLAP系统按照其存储器的数据存储格式可以分为关系OLAP(RelationalOLAP,简称ROLAP)、多维OLAP(MultidimensionalOLAP,简称MOLAP)和混合型OLAP(HybridOLAP,简称HOLAP)三种类型。 1.ROLAP ROLAP将分析用的多维数据存储在关系数据库中并根据应用的需要有选择的定义一批实视图作为表也存储在关系数据库中。不必要将每一个SQL查询都作为实视图保存,只定
4、义那些应用频率比较高、计算工作量比较大的查询作为实视图。对每个针对OLAP服务器的查询,优先利用已经计算好的实视图来生成查询结果以提高查询效率。同时用作ROLAP存储器的RDBMS也针对OLAP作相应的优化,比如并行存储、并行查询、并行数据管理、基于成本的查询优化、位图索引、SQL的OLAP扩展(cube,rollup)等等。,4.1 OLAP的分类,1.ROLAP 存储模式使得分区的聚合存储在关系数据库的表(在分区数据源中指定)中。但是,可为分区数据使用ROLAP存储模式,而不在关系数据库中创建聚合。 同样,如果分区源数据存储在SQL Server 2000中,而且满足特定条件,则将创建索引
5、视图而不创建表。 与MOLAP存储模式不同,ROLAP不会使源数据的复本存储起来;当结果无法从聚合或客户端高速缓存派生时,将访问分区的事实数据表以回答查询。在ROLAP存储模式下,查询响应一般较其它两种存储模式下要慢。ROLAP通常用于不经常查询的大数据集,如年份较早的历史数据。,4.1 OLAP的分类,2.MOLAP MOLAP将OLAP分析所用到的多维数据物理上存储为多维数组的形式,形成“立方体”的结构。 维的属性值被映射成多维数组的下标值或下标的范围,而总结数据作为多维数组的值存储在数组的单元中。 由于MOLAP采用了新的存储结构,从物理层实现起,因此又称为物理OLAP(Physical
6、OLAP); 而ROLAP主要通过一些软件工具或中间软件实现,物理层仍采用关系数据库的存储结构,因此称为虚拟OLAP(VirtualOLAP)。,4.1 OLAP的分类,2.MOLAP MOLAP存储模式使得分区的聚合和其源数据的复本以多维结构存储在分析服务器计算机上。根据分区定义为是本地分区还是远程分区,该计算机可以是定义分区的分析服务器计算机,或别的分析服务器计算机。用于存储分区数据的多维结构位于分析服务器Data文件夹的子文件夹中。 由于分析服务器计算机上驻留有源数据的一个复本,所以即使查询结果无法从分区的聚合中获得,也可以不用访问分区的源数据而解决查询。根据分区聚合的百分比和设计,MO
7、LAP 存储模式为达到最快查询响应时间提供了潜在可能性。总而言之,MOLAP更加适合于频繁使用的多维数据集中的分区和对快速查询响应的需要。,4.1 OLAP的分类,4.1 OLAP的分类,3.HOLAP 由于MOLAP和ROLAP有着各自的优点和缺点(如下表所示),且它们的结构迥然不同,这给分析人员设计OLAP结构提出了难题。为此一个新的OLAP结构混合型OLAP(HOLAP)被提出,它能把MOLAP和ROLAP两种结构的优点结合起来。迄今为止,对HOLAP还没有一个正式的定义。但很明显,HOLAP结构不应该是MOLAP与ROLAP结构的简单组合,而是这两种结构技术优点的有机结合,能满足用户各
8、种复杂的分析请求。,4.1 OLAP的分类,HOLAP 存储模式结合了MOLAP和ROLAP二者的特性。同MOLAP一样,HOLAP使得分区的聚合按多维结构存储在分析服务器计算机上。HOLAP不会使源数据的复本存储起来。对于只访问包含于分区聚合中的汇总数据的查询,HOLAP与MOLAP特性相同。访问源数据的查询(例如深化至原子多维数据集单元,而该单元没有对应的聚合数据)必须从关系数据库中检索数据,并且将不如源数据存储在MOLAP结构中那样快速。 按HOLAP存储的分区小于同一个按MOLAP存储的分区,而比ROLAP分区响应涉及汇总数据的查询要快。一般情况下,HOLAP存储模式适用于要求对基于大
9、量源数据的汇总能够实现快速查询响应的多维数据集中的分区。,4.1 OLAP与OLTP的区别,(1)OLTP主要面向公司职员;OLAP则主要面向公司领导者。 (2)OLTP应用主要是用来完成客户的事务处理,其数据基础是操作型数据库,如民航订票系统、银行储蓄系统等等,通常需要进行大量的更新操作,同时对响应时间要求较高; 而OLAP是以数据仓库或数据多维视图为基础的数据分析处理,是针对特定问题的联机数据访问和分析,它一般不对仓库数据作修改处理,而只是查询,其应用主要是对客户当前及历史数据进行分析,辅助领导决策,其典型的应用有对银行信用卡风险的分析与预测、公司市场营销策略的制定等,主要是进行大量的查询
10、操作,对时间的要求不太严格。,OLAP与OLTP的不同,OLAP与数据挖掘的比较,相同之处 OLAP与DM都是数据库(数据仓库)上的分析工具; 不同之处 (1)在实际应用中各有侧重。前者是验证型的,后者是挖掘型的; (2)前者建立在多维视图的基础之上,强调执行效率和对用户请求命令的及时响应,而且其直接数据源一般是数据仓库;后者建立在各种数据源的基础上,重在发现隐藏在数据深层次的对人们有用的模式,一般并不过多考虑执行效率和响应速度。,OLAP与数据挖掘的比较,(3)数据挖掘与OLAP不同,主要体现在它分析数据的深入和分析过程的自动化,自动化的含义是其分析过程不需要客户的参与,这是它的优点,也正是
11、其不足。因为在实际中,客户也希望参与到挖掘中来,例如只想对数据的某一子集进行挖掘,对不同抽取、集成水平的数据进行挖掘,或是根据自己的需要动态选择挖掘算法等等。 因此,OLAP与数据挖掘各有所长。,OLAP与DM都是数据库(数据仓库)的分析工具,在实际应用中各有侧重: OLAP的在线性体现在与用户的交互和快速响应上,多维性则体现在它建立在多维视图的基础上。用户积极参与分析过程,动态地提出分析要求,选择分析算法,对数据进行由浅及深的分析。 DM与OLAP不同,主要体现在它分析数据的深入和分析过程的自动化。其中,自动化是指其分析过程不需要用户的参与。这是它的优点,也正是它的不足。因为在实际中,用户也
12、希望参与到挖掘中来,如只想对数据的某一子集进行挖掘,以及对不同抽取、集成水平的数据进行挖掘,还有想根据自己的需要动态选择挖掘算法等等。 由此可见,OLAP与DM各有所长,如果能将二者结合起来,发展一种建立在olap和数据仓库基础上的新的挖掘技术,将更能适应实际的需要。而OLAM(on-line analytical mining或olap mining),正是这种结合的产物。,OLAP与数据挖掘的结合OLAM,将OLAP与数据挖掘结合起来,发展出一种为数据挖掘服务的具有新型OLAP的数据仓库,将更能适应实际的需要。 OLAM(On Line Analytical Mining,联机分析挖掘)正
13、是这种结合的产物。 联机分析挖掘,又称为OLAP Mining。它是联机分析处理技术与数据挖掘技术在数据库或数据仓库应用中的结合,是联机分析处理技术的新发展,也是近年来数据库领域的研究重点和热点。,OLAM产生的原因,OLAP与DM虽同为数据库或数据仓库的分析工具,但两者侧重点不同。同时,随着OLAP与DM技术的应用和发展,数据库领域在OLAP基础上对深层次分析的需求与人工智能领域中数据挖掘技术的融合最终促成了联机分析挖掘技术。,OLAM产生的原因,一方面,分析工具OLAP功能虽强大,能为客户端应用程序提供完善的查询和分析,但它也存在以下不足: 1) OLAP是一种验证型分析工具,是由用户驱动
14、的。即在某个假设的前提下通过数据查询和分析来验证或否定这个假设,这很大程度上受到用户假设能力的限制。 2) OLAP分析事先需要对用户的需求有全面而深入的了解,然而用户的需求并不是确定的,难以把握。所以OLAP分析常常采用试凑法在大型数据库或仓库中搜索,不仅花时间,而且可能产生一些无用的结果。 3) 即使搜索到了有用的信息,由于缺乏应有的维度,从不同的视图得到的结果可能并不相同,容易产生误导。,OLAM产生的原因,另一方面,数据挖掘虽然可以使用复杂算法来分析数据和创建模型表示有关数据的信息,用户也不必提出确切的要求,系统就能够根据数据本身的规律性,自动地挖掘数据潜在的模式,或通过联想,建立新的
15、业务模型以辅助决策。但它也存在一些缺点: 1) DM是挖掘型分析工具,是由数据驱动的。用户需要事先提出挖掘任务。但对于用户来讲,很多时候预先是不知道想挖掘什么样的知识的。 2)由于数据库或数据仓库中存有大量数据和信息,用户仅仅指出挖掘任务,而不提供其他搜索线索,这样DM工具就会遍历整个数据库,导致搜索空间太大。计算机将处于长时间的工作,而且结果中可能会生成很多无用信息。 3)即使挖掘出了潜在有价值的信息,但它究竟用来做什么分析用,用户也可能不清楚。,OLAM产生,两种技术各存在不足,但同时也可以相辅相成。如果将OLAP同DM配合集成, 一方面OLAP的分析结果给DM提供挖掘的依据,引导DM的进
16、行; 另一方面,在数据挖掘的结果中进行OLAP分析,则OLAP分析的深度就可拓展。这样用户就可以灵活选择所需的数据挖掘功能,并动态交换挖掘任务,在数据仓库的基础上提供更有效的决策支持。 鉴于OLAP与DM技术在决策分析中的这种互补性,促成了OLAM技术的形成。,发展olam的原始驱动力有以下几点: (1)data mining工具需要的数据是一些经过净化、集成处理的数据,通常这种处理过程也是昂贵的;而dw(data warehouse,数据仓库)作为olap的数据源,存储的就是这样的数据。它能为olap提供数据,当然也可以为dm提供数据。 (2)dm是一项崭新的技术,很多人在研究它。围绕着它有
17、许多工具或是体系结构。而dm作为数据分析工具的一种,不是孤立的,必然要与其他的工具发生联系。因此,考虑到如何最大限度地利用这些现成的工具,也是olam发展之初所关心的问题。 (3)成功的数据挖掘需要对数据进行钻探性(exporatory)分析。例如,挖掘所需的数据可能只是一部分、一定范围的数据。因此,对多维数据模型的切片、切块、下钻等操作,同样可以应用于dm的过程中。也就是说,可以将dm建立在多维模型(或说超级立方体)的基础之上。 (4)用户的参与对dm非常重要,它动态地提出挖掘要求,选择挖掘算法。故可以将olap的clientserver结构应用于dm中来。,OLAM产生,联机分析挖掘概念正
18、式提出是在1997年,由加拿大Simon Fraser大学教授Jiawei Han等在数据立方体的基础上提出多维数据挖掘的概念,称为OLAP mining。这实际上是在OLAP系统的基础上,把数据分析算法、数据挖掘算法引人进来,解决多维数据环境的数据挖掘问题。,OLAM体系结构,OLAM体系结构,OLAM的挖掘分析处理是建立在数据仓库系统的数据立方体基础上的。数据立方体的组织模型、计算和操作对与系统的执行效率和响应速度起着至关重要的作用。OLAM集成了传统的OLAP和数据挖掘技术,为用户的在线分析挖掘操作提供接口。OLAM引擎通过用户图形接口接收用户的分析请求指令和数据,在元数据的指导下,对数
19、据立方体进行相应的操作,包括集合运算(如求和、求平均)和导向运算(如选择、旋转、上钻与下钻)等,然后将挖掘分析的结果以可视化的形式展现给用户,整个分析挖掘过程是动态进行的。,OLAM的系统特征,OLAM系统的主要目的就是实现OLAP与数据挖掘的功能互补,提高数据分析挖掘的性能。建立在庞大复杂的数据仓库基础上的OLAM在实现过程中面临最大的挑战是数据分析挖掘执行的效率的提高和对用户请求的快速准确响应。目前专门的OLAM产品还没有正式出现,但根据OLAM系统的设计目的和用户要求,OLAM应具有其自己的系统及功能特征。,OLAM的系统特征(1),多维分析和数据挖掘无缝集成,即多维分析与数据挖掘的完美
20、结合需要理论基础,需要一套系统构建方法。比如借助于OLAP对数据立方体进行切片、切块、旋转、向下钻取、向上汇总等操作的支持,应能方便地对任何一部分数据和不同抽象级别地数据进行挖掘。,OLAM的系统特征(2),具有较高的执行效率和较快的响应速度。OLAM系统快速响应能力的获得是一个十分有挑战性的问题,可以认为是OLAM技术中最困难的问题之一。往往数据挖掘算法复杂且耗时,这时要求协调执行效率和挖掘精度两者的关系。,OLAM的系统特征(3),支持迭代分析过程,即系统应提供“回溯”能力,以便随时标记分析过程中的时空状态点,并在分析过程中随时回到这一点,有利于分析的灵活进行,防止在进行由浅人深的分析过程
21、中用户“迷失方向”。,OLAM的系统特征(4),支持复杂信息建模,即要求OLAM系统支持多种异构DBMS中多种数据类型的融合,全面处理企业内的各种决策支持应用。一方面,决策分析的数据对象来自于不同开发环境和目的的分立应用系统,数据的管理方法和数据结构也可能不同,这就要求OLAM在数据方面有很强的包容性;另一方面,不同的数据挖掘方法要求不同的数据结构支撑。,OLAM的系统特征(5),良好的可扩展性。要求OLAM系统支持多种挖掘算法的模块的添加、多种工作对象的建构、多种数据源的集成、多种前端工具的利用等扩展功能。用户能根据实际问题的不同,选用不同的挖掘算法。此外,OLAM因该具有支持这些扩展的通用
22、接口,以便与其它工具和算法衔接,或者嵌人用户自己的算法。,OLAM的系统特征(6),灵活友好的人机交互能力。OLAM中的决策分析过程是要在人的指导下进行的,人作为系统的有机组成部分和系统应用密不可分。人利用自己掌握的领域知识在OLAM系统的辅助下完成领域内问题的求解,在这个过程中人与计算机分别承担各自最擅长的工作,达到资源的合理配置。,OLAM的系统特征(7),支持复杂事务模型及多任务优化和调度。OLAM事务是有“内部结构”的数据库操作集合,是一个有层次的复杂网络结构,传统的无内部结构、彼此孤立的、最小原子特性的事务模型只是这种模型的特例。OLAM事务之间具有广泛的联系,考虑在对事务分解的基础
23、上,充分利用不同事务中的公共子事务来优化事务的调度。,OLAM的分析操作,从OLAM的定义来看,它是建立在多维数据视图基础之上的。因此,对于OLAM的操作应是超立方体计算与传统挖掘算法的结合。这里所说的立方体计算方法一般指切片、切块、上卷、下钻、旋转等操作;而挖掘算法则是指关联规则、分类、聚类等挖掘算法。根据立方体计算和数据挖掘所进行的次序的不同组合可以有不同的模式。,OLAM的分析操作,先进行立方体计算、后进行数据挖掘。在进行数据挖掘以前,先对多维数据进行二定的立方体计算,以选择合适的数据范围和恰当的抽象级别。 先对多维数据作数据挖掘,然后再利用立方体计算算法对挖掘出来的结果做进一步的深入分
24、析。 立方体计算与数据挖掘同时进行。在挖掘的过程中,可以根据需要对数据视图做相应的多维操作。这也意味着同一个挖掘算法可以应用于多维数据视图的不同部分。 回溯操作。OLAM的标签和回溯特性,允许用户回溯一步或几步,或回溯至标志处,然后沿着另外的途径进行挖掘,这样用户在挖掘分析中可以交互式的进行立方体计算和数据挖掘。,OLAM技术的发展趋势,OLAM技术实现了OLAP和DM技术的互补,它的发展趋势是两者更加可靠的集成、融合,有自己合理优化的结构体系和一套完备的技术理论基础,从整体上为决策分析提供完美支持。 OLAM技术是一门交叉学科,涉及机器学习、模式识别、统计学、智能数据库、人工智能、高性能计算
25、、数据可视化、专家系统等综合技术。这些相关学科的发展,无疑也将会推动OLAM技术的发展。特别是,近年来随着数据库技术的发展,出现了不同数据类型的高级数据库,如面向对象数据库、对象关系型数据库、空间数据库、超文本数据库、多媒体数据库、时序数据库等。因此,未来的OLAM技术应用应基于这些高级数据库展开。 随着互联网技术的发展,全球信息的共享,基于Web的联机分析挖掘(Web0LAM),也将成为OLAM技术发展的一个新方向。P87页,4.2 OLAP的典型操作,OLAP对数据仓库中数据的操作是针对多维数据视图(又称为超立方体)进行的。对立方体的典型操作包括:切片、切块以及旋转等。 切片 选定多维数组
26、的一个二维子集; 切块 选定多维数组的一个三维子集; 旋转 改变一个立方体显示的维方向,人们可以从不同的角度更加清晰、直观地观察数据。,多维数据,Sales volume as a function of product, month, and region,Product,Region,Month,Dimensions: Product, Location, Time Hierarchical summarization paths,Industry Region Year Category Country Quarter Product City Month Week Office Day
27、,立方体实例,Total annual sales of TV in U.S.A.,数据立方体的浏览,Visualization OLAP capabilities Interactive manipulation,第一节 多维数据模型,1、 数据立方体 数据仓库和OLAP工具基于多维数据模型,多维数据模型将数据看作数据立方体(data cube)形式。数据立方体允许以多维对数据建模和观察,由维和事实定义。,第一节 多维数据模型,1、 数据立方体 数据仓库和OLAP工具基于多维数据模型,多维数据模型将数据看作数据立方体(data cube)形式。数据立方体允许以多维对数据建模和观察,由维和事实
28、定义。,第一节 多维数据模型,OLAP展现在用户面前的是一幅幅多维视图。 联机分析处理 维(Dimension):是人们观察数据的特定角度,是考虑问题时的一类属性,属性集合构成一个维(时间维、地理维等)。 维的层次(Level):人们观察数据的某个特定角度(即某个维)还可以存在细节程度不同的各个描述方面(时间维:日期、月份、季度、年)。 维的成员(Member):维的一个取值,是数据项在某维中位置的描述。(“某年某月某日”是在时间维上位置的描述)。 度量(Measure):多维数组的取值。(2000年1月,上海,笔记本电脑,0000)。,第一节 多维数据模型,1、 数据立方体 维是关于一个组织
29、想要记录的透视或实体; 每一个维都有一个表与之相关联,该表称 为维表,它进一步描述维; 多维数据模型围绕中心主题组织,主题用 事实表表示; 事实是数值的度量,事实表包括事实的名 称或度量,以及每个相关维表的关键字。,第一节 多维数据模型,1、 数据立方体 设某BSEK北星易家连锁公司由下列关系表描述: Customer(cust_id,name,address,age,) Item(item_id, name,type,price,) Employee (empl_id, name,salary,) purchases(trans_id, cust_id , empl_id , date,ti
30、me,method_paid,amount,) Branch(branch_id, name,address),第一节 多维数据模型,1、 数据立方体 例如,BSEK可能创建一个数据仓库sales,记录商店的销售情况,涉及time,item和location。典型3-D立方体如图:,多维模型,第一节 多维数据模型,2、 多维数据库模式 E-R数据模型适用于OLTP,而数据仓库需要简明的、面向主题的模式,便于联机数据分析。数据仓库的数据模型采用多维数据模型。 星型模式 雪花模式 事实星座模式,第三节 数据仓库的实现,1、数据立方体的有效计算 多维数据分析的核心是有效地计算多个维集合上的聚集,类似
31、于SQL中的分组。 基本立方操作及实现 部分物化 数据立方体计算中多路数组聚集,第三节 数据仓库的实现,2、索引OLAP数据 位图索引 连接索引 复合连接索引,第四节 基于数据仓库的数据挖掘,1、 数据仓库的使用 数据仓库的三种应用: 信息处理 分析处理 数据挖掘,第四节 基于数据仓库的数据挖掘,1、 数据仓库的使用 信息处理:支持查询和基本的统计分析,并使用交叉表、表、图表或图进行报告。数据仓库信息处理的当前趋势是构造低成本的基于Web的存取工具,然后与Web浏览器集成在一起。,第四节 基于数据仓库的数据挖掘,1、 数据仓库的使用 分析处理:支持基本的OLAP操作,包括切片与切块、下钻、上卷
32、和转轴。一般在汇总的和细节的历史数据上操作,它支持数据仓库的多维数据分析。,第四节 基于数据仓库的数据挖掘,1、 数据仓库的使用 数据挖掘:支持知识发现,包括找出隐藏的模式和关联,构造分析模型,进行分类和预测,并用可视化工具提供挖掘结果。 数据挖掘不限于分析数据仓库中的数据,比OLAP更自动化,更深入,应用更广。,第四节 基于数据仓库的数据挖掘,2、 从OLAP到OLAM OLAM联机分析挖掘将联机分析处理与数据挖掘以及多维数据库中的发现知识集成在一起。 数据仓库中的数据高质量 环绕数据仓库的有价值的信息处理基础设施 基于OLAP的探测式数据分析 数据挖掘功能的联机选择,4.2 多维数据模型上
33、的OLAP操作:,4、 多维数据模型上的OLAP操作:有钻取(Drill-up和Drill-down)、切片(Slice)和切块(Dice)、以及旋转(Pivot)等。 钻取:是改变维的层次,变换分析的粒度。它包括向下钻取(Drill-down)和向上钻取(Drill-up)/上卷(Roll-up)。Drill-up是在某一维上将低层次的细节数据概括到高层次的汇总数据,或者减少维数;而Drill-down则相反,它从汇总数据深入到细节数据进行观察或增加新维。 切片和切块:是在一部分维上选定值后,关心度量数据在剩余维上的分布。如果剩余的维只有两个,则是切片;如果有三个或以上,则是切块。 旋转:是
34、变换维的方向,即在表格中重新安排维的放置(例如行列互换)。,4、 多维数据模型上的OLAP操作 概念分层将属性或维组织成渐进的抽象层,它将低层概念映射到更一般的高层概念。概念分层对于多抽象层上的挖掘有用。,4.2 多维数据模型上的OLAP操作:,4、 多维数据模型上的OLAP操作 上卷(roll-up) 下钻(drill-down) 切片(slice)、切块(dice) 转轴 (pivot) 钻过( drill-across) 钻透( drill-through),4.2 多维数据模型上的OLAP操作:,4、 多维数据模型上的OLAP操作 上卷:通过一个维的概念分层向上攀升或通过维归约,在数据
35、立方体上进行聚集。 下钻:通过沿维的概念分层向下或引入新的维来实现,它是上卷的逆操作,由不太详细的数据到更详细的数据。,4.2 多维数据模型上的OLAP操作:,4、 多维数据模型上的OLAP操作 切片:切片操作在给定的数据立方体的一个维上进行选择,导致一个子方。 切块:切块操作通过对两个或多个维执行选择,定义子方。 转轴:是一种目视操作,它转动数据的视角,提供数据的替代表示。,4.2 多维数据模型上的OLAP操作:,4、 多维数据模型上的OLAP操作 钻过:执行涉及多个事实表的查询。 钻透:操作使用关系SQL机制,钻到数据立方体的底层,到后端关系表。 OLAP的许多特征体现在统计数据库(SDB
36、)的早期工作中,而SDB 关注社会经济应用,OLAP旨在商务应用以及有效处理海量数据。例如书P49,4.2 多维数据模型上的OLAP操作:,OLAP服务器的类型,3、 OLAP服务器的类型 关系OLAP(ROLAP)服务器 多维OLAP(MOLAP)服务器 混合OLAP(HOLAP)服务器 特殊的SQL服务器,OLAP的12条准则 1、Multidimensional conceptual view OLAP模型必须提供多维概念视图 User-analysts would view an enterprise as being multidimensional in nature for ex
37、ample, profits could be viewed by region, product, time period, or scenario (such as actual, budget, or forecast). Multi-dimensional data models enable more straightforward and intuitive manipulation of data by users, including slicing and dicing. 分析用户能自然的视企业为一个多维模型,例如,利润可以按区域,产品,时间,或方案(如实际,预算或预测)查看
38、。多维数据模型能让用户更直接和方便的操作数据,包括“切片和切块” 2、Transparency 透明性 When OLAP forms part of the users customary spreadsheet or graphics package, this should be transparent to the user. OLAP should be part of an open systems architecture which can be embedded in any place desired by the user without adversely affect
39、ing the functionality of the host tool. The user should not be exposed to the source of the data supplied to the OLAP tool, which may be homogeneous or heterogeneous. 当OLAP以用户习惯的方式提供电子表格或图形显示时,这对用户应该是透明的。OLAP应该是开发系统架构的一部分,这个架构能按用户的需要嵌入到任何地方,而不会对主机工具的功能产生副作用。用户不应该接触到提供给OLAP工具的数据源,这些数据可能是同构的或是异构的,OLAP
40、的12条准则 3、Accessibility 存取能力准则 The OLAP tool should be capable of applying its own logical structure to access heterogeneous sources of data and perform any conversions necessary to present a coherent view to the user. The tool (and not the user) should be concerned with where the physical data comes
41、 from. OLAP工具应该有能力利用自有的逻辑结构访问异构数据源,并且进行必要的转换以提供给用户一个连贯的展示。是OLAP工具而不是用户需要关心物理数据的来源 4、Consistent reporting performance 稳定的报表能力 Performance of the OLAP tool should not suffer significantly as the number of dimensions is increased. OLAP工具的性能不应该因维度增加而受到明显的影响,OLAP的12条准则 5、Client/server architecture 客户/服务器
42、体系结构 The server component of OLAP tools should be sufficiently intelligent that the various clients can be attached with minimum effort. The server should be capable of mapping and consolidating data between disparate databases. OLAP工具的服务器端应该足够的智能让多客户的以最小的代价连接。服务器应该有能力映射和巩固不同数据库的数据 6、Generic dimensi
43、onality 维的等同性准则 Every data dimension should be equivalent in its structure and operational capabilities. 每个数据维度应该具有等同的结构和操作能力,OLAP的12条准则 7、Dynamic sparse matrix handling 动态的稀疏矩阵处理 The OLAP servers physical structure should have optimal sparse matrix handling. OLAP服务器的物理结构应能处理最优稀疏矩阵 8、 Multi-user sup
44、port 多用户支持能力 OLAP tools must provide concurrent retrieval and update access, integrity and security. OLAP应提供并发获取和更新访问,保证完整和安全的能力 9、 Unrestricted cross-dimensional operations 非受限的跨维操作 Computational facilities must allow calculation and data manipulation across any number of data dimensions, and must
45、not restrict any relationship between data cells. 计算设备必需允许跨数据维度的计算和数据操作,不能限制任何数据单元间的关系。,OLAP的12条准则 10、Intuitive data manipulation 直观的数据操纵 Data manipulation inherent in the consolidation path, such as drilling down or zooming out, should be accomplished via direct action on the analytical models cell
46、s, and not require use of a menu or multiple trips across the user interface. 数据操作应在固定的路径下,例如钻或缩小,应该通过直接在分析模型的单元上完成,而不需要目录货多次的用户交互 11、Flexible reporting 灵活的报表生成 Reporting facilities should present information in any way the user wants to view it. 报表设备应该能以用户需要的任何方式展现信息 12、Unlimited dimensions and agg
47、regation levels. 不受限的维与聚集层次 The number of data dimensions supported should, to all intents and purposes, be unlimited. Each generic dimensions should enable an essentially unlimited number of user-defined aggregation levels within any given consolidation path. 数据维度数量应该是无限的,用户在每个通用维度上定义的聚集聚合层次应该是无限的。
48、,主要厂商产品介绍 1、Hyperion HyperionEssbaseOLAPServer,在上面有超过100个的应用程序,有300多个用Essbase作为平台的开发商。具有几百个计算公式,支持过程的脚本预言,及统计和基于维的计算。 强大的OLAP查询能力,利用EssbaseQueryDesigner,商业用户可以不用IT人员的帮助自己构件复杂的查询。 广泛的应用支持,可以扩展数据仓库和ERP系统的价值,建立对电子商务、CRM、金融、制造业、零售和CPG(consumerpackagedgoods)等应用的分析程序。 Speed-of-Thought的响应时间,支持多用户同时读写 Web-E
49、nabled的,以服务器为中心的体系结构,支持SMP 强大的合作伙伴提供完整的解决方案,60多个包装好的解决方案,300多个咨询和实施公司。 丰富的前端工具,有30多个前端工具可供选择,其中包括Hyperion自己的WiredforOLAP、Spider-ManWebApplication、Objects、EssbaseSpreadsheetAdd-In、WebGateway、Reporting。,主要厂商产品介绍 1、Hyperion HyperionEnterprise,为跨国公司提供的财务整合、报告和分析的解决方案。有3000多家组织在使用此套系统。 功能丰富:支持多种财务标准USGAA
50、P,CanadianGAAP,UKGAAP,国际会计标准(ISA),FASB,HGB。分公司间交易的自动平帐。FAS52货币转换。FAS94。 易用:可通过Excel,Lotus1-2-3和各种浏览器访问系统。 支持公司结构的调整。跨国公司的支持:同时支持6种语言及各个不同国家的法律和税收要求。 完整的过程控制和审计跟踪,及安全等级的设置。 能与ERP或其他数据源集成 HyperionPillar,预算和计划工具。全球用户超过1500家,提供基于活动的预算,基于项目的计划,集中式计划,销售预测和综合计划。 分布式体系结构 详细计划的制订:允许一线经理制订详细的计划 复杂的建模和分析能力,主要厂
51、商产品介绍 2、Oracle ExpressServer提供全面的OLAP能力,有全球超过3000家用户 用户可通过Web和电子表格使用 灵活的数据组织方式,数据可以存放在ExpressServer内,也可直接在RDB上使用 有内建的分析函数和4GL来用户自己定制查询 3、Cognos PowerPlay,为商务效率评价BPM(BusinessPerformanceMeasurement)提供全面的报告和分析环境。向决策者提供企业运行效率的各种关键数据,进行各种各样的分析。 只用鼠标点击、拖拉就可以浏览多维数据 自动利用Web发布得到的分析报告 支持多种OLAPServer:Microsoft
52、OLAPServices、HyperionEssbase、SAPBW、IBMOLAPforDB2 完备的授权和安全体系 NovaView,是MicrosoftSQLServer7.0OLAPServices的客户端应用程序。,主要厂商产品介绍 5、MicroStrategy MicroStrategy7,是新一代的智能平台(IntelligencePlatform)面向电子商务应用e-business和电子客户关系管理eCRM。 具有强大的分析能力 以Web为中心的界面 支持上百万的用户和TB的数据 快速开发能力,可直接利用已有的数据模式 6、Intelligence Server,One for a
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 南京弹性放学实施方案
- 智慧云消防实施方案
- 章程落实工作方案
- 高考运输应急工作方案
- 警营文化建设具体方案
- 河南省安阳市2025-2026学年统编版九年级历史下学期中考一模试卷(含答案)
- 隔音墙施工专项方案
- 污水处理系统安装与调试方案
- 2025年气象预警矩阵助力物流行业安全运输可行性分析报告
- 生物质能设备2025年质量安全控制与能源利用方案
- 土地整治安全生产制度
- 高中政治命题培训课件
- 免疫治疗PRO不良反应预警模型
- 《埋地给水钢管道水泥砂浆衬里技术标准》
- 精神疾病医疗证明模板大全
- 2025年承包商入场安全教育试卷(含答案)
- 公交站整体吊装施工方案
- 水性漆喷涂工艺流程图
- 实施指南(2025)《CB4205-2012 重大件吊装作业安全要求》
- 水文站职工安全培训内容课件
- 气动工具安全培训课件
评论
0/150
提交评论