




已阅读5页,还剩7页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
内容出处:/tips/435/8125435.shtmlOLAP基本概念概述(组图)作者: 戴羽, 出处:IT专家网,责任编辑: 李书琴, 2008-05-21 10:46这一系列文章旨在使你从OLAP的基础概念到更高级的特性例如使用OLAP分析函数的大型库创建你自己的计算,以及更具数据库管理员类型的主题例如监控立方体数据加载和聚合过程。 【IT专家网独家】什么是OLAP?联机分析处理(OLAP)是一个被广泛使用从而丢失了它原有意思的词。在最初,在1990年代初,这个词是用来描述计算机系统的一个类,这个类是用来设计优化以用于分析的。现在这个词对于Oracle OLAP还保持原汁原味,但是对于现在市场中可用的其它解决方案来说却不是了。OLAP是关于使用商业数据而不必了解后台存储机制并具有智能地、透明地支持一个公司内存在的许多不同类型商业规则的能力。例如,一个非常简单和显而易见的例子是股票。大多数查询工具不了解怎样正确地分析股票,是用户来选择正确的聚合方法。通过使用这个术语,就可以区分商业分析师和高级管理团体的更多分析需求和能够容易并快速地由对事务处理(OLTP)系统的直接查询就可获得的一般基础需求。OLAP现在变为了更基础的环境,它现在是主要围绕使用“商业智能”这个术语。在这里强调的重点是“联机”或动态访问,以及在报表生成方面更加强调“分析”这个术语。那么这些术语联机和分析是什么意思呢?联机Online: 尽管大多数OLAP工具和应用程序使得可以开发在没有连接到实时数据时能够保存和打印的报表,但是OLAP强调了动态连接到数据而不是生成静态报表。分析查询是针对数据库实时提交的,而且结果也是实时返回的。分析处理:这是OLAP的关键概念。终端用户可以: 轻松地操纵多维数据来执行不可预知的热添加查询以及以多种有趣的形式显示结果。 在维度和立方体间透明地管理商业规则。 探索细节级别以显示数据的重要方面 快速并有效地获取数据计算和多维数据间选择的结果。一个标准的事务报表或查询可能会问“订单84305是什么时候发货的?”这个查询反映了进行业务操作的基本机制。它围绕简单的数据选择和很少或根本没有计算过程。它可以直接从事务系统来回答,而且很可能不会影响其它操作。每一个公司需要信息的这个基本等级。相比较而言,OLAP系统一般是部署以扩展和加强一个公司回答更广泛的关于他们在他们的事务系统中收集数据的商业问题的能力: 这个季度在欧洲我们的10大收益产品的销售状况与去年相比怎么样? 地区的产品销售与全球的销售相比区别是什么? 我们的预计、服务的价格、每个产品的成本、销售、成本趋势和未来12个月的利润都是怎样的? 过去哪些产品构成了我们各个地区收益的40%?这些问题更加具有分析性和更为复杂,而且随着用户研究一个商业问题或机会时一个问题的解答通常导致另一个问题的产生。OLAP旨在使终端用户可以轻松地提问这类分析而不必要求以下内容: 从IT部门得到的协助 编程技能 关于数据库组织结构的技术知识。还需要能够快速地得到查询结果以便分析师的思路不会被打断以及分析的价值不会被降低。一个典型的多维商业查询,应该是像下面这样:对于在世界各地,我们的收益前20的产品在过去三个月与去年同期相比百分比变化是多少?这个简单的商业问题描述了用户想检查的数据以及数据的结构格式。商业用户一般想回答问题时包括像什么、哪里、谁和什么时候等的术语。例如,你会发现下面这些重要问题也被包含进了这个示例问题: 什么产品卖得最好?(“前20%”) 他们在哪卖?(“世界各地”) 他们什么时候卖得最好?(“收益的百分比变化”)如果你仔细地查看这个询问,你就会发现它其实是一个很复杂的问题。当我在会议上做演示时我讨论过这类问题,你总会发现客户能指出数据库管理员的错误,他们总是立即将这个问题转化为一个SQL语句。当然是可以创建一个SQL查询来回答这个问题的。但是让我们把这个问题分解并更仔细的看看它: 有两个计算(收益方面的百分比变化以及过去三个月的总额)。 有个排列元素(产品的前20%) 有聚合(地理维度的地区等级)。 多维选择(指定的产品,指定的时间段,和指定的区域)。 查询的结果是多维数据视图(也许是屏幕上一个列表显示,也许是显示为一个图表,或两者都有)。我想现在许多人会同意这个问题看起来的确是个复杂的问题。为了在传统的查询里试验和设计它,报表生成工具会要求很高的技术。而且不要忘了这是分析的开始而不是最终结果。这个查询返回的数据可能会引起其它更有趣和复杂的查询。但是这个查询的复杂性是技术问题而不是商业问题。因此,OLAP技术的一个关键目标是使得终端用户易于对他们的数据提出这样的问题而不会增加IT部门的负担。OLAP是怎么使它简单的呢?商业用户在维度上思考。通过设计,OLAP技术以一种空间方式存储、处理和显示数据。OLAP系统的数据模型反映了用户关于它们的商业数据的图画,使得很容易以商业术语显示查询。OLAP系统被优化以快速获取数据用于维度分析。我们现在将检查多维逻辑模型,它为OLAP系统的基础服务。在OLAP模型中的主要对象 大多数OLAP数据模型是围绕两个主要概念建立的:度量和维度。度量度量显示了实际的数据,它们有时被成为“事实”。度量的典型例子有销售、成本、收益和利润。度量是由一个或多个维度组织而成的。许多人将度量想象为一个简单的立方体类的形状,这个形状的边缘是维度而这个形状的内容是度量值。下面的图片显示了一个一般的简单三维度量。当然度量不只局限于三维定义。一个度量可以按要求有许多也可以有很少的维度以精确地管理与这个度量关联的数据。此外,Oracle的OLAP选项使你可以设计和管理多个立方体,而每一个有不同的维度。而且Oracle OLAP支持一些不同的数据类型用于度量,例如:numeric(Oracle SQL数据类型)、decimal、integer、text、date和boolean。度量可以被划分为两个范畴: 存储度量 计算(或获取)度量存储度量是直接加载、聚合和存储进数据库。它们可以从存储的计算结果中获取。例如一个预测可以从另一个度量例如收入和存储在数据库中的预测计算结果中获得。计算度量是查询时动态计算度量的值。只有计算规则是存储在数据库中的。常见的计算包括比率、差异、移动总和以及平均值。计算不要求磁盘存储空间,而且它们不增大数据维护所要求的处理时间。注意:Oracle OLAP有一个具有几百个多维计算函数的库,这些函数可以用在计算度量中。它甚至可以为OracleOLAP的专业用户用于定义他们自己的函数以执行实际的任何计算。从一个商业用户的角度来看,这两个度量都以同样的方式显示和使用,并且具有同样快速的查询访问。只要和终端用户界面关联,那么所有的度量都是相等的。然而,它是很有用的,比如它至少通过一个工具条提供了对一个计算度量定义的访问,避免了混淆。下面是一个典型的报表示例,它包含了存储和计算这两种度量。两个计算字段是“Profit”和“Margin”。因为这两种类型的度量都是被看作是一样的,所以商业用户可以在查询、环境中使用它们以生成彩色代码、异常报告等等。那么立方体和度量间的区别是什么呢? 如果你使用过Analytic Workspace Manager,那么你就应该熟悉立方体的概念。这是一个高级容器,它对于商业用户查询OLAP数据、分组共享相同维度的度量来说是不可见的。立方体确实使你的生活更加简单,比如在共同管理一整个度量分组、将它们都存储到一个XML模板中、通过一个单独的引用加载数据到一个度量分组中等等。维度维度通过形成度量的边缘从而确认和分类你的度量中的数据。维度的例子包括产品、地理、时间和分销渠道。维度有三个主要的组成部分: 层级 级别 属性有了Oracle OLAP数据模型,维度就只存储一次并可以重复使用。这使得维度和它们的成员可以在度量中共享。维度形成了一个度量的边缘,而成员指向多维度量中的各个单元,如同上面所看到的。在下面的示例中,只有一个时间维度,尽管它显示了三个时间。在图片中的这三个度量有不同的形状,或维度。Sales和Units都是以Customer、Product和Time为维度的。Price只能以Product和Time为维度,它不使用Customer维度,因为价格不随客户的不同而不同。层级维度层级是可选的,但是OLAP系统常见的。一个层级是一个逻辑结构,它将一个维度的成员分组以用于分析。例如: 一个Time维度可能有一个描述了月份怎样分组以显示一个季度和季度怎样分组以显示一个整年的层级。 一个Organization维度可能有一个使得你可以很容易地确认一个特定经理直属报告的层级。如果需要的话每一个维度都可以有多个层级。例如,时间维度可以有一个层级显示Julian日历,而另一个层级显示一个财务日历。一个维度的结构是基于父子关系来组织层级的。这些关系使得: 在级别间导航: 维度的层级使得可以向下钻取到更低的级别或导航(向上钻取)到更高的级别。在时间维度的成员“2005”上向下钻取会将你导航到从2005 Q1到2005 Q4。在一个日历年份层级中,对2005 Q1向下钻取会将你导航到从05年1月到05年3月。这类的关系使得用户更加容易地导航大型多维数据。 从子值到父值的聚合:父亲显示了它的孩子的聚合。较低级别的数据值聚合进更高级别的数据值。维度被组织为层次化以便不同聚合级别的数据可以一起有效地操纵以用于分析和显示。 从父值到子值的分配:聚合的相反是分配,它经常被计划、预算和类似的应用程序所使用。这里,层级的角色是确认特定维度成员的孩子和子孙以用于“从上至下”的预算分配(在其它使用中)。 将成员分组以用于计算: 共享和索引计算利用了层级关系(例如,每一个产品所占总收益的百分比),或者产品收入在某一范畴的百分比,或者一个零售区域的成本占地理区域的百分比)。在这个例子中,你可以进行下面的产品层级: 在层级中从最低到最高的每一个级别中导航。 从最高级别导航到最低级别。 聚合层级中从最低级别获取的数据(各个产品)到最高级别(总产品)。级别每一个级别显示了层级中的一个位置。底层级别上的级别包含了聚合它下面级别的值。不同级别的成员有一个一对多的父子关系。一个层级一般包含几个级别,而一个单独的级别可以包含进不只一个的层级。如果Sales度量的数据是存储在Product级别的,那么产品维度的更高级别使得销售数据可以正确地聚合进Subcategory、Category,以及所有的Products级别。如果在一个维度上建有多个层级,那么可能一个层级会显示在不只一个的层级中或可能只存在于一个层级中。层级的类型 在一个多维模型中,有两个基本的层级类型: 基于等级 基于值大多数层级是基于等级的,包括在上一节中显示的产品维度层级和这一节中显示的时间维度层级。在时间层级示例中,在层级中有日、月、季度和年份级别。销售一般也有一个基于级别的结构,如下面的例子所示:Representative Area Region Country Continent World其它的维度可能有不是很严格的基于级别的层级,例如:在公司图表中有一个清晰的层级,但是总裁的所有直属报告可能不是在同一级别。在这个例子中,两个VP(副总裁)和总裁的Admin(行政助理)都是总裁的直属报告,但是他们不是在同一级别。VP不是Admin级别,Admin也不是VP级别。属性属性提供了关于维度成员的描述信息,并且当你选择维度成员用于分析的时候也是可用的: 选择颜色(属性)是“蓝色”的产品。 选择有两个孩子的客户。 选择类型是“Multipack”的提升。 选择描述包含“January”的所有时间段。大多数属性类型是可选的。Oracle OLAP允许如果必要的话可以选择创建大量的属性。一些属性对于维度的所有成员都是有效的,无论是什么级别。例如,所有级别的所有产品都有一个描述。其它属性只对于特定级别或特定层级是有效的。例如,只有单个的产品项目才有颜色。在上面的图片中,在产品维度上,特定的产品和这个层级中它们的父级别(subcategories和categories)一起显示出来。此外,这些产品的两个示例属性(Color和Product Manager)也显示了出来。其它的典型属性示例可能包括:对于产品维度: Color、Flavor、Pack Size、Brand Manager Name等等对于客户维度: Gender、Marital Status、Date of Birth和其它的统计信息
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 样貌特征测试题及答案
- 北京知识产权师培训班课件
- 2025年第一季度护理管理制度考核试题考题答案
- 营养专科护士培训考试题及答案
- 医院传染病防控知识培训考核试题(附答案)
- 护理导论知识练习测试题(含答案)
- 2024年上海市浦东新区高桥镇新益村社区工作人员考试模拟试题及答案
- 北京房屋测绘培训课件
- 2025年注册会计师重点试题带答案
- 标日课件第九课
- 茶叶加工工安全技术操作规程
- 2025年云南高考地理试题解读及答案详解讲评课件
- 江苏清泉化学股份有限公司年产4000吨呋喃、1000吨四氢呋喃丙烷、3000吨四氢呋喃技改项目环评资料环境影响
- 新型医药销售外包(CSO)行业跨境出海项目商业计划书
- 口腔诊室6S管理
- 2025-2030年中国外墙外保温系统行业市场现状供需分析及投资评估规划分析研究报告
- 文印员考试题库及答案
- 安全总监考试试题及答案
- XX学校(幼儿园)食堂管理各岗位廉政(廉洁)风险点及防控措施一览表
- 钢结构钢爬梯包工包料合同范本
- 家庭房屋财产协议书
评论
0/150
提交评论