版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、OLAP(在线分析处理)技术一、 发展背景60年代,关系数据库之父提出了关系模型,促进了联机事务处理(OLTP)的发展(数据以表格的形式而非文件方式存储)。1993年,提出了OLAP(联机分析处理)概念,认为OLTP已不能满足终端用户对数据库查询分析的需要,SQL对大型数据库进行的简单查询也不能满足终端用户分析的要求。用户的决策分析需要对关系数据库进行大量计算才能得到结果,而查询的结果并不能满足决策者提出的需求。因此,提出了多维数据库和多维分析的概念,即OLAP技术概念。OLTP与OLAP的不同点:OLTP数据OLAP数据原始数据导出数据细节性数据综合性和提炼性数据当前值数据历史数据可更新不可
2、更新,但周期性刷新一次处理的数据量小一次处理的数据量大面向应用,事务驱动面向分析,分析驱动面向操作人员,支持日常操作面向决策人员,支持管理需要二、 关于OLAP 定义OLAP(联机分析处理) :是使分析人员、管理人员或执行人员能够从多种角度对从原始数据中转化出来的、能够真正为用户所理解的、并真实反映企业维特性的信息进行快速、一致、交互地存取,从而获得对数据的更深入了解的一类软件技术OLAP委员会的定义(请特别注意,这是一类技术,而非特指某软件、或管理方法)。OLAP的目标:是满足决策支持或多维环境特定的查询和报表需求,它的技术核心是“维”这个概念,因此OLAP也可以说是多维数据分析工具的集合。
3、 OLAP相关基本概念:1、维:是人们观察数据的特定角度,是考虑问题时的一类属性,属性集合构成一个维(时间维、地理维等)。2、维的层次:人们观察数据的某个特定角度(即某个维)还可以存在细节程度不同的各个描述方面(时间维:日期、月份、季度、年)。3、维的成员:维的一个取值。是数据项在某维中位置的描述。(“某年某月某日”是在时间维上位置的描述)4、多维数组:维和变量的组合表示。一个多维数组可以表示为:(维1,维2,维n,变量)。(时间,地区,产品,销售额)5、数据单元(单元格):多维数组的取值。(2000年1月,上海,笔记本电脑,$100000) OLAP的特性1、快速性:用户对OLAP的快速反应
4、能力有很高的要求,主要是指计算机的计算的反应速度,系统应能在5秒内对用户的大部分分析要求做出反应,但对业务数据的实时信息却很难反应。 2、可分析性:OLAP系统应能处理与应用有关的任何逻辑分析和统计分析。3、多维性:多维性是OLAP的关键属性。系统必须提供对数据的多维视图和分析,包括对层次维和多重层次维的完全支持。4、信息性:不论数据量有多大,也不管数据存储在何处,OLAP系统应能及时获得信息,并且管理大容量信息。 OLAP多维数据结构1、超立方结构(Hypercube) :超立方结构指用三维或更多的维数来描述一个对象,每个维彼此垂直。数据的测量值发生在维的交叉点上,数据空间的各个部分都有相同
5、的维属性。(收缩超立方结构。这种结构的数据密度更大,数据的维数更少,并可加入额外的分析维)。 2、多立方结构(Multicube):即将超立方结构变为子立方结构。面向某一特定应用对维进行分割, 它具有很强的灵活性,提高了数据(特别是稀疏数据)的分析效率。 三、 OLAP多维数据分析1、切片和切块(Slice and Dice):在多维数据结构中,按二维进行切片,按三维进行切块,可得到所需要的数据。如在“城市、产品、时间”三维立方体中进行切块和切片,可得到各城市、各产品的销售情况。OLAP分析示意图:2、钻取(Drill) :钻取包含向下钻取(Drill-down)和向上钻取(Drill-up)
6、/上卷(Roll-up)操作, 钻取的深度与维所划分的层次相对应。3、旋转(Rotate)/转轴(Pivot):通过旋转可以得到不同视角的数据。 四、 OLAP分类1、OLAP分类 2、OLTP、ROLAP与MOLAP模式3、ROLAP的星型模式(Star Schema)事实表:用来存储事实的度量值和各个维的码值。维表:用来存放维的元数据(维的层次、成员类别等描述信息)。4、MOLAP的多维立方体(Multicube)5、数据组织形式6、ROLAP与MOLAP的性能对比ROLAPMOLAP优势没有大小限制 现有的关系数据库的技术可以沿用可以通过SQL 实现详细数据与概要数据的存储 现有关系型数
7、据库已经对OLAP 做了很多优化,包括并行存储、并行查询、并行数据管理、基于成本的查询优化、位图索引、SQL 的OLAP 扩展(cube,rollup) 等大大提高ROALP 的速度性能好、响应速度快 专为OLAP所设计 支持高性能的决策支持计算复杂的跨维计算多用户的读写操作n 行级的计算缺点一般比MDD 响应速度慢 不支持有关预计算的读写操作 SQL 无法完成部分计算无法完成多行的计算无法完成维之间的计算增加系统复杂度,增加系统培训与维护费用受操作系统平台中文件大小的限制,难以达到TB 级(只能1020G)需要进行预计算,可能导致数据爆炸无法支持维的动态变化缺乏数据模型和数据访问的标准五、O
8、LAP体系结构 六、OLAP评价准则Ø OLAP模型必须提供多维概念模型 Ø 透明性准则 Ø 存取能力准则 Ø 稳定的报表性能 Ø 客户/服务器体系结构 Ø 维的等同性准则 Ø 动态稀疏矩阵处理准则 Ø 多用户支持能力准则 Ø 非受限的跨维操作 Ø 直观的数据处理 Ø 灵活的报表生成 Ø 非受限的维与维的层次 七、流行的OLAP工具介绍1、OLAP产品Ø Hyperion Essbase Ø Oracle Express Ø IBM DB2 OL
9、AP Server Ø Sybase Power dimension Ø Informix Metacube Ø CA OLAP SERVER Ø Microsoft analysis services Ø CognosØ MicroStrategyØ Brio Ø Business Object 2、OLAP工具性能对比Hyperion Essbase 以服务器为中心的分布式体系结构有超过100个的应用程序有300多个用Essbase作为平台的开发商具有几百个计算公式,支持多种计算用户可以自己构件复杂的查询快速的
10、响应时间,支持多用户同时读写有30多个前端工具可供选择支持多种财务标准能与ERP或其他数据源集成全球用户超过1500家 Oracle 9iOracle DW支持GBTB数量级采用类似数组的结构,避免了连接操作,提高分析性能提供一组存储过程语言来支持对数据的抽取用户可通过Web和电子表格使用灵活的数据组织方式,数据可以存放在Express Server内,也可直接在RDB上使用有内建的分析函数和4GL用户自己定制查询 IBM DB2 OLAP Server把Hyperion Essbase的OLAP引擎和DB2的关系数据库集成在一起。与Essbase API完全兼容数据用星型模型存放在关系数据库
11、DB2中Informix Metacube采用metacube技术,通过OLE和ODBC对外开放采用中间表技术实现多维分析引擎,提高响应时间和分析能力开放的体系结构可以方便地与其他数据库及前台工具进行集成Cognos- 提供整套的数据仓库应用产品,包括ETL、多维立方存储、前端展示工具。- 强大的专业化的OLAP 数据引擎(OLAP 服务器),它能产生多维数据分析的立方体(Cubes)- 采用集中方式、基于LDAP的安全管理机制- 企业级OLAP服务器,具有负载均衡、服务器容错,能支持大用户数和大数据量的访问MicroStrategy- 开发的API(包括COM、XML、Java)- 智能立方
12、体(Intelligent Cubes TM)- 支持大量用户及大数据量访问,支持TB级数据- ROLAP,提供OLAP Server,以及零客户端的web前端展现工具- 适合二次开发以及大量复杂二次运算Brio- 优秀的OLAP前端工具- ROLAP,可以接驳主流OLAP Server- 支持负载平衡八、OLAP发展应用领域市场和销售分析(Marketing and Sales analysis)电子商务分析(Clickstream analysis)基于历史数据的营销(Database marketing)预算(Budgeting)财务报告与整合(Financial reporting a
13、nd consolidation)管理报告(Management reporting)利益率分析(Profitability analysis)质量分析(Quality analysis)OLAP标准APB-1(AQT-Analytical Query Time作为统计指标)从联机分析处理到联机分析挖掘(OLAM/OLAP挖掘)将联机分析处理与数据挖掘以及在多维数据库中发现知识集成在一起。联机分析挖掘提供在不同的数据子集和不同的抽象层上进行数据挖掘的工具. 联机分析挖掘为用户选择所期望的数据挖掘功能动态修改挖掘任务提供了灵活性 。超立方体计算与传统挖掘算法的结合先进行立方体计算,后进行数据挖掘先对多维数据作数据挖掘,然后再利用立方体计算算法对挖掘结果分析立方体计算与数据挖掘同时进行回溯特性OLAP基于Web的应用
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2026年大北农隆平高科转基因玉米大豆品种布局对比
- 2026年私人银行智能投顾大模型资产配置方案
- 2026年溶剂法回收碳纤维的工艺优化与规模化应用前景
- 2026年自建风光发电制氢项目减排量核算实务
- 2026年养老金融产品覆盖养老准备财富积累消费支付全生命周期
- 2026年智能合约赋能供应链融资政府采购监管应用指南
- 2026年幸福颐养养老服务提升行动实施方案
- 2025年公务员(办公环境管理)试题及答案
- 2026年轮胎产品碳足迹认证:橡胶原料与生产工艺碳排放
- 2026山东东营锦苑大地幼儿园招聘幼儿园教师1人备考题库附答案详解【达标题】
- 《关于大众传媒》课件
- 《东北三省》白山黑水
- 建筑施工企业管理人员、从业人员安全生产责任书(参考范本2023年版)
- 齐齐哈尔大学化学专业实验分析实验报告
- Bankart损伤与Hill-Sachs损伤影像诊断
- 永磁电动机计算公式大全(电磁计算程序)精讲
- DB3701∕T 15-2020 基层网格化服务管理规范
- 公路工程监理工作程序及质量控制
- 幼儿园大班数学活动ppt课件《好玩的数数》
- 正清风痛宁及风湿与疼痛三联序贯疗法新详解演示文稿
- JJG 181-2005石英晶体频率标准
评论
0/150
提交评论