版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、2021-11-201五邑大学计算机学院五邑大学计算机学院何国辉何国辉数据数据仓库与数据挖掘仓库与数据挖掘 Data Warehouse and Data Mining2021-11-202数据仓库与数据挖掘数据仓库与数据挖掘 Data Warehouse and Data Mining第四章第四章 联机分析处理概述及模型联机分析处理概述及模型2021-11-203v OLAP技术是数据仓库中一项非常重要的分析技术,技术是数据仓库中一项非常重要的分析技术,是数据仓库技术的一个自然的延伸和继续。是数据仓库技术的一个自然的延伸和继续。v 是以海量数据为基础的复杂分析技术。是以海量数据为基础的复杂分
2、析技术。v 支持各级管理决策人员从不同角度,快速灵活地对支持各级管理决策人员从不同角度,快速灵活地对数据仓库中的数据进行复杂查询和多维分析处理。数据仓库中的数据进行复杂查询和多维分析处理。 4.1 OLAP技术概述技术概述2021-11-204v 最早由关系数据库之父最早由关系数据库之父E.F.Codd于于1993年提出。年提出。v 原因:原因:E.F.Codd认为联机事务处理已经不能满足终认为联机事务处理已经不能满足终端用户对数据库数据进行查询、分析的需要。端用户对数据库数据进行查询、分析的需要。v OLAP是基于是基于多维数据库多维数据库和和多维分析多维分析的。的。 4.1.1 OLAP的
3、起源的起源2021-11-205v OLAP委员会给出的定义:委员会给出的定义: 定义定义1:OLAP是针对某个特定的主题进行联机数是针对某个特定的主题进行联机数据访问、处理和分析,通过直观的方式从多个维度、据访问、处理和分析,通过直观的方式从多个维度、多种数据综合程度将系统的运营情况展现给使用者。多种数据综合程度将系统的运营情况展现给使用者。 定义定义2:OLAP是使分析人员、管理人员和执行人是使分析人员、管理人员和执行人员能够从多角度对信息进行快速、一致、交互地存员能够从多角度对信息进行快速、一致、交互地存取,从而获得对数据的更深入了解的一类软件技术。取,从而获得对数据的更深入了解的一类软
4、件技术。 4.1.2 OLAP的定义的定义2021-11-206v OLAP基本功能:基本功能: 能够对用户提出的各类复杂查询能够对用户提出的各类复杂查询快速响应快速响应。 具备多维建模能力。具备多维建模能力。 4.1.2 OLAP的定义(续)的定义(续)2021-11-207v 主要特点:主要特点: 快速性:快速性:能在很短的时间内对用户的大部分分析要能在很短的时间内对用户的大部分分析要求作出响应。求作出响应。 可分析性:可分析性:用户无需编程就可以定义新的专门计算,用户无需编程就可以定义新的专门计算,将其作为分析的一部分,并以用户所希望的方式给将其作为分析的一部分,并以用户所希望的方式给出
5、报告出报告,处理与应用相关的各种逻辑分析和统计分处理与应用相关的各种逻辑分析和统计分析。析。 多维性:多维性:提供对数据的多维视图和分析。提供对数据的多维视图和分析。 及时性:及时性:不论数据量有多大、数据存储在何处,应不论数据量有多大、数据存储在何处,应能及时获得信息,并且管理海量信息。能及时获得信息,并且管理海量信息。4.1.2 OLAP的定义(续)的定义(续)2021-11-208v OLAP与与OLTP数据比较数据比较4.1.3 OLAP与与OLTP的区别的区别OLTP数据数据OLAP数据数据原始数据原始数据导出数据导出数据细节性数据细节性数据综合性或提炼性数据综合性或提炼性数据当前数
6、据当前数据历史数据历史数据可更新可更新不可更新,但周期性追加和刷不可更新,但周期性追加和刷新新一次处理的数据量小一次处理的数据量小一次处理的数据量大一次处理的数据量大面向应用,事务驱动面向应用,事务驱动面向分析,分析驱动面向分析,分析驱动面向操作人员,支持日常操作面向操作人员,支持日常操作面向决策人员,支持管理需要面向决策人员,支持管理需要2021-11-209v 两者最终结果:两者最终结果: OLAP通过逐层细化、切片、切块、数据旋转等操通过逐层细化、切片、切块、数据旋转等操作,采用非数据处理专业人员容易理解的形式(多作,采用非数据处理专业人员容易理解的形式(多维报表、统计图形)展现结果。维
7、报表、统计图形)展现结果。 OLTP大多使用操作人员常用的固定表格方式显示大多使用操作人员常用的固定表格方式显示数据。数据。4.1.3 OLAP与与OLTP的区别(续)的区别(续)2021-11-2010v OLAP核心技术包括:核心技术包括: 多维数据模型:多维数据模型:是数据分析时用户的数据视图,是是数据分析时用户的数据视图,是面向分析的数据模型,用于给分析人员多种观察的面向分析的数据模型,用于给分析人员多种观察的视角和面向分析的操作。视角和面向分析的操作。 多维分析操作多维分析操作 多维查询及展示多维查询及展示 数据立方体数据立方体 .4.1.4 OLAP核心技术核心技术商品商品城市城市
8、日期日期牛奶浴巾毛巾可乐果汁43212021-11-2011v 研究内容:研究内容:主要研究多维数据的抽象表示问题。主要研究多维数据的抽象表示问题。v 采用方式:采用方式:通常采用数据立方体的方式表示。通常采用数据立方体的方式表示。v 实现目标:实现目标:允许管理决策人员对多维数据从不同的允许管理决策人员对多维数据从不同的角度进行快速、稳定和交互式的观察和存取。角度进行快速、稳定和交互式的观察和存取。v 存在三种模型:存在三种模型:星形模型、雪花模型、事实群模型。星形模型、雪花模型、事实群模型。 4.2 多维数据模型多维数据模型2021-11-2012v 多维数据模型是一个多维空间。多维数据模
9、型是一个多维空间。v 核心概念主要涉及:维、维成员、维层次、度量等。核心概念主要涉及:维、维成员、维层次、度量等。4.2.1 基本概念基本概念2021-11-2013v 维是人们观察数据的特定角度,是每个事物的属性。维是人们观察数据的特定角度,是每个事物的属性。v 如:在分析产品销售数据时,需要知道在什么时候?如:在分析产品销售数据时,需要知道在什么时候?什么地区?销售什么产品?就涉及到观察的什么地区?销售什么产品?就涉及到观察的时间时间、地区地区、产品产品三个角度。三个角度。v 维是商业活动中的一个基本要素。维是商业活动中的一个基本要素。v 每个维都有一个唯一的名字,如:时间维、地区维、每个
10、维都有一个唯一的名字,如:时间维、地区维、产品维等。产品维等。1. 维维2021-11-2014v 维成员(维成员(member) 维由一些维成员构成。维的一个取值称为维的一个维由一些维成员构成。维的一个取值称为维的一个成员。成员。如果维已经分成了若干个维层次,那么维成如果维已经分成了若干个维层次,那么维成员就是不同维层次取值的组合。员就是不同维层次取值的组合。1. 维(续)维(续)商品商品城市城市日期日期牛奶浴巾毛巾可乐果汁4321商品、城市、日期维工业 国家 年商品 市 日类别 省 月2021-11-20151. 维(续)维(续)销售地区销售地区西南西南华中华中华东华东四川四川云南云南河南
11、河南湖北湖北江苏江苏上海上海2021-11-2016v 维层(维层(level) 人们观察数据时,除了要从某一个角度去观察外,人们观察数据时,除了要从某一个角度去观察外,还需要从不同的细节程度去观察,这些不同的细节还需要从不同的细节程度去观察,这些不同的细节程度就称为不同的维层次。程度就称为不同的维层次。 如:销售地区维有分区、省、市,对于时间维有日、如:销售地区维有分区、省、市,对于时间维有日、月、季度。月、季度。1. 维(续)维(续)2021-11-2017地区维的维成员之间的层次关系实例。地区维的维成员之间的层次关系实例。1. 维(续)维(续)商店商店.北京河北.华北华东.总部中国美国.
12、2021-11-2018维层之间以及维层与成员的关系。维层之间以及维层与成员的关系。1. 维(续)维(续)商店商店.北京保定.华北华东.总部中国美国.总部国家地区城市商店2021-11-2019v 维层次(维层次(hierarchy) 在一个维中可以有多种分类方法,把每种分类方法在一个维中可以有多种分类方法,把每种分类方法叫做一个层次。叫做一个层次。 如:时间维的两个层次。如:时间维的两个层次。1. 维(续)维(续)年季度月星期日2021-11-2020v 维属性(维属性(attribute) 维属性说明维成员所具有的特征。维属性说明维成员所具有的特征。 如:在地区维的商店这一层定义如:在地区
13、维的商店这一层定义“负责人负责人”、“商商店类型店类型”等属性,在城市层上定义等属性,在城市层上定义“人口人口”、“面面积积”等属性。等属性。1. 维(续)维(续)2021-11-2021v 度量是要分析的目标或对象,度量是要分析的目标或对象,是多维数据集的核心是多维数据集的核心值值,是最终用户在数据仓库应用中需查看的数据。是最终用户在数据仓库应用中需查看的数据。v 常见的度量有:销售量、供应量、营业额等。常见的度量有:销售量、供应量、营业额等。v 通常是具体数据值。通常是具体数据值。2. 度量度量商品商品城市城市日期日期牛奶浴巾毛巾可乐果汁4321究竟想了解什么?究竟想了解什么?2021-1
14、1-20222. 度量(续)度量(续)2021-11-2023v 多维数据模型构成的多维数据空间称作为数据立方多维数据模型构成的多维数据空间称作为数据立方体(体(Data CubeData Cube,简记为,简记为cubecube)。)。v 是是从不同角度对同一数据进行观察得到的数据交点。从不同角度对同一数据进行观察得到的数据交点。v 当观察的角度(参数)超过三个所构成的数据结果当观察的角度(参数)超过三个所构成的数据结果集称为集称为超立方体超立方体,也称为,也称为超维数据集超维数据集。3. 数据立方体数据立方体2021-11-2024v 一个二维数据立方体对应的某地区商店销售额表一个二维数据
15、立方体对应的某地区商店销售额表3. 数据立方体(续)数据立方体(续)时间(季度)时间(季度)产品类型产品类型彩电彩电冰箱冰箱洗衣机洗衣机家用电器家用电器第一季度第一季度500万万200万万240万万1500万万第二季度第二季度200万万300万万420万万2100万万第三季度第三季度240万万500万万250万万1000万万第四季度第四季度80万万100万万320万万1700万万2021-11-2025v 一个三维数据立方体(增加地区维)对应的一个三维数据立方体(增加地区维)对应的20092009年年商店销售额表商店销售额表3. 数据立方体(续)数据立方体(续)时间(季度)时间(季度)山东省所
16、有商店销售额山东省所有商店销售额河北省所有商店销售额河北省所有商店销售额福建省所有商店销售额福建省所有商店销售额产品类型产品类型产品类型产品类型产品类型产品类型彩电彩电冰箱冰箱洗衣洗衣机机家用电家用电器器彩电彩电冰箱冰箱洗衣洗衣机机家用电家用电器器彩电彩电冰箱冰箱洗衣洗衣机机家用电家用电器器第一季度第一季度500万万200万万240万万1500万万500万万200万万240万万1500万万500万万200万万240万万1500万万第二季度第二季度200万万300万万420万万2100万万200万万300万万420万万2100万万200万万300万万420万万2100万万第三季度第三季度240万
17、万500万万250万万1000万万240万万500万万250万万1000万万240万万500万万250万万1000万万第四季度第四季度80万万100万万320万万1700万万80万万100万万320万万1700万万80万万100万万320万万1700万万2021-11-2026v 对应对应20092009年商店销售额表的年商店销售额表的三维数据立方体三维数据立方体3. 数据立方体(续)数据立方体(续)2021-11-2027v 假如需再增加供应商维度,则生成四维数据立方体,假如需再增加供应商维度,则生成四维数据立方体,称为超立方体。称为超立方体。v 如何表示?如何表示?3. 数据立方体(续)数
18、据立方体(续)2021-11-2028v 在一个数据立方体中,当每个维上都确定了一个维在一个数据立方体中,当每个维上都确定了一个维成员时,就会唯一地确定多维空间中的一个点,这成员时,就会唯一地确定多维空间中的一个点,这个点称之为个点称之为数据单元数据单元(cellcell)。)。v 表示为:表示为:(维(维1 1成员,维成员,维2 2成员,成员,.,维,维n n成员,度量值成员,度量值1 1,度量值,度量值2 2,.)v 结合前面实例,如:结合前面实例,如:“山东省山东省”、“2009“2009年第一季年第一季度度”、“彩电彩电”时,销售额为时,销售额为500500万,则表示为:万,则表示为:
19、(“山东省山东省”,“2009“2009年第一季度年第一季度”,“彩电彩电”,“500“500万万”)4. 数据单元数据单元2021-11-2029v 常见的多维数据模型有:常见的多维数据模型有: 星形模型星形模型 雪花模型雪花模型 事实群模型事实群模型4.2.2 星形、雪花和事实群模型星形、雪花和事实群模型2021-11-20301. 星形模型星形模型v 星形模型是多维数据模型的基本结构,通常由一个星形模型是多维数据模型的基本结构,通常由一个很大的中心表(事实表)和一组较小的表(维度表)很大的中心表(事实表)和一组较小的表(维度表)组成。组成。 事实事实表表销售商维度表.时间维表产品维表20
20、21-11-20311. 星形模型(续)星形模型(续)2021-11-20321. 星形模型(续)星形模型(续)2021-11-20331. 星形模型(续)星形模型(续) 产品ID 时间ID 销售商ID 地址ID星形模型的关系数据库表示产品ID销售商ID地址ID时间ID销售数量销售成本总收入销 售 商维度表地 理 位置维表时间维表产品维表2021-11-20341. 星形模型(续)星形模型(续)v 对于维内层次比较复杂的维,为了避免冗余过多,对于维内层次比较复杂的维,为了避免冗余过多,同时也为了支持针对不同层上的相同属性的查询,同时也为了支持针对不同层上的相同属性的查询,可以用多张表来描述一个
21、复杂维,则产生了星形模可以用多张表来描述一个复杂维,则产生了星形模型的变种型的变种-雪花模型雪花模型。2021-11-20352. 雪花模型雪花模型v 维度表上用了多于一张的维表表示,称为维度表上用了多于一张的维表表示,称为详细类别详细类别表。表。2021-11-20362. 雪花模型(续)雪花模型(续)v 地域维上用了多于一张的维表表示。地域维上用了多于一张的维表表示。2021-11-20372. 雪花模型(续)雪花模型(续)2021-11-20382. 雪花模型(续)雪花模型(续) 产品维表 产品ID 时间ID 销售商ID 地址ID雪花模式的关系数据库表示地理位置维表时间维表产品ID产品名
22、称公司ID公司名称产品颜色ID产品颜色产品商标ID商标名称产品类型ID产品类型名销售商维度表产品ID销售商ID地址ID时间ID销售数量销售成本总收入产品ID公司ID产品颜色ID产品商标ID产品类型ID2021-11-20392. 雪花模型(续)雪花模型(续)v 星形模型和雪花模型的主要区别是雪花模型中的维星形模型和雪花模型的主要区别是雪花模型中的维表是表是规范化的规范化的。v 维表不但易于维护,而且节省存储空间。维表不但易于维护,而且节省存储空间。v 雪花模型在执行查询操作时需要进行较多的链接操雪花模型在执行查询操作时需要进行较多的链接操作,可能会影响系统的性能。作,可能会影响系统的性能。20
23、21-11-20403. 事实群模型事实群模型v 在某些复杂应用中,可能需要多个事实表来共享维在某些复杂应用中,可能需要多个事实表来共享维表,这种模型类似于星形模型的集合,被称之为表,这种模型类似于星形模型的集合,被称之为星星系模型系模型或或事实群模型事实群模型。v 销售事实表和货运事实表共享时间维、产品维和地销售事实表和货运事实表共享时间维、产品维和地区维举例。区维举例。2021-11-20413. 事实群模型(续)事实群模型(续)2021-11-2042v 关系数据模型的核心概念是关系数据模型的核心概念是关系,基本操作是:选关系,基本操作是:选择、投影、链接。择、投影、链接。v 多维数据模
24、型结构复杂,操作的种类也相对较多。多维数据模型结构复杂,操作的种类也相对较多。v 常用的多维分析操作有:常用的多维分析操作有:切片、切块、旋转、切片、切块、旋转、下钻下钻、上卷上卷等等。 4.3 多维分析操作多维分析操作2021-11-2043v 聚集是对细节数据进行综合的过程,是多维分析的聚集是对细节数据进行综合的过程,是多维分析的基础。基础。v 最常用的最常用的5种聚集函数:种聚集函数: 求和求和 计数计数 求最大值求最大值 求最小值求最小值 求平均值求平均值4.3.1 多维分析基础:聚集多维分析基础:聚集2021-11-2044v 举例:零售商对产品的销售尽心给分析时,设置了举例:零售商
25、对产品的销售尽心给分析时,设置了时间维(时间维(Time)、地区维()、地区维(Store)和商品维)和商品维(Product),度量是销售额(),度量是销售额(Sales),其中该地),其中该地区维是指商店所在地区。假设数据仓库中有一张销区维是指商店所在地区。假设数据仓库中有一张销售表(如下图),只列出在时间售表(如下图),只列出在时间T1、商品、商品P1在济南在济南地区的商店(地区的商店(S1、S2、S3)的销售额,分别为:)的销售额,分别为:(T1,S1,P1:100),(),(T1,S2,P1:78),(),(T1,S3,P1:97)4.3.1 多维分析基础:聚集(续)多维分析基础:聚
26、集(续)2021-11-20454.3.1 多维分析基础:聚集(续)多维分析基础:聚集(续)TimeStoreProductSalesT1S1P1100T1S2P178T1S3P197.2021-11-2046v 如何获得济南地区在时间如何获得济南地区在时间T1对商品对商品P1的销售额?的销售额?即即如何获得数据单元(如何获得数据单元(T1,“济南济南”,P1:X)v 即:即:X=sum(100,78,97)4.3.1 多维分析基础:聚集(续)多维分析基础:聚集(续)2021-11-2047v 多维分析操作是指对数据立方体执行多维分析操作是指对数据立方体执行切片、切片、切块、切块、旋转、旋转、
27、下钻、上卷下钻、上卷等各种分析操作,剖析数据,使等各种分析操作,剖析数据,使用户能从多角度、多侧面观察数据库中的手,从而用户能从多角度、多侧面观察数据库中的手,从而深入了解包含在数据中的信息和内涵。深入了解包含在数据中的信息和内涵。4.3.2 常用多维分析操作常用多维分析操作CTCT?2021-11-20481. 切片(切片(Slice)v 定义:定义:在数据立方体的某一维上选定一个维成员的在数据立方体的某一维上选定一个维成员的动作。动作。v 有多维数据集(维有多维数据集(维1 1,维,维2 2,维,维i i,维,维n n,观察变量),如果确定了某个维成员维观察变量),如果确定了某个维成员维i
28、 i 的值,则的值,则称:在维称:在维i i上的一个切片上的一个切片为为(维(维 1 1,维,维2 2,维,维i i成员,成员,维,维n n,观察变量)。,观察变量)。2021-11-20491. 切片(续)切片(续) 产品产品北京北京上海上海 化妆品化妆品江苏江苏 玩具玩具 服装服装 电器电器 1 2 3 4 时间(月时间(月)销售数量: 10000服装切片服装切片2021-11-20501. 切片(续)切片(续)2021-11-20511. 切片(续)切片(续)v 举例:举例:如在如在“贷款银行、贷款质量、时间贷款银行、贷款质量、时间”三维立三维立方体中进行切片,可得到各贷款银行、各种贷款
29、的方体中进行切片,可得到各贷款银行、各种贷款的统计情况。统计情况。2021-11-20521. 切片(续)切片(续)2021-11-20532. 切块(切块(dice)v 定义:定义:如果在一个多维数据集上对如果在一个多维数据集上对两个及其以上的两个及其以上的维维选定维成员的操作称为切块。选定维成员的操作称为切块。v 如有多维数据集(维如有多维数据集(维1 1,维,维2 2,维,维i i,维维k k,维,维n n,观察变量),对维,观察变量),对维i i,维,维k k,选定了维成员,那么(维选定了维成员,那么(维1 1,维,维2 2,维维i i成成员员,维维k k成员成员,维,维n n,观察变
30、量)就是,观察变量)就是多维数据集(维多维数据集(维1 1,维,维2 2,维,维i i,维,维k k,维,维n n,观察变量)在维,观察变量)在维i i,维,维k k上的上的一个切块。一个切块。 2021-11-20542. 切块(续)切块(续)2021-11-2055v 定义:定义:改变数据立方体维的次序的动作。改变数据立方体维的次序的动作。3. 旋转(旋转(rotate)2021-11-20563. 旋转(续)旋转(续)2021-11-2057v 举例:举例:旋转前的维方向旋转前的维方向3. 旋转(旋转(rotate)2002年年2003年年1季度季度2季季度度3季度季度4季度季度1季度季
31、度2季度季度3季度季度4季度季度北京市北京市123564566134562355上海市上海市13410398871021399782天津市天津市67735996736962942021-11-2058v 旋转后的维方向(旋转后的维方向(不同维度间的旋转操作不同维度间的旋转操作)3. 旋转(续)旋转(续) 北京市北京市上海市上海市天津市天津市 2002年年1季度季度12313467 2季度季度5610373 3季度季度459859 4季度季度6687962003年年1季度季度13410273 2季度季度5613969 3季度季度239762 4季度季度5582942002年年2003年年1季度季
32、度2季度季度3季度季度4季度季度1季度季度2季度季度3季度季度4季度季度北京市北京市123564566134562355上海市上海市13410398871021399782天津市天津市67735996736962942021-11-2059v 旋转后的维方向(旋转后的维方向(维度层次上的旋转操作维度层次上的旋转操作)3. 旋转(续)旋转(续)2002年年2003年年1季度季度2季度季度3季度季度4季度季度1季度季度2季度季度3季度季度4季度季度北京市北京市123564566134562355上海市上海市13410398871021399782天津市天津市67735996736962941季度季
33、度2季度季度3季度季度4季度季度20022003200220032002200320022003北京市北京市123134565645236655上海市上海市13410210313998978782天津市天津市67737369596296942021-11-20603. 旋转(续)旋转(续)2021-11-2061v 定义:定义:是指在某一个分析过程中,用户可能需要从是指在某一个分析过程中,用户可能需要从更多的维或者某个维的更细层次上来观察数据的操更多的维或者某个维的更细层次上来观察数据的操作。作。4. 下下钻钻(drill down)2021-11-2062v 举例:举例:4. 下下钻钻(续)
34、(续)2021-11-2063v 定义:定义:是与是与下钻操作相反的操作类型。是指为了看下钻操作相反的操作类型。是指为了看到更粗的数据的操作过程。到更粗的数据的操作过程。5. 上卷(上卷(roll up)2021-11-20645. 上卷(续)上卷(续)v 举例:举例:部门部门销售销售部门部门190部门部门260部门部门3802004年年部门部门1季度季度2季度季度3季度季度4季度季度部门部门120203515部门部门22551515部门部门3201518272021-11-2065v 除上述几种常用多维分析操作以外,包有:维操作、除上述几种常用多维分析操作以外,包有:维操作、属性操作等。属性
35、操作等。4.3.3 其它多维分析操作其它多维分析操作2021-11-2066v 维是多维数据模型中的核心概念。维是多维数据模型中的核心概念。v 一个维中又包含有:层次、层和成员。一个维中又包含有:层次、层和成员。1. 维操作维操作销售地区销售地区西南西南华中华中华东华东四川四川云南云南河南河南湖北湖北江苏江苏上海上海2021-11-2067v 维的层次分为:维的层次分为: 简单层次简单层次 复杂层次复杂层次1. 维操作(续)维操作(续)2021-11-2068v 简单层次简单层次1. 维操作(续)维操作(续)全国全国江苏江苏北京北京上海上海2021-11-2069v 复杂层次复杂层次1. 维操
36、作(续)维操作(续)全国全国江苏江苏北京北京上海上海苏州市苏州市扬州市扬州市宝应县宝应县2021-11-2070v 维的操作维的操作 给定维标识求维名字;给定维名字求维标识;求一给定维标识求维名字;给定维名字求维标识;求一个维中成员的个数。个维中成员的个数。 给定层次的标识或名,求层次中的所有层。给定层次的标识或名,求层次中的所有层。 给定层标识或名字,求层中成员的个数;给定层标识或名字,求层中成员的个数;. .1. 维操作(续)维操作(续)2021-11-2071v 举例:举例:结合下图,以时间维为例,给出的一些典型结合下图,以时间维为例,给出的一些典型操作。操作。 求时间维中的成员个数:时
37、间求时间维中的成员个数:时间.counts,其中此处,其中此处counts是操作符。是操作符。 求求“2月份月份”的父成员:时间的父成员:时间.年年 .季度季度.月月.2月月份份.parent,得到的结果将是:时间,得到的结果将是:时间.年年 .季度季度.第第1季季度。度。1. 维操作(续)维操作(续)年年季度季度月月星期星期日日2021-11-2072v 目的:目的:按照成员的属性进行特征分析。按照成员的属性进行特征分析。v 成员属性:成员属性:用于进一步说明成员的特征。用于进一步说明成员的特征。v 属性操作:属性操作:丰富了多维数据分析,使得不仅可以根丰富了多维数据分析,使得不仅可以根据层
38、次进行操作,而且还可以按成员的属性进行特据层次进行操作,而且还可以按成员的属性进行特征分析。征分析。v 举例举例:商品维的层次为商品代码(:商品维的层次为商品代码(ArticalID)FamilyGroupAreaTop(如表(如表4.5),商店),商店维的层次为维的层次为(ShopID)CityRegionCountryTop(如表(如表4.6)2. 属性操作属性操作2021-11-20732. 属性操作(续)属性操作(续)2021-11-20742. 属性操作(续)属性操作(续)v 其中:其中:CAMC的的Video在德国北部销售在德国北部销售89台,南部台,南部销售销售137台,台,VC
39、R.2021-11-2075v OLE DB是是Microsoft公司提出的数据访问规范。公司提出的数据访问规范。v OLE DB for OLAP是是OLE DB中定义的用于访问多中定义的用于访问多维数据的接口,它独立于多维数据的具体存储结构,维数据的接口,它独立于多维数据的具体存储结构,任何关系或多维的数据提供者均可以使用这套接口,任何关系或多维的数据提供者均可以使用这套接口,将多维数据描述或者表达给最终用户使用。将多维数据描述或者表达给最终用户使用。v MDX是是OLE DB for OLAP接口规范中定义的一组接口规范中定义的一组用于对多维数据进行查询的语句,类似关系数据库用于对多维数
40、据进行查询的语句,类似关系数据库中的中的SQL。 4.4 多维查询语言多维查询语言2021-11-2076v MDX的目的:的目的:方便用户对多维数据进行访问。方便用户对多维数据进行访问。4.4 多维查询语言(续)多维查询语言(续)2021-11-2077v MDX(多维表达式的英文首字母缩写词)是一种语(多维表达式的英文首字母缩写词)是一种语法,支持多维对象与数据的法,支持多维对象与数据的定义定义和和操作操作。v 提供了对数据立方体、维、度量等提供了对数据立方体、维、度量等OLAPOLAP环境下的对环境下的对象进行象进行创建创建、修改修改、删除删除的命令。的命令。v MDX查询的语法与查询的
41、语法与 SQL SQL 查询的语法类似。查询的语法类似。4.4.1 MDX简介简介2021-11-2078v MDX语句的构成:语句的构成: 查询所涉及的数据立方体;查询所涉及的数据立方体; 产生的结果数据集合中轴的个数;产生的结果数据集合中轴的个数; 数据立方体的维与结果数据集合中轴的对应关系;数据立方体的维与结果数据集合中轴的对应关系; 每个维上所要查询的成员。每个维上所要查询的成员。4.4.1 MDX简介(续)简介(续)2021-11-2079v 举例:举例:假设要对一个具有三个维度的数据立方体假设要对一个具有三个维度的数据立方体SALESCUBE进行查询,该数据立方体的三个维度进行查询
42、,该数据立方体的三个维度分别是时间维、地区维、产品维,有一个度量值:分别是时间维、地区维、产品维,有一个度量值:销售额销售额sales。现在用户需要了解北京和上海第一。现在用户需要了解北京和上海第一季度和第二季度四月份所销售的电视机情况和在第季度和第二季度四月份所销售的电视机情况和在第一、二季度销售寸衣的情况,并且要求结果数据集一、二季度销售寸衣的情况,并且要求结果数据集合中产品维和时间维在同一个轴上。合中产品维和时间维在同一个轴上。4.4.1 MDX简介(续)简介(续)2021-11-2080v 该查询语句格式:该查询语句格式:SELECT (TV,Qtr1),(TV,Qtr2.Apr),(
43、Clothes.Shrit,Qtr1),(Clothes.Shrit,Qtr2) ON COLUMNSBeijing,Shanghai ON ROWSFROM SALESCUBE WHERE sales4.4.1 MDX简介(续)简介(续)2021-11-2081v 有关说明:有关说明: MDX关键字:关键字:SELECT 、COLUMNS、ROWS、FROM 、WHERE4.4.1 MDX简介(续)简介(续)2021-11-2082v 查询结果:查询结果:4.4.1 MDX简介(续)简介(续)2021-11-2083v MDX语法语法请参读请参读Microsoft MDX语言文档。语言文档。
44、4.4.1 MDX简介(续)简介(续)2021-11-2084v 多维数据往往超过三维,如何在计算机屏幕上方便、多维数据往往超过三维,如何在计算机屏幕上方便、清楚地展示三维分析的结果?清楚地展示三维分析的结果?4.5 多维数据展示多维数据展示2021-11-2085v 要解决的主要问题:要解决的主要问题: 某个具体的维安排在空间的哪个方向?某个具体的维安排在空间的哪个方向? 如何展示维的层次?如何展示维的层次?4.5.1 三维数据展示三维数据展示2021-11-2086v 核心思想:核心思想: 切片切片 嵌套:按照层的抽象程度,依次在水平和垂直方向嵌套:按照层的抽象程度,依次在水平和垂直方向排
45、列。排列。4.5.1 三维数据展示(续)三维数据展示(续)2021-11-2087v 举例:举例:假设一个数据立方体有时间维、地区维、商假设一个数据立方体有时间维、地区维、商品维。商品维有两个层,具体品维。商品维有两个层,具体商品层商品层和和商品大类层商品大类层。时间维有时间维有年年、季度季度、月月和和日日4个层。地区维有个层。地区维有商店商店、城市城市、地区地区和和国家国家4个层。个层。v 北京在北京在2011年年4个季度中部分商品的销售额个季度中部分商品的销售额如何展如何展示?示?4.5.1 三维数据展示(续)三维数据展示(续)2021-11-2088v 展示结果之一:展示结果之一:4.5.
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 短歌行语文备课教案5篇
- 2025《齐桓晋文之事》中百姓福祉的实现途径课件
- 技术员入职考试题及答案
- 急性肠梗阻考试题及答案
- 济南入少先队考试题目及答案
- 血管外科护理试题及答案
- 2025年临床执业医师《内科学》真题试卷
- 一氧化碳中毒护理试题及答案
- 金矿机电矿长考试题库及答案
- 医疗纠纷风险评估研判制度
- 点亮未来-大学生职业生涯规划与就业指导(高职)全套教学课件
- LY/T 3345-2023毛竹林氮素精准施肥技术
- 量子计算与量子信息概述
- TH-1管道机器人设计说明书
- 集成运算放大器原理及其应用
- 神经发育障碍
- GB/T 7324-2010通用锂基润滑脂
- 2023年广东省外语艺术职业学院高职单招(英语)试题库含答案解析
- 《介入放射学总论》课件
- Meta分析过程的解读知识
- 实验室生物安全委员会模板
评论
0/150
提交评论