版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第二周:2023/9/4
第三讲:数据仓库的多维数据模型
数据仓库多维数据模型(Mulli-DimcnsionalDaiaModel)是为了满足顾客从多角度多层次
进行数据查询和分析的需要而建立起来的基于事实和维日勺数据库模型,其基本的应用是为
了实现OLAP(OnlineAnalyticalProcessing)。
I.度量值(Measure)
度量值是决策者所关怀口勺具有实际意义的数值。例如,销售量、库存量、银行贷款金
额等。度最值是所分析口勺多维数据集日勺关键,它是最终顾客浏览多维数据集时重点查看的
数值数据。
2.事实数据表(FactTabic)
度量值所在的表称为事实数据表,事实数据表中寄存的事实数据一般包括大量的J数据
行。事实数据表口勺重要特点是包括数值数据(事实),而这些数值数据可以记录汇总以提
供有关单位运作历史的信息。
3.维度组员(DimensionMember)
维H勺一种取值称为该维H勺一种维度组员(简称维组员)。假如一种维是多级别的,那
么该维的维度组员是在不一样维级别的取值的组合。例如,考虑时间维具有日、月、年这
3个级别,分别在日、月、年上各取一种值组合起来,就得到了时间维的|一种维组员,即
“某年某月某日“。
4.维度表(DimensionTable)
包括维度信息的表是维度表,维度表包括描述事实数据表中的事实记录的特性。
度量值
维度表和事实
表互相独立,又互
有关联并构成一种
统一的模式。构建
多维数据集时常用的架构:
1.星型模式
星型模式是一种多维的数据关系,它由一种事实表IFactTable)和一组维表(Dimension
Table)构成。每个维表均有一种维作为主键,所有这些维的主键组合成事实表的主键。事实
表的非主键属性称为事实(Fact),它们一般都是数值或其他可以进行计算U勺数据;而维表大都
是文字、时间等类型的数据,按这种方式组织好数据我们就可以按照不一样的维(事实表的
主键II勺部分或所有)来对这些事实数据进行求和(summary)、求平均(average)、计数(count)、
比例(percent)的汇集计算,甚至可以做20-80分析。这样就可以从不一样的角度数字来分析
业务主题II勺状况
♦:川崎
FK蛀网U
年
JJ
(1
时
分
H
*户・
用户】D
中屉Vf奖表
哪户类T
PK.FK1UMUD明户名
PK.FK2ttWD用户信肥
PK.FKJ■F1P
PK.FK4
PK.FKSXfllD
RKBB
实付余■
产UflH,蟀
nc7rmpPK文BID
产丛奥B上(・,方大
AWE
产MMtt
种经典的银行贷款分析in模型设”,其中加边框的为主关键字(PK.PrinaryKcy),其中贷款分析表是一种事实表,其中的贷款授信金8b钱收余额是
需要从谷角度观测的数格(事实),而观赛的角陵是有区域、银行、时何,岐研这四个方面用合进行,这购分析角度的有机如1合,可以对授信金额和仪荻氽额进
行4X8X4X8种姐科的数%记录分析,以此实现对贷款状况的多角度(维)多层次(数据不一样的汇总程度)的分析,贷秋分析人员既可以宏观也心到贷
欧业务的整体状况,乂可以做现地双厕到洋曲一家银行一天一类贷款的细计信息。多推分析的时候,潍俊选挣越多数据越细力(划分得更缰/),ftt度法杆捡少
数据越汇题越宏观。
***港表sales事实表i***越表
2.事实星座模式(FactCorrtellation):
多种事实表共享维表,可看作星型模式集。
3.雪花模式(SnowflakeSchema):
是星型模式口勺变种,其中某些维表将数据深入分解到附加的维表中,以便减少冗余,但对
系统的性能有一定的影响;
第四讲:联机分析处理
60年代,关系数据库之父E.F.Codd提出了关系模型,增进了联机事务处理(OLTP川勺发
展(数据以表格的形式而非文献方式存储)。1993年,EFCodd提出了OLAP概念,认为
OLTP已不能满足终端顾客对数据库查询分析的需要,SQL对大型数据库进行的简朴查询
也不能满足终端顾客分析的规定。顾客的决策分析需要对关系数据库进行大量计算才能得
到成果,而查询的成果并不能满足决策者提出的需求。因此,E.F.Codd提出了多维数据库
和多维分析的概念,即OLAP。
1.联机事务处理(OnIineTransIationProcessing)
一•般在数据库系统中,事务是工作的I离散单位。例如,一种数据库事务可以是修改一
种顾客打勺帐户平衡或库存项口勺写操作。联机事务处理系统(OLTP)实时地采集处理与事务相
连的)数据以及共享数据库和其他文献日勺地位日勺变化。在联机事务处理中,事务是被立即执
行的。上世纪60年代,由关系数据库之父E.F.Codd不停发展。
2.联机分析处理(OnLineAnalyticalProccessing,简称OLAP)
最早由关系数据库之父E.F.Codd于1993年提出。OLAP应用是目前数据仓库上的重要
应用之一,是决策分析的关键。作为数据仓库最重要的多维分析工具,OLAP运用存储在
数据仓库中口勺数据完毕多种分析操作,并以直观易懂的形式将分析成果返【可给决策人员。
它的目的是满足决策支持或多维环境特定的杳询和报表需求,技术关键是多维分析。多维
分析可以对以多维形式组织起来的数据进行上卷、下钻、切片、切块、旋转等多种分析操
作,以便剖析数据,使分析者、决策者能从多种角度、多种侧面观测数据库中的数据,从
而深入理解包括在数据中的信息和内涵。
电子卢品
日用品
书籍
钻取(Drill-down)上卷(Roll-up)
3.钻取(DriIl-down)
在维的不一样层次间的变化,从上层降到下一层,或者说是将汇总数据拆分到更细节
的数据,例如通过对2023年第二季度的总销售数据进行钻取来查看2023年第二季度4、
5、6每月的消费数据,如上图;当然也可以钻取浙江省来查看杭州市、宁波市、温州
市……这些都市的俏售数据。
4.上卷(RoIl-up)
钻取Fl勺逆操作,即从细粒度数据向高层的聚合,如将江苏省、上海市和浙江省的销售
数据进行汇总来查看江浙沪地区H勺销售数据,如上图。
5.切片(SIice)
选择维中特定口勺值进行分析,例如只选择电子产品H勺销售数据,或者2023年第二季度
的数据。
6.切块(Dice)
选择维中特定区间的数据或者某批特定值进行分析,例如选择2023年第一季度到
2023年第二季度的销售数据,或者是电子产品和日用品的箱售数据。
7.旋转(Pivot)
即维的位置的互换,就像是二维表的行列转换,如图中通过旋转实现产品维和地区维
的互换。
8.联机事务处理(OLTP)和联机分析处理(OLAP)的区别
(1)顾客和系统日勺面向性:
OLTP是面向顾客的,用于事务和查询处理
OLAP是面向市场日勺,用「数据分析
(2)数据内容:
OLTP系统管理目前数据.
OLAP系统管理大量历史数据,提供汇总和汇集机制.
(3)数据库设计:
OLTP采用实体-联络ER模型和面向应用的数据库设计.
OLAP采用星型或雪花模型和面向主题的|数据库设计.
(4)视图:
OLTP重要关注一种企业或部门内部的目前数据,不波及历史数据或不一样组织H勺数据
OLAP则相反.
(5)访问模式:
OLTP系统的访问重要由短H勺原子事务构成.这种系统需要并行和
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 执法办案场所责任制度
- 扶贫工作队责任制度
- 抄水电责任制度
- 护师责任制度
- 拖车驾驶员责任制度
- 排水工作责任制度
- 搅拌岗位责任制度
- 教科研目标责任制度
- 教辅材料追究责任制度
- 文化馆经济责任制度汇编
- 绿色贸易壁垒对浙江纺织品出口的影响及对策分析
- 图片环游在小学英语第一学段绘本教学中的应用研究
- 前厅服务与数字化运营 课件 于英丽 项目1、2 前厅部认知、现代前厅服务
- 教科版六年级科学下册 活动手册答案
- JB∕T 12796-2016 固定锥形阀标准规范
- 外科学 手术 基础
- 《弟子规》全文及解释(打印版)
- 2021年全国统一高考地理试卷(含答案)(乙卷)
- 中小学生森林防火安全教育《保护森林 人人有责》课件
- 人教版四年级下册数学第一、二单元测试题及答案
- 港口集装箱运输AGV项目规划设计方案
评论
0/150
提交评论