已阅读5页,还剩24页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第二章数据仓库原理,2.1数据仓库的数据模型,产品北京上海化妆品江苏玩具服装电器1234时间(月),销售数量:10000,服装切片,两类表:一、维表:用来记录维度信息。二、事实表:用来存储多维模型中维度交叉点处的度量值和码值。,1.星型模型,2.雪花模型3.星座模型4.雪暴模型,2.2维表和事实表的数据存储,产品北京上海化妆品江苏玩具服装电器1234时间(月),销售数量:10000,服装切片,2.3联机分析处理(OLAP),什么是OLAP?OLAP是针对某个特定的主题进行联机数据访问、处理和分析,通过直观的方式从多个维度、多种数据综合程度将系统的运营情况展现给使用者。两个特点,在线性(On_Line),多维分析(Multi_Analysis),ii)OLAP的相关基本概念,维、维的层次、维成员、多维数据集、数据单元、多维数据集的度量值和聚集1.维“上卷”“下钻”,销售地区,西南,华中,华东,四川,云南,河南,湖北,江苏,上海,维的层次关系和类关系,简单层次复杂层次,维的类关系,类的划分,只能依据同一层次的维成员集合来划分维的层次与类组合图,2.多维数据集,产品北京上海化妆品江苏玩具服装电器1234时间(月),销售数量:10000,服装切片,3.维成员维的取值。4.多维数据集的度量值多维数据集的核心值5.数据单元即多维数组的取值。数据单元可以表示为:(维1维成员,维2维成员,维3维成员,维4维成员,观察变量值),iii)多维分析,是指对多维数据集中的数据用切片、切块和旋转等等方式分析数据,使用户能够多角度、多侧面地去观察数据仓库中的数据。,1.多维的切片(维1,维2,维i成员,维n,观察变量)是多维数据集(维1,维2,维i,维n,观察变量)在维i上的一个切片2.多维的切块在(维1,维2,维i,维k,维n,观察变量)多维数据集上,对维i,维k,选定了维成员,那(维1,维2,维i成员,维k成员,维n,观察变量)就是多维数据集(维1,维2,维i,维k,维n,观察变量)在维i,维k上的一个切块,3.旋转,4.数据的上探、下钻数据的上探:是指在某一维上将低层次的细节数据概括到高层次的汇总数据。数据的下钻:是指从某维上汇总数据深入到细节数据进行观察。,Eg:指定“商店=广州所有商店”,(行为部门,列为时间和销售量)如表所示,表中无括号数为增长率,有括号表示下降率。对于汽车部门出现的奇怪现象,销售下降了13.2%,而利润却增加了21.4%,此时分析是什么原因?,对汽车部门向下钻取出具体项目(维修、配件、附件)的销售情况和利润增长情况。,2.4OLAP的实施,2.5数据抽取,转换和装载,过程:数据的抽取(extraction),转换(transform)和装载(load)过程。1.数据的抽取工作:Eg:确认数据源检查和确定数据源是否可以提供数据仓库需要的数据。,2.数据转换:Eg:选择、转换、汇总、分离/合并等。3.数据装载:分三种类型:最初装载、增量装载和完全刷新。,2.5元数据,一概念元数据是关于数据的数据。,二分类和组成根据元数据在DW中所承担的任务,将元数据分为:静态元数据-与数据结构有关。动态元数据-与数据的状态和使用方法有关。,静态元数据包括:名称,描述,格式,数据类型,关系,来源,域,业务规则等描述:主要是对中的各种数据元素进行说明关系:用于说明中各种数据对象之间的关系来源:指数据的来源域:用于说明中数据的有效值范围业务规则:指中数据在业务处理中所要遵循的规则,动态元数据包括:入库时间,更新周期,统计信息,存储位置,存储大小,引用处统计信息:统计了数据访问的用户、访问对象、访问时间和访问次数。这些信息对于性能的提高具有较高的参考价值。存储位置:说明数据存储在哪一位置存储大小:说明该数据所需要的存储
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 边缘智能场景应用-洞察与解读
- 退出渠道创新分析-洞察与解读
- 第12周包饺子(1)教学设计
- 热稳定性研究-洞察与解读
- 山东省嘉祥县大张楼镇第一中学商务星球版初中地理教学设计
- 适应性进化机制-第1篇-洞察与解读
- 2026年快消维护数字孪生协议
- 2026年金融外包云资源租赁协议
- 人教版化学九年级一轮复习中和反应复习教案
- 身份认证机制优化-第1篇-洞察与解读
- 第一单元《1.多彩的亚洲美术》课件-浙人美版初中美术七年级下册
- 无人机保险相关知识培训课件
- 课件:深入学习习近平总书记关于教育的重要论述
- 医院 全员安全生产责任制
- 超声内镜在胰腺疾病诊疗中的应用
- 供应链协同对农村电商发展的机制分析
- CIP、SIP工艺流程操作说明书
- 桩基施工安全措施方案
- 盘活利用闲置低效厂区厂房实施方案
- 高空安全培训试题及答案
- 2024年1月20日河北省委办公厅公开选调工作人员笔试真题及解析(综合文字岗)
评论
0/150
提交评论