版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、数据仓库维度建模数据仓库维度建模学习目的学习目的v在课程结束后应该知道: 数据仓库维度建模分哪几个步骤? 每个步骤都有哪些原则,和哪些误区? 掌握维度建模方法 ? 维度表属性在维度模型中起到什么样的作用? Kimball极力反对哪些建模方法?一个比喻一个比喻v比喻: 如果将数据仓库建设看作是一个高楼大厦建造过程的话 数据仓库维度建模就是大厦的框架建设工作 数据仓库ETL过程,就是为大厦添砖加瓦的过程 优秀数据访问工具则是大厦整体装修的最佳工具v框架的重要性 地基打多深决定大厦能做多高。 钢筋混凝土结构还是刚结构决定了大厦的稳定性 维度建模是数据仓库框架建设的重要技术维度建模四步曲维度建模四步曲
2、v四步维度建模步骤: 1.选取要建模的业务流程 2.定义业务流程中的数据粒度 3.选定用于每个事实表行的维度 4.确定用于形成每个事实表行的数字型事实四步曲四步曲1.选取业务流程选取业务流程v误区: 不针对业务流程而针对业务部门进行维度建模 将注意力放在业务部门身上,而不关注业务流程 为某个部门建立单独的维度模型v原则: 针对业务流程进行维度建模 确保某个业务流程中的核心数据只被抽取一次 保证数据仓库中业务数据一致性四步曲四步曲2.定义粒度定义粒度(1)v粒度的解释: 粒度传递了同事实表度量值相联系的细节所达到的程度方面的信息。 简单的说,反映了事实表的明细程度v粒度举例: 超市小票上的购物清
3、单 医生的处方药品清单 仓库每种产品库存值的月快照v误区: 数据仓库团队经常绕过这个看似不必要的步骤 一个不合适的粒度定义将会使维度建模感觉无从下手四步曲四步曲2.定义粒度定义粒度(2)v原则: 优先考虑具有原子粒度的业务信息,这些数据不能再做进一步的细分 数据仓库中存储汇总的、概要性的数据主要是基于数据库性能上的考虑 汇总数据不能成为最底层细节数据的替代品四步曲四步曲3.选定维度选定维度v误区: 没有定义粒度就开始选定维度v原则: 在粒度确认后,选取能从各个角度,充分描述问题的维度 为每个维度添加丰富的维度属性v示例: 常见维度包括日期、产品、顾客、事务类型和状态四步曲四步曲4.确定事实确定
4、事实v误区: 没有第2步的粒度确认,就开始确定事实 将含有不同粒度的事实放在了同一个事实表中v原则: 确定用于形成每个事实表行的数字可加型事实 在需求调研时我们可以通过提出“您需要对哪些指标进行统计?”这样的问题来确定事实。 具有不同粒度的事实必须放在不同的事实表中 事实一般在各维度上都有良好的可加性四步曲总结四步曲总结v维度建模总原则: 数据驱动和需求驱动相结合零售业案例背景零售业案例背景v背景: 设想一下在一家大型杂货连锁店,其业务覆盖分布在美国5个州范围内的100多家杂货店。 每个商店都有完整的配套部门,包括各类人员,并有大致60000多个品种的产品放在货架上。 各杂货店的POS系统记录
5、了每位顾客交易详的细信息 定价与促销是管理层重要决策之一 如何使各种形式的促销活动所产生的效能清晰可见?实例实例1.选取业务流程选取业务流程v选取业务流程: 你能列出该连锁店急待解决的问题吗? 是否有系统能提供解决问题所需要的数据? 该系统对应的业务流程你清楚吗?v注意: 建立的第一个维度模型应该是一个最有影响的模型,即它应该能对最紧迫的业务问题做出正面回答,并且要保证有足够的操作型数据源的支持。实例实例2.定义粒度定义粒度v定义粒度: 你还记得刚才的粒度定义原则吗? 在这个连锁店我们应该使用什么样的粒度?即事实表要详细到什么程度?实例实例3.选定维度选定维度v选定维度: 如何得出基本维度?
6、什么是附加维度? 通过粒度的判断我们可以得出事实表的基本维度为:日期、产品、商店与促销日期维度日期关键字日期关键字(PK)(PK)待定日期属性待定日期属性商场维度商场关键字商场关键字(PK)(PK)待定商场属性待定商场属性产品维度产品关键字产品关键字(PK)(PK)待定产品属性待定产品属性促销维度促销关键字促销关键字(PK)(PK)待定促销属性待定促销属性POS零售营销事务事实日期关键字日期关键字(FK)(FK)产品关键字产品关键字(FK)(FK)商场关键字商场关键字(FK)(FK)促销关键字促销关键字(FK)(FK)POSPOS事务编号事务编号待定事实待定事实实例实例4.确定事实确定事实v
7、确定事实: 是否还记得确定事实的基本原则? 按照基本原则你认为事实表中应该包含哪些事实? 是否应该在事实表中存放计算列? 实例中事实应包括销售量、销售额与成本价,当然也可以包括毛利润日期维度日期关键字日期关键字(PK)(PK)待定日期属性待定日期属性商场维度商场关键字商场关键字(PK)(PK)待定商场属性待定商场属性产品维度产品关键字产品关键字(PK)(PK)待定产品属性待定产品属性促销维度促销关键字促销关键字(PK)(PK)待定促销属性待定促销属性POS零售营销事务事实日期关键字日期关键字(FK)(FK)产品关键字产品关键字(FK)(FK)商场关键字商场关键字(FK)(FK)促销关键字促销关
8、键字(FK)(FK)POSPOS事务编号事务编号销售量销售量销售额销售额成本额成本额毛利润金额毛利润金额维度表属性维度表属性v添加维度表属性 这是维度建模的最后修补工作 增加的维度属性会为用户带来更多的查询条件 丰富的维度属性将使查询变得更加灵活维度表属性日期维度维度表属性日期维度v日期维度属性 是否还可以列出其它属性日期维度日期关键字日期关键字(PK)(PK)日期日期星期星期日历周结束日期日历周结束日期日历月日历月日历年月日历年月日历季度日历季度日历年季度日历年季度日历半年度日历半年度节假日指示符节假日指示符。及其它。及其它维度表属性产品维度维度表属性产品维度v产品维度属性 是否还可以列出其它属性产品维度产品关键字产品关键字(PK)(PK)产品描述产品描述SKUSKU编号编号商标描述商标描述子类描述子类描述分类描述分类描述部门描述部门描述包装类型包装类型包装尺寸包装尺寸含脂量含脂量。及其它。及其它维度表属性商场维度维度表属性商场维度v商场维度属性 是否还可以列出其它属性商场维度商场关键字商场关键字(PK)(PK)商场名称商场名称商场编号商场编号商场所在行政区商场所在行政区商场所在地区商场所在地区首次开业日首次开业日最后重修日最后重修日。及其它。及其它维度表属性促销维度维度表属性促销维度v促销维度属性 是否还可以列出其它属性
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 天辰齐翔新材料有限公司医药中间体项目水土保持方案报告表
- 营口南楼66千伏变电站改造工程水土保持报告表
- 《区块链概论》-课件 第1-4章-初识区块链 -开源区块链
- 部编高教版(2025)职业模块闪亮的坐标-劳模王进喜教学设计
- hundred,thousand,million(教学设计)译林版(三起)英语六年级下册
- 初中英语仁爱科普版(2024)八年级下册Topic1Wewillhaveaclassfashionshow.一等奖教学设计
- 初中音乐人教版七年级下册选听幸福歌教案
- 2026 全球威胁态势研究报告
- 第 6 课 视频的获取和加工教学设计小学信息技术滇人版四年级第4册-滇人版
- 高中地理 第一单元 从宇宙看地球 单元活动辨别地理方向教学设计2 鲁教版必修1
- 纪委巡察整改监督课件
- 学校有限空间管理制度
- 2025年高考全国二卷数学高考真题解析 含参考答案
- JG 170-2005生物安全柜
- 山东青岛大学招聘辅导员考试真题2024
- DBJ50-T-442-2023建筑工程安全文明工地建设标准
- 2022-2023学年广东省广州市白云区教科版(广州)六年级下册期末学业质量诊断调研英语试卷(无答案)
- 中国胰腺神经内分泌肿瘤诊疗指南
- 期中练习卷(试题)-2022-2023学年闽教版英语三年级下册
- 教育研究方法课件《教育研究方法》
- 食品经营申请书
评论
0/150
提交评论