移动视频数据仓库建设实践.pdf_第1页
移动视频数据仓库建设实践.pdf_第2页
移动视频数据仓库建设实践.pdf_第3页
移动视频数据仓库建设实践.pdf_第4页
移动视频数据仓库建设实践.pdf_第5页
已阅读5页,还剩26页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

hbase架构简介 report by 李修鹏 数据仓库 数据仓库 大数据的变革大数据的变革 只能支持战略决策-支持战略决策和战术决策( tactical decision ) -实时营销&个性化服务 数据仓库变化 实时主动数据仓库 (real-time active data warehouse)(real-time active data warehouse) rtadw 实时主动数据仓库 rtadw要集成的数据包括实时数据和历史 数据两部分。 主动 事件、条件、动作(event condition action,-事件、条件、动作(event-condition-action, eca) 实时事件进行主动分析和处理的能力 数据仓库架构介绍数据仓库架构介绍 建模角度建模角度 基础知识 第二范式(3nf):首先是 1nf,另外包含两 部分内容,一是表必须有一个主键;二是没有 包含在主键中的列必须完全依赖于主键,而不 能只依赖于主键的一部分。 第三范式():首先是,另外非主键 第三范式(3nf):首先是 2nf,另外非主键 列必须直接依赖于主键,不能存在传递依赖。 即不能存在:非主键列 a 依赖于非主键列 b, 非主键列 b 依赖于主键的情况。 基础知识 星型模式 -性能优势 -业务模型 雪花型模式 -属性众多 -星型模式进一步层次化,减少数据冗余 重复性问题重复性问题 交互性问题 数据仓库vs数据集市 数据仓库vs数据集市 inmon 和 kimball的大辩论 bill inmon 将数据仓库定义为“一个面向主 题的、集成的、随时间变化的、非易变的 用于支持管理的决策过程的数据集合” 数据仓库架构数据仓库架构数据仓库架构数据仓库架构 集中式架构 -标识着数据仓库架构已经进入比较成 熟的时期 inmon 和 kimball的大辩论 ralph kimball 说“数据仓库仅仅是构成它的 数据集市的联合”,他认为“可以通过一 系列维数相同的数据集市递增地构建数据 仓库”仓库” 数据仓库架构数据仓库架构数据仓库架构数据仓库架构 总线架构 数据仓库架构数据仓库架构数据仓库架构数据仓库架构 独立的数据集市架构 - - -去哪儿 事业部一个数据集市 不是企业内一致的数据,产生信息孤岛 联邦式数据仓库架构 - - -原有独立数据集市的数据交换 数据仓库架构数据仓库架构数据仓库架构数据仓库架构 how we dohow we do 需求 数据挖掘-细粒度数据 统计数据-粗粒度数据 建立数据仓库架构建立数据仓库架构建立数据仓库架构建立数据仓库架构 报表展示自定义查询数据分析 数 据 应 用 个性化推荐元 数 据 kpi个性化push美剧个性化用户画像查询 点击流数据 (click stream) 数据库数据 (oltp) m 其它数据 (other) 源 数 据 明细数据(dwd) 数 据 仓 库e t l 据 管 理 数 据 质 量 监 控 高粒度汇总数据(dws) 数据集市、宽表(dm) 数据应用(st) 低粒度汇总加工数据(dwb) dw五层模型架构介绍五层模型架构介绍五层模型架构介绍五层模型架构介绍 ? dw五层模型是按照edw各个应用层次的 需求进行分层细化而来的,每个层次满 足不同的应用。 ?分为以下5层:分为以下5层: 1. ods 数据准备层 2. dwd 数据明细层 3. dw(b/s) 数据汇总层 4. dm 数据集市层 5. st 数据应用层 dw五层模型架构介绍五层模型架构介绍五层模型架构介绍五层模型架构介绍 st层层层层 数据来源及建模方式数据来源及建模方式数据来源及建模方式数据来源及建模方式服务领域服务领域服务领域服务领域 数据来自dw层,采用维度建 数据来自dw层,采用维度建 模,星型架构 数据挖掘,自定义查询,应 用集市 前端报表展现,主题分析, kpi报表 数据数据数据数据etl过程描述过程描述过程描述过程描述 从dw层的数据进行粗粒度聚 合汇总;按业务需求对事实 从dw层的数据进行粗粒度聚 合汇总;如按年、月、季、 天对一些维度进行聚合生成 业务需要的事实数据 ods层层层层 dm层层层层 dw层层层层 dwd层层层层 数据准备区,数据来源是各 业务系统的源数据,物理模 型和业务系统模型一致。 数据来自ods层,是dw明细 事实层,数据模型是ods一致 数据来自dwd层,是dw事实 层,采用维度建模,星型架 构,这一层可细分为dwb 和 dws 数据来自dw层,采用维度建 模,星型架构 为其它逻辑层提供数据,为 统一数据视图子系统提供数 据实时查询 为edw提供各主题业务明细 数据 为edw提供各种统计汇总数 据 用集市 通过移动视频dc中心平台, 把业务数据抽取落地成文本 文件,再装载到数据仓库ods 层,不做清洗转换 根据ods增量数据进行merge 生成全量数据,不做清洗转 换,保留原始全量数据 从dwd层进行轻度清洗,转换,汇 总聚合生成dw层数据,如字符合 并, cv ,uid,日期, mtype ,合并; 用代理键取代维度;按各个维度进 行聚合汇总 合汇总;按业务需求对事

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论