2023学年完整公开课版整合层介绍_第1页
2023学年完整公开课版整合层介绍_第2页
2023学年完整公开课版整合层介绍_第3页
2023学年完整公开课版整合层介绍_第4页
2023学年完整公开课版整合层介绍_第5页
已阅读5页,还剩4页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

负责人:胡晶01目录整合层介绍整合层介绍1整合层介绍考虑大数据架构计算和存储的特点,将数据仓库分为逻辑上的几个层次。这样对于不同层次的数据操作,创建不同层次的任务,可以放到不同层次的任务流中进行执行,以及上层应用对数据访问的需求,数据分层结构规划为贴源层、整合层、清单层(轻度)、应用层。整合层介绍下面我们来看一下什么是整合层。根据源平台上事务处理逻辑和业务请求,此层将需要多表关联进行复杂计算(尤其是大表)的多张单表进行整合,组织成宽表,优化大数据的访问方式。整合层介绍DWS整合层:应用整合层,主要是将DWD和DWS的明细数据在hadoop平台进行汇总,然后将产生的结果同步到DWS数据库,提供给各个应用。基于DWD和DWS上的基础数据,整合汇总成分析某一个主题域的服务数据,一般是宽表。整合层介绍宽表从字面意义上讲就是字段比较多的数据库表。通常是指业务主题相关的指标、维度、属性关联在一起的一张数据库表。宽表由于把不同的内容都放在同一张表存储,宽表已经不符合三范式的模型设计规范,随之带来的主要坏处就是数据的大量冗余,与之相对应的好处就是查询性能的提高与便捷。这种宽表的设计广泛应用于数据挖掘模型训练前的数据准备,通过把相关字段放在同一张表中,可以大大提高数据挖掘模型训练过程中迭代计算时的效率问题。1.宽表整合层介绍聚集是指针对原始明细粒度的数据进行整合。DWS整合数据层是面向分析对象的主题聚集建模。(1)聚集是不跨越事实的。聚集是针对原始星形模型进行的整合。为获取和查询与原始模型一致的结果,聚集的维度和度量必须与原始模型保持一致,因此聚集是不跨越事实的,所以原子指标只能基于一张事实表定义,但是支持原子指标组合为衍生原子指标。(2)聚集会带来查询性能的提升,但聚集也会增加ETL维护的难度。当子类目对应的一级类目发生变更

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论