仓库管理_unit four数据仓库技术_第1页
仓库管理_unit four数据仓库技术_第2页
仓库管理_unit four数据仓库技术_第3页
仓库管理_unit four数据仓库技术_第4页
仓库管理_unit four数据仓库技术_第5页
已阅读5页,还剩43页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1 UNITfour数据仓库技术 2 学完本讲后 你应该能够了解 数据仓库中没有联机更新 因而数据仓库比数据库需要一系列更简单的技术 但数据仓库有很多特殊的技术上的需求 数据仓库的专用DBMS与通用DBMS的区别 多维DBMS和数据仓库之间的互补关系 数据仓库环境中的元数据与操作型环境中的元数据所扮演的角色不同 为了理解和解释一段时期内的信息 数据仓库需要一个全新的上下文维数据仓库的高效刷新方法 数据复制 和 变化数据捕捉 本讲主要目标 3 一 数据仓库的技术需求二 数据仓库专用DBMS三 多维DBMS和数据仓库四 数据仓库环境中的元数据五 上下文维和上下文信息六 建立数据仓库七 数据仓库的数据刷新 内容提纲 4 数据仓库的技术需求 5 数据仓库的技术需求 数据仓库与数据库技术需求不同的原因 数据仓库中没有联机数据更新比数据库的技术需求更简单数据仓库中的数据量非常大要考虑大量和不同数据的存储和查询的技术和效率数据仓库的数据来源于现有的系统 而现有的各个系统可能使用不同的技术不同来源数据的集成 转换和传送 6 数据仓库的技术需求 数据仓库的技术需求管理大量数据管理各种各样介质上的数据方便的索引和监视数据大量接口技术允许程序员将数据直接放在物理存储设备上数据的并行存储和访问数据仓库的元数据控制高效地装入数据仓库有效地使用索引以压缩方式存储数据支持复合键码有效地管理变长数据有选择地关闭锁管理单独索引处理从大容量存储器迅速恢复 7 数据仓库的技术需求 管理大量数据分四个方面基本的管理技术效率存储的费用处理的费用 8 数据仓库的技术需求 管理各种各样介质上的数据考虑访问速度和存储费用 一个满载的数据仓库应该放在多种存储介质上 9 数据仓库的技术需求 方便的索引和监视数据成功的数据仓库必须能方便和有效地检索数据成功的数据仓库的数据必须能被随意地监视监视数据仓库的数据的理由 决定是否应数据重组决定索引是否建立得恰当决定是否有太多数据溢出决定数据的统计成分决定剩余的可用空间 10 数据仓库的技术需求 大量接口技术能够用各种不同的技术获得和传送数据接口不仅要高效 还要便于使用能够在批模式下运行 11 数据仓库的技术需求 允许程序员将数据直接放在物理存储设备上为了对数据进行高效地访问和更新 程序员需要在物理的块 页的一级上对数据的存放进行特殊的控制 12 数据仓库的技术需求 数据的并行存储和访问当数据被并行存储和管理时 性能会提高很多 13 数据仓库的技术需求 数据仓库的元数据控制数据仓库的用户应该能够对元数据进行准确和实时的访问典型的元数据数据仓库表的结构数据仓库表的属性数据仓库的源数据 记录系统 从记录系统到数据仓库的映射数据模型的规格说明抽取日志访问数据的公用例行程序 14 数据仓库的技术需求 数据仓库要有多种语言接口数据仓库需要有非常丰富的语言接口数据仓库接口语言需要能够一次访问一组数据能够一次访问一条记录特别要保证 为了满足某个访问要求 能够支持一个或多个索引能够插入 删除 更新数据 15 数据仓库的技术需求 高效地装入数据仓库在装入数据的同时 索引也要高效地装入 16 数据仓库的技术需求 有效地使用索引数据仓库技术不仅必须能够方便地支持新索引的创建和装入 而且要能够高效地访问这些索引高效访问索引的方法位映象的方法多级索引将部分或全部索引装入内存当被索引的数据的次序允许压缩时 对索引项进行压缩创建选择索引或范围索引 17 数据仓库的技术需求 以压缩方式存储数据数据仓库中的数据很少更新 数据压缩的管理很简单解压缩的开销是CPU开销 不是I O资源的开销 18 数据仓库的技术需求 支持复合键码复合键码在数据仓库中随处可见 19 数据仓库的技术需求 有效地管理变长数据在数据仓库中 变长数据很稳定 没有数据库中变长数据的固有性能问题 20 数据仓库的技术需求 有选择地关闭锁管理应用加锁管理程序的后果之一是它消耗了相当的资源 即使数据不被更新也是一样 21 数据仓库的技术需求 单独索引处理当只通过查看一下索引就可以满足某些请求时 由于用不着查看数据的最初数据源而会更加有效 22 数据仓库的技术需求 从大容量存储器迅速恢复指能够从非直接存取存储设备快速地恢复数据仓库表 当可以从二级存储设备上恢复时 就可以节约大量开支 23 数据仓库专用DBMS 24 数据仓库专用DBMS 数据仓库专用数据库管理系统 是特别为数据仓库和决策支持而优化设计的管理系统 与通用DBMS的区别专用DBMS的处理类型为装入和访问 而通用DBMS必须适合于记录级的数据更新专用DBMS不需要自由空间 而通用DBMS对数据在块级上的管理要包括一些附加空间专用DBMS可以使用更完善的索引结构 而通用DBMS限制有限数量的索引专用DBMS物理上优化数据是为了便于访问和分析 而通用DBMS优化数据是为了事务的访问 25 数据仓库专用DBMS 是否应该改变DBMS技术 是当今可用的DBMS技术 当数据仓库首次载入数据时并不合适数据仓库已经变得非常之大 以至于应该提出新的技术方法数据仓库的利用已经提高许多 也改变了许多 使得现在的数据仓库的DBMS技术已经不适用了 26 数据仓库专用DBMS 是否应该考虑找一种新的DBMS技术 新的DBMS技术是否满足可预知的需求 从旧的DBMS向新的DBMS的转换应该怎样去做 转换的程序应该怎样改变 27 多维DBMS和数据仓库 28 多维DBMS和数据仓库 多维DBMS 有时也叫 数据集市 多维DBMS提供一种信息系统结构 使得对数据的访问非常灵活 可以以多种方法对数据进行分片 分割 动态地考察汇总数据和细节数据的关系多维DBMS不仅提供了灵活性 还可以对终端用户进行管理多维DBMS和数据仓库有互补关系 29 多维DBMS和数据仓库 多维DBMS数据集市的关系型基础优能支持大量数据能支持数据的动态连接已被证实是有效的技术如果对数据的使用模型不清楚的话 关系型结构与其他任何结构一样好劣性能上不是最好的不能单独对访问处理进行优化 30 多维DBMS和数据仓库 多维DBMS数据集市的 立方体 基础优对于DSS处理性能上是优化的能够对数据的快速访问进行优化如果已知数据访问的模式 则数据的结构可以优化能够很轻松地 切片和分块 可以用多种方法检测劣几乎不能处理像标准的关系模型那么多的数据不支持通用的更新处理装入的时间很长如果对路径的访问不被数据设计所支持的话 这种结构就显得不灵活对数据的动态连接的支持是有问题的 31 数据仓库中的元数据 32 数据仓库中的元数据 数据仓库中的元数据包括两大部分 有关集成的信息数据仓库字典 33 数据仓库中的元数据 数据仓库中元数据特点服务于DSS专业人员 而不仅仅是IT人员 34 数据仓库中的元数据 数据仓库中元数据特点涉及到从操作型环境到数据仓库环境的映射 35 数据仓库中的元数据 数据仓库中元数据特点数据会存在一段很长的时间 36 上下文维和上下文信息 37 上下文维和上下文信息 数据仓库中需要上下文维数据仓库的一个重要特征是能够对一段时间的信息进行存储和管理为了理解和解释一段时间内的信息 需要信息发生的背景三个级别的上下文信息简单上下文信息复杂上下文信息外部上下文信息 38 上下文维和上下文信息 简单上下文信息与数据本身的基本结构有关 包括数据的结构数据的编码数据的命名约定描述数据的度量数据的多少数据增长速度数据的哪一部分增长数据是怎样被使用的简单上下文以往是用字典 目录 系统监视器等管理的 39 上下文维和上下文信息 复杂上下文信息描述的是和简单上下文相同的数据 但从不同的侧面描述 其强调下面几点产品定义市场领域定价包装组织结构分发复杂上下文信息非常有用但基本 但非常难以捉摸 它令人难以捉摸是因为它是想当然的 并存在于背景环境中 40 上下文维和上下文信息 外部上下文信息是公司以外的 但在理解随时间变化的信息方面起重要作用的信息 实例包括经济预测通货膨胀金融税务经济增长政治信息竞争信息技术进展 41 上下文维和上下文信息 捕获和管理上下文信息复杂上下文信息和外部上下文信息是非结构化的上下文信息变化很快以往管理上下文信息的方法的缺点信息的管理针对信息系统的开发者 而不是最终用户对上下文管理的意图是被动的对上下文管理的意图在很多情况下会从开发计划中删除掉对上下文管理的意图仅局限于简单上下文 42 建立数据仓库 43 建立数据仓库 建立数据仓库的任务就是将数据源中的数据整理后按照数据仓库的结构 放入数据仓库的物理存储介质中数据仓库的建立分为三个子任务 抽取数据 extractingdata 转换数据 transformingdata 加载数据 transporting loadingdata 因此 建立数据仓库的过程也称为ETT过程或ETL过程 44 建立数据仓库 ETT过程 ExtractsourcedataTransform cleandataIndexandsummarize LoaddataintoWHDetectchangesRefreshdata Programs Tools ETT Operationalsystems Warehouse Gateways 45 数据仓库的数据刷新 46 数据仓库的数据刷新 数据仓库的数据定期刷新是一项巨大的开销数据刷新的方法直接读取老的传统的数据库 开销非常大在传统环境中捕捉正在修改的数据数据复制 改变发生时数据被捕获 设置一个 触发器 来捕获数据的更新活动变化数据捕获 将发生了的改变从在联机更新时生成的日志中提取出来 47 学完本讲后 你应该能够了解 数据仓库中没有联机更新 因而数据仓库比数据库需要一

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论