数据仓库基础知识培训_第1页
数据仓库基础知识培训_第2页
数据仓库基础知识培训_第3页
数据仓库基础知识培训_第4页
数据仓库基础知识培训_第5页
已阅读5页,还剩22页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

内部交流数据仓库我们公司数据中心架构指标、维度与报表和OLAP分析主题关系名词解释及缩略语数据仓库概述

随着信息技术的不断推广和应用,许多企业都已经在使用管理信息系统处理管理事务和日常业务。这些管理信息系统为企业积累了大量的信息。企业管理者开始考虑如何利用这些信息海洋对企业的管理决策提供支持。因此,产生了与传统数据库有很大差异的数据环境要求和从这些海洋数据中获取特殊知识的工具需要。本章目标:(1)了解数据仓库的发展与展望。(2)理解数据仓库的体系结构和参照结构。数据仓库概述1.1数据仓库的发展与展望1.2数据仓库的体系结构

1.3数据仓库的参照结构

1.1数据仓库的发展与展望

1.1.1从传统数据库到数据仓库随着市场竞争的加剧,信息系统的用户已经不满足于仅仅用计算机去处理每天所发生的事务数据,而是需要信息——能够支持决策的信息,去帮助管理决策。这就需要一种能够将日常业务处理中所收集到的各种数据转变为具有商业价值信息的技术,传统数据库系统无法承担这一责任。因为传统数据库的处理方式和决策分析中的数据需求不相称。这些不相称性主要表现在决策处理中的系统响应问题、决策数据需求的问题和决策数据操作的问题。

1.1数据仓库的发展与展望

1.决策处理的系统响应问题2.决策数据需求的问题3.决策数据操作的问题4.数据仓库与传统数据库的对比1.1数据仓库的发展与展望

对比内容数据库数据仓库数据内容当前值历史的、存档的、归纳的、计算的数据数据目标面向业务操作程序、重复处理面向主题域、管理决策分析应用数据特性动态变化、按字段更新静态、不能直接更新、只定时添加数据结构高度结构化、复杂、适合操作计算简单、适合分析使用频率高中到低数据访问量每个事务只访问少量记录有的事务可能要访问大量记录对响应时间的要求以秒为单位计量以秒、分钟、甚至小时为计量单位定义:

“一个面向主题的、集成的、随时间变化的、非易失性数据的集合,用于支持管理层的决策过程”。特性:面向主题性数据集成性数据的时变性数据的非易失性数据的集合性支持决策作用。

1.1.2数据仓库的定义与基本特性

1.2数据仓库的体系结构

1.2.1数据仓库的概念结构从数据仓库的概念结构看,应该包含:数据源、数据准备区、数据仓库数据库、数据集市/知识挖掘库以及各种管理工具和应用工具。

数据源业务系统外部数据源数据准备区数据仓库数据库应用工具管理工具数据集市/知识挖掘库应用工具数据集市/知识挖掘库图1.1数据仓库的概念结构1.2.2虚拟数据仓库结构

虚拟数据仓库利用描述了业务系统中数据位置和抽取数据算法的元数据直接从业务系统中抽取查询的数据进行概括、聚合操作后,将最终结果提供给用户

用户图1.2虚拟数据仓库结构数据仓库查询管理服务器业务系统数据库1.2.3数据集市结构

数据集市结构或称为主题结构的数据仓库是按照主题进行构思所形成的数据仓库,没有一个独立的数据仓库。系统的数据不存储在同一数据仓库中,每个主题有自己的物理存储区。

数据仓库查询管理服务器业务系统数据库主题1主题21.2.4单一数据仓库结构

将所有的主题都集中到一个大型数据库中的体系结构。数据源中数据被按照同一标准抽取到独立的数据仓库中,用户在使用时再根据主题将数据仓库中的数据发布到数据集市中。

数据仓库查询管理服务器业务系统数据库数据仓库数据集市1数据集市21.2.5分布式数据仓库结构

在企业各个分公司具有相当大的独立性时,企业总部设置一个全局数据仓库,各个分公司设置各自的局部数据仓库。局部数据仓库主要存储各自的未经转换的细节数据,全局数据仓库中主要存储经过转换的综合数据

站点A站点B

站点C站点D全局数据仓库局部数据仓库局部数据仓库局部数据仓库局部数据仓库总部1.3数据仓库的参照结构

数据仓库的基本功能包含:数据抽取,数据筛选、清理,清理后的数据加载,设立数据集市,完成数据仓库的查询、决策分析和知识的挖掘等操作。数据仓库的管理层分成数据管理与元数据管理两部分,主要负责对数据仓库中的数据抽取、清理、加载、更新与刷新等操作进行管理。数据仓库环境支持层包含数据传输和数据仓库基础两部分。数据仓库基本功能层数据仓库管理层数据仓库环境支持层1.3.1数据仓库基本功能层数据源数据准备区数据仓库结构数据集市/知识挖掘库存取与使用数据来源主要包含:业务数据、历史数据、办公数据、Web数据、外部数据以及数据源元数据

数据准备区的功能结构部分由数据标准化处理、数据的过滤与匹配、数据的净化处理、标明数据的时间戳、确认数据质量与元数据抽取和创建等操作组成

数据仓库的功能结构部分由数据重整和数据仓库创建以及元数据管理组成

数据集市/知识挖掘库的功能结构与数据仓库的功能结构极为相似

数据仓库的数据存取与使用结构主要为数据仓库的最终用户提供进行决策分析和挖掘知识的功能。数据仓库的数据存取与使用结构应该包含数据仓库存取与检索、元数据管理以及数据仓库分析与报告1.3.2数据仓库的管理层数据管理层中的数据抽取、新数据需求与查询管理主要负责完成从数据源中抽取数据的管理。数据仓库中的数据加载、存储、刷新和更新系统则负责对从数据源中所抽取的数据在完成筛选、净化处理以后,将这些数据加载、存储到数据仓库中;捕获数据源中的数据变化,用最新数据充实数据仓库;根据用户的需求和数据仓库管理的要求对数据仓库进行更新等工作。安全性与用户授权管理系统主要负责数据仓库的安全管理工作。数据仓库的数据归档、恢复及净化系统主要负责定期对数据仓库中的数据进行归档、备份。净化系统则负责对从数据源所抽取的数据进行数据的筛选、数据标准的统一、数据内容的统一等各种求精、重整净化工作的管理。数据抽取与新数据需求与查询管理数据加载、存储、刷新和更新系统安全性与用户授权管理系统数据归档、恢复及净化系统1.3.3数据仓库的元数据管理层负责管理数据仓库所使用的元数据,其中包括:数据仓库、数据集市/知识挖掘库和词汇表管理元数据抽取、创建、存储和更新管理预定义的查询和报表以及索引管理刷新与复制管理,登录、归档、恢复与净化管理数据仓库、数据集市和词汇表管理元数据抽取、创建、存储和更新管理预定义的查询、报表和索引管理刷新与复制管理登录、归档、恢复与净化管理1.3.4数据仓库的环境支持层

数据传输层包含了:数据传输和传送网络客户/服务器代理和中间件复制系统数据传输的安全保障系统

数据传输和传送网络客户/服务器代理和中间件复制系统安全和保障系统我们公司数据中心架构分析型系统

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论