




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第2章数据仓库的概念与体系结构历史数据的几种处理方式:1)简单删除2)备份后删除3)建立数据仓库12/10/2022数据仓库与数据挖掘第2章数据仓库的概念与体系结构历史数据的几种处理方式:2.1数据仓库的概念、特点与组成数据仓库的概念数据仓库就是一个面向主题的(SubjectOriented)、集成的(Integrate)、相对稳定的(Non-Volatile)、反映历史变化(TimeVariant)的数据集合,通常用于辅助决策支持(DDS)12/10/2022数据仓库与数据挖掘2.1数据仓库的概念、特点与组成数据仓库的概念12/8/22.1数据仓库的概念、特点与组成数据仓库的特点:面向主题;集成的;相对稳定的;反映历史变化。12/10/2022数据仓库与数据挖掘2.1数据仓库的概念、特点与组成数据仓库的特点:12/8/2.1数据仓库的概念、特点与组成数据仓库的组成:数据仓库数据库(核心部分)(特点:支持海量数据和快速检索);数据抽取工具(提取、转换、整理),数据转换的内容通常有:1)删除没意义的数据;2)转换到统一的数据名称和定义;3)计算统计和衍生数据;4)填补缺失数据等;元数据:技术元数据与业务元数据;技术元数据:数据仓库的涉及和管理人员用于开发和管理数据仓库时使用的元数据,包括:数据转换的描述、数据清洗和数据更新时用的规则等等。
业务元数据:从单位业务的角度描述数据仓库,如业务主题的描述,即业务主体包含的数据、查询及报表等。12/10/2022数据仓库与数据挖掘2.1数据仓库的概念、特点与组成数据仓库的组成:12/8/2.1数据仓库的概念、特点与组成数据仓库的组成:-访问工具:如分析、报表、数据挖掘工具数据集市(DataMarts):为特定的应用目的,从数据仓库中独立出来的一部分数据,也称部门数据或主题数据。数据仓库管理:包括安全与权限的管理、数据更新的跟踪、元数据的管理与更新、数据的复制于删除等等。信息发布系统:将数据发送给不同的地点或用户。12/10/2022数据仓库与数据挖掘2.1数据仓库的概念、特点与组成数据仓库的组成:12/8/2.2数据挖掘的概念与方法数据挖掘的概念数据挖掘(DataMining),就是从大量数据中获取有效的、新颖的、潜在有用的、最终可理解的模式的非平凡过程,简单的说,数据挖掘就是从大量数据中提取或“挖掘”知识,又被称为数据库中的知识发现(KnowledgeDiscoveryinDatabase,KDD)12/10/2022数据仓库与数据挖掘2.2数据挖掘的概念与方法数据挖掘的概念12/8/20222.2数据挖掘的概念与方法数据挖掘的方法:直接数据挖掘间接数据挖掘。12/10/2022数据仓库与数据挖掘2.2数据挖掘的概念与方法数据挖掘的方法:12/8/2022.2数据挖掘的概念与方法数据仓库与数据挖掘的关系若将数据仓库(DataWarehouse)比作矿井,那么数据挖掘(DataMining)就是深入矿井采矿的工作数据挖掘是从数据仓库中找出有用信息的一种过程与技术
12/10/2022数据仓库与数据挖掘2.2数据挖掘的概念与方法数据仓库与数据挖掘的关系12/82.3数据仓库的技术、方法与产品联机事务处理(OLTP)与联机分析处理(OLAP)的比较;见表1.1OLAP技术的有关概念:多维数据集、维度、度量值和多维分析(切片、切块、钻取、旋转等);OLAP根据其存储数据的方式可分为三类:ROLAP、MOLAP、HOLAP(混合,低层关系型,高层多维型)OLAP工具:对特定问题的联机数据访问与分析,一般是前端工具。
12/10/2022数据仓库与数据挖掘2.3数据仓库的技术、方法与产品联机事务处理(OLTP)与2.3数据仓库的技术、方法与产品数据仓库实施中的三个关键环节数据抽取;数据存储与管理:大量数据管理,并行处理,支持查询的优化,支持多维分析的查询模式数据表现:工具主要集中在多维分析、数据挖掘、统计分析。12/10/2022数据仓库与数据挖掘2.3数据仓库的技术、方法与产品数据仓库实施中的三个关键环2.3数据仓库的技术、方法与产品数据仓库实施方法论数据仓库不是简单的数据或产品堆砌,它是一个综合集成解决方案和系统工程。在数据仓库的实施过程中,技术决策至关重要,技术选择或决策错误很可能导致项目实施失败12/10/2022数据仓库与数据挖掘2.3数据仓库的技术、方法与产品数据仓库实施方法论12/82.3数据仓库的技术、方法与产品常用数据仓库产品比较常用OLAP工具介绍;各数据仓库厂商提供的解决方案IBM、Oracle、NCR、Microsoft、SAS等12/10/2022数据仓库与数据挖掘2.3数据仓库的技术、方法与产品常用数据仓库产品比较12/2.4数据仓库系统的体系结构数据仓库系统的体系结构的分类(1)两层架构(GenericTwo-LevelArchitecture)。(2)独立型数据集市(IndependentDataMart)。(3)依赖型数据集市和操作型数据存储(DependentDataMartandOperationalDataStore)。(4)逻辑型数据集市和实时数据仓库(LogicalDataMartandReal-TimeDataWarehouse)。12/10/2022数据仓库与数据挖掘2.4数据仓库系统的体系结构数据仓库系统的体系结构的分类12.4数据仓库系统的体系结构两层数据仓库体系结构
12/10/2022数据仓库与数据挖掘2.4数据仓库系统的体系结构两层数据仓库体系结构12/82.4数据仓库系统的体系结构基于独立数据集市的数据仓库体系结构
12/10/2022数据仓库与数据挖掘2.4数据仓库系统的体系结构基于独立数据集市的数据仓库体系2.4数据仓库系统的体系结构基于依赖型数据集市和操作型数据存储(ODS)的数据仓库体系结构
12/10/2022数据仓库与数据挖掘2.4数据仓库系统的体系结构基于依赖型数据集市和操作型数据2.4数据仓库系统的体系结构逻辑型数据集市和实时数据仓库的体系结构
12/10/2022数据仓库与数据挖掘2.4数据仓库系统的体系结构逻辑型数据集市和实时数据仓库的2.5数据仓库的产生、发展与未来数据仓库的产生联机事务处理系统(业务系统)刚上线时,查询不到数据是因为数据太少了,而几十年后查询不到有关数据是因为数据太多了。针对这一问题,人们设想专门为业务数据的统计分析建立一个数据中心,它的数据从联机事务处理系统中来、从异构的外部数据源来、或从脱机的历史业务数据中来,这个数据中心也是一个联机系统,它专门为分析统计和决策支持应用服务,通过它可获取决策支持和联机分析应用所需要的一切数据。这个数据中心就叫做数据仓库。简单地说,数据仓库就是一个作为决策支持和联机分析应用系统数据源的结构化数据环境,数据仓库要研究和解决的问题就是从数据库中获取信息的问题。
12/10/2022数据仓库与数据挖掘2.5数据仓库的产生、发展与未来数据仓库的产生12/8/22.5数据仓库的产生、发展与未来数据仓库的发展以报表为主以分析为主以预测模型为主以营运导向为主以实时数据仓库、自动决策应用为主
12/10/2022数据仓库与数据挖掘2.5数据仓库的产生、发展与未来数据仓库的发展12/8/22.5数据仓库的产生、发展与未来数据仓库的未来在数据抽取方面,未来的技术发展将集中在系统集成化方面。它将互连、转换、复制、调度、监控纳入标准化的统一管理,以适应数据仓库本身或数据源可能的变化,使系统更便于管理和维护。在数据管理方面,未来的发展将使数据库厂商明确推出数据仓库引擎,作为数据仓库服务器产品与数据库服务器并驾齐驱。在这一方面,带有决策支持扩展的并行关系数据库将最具发展潜力。在数据表现方面,数理统计的算法和功能将普遍集成到联机分析产品中,并与Internet/Web技术紧密结合。按行业应用特征细化的数据仓库用户前端软件将成为产品作为数据仓库解决方案的一部分。数据仓库实现过程的方法论将更加普及,将成为数据库设计的一个明确分支,成为管理信息系统设计的必备
12/10/2022数据仓库与数据挖掘2.5数据仓库的产生、发展与未来数据仓库的未来12/8/2第2章数据仓库的概念与体系结构历史数据的几种处理方式:1)简单删除2)备份后删除3)建立数据仓库12/10/2022数据仓库与数据挖掘第2章数据仓库的概念与体系结构历史数据的几种处理方式:2.1数据仓库的概念、特点与组成数据仓库的概念数据仓库就是一个面向主题的(SubjectOriented)、集成的(Integrate)、相对稳定的(Non-Volatile)、反映历史变化(TimeVariant)的数据集合,通常用于辅助决策支持(DDS)12/10/2022数据仓库与数据挖掘2.1数据仓库的概念、特点与组成数据仓库的概念12/8/22.1数据仓库的概念、特点与组成数据仓库的特点:面向主题;集成的;相对稳定的;反映历史变化。12/10/2022数据仓库与数据挖掘2.1数据仓库的概念、特点与组成数据仓库的特点:12/8/2.1数据仓库的概念、特点与组成数据仓库的组成:数据仓库数据库(核心部分)(特点:支持海量数据和快速检索);数据抽取工具(提取、转换、整理),数据转换的内容通常有:1)删除没意义的数据;2)转换到统一的数据名称和定义;3)计算统计和衍生数据;4)填补缺失数据等;元数据:技术元数据与业务元数据;技术元数据:数据仓库的涉及和管理人员用于开发和管理数据仓库时使用的元数据,包括:数据转换的描述、数据清洗和数据更新时用的规则等等。
业务元数据:从单位业务的角度描述数据仓库,如业务主题的描述,即业务主体包含的数据、查询及报表等。12/10/2022数据仓库与数据挖掘2.1数据仓库的概念、特点与组成数据仓库的组成:12/8/2.1数据仓库的概念、特点与组成数据仓库的组成:-访问工具:如分析、报表、数据挖掘工具数据集市(DataMarts):为特定的应用目的,从数据仓库中独立出来的一部分数据,也称部门数据或主题数据。数据仓库管理:包括安全与权限的管理、数据更新的跟踪、元数据的管理与更新、数据的复制于删除等等。信息发布系统:将数据发送给不同的地点或用户。12/10/2022数据仓库与数据挖掘2.1数据仓库的概念、特点与组成数据仓库的组成:12/8/2.2数据挖掘的概念与方法数据挖掘的概念数据挖掘(DataMining),就是从大量数据中获取有效的、新颖的、潜在有用的、最终可理解的模式的非平凡过程,简单的说,数据挖掘就是从大量数据中提取或“挖掘”知识,又被称为数据库中的知识发现(KnowledgeDiscoveryinDatabase,KDD)12/10/2022数据仓库与数据挖掘2.2数据挖掘的概念与方法数据挖掘的概念12/8/20222.2数据挖掘的概念与方法数据挖掘的方法:直接数据挖掘间接数据挖掘。12/10/2022数据仓库与数据挖掘2.2数据挖掘的概念与方法数据挖掘的方法:12/8/2022.2数据挖掘的概念与方法数据仓库与数据挖掘的关系若将数据仓库(DataWarehouse)比作矿井,那么数据挖掘(DataMining)就是深入矿井采矿的工作数据挖掘是从数据仓库中找出有用信息的一种过程与技术
12/10/2022数据仓库与数据挖掘2.2数据挖掘的概念与方法数据仓库与数据挖掘的关系12/82.3数据仓库的技术、方法与产品联机事务处理(OLTP)与联机分析处理(OLAP)的比较;见表1.1OLAP技术的有关概念:多维数据集、维度、度量值和多维分析(切片、切块、钻取、旋转等);OLAP根据其存储数据的方式可分为三类:ROLAP、MOLAP、HOLAP(混合,低层关系型,高层多维型)OLAP工具:对特定问题的联机数据访问与分析,一般是前端工具。
12/10/2022数据仓库与数据挖掘2.3数据仓库的技术、方法与产品联机事务处理(OLTP)与2.3数据仓库的技术、方法与产品数据仓库实施中的三个关键环节数据抽取;数据存储与管理:大量数据管理,并行处理,支持查询的优化,支持多维分析的查询模式数据表现:工具主要集中在多维分析、数据挖掘、统计分析。12/10/2022数据仓库与数据挖掘2.3数据仓库的技术、方法与产品数据仓库实施中的三个关键环2.3数据仓库的技术、方法与产品数据仓库实施方法论数据仓库不是简单的数据或产品堆砌,它是一个综合集成解决方案和系统工程。在数据仓库的实施过程中,技术决策至关重要,技术选择或决策错误很可能导致项目实施失败12/10/2022数据仓库与数据挖掘2.3数据仓库的技术、方法与产品数据仓库实施方法论12/82.3数据仓库的技术、方法与产品常用数据仓库产品比较常用OLAP工具介绍;各数据仓库厂商提供的解决方案IBM、Oracle、NCR、Microsoft、SAS等12/10/2022数据仓库与数据挖掘2.3数据仓库的技术、方法与产品常用数据仓库产品比较12/2.4数据仓库系统的体系结构数据仓库系统的体系结构的分类(1)两层架构(GenericTwo-LevelArchitecture)。(2)独立型数据集市(IndependentDataMart)。(3)依赖型数据集市和操作型数据存储(DependentDataMartandOperationalDataStore)。(4)逻辑型数据集市和实时数据仓库(LogicalDataMartandReal-TimeDataWarehouse)。12/10/2022数据仓库与数据挖掘2.4数据仓库系统的体系结构数据仓库系统的体系结构的分类12.4数据仓库系统的体系结构两层数据仓库体系结构
12/10/2022数据仓库与数据挖掘2.4数据仓库系统的体系结构两层数据仓库体系结构12/82.4数据仓库系统的体系结构基于独立数据集市的数据仓库体系结构
12/10/2022数据仓库与数据挖掘2.4数据仓库系统的体系结构基于独立数据集市的数据仓库体系2.4数据仓库系统的体系结构基于依赖型数据集市和操作型数据存储(ODS)的数据仓库体系结构
12/10/2022数据仓库与数据挖掘2.4数据仓库系统的体系结构基于依赖型数据集市和操作型数据2.4数据仓库系统的体系结构逻辑型数据集市和实时数据仓库的体系结构
12/10/2022数据仓库与数据挖掘2.4数据仓库系统的体系结构逻辑型数据集市和实时数据仓库的2.5数据仓库的产生、发展与未来数据仓库的产生联机事务处理系统(业务系统)刚上线时,查询不到数据是因为数据太少了,而几十年后查询不到有关数据是因为数据太多了。针对这一问题,人们设想专门为业务数据的统计分析建立一个数据中心,它的数据从联机事务处理系统中来、从异构的外部
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 南京大学《热流体学基础》2023-2024学年第一学期期末试卷
- 2025年现代服务业发展趋势考试试题及答案
- 汕头大学《数字影像工程》2023-2024学年第二学期期末试卷
- 2025年中级职称医学考试试题及答案
- 山东省临沂市平邑县2025年初三化学试题第一周周末练习含解析
- 2025年运动与健康科学专业考试试题及答案
- 2025年网络安全技术职业资格考试试题及答案
- 2025年行政职业能力测验试卷及答案
- 江西省赣州市南康中学2025年高三下学期第三次模拟考试(期中)生物试题含解析
- 外贸电气知识培训课件
- 2025至2030中国电化学储能行业发展现状及趋势前景预判研究报告
- 2025年公共卫生与预防医学知识考试试题及答案
- 离婚协议书原版
- 2025年高考地理复习 大单元八 人口、城镇与大都市辐射 题库
- 2025电力变压器(电抗器)综合监测与预警装置
- 新人教版数学五年级下册3.3 练习五课件
- 2025年中考化学第一轮复习 课件 2024-2025学年九年级化学人教版下册
- 2025年天津市滨海新区中考数学一模试卷
- 培训学校合伙协议书
- 农服公司招聘试题及答案
- 2025年杭州市高三语文二模作文题目“科技与相互理解”写作指导
评论
0/150
提交评论