数据仓库与数据挖掘论文_第1页
数据仓库与数据挖掘论文_第2页
数据仓库与数据挖掘论文_第3页
数据仓库与数据挖掘论文_第4页
数据仓库与数据挖掘论文_第5页
免费预览已结束,剩余5页可下载查看

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

数据仓库与数据挖掘数据仓库与数据挖掘 论文论文 题目 浅析基于数据仓库与数据挖掘技术题目 浅析基于数据仓库与数据挖掘技术 的决策支持系统的决策支持系统 指导老师 班级 学号 姓名 专业 2012 年 11 月 2 日 摘要摘要 通过对数据仓库与数据挖掘的学习和大致的了解 主要提出了一 种基于数据仓库的数据挖掘系统的决策支持系统的框架 该文章把 数据仓库 数据挖掘工具和知识库结合在一起 提高了数据挖掘的 效率 增加了挖掘数据的效率和价值实用性 一 概述一 概述 今天 越来越多的企业认识到要从以往的事务处理和决策中总 结经验 利用现有的数据进行分析和推理 建立企业的决策支持系 统 DSS 以提高决策的质量 企业如果不能快速精确的收集和分析 信息 将无法进行科学而有效的决策 建立数据仓库 Data warehouse 将能很的解决这一问题 使企业从大量的业务信息中筛 选出所需的信息 并做出正确的决策 数据仓库不是单一的产品 而是综合了多种信息技术的计算环境 它将全企业的运行数据汇集 到一个精心设计的关系数据库中 并将它们转换成面向主题 Subject oriented 的形式 使最终用户很容易的从历史的角度对 这些数据进行访问和分析 以银行为例 通常 银行的应用系统是 按业务分类的 如储蓄 信贷 信用卡等 一个客户的信息分布在 不同的业务系统中 要想得到一个客户的全面信息非常困难 银行 通过建立数据仓库 可以将分离在各个业务系统中的数据合并成一 个统一的图表 这样就可以看到客户在各个系统中的全貌 而且可 以从历史的角度对客户档案进行分析 以便做出为每一个客户进一 步服务的决策 二 数据仓库和数据挖掘的基本概念二 数据仓库和数据挖掘的基本概念 数据仓库是支持管理决策过程的 面向主题的 集成的 随时 间而变的 持久的数据集合 数据仓库系统负责从操作型数据库中 抽取数据 实现对集成和综合后的数据的管理 并把数据呈现给一 组数据仓库前端工具 以满足用户的各种分析和决策的需求 数据 仓库系统的前端工具以OLAP 工具和数据挖掘工具为代表 是用户赖 以从数据仓库中提取 分析数据 以及实施决策的必经途径 数据 挖掘DM Data Mining 是指从数据中识别出潜在有用的 先前未知 的 最终可理解的模式的非平凡过程 研究基于数据仓库的数据挖 掘系统结构框架是很有意义的 三 数据仓库的结构 功能三 数据仓库的结构 功能 1 数据仓库的基本结构 数据仓库中的信息存储 根据对数据的不同深度的分析处理而 区分为不同的层次 其基本结构分为以下几个部分 1 历史性详细数据层 它存储历史数据 用于数据对比 回归 汇总等供分析 建模预测之用 历史数据一般为5 至10 年或更久的 数据 它纵向只对数据 信息进行分类存储 2 当前详细数据层 存储当前最新详细数据 重点用于了解当前 情况 是进一步分析数据的基础 在一定时刻 这些数据会转移到 历史数据层去 3 不同程序的归纳总结信息层 可包含多个层次 根据所需分类 和归纳的不同深度而定 如按周 月 年统计的数据 这些信息只 是一些简单的汇总 尚不能形成高级的决策信息 4 专业信息分析层 进一步专业分析的结果 如统计分析 运筹 分析 时间序列分析以及表面数据的内在规律分析等 5 仓库结构信息 数据仓库的内部结构信息 反映各种信息在数 据仓库中的位置分布和处理方式等 以便检索查询之用 组织数据 仓库的数据时 应根据数据访问概率把数据分为经常被访问但较少 被修改的数据和经常被修改但较少被访问的数据 对于前者可以做 较多的索引 一般可做8 至12 个 来提高访问的效率 对于后者就 必须少建索引 否则 由于它经常被修改 重索引的概率就很大 反而会降低系统的效率 2 数据仓库的功能特点 数据仓库的主要功能是提供企业决策支持系统或执行信息系统 EIS 所需要的信息 它把企业日常运行中分散不一致的数据经归 纳整理后转换为集中统一的 可随时取用的深层信息 这种信息虽 然也是按关系数据库的存储结构存储的 单与面向逐条记录的联机 时务处理 OLTP 不同 在数据仓库中的一条记录 有可能是基础 数据中若干个表 若干条记录的归纳和汇总 数据仓库的基本特点是 1 面向对象性 数据仓库中存储的信息是面向主题来组织的 它 根据所需要的信息 分不同类 不同角度等主题把数据加工 整理 之后存储起来 按横向对数据进行分类存储 2 数据历史性 数据仓库中可以专门存储5 至10 年或更久的历 史数据 数据具有时间标示 以满足信息比较 分析预测等的数据 需求 按纵向对数据进行分类存储 3 数据集成性 无论数据来源于何处 进入数据仓库后都具有统 一的数据结构和编码规则 数据仓库中的数据具有一致性的特点 4 数据只读性 数据仓库是一个信息源 它只是为在其上开发的 DSS 或EIS 等提供信息服务 因此它应是只读数据库 一般不能轻 易改动 只能定期刷新 5 操作集合性 数据仓库可通过快照机制 成批的更新来自不同 资源的数据 将其载入数据仓库 也可以成批的访问数据 6 应用C S 客户机 服务器 性 数据仓库通过定义信息 元信 息 把整个数据组织起来 在元信息中有一类记录系统信息 定义 了数据存储 修改权限等 记录系统将原始数据转换成适合于数据 仓库应用的数据 所以这实际上是C S 应用模式 四 数据挖掘技术四 数据挖掘技术 数据挖掘是一种大型数据库 如数据仓库 中提取隐藏的预测 性信息的新技术 数据挖掘是一种展望和预测性的信息分析工具 它能挖掘数据间潜在的关系模式 发现用户可能忽略的信息 为企 业管理者提供前摄的 Proactive 基于知识的决策 数据挖掘技 术使DSS 的应用向效益型卖出了重要的一步 传统的DSS 通常是在 某个假设的前提下通过数据查询和分析来验证或否定这个假设 而 数据挖掘技术则能够自动分析数据 进行归纳性推理 从中发掘出 潜在模式或产生联想 建立新的业务模型 帮助决策者调整市场策 略 做出正确的决策 五 一种基于五 一种基于 DW 的的 DMS 结构框架结构框架 根据数据仓库系统的特点 提出一种基于数据仓库的通用数据 挖掘系统的结构框架 如图1 该结构框架的概念模型包括如下组成 部分 1 用户查询接口它可分为查询分类 查询解释及规格化两部分 其作用是将数据挖掘请求解释成规格化的查询语言 并交由查询协 同机处理 2 查询协同机它的工作是协同数据仓库管理系统 数据挖掘工具 管理系统和知识库管理系统 共同对查询接口提交的查询请求进行 处理 图 1 一种基于数据仓库的数据挖掘系统的结构框架 3 数据仓库管理系统它直接负责对数据仓库进行管理 并完成对 各种异构分布数据源中数据的提取工作 以最大限度屏蔽各异构数 据源对系统的影响 4 知识库管理系统它对知识库进行管理和控制 包括知识的增加 删除 更新和查询等 一方面 处理由查询协同机处理后产生的知 识库查询请求 并将结果提交给数据挖掘模块 另一方面 接受通 过知识评价的知识模式 并存入知识库 5 数据挖掘工具的管理系统它的作用是对数据挖掘工具进行管 理 6 数据挖掘预处理模块它的任务是在数据仓库管理系统的协同 下 根据元数据和维表 对整个数据仓库中储存的数据进行处理 生成符合用户查询需要的 并能满足数据挖掘工具集要求的待处理 数据子集 7 知识评价模块数据挖掘阶段发现出来的模式需要经过知识评 价模块的评估 如果存在冗余或无关的模式 则将其剔除了 如果 模式不能满足用户要求 则需要重新选取数据 设定新的数据挖掘 参数值 甚至更换数据挖掘算法重新进行数据挖掘 8 结论表达模块它将得到的结论按语义层次结构进行普化 得 出各语义层上的结论 并对其进行解释 将发现的模式以可视化或 自然语言的形式呈现给用户 六 基于数据仓库与数据挖掘技术的六 基于数据仓库与数据挖掘技术的 DSS 创建数据仓库的目的是为企业的DSS 和EIS 提供科学的决策依 据 数据仓库用于大量数据存储和组织 数据挖掘用于从大量的数 据中发现知识 为用户进行预测决策 数据挖掘以数据仓库和多维 数据库为基础 通过OLAP 和多维分析工具自动发现数据中的潜在 模式 并以这些模式为基础自动做出预测 数据仓库与数据挖掘技 术的结合为企业DSS 和EIS 的建立提供了新的 更有效的解决方案 图2 表明了这种方案的一种结构 七 结束语七 结束语 通过对数据仓库与数据挖掘教程的学习 我了解了数据仓库对相 关数据进行分析的方法 以及用相关软件预测的步骤 并且懂得了 企业未来的成功 很大程度上取决于准确的数据挖掘能力 许多领 域都需要对潜在的数据进行深层次的分析 困难主要有对数据的一 些概念和方法方法不太熟悉 导致思想比较懵懂 会时不时出现差 错 导致出现的结果与预期的不一致 但总体来说还是有很多收获 的 通过这次学习 我巩固了所学的理论知识 进一步理解了相关 的概念和方法 也明白了一些深刻的道理 即在遇到困难时不要放 弃 要有持之以恒的精神 遇到不懂的问题时要及时请教老师和同 学 要在实际动手操作时进一步完善自己的所学的知识 要善于思 考 善于总结 这样才能有所学有所想 学有所得 八 参考文献 八 参考文献 1 赖福

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论