数据挖掘习题二_第1页
数据挖掘习题二_第2页
数据挖掘习题二_第3页
全文预览已结束

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、数据挖掘习题二简答:1. 何谓数据挖掘?它有哪些方面的功能?2. 何谓数据仓库?为什么要建立数据仓库?3. 常见的分箱方法有哪些?数据平滑处理的方法有哪些?4. 何谓数据规范化?规范化的方法有哪些?写出对应的变换公式。数据挖掘讨论题1、(20分)讨论 ::下列每项活动是否是数据挖掘任务 ?简单陈述你的理由。(a) 根据性别划分公司的顾客。(b) 根据可赢利性划分公司的顾客。(c) 预测投一对骰子的结果。使用历史记录预测某公司未来的股票价格简答:5. 何谓数据挖掘?它有哪些方面的功能?从大量的、不完全的、有噪声的、模糊的、随机的数据中,提取隐含在其中的、 人们事先不知道的、但又是潜在有用的信息和

2、知识的过程称为数据挖掘。相关的名称 有知识发现、数据分析、数据融合、决策支持等。数据挖掘的功能包括:概念描述、关联分析、分类与预测、聚类分析、趋势分析、 孤立点分析以及偏差分析等。6. 何谓数据仓库?为什么要建立数据仓库?数据仓库是一种新的数据处理体系结构,是面向主题的、集成的、不可更新的(稳定性)、随时间不断变化(不同时间)的数据集合,为企业决策支持系统提供所需的集成 信息。建立数据仓库的目的有 3个:一是为了解决企业决策分析中的系统响应问题,数据仓库能提供比传统事务数据库更快的大规模决策分析的响应速度。二是解决决策分析对数据的特殊需求问题。决策分析需要全面的、正确的集成数据,这是传统事务数

3、据库不能直接提供的。三是解决决策分析对数据的特殊操作要求。决策分析是面向专业用户而非一般业务员,需要使用专业的分析工具,对分析结果还要以商业智能的方式进行表现,这是 事务数据库不能提供的。7. 常见的分箱方法有哪些?数据平滑处理的方法有哪些?分箱的方法主要有: 统一权重法(又称等深分箱法) 统一区间法(又称等宽分箱法) 最小熵法 自定义区间法数据平滑的方法主要有:平均值法、边界值法和中值法。8. 何谓数据规范化?规范化的方法有哪些?写出对应的变换公式。将数据按比例缩放(如更换大单位),使之落入一个特定的区域(如0.01.0),称为规范化。规范化的常用方法有: 最大最小规范化:max-min .

4、x= (X。_mino) + min(ma/ _min0)(2)零均值规范化:x0_XX=(3) 小数定标规范化:x= xo/10数据挖掘讨论题1、(10 分)讨论 ::下列每项活动是否是数据挖掘任务 ?简单陈述你的理由。(d) 根据性别划分公司的顾客。不是。 数据挖掘是在大型数据存储库中, 自动地发现有用信息的过程。 数据挖掘技 术服务用来探查大型数据库, 发现先前未知的有用模式。 还可以预测未来观测结果, 例如,预测一位新的顾客是否会在一家百货公司消费 100 美元以上。 但并非所有的 信息发现任务都被视为数据挖掘, 数据挖掘与信息检索不同, 使用数据库管理系统 查找个别的记录,或通过因特

5、网的搜索引擎查找特定的 Web 页面,则是信息检索 领域的任务,它们主要依赖传统的计算机科学技术和数据的明显特征来创建索引结 构,从而有效地组织和检索信息。 数据挖掘的任务可分为两大类: 预测任务和描述 任务。主要任务有四种:聚类分析,关联分析,异常检测,和预测建模。其目的是 根据其它属性的值, 预测特定属性的值, 或导出概括数据中潜在联系的模式, 主要 是预测某些信息。而根据性别划分公司的顾客,只是一种简单的数据库查询操作, 并没有涉及预测分析。(e) 根据可赢利性划分公司的顾客。不是。根据可赢利性划分公司的顾客是使用阈值进行的一种统计计算。 它仅仅是根 据消费结果统计将原有顾客进行划分,

6、只是一种统计的结果, 而没有根据这些结果 的特点预测一个新的顾客的赢利性,这种预测才是数据挖掘。(f) 预测投一对骰子的结果。不是。 因为骰子的六个数值出现的可能性是相同的,这是一种概率计算, 如果结果出现的可能性是不确定的, 不相同的, 则更像是数据挖掘的任务, 但在很早以前利 用数学已经能够很好的解决这个问题了。 所以预测投一对骰子的结果不属于数据挖 掘的任务,不带有发现新信息的预测特点。(g) 使用历史记录预测某公司未来的股票价格。这是数据挖掘的任务。 可以通过对历史记录特点的分析来创建一种模型预测未来的 公司的股票价格, 这是数据挖掘任务中预测建模的一个例子, 预测建模涉及以说明 变量函

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论