浙江大学数据挖掘在线作业_第1页
浙江大学数据挖掘在线作业_第2页
浙江大学数据挖掘在线作业_第3页
浙江大学数据挖掘在线作业_第4页
浙江大学数据挖掘在线作业_第5页
已阅读5页,还剩5页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

本文格式为Word版,下载可任意编辑——浙江大学数据挖掘在线作业您的本次作业分数为:100分单项选择题

1.孤立点挖掘适用于以下哪种场合?

A目标市场分析B购物篮分析C模式识别D信用卡欺诈检测

正确答案:D单项选择题

2.根据顾客的收入和职业状况,预计他们在计算机设备上的花费,所使用的相应数据挖掘功能是()。

A关联分析B分类和预计C蜕变分析D概念描述

正确答案:B单项选择题

3.数据挖掘应用和一些常见的数据统计分析系统的最主要区别在于()。

A所涉及的算法的繁杂性B所涉及的数据量C计算结果的表现形式D是否使用了人工智能技术

正确答案:B单项选择题

4.以下几种数据挖掘功能中,()被广泛的应用于股票价格走势分析。

A关联分析B分类和预计C聚类分析D蜕变分析

正确答案:D单项选择题

5.以下几种数据挖掘功能中,()被广泛的用于购物篮分析。

A关联分析B分类和预计C聚类分析D蜕变分析

正确答案:A单项选择题

6.帮助市场分析人员从客户的基本信息库中发现不同的客户群,寻常所使用的数据挖掘功能是()。

A关联分析B分类和预计C聚类分析D孤立点分析E蜕变分析

正确答案:C单项选择题

7.下面的数据挖掘的任务中,()将决定所使用的数据挖掘功能。

A选择任务相关的数据B选择要挖掘的知识类型C模式的兴趣度度量D模式的可视化表示

正确答案:B单项选择题

8.假设现在的数据挖掘任务是解析数据库中关于客户的一般特征的描述,寻常所使用的数据挖掘功能是()。

A关联分析B分类和预计

C孤立点分析D蜕变分析E概念描述

正确答案:E单项选择题

9.以下哪种可视化方法可用于发现多维数据中属性之间的两两相关性?

A空间填充曲线B散点图矩阵C平行坐标D圆弓分割

正确答案:B单项选择题

10.计算一个单位的平均工资,使用哪个中心趋势度量将得到最合理的结果?

A算术平均值B截尾均值C中位数D众数

正确答案:B单项选择题

11.字段Size={small,medium,large}属于那种属性类型?

A标称属性B二元属性C序数属性D数值属性

正确答案:C单项选择题12.字段Hair_color={auburn,black,blond,brown,grey,red,white}属于那种属性类型?

A标称属性

B二元属性C序数属性D数值属性

正确答案:A单项选择题

13.哪种数据变换的方法将数据沿概念分层向上汇总?

A平滑B聚集C数据概化D规范化

正确答案:C单项选择题

14.下面哪种数据预处理技术可以用来平滑数据,消除数据噪声?

A数据清理B数据集成C数据变换D数据归约

正确答案:A单项选择题

15.()通过将属性域划分为区间,从而减少给定连续值的个数。

A概念分层B离散化C分箱D直方图

正确答案:B单项选择题

16.数据的噪声是指()。

A孤立点

B空缺值

C测量变量中的随即错误或偏差D数据变换引起的错误

正确答案:C单项选择题

17.进行数据规范化的目的是()。

A去掉数据中的噪声B对数据进行汇总和聚集

C使用概念分层,用高层次概念替换低层次“原始〞数据D将属性按比例缩放,使之落入一个小的特定区间正确答案:D单项选择题

18.数据归约的目的是()。

A填补数据种的空缺值B集成多个数据源的数据C得到数据集的压缩表示D规范化数据

正确答案:C多项选择题

19.以下哪些是数据变换可能涉及的内容?

A数据压缩B数据概化C维归约D规范化

正确答案:BD多项选择题

20.数据清理的目的是处理数据中的()。

A空缺值

B噪声数据C不一致数据D敏感数据

正确答案:ABC多项选择题

21.下面哪些问题是我们进行数据预处理的原因?

A数据中的空缺值B噪声数据C数据中的不一致性D数据中的概念分层

正确答案:ABC多项选择题

22.以下哪些原因可能引起空缺值?

A设备异常B命名规则的不一致

C与其他已有数据不一致而被删除

D在输入时,有些数据由于得不到重视而没有被输入

正确答案:ACD单项选择题

23.以下哪个范围是数据仓库的数据库规模的一个合理范围?

A1-100MB100M-10GC10-1000GD100GB-数TB

正确答案:D单项选择题

24.下面的数据操作中,哪些操作不是多维数据模型上的OLAP操作?

A上卷(roll-up)

B选择(select)C切片(slice)D转轴(pivot)

正确答案:B单项选择题

25.平均值函数avg()属于哪种类型的度量?

A分布的B代数的C整体的D混合的

正确答案:B单项选择题

26.存放最低层汇总的方体称为()。

A顶点方体B方体的格C基本方体D维

正确答案:C单项选择题

27.哪种OLAP操作可以让用户在更高的抽象层,更概化的审视数据?

A上卷B下钻C切块D转轴

正确答案:A多项选择题

28.从结构的角度看,数据仓库模型包括以下几类()。

A企业仓库

B数据集市C虚拟仓库D信息仓库

正确答案:ABC多项选择题

29.以下哪些是数据仓库的主要应用?

A信息处理B互联网探寻C分析处理D数据挖掘

正确答案:ACD多项选择题

30.OLAP系统和OLTP系统的主要区别包括()。

AOLTP系统主要用于管理当前数据,而OLAP系统主要存放的是历史数据B在数据的存取上,OLTP系统比OLAP系统有着更多的写操作

C对OLTP系统上的数据访问量往往比对OLAP系统的数据访问量要大得多DOLAP系统中往往存放的是汇总的数据,而OLTP系统中往往存放详细的数据正确答案:ABD多项选择题

31.数据仓库的三层架构主要包括以下哪三部分?

A数据源B数据仓库服务器COLAP服务器D前端工具

正确答案:BCD单项选择题

32.以下哪个描述是正确的?

A分类和聚类都是有指导的学习

B分类和聚类都是无指导的学习

C分类是有指导的学习,聚类是无指导的学习D分类是无指导的学习,聚类是有指导的学习

正确答案:C单项选择题

33.下面哪种分类方法是属于神经网络学习算法?

A判定树归纳B贝叶斯分类C后向传播分类D基于案例的推理

正确答案:C单项选择题

34.下面哪种分类方法是属于统计学的分类方法?

A判定树归纳B贝叶斯分类C后向传播分类D基于案例的推理

正确答案:B单项选择题

35.以下哪种聚类方法可以发现任意形状的聚类?

A划分的方法B基于模型的方法C基于密度的方法D层次的方法

正确答案:C单项选择题

36.下面那种数据挖掘方法可以用来检测孤立点?

A概念描述

B分类和预计C聚类分析D蜕变分析

正确答案:C单项选择题

37.以下哪个指标不是表示对象间的相像度和相异度?

AEuclidean距离BManhattan距离CEula距离DMinkowski距离

正确答案:C单项选择题

38.根据关联分析中所处理的值类型,可以将关联规则分类为()。

A布尔关联规则和量化关联规则B单维关联规则和多维关联规则C单层关联规则和多层关联规则D简答关联规则和繁杂关联规则

正确答案:A单项选择题

39.支持度(support)是衡量兴趣度度量()的指标。

A实用性B确定性C简单性D别致性

正确答案:A单项选择题

40.以下几种数据挖掘功能中,()被广泛的用于购物篮分析。

A关联分析

B分类和预计C聚类分析D蜕变分析

正确答案:A单项选择题

41.规则:age(X,〞19-25〞)∧buys(X,“popcorn〞)=>buys(X,“coke〞)是一个()。

A单维关联规则B多维关联规则C混合维关联规则D不是一个关联规则

正确答案:B单项选择题

42.置信度(confidence)是衡量兴趣度度量()的指标。

A简单性B确定性C实用性D别致性

正确答案:B多项选择题

43.根据关联分析中所涉及的抽象层,可以将关联规则分类为()。

A布尔关联规则B单层关联规则C多维关联规则D多层关联规则

正确答案:BD多项选择题

44.根

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论