数据挖掘智慧树知到课后章节答案2023年下山东建筑大学_第1页
数据挖掘智慧树知到课后章节答案2023年下山东建筑大学_第2页
数据挖掘智慧树知到课后章节答案2023年下山东建筑大学_第3页
数据挖掘智慧树知到课后章节答案2023年下山东建筑大学_第4页
数据挖掘智慧树知到课后章节答案2023年下山东建筑大学_第5页
已阅读5页,还剩16页未读 继续免费阅读

付费下载

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

数据挖掘智慧树知到课后章节答案2023年下山东建筑大学山东建筑大学

第一章测试

下列属于大数据时代特征的是:

A:数据格式复杂,难以利用B:非结构化数据越来越多C:数据类型越来越复杂D:大人群产生了大量数据

答案:非结构化数据越来越多;数据类型越来越复杂;大人群产生了大量数据

对数据挖掘内涵描述正确的是

A:有噪声的数据不能用于数据挖掘B:数据挖掘的对象一般是大量的不完整的数据C:挖掘的结果可以是出乎意料的规则和内容D:挖掘的结果一定是大家熟悉的可以理解的

答案:数据挖掘的对象一般是大量的不完整的数据;挖掘的结果可以是出乎意料的规则和内容

聚类分析是预测型的数据挖掘,而关联分析是描述型的。

A:错B:对

答案:错

描述“性别”的属性是二元分类属性。

A:对B:错

答案:对

下列是分类型属性的是:

A:月收入:10500元B:身高:185cmC:信用等级:3(级别为1-5,数值越高信用级别越高)D:邮政编码:250101

答案:信用等级:3(级别为1-5,数值越高信用级别越高);邮政编码:250101

区间属性可以计算两个属性之间的倍数。

A:对B:错

答案:错

具有有限个值的属性才是离散属性。

A:对B:错

答案:错

定量属性可以取整数值。

A:错B:对

答案:对

关于连续属性与离散属性,下列说法正确的是:

A:连续属性的比率不一定有意义B:二元属性是连续属性C:连续属性有无限个取值D:离散属性有有限个取值

答案:连续属性的比率不一定有意义;连续属性有无限个取值

连续属性可以进行离散转化成离散属性。

A:对B:错

答案:对

第二章测试

和数据库中的数据一样,数据仓库中的数据也可以进行修改和删除。

A:对B:错

答案:错

以下哪项是元数据的包含的内容?

A:数据的更新频率B:数据所做的转换C:数据元素的含义D:数据的来源

答案:数据的更新频率;数据所做的转换;数据元素的含义;数据的来源

事实表中存储的是维度。

A:对B:错

答案:错

数据仓库的数据是面向主题的,主题与业务系统中的数据库是一一对应的。

A:错B:对

答案:错

下列哪项不是OLAP多维分析操作?

A:旋转B:透视C:切块D:钻取

答案:透视

维的层次越高,数据的粒度越大。

A:对B:错

答案:对

在OLAP多维分析操作中,旋转操作不改变数据,只是改变了数据集的展示方位。

A:对B:错

答案:对

星型模型不能表达维度的层次。

A:对B:错

答案:对

OLTP系统中的数据是数据仓库数据的主要来源。

A:对B:错

答案:对

数据仓库中不存储早期细节的数据。

A:错B:对

答案:错

第三章测试

Mondrian中Schema是以XML文件的形式定义的。Cube由维度构建出来的多维空间,是一系列DimensionMeasure的集合区域,它们共用一个事实表。

A:对B:错

答案:对

维度表是事实表的一部分。

A:对B:错

答案:错

事实表是维表的一部分。

A:错B:对

答案:错

维度表中包含事实数据。

A:对B:错

答案:错

Dimension(维度)是观察数据的一种角度,维度一般有其相对应的维度表,由Hierarchy(层次)组成,而Hierarchy(层次)又是由Level(级别)组成。

A:对B:错

答案:对

第四章测试

下列关于聚类分析描述错误的是?

A:当不知道数据集的类别标签可以通过聚类分析进行描述划分B:聚类是探索型数据挖掘C:划分聚类可以事先指定类别数量D:K中心点算法对噪声不敏感

答案:K中心点算法对噪声不敏感

由于K中心点算法采用了实际的对象作为中心点,因此能够发现任何形状的簇。

A:错B:对

答案:错

在所有核心点的指定半径邻域内的点数都不少于指定的阈值。

A:对B:错

答案:对

处理SS形状的数据时,适宜采用如下哪种聚类算法?

A:DBSCANB:K-中心点C:AGNESD:DIANA

答案:DBSCAN

K中心点算法是划分聚类算法的一种。

A:错B:对

答案:对

DBSCAN算法会删掉噪声点数据。

A:对B:错

答案:对

K-Means算法需要指定初始的中心点,但是聚类个数由算法自动决定。

A:对B:错

答案:错

将数据对象划分成不重叠的子集,使得每个对象恰在一个子集中,这种方法称作:

A:聚类B:预测C:补充缺值D:数据预处理

答案:聚类

AGNES算法和DIANA算法是相反的过程,但初始的簇都是一样的。

A:错B:对

答案:错

从点作为个体簇开始,每一步合并两个最接近的簇,这是一种分裂的层次聚类方法。

A:对B:错

答案:错

第五章测试

分类和回归都可用于预测,分类的输出是离散的类别值。

A:对B:错

答案:对

决策树的每个分支均包含了相应的决策规则。

A:错B:对

答案:对

朴素贝叶斯方法因做了不符合实际的假设,因此通常分类性能比较差。

A:错B:对

答案:错

朴素贝叶斯的分类结果是概率,表示最大可能的类别。

A:对B:错

答案:对

决策树包含如下哪几种节点?

A:外部节点B:属性节点C:根节点D:叶节点

答案:属性节点;根节点;叶节点

如果类别分布的信息熵是0.301,给定属性A的条件熵为0.2007,给定属性B的条件熵为0.1495,那么下列说法正确的是?

A:属性A的信息增益小于属性BB:属性A带来的信息多于属性BC:属性B带来的信息多于属性AD:属性A的信息增益大于属性B

答案:属性A的信息增益小于属性B;属性B带来的信息多于属性A

下面指标中,能够度量分类器对正例和负例识别能力的是?

A:正确度B:灵敏度和特效度C:精度D:错误率

答案:灵敏度和特效度

关于信息量,下列说法错误的是?

A:信息量的大小和不确定性的变化有关B:越确定的事情包含的信息量越小C:信息熵能够度量信息量的大小D:一组数据包含的信息量越小,熵越大

答案:越确定的事情包含的信息量越小

朴素贝叶斯网络假设属性和类别之间是独立的。

A:对B:错

答案:错

信息增益是一个属性比另一个属性信息熵的增加值。

A:对B:错

答案:错

第六章测试

变量y与x之间的回归方程反映y与x之间的真实关系达到最大限度的吻合。

A:对B:错

答案:对

多元线性回归分析的自变量与多个因变量呈现线性关系。

A:错B:对

答案:错

任何两个变量都具有相关关系。

A:对B:错

答案:错

在研究自变量X与因变量Y之间的线性相关关系时,相关系数r<0,表示两个变量?

A:正相关B:负相关C:线性不相关D:无法判断

答案:负相关

根据一组试验数据可以求出不同的回归方程,评价哪个好的常用准则是?

A:判定系数R2越接近1越好B:只是形式不同的回归方程,其结果是一样C:相关系数越小越好D:相关系数越大越好

答案:判定系数R2越接近1越好

为了了解变量x与y之间是否有相关关系,可以画下面哪种图形加以考查?

A:正态概率图B:散点图C:直方图D:排列图

答案:散点图

第七章测试

同一个关联规则的支持度和置信度无法比较大小。

A:对B:错

答案:错

同时大于支持度和置信度阈值的强关联规则一定是有意义的规则。

A:错B:对

答案:错

Apriori算法中,Hash树用于剪枝提高了算法的效率。

A:对B:错

答案:错

FP树算法与Apriori算法比,生成频繁项集的效率一样,但是在规则提取阶段FP算法效率更高。

A:对B:错

答案:错

关联规则的前项和后项互换后,支持度是一样的。

A:对B:错

答案:对

FP算法和Apriori算法比较,描述正确的是?

A:在构建完成FP树后,FP算法不需要再扫描数据库B:FP算法只需要扫描一次数据库C:一般情况下,Apriori算法扫描数据库的次数多于FP算法D:FP算法和Apriori算法扫描数据库的次数一样

答案:在构建完成FP树后,FP算法不需要再扫描数据库;一般情况下,Apriori算法扫描数据库的次数多于FP算法

前项和后项负相关时,即使符合强关联规则的要求,也是无意义的。

A:对B:错

答案:对

关联规则的评价指标包括:

A:正确率B:支持度、置信度C:提升度liftD:召回率

答案:支持度、置信度;提升度lift

在Apriori算法中,关于强关联规则的生成,下面说法正确的是?

A:首先产生前件只有一项的强关联规则B:随机产生强关联规则C:首先产生后件只有一项的强关联规则D:首先产生前件只有2项的强关联规则

答案:首先产生后件只有一项的强关联规则

FP算法中,每个事务都按照项的支持度计数的降序映射为FP树中的一条路径。

A:对B:错

答案:对

第八章测试

机器学习想做的事情,简单的说是要从资料中归纳出有用的规则。大数据说的是对大量的资料做分析,而人工智能说的是让机器看起来更聪明,两者都可以使用机器学习来做核心的工具。

A:错B:对

答案:对

关于人工神经网络描述,正确的是

A:神经网络按层数不同可分为单层、两层、多层。B:单层神经网络,不能解决异或问题或者复杂问题。C:两层神经网络采用sigmoid激活函数,能够有限区分异或问题D:多层神经网络能有效进行复杂问题的分类。

答案:神经网络按层数不同可分为单层、两层、多层。;单层神经网络,不能解决异或问题或者复杂问题。;两层神经网络采用sigmoid激活函数,能够有限区分异或问

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论