大数据解析与应用导论智慧树知到期末考试答案2024年_第1页
大数据解析与应用导论智慧树知到期末考试答案2024年_第2页
大数据解析与应用导论智慧树知到期末考试答案2024年_第3页
大数据解析与应用导论智慧树知到期末考试答案2024年_第4页
大数据解析与应用导论智慧树知到期末考试答案2024年_第5页
已阅读5页,还剩4页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

大数据解析与应用导论智慧树知到期末考试答案2024年大数据解析与应用导论用决策树训练一个分类器模型,树的每个叶子结点代表了()信息

A:无实际意义B:样本数量C:变量数量D:分类标签答案:分类标签异常值处理的3σ准则中,σ的含义为()

A:原始数据的方差B:原始数据的标准差C:正态分布的方差D:正态分布的标准差答案:原始数据的标准差如果想减少变分自编码器生成样本的不确定性,可以使用下列哪种方法()

A:增大隐变量先验分布的方差B:减小隐变量先验分布的方差C:增大变分下界中KL散度的权重D:减少训练的迭代次数答案:减小隐变量先验分布的方差将原始数据进行集成、变换、维度规约、数值规约是在以下哪个步骤的任务?()

A:频繁模式挖掘B:数据流挖掘C:分类和预测D:数据预处理答案:数据预处理以下哪个选项不是异常值处理的好处()

A:减小数据噪声B:降低模型应用时的危险性C:提升分析结果准确性D:便于观察数据分布答案:便于观察数据分布当不知道数据所带标签时,可以使用哪种技术促使带同类标签的数据与带其他标签的数据相分离?()

A:隐马尔可夫链B:分类C:聚类D:关联分析答案:聚类你有63*63*16的输入,有32个卷积滤波器进行卷积,卷积核的大小为7*7,步幅为1,要想输出的featuremap大小仍为63*63,请问pad的值是多少?()

A:3B:2C:7D:1答案:3变分自编码器中衡量分布之间差异的指标是()。

A:JS散度B:KL散度C:Wasserstein距离D:交叉熵答案:KL散度当数据各个变量的方差差异较大时,采用哪种距离定义方法相对来说更合适:()。

A:曼哈顿距离B:欧式距离C:切比雪夫距离D:马氏距离答案:马氏距离监督算法和无监督算法的区别是()。

A:数据是否有训练标签B:是否是软划分C:是否需要事先设定类别个数D:是否通过统计特性去训练数据答案:数据是否有训练标签数据挖掘的首要步骤是()

A:数据清洗B:数据标准化C:异常值处理D:缺失值处理答案:数据清洗以下哪一项在神经网络中引入了非线性()

A:随机梯度下降B:卷积C:Sigmoid激活函数D:其余选项都不正确答案:Sigmoid激活函数对数据进行归一化操作,()影响典型相关分析的结果

A:不会B:会C:可能会答案:不会关于多重共线性,下列说法错误的是。()

A:主元回归可以一定程度上解决多重共线性带来的问题B:增加样本容量可以消除多重共线性C:岭回归可以缓解多重共线性带来的影响D:多重共线性是指变量间存在很强的线性关系答案:增加样本容量可以消除多重共线性什么情况下协方差与相关系数相等()

A:变量均值为1B:变量均值为0C:变量标准差为0D:变量标准差为1答案:变量标准差为1贝叶斯是一种有概率描述的判别方法,使用()进行判别。

A:后验概率B:后验结果C:先验结果D:先验概率答案:后验概率训练过程中对隐层特征施加高斯分布约束的自编码器是()。

A:变分自编码器B:所有自编码器C:稀疏自编码器D:降噪自编码器答案:变分自编码器下列关于FDA和贝叶斯判别方法的说法错误的是()。

A:对于具有p个变量的样本集合,FDA最多能将其降维至p-1维B:FDA不擅于处理线性不可分的数据C:FDA适用于处理数值型数据,D:贝叶斯判别方法适用于处理离散型数据答案:对于具有p个变量的样本集合,FDA最多能将其降维至p-1维下列哪个操作能实现信息浓缩()

A:数据清洗B:数据降维C:数据标准化D:数据采集答案:数据降维在双盲降噪自编码器实现降噪一节中,编码器中包含RNN和一维卷积,你觉得这么设计的初衷是什么()。

A:因为所处理的数据是时序数据B:因为RNN模型、一维卷积模型足够通用C:因为这两个模型工程上容易实现D:因为RNN模型、一维卷积模型提取的特征适合用PCA处理答案:因为所处理的数据是时序数据通过CCA计算得到的变量组间的第一对典型相关系数较两组变量间任一个简单相关系数之绝对值都()

A:相等B:不一定C:大D:小答案:大随机森林通过()提高性能

A:提高方差B:提高偏差C:降低方差D:降低偏差答案:降低方差对于主元分析,下列说法错误的是()

A:提取出的潜变量一定适合对Y进行回归B:目标函数要求从X中提取出的潜变量对原数据的重构误差最小C:提取出的潜变量相互正交D:目标函数要求从X中提取出的潜变量方差最大答案:提取出的潜变量一定适合对Y进行回归关于回归,下列说法正确的是:()

A:回归的目的是发现变量间的关系;B:回归是有监督学习;C:可以使用残差平方和来衡量回归模型的好坏。D:回归可以用来进行预测;答案:回归是有监督学习;;回归可以用来进行预测;;回归的目的是发现变量间的关系;;可以使用残差平方和来衡量回归模型的好坏。下面哪些任务可以用神经网络解决()

A:语音识别B:分辨图片中的手写数字C:检测出图片中的汽车,并标出位置D:工业过程软测量答案:分辨图片中的手写数字###工业过程软测量###检测出图片中的汽车,并标出位置###语音识别PCA和CCA的相同点包括()。

A:都考虑了变量的相关性信息B:都基于变量的线性变换C:都可视为一种降维技术D:都是一种多元统计分析方法答案:都考虑了变量的相关性信息###都是一种多元统计分析方法###都基于变量的线性变换###都可视为一种降维技术下列哪些任务会使用多对一的RNN结构?()

A:情感分类(输入一段文字,输出0或1表示正面或负面情绪)B:图像分类(输入一张图片,输出对应标签)C:语音识别(输入语音,输出文本)D:人声识别(输入语音,输出说话人的性别)答案:情感分类(输入一段文字,输出0或1表示正面或负面情绪);人声识别(输入语音,输出说话人的性别)关于偏最小二乘回归,下列说法正确的是:()

A:偏最小二乘回归适用于样本数少于变量数的情况;B:使用迭代求解的方法依次求取潜变量。C:偏最小二乘提取潜变量时只考虑了X的信息;D:偏最小二乘求取潜变量时要求两潜变量的协方差最大;答案:偏最小二乘回归适用于样本数少于变量数的情况###使用迭代求解的方法依次求取潜变量一般来说,对样本数据进行降噪的主要目的有哪两方面()。

A:获得不含噪声的数据B:去除数据中包含的噪声C:能使用一种复杂的算法训练模型D:节约数据的存储空间答案:去除数据中包含的噪声###获得不含噪声的数据决策树的结点有哪些类型()

A:外部结点B:内部结点C:根节点D:叶子结点答案:根节点###内部结点###叶子结点聚类算法可以从()的角度对数据进行聚类。

A:数据的数量级B:样本C:变量D:其余选项三点均不是答案:样本###变量多元统计分析的简单指标有()

A:方差B:协方差C:均值D:相关系数答案:均值###方差###协方差###相关系数以下哪些属于大数据的特点()。

A:类型多B:速度快C:体量大D:价值低答案:体量大;类型多;速度快自编码器又哪两部分组成()。

A:解码器B:自回归器C:自预测器D:编码器答案:编码器###解码器目前工业领域大数据碰到的困难包括()。

A:工业对象个性化差异明显,模型也很难直接迁移B:工业大数据应用时对精度要求低C:工业数据标签难获得D:工业大数据维度高、质量低答案:工业大数据维度高、质量低###工业数据标签难获得###工业对象个性化差异明显,模型也很难直接迁移欧氏距离的不足是()。

A:不具备明确的物理意义B:不能体现各变量之间的相关性C:不能体现各变量在波动幅度上的不同D:计算相对简单答案:不能体现各变量在波动幅度上的不同;不能体现各变量之间的相关性随机森林的基本思想包含()

A:随机子空间方法B:迭代优化思想C:Boosting集成学习理论D:Bagging集成学习理论答案:Bagging集成学习理论###随机子空间方法可以作为K均值聚类算法迭代终止条件的有()

A:最大迭代次数B:类中心不再改变C:类别个数不再改变D:聚类结果不再改变答案:最大迭代次数###聚类结果不再改变###类中心不再改变以下哪些选项是降维处理的目的?()

A:增加计算效率B:降低存储要求C:降低数据维度D:提高计算精度答案:增加计算效率###降低存储要求###降低数据维度###提高计算精度会对K均值聚类算法结果产生影响的因素有()

A:类别个数B:迭代终止条件C:样本顺序D:初始类中心位置答案:类别个数###初始类中心位置###迭代终止条件变分自编码器的两个组成部分是()

A:生成器B:解码器C:判别器D:编码器答案:编码器###解码器随机森林的模型泛化误差界由()确定

A:训练数据的质量B:单棵树的分类强度C:训练数据的数量D:树间的相关性答案:树间的相关性###单棵树的分类强度你觉得为什么使用卷积神经网络处理心电图()。

A:卷积神经网络相比其他方法能够捕捉更多细节信息B:心电图中心电数据也是一种时间序列数据C:心电图中不同导联数据有相关性D:心电图也是一种图答案:心电图也是一种图###心电图中心电数据也是一种时间序列数据###心电图中不同导联数据有相关性多元统计分析的研究内容包括()

A:归类问题B:多元统计分析的理论基础C:多元数据的统计推断D:分析变量间的相互依赖关系E:降维问题答案:降维问题###归类问题###分析变量间的相互依赖关系###多元数据的统计推断###多元统计分析的理论基础简单相关系数描述两组变量的相关关系的缺点包括()

A:只是孤立考虑单个X与单个Y间的相关,没有考虑X、Y变量组内部各变量间的相关。B:没有从整体上刻画相关性。C:抓不住重点D:两组间有许多简单相关系数,使问题显得复杂。答案:只是孤立考虑单个X与单个Y间的相关,没有考虑X、Y变量组内部各变量间的相关###两组间有许多简单相关系数,使问题显得复杂###没有从整体上刻画相关性###抓不住重点多元数据的统计推断包括()

A:多元数据的特征值分解B:多元数据统计量分布推导C:多元正态分布的协方差阵的估计和假设检验D:多元正态分布的均值向量的估计和假设检验答案:多元正态分布的均值向量的估计和假设检验###多元正态分布的协方差阵的估计和假设检验下列哪些是神经网络中的“超参数”?()

A:神经网络层数B:隐藏层神经元个数C:迭代次数D:学习率答案:学习率###隐藏层神经元个数###迭代次数###神经网络层数自编码器的编码与解码部分可以使用下列哪些结构()。

A:MLPB:CNNC:RNND:GCN答案:MLP###CNN###RNN###GCN良好的特征工程有利于提升模型的整体效果()

A:错B:对答案:对GMM中各高斯元的权重之和为1。()

A:错B:对答案:对CCA算法广泛的应用于数据相关度的分析,同时还是偏最小二乘法的基础()

A:对B:错答案:对循环神经网络具有记忆功能()

A:对B:错答案:对聚类分析可以看作是一种非监督的分类。()

A:错B:对答案:对变分自编码器的推导过程使用了样本的独立同分布假设,因此不能直接处理具有时序相关性的流数据()

A:对B:错答案:对在聚类分析中,当聚类的数据量纲差异较大时,应先对数据进行标准化以消除计量单位对结果的影响。()。

A:错B:对答案:对样本的顺序会影响K均值聚类算法的结果。()

A:对B:错答案:错在机器学习模型中,需要通过训练学习到的的参数称为超参数。()

A:对B:错答案:错数据归一化没有实际意义。()

A:错B:对答案:错典型相关是研究两组变量之间相关性的一种统计分析方法。但不能把它当成一种降维技术()

A:对B:错答案:错典型相关分析适用于分析由多变量组成的变量组之间的相关性()

A:错B:对答案:对大数据时代中,相关关系不再那么重要,更注重因果关系。()

A:对B:错答案:错决策树需要从根节点到叶子结点一层一层构建。()

A:对B:错答案:对可以借助拉格朗日乘数来求解典型相关分析问题()

A:对B:错答案:对随机森林中树的数量对整体性能影响不大。()

A:错B:对答案:错主成分分析能够提升数据挖掘的效果。()

A:对B:错答案:对回归分析就是研究自变量和因变量之间的关系。()

A:对B:错答案:对堆栈自编码器得网络层在训练过程中是依次训练的。()

A:错B:对答案:对特征工程就是建立神经网络模型结构的过程()

A:对B:错答案:错图像经过卷积之后,尺寸一定会变小()

A:错B:对答案:错决策树的模型可解释性较差。()

A:错B:对答案:错主成分分析可以用于降维。()

A:错B:对答案:对岭回归通过引入二次项参数作为正则惩罚项

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论