【答案】《数据智能与应用》(浙江大学)章节期末慕课答案_第1页
【答案】《数据智能与应用》(浙江大学)章节期末慕课答案_第2页
【答案】《数据智能与应用》(浙江大学)章节期末慕课答案_第3页
【答案】《数据智能与应用》(浙江大学)章节期末慕课答案_第4页
【答案】《数据智能与应用》(浙江大学)章节期末慕课答案_第5页
已阅读5页,还剩9页未读 继续免费阅读

付费下载

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

【答案】《数据智能与应用》(浙江大学)章节期末慕课答案有些题目顺序不一致,下载后按键盘ctrl+F进行搜索数据智能之起源第一章单元测试1.单选题:任何一列都不可再分的数据为下列哪种数据?

选项:

A、结构化数据

B、半结构化数据

C、无结构数据

D、文本数据

答案:【结构化数据】2.多选题:在《大数据时代》中所提到的大数据三个特征为()?

选项:

A、全面而非抽样

B、效率而非精确

C、相关而非因果

D、种类而非数量

答案:【全面而非抽样;效率而非精确;相关而非因果】3.多选题:下列哪些是深度学习框架?

选项:

A、TensorFlow

B、Jupyter

C、PyTorch

D、Scikit-learn

答案:【TensorFlow;PyTorch】4.单选题:随着互联网多媒体应用的出现,非结构化数据将占有更大的比重。

选项:

A、正确

B、错误

答案:【正确】5.单选题:大数据是人们在大规模数据的基础上做到的事情,这些事情是在小规模数据的基础上无法完成的。

选项:

A、正确

B、错误

答案:【正确】数据智能之发展第二章单元测试1.单选题:《人工智能北京共识》于2019年5月25日发布,提出各个参与方应遵循有益于人类共同命运构建和社会发展的几条原则?

选项:

A、10

B、15

C、20

D、25

答案:【15】2.单选题:大数据产生的萌芽阶段为:()

选项:

A、19世纪90年代到20世纪初

B、20世纪90年代到21世纪初

C、21世纪初到2010年

D、2011年至今

答案:【20世纪90年代到21世纪初】3.多选题:下列属于数据智能的超强魔力的是:()

选项:

A、描述性分析

B、诊断性分析

C、预测性分析

D、指令性分析

答案:【描述性分析;诊断性分析;预测性分析;指令性分析】4.单选题:机器学习的最佳场景是大数据。

选项:

A、正确

B、错误

答案:【正确】5.单选题:“深度学习”概念是杰弗里?辛顿及他的学生鲁斯兰?萨拉赫丁诺夫于2005年提出的。

选项:

A、正确

B、错误

答案:【错误】数据智能之利器第三章单元测试1.单选题:卷积神经网络中,原始图像大小为32x32,卷积核大小为3x3,步长(stride)为2,补边(padding)为0,则卷积结果大小为()

选项:

A、29x29

B、14x14

C、15x15

D、16x16

答案:【15x15】2.单选题:以下属于分类算法的是()

选项:

A、K-Means

B、DBSCAN

C、逻辑回归

D、线性回归

答案:【逻辑回归】3.多选题:以下可以展示层级化信息的可视化方法的是()

选项:

A、等高线图

B、旭日图

C、树图

D、小提琴图

答案:【旭日图;树图】4.多选题:以下属于带有正则化的回归算法的是()

选项:

A、最小二乘回归

B、Lasso回归

C、Ridge回归(岭回归)

D、Elastic-Net回归(弹性网回归)

答案:【Lasso回归;Ridge回归(岭回归);Elastic-Net回归(弹性网回归)】5.单选题:LSTM可以缓解RNN梯度消失/梯度爆炸的问题。

选项:

A、正确

B、错误

答案:【正确】数据智能之应用第四章单元测试1.单选题:随机森林是哪种类型的学习算法?

选项:

A、有监督

B、无监督

C、半监督

D、以上均不是

答案:【有监督】2.单选题:在新冠肺炎传播模型中,患者的传染能力与什么因素无关?

选项:

A、患者确诊前一个月的活动轨迹

B、患者确诊前一个月的手机使用频率

C、患者确诊前一个月的接触人数

D、与这些因素都有关

答案:【患者确诊前一个月的手机使用频率】3.多选题:目标检测领域的常见算法有()

选项:

A、FasterR-CNN

B、FCN

C、ICNet

D、MaskR-CNN

答案:【FasterR-CNN;MaskR-CNN】4.单选题:协议自动化逆向依据方法进行分类可以分为基于流量数据的逆向和基于程序分析的逆向,由于工控协议为二进制协议,缺少文本协议所具有的分隔符和关键字等要素,所以不适合使用基于流量的方法进行逆向。

选项:

A、正确

B、错误

答案:【正确】5.单选题:样本失衡时,可以使用ROC曲线评价分类器的性能好坏。

选项:

A、正确

B、错误

答案:【正确】期末考试数据智能与应用期末考试1.单选题:2020年开展的第七次全国人口普查,体现了舍恩伯格提出的大数据特征中的哪一项?

选项:

A、全面而非抽样

B、效率而非精确

C、相关而非因果

D、种类而非数量

答案:【全面而非抽样】2.单选题:下面哪一项不是“大数据”区别于“小数据”的四个关键特征之一?

选项:

A、数据量大

B、数据类型多

C、数据来源广泛

D、数据价值高

答案:【数据来源广泛】3.单选题:以下最可能是机器学习的发展趋势的是()。

选项:

A、寻找适用于任何数据集及分析要求的机器学习技术

B、向着结构越来越复杂的机器学习模型发展

C、寻求现有机器学习技术及分析过程的可解释性

D、发展逐渐趋于停滞

答案:【寻求现有机器学习技术及分析过程的可解释性】4.单选题:在大数据时代,数据能够在各行各业得以放心使用主要是由()确保的。

选项:

A、数据存储能力

B、数据收集能力

C、数据的可靠性

D、数据分析能力

答案:【数据的可靠性】5.单选题:在大数据上使用简单的算法,与在小数据上使用复杂的算法,更有可能出现下列哪种效果?

选项:

A、前者效果更好

B、后者效果更好

C、两者效果类似

D、不具备可比性

答案:【后者效果更好】6.单选题:以下属于利用深度学习方法处理时序数据的是()。

选项:

A、利用KNN根据用户在平台的行为序列判断对某电商平台用户是否是网球爱好者

B、通过CNN根据一张256x256大小的全彩图片判断其中是否包含猫

C、利用DNN根据花瓣颜色、尺寸等一系列特征判断其是否为玫瑰花

D、利用RNN根据一段单人朗读录音判断朗读者是否为女性

答案:【利用RNN根据一段单人朗读录音判断朗读者是否为女性】7.单选题:以下对聚类算法描述正确的是()。

选项:

A、聚类算法必须已知全部样本的标注

B、一般来说,同一聚类簇中的样本间的相似度比不同聚类簇间样本的相似度更高

C、聚类算法必须已知样本将分成几类

D、一般来说,不同的聚类方法得到的聚类结果是完全相同的

答案:【一般来说,同一聚类簇中的样本间的相似度比不同聚类簇间样本的相似度更高】8.单选题:下列不属于过拟合原因的是()。

选项:

A、特征维度过多

B、模型假设过于复杂

C、训练数据过多

D、噪声过多

答案:【训练数据过多】9.单选题:在新冠肺炎的接触模型中,疫情在空间上的传播近似呈现()。

选项:

A、线性分布

B、指数分布

C、幂律分布

D、多项式分布

答案:【幂律分布】10.单选题:在各种大数据应用领域下,对于隐私方面的担忧主要表现为()。

选项:

A、个人信息被识别与暴露

B、大数据分析的错误结果

C、恶意广告的推送

D、病毒的侵入

答案:【个人信息被识别与暴露】11.单选题:导致模型遭受窃取攻击的因素包括()。

选项:

A、模型过拟合

B、模型结构

C、模型类型

D、以上都是

答案:【以上都是】12.单选题:对抗攻击发生在模型生命周期的()。

选项:

A、训练阶段

B、测试阶段

C、应用阶段

D、以上都是

答案:【测试阶段】13.单选题:以下对聚类算法描述正确的是()。

选项:

A、聚类算法必须已知全部样本的标注

B、一般来说,同一聚类簇中的样本间的相似度比不同聚类簇间样本的相似度更高

C、聚类算法必须已知样本将分成几类

D、一般来说,不同的聚类方法得到的聚类结果是完全相同的

答案:【一般来说,同一聚类簇中的样本间的相似度比不同聚类簇间样本的相似度更高】14.单选题:下面哪项操作能实现跟神经网络中Dropout的类似效果()。

选项:

A、Boosting

B、Bagging

C、Stacking

D、Mapping

答案:【Bagging】15.单选题:大数据的特点不包括()。

选项:

A、实时性

B、单一性

C、真实性

D、规模性

答案:【单一性】16.单选题:对线下零售行业这一应用领域而言,做好大数据分析应用的前提是()。

选项:

A、提升服务质量

B、增加营业时间

C、开展优惠促销

D、增加数据来源

答案:【增加数据来源】17.单选题:关于弱平稳性,下列说法错误的是()。

选项:

A、具有强平稳性的序列一定具有弱平稳性

B、弱平稳性不涉及高阶矩(>2)

C、均值函数是常数函数

D、协方差函数仅与时间差相关

答案:【具有强平稳性的序列一定具有弱平稳性】18.单选题:典型的工业控制系统网络拓扑不包括以下哪一层网络结构()。

选项:

A、管理层

B、监控层

C、控制层

D、现场层

答案:【现场层】19.单选题:小红和小刚经常写信分享生活,但是小红、小刚之间需要邮差小明传递信息,为了防止小明偷看信件具体内容,那么小红、小刚可以使用下列哪种隐私保护方法()。

选项:

A、匿名化方法

B、对称加密方法

C、非对称加密方法

D、差分隐私方法

答案:【非对称加密方法】20.单选题:以下哪一项不是Github的特色?

选项:

A、提供订阅、讨论组、文本渲染、在线文件编辑器、协作图谱报表、代码片段分享等功能

B、网站提供社交网络功能,用户可以通过复刻(fork)他人项目的形式参与开发

C、允许用户在不登陆的情况下,对在线仓库进行修改

D、只支持Git作为唯一的版本库格式进行托管

答案:【允许用户在不登陆的情况下,对在线仓库进行修改】21.单选题:下列哪种方法属于常见的信息保隐私技术且具有较好的数据保真度()。

选项:

A、K匿名方法

B、对称加密方法

C、差分隐私方法

D、L多样性方法

答案:【对称加密方法】22.单选题:下列常见的保隐私技术中,哪一个技术是在用户端加入噪声且具有较强的隐私保护能力()。

选项:

A、同态加密

B、安全多方计算

C、集中式差分隐私

D、本地差分隐私

答案:【本地差分隐私】23.单选题:卷积神经网络中,输入图片为RGB3个通道,每个通道大小为32x32,即输入大小为32x32x3,单个卷积核大小为5x5x3,卷积核个数为6,步长为1,无补边,则输出的大小为()。

选项:

A、27x27x3

B、14x14x3

C、14x14

D、27x27x6

答案:【27x27x6】24.单选题:可以对数据进行降维的可视化处理方法是()。

选项:

A、TSNE

B、直方图

C、散点图

D、热力图

答案:【TSNE】25.单选题:以下关于神经网络的说法中,正确的是()。

选项:

A、增加网络层数,总能减小训练集错误率

B、减小网络层数,总能减小测试集错误率

C、增加网络层数,可能增加测试集错误率

D、以上都不正确

答案:【增加网络层数,可能增加测试集错误率】26.单选题:下列哪一项在神经网络中引入了非线性?

选项:

A、随机梯度下降

B、修正线性单元(ReLU)

C、卷积函数

D、正则化

答案:【修正线性单元(ReLU)】27.单选题:已知:大脑是有很多个叫做神经元的东西构成,神经网络是对大脑的简单的数学表达。每一个神经元都有输入、处理函数和输出。神经元组合起来形成了网络,可以拟合任何函数。为了得到最佳的神经网络,我们用梯度下降方法不断更新模型。给定上述关于神经网络的描述,什么情况下神经网络模型被称为深度学习模型?

选项:

A、加入更多层,使神经网络的深度增加

B、有维度更高的数据

C、当这是一个图形识别的问题时

D、有卷积运算操作

答案:【加入更多层,使神经网络的深度增加】28.单选题:随机森林的数据集的选取是()的。

选项:

A、无放回

B、有放回

C、都含有

D、不确定

答案:【有放回】29.单选题:假设我们拥有一个已完成训练的、用来解决车辆检测问题的深度神经网络模型,训练所用的数据集由汽车和卡车的照片构成,而训练目标是检测出每种车辆的名称(车辆共有10种类型)。现在想要使用这个模型来解决另外一个问题,问题数据集中仅包含少量的一种车(福特野马),而目标变为定位车辆在照片中的位置,下面哪种方法可行?

选项:

A、除去神经网络中的最后一层,冻结所有层然后重新训练

B、对神经网络中的最后几层进行微调,同时将最后一层(分类层)更改为回归层

C、使用新的数据集重新训练模型

D、所有答案均不对

答案:【对神经网络中的最后几层进行微调,同时将最后一层(分类层)更改为回归层】30.单选题:在一个神经网络中,下面哪种方法可以用来处理过拟合?

选项:

A、Dropout

B、分批归一化(BatchNormalization)

C、正则化(regularization)

D、都可以

答案:【都可以】31.多选题:当前主要机器学习在发展过程中的挑战主要包括()。

选项:

A、硬件计算能力瓶颈

B、数据质量参差不齐

C、投入科研经费不足

D、数据标注代价昂贵

答案:【硬件计算能力瓶颈;数据质量参差不齐;数据标注代价昂贵】32.多选题:Scikit-learn是基于以下哪几项进行构建的?

选项:

A、NumPy

B、SciPy

C、Matplotlib

D、PyTorch

答案:【NumPy;SciPy;Matplotlib】33.多选题:下列属于常用的过滤法的是()。

选项:

A、方差选择

B、相关系数

C、卡方检验

D、互信息

答案:【方差选择;相关系数;卡方检验;互信息】34.多选题:下列属于数据智能道德规范范畴的是()。

选项:

A、数据收集

B、数据垄断

C、算法黑箱

D、主观歧视

答案:【数据收集;数据垄断;算法黑箱;主观歧视】35.多选题:下列关于大数据说法正确的有哪些?

选项:

A、错误性是大数据本身固有的。

B、大数据不仅不注重精确性,而且无法实现精确性。

C、在基本用途完成之后,数据的价值依然存在。

D、由于数据可以被再利用,因此数据应该永久被保存。

答案:【大数据不仅不注重精确性,而且无法实现精确性。;在基本用途完成之后,数据的价值依然存在。】36.多选题:关于非平稳的数据,下列说法正确的是()。

选项:

A、服从相同的分布

B、肯定不能使用同一个的模型进行监测

C、统计特性(均值、方差等)发生了变化

D、变量间可能存在长期稳定的关系

答案:【统计特性(均值、方差等)发生了变化;变量间可能存在长期稳定的关系】37.多选题:下面哪些属于常见的处理时间序列的模型?

选项:

A、RNN循环神经网络

B、ARIMA移动平均自回归模型

C、LDA隐狄利克雷分布

D、HMM隐马尔可夫模型

答案:【RNN循环神经网络;ARIMA移动平均自回归模型;HMM隐马尔可夫模型】38.多选题:下列属于数据智能的陷阱的是()。

选项:

A、数据造假

B、采样不当

C、结论不客观

D、描述性分析

答案:【数据造假;采样不当;结论不客观】39.多选题:相比标准神经网络DNN,循环神经网络RNN处理序列数据的优势是()。

选项:

A、RNN可以处理不同长度的序列数据

B、RNN可以让数据中不同位置的特征可以共享

C、RNN可以对数据进行预处理减少计算量

D、RNN可以缓解模型的欠拟合

答案:【RNN可以处理不同长度的序列数据;RNN可以让数据中不同位置的特征可以共享】40.多选题:LightGBM是一个梯度Boosting框架,它具有以下优势()。

选项:

A、更快

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论