机器学习-北京理工大学中国大学mooc课后章节答案期末考试题库2023年_第1页
机器学习-北京理工大学中国大学mooc课后章节答案期末考试题库2023年_第2页
机器学习-北京理工大学中国大学mooc课后章节答案期末考试题库2023年_第3页
机器学习-北京理工大学中国大学mooc课后章节答案期末考试题库2023年_第4页
机器学习-北京理工大学中国大学mooc课后章节答案期末考试题库2023年_第5页
已阅读5页,还剩14页未读 继续免费阅读

付费下载

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

机器学习_北京理工大学中国大学mooc课后章节答案期末考试题库2023年Jessen不等式等号成立的条件是:变量为常数

参考答案:

正确

关于EM算法的用途,EM算法只适用不完全数据的情形。

参考答案:

错误

关于EM算法的收敛性,EM算法理论上不能够保证收敛。

参考答案:

错误

混淆矩阵中的TP=16,FP=12,FN=8,TN=4,精确率是

参考答案:

4/7

在SVM领域种,margin的含义是()

参考答案:

间隔

SVM算法的最小时间复杂度是O(n*n)。基于这一点,以下哪种规格的数据集并不适用于该算法?

参考答案:

大数据集

如果一个样本空间线性可分,那么,我们能找到()个平面来划分样本

参考答案:

无数

SVM为什么会使用替代损失函数(如hinge损失,指数损失等)?

参考答案:

0/1损失函数非凸、不连续

支持向量机与逻辑回归的数学本质上的区别是什么?

参考答案:

损失函数

非线性支持向量机可以使用的核函数包含()

参考答案:

以上都是

关于LinearSVC叙述有误的是()

参考答案:

以上答案无误

关于sklearn库中的svm叙述有误的是()

参考答案:

SVC训练时间复杂度为O(nlogn),训练集实例数量大时很难进行归一化

混淆矩阵的真负率公式是为

参考答案:

TN/(TN+FP)

下列描述有监督学习错误的是

参考答案:

所有数据都相互独立分布

根据王珏的理解,下列不属于对问题空间W的统计描述是

参考答案:

学习能力

LDA模型的核心假设是:假设每个文档首先由主题分布表示,然后主题由词概率分布表示,形成文档-主题-词的三级层次。

参考答案:

正确

在两个变量的回归分析中,作散点图是为了()

参考答案:

根据经验选定回归方程的类型

已知变量x与y正相关,且由观测数据算得x的样本平均值为3,y的样本平均值为3.5,则由该观测数据对应的线性回归方程可能是()

参考答案:

y=0.4x+2.3

本章实验中训练集与测试集的划分比为()

参考答案:

7:3

下列对python函数叙述正确的是()

参考答案:

np.linspace(0,80,1000)表示取0-80之间1000个点

下列对于多项式函数叙述正确的是()

参考答案:

2+x+x^3是3阶多项式

下列哪项误差用于本章房价预测问题中()

参考答案:

MSELoss

读入数据集时常用的python库是()

参考答案:

pandas

本章中房价预测问题用了以下哪个数据集()

参考答案:

波士顿房价数据集

下列对回归问题和分类问题叙述正确的是()

参考答案:

对下午四点共享单车租用量值的预测问题属于回归问题

最小二乘法仅当X^TX可逆时才可解()

参考答案:

正确

理想情况下,梯度下降法与最小二乘法求解结果十分接近()

参考答案:

正确

学习率是梯度下降法中的超参数()

参考答案:

正确

下列对最小二乘法和梯度下降法的叙述正确的是()

参考答案:

上述无正确答案

下列关于python中plot函数包叙述正确的是()

参考答案:

用于绘制函数曲线图像

使用梯度下降法求y=(x-2.5)^2-1的极值点时,Resulttoolarge报错的主要原因是()

参考答案:

学习率过大

下列关于DBSCAN定义叙述错误的是()

参考答案:

密度可达是直接密度可达的传递闭包,是对称的,核心对象之间互相密度可达

下列关于SVM的叙述中,有误的一项是()

参考答案:

增删非支持向量样本对SVM有一定影响

SVM如何解决线性不可分问题()

参考答案:

通过核函数将特征映射到高维空间

假设有一个数据集,其中n=10个特征,m=5000个示例。使用梯度下降法训练logistic回归分类器后,您会发现它对训练集拟合不足,并且在训练集或交叉验证集上没有达到预期的性能。以下哪项可能是有希望采取的步骤?()

参考答案:

尝试用一个包含更多隐藏单元的神经网络

假设你使用高斯核训练了一个SVM分类器,它在训练集中学习了以下决策边界:【图片】当在交叉验证集上度量SVM的性能时,它的性能很差。你应该试着增加还是减少C?增加或减少σ^2()

参考答案:

减小C,增加σ^2

下列关于SVM优缺点总结,错误的是()

参考答案:

是一个非凸的优化问题,局部最优解不一定是全局最优解

SVM训练好之后,删除非支持向量的样本点后,此SVM仍然可以用于对新样本进行分类()

参考答案:

正确

SVM可以对来自其它分布的噪声样本鲁棒()

参考答案:

错误

对于DBSCAN,下列说法错误的是()

参考答案:

对参数较不敏感

下列关于K-means算法叙述有误的是()

参考答案:

算法适合发现非凸形状的簇,或者大小差别很大的簇

1.划分方法包括的典型方法有()(1)K-means及其变种(2)K-中心点(3)CLARA(4)CLARANS

参考答案:

(1)(2)(3)(4)

下列属于聚类算法的方法包括()(1)划分方法(2)层次方法(3)基于密度方法(4)基于网格方法(5)基于模型方法

参考答案:

(1)(2)(3)(4)(5)

下列关于聚类和分类的说法中,错误的是()

参考答案:

分类是一种无监督学习

K-means的算法步骤正确的是()输入:n个对象的数据集D,簇数目k输出:k个簇(1)将每个对象分配到中心与其最近的簇;(2)从D中随机选择k个对象作为初始簇中心;(3)重新计算簇的均值,使用新的均值作为每个簇的中心(4)重复迭代,直到所有簇中的对象不再变换

参考答案:

(2)(1)(3)(4)

多次运行,随机化初始点是对存在局部最优点的函数求解的一种方案()

参考答案:

正确

以下对于梯度下降法中学习率lr的阐述,正确的是()

参考答案:

lr大,收敛速度较快但可能导致不收敛

梯度下降法求函数极值算法步骤正确的是()(1)给定初始点x0、阈值和学习率(2)计算函数在该点的导数(3)如果插值小于阈值则找到极值点,否则重复前3步(4)根据梯度下降更新公式得到下一个x点(5)计算更新前后两点函数值的差值

参考答案:

(1)(2)(4)(5)(3)

梯度下降在深度神经网络中被广泛使用()

参考答案:

正确

对于Actor-Critic算法,说法错误的是

参考答案:

Critic网络是用来输出动作的_Actor网络是用来评价Critic网络所选动作的好坏的

以下属于Actor-Critic算法的是

参考答案:

DDPG_A3C

关于A3C算法说法正确的是

参考答案:

A3C是on-policy的算法_使用了多个线程,每个线程对应了不同的探索方式

以下哪种算法属于策略梯度算法

参考答案:

TRPO_PPO_REINFORCE

关于DoubleDQN说法正确的是

参考答案:

DoubleDQN可以减小偏差_Q值的目标值中的max操作会产生过估计,从而影响找到最佳策略

关于DQN说法正确的是

参考答案:

对于atari游戏中,一般将连续4帧图像放在一起作为一个state送到神经网络中_网络的输出是Q值_网络最开始使用卷积神经网络或全连接网络,目的是为了提取图像特征信息

关于经验池(experiencereplay)叙述正确的是

参考答案:

每次更新时随机采样样本_打破样本之间的连续性

Q-learning与Sarsa相同的地方是

参考答案:

都使用了等策略进行探索_都用q-table存储状态动作对

反向传播算法中需要先计算靠近输入层参数的梯度,再计算靠近输出层参数的梯度

参考答案:

错误

训练算法的目的就是要让模型拟合训练数据

参考答案:

错误

卷积神经网络通常比全连接神经网络参数少,因此能力更差

参考答案:

错误

循环神经网络按时间展开后就可以通过反向传播算法训练了

参考答案:

正确

LSTM和GRU网络因为引入了门控单元,可以缓解梯度消失问题

参考答案:

正确

为什么循环神经网络可以用来实现自动问答,比如对一句自然语言问句给出自然语言回答?

参考答案:

因为自动问答可以看成是一种序列到序列的转换_因为循环神经网络能够处理变长输入

通常有哪几种训练神经网络的优化方法?

参考答案:

小批量随机梯度下降法_梯度下降法_随机梯度下降法

隐马尔可夫模型是一种统计模型,经常用来描述一个含有隐含未知参数的马尔可夫过程。

参考答案:

正确

最大似然估计方法是实例数据不完备情况下的学习方法。

参考答案:

错误

贝叶斯网络具有的条件独立性是结点与其后代结点条件独立

参考答案:

错误

下图是全连接图。【图片】

参考答案:

错误

隐马尔可夫模型的三个基本问题是:

参考答案:

估值问题_寻找状态序列_学习模型参数

在数据不完备时,贝叶斯网络的参数学习方法有:

参考答案:

蒙特卡洛方法_拉普拉斯近似_高斯逼近

基于约束的方法通过统计独立性测试来学习结点间的

参考答案:

相关性_独立性

基于搜索评分的方法,关键点在于

参考答案:

确定评分函数_确定合适的搜索策略

GIS算法的收敛速度由计算更新值的步长确定。C值越大,步长越大,收敛速度就越快。

参考答案:

错误

从最大熵思想出发得出的最大熵模型,采用最大化求解就是在求P(y|x)的对数似然最大化。

参考答案:

正确

熵最大时,表示随机变量最不确定,也就是随机变量最随机,对其行为做准确预测最困难。

参考答案:

正确

逻辑斯蒂回归模型是一种回归算法。

参考答案:

错误

条件随机场需要解决的关键问题有:

参考答案:

模型推断_特征函数的选择_参数估计

以下关于逻辑斯蒂回归模型的描述正确的是

参考答案:

逻辑斯蒂回归模型是线性回归模型_直接对分类的可能性进行建模,无需事先假设数据分布,这样就避免了假设分布不准确所带来的问题。_针对分类的可能性进行建模,不仅能预测出类别,还可以得到属于该类别的概率。_模型本质仍然是一个线性模型,实现相对简单。

k-means算法、EM算法是建立在凸球形的样本空间上的聚类方法

参考答案:

正确

EM聚类属于软分聚类方法

参考答案:

正确

DBSCAN对参数不敏感

参考答案:

错误

分裂层次聚类采用的策略是自底向上

参考答案:

错误

数据有噪声,有重复值,不会导致SVM算法性能下降

参考答案:

错误

支持向量是最靠近决策表面的数据点

参考答案:

正确

“硬间隔”是指SVM允许分类时出现一定范围的误差

参考答案:

错误

若参数C(costparameter)被设为无穷,只要最佳分类超平面存在,它就能将所有数据全部正确分类

参考答案:

正确

SVM中的泛化误差代表SVM对新数据的预测准确度

参考答案:

正确

主题建模本质上是:一种新的文档表示方法,主要是通过主题的分布来表示一个文档。一种数据压缩方法,将文档压缩在更小的空间中。

参考答案:

正确

主题建模的关键是确定数据集合的主题个数。

参考答案:

错误

LDA模型是一种生成式模型

参考答案:

正确

关于LDA模型中的K,K的指定,必须考虑数据集合的特点,选择一个较为优化的数值。

参考答案:

错误

Gibbs采样是一类通用的采样方法,和M-H采样方法没有任何关系。

参考答案:

错误

吉布斯采样是一种通用的采样方法,对于任何概率分布都可以采样出对应的样本。

参考答案:

错误

使用k-means算法对红酒数据集进行聚类的实践中,与事实不符的是()

参考答案:

自实现的Kmeans模型与调用sklearn包的kmeans模型的准确度相等

关于数据预处理对聚类分析的影响的错误说法是()

参考答案:

有助于提升聚类质量

下列哪个不是影响基本K-均值算法的主要因素()

参考答案:

聚类准则

LDA模型在做参数估计时,最常用的方法是

参考答案:

Gibbs采样方法_变分推断

EM算法通常不需要设置步长,而且收敛速度一般很快。

参考答案:

正确

EM算法,具有通用的

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论