机器学习:模型与算法智慧树知到期末考试答案章节答案2024年浙江大学_第1页
机器学习:模型与算法智慧树知到期末考试答案章节答案2024年浙江大学_第2页
机器学习:模型与算法智慧树知到期末考试答案章节答案2024年浙江大学_第3页
机器学习:模型与算法智慧树知到期末考试答案章节答案2024年浙江大学_第4页
机器学习:模型与算法智慧树知到期末考试答案章节答案2024年浙江大学_第5页
已阅读5页,还剩8页未读 继续免费阅读

付费下载

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

机器学习:模型与算法智慧树知到期末考试答案+章节答案2024年浙江大学下列说法错误的是(

)。

答案:因果推理的关键因素是保证其它变量不变,改变果变量Y。在建立线性回归模型时,3对变量(Var1和Var2,Var2和Var3,Var3和Var1)之间的相关性分别为-0.98,0.45和1.23。我们可以从中推断出什么?(

答案:Var1和Var2之间相关性较高###由于Var1和Var2之间相关性较高,因此存在多重共线性,应该移除这两个变量###Var3和Var1之间的相关系数为1.23是不可能的下列属于集成方法的是(

答案:boosting;###blending;###bagging;下列机器学习的应用中,属于自然语言处理领域的有:(

答案:智能问答;###机器阅读;###机器翻译;机器学习主要是研究如何使计算机从给定的数据中学习规律,即从观测数据中寻找规律,并利用学习到的规律对未知或无法观测的数据进行预测。目前,主流的机器学习算法是基于统计的方法,也叫统计机器学习。(

答案:对在梯度下降训练的过程中,在训练样本上收敛的参数,并不一定在测试集上最优。。(

答案:对逻辑回归与多元回归分析有哪些不同?(

答案:其余选项全选对于一个图像识别任务(在一张照片里找出一只猫),下面哪种神经网络可以更好地解决这个问题(

答案:卷积神经网络;LeNet-5是一个非常成功的神经网络模型。基于LeNet-5

的__________系统在90

年代被美国很多银行使用.(

答案:手写数字识别;梯度下降算法的正确步骤应该是什么?对于下述的1-5按正确顺序排序_______(

)1.计算预测值和真实值之间的误差2.重复迭代,直至得到网络权重的最佳值3.把输入传入网络,得到输出值4.用随机值初始化权重和偏差5.对每一个产生误差的神经元,调整相应的(权重)值以减小误差

答案:4,3,1,5,2下列说法正确的是(

)。

答案:如果一个完全连接的RNN有足够数量的sigmoid型隐藏神经元,它可以以任意的准确率去近似任何一个非线性动力系统个。下列说法正确的是(

)。

答案:感知机网络只有输入层/输出层,无隐藏层。下述领域中可以用机器学习来参与解决的为_______。(

答案:机器翻译;###语音识别;###图像分类;###视频动作定位;在一个包含5000个特征及超过一百万个观测值的数据集上建立一个机器学习的模型,下面哪种方法能更高效地训练模型?(

答案:使用在线学习算法###从数据集中随机抽取样本来建立模型###使用主成分分析法(PCA)对数据降维以下哪种方法可以减少数据集中的特征?(

答案:我们把模型中的所有特征都训练一次,得到测试中模型的精确性。每次取一个特征,对测试数据集的特征值进行清洗,并且对测试数据进行预测,然后评估模型。若模型的精确性提高,则移除次特征。###使用“前向”搜索###使用“后向”搜索###根据相关表提出相关性高的特征下列关于随机森林和GradientBoosting说法不正确的是?(

答案:对于任何数据,GradientBoosting总是优于随机森林。###因为GrandientBoosting里的树是互相独立的,所以可以生成平行的树。###随机森林里的决策树不是相互独立的,而GradientBooting里的决策树是相互独立的。聚类是一个典型的无监督学习问题。(

答案:错增强学习也叫强化学习,强调如何基于环境做出一系列的动作,以取得最大化的累积收益。每做出一个动作,并不一定立刻得到收益。(

答案:对如果一个训练模型在测试集上精度达到100%,那么在另一个测试集上精度能否也达到100%(

答案:错训练一个支持向量机,除去不支持的向量后仍能分类。(

答案:对泛化错误是和过拟合相对应的一个概念。(

答案:对一般K-NN最近邻算法在样本较少但典型性好的情况下效果最好。(

答案:对循环神经网络通过使用带自反馈的神经元,____________。(

答案:可以处理可变长度的序列;经验风险最小化原则很容易导致模型在训练集上错误率很低,但是在未知数据上错误率很高。这就是所谓的_____。(

答案:过拟合;LSTM模型的关键是引入了一组_______(

答案:记忆单元下列哪一项在神经网络中引入了非线性?______(

答案:修正线性单元(ReLU)下列关于“集成学习”说法错误的是?(

答案:使用“加权平均”而不是“投票法”产生结果###个体学习器由相同的学习算法生成###个体学习器间相关性较高下面不属于过拟合解决方法的有:________。(

答案:加dropout层;###损失函数加正则化项;###批规范化

batch

normalizatin;rectifier函数,定义为

,rectifier函数被认为有生物上的解释性。下列属性中属于生物上的解释性的为__________。(

答案:单侧抑制;###宽兴奋边界;###稀疏激活性;做一个二分类预测问题,先设定阈值为0.5,概率大于等于0.5的样本归入正例类(即1),小于0.5的样本归入反例类(即0)。然后,用阈值n(n>0.5)重新划分样本到正例类和反例类,下面哪一种说法正确是(

答案:增加阈值不会提高召回率###增加阈值不会降低查准率在梯度下降训练的过程中,由于过拟合的原因,在训练样本上收敛的参数,并不一定在测试集上最优。因此,我们使用一个验证集(Validation

Dataset)(也叫开发集(Development

Dataset))来测试每一次迭代的参数在验证集上是否最优。如果没有验证集,哪几项不适合在训练集上进行:(

答案:依次验证;###随机验证;###顺序验证;下列表述中,在k-fold交叉验证中关于选择K说法正确的是:(

答案:相对于期望误差来说,选择较大的K会导致低偏差(因为训练folds会变得与整个数据集相似)###较大的K并不总是好的,选择较大的K可能需要较长的时间来评估你的结果###在交叉验证中通过最小化方差法来选择K值在一个线性回归模型中增加新的变量,下列说法不正确的是?(

答案:R^2减小,调整的R^2增大###R^2和调整的R^2都减小###R^2不变,调整的R^2增大###R^2和调整的R^2都增大下列属于常见的池化方式的有:(

答案:最大池化;###平均池化;###随机池化;下列关于sigmoid函数描述正确的是(

答案:阈值一般设置在0.5,大于该值的概率表示正例###只能做二分类###取值范围为(0,1),他可以将一个实数映射到(0,1)的区间,看做概率值;CNN的英文全称为Conditioned

Neural

Networks。(

答案:错神经元网络是在计算机上把虚拟的神经元排列成图状,模拟真正的神经细胞之间的电信号。借此实现大脑从各式各样的数据中提取本质概念的功能。(

答案:错为了解决泛化拟合问题,一般在经验风险最小化的原则上加参数的正则化,也叫结构风险最小化原则。(

答案:错循环神经网络不太擅长处理带有时序等序列关系的问题。(

答案:错动量法、AdaGrad、AdaDelta是常见的设置学习率的方法。(

答案:对如果自变量和因变量之间高度非线性且关系复杂,那么运用树回归优于经典回归模型。(

答案:对SVM

是一个面向数据的分类算法,它的目标是为确定一个分类超平面,从而将不同的数据分隔开,其需要确定分类超平面两侧的两组属于不同类别的支撑点,使得这两组点可以得到最大的物理间隔。(

答案:对参数过多,影响训练是深度学习的难点。(

答案:对牛顿法是用来对函数求根的。(

答案:对SoftMax

回归是Logistic

回归的多类推广,在SoftMax

回归中,机器学习模型预测目标为每一个类别的_____概率。(

答案:后验;softplus函数,定义为

。softplus

函数可以看作是rectifier

函数的平滑版本,以下不属于softplus

函数特性的为_________。(

答案:稀疏激活性;一个SVM存在欠拟合问题,下面怎么做能提高模型的性能:(

答案:增大惩罚参数C设输入图片大小为200×200,依次经过一层卷积(kernel

size

5×5,padding

1,stride

2),一层pooling(kernel

size

3×3,padding

0,stride

1),又一层卷积(kernel

size

3×3,padding

1,stride

1)之后,输出特征图大小为:______(

答案:97;图片是训练数据集(样本非常少)的快照(属性x、y分别用“+”

“o”表示),设定kNN的k=1,那么留一法交叉验证的误差是(

答案:100%如果使用sigmoid作为神经网络激活函数,由于在BP算法中,误差从输出层反向传播时,在每一层都要乘以该层激活函数的导数,所以可能遇到前面层比后面层梯度变化更快且快得多的情况,这种情况被称为__________。(

答案:梯度爆炸;解决线性不可分情况下的支持向量分类机的最优化模型问题时,以下可以保证结果模型线性可分的是(

答案:C

无限制下列是常见的交叉验证法:a.自助法(bootstrapping)b.留一法(Leave-One-Out)c.5折交叉验证d.2次5折交叉验证样本量为1000时,根据所需的执行时间排列上述四种方法:(

答案:b>d>c>a如果使用sigmoid作为神经网络激活函数,由于在BP算法中,误差从输出层反向传播时,在每一层都要乘以该层激活函数的导数,所以可能会遇到前面层比后面层梯度变化更小且慢得多的情况,这种情况被称为__________。(

答案:梯度消失;点击率的预测是一个数据比例不平衡问题(比如训练集中样本呈阴性的比例为99%,阳性的比例是1%),如果我们用这种数据建立模型并使得训练集的准确率高达99%。我们可以得出结论是:(

答案:模型不好,我们应建一个更好的模型一个回归模型存在多重共线问题。在不损失过多信息的情况下,你该怎么做:(

答案:移除共线的两个变量其中一个###移除相关变量可能会导致信息的丢失,为了保留这些变量,我们可以使用岭回归(ridge)或lasso等回归方法对模型进行惩罚###我们可以计算方差膨胀因子(variance

inflation

factor)来检查存在的多重共线性并采取相应的措施如何在“无监督学习”中使用聚类算法?(

答案:在应用无监督学习前可将不同的簇看成不同的特征###先将样本划分为不同的簇,然后分别在不同的簇上使用无监督学习当数据集中样本类别不均衡时,常采用哪些方法来解决?(

答案:升采样###更换分类算法###降采样###人造数据逻辑回归的优点有哪些?(

答案:训练速度快###方便输出结果调整###模型效果不错###形式简单以下属于传统机器学习方法,属于神经网络方法的有:(

答案:SVM;###K-means;###朴素贝叶斯;下列哪种说法是不正确的?(

答案:一个精度高的机器学习模型通常是一个好的分类器###模型越复杂,测试错误越低###一个精度低的机器学习模型分类效果一定很差下列关于梯度树提升说法正确的是?(

答案:当分裂所需最小样本数增加时,模型拟合不足###降低拟合个体学习器样本的分数可以降低方差关于L1正则和L2正则

下面的说法正确的是(

答案:L1范数会使权值稀疏###L2正则化标识各个参数的平方的和的开方值。下列哪些神经网络结构不会发生权重共享(

答案:全连接神经网络;###卷积神经网络;下列有关神经网络的问题正确的有?(

答案:减少层数可能缩小测试误差###增加层数可能扩大测试误差下列关于牛顿法描述正确的是(

答案:牛顿法是一种迭代算法,每一步都需要求解目标函数的Hessian矩阵的逆矩阵,###二阶收敛,收敛速度快###函数要求苛刻(二阶连续可微,汉森矩阵可逆)###牛顿法是局部收敛的,当初十点选择不当时,往往导致不收敛下面对于logistic回归与SVM的分析正确的有:(

答案:两个方法都可以增加不同的正则化项,如

l1、l2

等等;###从目标函数来看,logistic回归采用的是

logistical

loss,SVM

采用的是

hinge

loss;###SVM

的处理方法是只考虑

support

vectors,也就是和分类最相关的少数点,去学习分类器。而逻辑回归通过非线性映射,大大减小了离分类平面较远的点的权重,相对提升了与分类最相关的数据点的权重;L-BFGS的描述中,正确的是(

答案:不需要存储Hesse矩阵###适合大规模的数值计算###空间消耗相对于BFGS小###具备牛顿法收敛速度快的特点在进行线性回归分析时,下列假设错误的有:(

答案:所有变量必须服从正态分布###不存在或存在极少多重共线性###检查异常值,因为回归对异常值比较敏感小明参加某公司的大数据竞赛,他的成绩在大赛排行榜上原本居于前二十,后来他保持特征不变,对原来的模型做了1天的调参,将自己的模型在自己本地测试集上的准确率提升了5%,然后他信心满满地将新模型的预测结果更新到了大赛官网上,结果懊恼地发现自己的新模型在大赛官方的测试集上准确率反而下降了。对此,他的朋友们展开了讨论,下列哪些说法是正确的(

答案:小刚:你这个有可能是由于过拟合导致的###小平:你可以考虑一下,使用交叉验证来验证一下是否发生了过拟合在决策树中,用作分裂节点的information

gain说法正确的是(

答案:信息增益更加倾向于选择有较多取值的属性###信息增益可以使用熵得到下面哪一项

用决策树法训练大量数据集不会节约时间?(

答案:减少树的个数###增加学习率###增加树的深度下列哪种算法可以用神经网络构建?(

答案:线性回归###K-mean聚类算法###逻辑回归感知器是模拟生物神经元行为的机器,有与生物神经元相对应的部件,下面属于模拟生物神经元的部件为:___________。(

答案:激活函数;###输入输出;###偏置;###权重;下列可以用隐马尔可夫模型来分析的是?(

答案:股价数据###电影评论数据###基因序列数据###小说数据在梯度下降训练的过程中,我们开发集来测试每一次迭代的参数在验证集上是否最优。(

答案:对解决非凸优化问题并不是深度学习的难点。(

答案:错有监督学习是利用一组已知输入x

和输出y

的数据来学习模型的参数,使得模型预测的输出标记和真实标记尽可能的一致。(

答案:对无监督学习是用来学习的数据不包含输出目标,需要学习算法自动学习到一些有价值的信息。(

答案:对有监督学习根据输出类型又可以分为回归和分类两类。(

答案:对SVM的全称是support

vector

machine。(

答案:对对于未标记的训练样本进行学习,以发现这些样本中的结构知识,该学习方法称为:监督学习。(

答案:错Hinge

Loss

0-1

损失函数是逻辑回归的损失函数。(

答案:对在对于LSTM的变体GRU中,将LSTM中的记忆单元和神经元隐藏状态进行了合并。(

答案:对深度学习是由在计算机上模拟人类神经回路的神经元网络技术发展而来。。(

答案:对在对于LSTM的变体GRU中,对于LSTM进行了如下更新:将LSTM中的输出门与遗忘门合并为更新门。(

答案:错逻辑回归用来做回归任务的。(

答案:错卷积神经网络中其中一般含有的特殊神经网络层:卷积层与池化层。(

答案:对深度学习的需要满足的主要需求在于计算资源要大、数据要多、算法效率要好。(

答案:对逻辑回归在训练的过程当中,如果有很多的特征高度相关或者说有一个特征重复了100遍,会让分类器的准确率降低。(

答案:错欧氏距离,是最常见的两点之间或多点之间的距离表示法,又称之为欧几里得度量,。(

答案:对经验风险最小化原则很容易导致模型在训练集上错误率很低,但是在未知数据上错误率很高。(

答案:对过拟合问题往往是由于训练数据少和噪声造成的。(

答案:对在模型训练过程中,进行梯度下降法进行参数更新时,使用学习率这个参数来控制参数变化的快慢。(

答案:对运用主成分分析法(PCA)降维,朴素贝叶斯分类器的属性条件独立性假设总是成立的,因为由各个主成分之间正交可推出它们不相关。(

答案:错卷积神经网络(Convolutional

Neural

Networks,CNN)是一种前馈神经网络。卷积神经网络是受生物学上_________的机制而提出的。(

答案:感受野;下面不属于卷积神经网络结构上的特征的一项为:_________。(

答案:随机连接;在训练神经网络时,损失函数(loss)在最初的几个epochs时没有下降,可能的原因是?_______(

答案:学习率太低在使用对应正则化项减少参数空间的同时,_______范数的引入通常会使得参数有一定稀疏性,因此在很多算法中也经常使用。(

答案:L1;支持向量机模型,选择RBF函数作为kernel后,对gamma(函数自带参数)画散点图,如果忘记在图上标记gamma值,以下哪一个选项可以解释下图的gamma值(图1,2,3从左向右,gamma值分别为g1、g2、g3)?(

答案:g1

>=

g2

>=

g3以下哪一种方法最适合在n(n>1)维空间中做异常点检测。(

答案:马氏距离;门限循环单元(Gated

Recurrent

Unit,GRU)是一种比LSTM更加简化的版本。在LSTM中,输入门和遗忘门是互补关系,因为同时用两个门比较冗余。GRU将输入门与和遗忘门合并成一个门:_______(

答案:更新门;传统神经网络中最常用的激活函数分别是sigmoid

型函数。sigmoid

型函数是指一类________曲线函数。(

答案:S

型;BP(反向传播

Back

Propagation)算法主要是利用了_________(

答案:链式求导法则;对于一个语音识别任务(识别用户说的话),下面哪种神经网络可以更好地解决这个问题?(

答案:循环神经网络;bootstrap

数据的含义是:(

答案:有放回的从整体N中抽样n个样本在前馈神经网络中,各神经元分别属于不同的层。整个网络中无反馈,信号从输入层向输出层单向传播,可用一个__________表示。(

答案:有向无环图;在构建一个基于决策树模型时,使用信息增益information

gain作为决策树节点属性选择的标准,以下图片中哪一个属性具信息增益最大:(

答案:Outlook评估模型之后,得出模型存在偏差,下列哪种方法可能解决这一问题:(

答案:向模型中增加更多的特征为了对于LSTM进行简化,提出了一种新的循环神经网络单元,该单元称作:__________单元。(

答案:门循环;一般来说,为了解决过拟合问题,会在经验风险最小化的原则上加入参数的正则化,_______的正则化会用来减少参数空间,避免过拟合。(

答案:L2;为了避免梯度爆炸或消失问题,提出了______(

答案:长短时记忆神经网络下面哪一种属于非线性分类器?(

答案:多层感知机;前馈神经网络的输入和输出的维数都是__________。(

答案:随机的;卷积层虽然可以显著减少连接的个数,但是每一个特征映射的神经元个数并没有显著减少。这样,如果后面接一个分类器,分类器的输入维数依然很高,很容易出现过拟合。为了解决这个问题,在卷积神经网络一般会在卷积层之后再加上一个__________操作。(

答案:池化(Pooling);下列不属于因果推理方法的是(

)。

答案:倾向值的方法当今机器学习模型是基于因果关联的模型。(

答案:错下列是关联来源的是:(

)。

答案:混淆误差###因果关联###样本选择误差混淆变量直接平衡法的动机是变量的所有矩的集合能唯一决定其分布。(

答案:对函数tf.reduce_mean(v)的作用是(

)。

答案:求数组v的标准差TensorFlow在2.0.0版本后将取代计算题称为默认设置。(

答案:对PyTorch的API是围绕命令行式的编程(

答案:对下列属于Tensorflow的有点的是:(

)。

答案:降低了深度学习的开发成本和开发难度。###是当今最好用的神经网络库之一。###开源性。###它擅长与训练深度神经网络下列关于Tensorflow说法错误的是(

)。

答案:由Facebook进行开发。下列说法错误的是(

)。

答案:进化算法效率很高。目前以深度学习为代表的人工智能计算需求,主要采用GPU、FPGA等已有的适合并行计算的通用芯片来实现加速。(

答案:对动态规划是从前驱状态推断后继状态来计算赋值函数。(

答案:对下列不属于AutoML方法的是(

)。

答案:迁移学习下列哪些属于AutoML系统:(

)。

答案:自动网络###TPOT###Hyperopt-Sklearn###Auto-WEKA下列不属于强化学习的特点的是(

)。

答案:实时反馈一个好的策略是在当前状态下采取一个行动后,该行动能够在未来收到最大化反馈。(

答案:对Deep

Q-learning能够用有限的参数刻画无限的状态。(

答案:对关于智能主体下列描述正确的有:(

)。

答案:状态指的是智能主体对环境的一种解释。###智能主体可能知道也可能不知道环境的变化规律###按照某种策略,根据当前的状态选择合适的动作。下列关于环境的描述错误的是(

)。

答案:环境的变化受到智能主体的影

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论