机器学习基础智慧树知到期末考试答案2024年

上传人：题*** IP属地：浙江上传时间：2024-04-08 格式：DOCX 页数：8 大小：20.28KB 积分：6 举报 版权申诉

已阅读5页，还剩3页未读，继续免费阅读

版权说明：本文档由用户提供并上传，收益归属内容提供方，若内容存在侵权，请进行举报或认领

文档简介

机器学习基础智慧树知到期末考试答案2024年机器学习基础‎训练完SVM模型后,不是支持向量的那些样本我们可以丢掉,也可以继续分类。（）

A:对B:错答案:对PCA会选取信息量最少的方向进行投影。（）

A:正确B:错误答案:错误支持向量机是那些最接近决策平面的数据点。（）

A:错B:对答案:对在各类机器学习算法中，过拟合和欠拟合都是可以彻底避免的。（）

A:错误B:正确答案:错误线性回归是一种有监督机器学习算法，它使用真实的标签进行训练。（）

A:错误B:正确答案:正确K近邻是一种比较成熟也是比较简单的机器学习算法，主要用于分类问题。（）

A:错误B:正确答案:错误决策树学习是一种逼近离散值目标函数的方法，学习到的函数被表示为一棵决策树。（）

A:错误B:正确答案:正确K均值算法，是一种原型聚类算法。（）

A:对B:错答案:对KNN分类的时候，对新的样本，根据其k个最近邻的训练样本的类别，通过多数表决等方式进行预测。（）

A:错误B:正确答案:正确一般的，一棵决策树包含一个根结点、若干个内部结点和若干个叶结点；叶结点对应于决策结果，其他每个结点则对应于一个属性测试；根结点包含样本全集。（）

A:错误B:正确答案:正确K均值聚类时，初始质心不好会导致收敛速度差。（）

A:错B:对答案:对根据肿瘤的体积、患者的年龄来判断良性或恶性，这是一个回归问题。（）

A:正确B:错误答案:错误K-Means聚类分析使用目标字段,预测某一结果。（）

A:对B:错答案:错朴素贝叶斯模型假设属性之间相互独立，这个假设在实际应用中往往是不成立的，在属性相关性较小时，朴素贝叶斯性能良好。而在属性个数比较多或者属性之间相关性较大时，分类效果不好。（）

A:错误B:正确答案:正确K-Means的计算性能瓶颈发生在距离的计算上。（）

A:对B:错答案:对支持向量机求解不可以采用梯度下降方法求解最优值。（）

A:错误B:正确答案:错误朴素贝叶斯法对缺失数据较敏感。（）

A:正确B:错误答案:正确逻辑回归算法是一种广义的线性回归分析方法，它仅在线性回归算法的基础上，利用Sigmoid函数对事件发生的概率进行预测。（）。

A:错误B:正确答案:正确梯度下降，就是沿着函数的梯度（导数）方向更新自变量，使得函数的取值越来越小，直至达到全局最小或者局部最小。（）

A:正确B:错误答案:正确SVM中核函数将高维空间中的数据映射到低维空间。（）

A:正确B:错误答案:错误以下属于关联规则分析的是（）。

A:股票趋势建模B:购物篮分析C:自动判断鸢尾花类别D:CPU性能预测答案:购物篮分析下面关于回归分析的描述错误的是（）

A:回归分析按照涉及的变量的多少，分为一元回归和多元回归分析B:按照因变量的多少，可分为线性回归分析和非线性回归分析C:是确定两种或两种以上变量间相互依赖的定量关系的一种统计分析方法D:在大数据分析中,回归分析是一种预测性的建模技术答案:按照因变量的多少，可分为线性回归分析和非线性回归分析我们想在大数据集上训练决策树,为了使用较少时间,我们可以（）。

A:增加树的深度B:增加学习率C:减少树的深度D:减少树的数量答案:减少树的深度下述哪一个是机器学习的合理定义。（）

A:机器学习是允许机器人智能行动的领域B:机器学习能使计算机能够在没有明确编程的情况下学习C:机器学习是计算机编程的科学D:机器学习从标记的数据中学习答案:机器学习能使计算机能够在没有明确编程的情况下学习以下哪个距离度量不在KNN算法中体现（）

A:切比雪夫距离B:余弦相似度C:曼哈顿距离D:欧氏距离答案:余弦相似度一个正例(2,3)，一个负例(0,-1)，下面哪个是SVM超平面（）

A:2x+y-4=0B:无法计算C:2y+x-5=0D:x+2y-3=0答案:x+2y-3=0在logistic回归中将输出y视为样本x属于正例的概率。给定训练数据集，通常采用（）来估计参数w和b，最大化样本属于其真实类标记的概率的对数，即最大化对数似然。

A:交叉验证法B:极大似然法C:最小二乘法D:留出法答案:极大似然法下列选项中，关于KNN算法说法不正确是（）

A:算法相对简单，但是可解释性不强B:默认使用欧氏距离C:能找出与待预测样本相近的K个样本D:效率很高答案:效率很高线性回归方程中，回归系数b为负数，表明自变量与因变量为（）

A:显著相关B:不相关C:负相关D:正相关答案:负相关KNN最近邻方法在（）情况下效果较好？

A:样本较多但典型性不好B:样本呈链状分布C:样本呈团状分布D:样本较少但典型性好答案:样本较少但典型性好一个计算机程序从经验E中学习任务T，并用P来衡量表现。并且，T的表现P随着经验E的增加而提高。假设我们给一个学习算法输入了很多历史天气的数据，让它学会预测天气。P的合理选择是（）。

A:其它都不对B:计算大量历史气象数据的过程C:天气预报任务D:正确预测未来日期天气的概率答案:正确预测未来日期天气的概率假设你训练SVM后，得到一个线性决策边界，你认为该模型欠拟合。在下次迭代训练模型时，应该考虑（）

A:减少特征B:减少训练数据C:计算更多变量D:增加训练数据答案:计算更多变量以下关于逻辑回归与线性回归问题的描述错误的是（）。

A:逻辑回归用于处理分类问题，线性回归用于处理回归问题B:线性回归计算方法一般是最小二乘法，逻辑回归的参数计算方法是似然估计法C:线性回归要求输入输出值呈线性关系，逻辑回归不要求D:逻辑回归一般要求变量服从正态分布，线性回归一般不要求答案:逻辑回归一般要求变量服从正态分布，线性回归一般不要求逻辑回归模型可以解决线性不可分问题吗？（）。

A:不可以B:可以C:其它说法都不对D:视数据具体情况而定答案:不可以数据预处理对机器学习是很重要的,下面说法正确的是（）。

A:数据预处理的效果直接决定了机器学习的结果质量B:数据噪声对神经网络的训练没什么影响C:对于有问题的数据都直接删除即可D:预处理不需要花费大量的时间答案:数据预处理的效果直接决定了机器学习的结果质量关于朴素贝叶斯，下列说法错误的是（）

A:朴素的意义在于它的一个假设：所有特征之间是相互独立的B:它实际上是将多条件下的条件概率转换成了单一条件下的条件概率，简化了计算C:朴素贝叶斯不需要使用联合概率D:它是一个分类算法答案:朴素贝叶斯不需要使用联合概率下列关于线性回归分析中残差说法正确的是（）

A:残差均值总是为零B:残差均值总是大于零C:其它说法都不对D:残差均值总是小于零答案:残差均值总是大于零传统机器学习的应用领域有（）。

A:销售预测B:信用风险检测C:商品推荐D:语音合成答案:信用风险检测###销售预测###商品推荐关于剪枝，以下算法正确的是（）。

A:剪枝是防止过拟合的手段B:决策树剪枝的基本策略有预剪枝和后剪枝C:ID3算法没有剪枝操作D:C4.5算法没有剪枝操作答案:ID3算法没有剪枝操作###决策树剪枝的基本策略有预剪枝和后剪枝###剪枝是防止过拟合的手段下面属于降维常用的技术的有（）

A:特征提取B:奇异值分解C:主成分分析D:离散化答案:主成分分析###奇异值分解以下关于PCA说法正确的是（）

A:PCA各个主成分维度解释性强B:PCA运算结果受到属性方差的影响C:PCA运算时需要进行特征值分解D:PCA各个主成分之间正交答案:PCA各个主成分之间正交###PCA运算时需要进行特征值分解###PCA运算结果受到属性方差的影响假设您正在使用随机梯度下降训练逻辑回归分类器。你发现在过去的500个例子中，成本（即，500个例子平均后）绘制为迭代次数的函数，随时间缓慢增加。以下哪项更改可能有帮助（）。

A:从训练集中取更少的例子。B:试着在图中用较少的例子（比如250个例子而不是500个）来平均成本。C:这在随机梯度下降的情况下是不可能的，因为它保证收敛到最优参数。D:尝试将学习率减半（减少），看看这是否会导致成本持续下降；如果没有，继续减半直到成本会持续下降。答案:AI参考:选项D：“尝试将学习率减半（减少），看看这是否会导致成本持续下降；如果没有，继续减半直到成本会持续下降。”\n\n原因分析：在随机梯度下降中，学习率是一个重要的超参数，它决定了模型在每次更新参数时的步长大小。当学习率设置过高时，模型的更新可能会过于激进，从而导致梯度下降不能稳定地收敛到全局最优解。题干中描述的情况可能就是由于学习率设置过高导致的。因此，通过降低学习率，可以减小模型的更新步长，从而有助于模型更稳定地收敛到全局最优解。如果降低学习率后成本持续下降，那么说明降低学习率是有效的；如果没有效果，那么可以继续降低学习率，直到成本能够持续下降为止。\n\n其他选项的分析：\n\nA选项：减少训练集中样本的数量可能会影响模型的泛化能力，因为模型可能无法学到足够的样本间的差异。\n\nB选项：减少训练样本的数量可能会影响模型的性能，因为模型可能无法学到足够的样本间的差异。\n\nC选项：虽然随机梯度下降可以保证收敛到全局最优解，但这并不意味着成本会随时间缓慢增加。因此，该选项不能解决题干中的问题。\n\n因此，答案为D:尝试将学习率减半（减少），看看这是否会导致成本持续下降；如果没有，继续减半直到成本会持续下降。'下列关于K-means聚类算法的说法错误的是（）。

A:对大数据集有较高的效率并且具有可伸缩性B:是一种无监督学习方法C:初始聚类中心的选择对聚类结果影响不大D:K值无法自动获取，初始聚类中心随机选择答案:AI参考:关于K-means聚类算法的说法错误的是：初始聚类中心的选择对聚类结果影响不大。\n\nK-means算法是一种迭代的、基于距离的聚类方法，其核心思想是：对于每一个聚类，选择一个具有代表性的数据点作为聚类中心。初始聚类中心的选择会影响到后续的聚类结果，但在某些情况下，初始聚类中心的选择可能不会对最终的聚类结果产生太大的影响。\n\n其他选项中，A选项正确，K-means算法对大数据集有较高的效率并且具有可伸缩性；B选项正确，K-means算法是一种无监督学习方法；D选项正确，K值无法自动获取，需要手动设定。因此，本题的正确答案是C选项。'以下说法哪些是正确的?（）

A:在使用KNN算法时，k通常取偶数B:在使用KNN算法时，k取值越大，模型越容易过拟合C:KNN和k-means都是无监督学习算法D:KNN是有监督学习算法答案:AI参考:在给出的四个选项中，正确说法为：\n\nD:KNN是有监督学习算法。\n\n解释如下：\n\nA选项错误，因为在K近邻算法中，k是一个参数，通常取一个正整数，不是一个偶数。\n\nB选项错误，k值越大，表示在数据集中考虑更多的邻居，可以减少误分类的可能性，但并不是说模型容易过拟合。实际上，K近邻算法对噪声数据的鲁棒性较好，但容易对过度复杂的数据产生过拟合。\n\nC选项错误，K近邻算法是一种有监督学习算法，而k-means是一种无监督学习算法。\n\nD选项正确，K近邻算法是一种有监督学习算法，用于分类和回归分析。\n\n因此，正确答案是D：KNN是有监督学习算法。'以下说法错误的是（）

A:线性回归(LinearRegression)是利用数理统计中回归分析，来确定两种或两种以上变量间相互依赖的定量关系的一种统计分析方法B:这种函数是一个或多个称为回归系数的模型参数的线性组合C:线性回归利用称为线性回归方程的最小平方函数对一个或多个自变量和因变量之间关系进行建模D:只有一个自变量的情况称为多元回归,大于一个自变量情况的叫做简单回归答案:AI参考:答案是D：只有一个自变量的情况称为多元回归，大于一个自变量情况的叫做简单回归。\n\n线性回归分析只包含一个自变量和因变量的情况，也被称为简单回归。在有多个自变量和因变量的情况下，使用的是多元回归分析。所以，D选项说法错误。其他选项描述的是线性回归分析的基本概念，都是正确的。'K-means是一种迭代算法，在其内部循环中重复执行以下两个步骤是（）。

A:簇中心分配步骤，其中每个簇质心被分配（通过设置）到最近的训练示例B:移动簇中心，将其设置为等于最近的训练示例C:移动簇中心，更新簇中心。D:分配簇，计算距离。答案:"AI参考:正确选项是：C:移动簇中心，更新簇中心。K-means是一种迭代算法，在其内部循环中重复执行以下两个步骤：移动簇中心和更新簇中心。在每个迭代中，算法会重新分配训练样本到最近的簇，并更新每个簇的质心位置，以便能够更好地代表该簇的平均特征。因此，选项C是正确的描述。选项A和B是移动簇中心的描述，但没有提及如何更新簇中心；选项D则描述了分配簇和计算距离的过程，但与K-mea

人人文库> 全部分类> 教育资料 > 考试试卷

温馨提示

1. 本站所有资源如无特殊说明，都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2. 本站的文档不包含任何第三方提供的附件图纸等，如果需要附件，请联系上传者。文件的所有权益归上传用户所有。
3. 本站RAR压缩包中若带图纸，网页内容里面会有图纸预览，若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 人人文库网仅提供信息存储空间，仅对用户上传内容的表现方式做保护处理，对用户上传分享的文档内容本身不做任何修改或编辑，并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容，请与我们联系，我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

机器学习基础智慧树知到期末考试答案2024年

文档简介

温馨提示

最新文档

评论

机器学习基础智慧树知到期末考试答案2024年

文档简介

温馨提示

最新文档

评论

相关文档