机器学习模拟试题含答案_第1页
机器学习模拟试题含答案_第2页
机器学习模拟试题含答案_第3页
机器学习模拟试题含答案_第4页
机器学习模拟试题含答案_第5页
已阅读5页,还剩12页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

机器学习模拟试题含答案一、单选题(共50题,每题1分,共50分)1、同质集成中的个体学习器亦称()A、组件学习器B、基学习器C、异质学习器D、同质学习器正确答案:B2、假设我们使用原始的非线性可分版本的Soft-SVM优化目标函数。我们需要做什么来保证得到的模型是线性可分离的?A、C=0B、C=1C、C正无穷大D、C负无穷大正确答案:C3、关于logistic回归和SVM不正确的是()A、Logistic回归目标函数是最小化后验概率B、Logistic回归可以用于预测事件发生概率的大小C、SVM可以有效避免模型过拟合D、SVM目标是结构风险最小化正确答案:A4、构建一个最简单的线性回归模型需要几个系数(只有一个特征)?A、1个B、2个C、4个D、3个正确答案:B5、假如我们使用Lasso回归来拟合数据集,该数据集输入特征有100个(X1,X2,…,X100)。现在,我们把其中一个特征值扩大10倍(例如是特征X1),然后用相同的正则化参数对Lasso回归进行修正。那么,下列说法正确的是?A、特征X1很可能被排除在模型之外B、特征X1很可能还包含在模型之中C、无法确定特征X1是否被舍弃D、以上说法都不对正确答案:B6、下面关于SVM算法叙述不正确的是()A、SVM是一种基于经验风险最小化准则的算法B、SVM求得的解为全局唯一最优解C、SVM在解决小样本、非线性及高维模式识别问题中具有优势D、SVM最终分类结果只与少数支持向量有关正确答案:A7、KNN算法属于一种典型的()算法A、无监督学习B、半监督学习C、弱监督学习D、监督学习正确答案:D8、关于BP算法特点描述错误的是()A、输入信号顺着输入层、隐层、输出层依次传播B、计算之前不需要对训练数据进行归一化C、预测误差需逆向传播,顺序是输出层、隐层、输入层D、各个神经元根据预测误差对权值进行调整正确答案:B9、关于维数灾难说法错误的是?A、高维度数据可使得算法泛华能力变得越来越弱B、高维度数据增加了运算难度C、降低高维度数据会对数据有所损伤D、高维度数据难以可视化正确答案:A10、做一个二分类预测问题,先设定阈值为0.5,概率大于等于0.5的样本归入正例类(即1),小于0.5的样本归入反例类(即0)。然后,用阈值n(n>0.5)重新划分样本到正例类和反例类,下面哪一种说法正确是()1.增加阈值不会提高召回率2..增加阈值会提高召回率3..增加阈值不会降低查准率4.增加阈值会降低查准率A、1B、2C、2、4D、1、3正确答案:D11、按照求解方法进行分类算法的划分,下列中为生成模型的是()A、决策树B、支持向量机SVMC、K近邻D、贝叶斯分类器正确答案:D12、EM算法的停止条件()A、数据样本异常B、已达到最大迭代轮数C、似然函数减小D、训练器异常正确答案:B13、‌SVM中的代价参数C表示什么?A、交叉验证的次数B、以上都不对C、用到的核函数D、在分类准确性和模型复杂度之间的权衡正确答案:D14、假设现在只有两个类,这种情况下SVM需要训练几次?A、3B、2C、1D、4正确答案:C15、下列关于线性回归分析中的残差(Residuals)说法正确的是?A、残差均值总是为零B、残差均值总是小于零C、残差均值总是大于零D、以上说法都不对正确答案:A16、若svm出现欠拟合,以下合适的做法是A、增加训练样本B、使用更powful的kernelC、使用L2正规化D、做数据增强正确答案:B17、哪一个是机器学习的合理定义?A、机器学习从标记的数据中学习B、机器学习是计算机编程的科学C、机器学习是允许机器人智能行动的领域D、机器学习能使计算机能够在没有明确编程的情况下学习正确答案:D18、对函数dist(.,.)若它是一个距离度量则需要满足的基本特性中以下哪个不是正确答案A、非负性B、同一性C、对称性D、递增性正确答案:D19、关于决策树结点划分指标描述正确的是A、信息增益越大越好B、类别非纯度越大越好C、基尼指数越大越好D、信息增益率越小越好正确答案:A20、‍以下关于训练集、验证集和测试集说法不正确的是()。A、验证集用于调整模型参数B、测试集是纯粹是用于测试模型泛化能力C、以上说法都不对D、训练集是用来训练以及评估模型性能正确答案:D21、StandardScaler预处理方法可以表示为?=(?-?)/?,其中?表示特征所在列的A、最大值B、分解阈值C、均值D、方差正确答案:D22、对于在原空间中线性不可分问题,支持向量机()。A、无法处理B、将数据映射到核空间中C、在原空间中寻找线性函数划分数据D、在原空间中寻找非线性函数的划分数据正确答案:B23、以下哪些是无序属性()A、闵可夫斯基距离B、{1,2,3}C、{小,中,大}D、{飞机,火车、轮船}正确答案:D24、一对一法分类器,k个类别需要多少个SVM:A、k(k-1)B、kC、k(k-1)/2D、k!正确答案:C25、下列贝叶斯网结构中不属于三种典型的依赖关系A、选择结构B、同父结构C、顺序结构D、V型结构正确答案:A26、以下哪项是非线性降维方法A、PCA(主成分分析)B、LDA(线性判别)C、ICA(独立成分分析)D、KPCA(核化线性降维)正确答案:D27、以下关于感知器说法错误的是:()A、感知器中的偏置只改变决策边界的位置B、可为感知器的输出值设置阈值使其用于处理分类问题C、单层感知器可以用于处理非线性学习问题D、感知器是最简单的前馈式人工神经网络正确答案:C28、K均值算法的K指的是什么?A、K是均值的数值B、K是均值的最大限值C、K是分类的数量D、K是分类的迭代次数正确答案:B29、‌当数据分布不平衡时,我们可采取的措施不包括()。A、对数据分布较少的类别过采样B、对数据分布较少的类别赋予更大的权重C、对数据分布较多的类别欠采样D、对数据分布较多的类别赋予更大的权重正确答案:D30、关于决策树,以下哪种说法是正确的A、只用于分类问题B、可读性强C、是无监督学习D、只用于回归问题正确答案:B31、下列激活函数中,能够实现将特征限制到区间[-1,1]的是哪一个A、TanhB、LogisticC、ReLUD、Sigmoid正确答案:A32、对主成分分析PCA方法描述正确的是:A、投影矩阵是正交矩阵B、进行非正交投影C、PCA不需要进行样本去均值D、投影到特征值最小的方向正确答案:A33、朴素贝叶斯是一种典型的基于概率的机器学习方法,它利用了A、先验概率B、后验概率C、以上都是D、以上都不是正确答案:C34、对于非概率模型而言,可按照判别函数线性与否分成线性模型与非线性模型。下面哪个模型不属于线性模型?A、感知机B、AdaBoostC、K-meansD、k近邻正确答案:B35、模型评估的常用方法有哪些A、留出法B、交叉验证法C、自助法D、以上都是正确答案:D36、决策树模型中应如何妥善处理连续型属性A、利用固定阈值进行离散化B、随机选择数据标签发生变化的位置进行离散化C、直接忽略D、根据信息增益选择阈值进行离散化正确答案:D37、混淆矩阵的真负率公式是为A、FN/(TP+FN)B、FP/(FP+TN)C、TN/(TN+FP)D、TP/(TP+FN)正确答案:C38、下列不属于集成学习方法是A、connectingB、baggingC、stackingD、boosting正确答案:A39、一般来说,下列哪种方法常用来预测连续独立变量?A、线性回归B、逻辑回顾C、线性回归和逻辑回归都行D、以上说法都不对正确答案:A40、KNN算法是基于()A、颜色空间B、概率空间C、距离空间D、线性空间正确答案:C41、下列哪种方法可以用来缓解过拟合的产生:()。A、正则化B、增加更多的特征C、以上都是D、增加模型的复杂度正确答案:A42、以下哪个不是常见的决策树算法A、ID3B、C4.5C、CARTD、DBSCAN正确答案:D43、关于EM算法正确的是A、EM算法包括两步:E算法和M算法B、EM算法一定能收敛到全局最大值点C、英文全称是Expectation-MinimizationD、以上都不正确正确答案:A44、不属于KNN算法要素的是:A、距离度量B、分类决策的规则C、k值的选择D、训练样本的个数正确答案:D45、在回归模型中,下列哪一项在权衡欠拟合(under-fitting)和过拟合(over-fitting)中影响最大?A、使用常数项B、更新权重w时,使用的是矩阵求逆还是梯度下降C、多项式阶数正确答案:C46、以下关于机器学习描述错误的是?A、研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能B、器学习强调三个关键词:算法、模型、训练C、是一门涉及统计学、系统辨识、逼近理论、神经网络、优化理论、计算机科学、脑科学等诸多领域的交叉学科D、基于数据的机器学习是现代智能技术中的重要方法之一正确答案:B47、极大似然估计中参数是()A、确定且未知的量B、确定且已知的量C、未知的随机变量D、已知的随机变量正确答案:A48、下列两个变量之间的关系中,那一个是线性关系A、学生的性别与他(她)的数学成绩B、正方形的边长与周长C、儿子的身高与父亲的身高D、人的工作环境与他的身体健康状况正确答案:B49、‍“没有免费的午餐定理”告诉我们A、对于一个特定的问题,任何算法都是一样好的B、没有可以适应一切问题的算法C、设计好的算法是徒劳的D、我们不能对问题有先验假设正确答案:B50、下列是机器学习中降维任务的准确描述的为A、依据某个准则对项目进行排序B、将其映射到低维空间来简化输入C、预测每个项目的实际值D、对数据对象进行分组正确答案:B二、判断题(共50题,每题1分,共50分)1、贝叶斯分类器中只有一个判别函数A、正确B、错误正确答案:B2、回归问题和分类问题都有可能发生过拟合A、正确B、错误正确答案:A3、过拟合比欠拟合更容易克服。A、正确B、错误正确答案:B4、概率模型的训练过程就是参数估计的过程A、正确B、错误正确答案:A5、随机森林的两个随机指的是随机选取样本和随机选取属性A、正确B、错误正确答案:A6、逻辑回归是一个回归模型A、正确B、错误正确答案:B7、支持向量是最靠近决策表面的数据点A、正确B、错误正确答案:A8、随机森林的训练效率通常低于BaggingA、正确B、错误正确答案:B9、PCA是一种有效的降维去噪方法A、正确B、错误正确答案:A10、决策树的生成是一个递归过程。在决策树基本算法中,有三种情形会导致递归返回。A、正确B、错误正确答案:A11、K均值算法的E值越小则簇内样本相似度越低A、正确B、错误正确答案:B12、在初始数据量足够时,自助法比交叉验证法更为常用。A、正确B、错误正确答案:B13、逻辑回归分类的精度不够高,因此在业界很少用到这个算法A、正确B、错误正确答案:B14、在基于SGD随机梯度下降算法的神经网络中,每次打乱数据是非常重要和必不可少A、正确B、错误正确答案:A15、AGNES算法分为单链接、全链接、均链接算法A、正确B、错误正确答案:A16、PCA是有监督学习,是有参数限制的A、正确B、错误正确答案:B17、Bagging是并行式集成学习方法最著名的代表A、正确B、错误正确答案:A18、由于贝努力贝叶斯比适合于贝努力(二项分布)分布,因此,贝努力贝叶斯只能用于二分类任务A、正确B、错误正确答案:B19、模型泛化能力与训练样本数量无关A、正确B、错误正确答案:B20、BP算法陷入局部极小值的问题可通过更换激活函数解决。A、正确B、错误正确答案:B21、剪枝是决策树学习算法对付“过拟合”的主要手段,决策树剪枝的基本策略有“预剪枝”和“后剪枝”。A、正确B、错误正确答案:A22、一般情形下,后剪枝决策树的欠拟合风险很小,泛化性能往往优于预剪枝决策树。A、正确B、错误正确答案:A23、过拟合是有监督学习的挑战,而不是无监督学习A、正确B、错误正确答案:B24、BP算法“喜新厌旧”,在学习新样本后,会把旧样本逐渐遗忘。A、正确B、错误正确答案:A25、给定n个数据点,如果其中一半用于训练,另一半用于测试,则训练误差和测试误差之间的差别会随着n的增加而减小A、正确B、错误正确答案:A26、硬投票计算出每个类别的平均估算概率,然后选出概率最高的类别。A、正确B、错误正确答案:B27、"过拟合是有监督学习的挑战,而不是无监督学习"A、正确B、错误正确答案:A28、线性回归模型只能处理具有线性关系的数据。A、正确B、错误正确答案:B29、一个贝叶斯网由结构和参数两个部分构成A、正确B、错误正确答案:A30、Bagging只适用于二分类任务A、正确B、错误正确答案:B31、任何一个有效的机器学习算法必须有其归纳偏好A、正确B、错误正确答案:A32、最近邻分离器的泛化错误率不会超过贝叶斯最优分类器错误率的两倍A、正确B、错误正确答案:A33、一般来说,查准率高时,查全率也高。A、正确B、错误正确答案:B34、BP算法的反向传播是为了对权值进行调整。A、正确B、错误正确答案:A35、预剪枝决策树通常比后剪枝决策树保留了更多的分支。A、正确B、错误正确答案:B36、预剪枝决策树

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论