版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第一章概述1/2单选题(1分)以下关于机器学习的基本概念中说法错误的是:机器学习是近20多年兴起的一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。人工智能大致分为三种学习方法,即基于规则的方法、经典的机器学习方法、基于表示的学习方法。机器学习包括专家系统数据挖掘可以认为是机器学习和数据库技术的交叉学科,数据挖掘主要利用机器学习来分析数据,利用数据库技术来管理数据。答案:C2/2单选题(1分)以下属于大数据机器学习的特征的是:与日俱增的数据量不断增加的网络模型及模型复杂度媲美甚至超越人类认知的准确度以上都是答案:D第二章机器学习基本概念1/1单选题(1分)经验风险最小化最优模型,当样本容量很小时,经验风险最小化学习可能会产生哪种现象?欠拟合过拟合答案:B
1
/1
多选题
(2分)ABCD
答案:AB第三章模型性能评估1/3单选题(1分)真正例率TPR的怎么计算?TPR=TP/(TP+FN)TPR=FP/(FN+FP)TPR=(TP+FN)/TPTPR=(TN+FP)/FP答案:A2/3单选题(1分)在ROC分析中,分类器的性能曲线的理想状态是:对角线(AUC等于0.5)越靠下越好(AUC趋近于0)越靠上越好(AUC趋近于1)答案:C3/3判断题(1分)任意一条ROC曲线都有一条代价曲线与之对应,反之亦然。答案:√第四章感知机1/2单选题(1分)感知机属于生成模型还是判别模型?生成模型判别模型答案:B2/2判断题(1分)感知机不能学习异或XOR函数答案:√1/3单选题(1分)多层感知机解决线性不可分问题的原理是:分而治之,对原始问题空间进行划分将原始问题向更高维空间映射在输出层和隐含层之间形成非线性的分界面将原始问题在隐含层映射成线性可分问题答案:D2/3单选题(1分)在感知机中(Perceptron)的任务顺序是什么?1随机初始化感知机的权重2去到数据集的下一批(batch)3如果预测值和输出不一致,则调整权重4对一个输入样本,计算输出值1,2,3,44,3,2,13,1,2,41,4,3,2答案:D3/3多选题(2分)以下关于感知机说法错误的是:感知机是二分类的线性分类模型,属于非监督学习算法只要参数设置得当,感知机理论上可以解决各种分类问题感知机的训练过程可以看成是在误差空间进行梯度下降感知机学习算法是正确分类驱动的答案:ABD第五章聚类1/1单选题(1分)聚类任务是有监督学习还是无监督学习?无监督学习有监督学习答案:A1/1判断题(1分)距离度量需满足的基本性质有:非负性,同一性,对称性,直递性答案:√1/1判断题(1分)DBSCAN是基于划分的聚类答案:×第六章贝叶斯分类器及图模型1/1单选题(1分)关于因子图,说法错误的是:因子图由两类不同的结点组成,且所有的链接都位于两类不同的结点之间基于因子图可以用和积算法高效的求各个变量的边缘分布和积算法是一种通用的消息传递算法只有无向图能转化为因子图答案:D1/1单选题(1分)关于贝叶斯网络,说法错误的是:贝叶斯网络是基于有向无环图来刻画属性之间的依赖关系的一种网络结构贝叶斯网表达了各个节点间的条件独立关系,我们可以直观的从贝叶斯网当中得出属性间的条件独立以及依赖关系结点间的相互独立关系会增加建网过程当中的计算量贝叶斯网可以处理不完整和带有噪声的数据集答案:C1/2判断题(1分)朴素贝叶斯法属于生成模型。答案:√1/1单选题(1分)为什么需要半朴素贝叶斯分类器?后验概率P(c∣x)计算起来比较困难属性条件独立性假设在现实任务中往往很难成立。以上均正确以上均不正确答案:C1/1判断题(1分)Gibbs采样收敛慢。答案:√第七章决策树和随机森林1/1填空题(1分)通常特征选择的准则是____答案::["信息增益"]第八章逻辑斯谛回归与最大熵模型1/1填空题(1分)逻辑斯谛回归模型学习时,对于给定的数据集,一般用哪种方法估计模型参数,从而得到逻辑斯谛回归模型?____答案::["极大似然估计法","极大似然估计","极大似然"]1/1多选题(2分)常用的模型学习的最优化算法有?改进的迭代尺度法梯度下降法牛顿法拟牛顿法答案:ABCD第九章SVM1/2填空题(1分)在线性可分情况下,训练数据集的样本点与分离超平面距离最近的样本点的实例称为____答案::["支持向量"]2/2单选题(1分)线性可分支持向量机:给定线性可分训练数据集,通过间隔()为目标,求解相应的凸二次规划问题,从而学习得到的最优分离超平面,此时解是()的。最大不唯一最大唯一最小唯一最小不唯一答案:B1/1判断题(1分)凸优化的任何局部最优解就是全局最优解。答案:√1/3判断题(1分)线性支持向量机通过软间隔最大化将线性可分问题扩展到线性不可分问题?答案:√2/3判断题(1分)如果超平面参数w和b成比例地改变(超平面没有变),几何间隔会按此比例改变,而函数间隔不会。答案:×3/3单选题(1分)关于支持向量机SVM,说法正确的是:边缘(margin)是决策边界与任意样本之间的平均距离支持向量(supportvector)位于最大边缘超平面附近的点分类间隔为1/||w||,||w||代表向量的模决策边界只会被支持向量影响,跟其他点无关答案:D第十章核方法与非线性SVM1/1判断题(1分)支持向量机是比核方法更为一般的机器学习方法。答案:×1/1填空题(1分)研究无限维线性空间上的泛函数和算子理论,被称为()____答案::["泛函分析"]1/2单选题(1分)SVM的效率依赖于:核函数的选择核参数软间隔参数以上所有答案:D2/2判断题(1分)利用核技巧时,对于给定的核,特征空间和映射函数的取法是唯一的。答案:×1/1单选题(1分)序列最小最优化算法(SMO)的基本思路是:如果所有变量的解都满足此最优化问题的()条件,那么得到解;否则,选择()个变量,固定其他变量,针对其构建一个二次规划问题,称为子问题。KTT,一个KTT,两个KKT,两个KKT,一个答案:C第十一章降维与度量学习1/1单选题(1分)一般KNN最近邻方法在()的情况下效果较好?样本较少但典型性好样本较多但典型性不好样本呈团状分布样本呈链状分布答案:A1/2单选题(1分)下列说法错误的是()在高维情形下,数据样本将变得十分稀疏缓解维数灾难的途径主要有降维和特征选择在不少现实任务中,线性映射就能找到恰当的低维嵌入答案:C2/2多选题(2分)机器学习中做特征选择时,可能用到的方法有()卡方信息增益平均互信息期望交叉熵答案:ABCD1/1多选题(2分)关于主成分分析PCA说法正确的是?我们必须在使用PCA前规范化数据我们应该选择使得模型有最大variance的主成分我们应该选择使得模型有最小variance的主成分我们可以使用PCA在低纬度上做数据可视化答案:ABD第十二章提升方法1/2判断题(1分)多专家组合方法,是一种串行结构,其中下一个分类器只在前一个分类器预测不够准(不够自信)的实例上进行训练或检测。答案:×2/2单选题(1分)数据科学家可能会同时使用多个算法(模型)进行预测,并且最后把这些算法的结果集成起来进行最后的预测(集成学习),以下对集成学习说法正确的是:单个模型之间有高相关性单个模型之间有低相关性在集成学习中使用“平均权重”而不是“投票”会比较好单个模型都是用的一个算法答案:B1/1单选题(1分)对于随机森林和GradientBoostingTrees,下面说法正确的是:在随机森林的单个树中,树和树之间是有依赖的,而GradientBoostingTrees中的单个树之间是没有依赖的.这两个模型都使用随机特征子集,来生成许多单个的树.我们可以并行地生成GradientBoostingTrees单个树,因为它们之间是没有依赖的,GradientBoostingTrees训练模型的表现总是比随机森林好答案:B第十三章EM算法及混合高斯模型1/3判断题(1分)EM算法的优化结果与初始值的选取无关。答案:×2/3单选题(1分)似然函数在EM算法下是()的。单调递增单调递减保持不变不能确定答案:A3/3判断题(1分)EM算法是总会收敛,且能收敛到全局最优解。答案:×第十四章计算学习理论1/1多选题(2分)一个可PAC学习的学习器要满足哪两个条件?学习器必须以任意高的概率输出一个错误率任意低的假设稳定性好学习过程的时间最多以多项式方式增长数据特征比较多且样本数量足够答案:AC1/2单选题(1分)在VC维里,对于一个二分类问题,若示例集D中有3个示例,则赋予标记的可能结果有多少种?2468答案:D2/2单选题(1分)当一个模型的VC维越高,它处理数据时的训练误差和测试误差之间的差距将越大越小没有变化不能确定答案:A第十五章隐马尔可夫模型1/2判断题(1分)隐马尔科夫模型假设隐藏的马尔科夫链在任意时刻t的状态只依赖于其前一时刻的状态,与其他时刻的状态及观测无关,也与时刻t无关。答案:√2/2多选题(2分)隐马尔科夫模型是马尔科夫链的一种,它包含了()序列和()序列。隐含状态随机观测答案:BD1/1判断题(1分)隐马尔科夫模型的学习算法中,如果训练数据除了包含观测序列外还包含状态序列,则该学习算法为非监督学习方法。答案:×1/1判断题(1分)近似算法可以保证预测的状态序列整体是最有可能的状态序列答案:×第十六章条件随机场1/1判断题(1分)隐马尔科夫模型是判别式模型,条件随机场模型是生成式模型。答案:×1/1判断题(1分)隐马尔科夫模型是一个无向概率图模型,条件随机场是一个有向图模型。答案:×1/1多选题(2分)关于马尔科夫随机场,说法正确的是:马尔科夫随机场也被称为马尔科夫网络或者无向图模型与贝叶斯网络一样,马尔可夫网可以视为定义了一系列由图结构确定的独立性假设对于满足马尔科夫随机场的联合概率分布可以通过因子分解的形式求解每个结点表示一个或者一组变量,结点之间的边表示两个变量之间的依赖关系答案:ABCD第十七章概率图模型的学习与推断1/2判断题(1分)概率图模型的学习和推断方法只包括近似推断法。答案:×2/2判断题(1分)概率图模型的精确推断方法适用于任何场景。答案:×1/2单选题(1分)近似推断包括采样和变分两种方法,前者是通过_____进行近似,后者是通过_______进行近似。采样来对目标分布的期望;把多个变量的积的求和问题转换为对部分变量交替进行求积和求和的问题将目标变量的分布分解为更为简单或者结构更好的分布的乘积;采样来对目标分布的期望采样来对目标分布的期望;将目标变量的分布分解为更为简单或者结构更好的分布的乘积样来对目标分布的期望;把多个变量的积的求和问题转换为对部分变量交替进行求积和求和的问题;答案:C2/2判断题(1分)变分推断是通过使用已知简单分布来逼近需推断的复杂分布,并通过限制近似分布的类型,从而得到一种全局最优、但具有确定解的近似后验分布。答案:×第十八章神经网络和深度学习1/1单选题(1分)梯度下降算法的正确步骤是.a、计算预
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 产业链重组与技术创新-洞察及研究
- 2024小学英语词汇表及记忆方法指导
- 体育实践课教案与教学评估表模板
- 黄南市重点中学2026届九上物理期中联考模拟试题含解析
- 陕西省宝鸡市扶风县2026届物理九上期末监测模拟试题含解析
- 智能制造车间设备维护工作手册
- 黑龙江大庆市三站中学2026届九上物理期中监测试题含解析
- 重庆市七中学2026届八年级物理第一学期期末复习检测模拟试题含解析
- 2026届浙江省宁波市慈溪市物理九年级第一学期期末学业质量监测模拟试题含解析
- 建筑新框架结构施工技术说明
- 2025江苏苏州市高新区基层公共服务岗位招聘高校毕业生30人考试参考题库及答案解析
- 山西三晋卓越联盟2025-2026高三10月质量检测(26-X-028C)英语(B)
- 中考英语阅读理解专项训练试卷
- DB31T 1605-2025电动自行车充换电柜建设和消防安全管理要求
- 地质灾害知识培训会
- GB/T 24460-2025太阳能光伏照明装置总技术规范
- 视力障碍概述
- 384安全标准培训课件
- 中国邮政集团2025湖南省秋招笔试综合知识题专练含答案
- 土地复垦方案(3篇)
- 2025江苏苏州常熟市基层公共服务岗位招聘高校毕业生考试模拟试题及答案解析
评论
0/150
提交评论