人工智能机器学习技术练习(习题卷8)_第1页
人工智能机器学习技术练习(习题卷8)_第2页
人工智能机器学习技术练习(习题卷8)_第3页
人工智能机器学习技术练习(习题卷8)_第4页
人工智能机器学习技术练习(习题卷8)_第5页
已阅读5页,还剩56页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

试卷科目:人工智能机器学习技术练习人工智能机器学习技术练习(习题卷8)PAGE"pagenumber"pagenumber/SECTIONPAGES"numberofpages"numberofpages人工智能机器学习技术练习第1部分:单项选择题,共155题,每题只有一个正确答案,多选或少选均不得分。[单选题]1.以下哪项是解决NLP用例(如语义相似性、阅读理解和常识推理)的更好选择?A)ELMoB)OpenAI?sGPTC)ULMFit答案:B解析:[单选题]2.SVM在下列那种情况下表现糟糕A)线性可分数据B)清洗过的数据C)含噪声数据与重叠数据点答案:C解析:当数据中含有噪声数据与重叠的点时,要画出干净利落且无误分类的超平面很难[单选题]3.关于梯度提升树,说法正确的是()A)梯度提升树中样本的权重是不等的B)梯度提升树只需构建一棵树C)梯度提升树回归可以跨越训练集中label的值范围答案:A解析:[单选题]4.对于随机森林和GradientBoostingTrees,下面说法正确的是:A)在随机森林的单个树中,树和树之间是有依赖的,而GradientBoostingTrees中的单个树之间是没有依赖的.B)这两个模型都使用随机特征子集,来生成许多单个的树.C)我们可以并行地生成GradientBoostingTrees单个树,因为它们之间是没有依赖的,GradientBoostingTrees训练模型的表现总是比随机森林好答案:B解析:随机森林是基于bagging的,而GradientBoostingtrees是基于boosting的,所有说反了,在随机森林的单个树中,树和树之间是没有依赖的,而GradientBoostingTrees中的单个树之间是有依赖关系.这两个模型都使用随机特征子集,来生成许多单个的树.[单选题]5.在回归模型中,下列哪一项在权衡欠拟合(under-fitting)和过拟合(over-fitting)中影响最大?A)多项式阶数B)更新权重w时,使用的是矩阵求逆还是梯度下降C)使用常数项答案:A解析:选择合适的多项式阶数非常重要。如果阶数过大,模型就会更加复杂,容易发生过拟合;如果阶数较小,模型就会过于简单,容易发生欠拟合。[单选题]6.先对数据集进行特征选择,然后再训练学习器,特征选择过程与后续学习器无关,这相当于先用特征选择对初始特征进行(__)。A)排序B)过滤C)搜索D)查找答案:B解析:[单选题]7.(__)在训练的每一轮都要检查当前生成的基学习器是否满足基本条件。A)支持向量机B)Boosting算法C)贝叶斯分类器D)神经网络答案:B解析:[单选题]8.下面不属于数据归约方法有(__)。A)维归约B)度归约C)值归约D)数据压缩答案:B解析:[单选题]9.下列方法中没有考虑先验分布的是()A)最大后验估计B)贝叶斯分类器C)贝叶斯学习D)最大似然估计答案:D解析:[单选题]10.下面哪个端口不是spark自带服务的端口()。A)8080B)4040C)8090D)18080答案:C解析:[单选题]11.图片是训练数据集(样本非常少)的快照(属性x、y分别用?+?和?o?表示),设定kNN的k=1,那么留一法交叉验证的误差是A)0%B)100%C)0到100%D)以上均不正确答案:B解析:留一交叉验证法中,如果有N个样本数据。将每个样本单独作为测试集,其余N-1个样本作为训练集,这样得到了N个模型,用这N个模型的分类准确率的平均数作为此分类器的性能指标。因此每一个模型都是用几乎所有的样本来训练得到最接近样本,这样评估所得的结果没有随机因素,所以答案选择B。[单选题]12.核矩阵是()的。A)没有规律B)半正定C)正定D)样本矩阵答案:B解析:只要一个对称函数所对应的核矩阵半正定,它就能作为核函数使用。[单选题]13.下列哪个语句在Python中是非法的是()。A)x=y=z=1B)x,y=y,xC)x=(y=z+1)D)x+=y答案:C解析:[单选题]14.‍以下关于训练集、验证集和测试集说法不正确的是()。A)验证集用于调整模型参数B)测试集是纯粹是用于测试模型泛化能力C)以上说法都不对D)训练集是用来训练以及评估模型性能答案:D解析:[单选题]15.在马尔科夫随机场中,(__)个变量之间的联合概率分布能基于团分解为多个因子的乘积。A)2B)3C)4D)多答案:D解析:[单选题]16.ZooKeeper的核心是()。A)原子广播B)watchesC)ACLD)Znode答案:A解析:[单选题]17.(__)是指捕获人们的生活、业务或社会活动,并将其转换为数据的过程。A)数据化B)数据可视化C)数据存储D)数据加工答案:A解析:[单选题]18.下图是两个不同β0、β1对应的逻辑回归模型(绿色和黑色):关于两个逻辑回归模型中的β0、β1值,下列说法正确的是?注意:y=β0+β1*x,β0是截距,β1是权重系数。A)绿色模型的β1比黑色模型的β1大B)绿色模型的β1比黑色模型的β1小C)两个模型的β1相同D)以上说法都不对答案:B解析:逻辑回归模型最终还要经过Sigmoid非线性函数,Sigmoid是增函数,其图形与上图中的黑色模型相近。黑色模型是增函数,说明其β1>0,绿色模型是减函数,说明其β1<0。所以,得出结论:绿色模型的β1比黑色模型的β1小。[单选题]19.一阶规则的基本成分是A)原子命题B)谓词C)量词D)原子公式答案:D解析:[单选题]20.回归任务最常使用的性能度量是__。A)精度B)ROCC)MSED)AUC答案:C解析:[单选题]21.下列表示Pandas类别统计函数的是()。A)value_Counts()B)Value_Counts()C)values_counts()D)value_counts()答案:D解析:[单选题]22.已知中国人的血型分布约为A型:30%,B型:20%,O型:40%,AB型:10%,则任选一批中国人作为用户调研对象,希望他们中至少有一个是B型血的可能性不低于90%,那么最少需要选多少人?A)7B)9C)11D)13答案:C解析:[单选题]23.最早是Cloudera提供的日志收集系统,目前是Apache下的一个孵化项目,支持在日志系统中定制各类数据发送方,用于收集数据的工具是()A)FlumeB)ZookeeperC)StormD)Sparkstreaming答案:A解析:[单选题]24.用OpenCV读取图像所需要的函数是()。A)cv.imshow()B)cv.inread()C)cv.imwrite()D)cv.imread()答案:D解析:[单选题]25.Logit函数(给定为l(x))是几率函数的对数。域x=[0,1]中logit函数的范围是多少?A)(-∞,∞)B)(0,1)C)(0,∞)D)(-∞,0)答案:A解析:为了与目标相适应,几率函数具有将值从0到1的概率函数变换成值在0和∞之间的等效函数的优点。当我们采用几率函数的自然对数时,我们便能范围是-∞到∞的值。这里给出Logit函数的图像(来自维基百科):alt=""class="fr-ficfr-dii">[单选题]26.以下剪枝算法中性能最好的是A)REPB)IREPC)RIPPERD)CN2答案:C解析:[单选题]27.对于一个给定的token,其输入表示为它的token嵌入、段嵌入(SegmentEmbedding)、位置嵌入(PositionEmbedding)的总和A)ELMoB)GPTC)BERTD)ULMFit答案:C解析:[单选题]28.下面不属于数据加工的有(__)。A)数据脱敏B)数据脱质C)数据规约D)数据标注答案:B解析:[单选题]29.精确推断的实质是一类()规划算法,它利用图模型所描述的条件独立性来削减计算目标概率值所需的计算量。A)静态B)动态C)伪静态D)一阶答案:B解析:[单选题]30.有关决策树的说法哪个是错误的()A)可以转化为决策规则B)对新样本起到分类预测的作用C)决策树的深度越大越好D)决策树的算法和神经网络的原理不一样答案:C解析:[单选题]31.从一个初始策略出发,不断迭代进行策略评估和改进,直到策略收敛、不再改变为止,这样的作法称为A)策略迭代B)值迭代C)策略改进D)最优值函数答案:A解析:[单选题]32.Stage的Task的数量由什么决定()。A)PartitionB)JobC)StageD)TaskScheduler答案:A解析:[单选题]33.下列不属于Spark中driver的作用的是()A)执行main方法B)把用户程序转化为taskC)协调任务的调度D)负责运行组成Spark应用的任务答案:D解析:[单选题]34.关于L1、L2正则化,下列说法正确的是()。A)L2正则化能防止过拟合,提升模型的泛化能力,但L1做不到这点B)L2正则化技术又称为LassoRegularizationC)L1正则化得到的解更加稀疏D)L2正则化得到的解更加稀疏答案:C解析:L1正则化可以产生稀疏权值矩阵,即产生一个稀疏模型,可以用于特征选择;L2正则化可以防止模型过拟合,一定程度上L1也可以防止过拟合,L1正则化又称LassoRegression。[单选题]35.关于维数灾难说法错误的是?A)高维度数据可使得算法泛华能力变得越来越弱B)降低高维度数据会对数据有所损伤C)高维度数据增加了运算难度D)高维度数据难以可视化答案:A解析:[单选题]36.在目标识别中,假定类型1为敌方目标,类型2为诱饵(假目标),已知先验概率P(1)=0.2和P(2)=0.8,类概率密度函数如下:则总错误概率为P(e)为class="fr-ficfr-dibcursor-hover"A)0.08B)0.09C)0.11D)0.1答案:A解析:[单选题]37.线性判别分析设法将样例投影到__直线上,使得同类样例的投影点尽可能__。A)一条;接近B)两条;接近C)一条;远离D)两条;原理答案:A解析:[单选题]38.NaveBayes是一种特殊的Bayes分类器,特征变量是X,类别标签是C,它的一个假定是:()A)各类别的先验概率P(C)是相等的B)以0为均值,sqr(2)/2为标准差的正态分布C)特征变量X的各个维度是类别条件独立随机变量D)P(X|C)是高斯分布答案:C解析:[单选题]39.大数据的4V特性不包括A)Volume(大量)B)Velocity(高速)C)Visual(可视)D)Variety(多样)答案:C解析:[单选题]40.下列时间序列模型中,哪一个模型可以较好地拟合波动性的分析和预测A)AR模型B)MA模型C)ARMA模型D)GARCH模型答案:D解析:[单选题]41.()在训练的每一轮都要检查当前生成的基学习器是否满足基本条件。A)支持向量机B)Boosting算法C)贝叶斯分类器D)Bagging算法答案:B解析:[单选题]42.为了观察测试Y与X之间的线性关系,若X是连续变量,则使用()比较适合。A)散点图B)柱形图C)直方图D)以上答案都不正确答案:A解析:散点图反映了两个变量之间的相互关系,在测试Y与X之间的线性关系时,使用散点图最为直观。[单选题]43.如下表是用户是否使用某产品的调查结果()请计算年龄、地区、学历、收入中对用户是否使用调查产品信息增益最大的属性。alt="">A)年龄B)地区C)学历D)收入答案:C解析:alt=""class="fr-ficfr-dii">[单选题]44.(__)是神经网络的基本单位。A)神经系统B)神经网络C)神经元D)感知机答案:C解析:[单选题]45.对应GradientBoostingtree算法,以下说法正确的是:A)2和4B)2和3C)1和3D)1和4答案:C解析:最小样本分裂个数是用来控制?过拟合?参数。太高的值会导致?欠拟合?,这个参数应该用交叉验证来调节。第二点是靠bias和variance概念的。[单选题]46.下面列出特征选择算法中,不属于启发式搜索的有()A)分支限界搜索B)序列前向选择搜索C)增L去R搜索D)序列浮动选择搜索答案:A解析:[单选题]47.(__)是事先将训练样本存储下来,然后每当遇到一个新增样本,学习系统分析此样本与以前存储样本之间的关系,并据此把一个目标函数值赋给新增样本。A)基于实例学习B)遗传算法C)人工神经网络D)归纳学习答案:A解析:[单选题]48.找出其中的异类A)nltkB)scikitlearnC)SpaCyD)BERT答案:D解析:[单选题]49.下面不属于云计算技术的有(__)。A)HadoopB)SparkC)YARND)集中式计算答案:D解析:[单选题]50.神经网络是由()演化而来。[]*A)符号主义B)认知主义C)联结主义D)行为主义答案:C解析:[单选题]51.散点图矩阵通过()坐标系中的一组点来展示变量之间的关系。A)一维B)二维C)三维D)多维答案:B解析:[单选题]52.有如下两组数据{(-1,0),(-1,2),(1,2)}{(0,0),(1,0),(1,1)}我们在该数据集上训练一个线性SVM模型,该模型中的支持向量是哪些?A)(−1,2),(1,1),(1,0)B)(−1,0),(−1,2),(1,1),(1,0)C)(−1,0),(1,2),(0,0),(1,1)D)(−1,0),(-1,2),(0,0),(1,0)答案:C解析:[单选题]53.真负率是指(__)。A)正样本预测结果数/正样本实际数B)被预测为负的正样本结果数/正样本实际数C)被预测为正的负样本结果数/负样本实际数D)负样本预测结果数/负样本实际数答案:D解析:[单选题]54.下面关于支持向量机(SVM)的描述错误的是()?A)是一种监督式学习的方法B)可用于多分类的问题C)是一种生成式模型D)支持非线性的核函数答案:C解析:[单选题]55.下面不属于NoSQL的有(__)。A)ORACLEB)RedislabsC)couchbaseD)paradigm4答案:D解析:[单选题]56.(__)是指在对数据进行正式计算之前,根据后续数据计算的需求对原始数据进行审计、清洗、变换、集成等一系列处理活动。A)数据加工B)数据预处理C)数据清洗D)数据挖掘答案:A解析:[单选题]57.下面关于机器学习相关描述不正确的有(__)。A)机器学习的主要议题是如何实现和优化机器的自我学习B)机器学习的基本思路是以训练集为输入,通过机器学习算法让机器学习到能够处理更多数据的能力C)AlphaGo的核心技术是深度学习与增强学习D)机器学习的只能是预定义的答案:D解析:[单选题]58.GRAY灰度图像的通道数为()。A)0B)1C)2D)3答案:B解析:[单选题]59.接受者操作特征曲线简称(__)。A)双曲线B)ROC曲线C)科克曲线D)共轭曲线答案:B解析:[单选题]60.下列方法中,用于获取当前目录的是()。A)openB)writeC)getcwdD)readmulu答案:A解析:[单选题]61.在数据清理中,下面哪个不是处理缺失值的方法()A)估算B)整例删除C)变量删除D)成对删除答案:D解析:[单选题]62.根据边的性质不同,概率图模型可大致分为两类:第一类是使用有向无环图表示变量间的依赖关系,称为();第二类是使用无向图表示变量间的相关关系,称为无向图模型或马尔可夫网(Markovnetwork)。A)贝叶斯网B)拉普拉斯网C)帕斯卡网D)塞缪尔网答案:A解析:[单选题]63.如果使用线性回归模型,下列说法正确的是?A)检查异常值是很重要的,因为线性回归对离群效应很敏感B)线性回归分析要求所有变量特征都必须具有正态分布C)线性回归假设数据中基本没有多重共线性D)以上说法都不对答案:A解析:本题考查的是线性回归的一些基本原理。异常值是数据中的一个非常有影响的点,它可以改变最终回归线的斜率。因此,去除或处理异常值在回归分析中一直是很重要的。了解变量特征的分布是有用的。类似于正态分布的变量特征对提升模型性能很有帮助。例如,数据预处理的时候经常做的一件事就是将数据特征归一化到(0,1)分布。但这也不是必须的。当模型包含相互关联的多个特征时,会发生多重共线性。因此,线性回归中变量特征应该尽量减少冗余性。C选择绝对化了。[单选题]64.在测试一假设h时,发现在一包含n=1000个随机抽取样例的样本s上,它出现r=300个错误,计算Errors(h)的标准差()A)0.0145B)0.145C)1.45D)14.5答案:A解析:[单选题]65.(__)是在不影响数据完整性和数据分析结果准确性的前提下,通过减少数据规模的方式减少数据量,进而提升数据分析的效果与效率。A)数据缩减B)数据加工C)数据清洗D)数据归约答案:D解析:[单选题]66.一个包里有5个黑球,10个红球和17个白球。每次可以从中取两个球出来,放置在外面。那么至少取________次以后,一定出现过取出一对颜色一样的球。A)16B)9C)4D)1答案:A解析:[单选题]67.在支持向量机中,?间隔?是指(__)。A)非支持向量到划分超平面间的距离之和B)支持向量之间的距离C)支持向量和非支持向量之间的距离D)支持向量到超平面的距离之和答案:D解析:[单选题]68.对分类任务来说,学习器从类别标记集合中预测出一个标记,最常见的结合策略是(__)。A)投票法B)平均法C)学习法D)排序法答案:A解析:[单选题]69.混淆矩阵中的TP=16,FP=12,FN=8,TN=4,准确率是A)四分之一B)二分之一C)七分之四D)三分之二答案:B解析:[单选题]70.点击率的预测是一个数据比例不平衡问题(如训练集中样本呈阴性的比例为99%,阳性的比例是1%),如果我们用这种数据建立模型并使得训练集的准确率高达99%。我们可以得出结论是()。A)模型的准确率非常高,我们不需要进一步探索B)模型不好,我们应建一个更好的模型C)无法评价模型D)以上答案都不正确答案:C解析:对于失衡数据,模型的准确率不能作为衡量模型效果的标准。因为我们需要探索的是少数1%的数据,为更好地评估模型效果,可以用灵敏度、特异度、F-measure来判断。[单选题]71.(__)也称为?基于密度的聚类?A)原型聚类B)密度聚类C)层次聚类D)AGNES答案:B解析:[单选题]72.测试集应尽可能与训练集__。A)相容B)相等C)互斥D)包含答案:C解析:[单选题]73.事件A在另外一个事件B已经发生条件下的发生概率,称为(__)。A)先验概率B)后验概率C)条件概率D)统计概率答案:C解析:[单选题]74.(__)不是常用的噪声处理方法。A)聚类B)回归C)分类D)分箱答案:C解析:[单选题]75.在LogisticRegression中,如果同时加入L1和L2范数,会产生什么效果()A)可以做特征选择,并在一定程度上防止过拟合B)能解决维度灾难问题C)能加快计算速度D)可以获得更准确的结果答案:A解析:[单选题]76.以下描述中,属于决策树策略的是()A)最优投影方向B)梯度下降方法C)最大特征值D)最大信息增益答案:D解析:[单选题]77.()情况下,LDA会失败。A)如果有辨识性的信息不是平均值,而是数据的方差B)如果有辨识性的信息是平均值,而不是数据方差C)如果有辨识性的信息是数据的均值和方差D)以上答案都不正确答案:A解析:LDA的思想是投影后类内方差最小、类间方差最大。[单选题]78.词袋模型是在自然语言处理和信息检索中的一种简单假设。在这种模型中,文本(段落或者文档)被看作是()的词汇集合,忽略语法甚至是单词的顺序。A)无序B)有序C)无意义D)规范答案:A解析:[单选题]79.下列关于DataFrame说法正确的是()。A)DataFrame结构是由索引和数据组成B)DataFrame的行索引位于最右侧C)创建一个DataFrame对象时需要指定索引D)DataFrame每列的数据类型必须是相同的答案:C解析:[单选题]80.逻辑回归的以下模型:P(y=1|x,w)=g(w0+w1x)其中g(z)是逻辑函数。在上述等式中,通过改变参数w可以得到的P(y=1|x;w)被视为x的函数。在上面的问题中,你认为哪个函数会产生(0,1)之间的p?A)逻辑函数B)对数似然函数C)两者的复合函数D)都不会答案:A解析:对于从-∞到+∞的实数范围内的x的值。逻辑函数将给出(0,1)的输出。[单选题]81.当训练样本数量趋向于无穷大时,在该数据集上训练的模型变化趋势,对于其描述正确的是()A)偏差(bias)变小B)偏差变大C)偏差不变D)不变答案:C解析:偏差大是欠拟合,方差大是过拟合。增大样本数量会降低方差,和偏差没关系。[单选题]82.根据边的性质不同,概率图模型可大致分为两类:第一类是使用有向无环图表示变量间的依赖关系,称为有向图模型或贝叶斯网(Bayesiannetwork);第二类是使用无向图表示变量间的相关关系,称为()。A)赫布网B)拉普拉斯网C)马尔科夫网D)塞缪尔网答案:C解析:[单选题]83.下列不属于大数据4V特性的是().A)大量B)多样C)高速D)快捷答案:D解析:[单选题]84.下面关于Adaboost算法的描述中,错误的是()A)是弱分类器的线性组合B)提升树是以分类树或者回归树为基本分类器的提升办法C)该算法实际上是前向分步算法的一个实现,在这个方法里,模型是加法模型,损失函数是指数损失,算法是前向分步算法。D)同时独立地学习多个弱分类器答案:D解析:[单选题]85.在利用矢量形式的图像数据文件中?A)图像的分辨率与数据文件的大小成正比;B)如果显示其中的图像会有方块;?C)图形由空间分布的像素的集合来表示;D)不仅有数据还有命令;答案:D解析:[单选题]86.下列代码实现的功能是:>>>fromsklearn.naive_bayesimportGaussianNB>>>gnb=GaussianNB()>>>y_pred=gnb.fit(iris.data,iris.target).predict(iris.data)A)创建高斯朴素贝叶斯模型并对模型进行训练B)创建高斯朴素贝叶斯模型并对模型进行预测C)创建高斯朴素贝叶斯模型并对模型进行训练和预测D)创建高斯朴素贝叶斯模型并对模型进行训练和评测答案:C解析:[单选题]87.循环神经网络适合处理什么数据。()A)节点数据B)序列数据C)结构化数据D)图像数据答案:B解析:[单选题]88.在CTR(点击率预测)中,对于一个特定商品,一个用户可以根据过往的点击商品等信息被归为两类【会点击】和【不会点击】。CTR问题适合用()方法来解决A)分类B)回归C)聚类D)以上都不是答案:A解析:[单选题]89.Hadoop-2.6.5集群中的HDFS的默认的副本块的个数是?A)1B)2C)3D)4答案:B解析:[单选题]90.()是一个观测值,它与其他观测值的差别很大,以至于我们怀疑它是由不同的机制产生的。A)边缘点B)质心C)离群点D)核点答案:C解析:[单选题]91.设线性规划的约束条件为:则基本可行解为()A)(0,0,4,3)B)(3,4,0,0)C)(2,0,1,0)D)(3,0,4,0)答案:C解析:[单选题]92.在Matplotlib中设置x轴的标签的函数是()。A)xlabelsB)xticksC)xlabelD)Xtick答案:C解析:[单选题]93.集成学习中,每个基分类器的正确率的最低要求()A)50%以上B)60%以上C)70%以上D)80%以上答案:A解析:[单选题]94.一位母亲记录了儿子3~9岁的身高,由此建立的身高与年龄的回归直线方程为y=7.19x+73.93,据此可以预测这个孩子10岁时的身高,则正确的叙述是()A)身高一定是145.83cmB)身高超过146.00cmC)身高低于145.00cmD)身高在145.83cm左右答案:D解析:[单选题]95.一幅数字图像是()A)一个观测系统B)一个有许多像素排列而成的实体C)一个2-D数组中的元素D)一个3-D空间的场景答案:B解析:[单选题]96.Transformer架构首先是由下列哪项引入的?A)GloVeB)BERTC)OpenAI?sGPTD)ULMFit答案:C解析:[单选题]97.为数据的总体分布建模;把多维空间划分成组等问题属于数据挖掘的哪一类任务?A)探索性数据分析B)建模描述C)预测建模D)寻找模式和规则答案:B解析:[单选题]98.假设某商品需求函数为y1=B0+B1x1+u,为了考虑包装外观因素(黑,蓝,白,金四种不同的颜色),引入4个虚拟变量形式形成截距变动模型,则模型的参数估计量()A)是有偏估计量B)是非有效估计量C)是非一致估计量D)无法估计答案:D解析:[单选题]99.关于Anconda组件的说法中,下列描述错误的是()。A)AnacondaPrompt是Anaconda自带的命令行B)JupyterNotebook是基于客户端的交互式计算环境,可以编辑易于人们阅读的文档,用于展示数据分析的过程C)Spyder是一个使用Python语言、跨平台的、科学运算集成开发环境D)AnacondaNavigator是用于管理工具包和环境的图形用户界面,后续涉及的众多管理命令也可以在Navigator中手动实现JupyterNotebook是基于Web的交互式计算环境,可以编辑易于人们阅读的文档,用于展示数据分析的过程答案:B解析:[单选题]100.一个输入为(32,32,3)的数据集,通过一个卷积核个数为8,大小为5*5,步长为1的卷积层,输出()。A)(28,28,8)B)(27,27,8)C)(28,28,3)D)(27,27,3)答案:A解析:[单选题]101.以下对字典的说法错误的是()。A)字典可以为空B)字典的键不能相同C)字典的键不可变D)字典的键的值不可变答案:D解析:[单选题]102.关于数据规范化,下列说法中错误的是()。A)标准化实际上是将数据在样本的标准差上做了等比例的缩放操作B)归一化利用了样本中的最大值和最小值C)包含标准化和归一化D)标准化在任何场景下受异常值的影响都很小答案:D解析:[单选题]103.假设我们使用kNN训练模型,其中训练数据具有较少的观测数据(下图是两个属性x、y和两个标记为?+?和?o?的训练数据)。现在令k=1,则图中的Leave-One-Out交叉验证错误率是多少?A)0%B)20%C)50%D)100%答案:D解析:本题考查的是kNN算法和Leave-One-Out交叉验证。KNN算法是标记类算法,取当前实例最近邻的k个样本,k个样本中所属的最多类别即判定为该实例的类别。本题中k=1,则只需要看最近邻的那一个样本属于?+?还是?o?即可。Leave-One-Out交叉验证是一种用来训练和测试分类器的方法,假定数据集有N个样本,将这个样本分为两份,第一份N-1个样本用来训练分类器,另一份1个样本用来测试,如此迭代N次,所有的样本里所有对象都经历了测试和训练。分别对这10个点进行观察可以发现,每个实例点最近邻的都不是当前实例所属的类别,因此每次验证都是错误的。整体的错误率即为100%。[单选题]104.机器学习模型包括四个组成部分,不包含(A)模型结构B)知识库C)学习单元D)执行单元答案:A解析:[单选题]105.以下哪项方法不属于汉语分词方法?()A)双向扫描法B)正向最大匹配法C)逐词遍历法D)词向量匹配法答案:D解析:[单选题]106.ResNet-50有多少个卷积层?()A)48B)49C)50D)51答案:B解析:[单选题]107.归纳推理是()推理A)从一般到个别B)从个别到一般C)从个别到个别D)从一般到一般答案:B解析:[单选题]108.在给定文件中查找与设定条件相符字符串的命令A)gzipB)grepC)lsD)find答案:B解析:[单选题]109.关于贝叶斯网描述错误的是A)也称为信念网;B)借助有向无环图刻画属性之间的关系;C)借助无向无环图刻画属性之间的关系;D)用条件概率表来描述属性的联合概率分布;答案:C解析:[单选题]110.假设你需要调整参数来最小化代价函数(costfunction),会使用()技术。A)穷举搜索B)随机搜索C)Bayesian优化D)以上全是答案:D解析:[单选题]111.下列有关SVM和LR说法不正确的是()A)SVM是分类模型,LR是回归模型B)SVM和LR都是分类模型C)SVM是判别式模型D)LR判别式模型答案:A解析:[单选题]112.(__)是一种著名的过滤式特征选择方法。A)k-meansB)k近邻C)支持向量机D)Relief答案:D解析:[单选题]113.假负率是指(__)。A)正样本预测结果数/正样本实际数B)被预测为负的正样本结果数/正样本实际数C)被预测为正的负样本结果数/负样本实际数D)负样本预测结果数/负样本实际数答案:B解析:[单选题]114.支持向量(supportvectors)指的是()A)对原始数据进行采样得到的样本点B)决定分类面可以平移的范围的数据点C)位于分类面上的点D)能够被正确分类的数据点答案:B解析:[单选题]115.下面关于基础理论相关描述正确的有(__)。A)基础理论等于理论基础B)基础理论在数据科学研究边界之外C)理论基础在数据科学研究边界之内D)基础理论包含理念、理论、方法、技术等答案:D解析:[单选题]116.简单地将数据对象集划分成不重叠的子集,使得每个数据对象恰好在一个子集中,这种聚类方法称作()。A)层次聚类B)划分聚类C)非互斥聚类D)模糊聚类答案:B解析:[单选题]117.下列哪个算法可以用于特征选择A)朴素贝叶斯B)感知器C)支持向量机D)决策树答案:D解析:[单选题]118.长短时记忆神经网络通过什么来缓解梯度消失问题?()A)增加网络深度B)减少网络神经元C)使用双向的网络结构D)增加一个用来保存长期状态的单元答案:D解析:[单选题]119.以下关于感知器说法错误的是:()A)感知器中的偏置只改变决策边界的位置B)可为感知器的输出值设置阈值使其用于处理分类问题C)单层感知器可以用于处理非线性学习问题D)感知器是最简单的前馈式人工神经网络答案:C解析:[单选题]120.关于梯度下降算法,正确的说法是:A)小批量梯度下降同时具备批量梯度下降和随机梯度下降二者的优缺点。B)相对随机梯度下降算法,批量梯度下降运行速度很快C)相对随机梯度下降算法,批量梯度下降的一个优势是:当损失函数很不规则时(存在多个局部最小值),它更有可能跳过局部最小值,最终接近全局最小值。D)随机梯度下降同时具备批量梯度下降和小批量梯度下降二者的优缺点。答案:A解析:[单选题]121.当k=5时,使用k近邻算法判断下图中的绿色方框属于()A)圆形B)三角形C)长方形D)以上都不是答案:A解析:[单选题]122.线性SVM和一般线性分类器的区别主要是()A)是否进行了空间映射B)是否确保间隔最大化C)是否能处理线性不可分问题D)训练误差通常较低答案:A解析:[单选题]123.假设下图是K-means算法的聚类结果,那么K的值为()A)1B)2C)3D)4答案:C解析:[单选题]124.以下关于Sigmoid的特点说法错误的是()。A)Sigmoid函数计算量小B)趋向无穷的地方,函数变化很小,容易出现梯度消失的现象C)可以将函数值的范围压缩到[0,1]D)函数处处连续答案:A解析:[单选题]125.已知:(1)大脑是有很多个叫做神经元的东西构成,神经网络是对大脑的简单的数学表达。(2)每一个神经元都有输入、处理函数和输出。(3)神经元组合起来形成了网络,可以拟合任何函数。(4)为了得到最佳的神经网络,我们用梯度下降方法不断更新模型。给定上述关于神经网络的描述,什么情况下神经网络模型被称为深度学习模型?A)加入更多层,使神经网络的深度增加B)有维度更高的数据C)当这是一个图形识别的问题时D)以上都不正确答案:A解析:[单选题]126.以下对信息描述不正确的是()。A)信息与能源、材料属于同一层次的概念B)信息是客观的存在C)信息是人类社会赖以生存和发展的三大资源之一D)信息是对数据进行计量形成的记录答案:D解析:[单选题]127.有关数据仓库的开发特点,不正确的描述是A)数据仓库开发要从数据出发B)数据仓库使用的需求在开发出去就要明确C)数据仓库的开发是一个不断循环的过程,是启发式的开发D)在数据仓库环境中,并不存在操作型环境中所固定的和较确切的处理流,数据仓库中数据分析和处理更灵活,且没有固定的模式答案:A解析:[单选题]128.Relief属于哪种特征选择方法A)包裹式B)启发式C)嵌入式D)过滤式答案:D解析:[单选题]129.下列关于数组运算的描述错误的是()。A)在NumPy中,大小相等的数组之间的任何计算都会应用到元素级B)广播机制表示对数组进行扩展,使数组的shape属性值一样C)标量运算会产生一个与数组具有相同数量的行和列的新矩阵,其原始矩阵的每个元素都被相加、相减、相乘或者相除D)数组不支持算术运算符与标量之间的运算答案:D解析:数组支持算术运算符与标量之间的运算[单选题]130.下面有关可视化原理的说法,错误的是哪个()。A)可视化主要是为满足人类决策者对视觉信息的敏感性B)可视化分析的方法论基础是视觉隐喻,可以对数据进行一定的抽象表示C)高维数据可视化需要对数据进行变换,抽取有效特征,从而降低维度D)饼图可分析数据变化的趋势答案:D解析:[单选题]131.维纳滤波器的作用通常是()。A)去噪B)减小图像动态范围C)复原图像D)图像模糊答案:C解析:[单选题]132.hive的元数据存储在derby和mysql中有什么区别()。A)没区别B)多会话C)支持网络环境D)数据库的区别答案:B解析:[单选题]133.Relief的扩展变体Relief-F能够处理(__)问题。A)二分类B)多分类C)回归D)降维答案:B解析:[单选题]134.在逻辑回归输出与目标对比的情况下,以下评估指标中()不适用。A)AUC-ROCB)准确度C)LoglossD)均方误差答案:D解析:LogisticRegression是一个分类算法,所以它的输出不能是实时值,所以均方误差不能用于评估它。[单选题]135.最早被提出的循环神经网络门控算法是什么。()A)长短期记忆网络B)门控循环单元网络C)堆叠循环神经网络D)双向循环神经网络答案:A解析:[单选题]136.感知机描述错误的是:-P99A)感知机根据正确的程度进行权重调整;B)输入层接收外界输入信号传递给输出层;C)输出层是M-P神经元;D)感知机能容易实现逻辑与、或、非运算;答案:A解析:[单选题]137.专家系统是以______为基础,推理为核心的系统。A)专家B)软件C)问题D)知识答案:D解析:[单选题]138.‍?没有免费的午餐定理?告诉我们A)我们不能对问题有先验假设B)没有可以适应一切问题的算法C)设计好的算法是徒劳的D)对于一个特定的问题,任何算法都是一样好的答案:B解析:[单选题]139.以下选项中zookeeper的功能正确的是()。A)实现元数据持久化B)存储HA模式下状态信息C)存储namenode生成的editlogD)监控namenode节点的主备状态答案:B解析:[单选题]140.在安装cdh提供的软件的时候,我们应该关注哪一部分,下图给出了一款软件,名字是crunch,这款软件我们没有学过,但是我们通过对cdh的了解,可以知道,我们应该关注的版本号是哪部分():class="fr-ficfr-dibcursor-hover"A)crunch-0.11.0B)cdh5.14.0C)src.tar.gzD)changes.log答案:B解析:[单选题]141.主成分分析的优化目标是一个(__)。A)不含约束条件的二次规划问题B)含有约束条件的二次规划问题C)不含约束条件的线性规划问题D)含有约束条件的线性规划问题答案:B解析:[单选题]142.二项式分布的共轭分布是()A)正态分布B)Dirichlet分布C)Beta分布D)指数分布答案:C解析:[单选题]143.请阅读下列一段程序:Arr=np.arange(12).reshape(3,4)Arr.shape运行上述程序,它最终执行的结果为()。A)3B)4C)(3,4)D)(1,2)答案:C解析:[单选题]144.在使用软间隔支持向量机(SVM)时,对于线性不可分数据集,线性支持向量机对每个样本点引进松弛变量,放宽约束条件。为了使这种放宽适度,需要对每一个进行一个代价为的?惩罚?。关于惩罚系数C,正确的说法有:A)惩罚系数C越小,对于错误分类的惩罚越重B)惩罚系数C越大,对于错误分类的惩罚越重C)惩罚系数C越小越好D)惩罚系数C越大越好答案:B解析:[单选题]145.概率模型的训练过程就是()过程。A)分类B)聚类C)参数估计D)参数选择答案:C解析:[单选题]146.平面上平均每4个单位面积有一个染色点,观察一定面积上的点数X,X近似服从()A)均匀分布B)泊松分布C)二项分布D)正态分布答案:B解析:[单选题]147.决策树的生成是一个__过程。A)聚类B)回归C)递归D)KNN答案:C解析:[单选题]148.考虑如下数据集,其中CustomerID(顾客id),TransactionID(事务id),ItemsBought(购买项)。如果将每个事务id看成一个购物篮,计算项集{e},{b,d},{b,D,e}的支持度:A)s({e})=0.8s({b,d})=0.2s({b,D,e})=0.2B)s({e})=0.7s({b,d})=0.3s({b,D,e})=0.3C)s({e})=0.6s({b,d})=0.4s({b,D,e})=0.3D)s({e})=0.8s({b,d})=0.1s({b,D,e})=0.1答案:A解析:[单选题]149.向量X=[1,2,3,4,-9,0]的L1范数为?A)1B)19C)6D)√111答案:B解析:L0范数表示向量中所有非零元素的个数;L1范数指的是向量中各元素的绝对值之和,又称?稀疏矩阵算子?;L2范数指的是向量中各元素的平方和再求平方根。本例中,L0范数为5,L1范数为19,L2范数为√111。[单选题]150.以下对结构化数据描述不正确的是()。A)结构化数据可以直接用传统关系数据库进行存储B)先有结构,后有数据C)语音数据是结构化数据D)XML不是结构化数据答案:C解析:[单选题]151.假负率是指()。A)正样本预测结果数/正样本实际数B)被预测为负的正样本结果数/正样本实际数C)被预测为正的负样本结果数/负样本实际数D)负样本预测结果数/负样本实际数答案:B解析:[单选题]152.下列关于数据的说法,不正确的是()A)数据的类别有多种多样B)数据库中的一列代表一个特征C)一组数据平均值不会受异常值影响D)数据点之间的距离满足d_ij+d_jk≥d_ik答案:C解析:[单选题]153.以下哪个语句可以实现加载scikit-learn模块的iris数据集:A)iris=datasets.read_iris()B)iris=datasets.load_iris()C)iris=datasets.iris()D)iris=datasets.load.iris()答案:B解析:[单选题]154.给定测试样本,基于某种距离度量找出训练集中与其最靠近的k个训练样本,然后基于这k个样本的信息来进行预测。这种学习算法称为(__)。A)k-meansB)k近邻学习C)随机森林D)决策树答案:B解析:[单选题]155.以下哪个图是KNN算法的训练边界alt="">A)BB)AC)DD)CE)都不是答案:B解析:KNN算法肯定不是线性的边界,所以直的边界就不用考虑了。另外这个算法是看周围最近的k个样本的分类用以确定分类,所以边界一定是坑坑洼洼的。第2部分:多项选择题,共49题,每题至少两个正确答案,多选或少选均不得分。[多选题]156.下列属于无监督学习任务的还有(__)。A)密度估计B)异常检测C)聚类D)分类答案:ABC解析:[多选题]157.关于Zookeeper集群容错性的说法,正确的有()A)3个节点的cluster可以挂掉1个节点B)3个节点的cluster可以挂掉2个节点C)4个节点的cluster可以挂掉2个节点D)2个节点的cluster不能挂掉任何1个节点答案:AD解析:[多选题]158.Zookeeper运行的模式可以为()A)StandAloneB)StooolC)StandUpD)集群模式答案:AD解析:[多选题]159.下列关于嵌入式选择描述错误的是(__)。A)嵌入式选择是将特征选择过程与学习器训练过程融为一体,两者在同一个优化过程中完成B)从最终学习器性能来看,嵌入式特征选择比过滤式特征选择更好C)嵌入式特征选择的计算开销通常比过滤式特征选择大得多D)嵌入式特征选择方法直接针对给定学习器进行优化答案:BCD解析:[多选题]160.数据科学的基本流程包含(__)。A)数据化B)探索性分析C)数据分析D)数据存储答案:ABC解析:[多选题]161.数据科学项目主要涉及的角色有(__)和项目发起人、客户、项目经理。A)数据科学家B)领域专家C)数据工程师D)操作人员答案:ACD解析:[多选题]162.逻辑回归的一般过程是()A)拟合sigmoidfunctionB)某个样本的sigmoidfunction的计算结果看做是这个样本属于类别1的概率C)其它样本的sigmoidfunction的计算结果看做是样本属于类别0的概率D)将sigmoidfunction的计算结果大于等于0.5的归属为类别1,小于0.5的归为类别0答案:ABD解析:[多选题]163.神经网络起源很早,但真正被大规模商用还是在本世纪,你觉得阻碍神经网络在上世纪发展的主要原因是什么()A)理论没有发展起来B)科学界不重视C)计算能力跟不上D)标注数据不足答案:CD解析:[多选题]164.下列关于自助法描述错误的是(__)。A)自助法在数据集较大、难以有效划分训练集或测试集是很有用B)自助法能从初始数据集中产生多个不同的训练集C)自助法产生的数据集没有改变初始数据集的分布D)在初始数据量足够时,留出法和交叉验证法较自助法更为常用答案:AC解析:[多选题]165.现实任务中一般有哪两种策略来产生规则A)随机比对法B)穷尽搜索的序贯覆盖法C)自顶而下的序贯覆盖法D)自底向上的序贯覆盖法答案:CD解析:[多选题]166.影响深度神经网络训练效果的因素有()A)学习率B)训练集规模C)网络深度D)激活函数答案:ABCD解析:[多选题]167.关于ELM神经网络的描述,下列选项中正确的是()A)通过梯度下降法,利用反向传播的方式来进行学习B)是一种泛化的单隐层前馈神经网络C)容易形成局部极小值而得不到全局最优值D)输入层和隐含层之间的权重和隐含层节点的阈值是通过随机初始化得到的答案:BD解析:[多选题]168.根据《促进大数据发展行动纲要》(国发〔2015〕50号),大数据的主要特征包括A)容量大B)类型多C)存取速度快D)价值密度低答案:ABCD解析:[多选题]169.__可以用来判断学习器的性能。A)P-R曲线B)BEPC)F1度量D)Fβ度量答案:ABCD解析:[多选题]170.数据柔术强调的基本问题有(__)。A)设计思维问题B)产品开发要有较高的艺术性C)以目标用户为中心的产品开发D)支持人机交互问题答案:BC解析:[多选题]171.以下能力中,数据工程师需要具备的能力或素质是()。A)数据洞见B)数据的ETL操作C)数据的备份与恢复D)主数据管理及数据集成答案:BCD解析:[多选题]172.假设你有一个非常大的训练集合,如下机器学习算法中,你觉着有哪些是能够使用map-reduce框架并能将训练集划分到多台机器上进行并行训练()A)逻辑斯特回归(LR),以及随机梯度下降(SGD)B)线性回归及批量梯度下降(BGD)C)神经网络及批量梯度下降(BGD)D)针对单条样本进行训练的在线学习答案:BC解析:LR,SVM,NN,KNN,KMeans,DT,NB都可以用mapreduce并行。[多选题]173.交叉验证可用于(__)、(__)和(__)。A)分类B)参数选择C)模型选择D)特征选择答案:BCD解析:[多选题]174.关于贝叶斯网的结构描述正确的为A)有效表达了属性件的条件独立性;B)给定了父结点集;C)同父,顺序和V型结构为主要涉及的技术;D)所有属性之间相互独立;答案:ABC解析:[多选题]175.下列算法属于深度学习的是()A)卷积神经网络B)循环神经网络C)决策树D)受限玻尔兹曼机答案:ABD解析:[多选题]176.下列关于Boosting算法说法正确的是(__)。A)Boosting算法要求基学习器能对特定的数据分布进行学习B)Boosting对无法接受带权样本的基学习算法,可通过重采样法进行处理C)Boosting算法在训练的每一轮都要检查当前生成的基学习器是否满足基本条件D)一旦当前生成的基学习器不满足条件,则当前基学习器被抛弃,且学习过程停止答案:ABCD解析:[多选题]177.zookeeper常用的命令有哪些A)deleteB)getC)setD)Create答案:ABCD解析:[多选题]178.以下属于数据挖掘与分析工具的有()。A)TableauB)PythonC)SPSSD)Alteyx答案:ABCD解析:常用的数据挖掘工具有RapidMiner、IBMSPSSModeler、OracleDataMining、Teradata、Python。常用的数据分析工具有Tableau、Alteyx、R&Python语言、FineReport、PowerBI。[多选题]179.下面关于特征选择和特征提取的描述正确的是()A)Relief算法属于特征提取方法B)特征选择的目标是从原始的d个特征中选择k个特征C)特征提取的目标是根据原始的d个特征的组合形成k个新的特征D)PCA属于特征选择方法答案:BC解析:[多选题]180.下面关于最大熵模型的描述,正确的是()A)思想是在满足一定约束条件下,概率分布的熵最大B)是一种信息论模型C)在已知均值和方差的条件下,最大熵分布是高斯分布D)在已知均值和方差的条件下,最大熵分布是指数分布答案:ABC解析:[多选题]181.如右图所示无向图,它的极大团包括()A){B,C,D}B){A,B}C){A,B,C}D){A,B,C,D}答案:AC解析:[多选题]182.在分析句子结构时,句子的内部组织结构用树来表示,组成的结构具有显著的特点是()A)递归B)中心词C)循环D)修饰语答案:ABD解析:[多选题]183.学习器结合可能从哪些方面带来好处A)统计方面B)计算方面C)表示方面D)预测方面答案:ABC解析:[多选题]184.下列方法中,解决欠拟合的方法有哪些()A)正则化方法B)集成学习方法C)添加新特征D)减少正则化系数答案:BCD解析:[多选题]185.根据学习形式,数据科学中机器学习可分为(__)。A)人工神经网络和增强学习B)基于实例学习C)遗传算法D)贝叶斯学习答案:ABCD解析:[多选题]186.关于线性回归说法不正确的是()A)梯度下降在靠近极大值时速度减慢B)梯度下降学习率a的选择不合适不影响模型结果C)线性回归对异常值非常敏感D)适用于预测目标与特征之间线性关系强的数据集答案:AB解析:[多选题]187.以下不是人工智能深度学习技术先寻找的是()A)概率B)数据C)梯度D)函数答案:ABC解析:[多选题]188.关于决策树的CART分类树构造算法和ID3算法,下列说法正确的是?A)选择切分特征时,ID3算法使用信息熵B)选择切分特征时,CART算法使用基尼指数来度量一个数据集的混乱程度C)选择切分特征时,ID3算法使用基尼指数D)选择切分特征时,CART算法使用信息熵答案:AB解析:[多选题]189.下列属于DBSCAN算法的特点的是(__)。A)对噪音敏感B)能发现任意形状的簇C)对参数的设置敏感D)DBSCAN使用固定的参数识别聚类答案:BCD解析:[多选题]190.影响K-Means聚类算法结果的主要因素有()A)样本顺序B)相似性度量C)初始聚类中心D)样本类别答案:BC解析:[多选题]191.下列关于支持向量的说法错误的是(__)。A)支持向量回归机的支持向量落在它规定的间隔带之内B)支持向量回归机的支持向量落在它规定的间隔带之外C)支持向量回归机的支持向量只占训练集的一部分D)训练集中的全部样本都是支持向量答案:BD解析:[多选题]192.以下关于机器学习的发展历程描述正确的是(___)。A)机器学习是人工智能研究发展到一定阶段的必然产物B)二十世纪五十年代到七十年代出,人工智能研究处于?推理期?C)图灵在1950年关于图灵测试的文章中,就曾提到了机器学习的可能D)人工智能在二十世纪五十到八十年代经历了?推理期?和?知识期?答案:ABCD解析:[多选题]193.逻辑学中,()和()是人类人事世界的两种基本方式A)推导B)演绎C)归纳D)泛化答案:BC解析:[多选题]194.一个交叉验证将数据集分成两个互补的子集,分别是(__)和(__)。A)训练集B)测试集C)子集D)补集答案:AB解析:[多选题]195.随机森林的随机性在于()A)随机样本B)随机特征C)随机特征组合D)随机分裂规则答案:ABCD解析:[多选题]196.图像分割中常使用的领域有()。A)0邻域B)4邻域C)8邻域D)24邻域答案:BC解析:[多选题]197.K近邻算法实现的基本步骤有A)计算距离,并按距离排序B)选取距离最小的K个点C)确定k点中各分类的出现概率D)返回出现概率最高的分类答案:ABCD解析:[多选题]198.根据波士顿郊区房屋信息,预测房屋价格。适合采用的方法有?A)CART回归决策树B)线性回归C)朴素贝叶斯D)CART分类决策树答案:AB解析:[多选题]199.模仿学习包含以下哪两种学习方法A)值函数近似B)直接模仿学习C)逆强化学习D)间接模仿学习答案:BC解析:[多选题]200.下列关于特征选择方法说法正确的是A)过滤式方法先对数据集进行特征选择,然后再训练学习器,特征选择过程与后续学习器无关B)包裹式特征选择直接把最终将要使用的学习器的性能作为特征子集的评价标准C)包裹式特征选择过程中需要多次训练学习器,因此包裹式特征选择的计算开销通常比较大D)嵌入式特征选择是将特征选择过程与学习器训练过程融为一体,两者在同一个优化过程中完成答案:ABCD解析:[多选题]201.以下描述错误的是:A)SVM是这样一个分类器,他寻找具有最小边缘的超平面,因此它也经常被称为最小边缘分类器(minimalmarginclassifier)B)在聚类分析当中,簇内的相似性越大,簇间的差别越大,聚类的效果就越差。C)在决策树中,随着树中结点数变得太大,即使模型的训练误差还在继续减低,但是检验误差开始增大,这是出现了模型拟合不足的问题。D)聚类分析可以看作是一种非监督的分类。答案:ABC解析:[多选题]202.以下属于聚类算法的是:A)K均值B)DBSCANC)AprioriD)朴素贝叶斯答案:AB解析:[多选题]203.关于Word2vec,下列哪些说法是正确的()A)Word2vec是无监督学习B)Word2vec利用当前特征词的上下文信息实现词向量编码,是语言模型的副产品C)Word2vec能够表示词汇之间的语义相关性D)Word2vec没有使用完全的深度神经网络模型E)Word2vec可以采用负采样的方式来节省计算开销答案:ABCDE解析:[多选题]204.下面哪些算法模型可以用来完成命名实体的任务()A)GBDTB)LDAC)HMMD)CRFE)LSTMF)seq2seq答案:CDEF解析:第3部分:判断题,共33题,请判断题目是否正确。[判断题]205.在训练集非常大时,批量梯度下降算法会运行得极慢。随机梯度下降和小批量梯度下降可以解决该问题A)正确B)错误答案:对解析:[判断题]206.一般情形下,后剪枝决策树的欠拟合风险很小,泛化性能往往优于预剪枝决策树。A)正确B)错误答案:对解析:[判断题]207.logistic函数是一种线性函数A)正确B)错误答案:错解析:[判断题]208.CART分类树构造算法在选择切分特征时,选择使得每一个特征条件下基尼指数最大的特征来切分数据形成子集A)正确B)错误答案:错解析:[判断题]209.线性回归是一种有监督机器学习算法,它使用真实的标签进行训练。A)正确B)错误答案:对解析:[判断题]210.已知学得规则:好瓜←(根蒂=蜷缩)⋀(脐部=凹陷)。则被该规则覆盖的样本是好瓜,没被覆盖的不是好瓜。A)正确B)错误答案:错解析:[判断题]211.数据标准化有利于加快模型的收敛速度,提高模型的泛化能力。A)正确B)错误答案:对解析:[判断题]212.集合中的元素没有特定顺序但可以重复。A)正确B)错误答案:错解析:[判断题]213.FOIL不支持函数和逻辑表达式嵌套A)正确B)错误答案:对解析:[判断题]214.朴素贝叶斯做了一个很强的?特征条件独立性假设?把问题简化,即假设的各个特征之间相互独立,一个特征出现的概率不受其他特征的影响。A)正确B)错误答案:对解析:[判断题]215.CART算法处理回归问题时,要求算法输出的是布尔值A)正确B)错误答案:错解析:[判断题]216.Pandas只有Series和DataFrame两种数据结构。A)正确B)错误答案:错解析:Pandas有Series、DataFrame、Panel三种数据结构[判断题]217.对抗神经网络可以通过两个神经网络的博弈,达到更好的学习效果A)正确B)错误答案:对解析:[判断题]218.综合编码长度最短的贝叶斯网就是最小描述长度准则A)正确;B)错误;答案:对解析:[判断题]219.只要当前的系统中安装了Anconda,则默认就已经拥有了JupyterNotebook,不需要再另行下载和安装。A)正确B)错误答案:对解析:[判断题]220.Sigmoid函数能够把输入的连续实值变换为0和1之间的输出。A)正确B)错误答案:对解析:[判断题]221.支持向量是最靠近决策表面的数据点A)正确B)错误答案:对解析:[判断题]222.两个变量相关,它们的相关系数r可能为0。这句话是否正确?A)正确B)错误答案:对解析:一般来说,相关系数r=0是两变量相互独立的必要不充分条件。也就是说,如果两个变量相互独立,那么相关系数r一定为0,如果相关系数r=0,则不一定相互独立。相关系数r=0只能说明两个变量之间不存在线性关系,仍然可能存在非线性关系。那么,若两个变量相关,存在非线性关系,那么它们的相关系数r就为0。[判断题]223.回归问题和分类问题都有可能发生过拟合A)正确B)错误答案:对解析:[判断题]224.逻辑回归算法是一种广义的线性回归分析方法,它仅在线性回归

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论