版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
人工智能核心算法模拟练习题含参考答案一、单选题(共44题,每题1分,共44分)1.使用交叉验证最简单的方法是在估计器和数据集上调用什么辅助函数?A、cross_val%B、cross_val_scoreC、val_scoreD、cross_score正确答案:B2.代码arr1=np.array([[1,2,3],[4,5,6]]);arr2=2*np.ones([2,3],dtype=64);print((arr1*arr2)[1][2])的输出结果是()?注:(已导入numpy库)importnumpyasnpA、8B、12C、10D、6正确答案:B3.半监督支持向量机简称?A、SVMPB、S2VMC、S3VMD、SSVM正确答案:C4.最小二乘法就是试图找到一条直线,使所有样本到直线上的()之和最小。A、马氏距离B、曼哈顿距离C、切比雪夫距离D、欧氏距离正确答案:D5.关于bagging下列说法错误的是:()A、各基分类器之间有较强依赖,不可以进行并行训练。B、为了让基分类器之间互相独立,需要将训练集分为若干子集。C、最著名的算法之一是基于决策树基分类器的随机森林。D、当训练样本数量较少时,子集之间可能有重叠。正确答案:A6.如果我们希望预测n个类(p1,p2...pk)的概率使得所有n的p的和等于1,那么下列哪个函数可以用作输出层中的激活函数?A、SigmoidB、ReLuC、SoftmaxD、Tanh正确答案:C7.下列哪个包不是用于处理图像的?()A、gensimB、opencvC、skimageD、Scipy正确答案:A8.协同训练(co-training)是针对(___)数据设计?A、多版本B、多角度C、多视图D、多环境正确答案:C9.强化学习在每个时刻环境和个体都会产生相应的交互。个体可以采取一定的(),这样的行动是施加在环境中的。A、actionB、stateC、rewardD、agent正确答案:A10.在数据挖掘中,比较成熟的预测算法包括Logistic回归模型、()、决策树、神经网络等A、时间序列B、线性回归C、灰色模型D、贝叶斯网络正确答案:D11.数据科学家经常使用多个算法进行预测,并将多个机器学习算法的输出(称为“集成学习”)结合起来,以获得比所有个体模型都更好的更健壮的输出。则下列说法正确的是?()A、基本模型之间相关性高。B、基本模型之间相关性低。C、集成方法均使用加权平均代替投票方法。D、基本模型都来自于同一算法。正确答案:B12.每一棵决策树拟合的是之前迭代得到的模型的()A、标准差B、均方差C、残差D、方差正确答案:C13.下列哪些项目是在图像识别任务中使用的数据扩增技术(dataaugmentationtechnique)?1水平翻转(Horizontalflipping)2随机裁剪(Randomcropping)3随机放缩(Randomscaling)4颜色抖动(Colorjittering)5随机平移(Randomtranslation)6随机剪切(Randomshearing)A、1,3,5,6B、1,2,4C、2,3,4,5,6D、所有项目正确答案:D14.对于给定的关于天气信息的数据集,已知空气的温度、湿度、气压、是否降雨以及pm2.5指数,需要建立一个回归模型预测pm2.5指数,这是一个()。A、半监督学习B、强化学习C、有监督的学习D、无监督学习正确答案:C15.关于SVM,以下描述错误的是()A、某个核函数使训练集在特征空间中线性可分,可能原因是欠拟合B、正则化可理解为一种“罚函数法C、“软间隔”允许某些样本不满足约束D、如果原始空间是有限维,即属性数有限,那么一定存在一个高维特征空间使样本可分正确答案:A16.随着卷积层数的增加,下面描述正确的是:①.在一定层数范围内,效果越来越好②.能够抽取的特征更加复杂③.层数越多越容易发生梯度消失A、①②③B、①②C、①③D、②③正确答案:A17.前馈神经网络是一种简单的神经网络,各神经元分层排列,是目前应用最广泛,发展最迅速的人工神经网络之一。以下关于前馈神经网络说法正确的是:A、具备计算能力的神经元与上下两层相连B、其输入节点具备计算能力C、同一层神经元相互连接D、层间信息只沿个方向传递正确答案:D18.下列哪一项不是常见的机器学习模型正则化方法。A、数据增强B、模型集成C、引入参数范数惩罚项D、数据优化正确答案:D19.卷积神经网络(convolu-tionalneuralnetwork,CNN),是一种专门用来处理具有类似()的数据的神经网络。A、网格结构B、数组结构C、序列结构D、表格结构正确答案:A20.测试集应尽可能与训练集(___)。A、包含B、互斥C、相容D、相等正确答案:B21.将训练集随机等分为k份,选择其中的1份为测试集,另外k-1份作为训练集进行训练,进而可以进行k次训练和测试,最后返回这k个测试结果的均值,这种评估模型的方法叫做(____)。A、k折交叉验证B、留一交叉验证C、自助法D、留出法正确答案:A22.前馈神经网络通过误差后向传播(BP算法)进行参数学习,这是一种()机器学习手段A、监督学习B、无监督学习C、半监督学习D、无监督学习和监督学习的结合正确答案:A23.下列哪些属于循环神经网络()A、LeNetB、GoogleNetC、Bi-LSTMD、BERT正确答案:C24.关于wordembedding下列叙述正确的是①.向量维数较低②.向量之间有更强的相关关系③.向量不再是稀疏的④.向量中的值更容易计算A、①③④B、①③④C、①②④D、①②③正确答案:D25.以下哪些算法是分类算法()A、DBSCANB、C4.5C、K-MeanD、EM正确答案:B26.()是用来评估神经网络的计算模型对样本的预测值和真实值之间的误差大小。A、优化函数B、梯度下降C、损失函数D、反向传播正确答案:C27.在pytorch中,设模型变量名为model,则对model.eval()的描述正确的是A、model.eval()可以在模型训练阶段使用B、model.eval()在模型训练、模型验证、模型测试阶段都可以使用C、model.eval()只能在模型测试阶段使用D、model.eval()在模型验证、模型测试阶段都可以使用正确答案:D28.聚类是一种典型的无监督学习任务,然而在现实聚类任务中我们往往能获得一些额外的监督信息,于是可通过(___)来利用监督信息以获得更好的聚类效果。A、聚类B、监督聚类C、直推聚类D、半监督聚类正确答案:D29.下列哪种机器学习算法不需要归一化处理?()A、DecisionTreeB.SVMB、KmeansC、LogisticRegression正确答案:A30.将输出标记的对数作为线性模型逼近的目标是(___)。A、对数几率回归B、极大似然法C、正则化D、对数线性回归正确答案:D31.强化学习的目标是找到()的策略A、最小损失函数B、全局最优解C、局部最优解D、最大化收益正确答案:D32.关于线性回归的描述,以下正确的有()A、基本假设包括随机干扰项是均值为0,方差为1的标准正态分布B、基本假设包括随机干扰项是均值为0的同方差正态分布C、多重共线性会使得参数估计值方差减小D、基本假设包括不服从正态分布的随机干扰项正确答案:B33.循环神经网在工业上最常用的两种实现是:①.LSTM②.GRU③.CNN④.DNNA、①③B、①②C、①③D、①④正确答案:B34.图像数字化分为两个步骤:一为取样,二为()。A、量化B、数字化C、去噪声D、清洗正确答案:A35.某超市研究销售纪录数据后发现,买啤酒的人很大概率也会购买尿布,这种属于数据挖掘的哪类问题?()A、自然语言处理B、分类C、关联规则发现D、聚类正确答案:C36.关于贝叶斯网的学习描述错误的为(___)A、网络结构为已知;B、估计出每个结点的条件概率;C、评分搜索为求解的常用办法;D、贝叶斯的学习过程为对训练样本计数;正确答案:A37.根据边的性质不同,概率图模型可大致分为两类:第一类是使用有向无环图表示变量间的依赖关系,称为有向图模型或贝叶斯网(Bayesiannetwork);第二类是使用无向图表示变量间的相关关系,称为(___)。A、赫布网B、拉普拉斯网C、马尔科夫网D、塞缪尔网正确答案:C38.关于Elman网络描述错误的是(___)A、作为递归神经网络,允许出现环形结构;B、一些神经元的输出反馈回来会作为输入信号;C、用于处理静态模型,即无法处理与时间有关的动态变化;D、可利用BP算法来进行参数优化;正确答案:C39.在CNN网络模型中,不常见的Pooling层操作是A、maxB、minC、meanD、sum正确答案:D40.LSTM是一种什么网络?A、孪生网络B、前馈神经网C、卷积神经网D、循环神经网正确答案:D41.Dropout是一种在深度学习环境中应用的正规化手段。它是这样运作的:在一次循环中我们先随机选择神经层中的一些单元并将其临时隐藏,然后再进行该次循环中神经网络的训练和优化过程。在下一次循环中,我们又将隐藏另外一些神经元,如此直至训练结束。根据以上描述,Dropout技术在下列哪种神经层中将无法发挥显著优势?A、仿射层B、卷积层C、RNN层D、均不对正确答案:C42.下面的问题,哪一个属于分类问题的是()A、根据员工的薪水、工作压力、成长环境、工作年限、绩效考核等数据,预测员工是否可能会在接下来的一段时间内离职B、根据员工的薪水、工作压力、成长环境、工作年限、绩效考核等数据,预测员工在接下来一段时间内的工资涨幅C、根据员工的薪水、工作压力、成长环境、工作年限、绩效考核等数据,预测员工下一季度的销售额D、根据员工的薪水、工作压力、成长环境、工作年限、绩效考核等数据,预测员工下一季度的绩效考核分数正确答案:A43.对于图像数据,通常使用的模型是()A、word2vecB、循环神经网络C、bertD、卷积神经网络正确答案:D44.一张RGB彩色图片存储在计算机中通常不含以下哪一项:A、黄色通道B、蓝色通道C、绿色通道D、红色通道正确答案:A二、多选题(共24题,每题1分,共24分)1.下列哪些项是决策树常用的属性选择指标()A、信息增益B、Gini系数C、信息增益率D、距离平方和正确答案:ABC2.经典逻辑推理有哪些?A、不确定与非单调推理B、归结演绎推理C、自然演绎推理D、与、或形演绎推理正确答案:BCD3.带有记忆处理的神经元有()A、LSTMB、GRUC、CNND、ResNet正确答案:AB4.配置关键词时,我们可以按照以下哪个方法来进行操作?A、使用核心的词汇或词组来配置B、仅配置数字;C、仅配置字母;D、针对任一问题来提取关键词配置正确答案:AD5.faster-rcnn网络每个位置生成哪几种比例的anchor?A、1比1B、2比2C、1比2D、2比1正确答案:ACD6.隐马尔可夫模型三个基本问题以及相应的算法说法正确的是()A、评估—前向后向算法B、解码—维特比算法C、学习—Baum-Welch算法D、学习—前向后向算法正确答案:ABC7.以下哪些是属于深度学习算法的激活函数?A、ReLUB、TanhC、SigmoidD、Sin正确答案:ABC8.文本语料库的可能特征是什么?A、词的向量标注B、文本中词计数C、词性标注(PartofSpeechTag)D、基本依存语法正确答案:ABCD9.下列模型属于机器学习生成式模型的是()A、深度信念网络B、隐马尔科夫模型C、朴素贝叶斯D、线性回归模型正确答案:ABC10.利用one-hot表示一个向量,使用一个词表长的向量表示一个单词,被表示单词对应的位置为(),其他单词对应的位置均为()A、0B、1C、-1D、2正确答案:AB11.模型选择方法包括哪些?A、格点搜索B、交叉验证C、针对预测误差评估的度量函数正确答案:ABC12.下面关于机器学习的理解正确的是()A、监督学习和非监督学习的区别在于是否要求样本数据带标签B、非监督学习的样本数据是要求带标签的C、卷积神经网络一般用于图像处理等局部特征相关的数据D、强化学习以输入数据作为对模型的反馈正确答案:ACD13.Relu激活函数的优点?A、解决了梯度消失、爆炸的问题B、输出不是以0为中心C、计算方便,计算速度快,求导方便D、加速网络训练正确答案:ACD14.人工智能算法中,决策树分类算法包括A、C4.5B、ID3C、SGDD、CART正确答案:ABD15.关于线性回归说法正确的是()A、日常生活中,收入预测可以作为线性回归问题来解决B、线性回归是简单的方法"C、商品库存预测,是一种典型的有监督学习方法D、常用的回归模型有线性回实用归和非线性回归正确答案:ABCD16.对于Word2vec的2个基础算法,每次()更新只能优化一个向量且softmax里的指数求和操作计算量太大,一般使用比较高效的()算法。A、梯度B、负采样C、正采样D、旋度正确答案:AB17.以下哪些机器学习算法可以不对特征做归一化处理()A、随机森林B、逻辑回归C、SVMD、GBDT正确答案:AD18.VGG从()角度改进了之前的图像分类网络?GoogLeNet从()角度改进了之前的图像分类网络?ResNet从()角度改进了之前的图像分类网络?A、轻量化网络模型B、增加网络深度C、改善网络退化现象D、增加网络宽度正确答案:BCD19.下列可以用于分类问题的机器学习算法有:A、逻辑回归B、决策树C、k近邻D、随机森林正确答案:ABCD20.DSSM模型总的来说可以分成三层结构,分别是()A、输入层B、表示层C、匹配层D、输出层正确答案:ABC21.线性回归的基本假设包括哪个?A、随机误差项是一个期望值为0的随机变量B、对于解释变量的所有观测值,随机误差项有相同的方差C、随机误差项彼此相关D、解释变量是确定性变量不是随机变量,与随机误差项之间相互独立正确答案:ABD22.FasterRCNN模型相比于FastR-CNN模型,算法的改进主要体现在()A、提出候选框生成网络,取代了SelectiveSearchB、在RPN与最终输出的两个阶段,将分类损失和框回归损失进行联合后对网络进行优化C、采用ROIpooling层,加速特征提取过程D、将CNN提取到的特征送入SVM进行分类正确答案:AB23.非线性核SVM研究重点是设计快速近似算法,包括()A、低秩逼近B、随机分布C、随机傅里叶特征D、采样正确答案:ACD24.在随机森林中,最终的集成模型是通过什么策略决定模型结果的?A、累加制B、求平均数C、投票制D、累乘制正确答案:BC三、判断题(共36题,每题1分,共36分)1.数据预处理方法主要有数据清洗、数据集成、数据变换、数据归约A、正确B、错误正确答案:A2.PageRank是一个函数,它对Web中的每个网页赋予一个实数值。它的意图在于网页的PageRank越高,那么它就相关性越高A、正确B、错误正确答案:B3.NFL(NoFreeLunchTheorem)定理有一个重要前提:所有“问题”出现的机会相同、或所有问题同等重要。A、正确B、错误正确答案:A4.解路径也可以用规则的序列表示,如果从问题的初始状态依次应用这些规则,得到的节点连同初始状态刚好是一个解路径的话.解路径又可以称为问题的解,或简称为解。A、正确B、错误正确答案:A5.聚类(clustering)是这样的过程:它找出描述并区分数据类或概念的模型(或函数),以便能够使用模型预测类标记未知的对象类A、正确B、错误正确答案:B6.PSP网络获取上下文信息的关键在于增大感受野A、正确B、错误正确答案:A7.原始业务数据来自多个数据库或数据仓库,它们的结构和规则可能是不同的,这将导致原始数据非常的杂乱、不可用,即使在同一个数据库中,也可能存在重复的和不完整的数据信息,为了使这些数据能够符合数据挖掘的要求,提高效率和得到清晰的结果,必须进行数据的预处理。A、正确B、错误正确答案:A8.对于SVM分类算法,待分样本集中的大部分样本不是支持向量,移去或者减少这些样本对分类结果没有影响。A、正确B、错误正确答案:A9.PCA可用于在较小维度上投影和可视化数据。A、正确B、错误正确答案:A10.SVM是在特征空间上找到最佳的分离超平面,使得训练集上的正负样本间隔最大。是用来解决二分类问题,在引入核方法后也可以解决非线性问题。A、正确B、错误正确答案:A11.卷积神经网络中同一卷积层的所有卷积核是权重共享的。A、正确B、错误正确答案:A12.神经网络中的注意力机制受到人类视觉中注意力的启发,即人类视觉注意力能够聚焦到图像的特定区域,并在这个区域有非常低的分辨率,而在其它区域有较高的分辨率。A、正确B、错误正确答案:B13.图像分类是根据图像的语义信息对不同类别图像进行区分,是计算机视觉的核心,是物体检测、图像分割、物体跟踪、行为分析、人脸识别等其他高层次视觉任务的基础A、正确B、错误正确答案:A14.当训练数据近似线性可分时,通过硬间隔最大化,也学习一个线性的分类器,即线性支持向量机,又称为硬间隔支持向量机。A、正确B、错误正确答案:B15.SOFTMAX函数,是用来将全数域函数结果映射到概率空间。A、正确B、错误正确答案:A16.Sigmoid是神经网络中最常用到的一种激活函数,除非当梯度太大导致激活函数被弥散,这叫作神经元饱和,这就是为什么ReLU会被提出来,因为ReLU可以使得梯度在正向时输出值与原始值一样。这意味着在神经网络中ReLU单元永远不会饱和。A、正确B、错误正确答案:B17.EM算法用于训练样本完整的情况下进行估计A、正确B、错误正确答案:B18.人工校验是指打印数据输出结果,观察是否是预期的格式。实现数据处理和加载函数后,我们可以调用它读取一次数据,观察数据的shape和类型是否与函数中设置的一致A、正确B、错误正确答案:A19.利用one-hot表示一个向量,使用一个词表长的向量表示一个单词,被表示单词对应的位置为0,其他单词对应的位置均为1A、正确B、错误正确答案:B20.LR的损失函数为hingeloss(或者说是逻辑损失都可以)、而SVM的损失函数为Log损失。A、正确B、错误正确答案:B21.N-gram模型中,N指的是忽略距离大于n的上文词的影响,N越大时。模型包含的次序信息越丰富,同时计算量随
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025-2030年道路、桥梁、隧道工程招标代理服务行业数字营销策略分析研究报告
- 2026年信息技术工程师专业技术资格考试试题及答案解析
- 消防安全知识培训测试题库(2025版)及答案详解
- 2025-2030年幻灯片协同编辑行业跨境出海战略分析研究报告
- 2026年辽宁沈阳市中考一模语文模拟试卷试题(含答案详解)
- 2026钙钛矿光伏技术产业化进程与市场机会分析报告
- 小学体育教师资格考试面试试题及解答参考2026年及答案
- 2026费托蜡下游应用领域拓展与市场增量机会分析报告
- 2026调味品行业市场全景剖析及渠道变革与商业机会研究报告
- 重金属冶炼工艺的环境友好型优化方案
- 云车高空作业车施工方案
- 2025年恒丰银行校园招聘笔试模拟试题及答案解析
- 第12课 辽宋夏金元时期经济的繁荣(说课稿)七年级历史下册同步高效课堂(统编版2024)
- 教改项目答辩课件
- 版画艺术鉴赏课件
- 【新课标】水平四(七年级)体育《田径:快速起动加速跑》教学设计及教案(附大单元教学计划18课时)
- 电力交易员基础知识培训课件
- 机械补贴协议书
- 火电精益管理办法
- 卡西欧手表5123机芯中文使用说明书
- 小学信息技术课件一等奖
评论
0/150
提交评论