人工智能自然语言技术练习(习题卷7)_第1页
人工智能自然语言技术练习(习题卷7)_第2页
人工智能自然语言技术练习(习题卷7)_第3页
人工智能自然语言技术练习(习题卷7)_第4页
人工智能自然语言技术练习(习题卷7)_第5页
已阅读5页,还剩49页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

试卷科目:人工智能自然语言技术练习人工智能自然语言技术练习(习题卷7)PAGE"pagenumber"pagenumber/SECTIONPAGES"numberofpages"numberofpages人工智能自然语言技术练习第1部分:单项选择题,共116题,每题只有一个正确答案,多选或少选均不得分。[单选题]1.sigmoid激活函数在反向传播是可能会造成梯度消失,那么以下哪个激活函数可以对其进行改进A)coshB)sinC)tanhD)sigmoid答案:C解析:[单选题]2.BERT中遮蔽了多少词A)10%B)12%C)15%D)20%答案:C解析:[单选题]3.()函数用于搜索搭配词语。A)concordanceB)common_contextsC)collocationsD)Sorted答案:C解析:[单选题]4.什么是SVM,如何去理解SVMA)一种树形结构,其中每个内部节点表示一个属性上的测试,每个分支代表一个测试输出,每个叶节点代表一种类别B)两个变量之间的关系是二次函数的关系,图像是条抛物线C)两个变量之间的关系是一次函数关系的关系D)它是一种二类分类模型,其基本模型定义为特征空间上的间隔最大的线性分类器,其学习策略便是间隔最大化,最终可转化为一个凸二次规划问题的求解答案:D解析:[单选题]5.以下几种说法当中,关于随机森林的说法错误的是A)随机森林的结果是多数表决表决的B)随机森林对异常值不敏感C)随机森林是减少模型的方差D)组成随机森林的树可以串行生成答案:D解析:[单选题]6.怎样解决梯度消失A)对于RNN,可以通过梯度截断,避免梯度消失B)可以通过添加正则项,避免梯度爆炸C)使用LSTM等自循环和门控制机制,避免梯度爆炸D)优化激活函数,譬如将sigmold改为relu,避免梯度消失答案:D解析:[单选题]7.Transformer的编码层是总共是有几层构成的A)1B)2C)3D)4答案:B解析:[单选题]8.小概率事件怎么理解?()A)发生可能性不大的事件B)发生可能性大的事件C)发生可能性不去确定的事件D)以上都正确答案:A解析:[单选题]9.SVM中的泛化误差代表什么?A)分类超平面与支持向量的距离B)SVM对新数据的预测准确度C)SVM中的误差阈值D)不确定答案:B解析:[单选题]10.大五码非汉字区第一字节ASCII码的范围()A)161-163B)64-126C)164-249D)161-254答案:A解析:[单选题]11.基于()的n-gram模型参数空间最小,可以构造高元模型,用于描述长距离的语言约束关系A)词性B)词C)词自动聚类D)其余三项都可以答案:A解析:[单选题]12.以下哪种模型是自然语言处理后Bert时代的预训练模型A)Word2VecB)RNNC)XLNetD)LSTM答案:C解析:[单选题]13.朴素贝叶斯分类的思想A)使用训练数据构造决策树进行分类B)利用先验知识层层迭代,穷举所有的可能C)利用贝叶斯定理,使用先验概率求后验概率D)相似的对象分到一类中答案:C解析:[单选题]14.词法分析器的输出结果就是()A)记号B)相应条目在符号表中的位置相应条目在符号表中的位置C)记号与属性二元组D)属性值答案:C解析:[单选题]15.关系抽取中通过实体去寻找句子中的几元组模型A)1B)2C)3D)4答案:C解析:[单选题]16.下列几个说法表示K-NN的优点?A)对内存要求较高,因为该算法存储了所有训练数据B)简单易用,相比其他算法,KNN算是比较简洁明了的算法。即使没有很高的数学基础也能搞清楚它的原理。C)预测阶段可能很慢D)对异常值敏感答案:B解析:[单选题]17.步长strides=[1,3,3,1]能是张量纵向移动()A)1像素B)4像素C)3像素D)2像素答案:C解析:[单选题]18.LSTM可以做特征提取,在以下的几个模型当中,哪个模型中使用到了A)bertB)GPTC)GPT-2D)ELMO答案:D解析:[单选题]19.softmax是多分类中常用的函数,它又叫什么函数A)概率B)归一化C)损失函数D)空间答案:B解析:[单选题]20.属于特征提取方法的是()。A)BOW模型B)数据标准化C)训练模型D)模型融合答案:A解析:[单选题]21.线性回归一般形式为Y=W*X+b,值域在[-∞,+∞],那么可以通过以下哪种方式进行分类呢A)加入非线性变换sigmoidB)再加入一个线性变化C)加入一个正则化D)使用均方误差作为损失答案:A解析:[单选题]22.tensorflow里的函数con1d是进行什么操作A)二维卷积B)一维卷积C)GRU操作D)lstm操作答案:B解析:[单选题]23.什么是特征工程,如何去理解特征工程A)特征工程就是对原始的数据做一系列的处理B)特征工程就是使用各种算法实现结果C)特征工程就是聚类和降维D)特征工程就是回归和分类答案:A解析:[单选题]24.以下关于LDA和PCA两个模型的相同点描述正确的是?A)两者均可以对数据进行降维B)都属于无监督学习C)都属于有监督学习D)都可以即做分类又做回归答案:A解析:[单选题]25.以下四个选项中描述的是PCA缺点的是哪个?A)仅仅需要以方差衡量信息量,不受数据集以外的因素影响B)各主成分之间正交,可消除原始数据成分间的相互影响的因素。C)主成分各个特征维度的含义具有一定的模糊性,不如原始样本特征的解释性强。D)计算方法简单,主要运算是特征值分解,易于实现。答案:C解析:[单选题]26.tf.Graph.finalize()的作用是什么A)返回图中的操作节点列表B)为节点创建层次化的名称,并返回一个上下文管理器C)返回图中的操作节点列表D)完成图的构建,即将其设置为只读模式答案:D解析:[单选题]27.在调整NNLM的权重时,使用的方法是什么A)BP+SGDB)BPC)SGDD)BP+BGD答案:A解析:[单选题]28.扫描器所完成的任务就是从字符串形式的源程序中识别出一个个具有独立含义的最小语法单位即()A)字符B)单词C)句子D)句型答案:B解析:[单选题]29.sigmoid激活函数的模型曲线是()?A)X型B)S型C)U型D)L型答案:B解析:[单选题]30.谓词相关特征之一()A)动词原形B)语态C)父类框架D)谓语动词答案:B解析:[单选题]31.对于k-NN分类器,以下哪个陈述是正确的?A)k值越大,分类精度越好B)k值越小,决策边界越光滑C)决策边界是线性的D)k-NN不需要显式的训练步骤答案:D解析:[单选题]32.XGBoost虽然也是个算法,但是这个算法的本质其实是很么算法A)随机森林B)GBDTC)线性回归D)逻辑回归答案:B解析:[单选题]33.使用了mini-batch后,可以得到怎样的下降效果?A)损失函数值一直下降B)损失函数值总体趋势下降C)比梯度下降速度快D)梯度下降不明显答案:B解析:[单选题]34.现有一份大小为n的数据集,如果采用mini-batch的方式,那么它的大小应该是多少A)1B)mC)0D)大于2,小于m答案:A解析:[单选题]35.交叉检验的方法不包括以下几项A)口头信息、书面信息与实际状况之间的验证B)不同数据和信息之间的关系的合理性验证C)不同时间的关联数据之间的合理性验证D)同一个人对不同问题提供的信息的验证答案:D解析:[单选题]36.Word2Vec常用到中文同义词替换,以下说法错误的是A)Word2Vec基于概率统计B)Word2Vec结果符合当前预料环境C)Word2Vec得到的都是语义上的同义词D)Word2Vec受限于训练语料的数量和质量答案:C解析:[单选题]37.多分类问题的最后一层一般用什么激活函数A)sigmoidB)tanhC)softmaxD)relu答案:C解析:[单选题]38.()根据文本的不同特征划分为不同的类A)文本概括B)文本分类C)文本聚类D)都可以答案:C解析:[单选题]39.以下四个选项当中,关于带有深度限制的按叶子生长(leaf-wise)算法,主要做了什么事情,描述正确的是?A)增加了一个最大深度的限制,在保证高效率的同时防止过拟合B)先把连续的浮点特征值离散化成k个整数,同时构造一个宽度为k的直方图C)不确定D)以上都正确答案:A解析:[单选题]40.决策树算法的缺点是()。A)学习时间长,且效果不可保证B)易出现过拟合,易忽略数据集属性的相关性C)时空复杂度高,样本容量较小或数据集偏斜时容易误分D)对非线性问题没有通用解决方案答案:B解析:[单选题]41.概率图中的有向边表示的是什么A)表示单向的依赖B)表述互相依赖关系C)表示无依赖关系D)不确定答案:A解析:[单选题]42.决策树有很多的优点,但是它也有缺点那么,构建决策树时有可能会造成什么缺点A)可能会对缺失值很敏感B)无法处理不相关的数据C)可能产生过渡匹配问题D)计算的复杂度很高答案:C解析:[单选题]43.LSTM的输出有两个:当前时刻LSTM输出值、和()A)输入门B)遗忘门C)当前时刻的单元状态D)更新门答案:C解析:[单选题]44.词性标注最困难的是:()A)兼类词B)外来词C)新词D)未登录词答案:A解析:[单选题]45.神经网络的训练过程,经常要做数据划分,以下说法正确的是?A)可以不设置训练集B)可以不设置测试集C)可以不设置验证集D)不确定答案:C解析:[单选题]46.下列关于doc2vec算法的描述错误的是?()A)DM模型在给定上下文和文档向量的情况下预测单词的概率B)DM模型在训练时,首先将每个文档的ID和语料库中的所有词初始化一个K维的向量C)DBOW模型的训练方法是忽略输入的上下文,让模型去预测段落中的随机一个单词D)在预测单词的概率时,利用了部分文档的语义。答案:D解析:[单选题]47.SVM的应用也很广泛,支持向量机(SVM)是一个什么算法A)分类B)回归C)聚类D)降维答案:A解析:[单选题]48.在决策树的可视化中可以用以下哪个获取决策树叶子节点的个数A)plotTreeB)plotNodeC)getTreeDepthD)getNumLeafs答案:D解析:[单选题]49.异质集成(系统中个体学习器的类型不同)中,个体学习器又被称为?组建学习(componentlearner)?A)基学习器B)组建学习C)不能判断D)以上都正确答案:B解析:[单选题]50.tanh的取值范围是多少?A)+1和-1B)+0和-1C)+1和0D)+2和-2答案:A解析:[单选题]51.在自然语言中,主要应用到的是深度学习神经网络是以下哪个A)ANNB)CNNC)RNND)XNN答案:C解析:[单选题]52.在优化算法中,学习率会:A)保持不变B)持续减小C)持续增大D)不变答案:B解析:[单选题]53.NiLTK的安装步骤为()。A)安装NLP虚拟环境→安裝NLTK一→检查是否存在NLTK→下载NLTK数据包B)安装NLTK→安装NLP虚拟环境→检查是否存在NLTK→下载NLTK数据包C)安装NLP虚拟环境一安装NLTK一下载NLTK数据包一检查是否存在NLTKD)下载NLTK数据包→安装NLP虚拟环境→安装NLTK→检查是否存在NLTK答案:A解析:[单选题]54.关于机器学习的聚类中的肘部法则是指()A)就是从K值和代价函数J的二维图中找出J下降变平滑的拐点对应的K值。B)最大K值C)最小K值D)随机K值答案:A解析:[单选题]55.常用的激活函数,修正线性单元指的是以下哪个选项?A)sigmoidB)tanhC)reluD)leakyrelu答案:C解析:[单选题]56.可以实现关键词归一化的技术是__?A)词形还原(Lemmatization)B)探测法(Soundex)C)余弦相似度(CosineSimilarity)D)N-grams答案:A解析:词形还原有助于得到一个词的基本形式,例如:playing->play,eating->eat等;其他选项的技术都有其他使用目的。[单选题]57.不属于情感分析应用的是()。A)信息检索B)远程通信C)机器翻译D)语音识别答案:B解析:[单选题]58.以下哪种方法中,模型参数不是根据在某个语料库上通过统计计数得到。A)Witten-Bell算法B)Good-Turing估计C)扣留估计D)线性折扣算法答案:C解析:[单选题]59.NLP任务的标准流程中第一步是做什么A)预处理B)特征提取C)特征工程D)wordembedding答案:A解析:[单选题]60.下列哪个不属于常用的文本分类的特征选择算法?()A)卡方检验值B)互信息C)信息增益D)主成分分析答案:D解析:[单选题]61.BeamSearch(集束搜索)的作用A)增加在空间的消耗B)增加搜索的时间C)减少准确率D)减少搜索所占用的空间和时间答案:D解析:[单选题]62.处理文本词的时候,经常会遇到衡量词不全面,那么TF-IDF可以怎么解决A)使用one-hotB)使用bagofwordC)使用Word2VecD)不确定答案:C解析:[单选题]63.Adam算法的核心是A)强化了RMSprop算法B)强化了动量梯度算法C)同时使用Momentum和RMSprop算法D)没有核心答案:C解析:[单选题]64.以下哪个算法,既可以做分类又可以做降维A)PCAB)LDAC)K-MeansD)SVM答案:D解析:[单选题]65.导出数据Data到微软的Excel文件,pandas用到的方法是A)A:df.to_csv()B)B:df.to_excel()C)C:df.to_sql()D)D:df.to_json()答案:B解析:[单选题]66.tf.Graph.get_operations()的作用是什么A)返回图中的操作节点列表B)为节点创建层次化的名称,并返回一个上下文管理器C)返回图中的操作节点列表D)完成图的构建,即将其设置为只读模式答案:C解析:[单选题]67.在应用高斯核SVM之前,通常都会对数据做正态化(normalization),下面对特征正态化的说法哪个是正确的?1.对特征做正态化处理后,新的特征将主导输出结果2.正态化不适用于类别特征3.对于高斯核SVM,正态化总是有用A)1B)1和2C)1和3D)2和3答案:B解析:[单选题]68.专家系统是一个复杂的智能软件,它处理的对象是用符号表示的知识,处理的过程是()的过程。A)思考B)回溯C)推理D)递归答案:C解析:[单选题]69.语料库的加工方式不包括A)人工方式B)半自动方式C)自动方式D)干预方式答案:D解析:[单选题]70.下列哪项不是文本分析的过程步骤?()A)词法分析B)句法分析C)文本分析D)语义分析答案:C解析:马铃薯是是蔬菜。[单选题]71.在NLP任务当中机器翻译任务所使用的的模型属于什么模型A)基于统计的语言模型B)基于神经网络的语言模型C)预训练模型D)编解码模型答案:A解析:[单选题]72.关于k-NN算法的应用,以下说法正确的是?A)可用于分类B)可用于回归C)可用于分类和回归D)聚类答案:C解析:[单选题]73.下面哪个网络常用于NLP任务中A)ANNB)CNNC)RNND)XNN答案:C解析:[单选题]74.下列关于基尼系数和熵说法正确的是A)基尼系数更偏向于连续值B)熵更偏向于离散值C)基尼系数的计算需要对数的运算D)熵运算起来更加的高效答案:A解析:[单选题]75.不同于通常涉及大量的规则编码的早期尝试语言处理,现代NLP算法是基于()A)自动识别B)机器学习C)模式识别D)算法辅助答案:B解析:[单选题]76.以下哪个选项的框架对Cache命中率优化A)XGBoostB)随机森林C)GBDTD)LightGBM答案:D解析:[单选题]77.在反向传播中,会出现误差逐渐变小,使得网络层的学习速率越来越低,这种现象被称为什么A)梯度上升问题B)梯度优化C)梯度消失问题D)梯度下降法答案:C解析:[单选题]78.归一化的公式方式为:A)通过中值和均值进行确定B)通过平均值和最小值确定C)通过方差和均值确定D)通过标准差和均值确定答案:C解析:[单选题]79.以下四个选项中代表的随机森林缩写的是哪个?A)RFB)GBDTC)XGBoostD)LightGBM答案:A解析:[单选题]80.以下几个模型中哪个模型在建模的时候与词的位置无关A)OpenAIGPTB)ELMoC)BERTD)ULMFit答案:C解析:BERTTransformer架构将句子中每个词和所有其他词之间的关系建模,以生成注意力分数。这些注意力分数随后被用作所有词表示的加权平均值的权重,它们被输入到完全连接的网络中以生成新的表示。[单选题]81.预训练模型的思路说法正确的是__?A)特征提取的地层差异性比较大B)所有的任务都是一样的C)在做特征提取的时候,底层的特征的提取往往是极其相似的D)以上都正确答案:A解析:[单选题]82.下面哪个不是常用的分类器A)lassoB)SVCC)HMMD)CRF答案:A解析:[单选题]83.怎么去理解?非线性?A)两个变量之间的关系是一次函数的关系B)图像是条直线C)两个变量之间的关系不是是一次函数的关系D)不确定答案:C解析:[单选题]84.下面哪个函数的现状是S曲线型的A)Sigmoid函数B)tanh函数C)ReLUD)cosh答案:C解析:[单选题]85.下列几个选项中,关于RMSprop算法的特点描述正确的优哪些?A)指数加权平均数求和B)指数加权平均数先平方再开方C)指数加权平均数求微分D)指数加权平均数求均方误差答案:B解析:[单选题]86.以下四个选项中能实现对比两个矩阵是否相等的是哪个函数?A)c=tf.greater(a,b)B)a=tf.subtract(a,b)C)b=tf.equal(a,b)D)d=tf.matmul(a,b)答案:C解析:[单选题]87.关于NLP中常用的Glove说法错误的是A)可以学习的到词向量B)学习得到的词向量可以区分一词多意C)通过局部数据来训练计算的D)通过全局数据来统计共现概率答案:C解析:[单选题]88.什么是正则表达式?()A)正确表达式B)程序员经常使用的编程语言表达式的集合C)一种排序算法D)用来匹配文本字符串(如特定字符、单词或字符模式)的一种工具答案:D解析:[单选题]89.常用的特征缩放方法是()A)原始特征减去其平均值,然后除于其标准差B)同时除于一个极大值C)同时除于一个极小值D)原始特征减去平均值答案:A解析:[单选题]90.马尔可夫模型的基本特征不包括A)无后效性B)遍历性C)吸收性D)相关性答案:D解析:[单选题]91.在语义网络中,用()来标明类与子类之间的关系。A)实例联系B)泛化联系C)聚集联系D)属性联系答案:B解析:[单选题]92.马尔可夫模型的三个基本问题不包括A)估值问题B)寻找状态序列C)学习模型参数D)学习模型参数答案:D解析:[单选题]93.以下四个选项中,找出一个与其他三个不相同的模型A)ELMoB)GPTC)BERTD)Nltk答案:D解析:[单选题]94.关于K-Means以下说法正确的是?A)是无监督学习B)是有监督学习C)是半监督学习D)是强化学习答案:A解析:[单选题]95.提取关键词的常见方法是()A)词频B)标签C)分词D)关键字答案:A解析:[单选题]96.以下哪些方法不可以直接来对文本分类?A)KmeansB)决策树C)支持向量机D)KNN答案:A解析:[单选题]97.假如经过测试后发现模型欠拟合了,以下哪种做法是不正确的A)增加新特征B)减少正则化参数C)选择更好的模型D)加入Dropout答案:D解析:[单选题]98.下列是对于Batch归一化的描述,其中它的流程步骤不包括下列哪个选项?A)求每个训练批次数据的均值B)求每个训练批次数据的方差C)使用求得的均值和方差对该批次的训练数据做归一化,获得0-1分布D)求每个训练批次的和答案:D解析:[单选题]99.在RNN循环神经网络中,在反向传播过程中很容易发生梯度消失现象,它与什么因素相关A)激活函数求导B)学习率C)批处理数D)网络层数答案:A解析:[单选题]100.K-NN中的K可以代表什么意思A)代价B)学习率C)不确定D)K个最近的邻居答案:D解析:[单选题]101.通过以下哪种方式可以得到加权平均值A)局部平均值B)局部方差C)全局平均值D)全局方差答案:A解析:[单选题]102.tf.cast函数的返回值数据类型是什么A)整数型B)布尔型C)浮点型D)字符串答案:C解析:[单选题]103.神经网络中常用的dropout函数,下列选项中关于它的描述正确的是?A)属于正则处理B)一个激活函数C)用于分割数据集D)用于将数据样本多样化答案:A解析:[单选题]104.基于转换的错误驱动的学习算法如下:(1)初始标注;(2)获取规则;(3)生成候选规则集;它们是按照什么顺序进行的?A)(1)(2)(3)B)(1)(3)(2)C)(2)(1)(3)D)(2)(3)(1)答案:B解析:[单选题]105.知识图谱中的边称为?A)连接边B)关系C)属性D)特征答案:B解析:[单选题]106.在处理文本是,关于NLP中句法结构分析的说法正确的是A)神经网络可以准确地确定句子的句法结构B)机器学习的KNN算法就可以获取到句子的句法结构C)机器学习的K-Means算法就可以获取到句子的句法结构D)不确定答案:A解析:[单选题]107.算法经常出现过拟合,以下四个选项中,哪个不容易陷入过拟合A)未剪枝的决策树B)随机森林C)不加正则的线性回归D)不加正则的逻辑回归答案:B解析:[单选题]108.tf.Variable(tf.random_normal([20,10,5,16])),在该操作中,关于定义的卷积核高度是多少?A)10B)6C)16D)20答案:D解析:[单选题]109.如果文法中的每一条产生式A→β的形式,其中A是一个非终结符,β是终结符和/或非终结符组合(例如,Y→y),那么这种文法就称为A)0型文法B)1型文法C)2型文法D)左线性文法答案:C解析:[单选题]110.以下哪个方法可以在文本当中提取到人名,地名等A)词干提取(Stemming)B)词形还原(Lemmatization)C)停用词消除(StopWordRemoval)D)命名实体识别(NamedEntityRecognition)答案:D解析:[单选题]111.在工业应用中经常会碰到NLP中的文本分类,文本分类属于以下哪种任务?A)分类B)回归C)聚类D)降维答案:A解析:[单选题]112.对于超参数随机取值指的是?A)随机选择标尺取值B)随机取值就是有效范围内随机均匀取值C)选择合适的标尺进行取值D)随机的进行均匀的取值答案:C解析:[单选题]113.在执行了以下的文本清理步骤之后,可从下面的语句中生成多少三元组短语(trigram):停用词移除使用单一空格替换标点符号「#Analytics-vidhyaisagreatsourcetolearn@data_science.」A)3B)4C)5D)6答案:C解析:在执行了停用词移除和标点符号替换之后,文本变成:「Analyticsvidhyagreatsourcelearndatascience」,三元组短语--Analyticsvidhyagreat,vidhyagreatsource,greatsourcelearn,sourcelearndata,learndatascience[单选题]114.线性回归使用的目标函数是以下哪个A)信息增益B)信息熵C)交叉熵D)均方误差答案:D解析:[单选题]115.通常的语义角色标注分为()个步骤:①识别、②分类、③剪枝、④后处理A)①②③④B)①③④C)①②④D)①④答案:A解析:[单选题]116.如何去理解牛顿法?A)实现简单,当目标函数是凸函数时,梯度下降法的解是全局解。一般情况下,其解不保证是全局最优解,梯度下降法的速度也未必是最快的B)是一种在实数域和复数域上近似求解方程的方法C)改善每次需要求解复杂的Hessian矩阵的逆矩阵的缺陷,它使用正定矩阵来近似Hessian矩阵的逆,从而简化了运算的复杂度D)不确定答案:B解析:第2部分:多项选择题,共57题,每题至少两个正确答案,多选或少选均不得分。[多选题]117.网络结构分别都有哪些形式,以下选项中正确是?A)星形结构:具有一个中心结点,所有通讯都通过它。B)环形结构:网络结点连成一个封闭的环形。C)总线结构:具有一个共享总线,所有结点挂在上面,又称树形结构D)以上都正确答案:ABCD解析:[多选题]118.关于激活函数sigmoid的说法,以下正确的有哪些?A)将负的权值映射到正值B)将输出数据压缩到[0,1]集合范围C)能解决非线性分类问题D)将正权值映射到负数答案:ABC解析:[多选题]119.语言模型分为哪几类A)统计的语言模型B)机器学习的语言模型C)神经网络的语言模型D)不确定答案:AC解析:[多选题]120.关于数据集DataSet的一般特性有哪些():A)连续性B)维度C)稀疏性D)分辨率答案:BCD解析:[多选题]121.seq2seq可以做机器翻译等之类的NLP任务,那么在编码器中可以用以下哪些模型做特征提取?A)CNNB)RNNC)LSTMD)SVM答案:ABC解析:[多选题]122.如果使用到了mini-batch,那么每次选择的批量大小为多少是比较合适的?A)16B)32C)64D)128答案:ABCD解析:[多选题]123.关于KNN算法,下列说法正确的是()A)无需参数估计,无需训练B)既能解决分类问题也能解决回归问题C)对变量之间的共线性比较敏感D)可解释性较差,无法给出像决策树那样的规则答案:ABCD解析:[多选题]124.以下四个选项当中,关于LDA说法正确的是A)可以通过经验主观判断、不断调试、操作性强、最为常用,的方式确定LDA中Topic的个数B)包含线性判别分析,概率主题模型,两种含义C)LDA中包含一个gamma函数D)以上都正确答案:ABCD解析:[多选题]125.人工智能中有三大主义,其中连接主义中,以下描述正确的是哪些?A)基础理论是神经网络B)深度学习属于连接主义C)又称仿生学派D)产生在20世纪50年代产生答案:ABCD解析:[多选题]126.数据切分阶段中,下列关于数据的训练集和验证集的划分,描述正确的有哪些?A)不一定需要验证集B)数据集数量较少时,训练集和测试集比例可以是7:3C)任何数量的数据集,都应遵守训练集和测试集比例7:3的原则D)大数据量的验证集,可以不遵循训练集和测试集比例7:3的原则答案:ABD解析:[多选题]127.NLP在工业中的应用A)语音识别B)自动翻译C)控制装置D)人脸识别答案:ABC解析:[多选题]128.文本表示分类(基于表示方法)A)短文本表示B)One-hot表示C)词表示D)CBOW答案:BD解析:[多选题]129.LightGBM为什么在Leaf-wise之上增加一个最大深度的限制A)高效率B)低效率C)防止过拟合D)防止欠拟合答案:AC解析:[多选题]130.SVM在工业中有广泛的应用,以下说法正确的是A)文本分类B)图片分类C)新闻聚类D)以上都对答案:ABCD解析:[多选题]131.以下几种网络中,哪些属于神经网络A)NN(标准神经网络)B)CNN(卷积神经网络)C)RNN(循环神经网络)D)以上都是答案:ABCD解析:[多选题]132.模型评估方法有哪些?A)Holdout检验B)不确定C)自助法D)交叉检验答案:ACD解析:[多选题]133.以下选项中,哪些是自然语言处理的应用?A)舆情分析B)文本分类C)自动文摘D)问答系统答案:ABCD解析:[多选题]134.概率图模型中的边可以分为哪几种A)有向边B)不确定C)无向边D)以上都正确答案:AB解析:[多选题]135.下列选项中关于高维数据处理描述正确的是?A)为了提高复杂关系的拟合能力B)在特征工程中经常会把一阶离散特征两两组合C)构成高阶组合特征D)以上都正确答案:ABCD解析:[多选题]136.LightGBM中使用了直方图操作,这样的好处是什么A)最明显就是内存消耗的升高B)直方图算法不仅不需要额外存储预排序的结果C)可以只保存特征离散化后的值D)以上都正确答案:BC解析:[多选题]137.自然语言处理的主要难点不包括以下哪两项A)语言独立性B)语言歧义性C)多国语言D)语境答案:AC解析:[多选题]138.以下选项中关于集合外一个点,到该集合的距离,描述正确的是哪些选项A)是该点到集合边界点的最短距离B)是该点到集合内所有点的最短距离C)是该点到集合内任意一点的距离D)是该点到集合内非边界点的某点的距离答案:AB解析:[多选题]139.ELMO的优缺点分别都有哪些A)解决了一词多意B)适用范围广C)LSTM特征提取能力比Transformer若D)拼接的方式双向融合能力偏弱答案:ABC解析:[多选题]140.以下()是NLP的应用场景。A)百度翻译B)图灵机器人C)微信语音转文字D)新闻分类答案:ABCD解析:[多选题]141.下列关于LightGBM有什么优点,说法正确的是A)更快的训练速度B)更低的内存消耗C)更好的准确率D)分布式支持,可以快速处理海量数据答案:ABCD解析:[多选题]142.深度学习文本分类方法有哪些A)特征工程B)TextCNNC)分类器D)FastText答案:BD解析:[多选题]143.以下算法,属于分类器都有哪些??A)朴素贝叶斯B)最大熵C)SVMD)神经网络答案:ABCD解析:[多选题]144.BP算法中最重要的两个环节,分别是什么?A)激励传播B)权重更新C)信息传播D)激活函数答案:AB解析:[多选题]145.过拟合既然是不好的现象,我们应该如何解决A)增加样本数量B)加入正则化C)Dropout降低模型复杂度D)减少迭代次数答案:ABCD解析:[多选题]146.聚类算法中应该注意的问题有哪些A)C值如何确定B)初始质心的选取C)质心的计算D)算法停止的条件答案:ABCD解析:[多选题]147.循环神经网络包含以下哪几种A)RNNB)CNNC)LSTMD)GRU答案:ACD解析:[多选题]148.下列四个选项中,哪些选项属于激活函数A)reluB)dropoutC)sigmoidD)softmax答案:ABCD解析:[多选题]149.在预处理阶段,我们一般将数据集分为哪几个类别A)训练集B)验证集C)测试集D)批处理集答案:ABC解析:[多选题]150.常用的聚类方法有()A)KMeansB)感知机C)NBMD)DBSCAN答案:AD解析:[多选题]151.无监督学习是机器学习算法中一个大分支,那么以下几个选项中属于无监督学习的是A)聚类B)降维C)分类D)回归答案:AB解析:[多选题]152.以下四个选项中,经典的概率模型有哪些?A)不确定B)古典概型C)几何概型D)以上都正确答案:BC解析:[多选题]153.类别特征处理,可以使用以下哪些方式A)序列编号B)线性回归C)独热编码D)SVM答案:AC解析:[多选题]154.以下关于概率图模型的表述正确的是A)有向图:贝叶斯网络B)有向图:马尔可夫随机场C)无向图:贝叶斯网络D)无向图:马尔可夫随机场答案:AD解析:[多选题]155.以下四个算法中,有哪些算法是属于决策树算法的A)SVMB)ID3C)C4.5D)CART答案:BCD解析:[多选题]156.以下哪几个?门?属于LSTMA)输入门B)遗忘门C)输出门D)更新门答案:ABC解析:[多选题]157.在神经网络中,如果单个神经元能解决什么问题A)与B)或C)非D)异或答案:ABC解析:[多选题]158.神经风格迁移也有非常广泛的应用,其中神经风格迁移过程包括?A)创建网络B)损失函数最小化C)梯度下降过程LOSS最小化D)数据清洗答案:ABC解析:[多选题]159.下列关于网络模型训练中的梯度消失问题,描述错误的都有哪些选项?A)梯度下降会增加学习次数B)多使用梯度爆炸,增加计算效率提升模型准确率C)梯度下降可以减少计算量,建议使用D)梯度爆炸会增大计算量,编写代码时避免梯度爆炸答案:BC解析:[多选题]160.以下四个选项中,可以把关键词转化为其基本形式的方法有哪些A)词形还原(Lemmatization)B)LevenshteinC)词干提取(Stemming)D)探测法(Soundex)答案:AC解析:[多选题]161.常用分类器有哪些A)朴素贝叶斯B)最大熵C)SVMD)神经网络答案:ABCD解析:[多选题]162.文本向量化的两种表示方法是。()A)独热编码B)Z-ScoreC)归一化D)词嵌入答案:AD解析:[多选题]163.概率图模型中的生成式模型与判别式模型在统计学角度与相比,有什么优点?A)适用较多类别的识别B)能更充分利用先验知识C)分类边界更灵活D)研究单类问题灵活性强答案:BD解析:[多选题]164.谷歌开源出来的BERT,一般可以用于下列哪些任务A)情感分析B)垃圾邮件过滤C)命名实体识别D)问答系统答案:ABCD解析:[多选题]165.以下是针对k-NN算法给出的两条陈述,其中哪一条是真的?A)我们可以借助交叉验证来选择k的最优值B)不能判断C)欧氏距离对每个特征一视同仁D)以上都正确答案:AC解析:[多选题]166.智能问答系统主要依靠的关键基础和技术包括以下哪些选项?()A)大量高质量的数据和知识B)强大的自然语言处理技术C)强大的机械语言处理技术D)需要大量的标准训练语料答案:ABD解析:[多选题]167.搜索是常见的NLP应用,那么以下几个选项中,哪些可能是实现搜索的一部分A)用协同过滤模型(CollaborativeFilteringmodel)来检测相似用户表现(查询)B)在术语中检查Levenshtein距离的模型C)将句子译成多种语言D)不确定答案:AB解析:[多选题]168.所有主题模型都基于以下()基本假设。A)每个文档包含多个主题B)每个主题包含多个词C)词由主题构成D)主题与词无关答案:AB解析:[多选题]169.自然语言处理应用?A)客服系统B)查找同义词C)道标识别D)文本挖掘答案:ABD解析:[多选题]170.下列哪些选项对于搜索参数的方式,是正确的?A)没有足够计算资源,通过每天观察,不断调整参数B)同时试验多种模型,获得学习曲线C)没有足够计算资源,通过试验多种模型,获得学习曲线D)拥有足够资源时,通过每天观察一个参数,来进行调整答案:AB解析:[多选题]171.当然朴素贝叶斯也有很多的缺点,以下关于它缺点描述正确的是?A)对缺失数据不太敏感B)分类效果不稳定C)先验模型可能导致结果不佳D)不适合增量式训练答案:AC解析:[多选题]172.以下是两个陈述。以下两个陈述中哪一项是正确的?A)k-NN是一种基于记忆的方法,即分类器会在我们收集新的训练数据时立即进行调整。B)不确定C)在最坏的情况下,新样本分类的计算复杂度随着训练数据集中样本数量的增加而线性增加D)以上都正确答案:AC解析:[多选题]173.ELMO分为哪两个阶段A)Pre-training(预训练)B)word-embedding(词嵌入)C)Feature-based(微调)D)不确定答案:AC解析:第3部分:判断题,共66题,请判断题目是否正确。[判断题]174.神经机器翻译是通过一个称为递归神经网络(RNN)的大型人工神经网络对整个过程进行建模的方法。A)正确B)错误答案:对解析:[判断题]175.随着批量数目增大,处理相同数据量的速度越快。A)正确B)错误答案:对解析:[判断题]176.one-hot表示的结果能保留词语在句子中的位置信息。错A)正确B)错误答案:错解析:[判断题]177.离散型的表示方式只有one-hotA)正确B)错误答案:错解析:[判断题]178.在做NLP任务时,数据处理是不可缺少的部分A)正确B)错误答案:对解析:[判断题]179.CrossEntropyLoss是tensorflow中动态优化器A)正确B)错误答案:错解析:[判断题]180.命名实体识别不是序列标注问题。错A)正确B)错误答案:错解析:[判断题]181.机器学习算法=模型表征+模型评估+优化算法。A)正确B)错误答案:对解析:[判断题]182.Relu激活函数,整个过程的计算量小A)正确B)错误答案:对解析:[判断题]183.BP算法和神经网络是相同的A)正确B)错误答案:错解析:[判断题]184.混淆矩阵也称误差矩阵A)正确B)错误答案:对解析:[判断题]185.上下文有关文法(1型)的分析算法过于复杂,不便于实际应用A)正确B)错误答案:对解析:[判断题]186.要确定最优状态序列,一种方法是把所有可能的状态序列的概率求出来,从中选出概率最大的序列。A)正确B)错误答案:对解析:[判断题]187.神经网络中非线性变换叫做传递函数或者激活函数A)正确B)错误答案:对解析:[判断题]188.在GRU中sigmoid激活函数的作用是作为一个"门"A)正确B)错误答案:对解析:[判断题]189.在简单的插值模型中,权值仅仅是一个常数。A)正确B)错误答案:对解析:[判断题]190.深度学习需要逐层的分析,而机器学习是端到端的学习A)正确B)错误答案:错解析:[判断题]191.laplace法则计算公式中T为训练实例的种类数A)正确B)错误答案:对解析:[判断题]192.语料库构建不包括结构性A)正确B)错误答案:错解析:[判断题]193.seq2seq和Transformer的模型结构是完全不相同A)正确B)错误答案:错解析:[判断题]194.s.startswith(t),测试是否以t开头A)正确B)错误答案:对解析:[判断题]195.通俗来讲,所谓因子图就是对函数进行因子分解得到的一种概率图A)正确B)错误答案:对解析:[判断题]196.NNLM和N-Gram是完全相同的A)正确B)错误答案:错解析:[判断题]197.为了进行中文的分词或者词性标注等处理,可以使用的导入模块语句为importjieba。对A)正确B)错误答案:对解析:[判断题]198.将隐马尔科夫模型表示成五元组的形式,其中V为发射概率集合。A)正确B)错误答案:错解析:[判断题]199.CBOW中是使用中心词预测上下文单词的A)正确B)错误答案:错解析:[判断题]200.GPT中最大的缺点就是不能解决一词多意问题A)正确B)错误答案:错解析:[判断题]201.深度学习省去了人工的提取特征,可以自动提取特征A)正确B)错误答案:对解析:[判断题]202.语料库是为某一个或多个应用而专门收集的、有一定结构的、有代表性的、可以被计算机程序检索的、具有一定规模的语料的集合。对A)正确B)错误答案:对解析:[判断题]203.LightGBM牺牲了一定的精度,但是提升了速度A)正确B)错误答案:错解析:[判断题]204.LightGBM占用的内存变大了A)正确B)错误答案:错解析:[判断题]205.特征归一化可以用到SVM,逻辑回归,线性回归等模型中A)正确B)错误答案:对解析:[判断题]206.RNN的多对一结构通常用于处理序列分类问题。对A)正确B)错误答案:对解析:[判断题]207.机器翻译是自然语言处理中最为人所熟知的场景,国内外有很多比较成熟的机器翻译产品,如百度翻译等。A)正确B)错误答案:对解析:[判断题]208.RNN是NLP的核心网络之一A)正确B)错误答案:对解析:[判断题]209.朴素贝叶斯分类是基于类条件独立假设A)正确B)错误答案:对解析:[判断题]210.XGBoost的本质其实就是一个随机森林A)正确B)错误答案:错解析:[判断题]211.交叉检验的缺点是:最初的训练数据比较少,所以得到的概率估计也不会太可靠A)正确B)错误答案:错解析:[判断题]212.支持向量是最靠近决策表面的数据点A)正确B)错误答案:对解析:[判断题]213.在LSTM中常用的激活函数有sigmoid和tanhA)正确B)错误答案:对解析:[判断题]214.Boosting方法(Schapire,1990)是一种用来提高弱(Weak)分类算法准确度的方法,识别错误率小于1/2,也即准确率仅比随机猜测略高。A)正确B)错误答案:对解析:[判断题]215.NLTK的nltk.corpus模块可用于语料库的获取。对A)正确B)错误答案:对解析:[判断题]216.感知机利用误分类最小策略,求得分离超平面,不过此时的解有无穷多个。A)正确B)错误答案:对解析:[判断题]217.在模型输入的时候,我们并不需要对文本进行处理A)正确B)错误答案:错解析:[判断题]218.LightGBM支持分布式和并行计算A)正确B)错误答案:对解析:[判断题]219.文本情感倾向性分析就是对网页进行舆情分析。错A)正确B)错误答案:错解析:[判断题]220.在自然语言领域RNN的特征提取效果不如CNN,因为CNN有卷积操作A)正确B)错误答案:错解析:[判断题]221.Excel支持正则表达式。对A)正确B)错误答案:对解析:[判断题]222.基于实例的学习的核心是两个实例间的相似度或成距离的度量A)正确B)错误答案:对解析:[判断题]223.XGBoost对GBDT的速度上和效率上做了很大的提升A)正确B)错误答案:对解析:[判断题]224.平行语料库的目的侧重于特定语言现象的对比A)正确B)错误答案:错解析:[判断题]225.好的初始估计对于发射概率是非常重要的。A)正确B)错误答案:对解析:[判断题]226.CNN卷积核(窗口)的大小是一个参数,可以自己选定A)正确B)错误答案:对解析:[判断题]227.决策树的学习目标是:根据给定的训练数据集合构建一个决策树模型,使它能够对实例进行正确的分类A)正确B

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论