人工智能自然语言技术练习(习题卷5)_第1页
人工智能自然语言技术练习(习题卷5)_第2页
人工智能自然语言技术练习(习题卷5)_第3页
人工智能自然语言技术练习(习题卷5)_第4页
人工智能自然语言技术练习(习题卷5)_第5页
已阅读5页,还剩49页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

试卷科目:人工智能自然语言技术练习人工智能自然语言技术练习(习题卷5)PAGE"pagenumber"pagenumber/SECTIONPAGES"numberofpages"numberofpages人工智能自然语言技术练习第1部分:单项选择题,共116题,每题只有一个正确答案,多选或少选均不得分。[单选题]1.如果对数据进行了归一化的处理,可以达到什么样的效果A)将所有的特征都统一到一个大致相同的数值区间内B)并无实际的意义C)不确定D)可以对数据进行等比例的扩大答案:A解析:[单选题]2.以下哪个手段不属于CNNA)局部连接B)权值共享C)池化操作D)多层次结构答案:D解析:[单选题]3.EM算法应用很广泛,它有什么优点?A)对初始值敏感B)简单性和普适性C)不同的初值可能得到不同的参数估计值D)不能保证找到全局最优值答案:B解析:[单选题]4.如果数据特征太多,需要对数据特征做降维操作,可以使用以下那种方式A)PCA降维B)K-MeansC)SVMD)岭回归答案:A解析:[单选题]5.在NLP的中多模型当中,N-Gram模型可以用来做什么A)预计或者评估一个句子是否合理B)可以做到文本翻译C)提取文本当中的主题D)可以做问答系统答案:A解析:[单选题]6.我们知道在概率图中有很多的节点,这些节点分别有什么意义A)随机变量B)关系C)代价D)学习率答案:A解析:[单选题]7.正则表达式的转义符是()A)\\B)\C);D)$$答案:A解析:[单选题]8.信息熵又叫什么?A)信息增益B)信息增益比C)基尼系数D)香农熵答案:D解析:[单选题]9.数据平滑方法不包括A)laplace法则B)绝对折扣C)交叉检验D)决策树答案:D解析:[单选题]10.如果网络中遇到了梯度爆炸问题,下列选项中哪个可以很好的解决?A)梯度剪切,正则B)增加拟合数据C)增加训练数据维度D)增加隐藏层答案:A解析:[单选题]11.关于语料库的叙述错误的是A)是指存放语言材料的数据库B)是指计算机存储的数字化语料库C)库中文本通常具有既定的格式与标记D)其中包含了词汇知识库答案:D解析:[单选题]12.BERT是一个什么样的模型A)预训练模型B)语言模型C)概率图模型D)不确定答案:A解析:[单选题]13.RNN是什么的简称A)全连接网络B)卷积神经网络C)循环神经网络D)感知机网络答案:C解析:[单选题]14.多分类问题中最经典的模型是()。A)CRF模型B)聚类模型,C)多项逻辑斯谛回归D)神经网络模型答案:A解析:[单选题]15.BP算法,其中的BP指的怎样传播?A)反向B)正向C)前后向D)全连接答案:A解析:[单选题]16.下列四个选项中,哪个选项指的是mini-batchA)小批量梯度下降B)随机梯度下降C)批量梯度下降D)小批量损失计算答案:A解析:[单选题]17.relu是常用的激活函数,它可以将小于()的数输出为0A)-1B)0C)1D)x答案:B解析:[单选题]18.XGBoost的基本核心思想是什么A)训练出来一个一次函数图像去描述数据B)训练出来一个二次函数图像去描述数据C)不断地添加树,不断地进行特征分裂来生长一棵树,每次添加一个树,其实是学习一个新函数f(x),去拟合上次预测的残差。D)不确定答案:C解析:[单选题]19.以下四个选项当中,哪个不是不是python的?魔法?方法是A)__enter__B)__len__C)__iter__D)__list__答案:D解析:[单选题]20.使用TensorFlow去定义常量的操作,以下正确得是?A)tensor=tf.constant(1)B)tensor=tf.constant([1,2])C)tensor=tf.constant(-1,shape=[2,3])D)a=tf.constant([1.0,2.0],name="a)答案:D解析:[单选题]21.以下四个模型中哪个不属于判别式式模型A)MEMMB)CRFC)HMMD)SVM答案:C解析:[单选题]22.关于失活函数dropout运行的描述正确的是?A)随机取消一些节点,只是用部分节点进行拟合运算,防止过拟合B)dropout能增加新样本防止过拟合C)dropout进行归一化操作,防止过拟合D)dropout通过给损失函数增加惩罚项,防止过拟合答案:A解析:[单选题]23.tf.abs对张量做什么操作A)求绝对值B)相减C)相除D)相加答案:A解析:[单选题]24.以下哪种情况会导致SVM算法性能下降?A)数据线性可分B)数据干净、格式整齐C)数据有噪声,有重复值D)不确定答案:C解析:[单选题]25.tf.reverse的正确说法是哪一项?A)沿着某一维度连结tensorB)沿着某一维度将tensor分离为num_splittensorsC)对tensor进行切片操作D)沿着某维度进行序列反转答案:D解析:[单选题]26.检索模型和生成模型由不同的应用,下面选项包含检索模型和生成式模型例子是哪个?A)基于词典的学习和词向量模型B)基于规则的学习和序列到序列模型C)词向量和句子到向量模型D)循环神经网络和卷积神经网络答案:B解析:BERT使用token嵌入、段嵌入(SegmentEmbedding)、位置嵌入(PositionEmbedding)。[单选题]27.先把连续的浮点特征值离散化成k个整数,构造一个宽度为k的直方图。是以下哪个算法的优化A)直方图算法算法B)带深度限制的Leaf-wise的叶子生长策略C)不确定D)直接支持类别特征答案:A解析:[单选题]28.TextRank是由__演变而来的A)TextrnnB)PageRankC)fastTextD)TextCNN答案:B解析:[单选题]29.以下几个算法中哪个不容易陷入过拟合A)未剪枝的决策树B)随机森林C)不加正则的线性回归D)不加正则的逻辑回归答案:B解析:[单选题]30.当样本较难确定时,可使用下列哪个抽样方法是:A)有放回的简单随机抽样B)无放回的简单随机抽样C)分层抽样D)渐进抽样答案:D解析:[单选题]31.NLP任务想要做的好,最基础的操作是什么A)文本的向量化B)下有任务的处理C)模型的选择D)都不正确答案:A解析:[单选题]32.人工智能NLP有很大的应用,那么下面哪些属于NLP的应用A)从图像中检测物体B)面部识别C)语音生物识别D)文本摘要答案:D解析:[单选题]33.以下四个选项中,那个是BERT的遮蔽A)TokenB)MASKC)RELUD)不确定答案:B解析:[单选题]34.可以接受非语言形式的信息作为输入,生成可读的文字属于什么任务类型A)文本分类B)文本生成C)文本翻译D)信息抽取答案:B解析:[单选题]35.逻辑回归是如何做分类的,为什么可以做分类A)因为使用了Y=W*X+b的函数表达式B)因为逻辑回归引入了激活函数做了非线性的变换C)因为逻辑回归使用了误差平方和作为目标函数D)因为逻辑处理的都是连续性数据答案:B解析:[单选题]36.下列哪部分不是专家系统的组成部分A)用户B)综合数据库C)推理机D)知识库答案:A解析:[单选题]37.高斯混合模型与K均值算法的相同点有哪些A)都是可用于分类的算法B)都是可用于聚类的算法C)都是可用于回归的算法D)都是可用于降维的算法答案:B解析:[单选题]38.隐马是建立在马尔科夫的基础上的,马尔科夫属于几元组模型A)1B)2C)3D)4答案:C解析:[单选题]39.朴素贝叶斯是以()为基础的分类方法。A)概率论B)线性代数C)微积分D)都不是答案:A解析:[单选题]40.什么是概率图模型,如何去理解概率图模型A)概率图模型是用图来表示变量概率依赖关系B)概率图是树状的结构C)概率图就是概率,是相同的D)不确定答案:A解析:[单选题]41.关于结构化数据,以下是哪个?A)数据库中的数据B)HTML文档C)文本D)图片答案:A解析:[单选题]42.自然语言处理()。A)就是像人一样听到语言,然后查找数据库识别声音。B)就是理解书面文字,翻译成另一种语言。C)理解自然界的各种声响,并加以解释。D)具备人类般文字处理能力,从文本中提取意义。答案:D解析:[单选题]43.sigmoid激活函数的曲线是什么样的A)直线B)A型曲线C)C型曲线D)S型曲线答案:D解析:[单选题]44.以下四个选项中哪个不属于深度模型框架A)tensorflowB)pytorchC)pandlepandleD)flyfly答案:D解析:[单选题]45.K-NN算法有什么特点A)KNN是一种非参的,惰性的算法模型B)KNN是一种基于划分的聚类C)KNN是一种异常值非常敏感的算法D)以上都正确答案:A解析:[单选题]46.假定使用阶数为2的线性核SVM,将模型应用到实际数据集上后,其训练准确率和测试准确率均为100%。现在增加模型复杂度(增加核函数的阶),会发生以下哪种情况?A)过拟合B)欠拟合C)什么都不会发生,因为模型准确率已经到达极限D)以上都不对答案:A解析:[单选题]47.能对发生故障的对象(系统或设备)进行处理,使其恢复正常工作的专家系统是()。A)修理专家系统B)诊断专家系统C)调试专家系统D)规划专家系统答案:A解析:[单选题]48.在同质集成(系统中个体学习器的类型相同)中,个体学习器又被称为A)基学习器B)组建学习C)不能判断D)以上都正确答案:A解析:[单选题]49.在进行神经网络建模时,需要对目标数据进行怎样的操作A)度量化B)抽象化C)具体化D)理想化答案:A解析:[单选题]50.NLP可以说是人工智能中最难的一个方向,那么它的难体现在哪个地方A)语言的多样性,多变性等B)算力能力的提升C)数据量变得很大D)算法没有更新答案:A解析:[单选题]51.在NLP虚拟环境中安装需要的程序包,并自动安装这个包的依赖项需要用()。A)pipB)condaC)condaD)pip答案:B解析:[单选题]52.以下哪个参数属于超参数?A)学习率B)激活值C)损失值D)偏置答案:A解析:[单选题]53.以下四个选项中,属于监督学习算法是哪个A)聚类B)降维C)回归算法D)PCA答案:C解析:[单选题]54.常用的聚类算法属于什么技术A)机器学习B)深度学习C)神经网络D)强化学习答案:A解析:[单选题]55.在NNLM模型中,它的模型框架是什么样的A)先编码再解码B)先计算一句话的条件概率然后再做特征映射C)先解码再编码D)输入经过一个特征映射然后计算条件概率分布答案:D解析:[单选题]56.()是指用NLP、文本挖掘和计算机语言学等方法对带有情感色彩的主观性文本进行分析、处理、归纳和推理的过程。A)关键词提取B)文本向量化C)文本情感分析D)智能问答答案:C解析:[单选题]57.概率图模型中使用的什么表示的变量的联合概率分布A)代价B)图C)信息D)以上都正确答案:B解析:[单选题]58.tf开始执行每个variable里的initializer的函数是哪个A)sess.runB)global_variables_initializer()C)variables_initializer()D)global_initializer()答案:B解析:[单选题]59.浅层句法分析方法大体分为两类,其一基于统计的方法,统计方法中不属于具有代表性的方法是A)基于HMM模型的方法B)Φ2统计方法C)互信息方法D)统计分组方法答案:D解析:[单选题]60.共现矩阵很容易造成稀疏和维度大的问题,应该怎么解决A)回归B)分类C)降维D)聚类答案:C解析:[单选题]61.GPT中舍弃了LSTM做特征提取,那么LSTM的缺点是什么A)无法捕捉更长的语义信息B)LSTM出现的早,所以不好C)可以捕捉更好的语义信息D)不确定答案:A解析:[单选题]62.以下几个机器学习算法中,哪个算法是比较常用的无监督学习算法A)聚类B)K-近邻算法C)回归算法D)决策树答案:A解析:[单选题]63.XGBoost中做了很多的改进,它的思想是什么A)BoostingB)BaggingC)StackingD)不确定答案:A解析:[单选题]64.以下哪些算法是聚类算法A)ID3B)C4.5C)K-MeansD)SVM答案:C解析:[单选题]65.哪个激活函数运行效率最高?A)reluB)tanhC)sigmoidD)不能确定答案:A解析:[单选题]66.计算机在处理向量肯定是比处理字符串更加方便,因此我们将字符串转换为向量的过程叫什么A)文本表示B)文本分类C)文本摘要D)文本挖掘答案:A解析:[单选题]67.以下选项中关于在图像特征经过几个卷积后,特征信号会发生怎样的变化:A)减弱B)不变C)增强D)都有可能答案:D解析:[单选题]68.以下四个任务中,逻辑回归可以做哪个A)数据降维B)垃圾邮件分类C)电影票房预测D)房价预测答案:B解析:[单选题]69.聚类算法是常用的算法,在以下四个选项中,哪个是聚类算法A)SVMB)KNNC)ID3D)K-Means答案:D解析:[单选题]70.对于词性标注的主要方法不包括()A)基于规则的方法B)基于统计的方法C)基于语义的标注方法D)基于统计的和基于规则的相结合的方法答案:C解析:[单选题]71.在传统的NLP中,语义层面是如何表示的A)使用深度学习直接过去结果B)手写大量的规则函数C)使用先进的算法的到结果D)以上都不正确答案:B解析:[单选题]72.EM算法应用广泛,它的求解原理是什么A)是通过寻找最优的自变量和因变量之间的一次函数关系B)通过寻找最优的超平面进行更好的分类C)是通过迭代,不断求解下界的极大化,来逐步求解对数似然函数极大化D)不确定答案:C解析:[单选题]73.下面哪种属于映射数据到新的空间的方法?A)傅立叶变换B)特征加权C)渐进抽样D)维归约答案:A解析:[单选题]74.在优化算法的计算当中,使用到了以下哪种方式A)标准差加权平均B)方差加权平均C)对数加权平均D)指数加权平均答案:D解析:[单选题]75.tf.concat的作用?A)相加B)两个张量拼接C)相减D)求绝对值答案:B解析:[单选题]76.GPT中使用的特征提取器是什么A)LSTMB)双向TransformerC)单向TransformerD)RNN答案:C解析:[单选题]77.以下哪个不属于LSTMA)输入门B)输出门C)更新门D)遗忘门答案:C解析:[单选题]78.在Katz回退算法中,将从非零计数中减去的计数量分配给A)计数为零的高元语法B)所有零概率事件C)未知事件D)A和C答案:A解析:[单选题]79.N元语法模型中一个词的出现和这个词之前的()个词有关A)0B)1C)N-1D)N答案:C解析:[单选题]80.什么是似然函数如何去理解似然函数?A)是一种关于统计模型中的参数的函数,表示模型参数中的似然性B)是一个最优的超平面用作分类C)是一个一次函数之间的关系D)是一种正则化的方式答案:A解析:[单选题]81.LDA的实质是在做一个什么东西A)根据给定的一篇文档,反推其主题B)可以找出来最优的分类超平面C)可以找到因变量和自变量之间的一次关系D)不确定答案:A解析:[单选题]82.BERT目前的到了很广泛的应用,那么BERT是哪个公司推出的A)百度B)华为C)FaceBokD)谷歌答案:D解析:[单选题]83.如果缺失值特别多,可以考虑如何做特征处理A)删除该特征B)逐个添加该特征C)直接使用该特征输入D)不确定答案:A解析:[单选题]84.面向对象的特质有:A)A:封装B)B:继承C)C:多态D)D:消息答案:D解析:[单选题]85.()是指用NLP、文本挖掘和计算机语言学等方法对带有情感色彩的主观性文本进行分析、处理、归纳和推理的过程。A)关键词提取B)文本向量化C)文本情感分析D)智能问答答案:C解析:[单选题]86.关于人工智能的RNN,将()信息带到下个环节中A)先前B)之后C)丢失D)LSTM答案:A解析:[单选题]87.下列哪种机器学习算法可用于估算分类变量和连续变量的缺失值?A)KNNB)线性回归C)Logistic回归D)K-Means答案:A解析:[单选题]88.什么激活函数,如何理解激活函数A)激活函数其实就是一个线性变换的过程B)激活函数并无实际意义C)上层节点的输出和下层节点的输入之间具有一个函数关系,这个函数称为激活函数D)使自变量与因变量之间存在一个Y=W*X+b的一次函数关系答案:C解析:[单选题]89.使用jieba库提供的(A)方法,可以对文本进行分词操作。A)cutB)splitC)BreakD)apart答案:B解析:[单选题]90.相比sigmoid函数性能好的激活函数是A)coshB)sinC)tanhD)sigmoid答案:C解析:[单选题]91.BERT-BASE的参数量有多大A)1亿B)2亿C)3亿D)4亿答案:A解析:[单选题]92.以下几个关于EM算法的说法,正确的是A)传统EM算法对初始值不敏感B)EM算法不能应用到HMM的求解中C)不确定D)传统EM算法对初始值敏感答案:D解析:[单选题]93.基于语义的文本表示的深度学习方法有哪些A)LDAB)LSIC)PLSID)wordembedding答案:B解析:[单选题]94.CART为什么用基尼系数来代替信息增益比A)基尼系数代表了纯度B)基尼系数代表了不纯度C)基尼系数越大,纯度越低D)基尼系数越小,特征越好答案:B解析:[单选题]95.下列Python中的预定义字符描述正确的是()。A)\w:与\W反义,非数字、非字母和非字B)\s:空白字符C)\D:数字D)\d:非数字答案:D解析:[单选题]96.下面哪个选项说的不是Batch归一化的作用A)减少了隐藏值分布变化的数量B)减少了输入值改变的问题C)有轻微的正则化效果D)增加了输入值改变的问题答案:D解析:[单选题]97.隐马尔科夫是几元祖模型A)2B)3C)4D)5答案:D解析:[单选题]98.在使用TensorFlow的过程中,如果想要打印某点值,应该怎么操作A)A=tf.run()B)A=S.valueC)A=S.eval()D)tf.assign()答案:A解析:[单选题]99.K-Means中的K应该如何去选择A)贪心法则B)马尔科夫C)肘部法则D)概率图答案:C解析:[单选题]100.在对文本进行分词时,哪些词可以去掉()A)中文:的,了,是B)中文:文本,可视化,大数据.C)英文:text,analytics,mooc...D)英文:the,A,bad,poor答案:A解析:[单选题]101.BP算法最早时,是在以下哪个任务中得到了最早的应用A)手写数字识别B)CPUC)GPUD)不确定答案:A解析:[单选题]102.下列选项中关于Batch归一化的描述,描述错误的是哪个?A)使参数搜索问题变得容易B)使神经网络对超参数的选择更加稳定C)超参数的范围更加庞大D)仅作用于输入层答案:D解析:[单选题]103.下列关于双向RNN结构说法正确的是()。A)只考虑预测词前面的词,并没有考虑该词后面的内容B)不仅从前往后保留该词前面的词的信息,而且还从后往前保留该词后面的词的信息C)不是由两个RNN上下叠加在一起组成D)输出与隐藏层的状态无关答案:B解析:[单选题]104.以下几个选项中关于ID3算法正确的是A)适用于二分类B)使用信息增益比选取特征C)能够很好的处理连续值D)不确定答案:A解析:[单选题]105.下列不属于机器学习中典型的分类方法的是()A)决策树B)Witten-Bell平滑算法C)贝叶斯分类器D)支持向量机答案:B解析:[单选题]106.正常的将数据集进行切分为三个集合,其中不包括下列哪个集合?A)测试集B)确认集C)验证集D)训练集答案:B解析:[单选题]107.CNN中设置多个卷积核是为了什么目的A)同时提取多个图像的特征B)提取某些图像多个特征C)图像有多个通道D)与多特征无关答案:B解析:[单选题]108.GBDT属于集成学习,因此它拥有哪些优点A)采用决策树作为弱分类器使得GBDT模型具有较好的解释性和鲁棒性,能够自动发现特征间的高阶关系。B)GBDT在高维稀疏的数据集上,表现不如支持向量机或者神经网络。C)GBDT在处理文本分类特征问题上,相对其他模型的优势不如它在处理数值特征时明显。D)训练过程需要串行训练,只能在决策树内部采用一些局部并行的手段提高训练速度。答案:A解析:[单选题]109.假如说特征过少,模型过于简单,可能会发生什么情况A)正常拟合B)过拟合C)欠拟合D)不确定答案:C解析:[单选题]110.造成自然语言处理困难的根本原因是自然语言文本和对话的各个层次上广泛存在的各种合样的()A)一致性或统一性B)复杂性或重复性C)歧义性或多义性D)一致性或多义性答案:C解析:[单选题]111.PCA将n维特征映射到k维特征后,k维特征的线性相关性如何?A)A:不确定B)B:线性相关C)C:线性无关D)D:线性关联答案:C解析:[单选题]112.在NLP当中,像Bi-Gram和TriGram这样的模型都属于什么模型A)N-GramB)Seq2seqC)TransformerD)Bert答案:A解析:[单选题]113.独热编码可以完成什么事情A)对数据进行向量化B)对数据进行特征缩放C)对特征进行归一化处理D)消除数据特征之间的量纲影响答案:A解析:[单选题]114.NLP中做多分类任务可以使用__激活函数?A)softmaxB)logicC)K-MeansD)SVD答案:A解析:[单选题]115.句法分析是自然语言处理中的关键技术之一,它是对输入的文本()进行分析得到句子的句法结构的处理过程A)单词B)句法C)句子D)数字答案:C解析:[单选题]116.SVM中有软间隔和硬间隔的概念,以下对于硬间隔解释正确的是?A)SVM只允许极小误差B)SVM允许分类时出现一定范围的误差C)二者都不对D)不确定答案:A解析:第2部分:多项选择题,共57题,每题至少两个正确答案,多选或少选均不得分。[多选题]117.语料库标注的目的()A)提高语料价值B)获取更多知识和信息C)为词典编募服务D)实现语料功能多样化答案:ABD解析:[多选题]118.word2vc中的CBOW模型有什么特点特点和步骤有哪些A)无隐层B)与上下文的词序无关C)使用了上下文窗口预测中心词D)投影层求和(平均)答案:ABCD解析:[多选题]119.卷积神经网络包括以下哪项A)局部连接B)权值共享C)多层次结构D)池化操作答案:ABD解析:[多选题]120.集成学习主要有哪几种框架?工作过程是?A)BaggingB)BoostingC)StackingD)以上都正确答案:ABCD解析:[多选题]121.以下的几个任务中,哪些任务属于自然语言领域的A)人脸检测B)机器翻译C)图像识别D)会话机器人答案:BD解析:[多选题]122.NLP可以解决下面的哪些任务A)文本摘要B)机器翻译C)阅读理解D)以上都不正确答案:ABC解析:[多选题]123.以下选项中,描述的反向传播算法的过程正确的是?A)初始化联结权重Wij,对于输入的训练样本,求取每个节点输出和最终输出层的输出值B)对输出层求取偏导数C)对于隐藏层求取偏导数D)求取输出误差对于每个权重的梯度,更新权重答案:ABCD解析:[多选题]124.以下模型中使用Transformer的是___?A)ELMOB)BERTC)GPTD)Word2Vec答案:BC解析:[多选题]125.以下属于判别式模型的都有()?A)HMMB)SVMC)CRFD)MEMM答案:BCD解析:[多选题]126.特征清洗中包括以下哪些操作A)清洗异常样本B)数据不均衡C)归一化D)样本权重答案:ACD解析:[多选题]127.GateRecurrentUnit的门包括下面哪几项A)更新门B)遗忘门C)输入门D)重置门答案:AD解析:[多选题]128.Stacking的操作可以分为哪些阶段A)Aggregating阶段,将上一个阶段训练得到的n个基模型组合起来,共同做决策。在分类任务中,可采用投票法,比如相对多数投票法,将结果预测为得票最多的类别。而在回归任务中可采用平均法,即将每个基模型预测得到的结果进行简单平均或加权平均来获得最终的预测结果。B)Boostrap阶段,即采用有放回的采样方式,将训练集分为n个子样本集;并用基学习器对每组样本分布进行训练,得到n个基模型C)分别采用全部的训练样本来训练n个组件模型,要求这些个体学习器必须异构的,比如可以分别是线性学习器,SVM,决策树模型和深度学习模型。D)训练一个元模型(meta-model)来将各个组件模型的输出结果进行结合,具体过程就是将各个学习器在训练集上得到的预测结果作为训练特征和训练集的真实结果组成新的训练集;然后用这个新组成的训练集来训练一个元模型。这个元模型可以是线性模型或者树模型。答案:BC解析:[多选题]129.字符串匹配计算相似度的方法有哪些A)汉明距离B)余弦相似度C)简单共有词D)编辑距离答案:ABCD解析:[多选题]130.seq2seq中加入Attention的作用A)把输入编码成一个固定的向量当中B)把输入编码成一个向量序列当中C)解码器解码时不同step所分配的注意力是不同的D)无实际性的意义答案:BD解析:[多选题]131.语料库的用途有()A)用于语言研究B)用于编纂工具参考书籍C)用于语言教学D)用于NLP答案:ABCD解析:[多选题]132.自然语言处理技术的应用有()A)机器翻译技术B)语音识别技术C)语音合成技术D)文本分析程序答案:ABCD解析:[多选题]133.以下几个任务中哪些可以用线性回归接近A)票房预测B)判断个人信用C)垃圾邮件分类D)房价预测答案:ABD解析:[多选题]134.神经网络一般是由多层构成的一个网络,一般分别由哪些层构成A)隐藏层B)输入层C)输出层D)不确定答案:ABC解析:[多选题]135.寻找数据集中的关系是为了寻找精确、方便并且有价值地总结了数据的某一特征的表示,这个过程包括了以下哪些步骤?A)决定要使用的表示的特征和结构B)决定如何量化和比较不同表示拟合数据的好坏C)选择一个算法过程使评分函数最优D)决定用什么样的数据管理原则以高效地实现算法。答案:ABCD解析:[多选题]136.以下关于NNLM的几种说法正确的有哪些A)从语言模型出发,将模型最优化的过程转换为求词向量表示的过程B)使用了非对称的前项窗口C)滑动窗口便利整个语料库D)计算量正比语料库的大小答案:ABCD解析:[多选题]137.数据切分阶段中,下列关于训练集和验证集的划分,有哪些描述正确的?A)不一定需要验证集B)数据集数量较少时,训练集和测试集比例可以是7:3C)大数据量的验证集,可以不遵循训练集和测试集比例7:3的原则D)任何数量的数据集,都应遵守训练集和测试集比例7:3的原则答案:ABC解析:[多选题]138.EM算法在高斯混合模型中的应用包含哪些步骤A)明确隐变量,写出完全数据的对数似然函数。B)EM算法的E步:确定Q函数C)求Q函数对theta的极大值,即求新一轮迭代的模型参数。D)以上都正确答案:ABCD解析:[多选题]139.下列哪些是叙述KNN最近邻分类算法的过程A)计算训练样本和测试样本中每个样本点的距离(常见的距离度量有欧式距离,马氏距离等)B)对上面所有的距离值进行排序C)选前k个最小距离的样本D)根据这k个样本的标签进行投票,得到最后的分类类别;答案:ABCD解析:[多选题]140.可以排成序列的类型有:A)语音识别B)情感分类C)机器翻译D)DNA序列分析答案:ABCD解析:[多选题]141.下列关于搜索参数的方式,描述正确的选项有哪些?A)没有足够计算资源,通过每天观察,不断调整参数B)同时试验多种模型,获得学习曲线C)没有足够计算资源,通过试验多种模型,获得学习曲线D)拥有足够资源时,通过每天观察一个参数,来进行调整答案:AB解析:[多选题]142.NLP的目标A)让计算机处理或者?理解?自然语言,以完成有意义的任务B)一门计算机科学、人工智能以及语言学的交叉学科C)完全理解和表达语言是极其困难的D)完美的语言理解等同于实现人工智能答案:ACD解析:[多选题]143.常见的词嵌入算法有哪些?()A)Word2VecB)TextRankC)AHPD)Doc2Vec答案:AD解析:[多选题]144.哪些属于序列数据A)语音识别B)情感分类C)机器翻译D)DNA序列分析答案:ABCD解析:[多选题]145.可以通过以下哪些方式提取词向量特征A)静态(word2vec)B)非静态(fine-tunning)C)one-hotD)以上都正确答案:AB解析:[多选题]146.对情感分析的研究到目前为止主要集中在以下哪些方面?()A)识别给定的文本实体是主观的还是客观的B)识别文本的前后联系C)识别文本的含义D)识别主观的文本的极性答案:AD解析:[多选题]147.进行前向算法需要有哪两项A)权重wB)正弦函数C)激活函数D)余弦函数答案:AC解析:[多选题]148.关于特征工程正则化的描述,下列正确的有哪些?A)正则化可以防止欠拟合B)正则化可以防止过拟合C)dropout具有正则化效果D)relu函数具有正则化效果答案:BC解析:[多选题]149.在代价函数上加入一个正则项,我们可以使用以下哪种A)L1B)L2C)余弦公式D)正弦公式答案:AB解析:[多选题]150.词向量的模型一直在发展,那么词向量的模型到底有什么意义A)词向量是各种模型框架的基础,只有编码成更好的词向量才会得到更好的效果B)无实际性的意义C)随着不断的发展词向量化的程度越来越复杂,且效果不好D)随着不断的发展,向量中包含的语义信息越来越强答案:AD解析:[多选题]151.以下四个选项中,哪些是人工智能的三个主要流派A)符号主义B)连接主义C)行为主义D)机器学习答案:ABC解析:[多选题]152.NLP方向的常见成品有哪些A)知识图谱B)机器人C)人脸检测D)推荐系统答案:ABD解析:[多选题]153.深度学习现在大火,那么主要得益于哪些原因?A)新方法的出现,为神经网络深度的拓展解决了梯度弥散的问题;B)大量已标注数据的出现,为神经网络的训练做好了数据准备;C)GPU(图形处理器)的使用,为卷积计算提供了高速解决方案D)深度学习等于人工智能答案:ABC解析:[多选题]154.以前为什么深度学习不火,而最近几年的到了很大的发展呢?A)算力的能力上升B)算法有了很大的发展C)更好的正则化和优化方法D)数据量变得越来越大答案:ABCD解析:[多选题]155.如果我们想做一个非线性的变换,可以使用以下哪种方式A)L1B)ReluC)SigmoidD)L2答案:BC解析:[多选题]156.one-hot做此编码的时候会出现什么问题A)造成维度太小,导致特征不全B)不会造成不好的影响C)造成维度爆炸D)向量过于稀疏并且毫无关联答案:CD解析:[多选题]157.在概率图模型当中分别有哪几种边A)有向边B)不确定C)无向边D)以上都正确答案:AB解析:[多选题]158.神经网络中超参数调试方法A)随机选择点来试验超参数效果B)当你给超参数取值时,另一个惯例是采用由粗糙到精细的策略。C)只调试容易的D)给定默认值即可答案:AB解析:[多选题]159.seq2seq+Attention可以做下列哪些任务A)意图识别B)机器翻译C)文本摘要D)标题的提取答案:ABCD解析:[多选题]160.NLP所研究的范畴包括哪些?A)信息抽取B)问答系统C)数据预处理D)模型构建答案:AB解析:[多选题]161.下列选项中SVM可以调节的参数是?A)CB)kernelC)degreeD)gamma答案:ABCD解析:[多选题]162.生成式模型相比判别式模型有什么优点?A)适用较多类别的识别B)能更充分利用先验知识C)分类边界更灵活D)研究单类问题灵活性强答案:BD解析:[多选题]163.优化CBOW可以从以下哪些方面入手A)将CBOW中最后一层的softmax转化成层次softmaxB)将CBOW中的最后一层的softmax转化为负例采样的方式C)将CBOW中的最后一层的softmax转换为logic回归D)以上都是答案:AB解析:[多选题]164.Stacking都有哪些阶段,分别是怎么做的?A)Aggregating阶段,将上一个阶段训练得到的n个基模型组合起来,共同做决策。在分类任务中,可采用投票法,比如相对多数投票法,将结果预测为得票最多的类别。而在回归任务中可采用平均法,即将每个基模型预测得到的结果进行简单平均或加权平均来获得最终的预测结果。B)Boostrap阶段,即采用有放回的采样方式,将训练集分为n个子样本集;并用基学习器对每组样本分布进行训练,得到n个基模型C)分别采用全部的训练样本来训练n个组件模型,要求这些个体学习器必须异构的,比如可以分别是线性学习器,SVM,决策树模型和深度学习模型。D)训练一个元模型(meta-model)来将各个组件模型的输出结果进行结合,具体过程就是将各个学习器在训练集上得到的预测结果作为训练特征和训练集的真实结果组成新的训练集;然后用这个新组成的训练集来训练一个元模型。这个元模型可以是线性模型或者树模型。答案:BC解析:[多选题]165.常见的几种最优化的方法有哪些A)梯度下降法B)牛顿法C)拟牛顿法D)共轭梯度法答案:ABCD解析:[多选题]166.tf.train.AdamOptimizer(1e-4).minimize(cross_entropy),以下四个选项中,关于上述代码描述正确的是哪些选项A)定义学习步长B)优化器C)交叉熵损失函数D)开始训练答案:ABC解析:[多选题]167.以下的四个算法中,哪些算法在输入的阶段需要做特征处理A)决策树B)线性回归C)逻辑回归D)SVM答案:BCD解析:[多选题]168.CBOW模型的神经网络包含了()A)输入层B)隐藏层C)输出层D)全连接层答案:ABC解析:[多选题]169.Adam算法是结合了()和()一起A)RMSprop算法B)均方误差C)Momentum算法D)交叉熵答案:AC解析:[多选题]170.以下属于关键字提取算法的是哪些??A)TF-IDFB)TextRnnC)TextRankD)RNN答案:AC解析:[多选题]171.隐马等生产式模型存在的问题A)列举观察值会比较困难B)每个元素之间相互独立,任何时刻的观察值只和状态有关C)列举观察会比较容易D)以上都正确答案:AB解析:[多选题]172.为什么XGBoost要用泰勒展开,优势在哪里?A)XGBoost使用了一阶和二阶偏导B)二阶导数有利于梯度下降的更快更准C)使用泰勒展开取得函数做自变量的二阶导数形式D)可以在不选定损失函数具体形式的情况下,仅仅依靠输入数据的值就可以进行叶子分裂优化计算答案:ABCD解析:[多选题]173.决策树中通常有哪些操作步骤A)特征缩放B)特征选择C)决策树生成D)决策树修剪答案:BCD解析:第3部分:判断题,共66题,请判断题目是否正确。[判断题]174.word2vec+余弦相似度可以做文本分类A)正确B)错误答案:错解析:[判断题]175.seq2seq是经典的预训练语言模型A)正确B)错误答案:错解析:[判断题]176.BERT中没有位置的嵌入,之后segembedding和wordembeddingA)正确B)错误答案:错解析:[判断题]177.ELMO有两个阶段构成:预训练和微调A)正确B)错误答案:对解析:[判断题]178.当数据输入到决策树中前,必须要做特征工程A)正确B)错误答案:错解析:[判断题]179.RNN循环神经网络是自然语言中常用的网络A)正确B)错误答案:对解析:[判断题]180.XGBoost使用的是Boosting方法,而GBDT使用的是Bagging方法A)正确B)错误答案:错解析:[判断题]181.NLP的最终目的应该是在语法理解的基础上实现相应的操作。()A)正确B)错误答案:错解析:[判断题]182.机器学习的K-Means算法可用于文本聚类。对A)正确B)错误答案:对解析:[判断题]183.按语料库的用途可划分为通用语料库和专用语料库A)正确B)错误答案:对解析:[判断题]184.KNN模型训练所消耗的时间跟选择的K有关A)正确B)错误答案:对解析:[判断题]185.CNN在NLP中也有一些应用,比如textCNN做文本分类任务A)正确B)错误答案:对解析:[判断题]186.将文字信息转成语音的技术叫语音合成A)正确B)错误答案:对解析:[判断题]187.XGBoost本质上还是一个GBDT,但是力争把速度和效率发挥到极致A)正确B)错误答案:对解析:[判断题]188.随着深度学习技术的广泛应用,基于神经网络的文本向量化已经成为NLP领域的研究热点,尤其是以词为单位的向量化。对A)正确B)错误答案:对解析:[判断题]189.专家系统的结构包含人机界面、知识库,推理机,动态数据库,知识库答理系统和解释模块。A)正确B)错误答案:对解析:[判断题]190.正则文法(3型)通常用于句法分析A)正确B)错误答案:错解析:[判断题]191.fdist.keys(),以频率递增顺序排序样本链表A)正确B)错误答案:错解析:[判断题]192.特征工程旨在去除原始数据中的杂质和冗余A)正确B)错误答案:对解析:[判断题]193.对于深层网络,sigmoid函数反向传播时,很容易就会出现梯度消失的情况A)正确B)错误答案:对解析:[判断题]194.正则表达式是一个描述字符模式的对象。对A)正确B)错误答案:对解析:[判断题]195.BOW模型首先对文本进行分词,然后统计每个词在文档中出现的次数。对A)正确B)错误答案:对解析:[判断题]196.基于知识工程的分类方法,指通过计算机自主学习、提取规则进行的分类。错A)正确B)错误答案:错解析:[判断题]197.决策树(decisiontree):是一种基本的分类与回归方法A)正确B)错误答案:对解析:[判断题]198.规则方法就是根据人工书写的或(半)自动获取的语法规则标注出短语的边界和短语的类型A)正确B)错误答案:对解析:[判断题]199.SVM是机器学习中经典的算法,在NLP中也有很多的应用,例如:rasa机器人A)正确B)错误答案:对解析:[判断题]200.理性主义方法又称基于规则的方法。()A)正确B)错误答案:对解析:[判断题]201.通过降低神经网络参数量来减缓过拟合,用正则化或者dropout。A)正确B)错误答案:对解析:[判断题]202.字频统计是词汇获取的最基本工作。A)正确B)错误答案:对解析:[判断题]203.朴素贝叶斯(NaiveBayesian)是经典的机器学习算法之一,也是为数不多的基于概率论的分类算法A)正确B)错误答案:对解析:[判断题]204.K-MEANS是基于层次的聚类A)正确B)错误答案:错解析:[判断题]205.LDA可以将文档集中每篇文档的主题以概率分布的形式给出,从而通过分析一些文档抽取出它们的主题(分布)出来后,便可以根据主题(分布)进行主题聚类或文本分类A)正确B)错误答案:对解析:[判断题]206.批量的大小(batch_size)选择的越大越好A)正确B)错误答案:错解析:[判断题]207.LEXAS为每个歧义词建立一个分类器A)正确B)错误答案:对解析:[判断题]208.中文文本分析不需要分词。错A)正确B)错误答案:错解析:[判断题]209.森林中每棵树的分类能力:每棵树的分类能力越强,整个森林的错误率越大A)正确B)错误答案:错解析:[判断题]210.正则表达式可用于特殊字符过滤。对A)正确B)错误答案:对解析:[判断题]211.自然语言生成的工作过程是从抽象的概念层次开始,通过选择并执行一定的语义和语法规则生成文本。()A)正确B)错误答案:对解析:[判断题]212.LSTM网络可应用于文本分类任务。对A)正确B)错误答案:对解析:[判断题]213.分隔超平面所产生的分类结果是最鲁棒的,对未知实例的泛化能力最弱A)正确B)错误答案:错解析:[判断题]214.常用的损失函数之后均方误差MSEA)正确B)错误答案:错解析:[判断题]215.作为深度学习中的神经网络在进行预训练时可以将所有参数全部初始化为0A)正确B)错误答案:错解析:[判断题]216.softmax输出单元从多个变成了一个。A)正确B)错误答案:错解析:[判断题]217.例如CNN,RNN目的是为了更好的做特征提取A)正确B)错误答案:对解析:[判断题]218.seq2seq不是一种编解码模型A)正确B)错误答案:错解析:[判断题]219.深度学习的发展主要因为数据量的提升,并且硬件算力的提升,和算法的更新A)正确B)错误答案:对解析:[判断题]220.语句fromnltkimportpos_tag是用于导入nltk中的英文词性标注模块。对A)正确B)错误答案:对解析:[判断题]221.KNN算法和K-Means没有任何区别A)正确B)错误答案:错解析:[判断题]222.准确率就是所有的预测正确(正类负类)的占总的比重。A)正确B)错误答案:对解析:[判断题]223.歧义是自然语言中普遍存在的现象,广泛地存在于词法、句法、语义、语用和语音等各个层面。()A)正确B)错误答案:对解析:

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论