人工智能自然语言技术练习(习题卷1)_第1页
人工智能自然语言技术练习(习题卷1)_第2页
人工智能自然语言技术练习(习题卷1)_第3页
人工智能自然语言技术练习(习题卷1)_第4页
人工智能自然语言技术练习(习题卷1)_第5页
已阅读5页,还剩49页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

试卷科目:人工智能自然语言技术练习人工智能自然语言技术练习(习题卷1)PAGE"pagenumber"pagenumber/SECTIONPAGES"numberofpages"numberofpages人工智能自然语言技术练习第1部分:单项选择题,共116题,每题只有一个正确答案,多选或少选均不得分。[单选题]1.在使用EM算法的时候可能会出现以下什么问题(弊端)A)算法快速收敛B)可能达到局部最优C)不确定D)使梯度的计算更便捷答案:B解析:[单选题]2.人工智能中regularization的作用A)防止过拟合B)边缘检测C)提取特征D)简化数据答案:A解析:[单选题]3.在NLP的应用当中,估计条件概率常用的方法是什么A)交叉熵函数B)信息熵函数C)加和求平均D)极大似然估计答案:D解析:[单选题]4.在NLP中的实体识别任务中,如果使用Bi-LSTM+CRF框架,Bi-LSTM是什么作用A)从前向后,单向提取特征B)从后向前,单向提取特征C)从前向后,从后向前,双向提取特征D)不确定答案:C解析:[单选题]5.常用的激活函数relu,下列对该激活函数描述正确的是?A)引用了无效的单元格地址B)过滤无效神经元C)不是激发函数D)将正数保留,将负数置0答案:D解析:[单选题]6.马尔可夫模型属于A)定性安全评价方法B)概率风险评判法C)伤害范围评价法D)危险指数评价法答案:B解析:[单选题]7.正则表达式()A)属于C#B)属于jsC)属于javaD)不属于任何语言,但大多数语言都有对他的支持答案:D解析:[单选题]8.激活函数也在不断的更新,以下哪个激活函数是在Relu的基础上优化的A)sigmoidB)tanhC)reluD)Leakyrelu答案:D解析:[单选题]9.每个Transformer编码器中的第一层是__?A)前馈神经网络B)AttentionC)Self-AttentionD)不确定答案:A解析:[单选题]10.所有的预测正确(正类负类)的占总的比重,这种计算方法可以计算?A)召回率B)准确率C)精准率D)F1值答案:B解析:[单选题]11.tf.abs的作用是什么A)相加B)相减C)相除D)求绝对值答案:D解析:[单选题]12.以下四个选项中,哪个激活函数的的输出在0~1的范围之间A)reluB)tanhC)LeakyReluD)sigmoid答案:D解析:[单选题]13.以下四个选项中,其中有哪些算法是基于规则的分类器A)C4.5B)KNNC)NaveBayesD)ANN答案:A解析:[单选题]14.关于距离空间其主要目的是A)求相关性B)构成线性空间C)度量后比较D)求信息熵答案:C解析:[单选题]15.以下关于机器学习算法与传统基于规则方法的区别中不正确的是A)传统的基于规则的方法,其中的规律可以人工显性的明确出来B)传统基于规则的方法使用显性编程来解决问题C)机器学习中模型的映射关系是自动学习的D)机器学习算法不包括深度学习答案:D解析:[单选题]16.relu()会将小于()输出为零A)-1B)0C)1D)x答案:B解析:[单选题]17.以下四个选项中关于二项分布说法正确的是A)连续型分布B)离散型分布C)正态分布D)伽玛分布答案:B解析:[单选题]18.TextRank可以提取到关键词那么它是由哪个算法发展来的?A)TextRnnB)TextCNNC)FasttextD)PageRank答案:D解析:[单选题]19.XGBoost中加入正则化会怎么样A)可以防止欠拟合B)可以增加模型的泛化能力C)可以增加模型的复杂度D)以上都是答案:B解析:[单选题]20.可以使一个词有多个嵌入方式的模型是哪个A)GloVeB)Word2VecC)ELMoD)Nltk答案:C解析:ELMo(EmbeddingsfromLanguageModels)词嵌入支持同一个词的多个嵌入,这有助于在不同的上下文中使用同一个词,从而捕获上下文而不仅仅是词的意思,这与GloVe、Word2Vec不同。Nltk不是词嵌入。[单选题]21.在NLP中面临的解决解码问题可以用什么算法A)前向算法B)后向算法C)Viterbi算法D)Baum-Welch算法答案:C解析:[单选题]22.激活函数的应用面非常广泛,以下四个选项中属于激活函数的是A)sigmoidB)L1C)L2D)MSE答案:A解析:[单选题]23.移进归约算法主要一共有几种操作?A)1B)2C)3D)4答案:D解析:[单选题]24.下列算法中,属于分类算法的是()A)DBSCANB)C4.5C)K-MeansD)EM答案:B解析:[单选题]25.自然语言处理的英文缩写是()。A)NLPB)AIC)DFSD)TCP/IP答案:A解析:[单选题]26.()是一种基于图的文本排序算法,它可以用于自动摘要和提取关键词。A)TF-IDF算法B)TextRank算法C)LDA算法D)主题模型答案:B解析:[单选题]27.最基本的文本预处理手段是()A)提取主题B)情感分析C)分词D)时序分析答案:C解析:[单选题]28.sigmoid求导之后的取值范围是多少?A)(0,0.1]B)(0,0.2]C)(0,0.25]D)(0,0.5]答案:C解析:[单选题]29.Bagging在做分类的Voting过程中(每个基学习器进行投票)如何做的A)每个基学习器预测结果进行平均B)每个基学习器预测结果进行投票,得票数最多的类为预测类C)从众多分类结果中,随机出来一个结果D)不去定答案:B解析:[单选题]30.TF-DF算法的主要思想是()A)字词的重要性随着它在文档中出现次数的增加而上升,随着它在语料库中出现频率的升高而下降B)字词的重要性随着它在文档中出现次数的增加而下降,随着它在语料库中出现频率的升高而下降C)字词的重要性随着它在文档中出现次数的增加而下降,随着它在语料库中出现频率的升高而上升D)字词的重要性随着它在文档中出现次数的增加而上升,随着它在语料库中出现频率的升高而上升答案:A解析:[单选题]31.向量空间也可以称为(),它属于线性代数内容和范畴A)线性空间B)内积空间C)赋范空间D)希尔伯特空间答案:A解析:[单选题]32.什么是类别特征,如何理解类别特征A)只在有限选项内取值的特征B)消除数据特征之间的量纲影响C)对特征进行归一化处理D)使得不同指标之间具有可比性答案:A解析:[单选题]33.关于信息熵说法正确的是A)信息熵是消除不确定性所需信息量的度量,也即未知事件可能含有的信息量。B)信息熵就是极大似然函数C)信息熵就是代价函数D)不确定答案:A解析:[单选题]34.以下哪个是激活函数呢?A)sigmodeB)tanhC)EELUD)PLU答案:B解析:[单选题]35.经常会用到的马尔科夫假设,它是个几元组模型A)1B)2C)3D)4答案:C解析:[单选题]36.在下列几关于mini-batch的说法当中,描述错误的是哪个?A)指的是批量梯度下降B)适用于样本量小的数据集C)每一次只运算部分数据,最后将全部数据进行运算D)适用于样本量大的数据答案:B解析:[单选题]37.RNN中常用到Tanh激活函数,它在求导之后的取值范围是多少A)(0,1)B)(-1,1)C)(0,0.5)D)0或1答案:A解析:[单选题]38.通常所说的字符编码有两种意思,一是指输入编码,二是指()A)输出编码B)机内编码C)程序编码D)机械编码答案:B解析:[单选题]39.下面哪个是SVM在实际生活中的应用?A)文本分类B)图片分类C)新闻聚类D)以上都对答案:D解析:[单选题]40.如果说文本中出现多意现象,需要把上下文连接起来,可以怎么做A)随机森林分类器B)卷积神经网络C)梯度爆炸D)上述所有方法答案:B解析:CNN是文本分类问题中比较受欢迎的选择,因为它们把上下文的文本当作特征来考虑,这样可以解决多义问题。[单选题]41.下面哪个与过拟合问题有关?A)DorpoutB)正则化C)批规范化D)以上技术均可以答案:D解析:[单选题]42.预处理是必不可少的阶段,以下哪一项不是预处理技术?A)词干提取和词形还原(StemmingandLemmatization)B)转换成小写(ConvertingtoLowercase)C)情绪分析(SentimentAnalysis)D)删除标点符号(RemovePunctuation)答案:C解析:情绪分析不是一种预处理技术。它是在预处理之后完成的,是一个NLP用例。所有其他列出的都用作语句预处理的一部分。[单选题]43.1-NN,2-NN,3-NN所花费的时间之间是什么关系。A)1-NN>2-NN>3-NNB)1-NN<2-NN<3-NNC)1-NN~2-NN~3-NND)这些都不是答案:C解析:[单选题]44.TensorFlow是一个开放源码的软件库,通常它有哪些版本A)CPU,GPU,TPUB)CPU,GPUC)CPUD)TPU答案:A解析:[单选题]45.下面那个是文本分类的算法A)PCAB)LDAC)K-meansIID)FastText答案:D解析:[单选题]46.CRF又叫什么A)拉索回归B)支持向量机C)隐马尔科夫D)条件随机场答案:D解析:[单选题]47.什么是贝叶斯的决策,如何去理解A)就是判断自变量和因变量之间的关系B)就是在不完全情况下,对部分未知的状态用主观概率估计,然后用贝叶斯公式对发生概率进行修正,最后再利用期望值和修正概率做出最有决策。C)不确定D)就是通过选择最优的超平面去进行最好的分类超平面答案:B解析:[单选题]48.聚类算法,是哪种学习方式A)有监督B)无监督C)半监督D)强化学习答案:B解析:[单选题]49.机器翻译是NLP中的常见任务,以下模型中哪个可以做机器翻译?A)KNNB)SVMC)Seq2seqD)SVD答案:C解析:[单选题]50.实验测得四组(x,y)的值为(1,2),(2,3),(3,4),(4,5),则y与x之间的回归直线方程为A)y=x+1B)y=x+2C)y=x-1D)y=2x+1答案:A解析:[单选题]51.关于对于数据切分的问题,以下说法正确的是?A)可以不设置训练集B)可以不设置测试集C)可以不设置验证集D)不确定答案:C解析:[单选题]52.以下四个模型中,哪个可以做NLP中的机器翻译任务A)LSAB)seq2seqC)TextFastD)LSTM答案:B解析:[单选题]53.BiGram中的滑动窗口多大A)2B)3C)4D)1答案:A解析:[单选题]54.()是一种基于图的文本排序算法,它可以用于自动摘要和提取关键词。A)TF-IDF算法B)TextRank算法C)LDA算法D)主题模型答案:B解析:[单选题]55.在网络模型的构建中,关于dropout运行的描述正确的是哪个?A)dropout能增加新样本防止过拟合B)随机取消一些节点,只是用部分节点进行拟合运算,防止过拟合C)dropout进行归一化操作,防止过拟合D)dropout通过给损失函数增加惩罚项,防止过拟合答案:B解析:[单选题]56.下列哪项不是词义消歧方法A)基于语法的方法B)基于词典的方法C)基于语料库的方法D)基于规则的方法答案:A解析:[单选题]57.下列不是自然语言处理中用到的知识的是()。A)语音学知识B)词法学知识C)汉语学知识D)话语学知识答案:C解析:[单选题]58.决策树有可能会造成什么缺点A)可能会对缺失值很敏感B)无法处理不相关的数据C)可能产生过渡匹配问题D)计算的复杂度很高答案:C解析:[单选题]59.贝叶斯判别规则是什么A)就是判断自变量和因变量之间的关系B)把特征向量X落入某类集群wi的条件概率平P(wi/X)当成分类判别函数,把X落入某集群的条件概率最大的类为X的分类这种判别规则叫贝叶斯判别规则C)不确定D)就是通过选择最优的超平面去进行最好的分类超平面答案:B解析:[单选题]60.贝叶斯可以用什么图去进行表示A)无向图B)有无向图C)有向图D)不确定答案:C解析:[单选题]61.tf.reshape有什么作用A)插入维度1进入一个tensor中B)改变tensor的形状C)改变tensor的数据类型D)转为32位整型-int32答案:B解析:[单选题]62.词法分析的任务就是()A)识别单词B)分析句子的含义C)识别句子D)生成目标代码答案:A解析:[单选题]63.梯度下降是常使用的方法,那么梯度下降是一种怎样的算法A)迭代优化B)一次求解C)求解函数最大值D)迭代求代价函数最小值答案:A解析:[单选题]64.机器翻译的应用层面很广泛,具体属于下列哪个领域?A)自然语言系统B)机器学习C)专家系统D)人类感官模拟答案:A解析:[单选题]65.关于曼哈顿距离,以下哪项是正确的?A)可用于连续变量B)可用于分类变量C)可用于分类变量和连续变量D)无答案:A解析:[单选题]66.关键词提取最简单、最直观的方法是()方法,用于识别定义类查询的句字A)词性标注B)命名实体识别C)规则的匹配方法D)文本分类答案:C解析:[单选题]67.隐马尔可夫模型的训练算法是A)前向后向算法B)Viterbi算法C)Baum-Welch算法D)DTW算法答案:C解析:[单选题]68.最大熵模型又被称作()A)Logistic模型B)Exponential模型C)Log-linear模型D)以上都是答案:D解析:[单选题]69.可以利用状态估计等功能,督导考核()维护工作。A)运行数据B)原始数据C)统计数据D)基础数据答案:D解析:[单选题]70.以下几个选项中,哪个描述的不是随机梯度下降的特点?A)批量数值选取为1B)学习率逐渐减小C)可以达到最小值D)在最小值附近波动答案:C解析:[单选题]71.()是能够独立运行的最小语言单位A)字B)词C)句D)段答案:B解析:[单选题]72.XGBoost中树上叶子节点的得分w的L2模平方,是怎么做的A)对w进行L2正则化B)对w进行L1正则化C)对w进行DropoutD)不确定答案:A解析:[单选题]73.线性整流函数(RectifiedLinearUnit,ReLU),又称修正线性单元A)Sigmoid函数B)tanh函数C)ReLUD)leakyReLU答案:C解析:[单选题]74.注意力机制最近很火,那么它具体有什么样的作用呢?A)从大量信息中有选择地筛选出少量重要信息并聚焦到这些重要信息上B)注意力机制在深度学习中做文本分类C)注意力机制在深度学习中没有什么作用,可以忽略D)注意力机制最早是在视觉图像领域提出来的答案:A解析:[单选题]75.直方图算法,其算法中有一个参数:K,K代表的是什么意义A)代价B)常数C)学习率D)不确定答案:B解析:[单选题]76.()根据文本的不同特征划分为不同的类A)文本概括B)文本分类C)文本聚类D)都可以答案:C解析:[单选题]77.下列四个算法中哪个属于无监督学习的算法A)SVMB)逻辑回归C)线性回归D)聚类答案:D解析:[单选题]78.感知器的学习规则属于()A)梯度下降法B)飞度法C)ADB算法D)梯度上升法答案:A解析:[单选题]79.以下关于梯度下降优化算法的描述,错误的是?A)靠近极值点收敛速度慢B)直线搜索时可能会产生问题C)可能会?之字形?地下降。D)越靠近极值点收敛速度快答案:D解析:[单选题]80.以下哪个激活函数用来处理二分类任务A)tanhB)LeakyReluC)sigmoidD)relu答案:C解析:[单选题]81.有向图模型和无向图模型的相同同之处A)都是转换成了概率相加的形式B)将复杂的联合分布分解为多个因子相加C)将复杂的联合分布分解为多个因子的乘积D)以上所有答案:C解析:[单选题]82.()函数用于搜索搭配词语。A)concordanceB)common_contextsC)collocationsD)Sorted答案:C解析:[单选题]83.Tanh的导数范围是多少?A)(0,1]B)(0,0.1]C)(0,-1]D)(0,10]答案:A解析:[单选题]84.深度学习常用框架TensorFlow,在该框架下如何正确调用dropout函数A)tf.nn.dropoutB)tf.train.dropoutC)tf.dropoutD)tf.dropOut答案:A解析:[单选题]85.下面哪个不是作为bert的输入A)segmentembeddingB)TokenembeddingC)PositionembeddingD)one-hot答案:D解析:[单选题]86.马尔可夫模型分析的数据来源有A)RCT数据B)RWE数据C)文献数据D)其余选项皆对答案:D解析:[单选题]87.以下四个算法中,哪个体现了XGBoost的本质A)随机森林B)GBDTC)线性回归D)逻辑回归答案:B解析:[单选题]88.主成分分析法PCA有什么优缺点,描述正确的是?A)仅仅需要以方差衡量信息量,不受数据集以外的因素影响B)各主成分之间非正交C)主要运算是奇异值分解D)生成的数据解释性更强答案:A解析:[单选题]89.tf.tanh的作用是什么A)计算元素的sigmoid值.B)计算元素的softmax值.C)计算元素的双曲正切值.D)计算元素的relu值答案:C解析:[单选题]90.以下哪种情况下树会容易发生了过拟合的现象A)加入L2正则B)加入L1正则C)设置树的最大深度D)没有设置树的最大深度答案:D解析:[单选题]91.下列说法不正确的是()A)最大匹配法的优点是程序简单易行,开发周期短B)最少分词法只需要很少的语言资源,不需要任何词法,句法,语意资源C)最大概率发可以发现所有的切分歧义,很大程度上取决于统计语言模型的精度和决策算法,不需要标注语料D)最大概率法和词性标注相结合的分词方法需要同时利用词典和语料库答案:C解析:[单选题]92.什么是集成学习,如何去理解集成学习A)通过变量和因变量之间的一次函数关系构建的B)通过找到一个最优的超平面去完美的分类C)就是将多个机器学习模型组合起来,共同工作以达到优化算法的目的D)以上都正确答案:C解析:[单选题]93.一个汉字不管用什么样的()码输入,到机器里都是一样的()码。A)源外B)源内C)外内D)内外答案:C解析:[单选题]94.HMM(隐马尔可夫模型)是一个什么模型A)是生成式模型B)是判别式模型C)即是生成式模型又是判别式D)不确定答案:A解析:[单选题]95.上升速度最快的是哪个函数A)线性函数B)指数函数C)对数函数D)幂函数答案:C解析:[单选题]96.线性判别分析LDA的思想是什么A)投影后类内方差最大B)类间方差最小C)投影后类内方差最小D)不确定答案:C解析:[单选题]97.自动驾驶是如何起源的A)BP算法B)神经网络C)前向算法D)NFC答案:A解析:[单选题]98.特征进行归一化可以做到什么效果A)消除数据特征之间的量纲影响B)可以为数据增加适量的沉余C)可以为代价函数加入正则项D)不确定答案:A解析:[单选题]99.以下四个模型当中,哪个使用的是单向Transformer的预训练模型A)GPT模型B)Word2Vec模型C)BERT模型D)ELMO模型答案:A解析:[单选题]100.当不知道数据所带标签时可以使用哪种技术促使带同类变迁的数据与带其他标签的数据分离A)分类B)聚类C)关联分析D)隐马尔可夫链答案:B解析:[单选题]101.如何理解想?回归?A)通过数据使预测回归到真实值上B)通过数据做分类C)通过数据做缩小维度D)通过数据使相似的数据聚到一块答案:A解析:[单选题]102.下面哪个不属于超参数?A)学习率αB)动量梯度下降的参数βC)mini-Batch的大小D)输入图片大小答案:D解析:[单选题]103.SVD可以做什么A)降维B)聚类C)分类D)回归答案:A解析:[单选题]104.以下选项中关于交叉熵使用的激活函数描述正确的是?A)sigmoidB)reluC)tanhD)cosh答案:A解析:[单选题]105.什么是Boosting思想,如何理解Boosting思想A)将基分类器层层叠加,每一层在训练的时候,对前一层基分类器分错的样本,给予更高的权重B)从总体样本当中随机取一部分样本进行训练,通过多次这样的结果,进行投票获取平均值作为结果输出C)不确定D)以上都正确答案:A解析:[单选题]106.在以下四个选项中,可以将高级语言程序设计语言源程序翻译成计算机可执行代码的软件是?A)汇编程序B)编译程序C)管理程序D)服务程序答案:B解析:[单选题]107.C4.5相比较于ID3算法,在哪个地方得进行了改变A)将信息增益比作为了选择特征的标准B)将信息增益作为了选择特征的标准C)将基尼系数作为了选择特征的标准D)将信息熵作为了选择特征的标准答案:A解析:[单选题]108.Word2Vec的()可以用来计算两个词之间的相似度。A)tfidf函数B)similarity函数C)Sum函数D)Max函数答案:B解析:[单选题]109.SVM算法的最小时间复杂度是O(n²),基于此,以下哪种规格的数据集并不适该算法?A)大数据集B)小数据集C)中等数据集D)不受数据集大小影响答案:A解析:[单选题]110.下列不是自然语言处理的应用领域的是()。A)文化教育B)健康生活C)公共设施D)移动计算答案:B解析:[单选题]111.XGBoost中的节点的分裂方式A)枚举出了不同树结构的贪心法B)通过基尼系数C)通过信息增益D)通过信息增益比答案:A解析:[单选题]112.下列模型中,doc2vec的常用模型包括DM模型和()A)Skip-Gram模型B)分类器模型C)LDA模型D)DBOW答案:D解析:[单选题]113.SVD在自然语言(NLP)中经常解决的问题A)对新词很轻松的分配词向量B)计算量随着预料和词典增长维度膨胀快C)与其他深度学习模型框架差异小D)同时也可以解决聚类的问题答案:B解析:[单选题]114.下列哪项是无监督学习的方法?()A)标签法B)分类C)聚类D)判别答案:C解析:[单选题]115.一个字符的Unicode编码是()。A)不确定的B)确定的C)可替换的D)不可替换的答案:B解析:[单选题]116.下面关于数据粒度的描述不正确的是:A)粒度是指数据仓库小数据单元的详细程度和级别;B)数据越详细,粒度就越小,级别也就越高;C)数据综合度越高,粒度也就越大,级别也就越高;D)粒度的具体划分将直接影响数据仓库中的数据量以及查询质量.答案:C解析:第2部分:多项选择题,共57题,每题至少两个正确答案,多选或少选均不得分。[多选题]117.以下技术中哪个技术可以作为正则项A)L1B)L2C)DropoutD)以上都正确答案:ABCD解析:[多选题]118.EM算法有哪些优点A)简单性和普适性B)可看作是一种非梯度优化方法C)解决梯度下降等优化方法的缺陷D)以上都正确答案:ABCD解析:[多选题]119.自动校对系统可应用于以下哪些行业?()A)报刊B)出版社C)打字业D)电商行业答案:ABC解析:四、填空题(17题)[多选题]120.LDA中包含一个理念和一个概念A)共轭先验B)贝叶斯框架C)二项分布D)gamma函数答案:AB解析:[多选题]121.TensorFlow中一般包括哪些数据类型A)int32B)int64C)float32D)float64答案:ABCD解析:[多选题]122.词性标注后会降低()处理的复杂度。A)词义标注B)信息检索C)字音转换D)简繁转换答案:ABCD解析:[多选题]123.以下四个选项当中哪些属于语言模型A)统计语言模型B)神经网络语言模型C)预训练语言模型D)编解码模型答案:AB解析:[多选题]124.LightGBM为了更好的实现落地GBDT算法,在以下哪些方向上做了优化?A)带深度限制的Leaf-wise的叶子生长策略B)直方图做差加速直接C)支持类别特征(CategoricalFeature)D)以上不都是答案:ABC解析:[多选题]125.下列模型中,哪些是doc2vec的常用模型?()A)DM模型B)分类器模型C)LDA模型D)DBOW模型答案:AD解析:[多选题]126.可以使用正则的算法有:A)A:lasso回归B)B:Ridge回归C)C:逻辑回归D)D:K-means答案:ABCD解析:[多选题]127.K-NN和K-Means很相像,他们有什么具体的区别A)K-Means是聚类算法,KNN是分类算法。B)KNN需要标记点,因此是有监督的学习,而k-means不是,因此是无监督学习。C)K均值聚类仅需要一组未标记的点和阈值D)以上都正确答案:ABCD解析:[多选题]128.LightGBM出来后,分别对哪些方面进行了很大的提升A)速度快B)支持分布式C)占用内存小D)代码清晰易懂答案:ABCD解析:[多选题]129.给出了以下2条语句,发现在k-NN情况下哪个选项是正确的?A)如果k的值非常大,我们可以将其他类别的点包括到邻域中。B)不能判断C)如果k的值太小,该算法会对噪声非常敏感D)以上都正确答案:AC解析:[多选题]130.下面哪些选项解释了AI中的连接主义?A)基础理论是神经网络B)深度学习属于连接主义C)又称仿生学派D)产生在20世纪50年代产生答案:ABCD解析:[多选题]131.Transformer相比较RNN/LSTM/CNN,说法正确的是A)RNN系列模型,并行计算能力很差B)特征提取能力要比RNN更强C)RNN在T时刻的输出依赖T-1时刻,会形成序列依赖问题D)Transformer的适用多头机制更好的提取特征答案:ABCD解析:[多选题]132.LightGBM分别在哪些方面做了提升A)速度快B)支持分布式C)占用内存小D)代码清晰易懂答案:ABCD解析:[多选题]133.采用决策树作为弱分类器使得GBDT模型具有哪些特性A)较好的解释性和鲁棒性;B)能够自动发现特征间的高阶关系;C)不需要对数据进行特殊的预处理,如归一化等。D)以上都正确答案:ABCD解析:[多选题]134.CART相比较ID3和C4.5有什么独特之处A)CART生成的树必须是二叉树B)CART既可以做分了也可以做回归C)CART内部节点只能根据属性值进行二分D)以上都正确答案:ABCD解析:[多选题]135.LightGBM在哪些地方进行了优化(区别XGBoost)?A)基于Histogram的决策树算法B)带深度限制的Leaf-wise的叶子生长策略C)直方图做差加速直接D)支持类别特征(CategoricalFeature)答案:ABCD解析:[多选题]136.自然语言处理中四个最基本的任务()。A)分词B)词性标注C)依存句法分析D)命名实体识别答案:ABCD解析:[多选题]137.人工智能关于词袋子模型,其优点有哪些?A)简单方便快速B)在语料充足的前提下,对于简单自然语言处理任务效果不错C)准确率较低D)无法关注词语间的顺序答案:AB解析:[多选题]138.bert作为很火的预训练模型,下列说法正确的是?A)bertbase模型的参数量大概是一亿左右B)bert的输入层是三个向量的叠加C)使用双向的TransformerD)遮蔽掉了15%的词答案:ABCD解析:[多选题]139.关于AI人工智能的特征工程,以下哪些是对的??A)文本预处理B)特征提取C)文本表示提升算法的效果D)分类器答案:ABC解析:[多选题]140.下列说法中,关于梯度消失的描述正确的选项都有哪些?A)可以通过激活函数防止梯度消失B)梯度消失对神经网络无影响C)尽量避免梯度消失D)梯度消失反向传播时,由于梯度值过小或消失的现象答案:ACD解析:[多选题]141.问答系统流程由下列哪三个部分组成?()A)问题理解B)知识检索C)答案生成D)信息检索答案:ABC解析:三、填空题(4题)[多选题]142.在情感分析领域目前主要的分析方法有()A)语法分析B)词法分析C)机器学习分析D)混合分析答案:BCD解析:[多选题]143.降维的目的是为了什么,达到什么效果A)减少预测变量的个数。B)确保这些变量是相互独立的。C)数据在低维下更容易处理、更容易使用。D)去除数据噪声。答案:ABCD解析:[多选题]144.词袋子模型的优点A)简单方便快速B)在语料充足的前提下,对于简单自然语言处理任务效果不错C)准确率较低D)无法关注词语间的顺序答案:AB解析:[多选题]145.GPT是NLP中常用的预训练模型,下边关于GPT模型说法正确的有哪些A)使用了双向的TransformerB)使用了单向的TransformerC)使用了双向LSTMD)解决了一词多义的问题答案:BD解析:[多选题]146.机器学习虽然是人工智能的实现方法,但是它里边会有什么样的缺点A)机器学习准确度不好B)手工特征耗时耗力,还不易拓展C)自动特征学习快,方便拓展D)机器学习无缺点答案:BC解析:[多选题]147.NLP的技术发展A)以语言学为主要基础的时代(过去)B)以统计方法为主流的时代(现在)C)深度学习等人工智能最新技术在NLP领域中的应用(现在)D)深度学习等人工智能最新技术在NLP领域中的应用(将来)答案:ABD解析:[多选题]148.人工智能中梯度优化有哪些呢?A)dropoutB)动量梯度下降法C)RMSpropD)Adam答案:BCD解析:[多选题]149.以下四个选项中关于beamSearch说法正确的是A)是一种启发式图搜索算法B)为了减少搜索的时间和空间C)保留质量较高的节点,减掉质量较差的节点D)常用在机器翻译和语音识别等NLP任务当中答案:ABCD解析:[多选题]150.seq2seq的编码阶段可以是用什么做特征提取A)CNNB)RNNC)LSTMD)SVM答案:ABC解析:[多选题]151.逻辑回归在工业中可以有哪些应用A)各种分类场景B)某搜索引擎厂的广告CTR预估基线版是LR。C)某电商搜索排序/广告CTR预估基线版是LR。D)某电商的购物搭配推荐用了大量LR。答案:ABCD解析:[多选题]152.在TensorFlow中使用tf定义变量:a=tf.Variable([1,2,3])和b=tf.Variable(a),以下描述正确的是A)合法B)非法C)合法但a需要提前初始化D)合法但不够安全答案:ACD解析:[多选题]153.以下()是NLP的应用场景。A)百度翻译B)图灵机器人C)微信语音转文字D)新闻分类答案:ABCD解析:[多选题]154.如果在XGBoost中加入了正则化项,可以达到哪些效果A)减少模型复杂度B)防止了过拟合C)增加模型复杂度D)防止了欠拟合答案:AB解析:[多选题]155.句法分析的主要难点有()A)分词B)歧义C)词性标注D)搜索空间答案:BD解析:[多选题]156.在深度学习中,进行前向算法需要有()和()才能由前往后正常计算A)联合权重wB)正弦函数C)激活函数D)余弦函数答案:AC解析:[多选题]157.下列属于朴素贝叶斯缺点的是()。A)对缺失数据不太敏感B)分类效果不稳定C)先验模型可能导致结果不佳D)不适合增量式训练答案:AC解析:[多选题]158.词袋的子模型特点是:A)简单方便快速B)在语料充足的前提下,对于简单自然语言处理任务效果不错C)准确率较低D)无法关注词语间的顺序答案:AB解析:[多选题]159.LightGBM有什么优点A)速度快B)支持分布式C)占用内存小D)代码清晰易懂答案:ABCD解析:[多选题]160.KNN和K-Means的区别有哪些A)KNN是聚类算法B)K-Means是分类算法C)KNN是分类算法D)K-Means是聚类算法答案:CD解析:[多选题]161.NLP中的预训练模型ELMO中,有什么样的优缺点A)解决了多义词问题B)适用范围广,普适性强C)LSTM抽取特征能力弱D)拼接方式双向融合特征能力偏弱答案:ABCD解析:[多选题]162.超参数应该可以如何调优A)网格搜索B)不确定C)随机搜索D)贝叶斯优化算法答案:ACD解析:[多选题]163.语料库的规范化是指()A)文本描述语言规范B)标注语言规范C)文本格式规范D)便于实现不同语料库的集成答案:ABCD解析:[多选题]164.以下四个关于EM算法的描述,正确的是A)对初始值敏感B)对初始值敏感C)不同的初值可能得到不同的参数估计值D)不能保证找到全局最优值。答案:ABCD解析:[多选题]165.为什么要将求解SVM的原始问题转换为其对偶问题?A)是对偶问题往往更易求解B)是对偶问题往往不易求解C)自然引入核函数,进而推广到非线性分类问题。D)以上都正确答案:AC解析:[多选题]166.ELMO中的双向的LSTM和词嵌入分别学到了句子的什么信息A)句子的句法特征B)更好的单词的特征C)句子的语义特征D)以上都正确答案:ABCD解析:[多选题]167.bert模型中的输入是什么A)wordembeddingB)posembeddingC)segembeddingD)不确定答案:ABC解析:[多选题]168.人工智能关于传统文本相似度计算的算法有哪些A)欧几里得距离B)曼哈顿距离C)SimHashD)余弦相似性答案:ABCD解析:[多选题]169.在关于tf.reshape(tensor,shape,name)函数的参数,以下选项中描述正确的是A)name可省略B)1所代表的含义是我们不用亲自去指定这一维的大小,函数会自动进行计算C)函数的作用是将tensor变换为参数shape形式D)其中的shape为一个列表形式答案:ABCD解析:[多选题]170.LDA和PCA有很多的异同点,对于不同点描述正确的是?A)LDA有监督的降维方法;B)PCA无监督的降维方法;C)LDA可以用于降维,还可以用于分类;D)PCA只用于降维;答案:ABCD解析:[多选题]171.以下选项中哪些包含了深度学习的应用A)图像识别B)机器创作C)个性化推荐D)文本分类答案:ABCD解析:[多选题]172.在以下四个选项的描述中,哪些选项属于激活函数A)L1B)L2C)ReluD)Sigmoid答案:CD解析:[多选题]173.我们日常常用的函数,其实可以表达描述成??A)一个集合B)一个映射C)一个概率空间D)一个线性空间答案:AB解析:第3部分:判断题,共66题,请判断题目是否正确。[判断题]174.用余弦相似度表示的词之间的差异将显著低于0.5A)正确B)错误答案:错解析:[判断题]175.自顶向下的分析,优点是节约空间,它自始至终只需存储一棵树的结构A)正确B)错误答案:对解析:[判断题]176.决策树代表样本特征约束的合取的析取式()A)正确B)错误答案:对解析:[判断题]177.XGBoost是陈天奇等人开发出来的机器学习项目A)正确B)错误答案:对解析:[判断题]178.在SVM训练好后,我们可以抛弃非支持向量的样本点,仍然可以对新样本进行预测A)正确B)错误答案:对解析:[判断题]179.实现人工智能的手段是机器学习和深度学习A)正确B)错误答案:对解析:[判断题]180.DBOW模型对应Word2Vec模型中的Skip-gram模型。对A)正确B)错误答案:对解析:[判断题]181.基于密度聚类的特点是计算量大。很适合发现中小规模的数据库中小规模的数据库中的球状簇。A)正确B)错误答案:错解析:[判断题]182.感知机和神经网络是相同的A)正确B)错误答案:错解析:[判断题]183.当数据的先验分布假定为正态分布时,贝叶斯判别与正态分布等价A)正确B)错误答案:对解析:[判断题]184.注意力机制的应用,并无实际意义A)正确B)错误答案:错解析:[判断题]185.常用的减缓过拟合方法包括,用正则化或者dropout。A)正确B)错误答案:对解析:[判断题]186.给定似然函数,如果后验分布和先验分布属于同一分布族,则将此先验分布称为此似然函数的共轭先验分布.A)正确B)错误答案:对解析:[判断题]187.马尔科夫模型描述了一类重要的定向过程。A)正确B)错误答案:错解析:[判断题]188.计算相似度的技术有很多种,例如:杰卡德相似度A)正确B)错误答案:对解析:[判断题]189.感知器的基本组成单位是神经元,每一个神经元是一个二元线性分类器,对应的线性函数为g(x)=(w·x)+b。()A)正确B)错误答案:对解析:[判断题]190.TF算法是一个统计词在文档集中的多少个文档中出现.其基本思想是,如果一个词在越少的文档是出现,其对文档的区分能力就越强.A)正确B)错误答案:错解析:[判断题]191.逆文档频率是统计一个词出现在文档集中文档频次的统计量。对A)正确B)错误答案:对解析:[判断题]192.分类特征的选择决定了算法的效率与所生成的决策树的繁简程度()A)正确B)错误答案:对解析:[判断题]193.线性回归算法只能做回归,不能做分类A)正确B)错误答案:对解析:[判断题]194.线性回归的一般表达式为:Y=W*X+bA)正确B)错误答案:对解析:[判断题]195.线性回归,逻辑回归,SVM输入前都需要做特征归一化A)正确B)错误答案:对解析:[判断题]196.EM算法就是对于一个含有隐变量的概率模型,目标是极大化观测数据Y关于参数theta的对数似然函数A)正确B)错误答案:对解析:[判断题]197.基于机器学习的分类方法,指通过专家经验,依靠人工提取规则进行的分类。错A)正确B)错误答案:错解析:[判断题]198.BERT可以处理的最长序列是768A)正确B)错误答案:错解析:[判断题]199.LightGBM是为了GBDT的工程化改进A)正确B)错误答案:对解析:[判断题]200.SVM和决策树都可以做分类回归,因此,没有明显的区别A)正确B)错误答案:错解析:[判断题]201.分布式表示的优点是考虑到了词之间存在的相似关系,增加了词向量的维度。错A)正确B)错误答案:错解析:[判断题]202.最大匹配法主要分为三种:正向最大匹配法,逆向最大匹配法,双向匹配分词A)正确B)错误答案:对解析:[判断题]203.词性标注的主要任务是消除词性的兼类歧义A)正确B)错误答案:对解析:[判断题]204.KNN算法是K邻近算法A)正确B)错误答案:对解析:[判断题]205.情感词包含极性和强度两个属性。对A)正确B)错误答案:对解析:[判断题]206.加入这个正则化项好处:控制参数幅度,限制参数搜索空间A)正确B)错误答案:对解析:[判断题]207.sigmoid相比较于relu激活函数,速度要快,效果要好A)正确B)错误答案:错解析:[判断题]208.中括号?[]?表示可以匹配多个字符,表示包含在中括号内部的字符都会被匹配。对A)正确B)错误答案:对解析:[判断题]209.关于LDA有两种含义,一种是线性判别分析(LinearDiscriminantAnalysis),一种是概率主题模型:隐含狄利克雷分布(LatentDirichletAllocation,简称LDA)A)正确B)错误答案:对解析:[判断题]210.自然语言处理是一门融语言学、计算机科学、数学、心理学、逻辑学、声学于一体的科学,而以声学为基础。()A)正确B)错误答案:错解析:[判断题]211.基于情感词典的情感分析是最复杂的一种情感分析方法。错A)正确B)错误答案:错解析:[判断题]212.正则表达式的?[0-9a-zA-Z_]+?只用于匹配一个字母或者数字A)正确B)错误答案:错解析:[判断题]213.召回率真正正确的占所有实际为正的比例。A)正确B)错误答案:对解析:[判断题]214.文本分析是文本挖掘、信息检索的一个基本问题。对A)正确B)错误答案:对解析:[判断题]215.Keras具有简易和快速的原型设计,支持CNN与RNN,能够无缝在CPU与GPU间切换的优点。对A)正确B)错误答案:对解析:[判断题]216.Dropout可以失活一些单元,从而防止过拟合A)正确B)错误答案:错解析:[判断题]217.模型太过于复杂的话,会造成欠拟合A)正确B)错误答案:错解析:[判断题]218.Tri-Gram中没有涉及到窗口的概念A)正确B)错误答案:错解析:[判断题]219.隐藏层只能是多层叠加,层与层之间是相互连接的A)正确B)错误答案:错解析:[判断题]220.主题模型认为文档是由主题组成的,而主题是词的一个概率分布。对A)正确B)错误答案:对解析:[判断题]221.命题是指具有真假意义的陈述句A)正确B)错误答案:对解析:[判断题]222.文本的分布式表示是一种固定长度的稠密词向量。对A)正确B)错误答案:对解析:[判断题]223.条件概率(又称后验概率)就是事件A在另外一个事件B已经发生条件下的发生概率A)正确B)错误答案:对解析:[判断题]224.在做NLP任务的一系列任务时,通常要做去停用词的处理,否者效果可能就不会很好A)正确B)错误答案:对解析:[判断题]225.对弱分类器的要求一般是足够简单,并且是低方差和高偏差的。A)正确B)错误答案:对解析:[判断题]226.删除插值和katz回退都使用低阶分布的信息来确定计数为0的n元语法的概率A)正确B)错误答案:对解析:[判断题]227.ELMO相比较word2vec来说解决了一词多义问题A)正确B)错误答案:对解析:[判断题]228.词义消岐方法利用了双语词典的帮助A)正确B)错误答案:错解析:[判断题]229.自然语言理解主要包括两个方面:语言信息的录入,文本理解。()A)正确B)错误答案:对解析:[判断题]230.决

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论