人工智能自然语言技术练习(习题卷6)_第1页
人工智能自然语言技术练习(习题卷6)_第2页
人工智能自然语言技术练习(习题卷6)_第3页
人工智能自然语言技术练习(习题卷6)_第4页
人工智能自然语言技术练习(习题卷6)_第5页
已阅读5页,还剩49页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

试卷科目:人工智能自然语言技术练习人工智能自然语言技术练习(习题卷6)PAGE"pagenumber"pagenumber/SECTIONPAGES"numberofpages"numberofpages人工智能自然语言技术练习第1部分:单项选择题,共116题,每题只有一个正确答案,多选或少选均不得分。[单选题]1.一下哪个网络是NLP中用的最多的A)ANNB)CNNC)RNND)DNN答案:C解析:[单选题]2.在处理数据时需要进行归一化,那么关于归一化的描述正确的哪个选项A)通过中值和均值进行确定B)通过平均值和最小值确定C)通过方差和均值确定D)通过标准差和均值确定答案:C解析:[单选题]3.主成分分析法的简写是哪个A)PCAB)LDAC)SVMD)K-Means答案:A解析:[单选题]4.专家系统的正向推理是以()作为出发点,按照一定的策略,应用知识库中的知识,推断出结论的过程。A)需要解决的问题B)已知事实C)证明结论D)表示目标的谓词或命题答案:B解析:[单选题]5.tf.nn.softmax_cross_entropy_with_logits的作用是什么?A)信息熵B)信息元C)交叉熵D)logits答案:C解析:[单选题]6.情感分析技术的核心问题是()。A)情感分类B)信息预测C)舆情分析D)文本抽取答案:A解析:[单选题]7.以下四个模型当中,哪个模型不能动态的去调整词向量A)ELMoB)GPTC)BERTD)word2vec答案:D解析:[单选题]8.语料库是以语言文字为材料,语料库的选材原则是()A)仔细审核一定是近3年的B)电子形式存储一定是近5年C)电子形式存储代表性D)仔细审核代表性答案:C解析:[单选题]9.如果我们想加速线性变换可以使用以下哪个激活函数A)SigmoidB)TanhC)ReluD)不确定答案:C解析:[单选题]10.深度学习和机器学习存在什么关系A)机器学习属于深度学习B)深度学习为机器学习更方便的提取特征C)机器学习是为深度学习服务的D)无相应关系答案:B解析:[单选题]11.以下四种说法当中,关于GBDT的描述说法正确的有哪些A)GBDT是并行生成B)GBDT则是多棵树累加之和C)GBDT对异常值比较敏感D)GBDT是减少模型的偏差答案:A解析:[单选题]12.以下四个选项中,人脸识别可以用网络架构A)LeNET5B)(CNN:AlexNet)C)VGGD)ResNet答案:B解析:[单选题]13.独热表示的缺点不包括()。A)构造简单B)维数过高C)可以保留语义D)矩阵稀疏答案:C解析:[单选题]14.集成学习GBDT是很好的算法,同时也有很多优点,以下对其优点的描述A)在分布稠密的数据集上,泛化能力和表达能力都很好;B)GBDT在高维稀疏的数据集上表现不佳;C)训练过程需要串行训练,只能在决策树内部采用一些局部并行的手段提高训练速度。D)不确定答案:A解析:[单选题]15.训练模型阶段,如果想要损失值最小,需要得到什么值?A)鞍点B)局部最优解C)转折点D)全局最优解答案:D解析:[单选题]16.以下的四个选项中,哪个选项不是激活函数?A)reluB)sigmoidC)tanhD)dropout答案:D解析:[单选题]17.关于概率图中的无向边,下列描述正确的是A)表示单向的依赖B)表述互相依赖关系C)表示无依赖关系D)不确定答案:B解析:[单选题]18.下面哪个队tf.reverse的解释是正确的A)沿着某一维度连结tensorB)沿着某一维度将tensor分离为num_splittensorsC)对tensor进行切片操作D)沿着某维度进行序列反转答案:D解析:[单选题]19.欠拟合对于模型来说会有什么影响A)在训练集上的效果很好,但是在测试集上的效果很差B)在训练集上的效果差,在测试集上的效果也差C)在训练集上的效果很好,在测试集上的效果也很好D)在训练集上的效果很差,但是在测试集上的效果很好答案:A解析:[单选题]20.人工智能NLP方向在生活中的应用A)机器翻译B)图像处理C)对话系统D)文本分类答案:B解析:[单选题]21.朴素贝叶斯算法训练阶段的输出是什么?()A)新数据的分类结果B)特征属性和训练样本C)分类器D)训练样本的出现频率答案:C解析:[单选题]22.欧氏距离也可以叫做什么()A)非负距离B)平面距离C)绝对值距离D)平方范数距离答案:D解析:[单选题]23.在实现前向传播和反向传播中使用的?cache?是什么?A)它用于跟踪我们正在搜索的超参数,以加速计算。B)用于在训练期间缓存代价函数的中间值。C)使用它传递反向传播中计算的变量到相应的前向传播步骤,它包含对于前向传播计算导数有用的变量。D)使用它传递前向传播中计算的变量到相应的反向传播步骤,它包含对于反向传播计算导数有用的变量。答案:D解析:cache?缓存?记录来自正向传播单元的值,并将其发送到反向传播单元,这是链式求导的需要。[单选题]24.机器学习逻辑回归logisticsregression算法,属于哪类算法??A)A:分类算法B)B:聚类算法C)C:神经网络算法D)D:支持向量机算法答案:A解析:[单选题]25.LightGBM是由哪个公司开源出来的A)谷歌B)百度C)微软D)facebook答案:C解析:[单选题]26.集成学习是机器学习的重要组成部分,以下说法正确的是A)通过变量和因变量之间的一次函数关系构建的B)通过找到一个最优的超平面去完美的分类C)就是将多个机器学习模型组合起来,共同工作以达到优化算法的目的D)以上都正确答案:C解析:[单选题]27.马尔科夫假设当前词(n)出现的概率依赖于哪些词A)n-3B)n-2C)nD)n-1答案:D解析:[单选题]28.以下几个选项中,可以通过哪种方式来选择参数或超参A)通过常识选择B)随机选择点来试验超参数效果C)选择输入的参数即可D)取离散参数的平均值答案:B解析:[单选题]29.以下几个选项中,哪个选项没描述神经网络的超参数是正确的A)权重B)偏置C)神经网络的层数D)激活值答案:C解析:[单选题]30.以下四个函数当中,哪个不是python内建函数A)iterB)hashC)binD)number答案:D解析:[单选题]31.可以如何选择神经网络的参数或超参A)通过常识选择B)随机选择点来试验超参数效果C)选择输入的参数即可D)取离散参数的平均值答案:B解析:[单选题]32.下面哪项不属于目前常见的分类器?()A)KNNB)DTC)RSAD)NN答案:C解析:[单选题]33.卷积神经网络包含如下哪个概念A)视野域B)循环结构C)梯度消失D)以上都不包含答案:A解析:[单选题]34.不是Synset之间的关系类型有A)反义关系B)继承关系C)上下关系D)整体与局部关系答案:C解析:[单选题]35.自然语言处理是()技术的一种应用。A)语音识别B)虚拟现实C)人工智能D)自然语言答案:C解析:[单选题]36.下列关于不精确推理过程的叙述错误的是()。A)不精确推理过程是从不确定的事实出发B)不精确推理过程最终能够推出确定的结论C)不精确推理过程是运用不确定的知识D)不精确推理过程最终推出不确定性的结论答案:B解析:[单选题]37.下列哪一项在神经网络中引入了非线性?A)随机梯度下降B)修正线性单元(ReLU)C)卷积函数D)以上都不正确答案:B解析:[单选题]38.下面BiGram和TreGram说法正确的是A)BiGram效果会更好B)BiGram的速度会比TreGram的慢C)TreGram的效果更好D)TreGram的滑动窗口是2答案:C解析:[单选题]39.LDA属于一个什么模型A)语言模型B)词袋子模型C)预训练模型D)不确定答案:B解析:[单选题]40.以下四个模型中,哪个使用了双向的LSTM语言模型A)GPTB)BERTC)ULMFitD)ELMo答案:D解析:ELMo尝试训练两个独立的LSTM语言模型(从左到右和从右到左),并将结果连接起来以产生词嵌入。[单选题]41.在神经网络中我们经常会使用到正则化,那么正则化有什么作用A)A防止过拟合B)B边缘检测C)C提取特征D)D简化数据答案:A解析:[单选题]42.Tensorflow1.0和2.0最本质的区别A)1.0是动态图,2.0是经态度B)1.0是静态图,2.0是动态图C)1.0debug更方便D)2.0运行速度更快答案:B解析:[单选题]43.SVM中,若C的值很小,以下哪种说法正确?A)会发生误分类现象B)数据将被正确分类C)不确定D)以上都不对答案:A解析:[单选题]44.下列关于K均值说法,正确的是?A)K均值接收未标记的数据集,然后将数据聚类成不同的组B)通过生成树的形式对,数据集进行分类C)通过自变量和因变量之间的一次函数关系,构建回归模型D)构建一个超平面,将数据在更高维度上,使用超平面更好的划分答案:A解析:[单选题]45.基于商品评论数据来评估客户对商品的态度运用了到以哪项数据分析工具?()A)文本挖掘B)情感分析C)自然语言处理D)以上三种都有答案:D解析:[单选题]46.朴素贝叶斯算法,描述正确的是:A)它假设特征分量之间相互独立B)它假设特征分量之间相互不独立C)不确定D)以上都正确答案:A解析:[单选题]47.google开发的深度学习框架叫什么A)pytorchB)tensorflowC)caffeD)mxnet答案:B解析:[单选题]48.bert这个预训练语言模型当中存在什么缺点A)性能不好有很大提升空间B)使用了双向的Transformer效果不好C)没有LSTM特征提取的好D)使用了单向的Transformer答案:A解析:[单选题]49.BERT中关于遮蔽掉的15%的字,说法不正确的是A)15%中的80%的字使用MASK替换B)15%中的10%使用随机的其他词替换C)15%中的10%使用原词(正确的词替换)D)15%中的20%使用原词替换答案:D解析:[单选题]50.Attention是通过那种方式计算权重的A)tanhB)reluC)softmaxD)sigmoid答案:C解析:[单选题]51.关于tf.conv2d函数,该方法接收到的张量维度是多大?A)[batch,in_height,in_width,in_channels]B)[Size,in_height,in_width,in_channels]C)[batch,in_width,in_height,in_channels]D)[batch,in_channels,in_height,in_width]答案:A解析:[单选题]52.下列不是知识表示法的是()。A)计算机表示法B)谓词表示法C)框架表示法D)产生式规则表示法答案:A解析:[单选题]53.以下哪个函数表示双曲正切激活函数?A)ReluB)sigmoidC)tanhD)sin答案:C解析:[单选题]54.LSTM的那个门是选择性的丢弃信息?A)输入门B)遗忘门C)输出门D)更新门答案:B解析:[单选题]55.假定现在有一个四分类问题,用One-vs-all策略训练一个SVM的模型,需要训练几个SVM模型?A)1B)2C)3D)4答案:D解析:[单选题]56.bert中可以接受的最大句子长度是多少A)128B)512C)768D)64答案:A解析:[单选题]57.迁移学习说的是下面哪个网络?A)RNNB)CNNC)NLPD)TransferLearning答案:D解析:[单选题]58.在以下四个模型当中哪个是排列语言模型A)BERTB)ELMOC)GPTD)XLNET答案:D解析:XLNET提供了基于排列的语言模型,这是与BERT的一个关键区别。[单选题]59.分类模型包括决策树、贝叶斯和()分类方法A)线性回归B)岭回归C)K-meansD)SVM答案:D解析:[单选题]60.()的任务是:统计给定语料中有多少个不同的字对,每个字对各出现多少次。A)单字字频统计B)双字字频统计C)多字字频统计D)字对字频统计答案:B解析:[单选题]61.预训练模型GPT的优点是什么A)引入了单向的Transformer效果得到提升B)使用双向的TransformerC)抛开了下文只用了上文信息D)使用了双向的LSTM做特征提取答案:A解析:[单选题]62.在NLP中CRF的到广泛的应用,那么CRF是什么模型A)是生成式模型B)是判别式模型C)即是生成式模型又是判别式D)不确定答案:B解析:[单选题]63.哪个激活函数用于表示GRU的?门?A)reluB)tanhC)LeakyReluD)sigmoid答案:D解析:[单选题]64.下边关于CBOW说法正确的是A)使用中心词预测上下文单词B)与上下问的词序是相关的C)和Skip-Gram是相同的D)使用上下文单词预测中心词答案:D解析:[单选题]65.下列哪一种技术能被用于英语中的关键词归一化,即把关键词转化为其基本形式?A)词形还原B)探测法C)余弦相似度D)N元语法模型答案:A解析:[单选题]66.语义网络是一种用实体及其语义关系来表达知识的()A)有义图B)无义图C)有向图D)无相图答案:C解析:[单选题]67.在预处理极端,关于数据归一化的描述正确的哪个选项A)通过中值和均值进行确定B)通过方差和均值确定C)通过平均值和最小值确定D)通过标准差和均值确定答案:B解析:[单选题]68.什么是结构化数据?A)数据库中的数据B)HTML文档C)文本D)图片答案:A解析:[单选题]69.tf.to_int64的作用?A)转为64位浮点类型-float64B)转为32位整型-int32C)字符串转为数字D)转为64位整型-int64答案:D解析:[单选题]70.所谓继承是指对事物的描述从()结点传递到具体结点A)抽象B)现实C)普通D)任意答案:A解析:[单选题]71.自然语言理解是人工智能的重要应用领域,下面列举中的()不是它要实现的目标。A)理解别人讲的话B)对自然语言表示的信息进行分析概括或编辑。C)自动程序设计D)机器翻译答案:C解析:[单选题]72.神经网络反向传播传播的是什么?A)学习率B)迭代次数C)误差D)网络层数答案:C解析:[单选题]73.通过(1,3)(2,5)(3,7)(4,9)这些数据可以构建怎样的线性函数A)Y=W*X+bB)Y=lnXC)Y=X²D)Y=K*X²答案:A解析:[单选题]74.tf如何定义常量?A)tensor=tf.constant([1,2])B)tensor=tf.constant(1)C)tensor=tf.constant(-1,shape=[2,3])D)a=tf.constant([1.0,2.0],name="a)答案:D解析:[单选题]75.下边哪些模型不能将文本向量化A)word2vecB)bertC)ELMOD)DSSM答案:D解析:[单选题]76.信息增益和信息增益比相比有什么不同A)它们的计算方法完全相同B)信息增益总是偏向于选择取值较多的属性。信息增益比在此基础上增加了一个罚项C)信息增益可以处理连续型的数据D)信息增益比可以处理连续型的数据答案:B解析:[单选题]77.不属于面向对象的是A)A:封装B)B:继承C)C:多态D)D:消息答案:D解析:[单选题]78.SVM中的代价参数C表示什么?A)交叉验证的次数B)用到的核函数C)在分类准确性和模型复杂度之间的权衡D)以上都不对答案:C解析:[单选题]79.KNN算法的基本要素有()A)K值的选择距离度量分类决策规则B)利用自变量和因变量之间的一次函数关系C)找出最好的分类超平面D)利用自变量和因变量之间的对数关系答案:A解析:[单选题]80.聚类中的肘部法则是选择A)就是从K值和代价函数J的二维图中找出J下降变平滑的拐点对应的K值。B)最大K值C)最小K值D)随机K值答案:A解析:[单选题]81.自然语言处理发展,主要存在的难点不包括A)语言不规范,灵活性高B)新词C)错别字D)语种过多答案:D解析:[单选题]82.早期的语料库语言学主要研究不包括A)语料库的建设B)语言习得C)音系研究D)方言学与语料库技术的结合答案:A解析:[单选题]83.马尔可夫链具有()特性A)状态转移B)无记忆性C)稳定变化D)随机性答案:B解析:[单选题]84.为什么会提出LightGBM,最主要是什么原因A)并无实际的意义B)为了解决GBDT的并行问题C)为了改进XGBoostD)为了解决GBDT在大数据上遇到的问题答案:D解析:[单选题]85.数据归一化通常和以下哪个选项中一起使用A)训练集的mini-batchB)测试集的mini-batchC)整个训练集D)整个测试集答案:A解析:[单选题]86.从句子左端将一个终结符移到栈顶是什么操作A)归约B)接收C)移进D)拒绝答案:C解析:[单选题]87.OpenCV中,高通滤波器的作用是?A)检测低频率B)检测高频率C)过滤信号频谱低频部分D)过滤信号频谱高频部分答案:C解析:[单选题]88.NLP中的核心和最重要网络是哪个?A)CNNB)NNC)RNND)SVM答案:C解析:[单选题]89.下列不正确的是A)正则文法(3型)通常用于词法分析B)0型文法生成能力弱C)上下文有关文法(1型)的分析算法过于复杂,不便于实际应用D)上下文无关文法(2型)的规则体系便于构造,是研究得最多的一种文法答案:B解析:[单选题]90.高斯马尔可夫定理中OLS估计量的有A)OLS估计量的期望值等于待估参数B)OLS估计量的值等于待估参数C)残差和为0D)OLS估计量在所有想i选哪个无偏估计两会中具有最小方差答案:D解析:[单选题]91.LDA模型是应用比较广泛的一种主题模型,包含词、()和文档3层结构。A)主题B)词频C)权重D)词性答案:A解析:[单选题]92.以下哪个激活函数的执行速度是最快的A)reluB)tanhC)sigmoidD)不能确定答案:A解析:[单选题]93.逻辑回归的目标函数中增大L1正则化会有什么结果A)所有的参数w都变成0B)所有参数w都会趋近于0C)所有参数w都不会变化D)不确定答案:A解析:[单选题]94.马尔科夫是个几元组模型A)1B)2C)3D)4答案:C解析:[单选题]95.汉语自动分词的准确率具体定义是()A)P=(系统输出正确词个数/系统输出词个数)*100%B)R=(系统输出正确词个数/标准答案中词的个数)*100%C)F=((β2+1)*P*R)/(β2*P+R)=(B=1)(2*P*R)/(P+R)D)P(A|B)=P(B|A)*P(A)/P(B)答案:A解析:[单选题]96.NLP自然语言处理的一般处理流程顺序是():1、获取语料2、数据预处理3、特征工程4、特征选择5、模型选择6、模型训练7、模型评估8、投产上线A)12345678B)12345687C)21345678D)21346578答案:A解析:[单选题]97.以下选项中哪个和其他的是不同的A)nltkB)scikitlearnC)SpaCyD)BERT答案:D解析:除了BERT是一个词嵌入方法以外,其它都是NLP库。[单选题]98.语言就是()A)句子的集合B)产生式的集合C)符号串的集合D)句型的集合答案:A解析:[单选题]99.基于直方图的稀疏特征优化多线程优化。是以下哪个框架做的优化A)LightGBMB)XGBoostC)随机森林D)GBDT答案:A解析:[单选题]100.关于数据处理定理下列说法不正确的是A)若X、Y、Z组成一个马尔可夫链,则有I(X;Z)大于等于I(X;Y)B)若X、Y、Z组成一个马尔可夫链,则有I(X;Z小于等于I(X;Y)C)数据处理过程中熵不会增加D)通过数据处理后,一般只会增加信息的损失,最多保持原来的信息答案:A解析:[单选题]101.SVM算法有很多的优点,以下四个选项中针对SVM的性能为什么好,描述正确的是?A)核函数的选择B)核函数的参数C)软间隔参数CD)以上所有答案:D解析:[单选题]102.Word2Vec的训练方式属于__?A)无监督B)有监督C)半监督D)自主学习答案:A解析:[单选题]103.下列不是自然语言处理的应用领域的是()。A)经济B)政务C)医疗D)商务答案:A解析:[单选题]104.以下哪个操作可以停止树的循环A)加入L2正则B)加入L1正则C)设置树的最大深度D)以上都可以答案:C解析:[单选题]105.对于超参数调试的方法的描述,其中描述正确的是哪个选项?A)随机选择点来试验超参数效果B)当你给超参数取值时,另一个惯例是采用由精细到粗糙的策略。C)只调试容易的D)给定默认值即可答案:A解析:[单选题]106.高维组合特征的处理,具体是怎么做的A)在特征工程中经常会把一阶离散特征两两组合B)在特征工程中经常会把一阶离散特征打散C)删除一部分离散特征D)不确定答案:A解析:[单选题]107.指数分布的均值的倒数的共轭先验分布是()A)贝塔分布B)泊松分布C)伽马分布D)指数分布答案:B解析:[单选题]108.反向传播指的是哪个变量的传递?A)训练轮次B)批处理数C)误差D)网络层数答案:C解析:[单选题]109.马尔可夫模型的局限性不包括A)数据规模B)状态迁移C)异质性D)静态分析答案:D解析:[单选题]110.LDA模型的隐变量Z是A)每个词对应的主题B)每篇文档对应的主题C)每段话对应的主题D)每个词组对应的主题答案:A解析:[单选题]111.如果说数据当中有缺失值,可以使用以下哪种方式去填充A)平均值B)不填充C)代价D)学习率答案:A解析:[单选题]112.K-Means最终得到的结果是什么A)将已经分类好的数据,重新进行划分类别B)未标记的数据聚类成不同的组C)不确定D)将已经标记好的数据打散成无类别形式答案:B解析:[单选题]113.tf.mul的作用是什么A)相乘B)相加C)相减D)相除答案:A解析:[单选题]114.文本分类,情感识别等等属于以下哪个选项的子任务A)数据挖掘B)不确定C)图像识别D)自然语言答案:D解析:[单选题]115.以下针对数据粒度的描述中,哪个表述不正确:A)粒度是指数据仓库小数据单元的详细程度和级别;B)数据越详细,粒度就越小,级别也就越高;C)数据综合度越高,粒度也就越大,级别也就越高;D)粒度的具体划分将直接影响数据仓库中的数据量以及查询质量.答案:C解析:[单选题]116.长短期记忆人工神经网络Longshort-termmemory,其缩写是()A)LSTMB)CONVC)CNND)RNN答案:A解析:第2部分:多项选择题,共57题,每题至少两个正确答案,多选或少选均不得分。[多选题]117.在k-NN中可以使用以下哪个距离度量?A)ManhattanB)MinkowskiC)TanimotoD)Jaccard答案:ABCD解析:[多选题]118.以下四个伪代码中,哪个是pytorch的学习率调整方法A)lr_scheduler.StepLRB)lr_scheduler.MultiStepLRC)lr_scheduler.ExponentialLRD)lr_scheduler.CosineAnnealingLR答案:ABCD解析:[多选题]119.神经网络在NLP中有哪些常见应用领域A)机器创作B)个性化推荐C)文本分类D)情感分析答案:ABCD解析:[多选题]120.序列类型数据有:A)语音识别B)情感分类C)机器翻译D)DNA序列分析答案:ABCD解析:[多选题]121.信息增益是由什么求来的A)信息熵B)信息增益比C)条件熵D)基尼系数答案:AC解析:[多选题]122.词_袋_子模型的优点A)简单方便快速B)在语料充足的前提下,对于简单自然语言处理任务效果不错C)准确率较低D)无法关注词语间的顺序答案:AB解析:[多选题]123.以下哪几项属于GRUA)更新门B)遗忘门C)输入门D)重置门答案:AD解析:[多选题]124.在神经网络中经常使用交叉熵,以下几个选项中描述正确的是?A)用信息熵B)用softmax映射到概率空间C)在全连接层D)进行优化时用答案:ABCD解析:[多选题]125.情感分析的主要内容包括()A)主客观分类B)情感分类C)情感极性判断D)情感表达答案:ABC解析:[多选题]126.深度学习提出的常用激活函数有哪些A)ReluB)leaky-ReluC)tanhD)sigmoid答案:ABCD解析:[多选题]127.以下哪些数据是常见的数据A)文本B)图像C)音频D)视频答案:ABCD解析:[多选题]128.深度学习在CV图像中有哪些常见应用A)图像识别B)物体识别C)图片修复D)图片美化答案:ABCD解析:[多选题]129.ELMO,BERT,GPT三个预训练模型,以下说法错误的是__?A)都是预训练模型B)ELMO使用的LSTM,BERT和GPT用的是TransformerC)BERT和GPT都使用的Transformer作为的特征提取D)以上都正确答案:ABCD解析:[多选题]130.哪些是判别式Discriminativemodel模型A)HMMB)SVMC)CRFD)MEMM答案:BCD解析:[多选题]131.使用决策树去做预测需要以下哪些步骤A)收集数据B)分析数据C)训练算法D)测试算法答案:ABCD解析:[多选题]132.GBDT主要由哪几个概念组成A)RegressionDecistionTree(即DT)B)GradientBoosting(即GB)C)Shrinkage(算法的一个重要演进分枝,目前大部分源码都按该版本实现)。D)以上都正确答案:ABCD解析:[多选题]133.文本生成任务包括哪几类A)文本到文本的生成B)数据到文本的生;C)文本到图像的生成D)图像到文本的生成答案:ABD解析:[多选题]134.交叉熵公式的符号代表为:A)m是训练输入元素个数B)∑的加和长度是输入个数C)y(i)来自标签的onehot表D)hθ(x(i))和标签one-hot表维度一致答案:ABCD解析:[多选题]135.下面属于维归约常用的线性代数技术的有:A)主成分分析B)特征提取C)奇异值分解D)特征加权答案:AC解析:[多选题]136.关于k-NN算法,以下哪个陈述是正确的?A)如果所有数据的比例均相同,则k-NN的效果会更好B)k-NN在少数输入变量(p)下工作良好,但在输入数量很大时会遇到困难C)k-NN对所解决问题的函数形式没有任何假设D)以上都正确答案:ABCD解析:[多选题]137.如果需要做Batch归一化的操作,那么它的具体流程是怎样的?A)求每个训练批次数据的均值B)求每个训练批次数据的方差C)使用求得的均值和方差对该批次的训练数据做归一化,获得0-1分布D)尺度变换和偏移答案:ABCD解析:[多选题]138.为什么SVM对缺失某些特征数据敏感?A)VM没有处理缺失值的策略(决策树有)B)特征空间的好坏对SVM的性能很重要C)SVM希望样本在特征空间中线性可分D)以上都正确答案:ABCD解析:[多选题]139.以下几个tensorflow中的方法,可以做总体加和或平均的函数,分别是哪个?A)tf.reduce_sumB)tf.multiplyC)tf.reduce_meanD)tf.norm答案:AC解析:[多选题]140.基于神经网络的语言模型一般分为哪几层A)输入层B)投影层C)隐藏层D)输出层答案:ABCD解析:[多选题]141.下面属于NLP研究内容的有哪些?A)文档分类B)信息抽取C)舆情分析D)信息检索答案:ABCD解析:[多选题]142.下列选项中,哪些属于NLP知识体系()A)问答系统B)词性标注C)文本挖掘D)纠错答案:AC解析:[多选题]143.正则表达式可以()A)测试字符串内的模式。例如,可以测试输入字符串,以查看字符串内是否出现电话号码模式或信用卡号码模式B)替换文本。可以使用正则表达式来识别文档中的特定文本,完全删除该文本或者用其他文本替换它C)基于模式匹配从字符串中提取子字符串D)可以查找文档内或输入域内特定的文本答案:ABCD解析:四、填空题8题)[多选题]144.数学建模前需要哪些准备工作。A)A:填补缺失值B)B:计算召回率C)C:数据标准化D)D:填补缺失值答案:ABC解析:[多选题]145.L1和L2正则化的区别A)L1可以让一部分特征的系数缩小到0,从而间接实现特征选择。B)L1让所有特征的系数都缩小,但是不会减为0,它会使优化求解稳定快速C)L2可以让一部分特征的系数缩小到0,从而间接实现特征选择。D)L2让所有特征的系数都缩小,但是不会减为0,它会使优化求解稳定快速答案:AD解析:[多选题]146.以下哪些属于GRUA)更新门B)重置门C)输入门D)输出门答案:AB解析:[多选题]147.以下四个选项当中描述的是EM算法缺点的是?A)简单性和普适性B)解决梯度下降等优化方法的缺陷C)对初始值敏感D)不能保证找到全局最优值。答案:CD解析:[多选题]148.什麽样的资料集不适合用深度学习A)数据集太大B)数据集太小,数据样本不足C)数据集没有局部相关特性D)样本量太多答案:BC解析:[多选题]149.关于LDA有有哪些含义A)一种是线性判别分析(LinearDiscriminantAnalysis)B)不确定C)种是概率主题模型:隐含狄利克雷分布D)以上都正确答案:AC解析:[多选题]150.情感分析的应用领域有()A)商品评论B)舆情分析C)信息预测D)推荐系统答案:ABCD解析:[多选题]151.在Histogram算法之上,LightGBM还做了哪些优化A)带深度限制的Leaf-wise的叶子生长策略B)直方图做差加速直接C)支持类别特征(CategoricalFeature)D)不确定答案:ABC解析:[多选题]152.MLlib中用于线性回归算法的包主要有()。A)RidgeRegressionWithSGDB)LinearRegressionWithSGDC)LeftRegressionD)LassoWithSGD答案:ABD解析:[多选题]153.卷积神经网络中的卷积操作分别都是有哪些部分构成的A)卷积层B)RELUC)POOLING层D)pedding答案:ABC解析:[多选题]154.Jieba.cut方法的3个参数分别是?A)cat_allB)HMMC)SepD)sentence答案:ABD解析:[多选题]155.如果模型训练中使用到了Adam动态优化器,可以使用以下哪种方式下降?A)batchB)mini-batchC)LassoD)Ridge答案:AB解析:[多选题]156.以下关于隐马尔科夫模型的参数说法正确的是A)Y:隐状态B)A:输出观察值概率矩阵C)B:状态转移概率矩阵D)Π:初始状态概率矩阵答案:AD解析:[多选题]157.关于神经网络,由哪几部分组成A)输入层B)输出层C)隐藏层D)以上都正确答案:ABCD解析:[多选题]158.下列任务中,SVM可以做哪些任务A)分类B)聚类C)降维D)回归答案:AD解析:[多选题]159.逻辑回归有哪些可以优化的方法A)梯度下降B)随机梯度下降C)mini随机梯度下降D)以上都正确答案:ABCD解析:[多选题]160.有向图模型和无向图模型的不同之处A)无向图模型因子是势函数,需要全局归一B)有向图模型因子是概率分布,需要全局归一C)有向图模型因子是概率分布,无需全局归一D)无向图模型因子是势函数,无需全局归一答案:AC解析:[多选题]161.添加了正则化项的,以下都有哪些模型?A)A:lasso回归B)B:Ridge回归C)C:逻辑回归D)D:K-means答案:AB解析:[多选题]162.iAIEngine-NLU词性标注返回值类型ResponseResult对象中包括以下哪些参数?()A)codeB)messageC)posD)type答案:ABC解析:[多选题]163.EM算法在机器学习中有着怎样的应用A)学习高斯混合模型B)隐马尔科夫算法C)LDA主题模型的变分推断D)不确定答案:ABC解析:[多选题]164.GBDT虽然有很好的应用和效果,但是也有很明显的缺点,比如___A)预测阶段的计算速度快,树与树之间可并行化计算(注意预测时可并行);B)在分布稠密的数据集上,泛化能力和表达能力都很好;C)训练过程需要串行训练,只能在决策树内部采用一些局部并行的手段提高训练速度。D)GBDT在高维稀疏的数据集上表现不佳;答案:CD解析:[多选题]165.以下关于Batch归一化的特点描述正确的选项是哪些?A)使参数搜索问题变得容易B)使神经网络对超参数的选择更加稳定C)超参数的范围更加庞大D)使训练更加容易答案:ABCD解析:[多选题]166.判别式Discriminativemodel模型有什么缺点A)学习过程比较复杂B)目标分类中易产生较大错误率C)不能反映训练数据本身的特性D)没办法把整个场景描述出来答案:CD解析:[多选题]167.可以度量文本相似度的算法有哪些A)主题模型B)LDAC)BERTD)Word2Vec+VSM答案:ABCD解析:[多选题]168.对sigmoid描述正确的是?A)将负的权值映射到正值B)将输出数据压缩到[0,1]集合范围C)能解决非线性分类问题D)将正权值映射到负数答案:ABC解析:[多选题]169.以下选项中关于梯度下降法有哪几种类型A)GDB)SGDC)MiniBatchSGDD)SVD答案:ABC解析:[多选题]170.马尔科夫三元组当中分别表示什么A)S是状态集合B)π是初始状态的概率C)X是输入的向量D)A是状态间的转移概率答案:ABD解析:[多选题]171.以下几个选项中,属于语言模型的是哪些A)统计的语言模型B)机器学习的语言模型C)神经网络的语言模型D)不确定答案:AC解析:[多选题]172.为什么GBDT不适合使用高维稀疏特征?A)高维稀疏的ID类特征会使树模型的训练变得极为低效B)容易过拟合。C)高维稀疏的ID类特征会使树模型的训练变得极为高效D)容易欠拟合。答案:AB解析:[多选题]173.文本计算相似度方式有哪些A)欧几里得距离B)曼哈顿距离C)SimHashD)余弦相似性答案:ABCD解析:第3部分:判断题,共66题,请判断题目是否正确。[判断题]174.SVM就是想找到一个距离最大的超平面,可以更好的去做分类A)正确B)错误答案:对解析:[判断题]175.XGBoost对树的复杂度包含了两个部分:一个是树里面叶子节点的个数T;一个是树上叶子节点的得分w的L2模平方A)正确B)错误答案:对解析:[判断题]176.激活函数其实就是接了一个线性的变换A)正确B)错误答案:错解析:[判断题]177.扩展库jieba的函数cut可以用来对中文文本进行分词并返回包含分词结果的列表。对A)正确B)错误答案:对解析:[判断题]178.ELMO使用到了遮蔽掉部分词去进行训练的思想A)正确B)错误答案:错解析:[判断题]179.目前较常用的无监督关键词提取算法有TF-IDF算法、TextRank算法和主题模型算法。对A)正确B)错误答案:对解析:[判断题]180.语义分析从分析的深度上分为浅层语义分析和深层语义推理两个层次A)正确B)错误答案:对解析:[判断题]181.RNN可用于判断输入句子的情感倾向。对A)正确B)错误答案:对解析:[判断题]182.概率图模型包括了朴素贝叶斯模型、最大熵模型、隐马尔可夫模型、条件随机场、主题模型等,在机器学习的诸多场景中都有着广泛的应用。A)正确B)错误答案:对解析:[判断题]183.L1会将参数缩减为0,而L2会将参数缩小趋近于0A)正确B)错误答案:对解析:[判断题]184.Batch_Size太小,模型表现效果极其糟糕(error飙升)。A)正确B)错误答案:对解析:[判断题]185.深度学习可以在NLP中取得这样的成绩主要归结为海量的数据和深度学习算法的革新。A)正确B)错误答案:对解析:[判断题]186.逻辑回归可以将多分类看成多个二分类,然后进行多分类A)正确B)错误答案:对解析:[判断题]187.只有大的语料库才可以有效利用语料检索系统.错A)正确B)错误答案:错解析:[判断题]188.ID3,C4.5,CART都属于逻辑回归算法A)正确B)错误答案:错解析:[判断题]189.最基础的Seq2Seq模型包含了3个部分,即编码器、解码器和连接两者的中间状态向量。对A)正确B)错误答案:对解析:[判断题]190.GBDT和随机森林的思想和流程是相同的A)正确B)错误答案:错解析:[判断题]191.tf-idf在文本分类中效果一定比word2vec好。错A)正确B)错误答案:错解析:[判断题]192.可以使用1-NN分类器构造2-NN分类器吗?A)正确B)错误答案:对解析:[判断题]193.分类和聚类并不属于机器学习的算法A)正确B)错误答案:错解析:[判断题]194.降维算法,可以筛选出来更少的特征去做任务,有更好的效果A)正确B)错误答案:对解析:[判断题]195.分布式表示的思想是词的语义是通过上下文信息确定的,即相同语境出现的词,其语义也相近。对A)正确B)错误答案:对解析:[判断题]196.将文本进行Embedding的过程叫做,词干提取(Stemming)A)正确B)错误答案:错解析:这是分词(tokenization),而不是词干提取。[判断题]197.one-hot可以直接做命名实体识别A)正确B)错误答案:错解析:[判断题]198.HMM的状态序列既不能直接获得,也不能通过观察序列获得A)正确B)错误答案:错解析:[判断题]199.人工智能的三大学派包括连接主义,符号主义和行为主义A)正确B)错误答案:对解析:[判断题]200.SVM做分类的本质是想找到一条最优的超平面,完美的分开不同的类别A)正确B)错误答案:对解析:[判断题]201.情感分析是基于大数据的文本分析的一种运用,指的是对文本中情感的倾向性和评价对象进行提取的过程。()A)正确B)错误答案:对解析:[判断题]202.N-gram模型中,N指的是忽略距离大于n的上文词的影响,N越大时。模型包含的次序信息越丰富,同时计算量随之增大。A)正确B)错误答案:对解析:[判断题]203.KNN通过建立因变量和自变量之间的一次函数关系,来做回归A)正确B)错误答案:对解析:[判断题]204.特征选择是决策树学习算法的关键()A)正确B)错误答案:对解析:[判断题]205.DM模型对应Word2Vec模型里的Skip-gram模型。错A)正确B)错误答案:错解析:[判断题]206.XGBoost并不是一个集成学习的算法A)正确B)错误答案:错解析:[判断题]207.自然语言处理研究的分支领域包括文本分类、信息抽取、信息检索、信息过滤、自动文摘、智能问答、话题推荐、机器翻译、主题词识别、知识库构建、深度文本表示、命名实体识别、文本生成、文本分析(词法、句法和语法)、舆情分析、自动校对、语音识别与合成等。A)正确B)错误答案:对解析:[判断题]208.NLP的应用面非常广泛,涉及文化、教育、军事、医疗、商业、政务、社交等各个领域。()A)正确B)错误答案:对解析:[判断题]209.引入两层的神经网络可以使线性切分变成非线性切分A)正确B)错误答案:对解析:[判断题]210.决策树的测试:最小化损失函数A)正确B)错误答案:对解析:[判断题]211.XGBoost属于深度学习的一个经典算法A)正确B)错误答案:错解析:[判断题]212.n元谓词都不是命题A)正确B)错误答案:错解析:[判断题]213.正则表达式的search函数返回的是正则表达式在字符串中所有匹配结果的列表。错A)正确B)错误答案:错解析:[判断题]214.问答系统的知识库内容和规模能直接改变问答系统结果,并影响问答能力和效率。对A)正确B)错误答案:对解析:[判断题]215.上下文无关文法(2型)的规则体系便于构造,是研究得最多的一种文法A)正确B)错误答案:对解析:[判断题]216.隐马尔科夫模型的数学思想是由Baker极其同事在20世纪60年代到70年代初提出来的A)正确B)错误答案:错解析:[判断题]217.为了便于处理各个领域的文本,结巴分词提供了用户添加自定义词的功能。()A)正确B)错误答案:对解析:[判断题]218.逻辑回归是一个既可以做回归也可以做分类的算法A)正确B)错误答案:错解析:[判断题]219.gbdt通过多轮迭代,每轮迭代产生一个弱分类器,每个分类器在上一轮分类器的残差基础上进行训练。A)正确B)错误答案:对解析:[判断题]220.用任何一个汉字在语料中出现的次数,除以所有汉字出现的总次数,就可以得到这个汉字的频率。A)正确B)错误答案:对解析:[判断题]221.自然语言处理中,最常用深度学习算法是CNN,因为其具有记忆功能?A)正确B)错误答案:错解析:[判断题]222.如果某个特征当中有缺失值,缺失比较少的话,可以使用该特征的平均值或者其它比较靠谱的数据进行填充A)正确B)错误答案:对解析:[判断题]223

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论