人工智能自然语言技术练习(习题卷4)_第1页
人工智能自然语言技术练习(习题卷4)_第2页
人工智能自然语言技术练习(习题卷4)_第3页
人工智能自然语言技术练习(习题卷4)_第4页
人工智能自然语言技术练习(习题卷4)_第5页
已阅读5页,还剩49页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

试卷科目:人工智能自然语言技术练习人工智能自然语言技术练习(习题卷4)PAGE"pagenumber"pagenumber/SECTIONPAGES"numberofpages"numberofpages人工智能自然语言技术练习第1部分:单项选择题,共116题,每题只有一个正确答案,多选或少选均不得分。[单选题]1.常用的马尔科夫假设中,当前词(n)出现的概率依赖于哪些词A)n-3B)n-2C)nD)n-1答案:D解析:[单选题]2.以下关于分析说法不正确的是?A)基于规则的分词简单高效,但是词典维护困难B)在实际工程应用中,分词一般只采用一种分词方法C)中文不同于英文自然分词,中文分词是文本处理的一个基础步骤,分词性能的好坏直接影响比如词性,句法等其他模块的性能D)统计分词的目的就是对分词结果进行概率计算,获得概率最大的分词方式答案:B解析:[单选题]3.下列关于Word2Vec模型说法正确的是()。A)得到的训练结果不能度量词与词之间的相似性B)当这个模型训练好以后,需要用这个训练好的模型处理新的任务C)真正需要的是这个模型通过训练数据所得的参数D)Word2Vec模型其实就是简化的遗传算法模型答案:C解析:[单选题]4.贝叶斯网络的节点代表什么A)随机过程B)树的根C)树的叶子D)不确定答案:A解析:[单选题]5.最大正向匹配法可以用于()A)文本分类B)文本特征获取C)分词D)情感分析答案:C解析:[单选题]6.下列属于西文字符编码的是()A)ASCII码B)国标码C)GB13000D)GBK答案:A解析:[单选题]7.L1正则化表示为A)A:各个参数的平方和B)B:是模型参数中非零参数的个数C)C:各个参数绝对值之和D)D:以上都不对答案:C解析:[单选题]8.ID3,C4.5,他们有什么,相同的地方?A)将信息增益比作为了选择特征的标准B)将信息增益作为了选择特征的标准C)将基尼系数作为了选择特征的标准D)都属于决策树算法答案:D解析:[单选题]9.以下四个任务当中LDA可以很好的完成哪个任务?A)对图像进行文本B)对图像进行特征提取C)对文档的主题进行分类或聚类D)以上都正确答案:C解析:[单选题]10.以下哪些是神经网络中的?超参数??A)隐藏层的大小B)激活值C)权重D)偏置答案:A解析:[单选题]11.下列几个选项中对于卡方检验,描述正确的是A)卡方检验主要用于类别数据B)卡方检验不可以用于定量数据C)用于类别数据时必须先将数据分组才能获得实际的观测频数D)和KS检验相同答案:A解析:[单选题]12.以下___不是预训练模型?A)ELMOB)Word2VecC)BERTD)GPT-2答案:B解析:[单选题]13.适当的减少正则化的系数,可以预防什么情况A)防止过拟合B)防止欠拟合C)防止完美拟合D)不确定答案:B解析:[单选题]14.常用的softmax函数,下列选项中描述正确得是哪个?A)主要用于二分类B)算出来为概率值C)将最小的概率值所对应的类别作为输入样本的输出类别D)所有的概率相加大于1答案:B解析:[单选题]15.反向传播过程中传递的参数是什么?A)学习率B)迭代次数C)误差D)网络层数答案:C解析:[单选题]16.LSTM可以通过()来进行长短期记忆A)RNN控制B)前馈控制C)BP控制D)门控制答案:D解析:[单选题]17.下列哪个激活函数,处理梯度消失问题效果最好?A)sigmoidB)LeakyreluC)reluD)tanh答案:B解析:[单选题]18.关于距离空间,其基本目的,以下描述正确的是?A)求相关性B)构成线性空间C)度量后比较D)求信息熵答案:C解析:[单选题]19.双向的Transformer在以下哪个模型中有使用A)GPTB)BERTC)ELMOD)GPT-2答案:C解析:[单选题]20.m阶马尔可夫心愿的状态是指A)某个信源符号B)m个随机状态的某个具体消息C)某一转移概率D)状态转移图答案:D解析:[单选题]21.在NLP自然语言处理中,不可以做以下选项中的那个任务A)会话机器人B)人脸检测C)推荐系统D)文本纠错答案:B解析:[单选题]22.实际的应用中会有很多的数据,下列关于数据划分后的训练,测试以及验证说法错误的是哪个?A)可以直接使用训练集来验证算子的准确率B)训练集用于算子的拟合C)验证集和测试集用来评判算子的准确度D)可以不配置验证集答案:A解析:[单选题]23.下面哪个尺寸一般被用于设置batch_size大小A)125B)126C)127D)128答案:D解析:[单选题]24.XGBoost中用到了和哪个树相同的想法,去寻找最优A)随机森林B)CART回归树C)ID3D)C4.5答案:B解析:[单选题]25.支持向量机(SVM)是一个什么算法A)分类B)回归C)聚类D)降维答案:A解析:[单选题]26.从概率论的角度来说,概率图中的节点代表什么A)随机变量B)关系C)代价D)学习率答案:A解析:[单选题]27.下列说法错误的是A)浅层句法分析的方法基本上可以分成两类:基于统计的方法和基于规则的方法B)浅层句法分析是与完全句法分析相似的C)英语基本名词短语分为:由序数词、基数词和限定词修饰的名词短语;由形容词和名词修饰的名词短语D)自顶向下的分析,优点是节约空间,它自始至终只需存储一棵树的结构答案:B解析:[单选题]28.对一个概率空间,进行多种划分,其信息熵是A)一定相等B)一定不等C)不确定无关联D)互有关联答案:C解析:[单选题]29.L1正则的特点是:A)A:各个参数的平方和B)B:是模型参数中非零参数的个数C)C:各个参数绝对值之和D)D:以上都不对答案:C解析:[单选题]30.TF-IDF和词的那些因素相关A)不确定B)词意C)词序D)词权重答案:D解析:[单选题]31.CRF模型思想主要来源于()。A)无向图模型B)最大熵模型C)马尔可夫随机场D)统计方法答案:B解析:[单选题]32.如何使用tensorflow定义常量?A)tf.constantB)tf.placeholderC)tf.VariableD)tf.split答案:A解析:[单选题]33.MSE代表什么意思A)信息熵B)均方误差C)交叉熵D)信息增益答案:B解析:[单选题]34.若参数C(costparameter)被设为无穷,下面哪种说法是正确的?A)只要最佳分类超平面存在,它就能将所有数据全部正确分类B)软间隔SVM分类器将正确分类数据C)二者都不对D)不确定答案:A解析:[单选题]35.One-Hot是怎样的一种向量化表达方式A)分布式表示B)基于矩阵的表示C)基于神经网络的表示D)离散型表示答案:D解析:[单选题]36.在NLP中,不可以做以下选项中的那个任务A)聊天机器人B)车牌检测C)推荐系统D)文本纠错答案:B解析:[单选题]37.以下关于数据粒度,下面说法不正确的是:A)粒度是指数据仓库小数据单元的详细程度和级别;B)数据越详细,粒度就越小,级别也就越高;C)数据综合度越高,粒度也就越大,级别也就越高;D)粒度的具体划分将直接影响数据仓库中的数据量以及查询质量.答案:C解析:[单选题]38.ELMO中是为什么使用双向的LSTMA)从前往后,从后往前双向的更好的提取特征B)为了增加模型的复杂度C)为了舍弃句子当中的语义信息D)以上都不正确答案:A解析:[单选题]39.tensoflow中的函数Graph.get_operations()的作用是什么A)返回图中的操作节点列表B)为节点创建层次化的名称,并返回一个上下文管理器C)完成图的构建,即将其设置为只读模式D)返回图中的操作节点列表答案:D解析:[单选题]40.朴素贝叶斯有着广泛的应用,那么朴素贝叶斯分类是基于()假设。A)条件独立B)条件不独立C)联合概率D)不确定答案:A解析:[单选题]41.深入挖掘Transformer,在其输入阶段如何做的位置向量A)使用sin,cos函数B)使用one-hotC)随机初始D)不确定答案:A解析:[单选题]42.使用的TensorFlow中的一个方法进行数据的计算tf.subtract,最终会返回什么类型的数据A)TensorB)数组C)矢量D)范数答案:A解析:[单选题]43.建立了一个kNN分类器,该分类器在训练数据上获得100%的准确性。当他们在客户端上部署此模型时,发现该模型根本不准确。以下哪项可能出错了?A)可能是模型过拟合B)可能是模型未拟合C)不能判断D)这些都不是答案:A解析:[单选题]44.X.dat中字段含义错误的是A)ss_type:词性标注B)w_cont:词语个数C)word:词语D)lex_id:2位16进制数表示的一个词语编号答案:D解析:[单选题]45.什么情况下神经网络模型被称为深度学习模型?A)加入更多层,使神经网络的深度增加B)有维度更高的数据C)当这是一个图形识别的问题时D)以上都不正确答案:A解析:[单选题]46.下列选项当中,XGBoost对树的复杂度描述正确的是哪个选项?A)一个是树里面根节点的个数TB)一个是树里面叶子节点的个数TC)不确定D)以上都正确答案:B解析:[单选题]47.,Transformer是很常用的特征提取器,那么Transformer架构首先是由下列哪项引入的?A)GloVeB)BERTC)OpenAI?sGPTD)ULMFit答案:C解析:ULMFit拥有基于LSTM的语言建模架构;这之后被OpenAI的GPT的Transformer架构所取代。[单选题]48.Batch归一化操作用于网络的什么层?A)输出层B)输入层C)无法在隐藏层起作用D)用于输入层,甚至深度隐藏层的归一化过程答案:D解析:[单选题]49.tanh的输出范围是多少A)[0,1]B)[-1,1]C)[-1,0]D)[-0.5,0.5]答案:B解析:[单选题]50.以下__使用LSTM做特征提取器A)ELMOB)BERTC)GPTD)GPT-2答案:A解析:[单选题]51.以下哪个激活函数常用于解决类似文本分类的多分类任务A)tanhB)sigmoidC)reluD)softmax答案:D解析:[单选题]52.向量空间的别称是:A)线性空间B)内积空间C)赋范空间D)希尔伯特空间答案:A解析:[单选题]53.语言模型的用途主要有A)已知若干个词,预测下一个词B)决定哪一个词序列的可能性更大C)统计词组D)A和B答案:D解析:[单选题]54.串行地训练一系列前后依赖的同类模型,即后一个模型用来对前一个模型的输出结果进行纠正属于什么思想A)BaggingB)BoostingC)StackingD)以上都正确答案:B解析:[单选题]55.在文档中加入词的权重也是必要的,那么以下哪个可以计算的出词权重A)词频(TF)B)逆文档频率(IDF)C)Word2VecD)隐狄利克雷分布(LatentDirichletAllocation)答案:B解析:[单选题]56.为模型选择超参数,选择了不同的取值,不可以_____?A)选择对训练集目标而言的最优解B)对于开发集而言的最优解C)超参搜索过程中最想优化的东西D)简化参数调试答案:D解析:[单选题]57.线性回归在工业中有着广泛的应用,以下几个选项中,属于线性回归应用的是A)数据降维B)垃圾邮件分类C)癌症良性恶性分类D)房价预测答案:D解析:[单选题]58.情感分析属于什么算法A)分类B)回归C)聚类D)降维答案:A解析:[单选题]59.以下哪个函数常用于解决多分类问题A)tanhB)sigmoidC)softmaxD)relu答案:C解析:[单选题]60.RNN的中文全称是什么?A)循环神经网络B)标准神经网络C)卷积神经网络D)自注意力机制答案:A解析:[单选题]61.关于Batch归一化的描述,说法正确的是?A)批量归一化B)仅对输入数据进行归一化C)仅对隐藏层进行归一化D)提升了参数搜索难度答案:A解析:[单选题]62.以下哪个领域包含命名实体识别任务A)图像识别B)数据挖掘C)自然语言D)不确定答案:C解析:[单选题]63.以下四个现象中,那个是关键词提取的方法A)基于主题模型B)基于概率模型C)基于信息D)以上没有答案:A解析:[单选题]64.doc2vec是一种什么类型的算法?()A)非监督式算法B)监督式算法C)神经网络算法D)感知机算法答案:A解析:[单选题]65.DM模型与CBOW模型的区别为()。A)DM模型的输入包括上下文B)DM模型预测目标词出现的概率C)DM模型输入不仅包括上下文,而且还包括相应的段落D)CBOW模型输入包括上下文答案:C解析:[单选题]66.EM最大期望算法的第一步是做什么A)求代价B)最大化C)计算期望D)不确定答案:C解析:[单选题]67.在tf中常用的Add函数它的用途是做什么?A)维度转化B)相加C)相乘D)相减答案:B解析:[单选题]68.下列说法中关于Batch归一化的描述,说法正确的是?A)批量归一化B)仅对输入数据进行归一化C)仅对隐藏层进行归一化D)提升了参数搜索难度答案:A解析:[单选题]69.为什么要使用激活函数,有什么意义和用途A)进行非线性变换,增强表达能力B)进行线性变换,增强表达能力C)进行线性变换,减少表达能力D)进行非线性变换,减少表达能力答案:A解析:[单选题]70.Adam动态优化器,下列关于它的说法正确的是?A)强化了RMSprop算法B)强化了动量梯度算法C)同时使用Momentum和RMSprop算法D)没有核心答案:C解析:[单选题]71.以下几个描述中,关于优化算法减小学习率的原因,说法正确的是?A)一种默认定式B)减少内存容量C)避免在最优解附近大幅度摆动D)减少迭代次数答案:C解析:[单选题]72.真正正确的占所有预测为正的比例,这个计算方式可以计算出来什么?A)精确率B)召回率C)F1D)ROC答案:A解析:[单选题]73.以下哪个技术支持双向的上下文A)Word2VecB)BERTC)GloVeD)以上所有答案:B解析:[单选题]74.一个家用电器制造商雇佣你帮助其分析社交媒体数据来决定它们的哪个冰箱质量是最可靠的。你会用以下哪一个工具来分析?()A)文本挖掘工具B)情感分析软件C)网页挖掘技术D)数据挖掘软件答案:B解析:[单选题]75.LSA是如何得到文本的词向量的?A)SVDB)PCAC)KNND)K-Means答案:A解析:[单选题]76.集成学习中的随机森林和GBDT有很多异同点,关于他们相同点说法正确的是A)都是由多棵树组成,最终的结果都是由多棵树一起决定。B)组成随机森林的树可以并行生成,而GBDT是串行生成C)随机森林的结果是多数表决表决的,而GBDT则是多棵树累加之和D)随机森林对异常值不敏感,而GBDT对异常值比较敏感答案:A解析:[单选题]77.符号主义是()A)是人工智能的主流B)是人工智能的基础C)是人工智能的全部D)不是人工智能答案:A解析:[单选题]78.GBDT和随机森林都属于集成学习,因此他们有相似的地方,下列描述正确的是A)组成随机森林的树可以并行生成,而GBDT是串行生成B)随机森林的结果是多数表决表决的,而GBDT则是多棵树累加之和C)都是由多棵树组成,最终的结果都是由多棵树一起决定。D)随机森林对异常值不敏感,而GBDT对异常值比较敏感答案:C解析:[单选题]79.语料库研究属于()A)实验研究B)非实验研究C)田野研究D)化学研究答案:B解析:[单选题]80.如何理解线性回归中的?线性?A)两个变量之间的关系是一次函数的关系,图像是条直线B)两个变量之间的关系是二次函数的关系,图像是条抛物线C)两个变量之间的关系是对数的关系D)两个变量之间的关系是指数函数的关系答案:A解析:[单选题]81.最简单常用的sigmoid激活函数的输出值的范围是在以下哪个区间中?A)0~1B)0~2C)-1~0D)-1~1答案:A解析:[单选题]82.零均值归一化是怎么做的A)原始数据进行线性变换B)使结果映射到[0,1]的范围C)实现对原始数据的等比缩放D)将原始数据映射到均值为0、标准差为1的分布上答案:D解析:[单选题]83.以下四个选项中,和K-means一样都属于无监督算法的是?A)KNNB)SVMC)逻辑回归D)PCA答案:D解析:[单选题]84.在训练模型的时候,经常会加入正则项,那么加入了正则项之后,会有什么效果A)正常拟合B)过拟合C)欠拟合D)不确定答案:B解析:[单选题]85.虽然随机森林和GBDT都属于集成学习,他们有什么不同之处A)都是由多棵树组成,最终的结果都是由多棵树一起决定。B)组成随机森林的树可以并行生成,而GBDT是串行生成C)RF和GBDT在使用CART树时,可以是分类树或者回归树。D)不确定答案:B解析:[单选题]86.以下哪种情况会造成过拟合A)数据样本中的噪声太大B)模型复杂度太低C)模型过于简单D)数据特征太少答案:A解析:[单选题]87.LSTM网络通过精妙的()将短期记忆与长期记忆结合起来,并且一定程度上解决了梯度消失的问题A)RNN控制B)前馈控制C)BP控制D)门控制答案:D解析:[单选题]88.多层长短期记忆人工神经网络LSTM,组合成多层网络结构后,可以处理更大范围的()A)不稳定性B)静态性C)动态性D)鲁棒性答案:C解析:[单选题]89.朴素贝叶斯分类器的朴素之处在于A)只能处理低维度属性B)只能处理离散属性C)分类效果一般D)属性之间的条件独立性假设答案:D解析:[单选题]90.自然语言处理主要是关于()的技术。A)机械学B)通信学C)物理学D)逻辑学答案:D解析:[单选题]91.哪个激活函数的用于表示LSTM的?门?的概念A)reluB)tanhC)LeakyReluD)sigmoid答案:D解析:[单选题]92.奇异值分解的缺点。A)A:转换后的数据比较难理解。B)B:简化数据C)C:降低模型计算性能D)D:压缩维度答案:A解析:[单选题]93.语料库研究属于()A)实验研究B)非实验研究C)田野研究D)化学研究答案:B解析:[单选题]94.如说使用到了N-gram模型,如果N越大,会造成什么后果A)效果越差B)训练时间越短C)复杂度越低D)效果越好但是训练时间更长答案:D解析:[单选题]95.GBDT有很多的局限性,在以下说法中关于它的局限性描述正确的是A)预测阶段的计算速度快,树与树之间可并行化计算。B)在分布稠密的数据集上,泛化能力和表达能力都很好,这使得GBDT在Kaggle的众多竞赛中,经常名列榜首。C)GBDT在高维稀疏的数据集上,表现不如支持向量机或者神经网络。D)采用决策树作为弱分类器使得GBDT模型具有较好的解释性和鲁棒性,能够自动发现特征间的高阶关系。答案:C解析:[单选题]96.迁移学习的英文表示是什么?A)RNNB)CNNC)NLPD)TransferLearning答案:D解析:[单选题]97.以下哪项不是KNN算法的三要素?()A)K值的选取B)分类决策规则C)距离度量的方式D)特征的顺序答案:D解析:[单选题]98.seq2seq中的encode阶段是把输入的序列转换成怎样的向量A)黑箱操作不能确定B)等价于输入的向量C)固定长度的向量D)可变长度的向量答案:C解析:[单选题]99.AUC值越大的分类器,正确率会怎么样A)越高B)越低C)不确定D)以上都正确答案:A解析:[单选题]100.关于同义词的替换处理,以下哪个表述是正确的?A)Word2Vec基于概率统计B)Word2Vec结果符合当前预料环境C)Word2Vec得到的都是语义上的同义词D)Word2Vec受限于训练语料的数量和质量答案:C解析:[单选题]101.不确定推理过程的不确定性不包括()A)证据的不确定性B)规则的不确定性C)推理过程的不确定性D)知识表示方法的不确定性答案:D解析:[单选题]102.以下四个选项中关于sigmoid的图形曲线描述正确的是?A)U型B)M型C)X型D)S型答案:D解析:[单选题]103.在做灵活的文本匹配过程中包含以下哪个过程A)字符串语音表示(Soundex)B)语音发声散列(Metaphone)C)编辑距离算法(EditDistance)D)关键词哈希算法(KeywordHashing)答案:D解析:除了关键词哈希算法,其它所有方法都用于灵活字串匹配[单选题]104.maxpooling中()是[batch,height,width,channels]的这种表示形式A)valueB)stridesC)shapeD)padding答案:C解析:[单选题]105.在模型训练的阶段,使用的优化算法中,超参数学习率会怎么变化A)保持不变B)持续较小C)持续增大D)不变答案:B解析:[单选题]106.修正线性函数指的是哪个函数A)sigmoidB)tanhC)reluD)Leakyrelu答案:C解析:[单选题]107.如果使用到了mini-batch去选取样本,一般对选择多大批次?A)61B)62C)63D)64答案:D解析:[单选题]108.哪个网络结构常用于人脸识别A)LeNET5B)(CNN:AlexNet)C)VGGD)ResNet答案:B解析:[单选题]109.GPT的思想是什么A)遮蔽掉一定量的词B)预测下一句是否正确C)训练一个语言模型D)在没有标注的数据上进行网络学习,然后添加一层再去具体的任务上进行微调答案:D解析:[单选题]110.构建或研究语料库的时候,一般应考虑代表性、结构性、平衡性、()4个特性。A)规模性B)便捷性C)安全性D)高效性答案:A解析:[单选题]111.learning_rate用于网络的什么作用A)调整学习率B)批处理C)dropoutD)过拟合答案:A解析:[单选题]112.假设要从时事新闻报道中抽取出某一恐怖事件的基本信息,如时间、地点、事件制造者、受害人、袭击目标、伤亡人数等,需要用到()A)信息抽取B)自动文摘C)智能问答D)信息过滤答案:A解析:[单选题]113.如何对比矩阵是否相等A)c=tf.greater(a,b)B)a=tf.subtract(a,b)C)b=tf.equal(a,b)D)d=tf.matmul(a,b)答案:C解析:[单选题]114.EM算法,什么是EM,最大期望算法A)是在概率模型中寻找参数最大似然估计或者最大后验估计的算法,其中概率模型依赖于无法观测的隐性变量。B)自变量和因变量之间的关系C)找出最优超平面进行分类D)不确定答案:A解析:[单选题]115.马尔科夫作为常用的理论储备,他可以用一个什么图去进行表示A)无向图B)有无向图C)有向图D)不确定答案:A解析:[单选题]116.RNN可以将()时间步带入到神经元计算A)先前B)之后C)丢失D)LSTM答案:A解析:第2部分:多项选择题,共57题,每题至少两个正确答案,多选或少选均不得分。[多选题]117.判别式模型有什么缺点A)学习过程比较复杂B)目标分类中易产生较大错误率C)不能反映训练数据本身的特性D)没办法把整个场景描述出来答案:CD解析:[多选题]118.分析y与x之间的线性关系,以下哪些图不适合?A)A:散点图B)B:条形图C)C:直方图D)D:饼图答案:BCD解析:[多选题]119.语料库的规模取决于()A)语料获取的可能性B)语料加工的深度C)语料加工能力D)语料成分集合的大小答案:ABCD解析:[多选题]120.Batch归一化操作的具体流程是怎样的?A)求每个训练批次数据的均值B)求每个训练批次数据的方差C)使用求得的均值和方差对该批次的训练数据做归一化,获得0-1分布D)尺度变换和偏移答案:ABCD解析:[多选题]121.一个合格的机器算法包含哪些部分A)模型表征B)模型评估C)优化算法D)学习率答案:ABC解析:[多选题]122.为模型挑选超参数时,选择不同的超参数可以的标准是什么?A)选择对训练集目标而言的最优解B)对于开发集而言的最优解C)超参搜索过程中最想优化的东西D)简化参数调试答案:ABC解析:[多选题]123.下面有关文本分析正确的说法是哪些?()A)时间和日期都是需要识别的命名实体。B)句法分析可以表达组成句子的词语之间的搭配或修辞关系C)文本分类可以通过贝叶斯分类器完成。D)信息抽取不需要了解实体之间的语义关系答案:ABC解析:[多选题]124.以下哪些网络属于计算机视觉领域A)VGGnetB)YOLOC)RNND)LSTM答案:AB解析:[多选题]125.下面关于SVM中核函数的说法正确的是?A)核函数将低维空间中的数据映射到高维空间B)它是一个相似度函数C)不确定D)以上都正确答案:AB解析:[多选题]126.自然语言的落地成品有哪些A)知识图谱B)机器人C)人脸检测D)推荐系统答案:ABD解析:[多选题]127.在tensorflow中reshape函数其中的参数有(tensor,shape,name)等等,以下选项中描述正确的是A)函数的作用是将tensor变换为参数shape形式B)其中的shape为一个列表形式C)name可省略D)1所代表的含义是我们不用亲自去指定这一维的大小,函数会自动进行计算答案:ABCD解析:[多选题]128.如果说我们有一个语料库,如何去创建一个标签的模型?A)完成一个主题模型掌握语料库中最重要的词汇;B)训练一袋N-gram模型捕捉顶尖的n-gram:词汇和短语C)训练一个词向量模型学习复制句子中的语境D)以上所有答案:ABCD解析:[多选题]129.交叉熵作为卷积网络中常用的函数,以下几个选项中描述正确的是?A)在全连接层B)进行优化时用C)用信息熵D)用softmax映射到概率空间答案:ABCD解析:[多选题]130.关于ELMO的本质思想说法正确的A)学的一个固定的WordEmbeddingB)事先训练好一个词向量(预训练)C)基于任务上下文进行动态调整词向量(微调)D)以上都正确答案:AB解析:[多选题]131.TensorFlow的使用中tf.ones_like(a),这个变成语句代表了几层意思A)将t节点内容用a替换B)t节点对应张量维度和A相同C)t对应张量值为1D)a需要预先初始化答案:BCD解析:[多选题]132.XGBoost对树的复杂度处理是怎么样的A)控制树的叶子节点个数B)增加叶子数的个数C)树上叶子节点的得分w的L2模平方D)以上都正确答案:AC解析:[多选题]133.为什么进行文本表示A)计算机不方便直接对文本字符串进行处理,因此需要进行数值化或向量化B)便于机器学习C)深度学习等人工智能最新技术在NLP领域中的应用(现在)提升算法的效果D)句子表示答案:ABC解析:[多选题]134.ID3算法的实现步骤有哪些A)从根结点(rootnode)开始,对结点计算所有可能的特征的信息增益,选择信息增益最大的特征作为结点的特征。B)由该特征的不同取值建立子节点,再对子结点递归地调用以上方法,构建决策树;直到所有特征的信息增益均很小或没有特征可以选择为止;C)最后得到一个决策树。D)不确定答案:ABC解析:[多选题]135.哪些是机器学习的学习方法A)监督式学习B)非监督式学习C)半监督式学习D)强化学习答案:ABCD解析:[多选题]136.梯度消失是网络中经常发生的问题,下列关于它的说法正确的是A)可以通过激活函数防止梯度消失B)梯度消失对神经网络无影响C)尽量避免梯度消失D)梯度消失反向传播时,由于梯度值过小或消失的现象答案:ACD解析:[多选题]137.以下哪些是朴素贝叶斯算法的特点()A)低偏差B)高方差C)低方差D)高偏差答案:CD解析:[多选题]138.自动文摘分为哪几种方式A)抽取式(Extractive)B)编码式C)生成式(abstractive)D)解码式答案:AC解析:[多选题]139.以下哪些网络是NLP中常用的网络结构A)RNNB)LSTMC)GRUD)以上都是的答案:ABCD解析:[多选题]140.下列四个选项关于数据归一化的描述,正确的选项有哪些?A)归一化可以预防过拟合B)归一化没有实质作用C)归一化将所有数据样本值缩放到0-1之间D)归一化是一种激活函数答案:AC解析:[多选题]141.以下哪两项对sigmoid函数的描述是准确的A)概率平均B)能解决非线性分类问题C)将负的权值映射到正值D)将正权值映射到负数答案:BC解析:[多选题]142.关键词抽取的算法主要分为哪两类A)有监督B)半监督C)无监督D)不确定答案:AC解析:[多选题]143.常用的池化包含哪两种A)最小池化B)最大池化C)平均池化D)方差池化答案:BC解析:[多选题]144.词频统计的TF-IDF算法相关公式有哪些?A)TF=在某一类中词条出现的次数/该类中所有词条数目B)IDF=log(语料库中文档总数/包含词条的文档数+1)C)IDF=log(语料库中文档总数/包含词条的文档数)+1D)TF-IDF=TF*IDF答案:ABD解析:[多选题]145.BERT的token中mask是怎么做的A)80%的tokens会被替换成[MASK]tokenB)10%的tokens会被替换成随机的tokenC)10%的tokens会保持不变但需要被预测D)15%的tokens会被替换成[MASK]答案:ABC解析:[多选题]146.以下四个任务中,决策树可以完成哪些A)分类B)聚类C)回归D)降维答案:AC解析:[多选题]147.求最大似然函数时的步骤一般都包含哪些A)写出似然函数;B)对似然函数取对数,并整理;C)求导数,令导数为0,得到似然方程;D)解似然方程,得到的参数即为所求;答案:ABCD解析:[多选题]148.关于数据归一化的作用描述正确的有哪些?A)更容易收敛得到最优解B)权重值较小C)权重值大D)无特点答案:AB解析:[多选题]149.生成式Generativemodel模型相比判别式Discriminativemodel模型的优点有哪些?A)适用较多类别的识别B)能更充分利用先验知识C)分类边界更灵活D)研究单类问题灵活性强答案:BD解析:[多选题]150.下述相似度公式正确的是?A)汉明距离相似度:1-汉明距离/关键词长度B)欧几里得距离相似度:1/(1+欧几里得距离)C)曼哈顿距离相似度:1/(1+曼哈顿距离)D)编辑距离相似度:(1-编辑距离/两者之间长度)答案:BC解析:[多选题]151.以下几个模型中,哪些是基于N-Gram的A)BERTB)GPTC)NNLMD)CBOW答案:CD解析:[多选题]152.关于动量梯度下降是由哪些因素控制的?A)平均值B)指数加权平均值C)学习率D)方差答案:BC解析:[多选题]153.关于牛顿法缺点的描述,以下正确的是A)牛顿法是一种迭代算法,每一步都需要求解目标函数的Hessian矩阵的逆矩阵,计算比较复杂。B)在高维情况下这个矩阵非常大,计算和存储都是问题。C)在小批量的情况下,牛顿法对于二阶导数的估计噪声太大。D)目标函数非凸的时候,牛顿法容易受到鞍点或者最大值点的吸引。答案:ABCD解析:[多选题]154.AlphaGo中使用了哪些技术?A)决策神经网络B)评估神经网络C)历史经验D)线性代数答案:AB解析:[多选题]155.以下四个选项中属于Bert家族成员的有哪些A)albertB)RoBertaC)Sentence-BertD)SpanBert答案:ABCD解析:[多选题]156.Word2Vec中的输出层为什么采用负例采样A)可以大大降低计算量B)可以加快模型的训练时间C)保证模型的训练效果D)通过部分词,来更新权重答案:ABCD解析:[多选题]157.目前情感分类的研究主要有()两种方法A)基于情感词典的情感分析B)基于机器学习的情感分类C)基于规则的情感分析D)基于统计的情感分析答案:AB解析:[多选题]158.在深度学习领域中,以下框架哪些可以很好的为深度学习服务A)caffeB)tensorflowC)torchD)mxnet答案:ABCD解析:[多选题]159.CNN中的pooling手段一般包含哪两种A)最小池化B)最大池化C)平均池化D)方差池化答案:BC解析:[多选题]160.Adaboost中有两种权重,体现在()A)A:样本权重B)B:代价函数C)C:梯度下降D)D:弱分类器权重答案:AD解析:[多选题]161.经典算法SVM,以下说法正确的是A)函数距离B)拉格朗日乘子法C)对偶问题D)几何距离答案:ABCD解析:[多选题]162.以下四个描述中,对于马尔科夫模型的描述正确的是?A)马尔科夫模型的基本假设是人事变动概率B)用以估计历年年平均调动概率的周期越长,根据过去所推测未来人员变动就越准确C)采用马尔科夫模型可以预测组织任何时刻点上的各类人员分布状况D)模型中的转移率是指组织中人员进行水平调动的比率,不包含被提升或降级的人数答案:AB解析:[多选题]163.情感分析为自然语言处理(NLP)中最活跃的研究领域之一,在()方面有广泛的应用与研究。A)数据挖掘B)Web挖掘C)文本挖掘D)信息检索答案:ABCD解析:[多选题]164.ML模型有哪些A)SVMB)LRC)LSTMD)RNN答案:ABCD解析:[多选题]165.激活函数也在不断地发展,Relu激活函数相比sigmoid会有哪些优点,以下描述正确的是A)防止梯度弥散B)Relu是一些单元失活,造成稀疏性,从而防止过拟合C)加快计算D)以上都正确答案:ABCD解析:[多选题]166.Sigmoid,Relu,Tanh有什么异同点A)都可以做非线性的变换B)都可以做线性的变换C)变换后Y的取值范围不相同D)变换后Y的取值范围相同答案:AC解析:[多选题]167.基于表示方法的文本分类为A)短文本表示B)One-hot表示C)词表示D)CBOW答案:BD解析:[多选题]168.在NLP中词袋子模型可以编码文本,那么它有什么优缺点A)A简单方便快速B)B在语料充足的前提下,对于简单自然语言处理任务效果不错C)C准确率较低D)D无法关注词语间的顺序答案:ABCD解析:[多选题]169.概率图模型中关于隐马尔可夫模型都解决哪几类问题A)预测问题B)评价问题C)解码问题D)参数学习问题答案:BCD解析:[多选题]170.以下几种关于GPT的说法正确的是什么A)使用的是Transformer而不是LSTMB)使用的是LSTM而不是TransformerC)其中Transformer是单向的D)使用了双向的Transformer答案:AC解析:[多选题]171.GRU中也使用了门机制,分别是什么门A)更新门B)输入门C)重置门D)输出门答案:AC解析:[多选题]172.专家系统的结构包含哪些?A)人机界面和知识库B)推理机C)动态数据库D)知识库答理系统和解释模块答案:ABCD解析:[多选题]173.自然语言理解不仅包括计算机能正确理解人们用自然语言输入的信息,能正确回答输入信息中的有关问题,而且还包括哪些?A)语言分析B)语法分析C)语用分析D)语句分析答案:BCD解析:第3部分:判断题,共66题,请判断题目是否正确。[判断题]174.语义分析技术主要来自数理逻辑和语义学A)正确B)错误答案:对解析:[判断题]175.通过较少树,叶节点的数量,可以较小树的复杂度A)正确B)错误答案:对解析:[判断题]176.决策树只能做分类,但是做不了回归问题A)正确B)错误答案:错解析:[判断题]177.元字符由特殊符号组成,元字符的应用是正则表达式强大的原因。对A)正确B)错误答案:对解析:[判断题]178.K-Means算法试图找到误差准则函数最小的簇A)正确B)错误答案:对解析:[判断题]179.对于一个实用的NLP系统,必须具有较好的未知语言现象的处理能力。()A)正确B)错误答案:对解析:[判断题]180.激活函数的性质:非线性,可微性,单调性A)正确B)错误答案:对解析:[判断题]181.机器学习的聚类算法可用于新闻文本聚类任务。对A)正确B)错误答案:对解析:[判断题]182.深度学习只能应用在图像方面,不能应用到自然语言中A)正确B)错误答案:错解析:[判断题]183.TF-IDF是一种基于统计的计算方法,常用于评估在一个文档集中一个词对全部文档的重要程度。A)正确B)错误答案:错解析:[判断题]184.词嵌入的过程就是,需要获得多维的数据,并表示为向量A)正确B)错误答案:对解析:[判断题]185.自动分词难点主要集中在分词标准,切分歧义和未登录词三部分A)正确B)错误答案:对解析:[判断题]186.特征归一化以后,可以通过梯度更快的找到最优解A)正确B)错误答案:对解析:[判断题]187.jieba分词支持精确模式、全模式和搜索引三种模式。对A)正确B)错误答案:对解析:[判断题]188.relu比sigmoid更容易陷入梯度消失A)正确B)错误答案:错解析:[判断题]189.非结构化数据。结构化数据类型可以看作关系型数据库的一张表A)正确B)错误答案:错解析:[判断题]190.CNN不能做文本特征提取,只适用于图像A)正确B)错误答案:错解析:[判断题]191.基于深度学习的命名实体识别是目前研究与应用的主流方法。对A)正确B)错误答案:对解析:[判断题]192.相比单层的神经网络,引入多层的神经网络就可以使线性模型变成非线性模型,来拟合非线性的结构A)正确B)错误答案:对解析:[判断题]193.词的多义现象可以分为三种类型:意义相关的多义,意义无关的多义,词性不同的多义A)正确B)错误答案:对解析:[判断题]194.随机森林是由很多弱分类器构成的一个强分类器A)正确B)错误答案:对解析:[判断题]195.按语料库的动态更新程度可分为参考语料库和监控语料库A)正确B)错误答案:对解析:[判断题]196.XGBoost和随机森林的思想是一样的A)正确B)错误答案:错解析:[判断题]197.语音识别又称自动语音识别,是指对输入计算机的语音信号进行识别并转换成书面语言表示出来。A)正确B)错误答案:对解析:[判断题]198.线性回归不仅可以最回归同时也可以做分类A)正确B)错误答案:错解析:[判断题]199.KNN是一个典型的聚类算法A)正确B)错误答案:错解析:[判断题]200.nltk中定义了许多基本语料库函数,fileids()函数用于获取语料库中的文件。对A)正确B)错误答案:对解析:[判断题]201.抽取关键词,只能使用无监督的算法A)正确B)错误答案:错解析:[判断题]202.witten-bell算法的思想是:如果测试过程中的一个实例在训练语料中从未出现,那么它就是一个新事物A)正确B)错误答案:对解析:[判断题]203.通常连接主义,符号主义和行为主义指的是人工智能的三大学派A)正确B)错误答案:对解析:[判断题]204.L2正则化可以做特征选择A)正确B)错误答案:错解析:[判断题]205.一般来讲,使用低阶的n元模型向n元高阶模型插值是无效的,因为当没有足够的语料库估计高阶模型的概率时,低阶模型无法提供有用的信息A)正确B)错误答案:错解析:[判断题]206.CNN通过卷积的方式进行特征提取A)正确B)错误答案:对解析:[判断题]207.基于统计的分词能够较好地处理未登录词和歧义词,不需要人为的搭建和维护词典。对A)正确B)错误答案:对解析:[判断题]208.情感分类主要用于判别自然语言文字中表达的观点、喜好以及与感受和态度等相关的信息。对A)正确B)错误答案:对解析:[判断题]209.ELMO是否成功解决了对意词的问题A)正确B)错误答案:对解析:[判断题]210.one-hot是最优的向量编码方式A)正确B)错误答案:对解析:[判断题]211.语言模型在自然语言处理中占有重要的地位,在语音识别,机器翻译,汉语自动分词和句法分析等都有应用A)正确B)错误答案:对解析:[判断题]212.LDA在2003年提出,是一种主题模型A)正确B)错误答案:对解析:[判断题]213.按语料的加工深度来分,语料库可分为标注语料库和非标注语料库A)正确B)错误答案:对解析:[判断题]214.国标码用三个字节表示一个汉字,每个字节的ASCII码都大于127A)正确B)错误答案:错解析:[判断题]215.textCNN和textRNN都属于深度学习的文本分类模型A)正确B)错误答案:对解析:[判断题]216.如果发生了欠拟合可以加入正则化,并且减小模型的复杂度A)正确B)错误答案:错解析:[判断题]217.损失函数MSE经常用在SVM中使用A)正确B)错误答案:错解析:[判断题]218.TF-IDF会将一些高频词(的,是,了)作为停用词去掉A)正确B)错误答案:对解析:[判断题]219.NLTK中的()函数可查询文本中的词汇频数分布.对A)正确B)错误答案:对解析:[判断题]220.回退模型是根据低一阶的分布,将从非零计数中减去的计数量分配给计数为零的高元语法。A)正确B)错误答案:对解析:[判断题]221.seq2seq和transformer一样都是编解码的模型结构A)正确B)错误答案:对解析:[判断题]222.特征提取包含在神经网络内部,所以说神经网络是端到端的网络。A)正确B)错误答案:对解析:[判断题]223.模型过拟合了之后可以适当降低模型的复杂度A)正确B)错误答案:对解析:[判断题]224.Bi-Gram和TriGram都属于N-Gram中的子模型,前者的窗口大小为2,后者的窗口大小为3A)正确B)错误答案:对解析:[判断题]225.命名实体识别是信息提取、机器翻译和问答系统等应用领域里的基础工具。对A)正确B)错误答案:对解析:[判断题]226.AUC值越大的分类器,正确率越低A)正确B)错

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论