人工智能复习复习试题及答案

上传人：喝*** IP属地：浙江上传时间：2023-12-27 格式：DOC 页数：65 大小：91.78KB 积分：20 举报 版权申诉

已阅读5页，还剩60页未读，继续免费阅读

版权说明：本文档由用户提供并上传，收益归属内容提供方，若内容存在侵权，请进行举报或认领

文档简介

第页人工智能复习复习试题及答案1.强化学习的基础模型是（）模型A、马可夫决策B、贝叶斯C、HMMD、最大后验概率【正确答案】：A解析：

见算法解析2.关于梯度下降算法描述正确的是：A、梯度下降算法就是不断的更新w和b的值B、梯度下降算法就是不断的更新w和b的导数值C、梯度下降算法就是不断寻找损失函数的最大值D、梯度下降算法就是不断更新学习率【正确答案】：A解析：

梯度下降算法就是不断的更新w和b的值3.代码arr3=np.array（[[1,2,3],[4,5,6]]）.transpose（）;print（arr3[1,1]）的输出结果是（）？A、5B、4C、3D、2【正确答案】：A解析：

见算法解析4.主成分分析是一种数据降维和去除相关性的方法，它通过（）将向量投影到低维空间。A、线性变换B、非线性变换C、拉布拉斯变换D、z变换【正确答案】：A解析：

主成分分析是一种数据降维和去除相关性的方法，它通过线性变换将向量投影到低维空间。5.下列选项中，是合页损失函数的是（）。A、exp(yf(x))B、[1-yf(x)]_+C、log[1+exp(-yf(x))D、exp(-yf(x))【正确答案】：B解析：

A不是损失函数，Csiro逻辑斯蒂损失函数，D是指数损失函数。6.下列哪一个不是神经网络的代表A、卷积神经网络B、递归神经网络C、残差网络D、xgboost算法【正确答案】：D解析：

XGBoost是针对分类或回归问题的boosting算法的一种实现方式，并不是神经网络的代表。7.对完成特定任务的卷积神经网络训练采用的是监督学习方法。在这个过程中，通过误差后向传播来优化调整网络参数，请问下面哪个参数不是通过误差后向传播来优化的A、卷积滤波矩阵中的参数B、全连接层的链接权重C、激活函数中的参数D、模型的隐藏层数目【正确答案】：D解析：

08.在人脸检测算法中，不属于该算法难点的是A、出现人脸遮挡B、人脸角度变化大C、需要检测分辨率很小的人脸D、需要检测不同性别的人脸【正确答案】：D解析：

在人脸检测算法中，不属于该算法难点的是需要检测不同性别的人脸9.假设你有5个大小为7x7、边界值为0的卷积核，同时卷积神经网络第一层的深度为1。此时如果你向这一层传入一个维度为224x224x3的数据，那么神经网络下一层所接收到的数据维度是多少？A、218x218x5B、217x217x8C、217x217x3D、220x220x5【正确答案】：A解析：

010.神经元之间的每个连接都有（）权重。A、一个B、两个C、多个D、无【正确答案】：A解析：

神经元之间的每个连接都有一个权重。11.评估完模型之后，发现模型存在高偏差（highbias），应该如何解决？A、减少模型的特征数量B、增加模型的特征数量C、增加样本数量D、以上说法都正确【正确答案】：B解析：

如果模型存在高偏差（highbias），意味着模型过于简单。为了使模型更加健壮，我们可以在特征空间中添加更多的特征。而添加样本数量将减少方差12.在强化学习的过程中,学习率α越大,表示采用新的尝试得到的结果比例越（）,保持旧的结果的比例越（）。A、大;小B、大;大C、小;小D、小;大【正确答案】：A解析：

013.闵可夫斯基距离表示为曼哈顿距离时，p为（）。A、1B、2C、3D、4【正确答案】：A解析：

闵可夫斯基距离定义为：该距离最常用的p是2和1,前者是欧几里得距离），后者是曼哈顿距离。14.与传统的关系型数据库相比，图数据库善于处理大量的、复杂的、互联的、多变的网状数据，效率远远（）传统型数据库A、小于B、接近C、等于D、高于【正确答案】：D解析：

与传统的关系型数据库相比，图数据库善于处理大量的、复杂的、互联的、多变的网状数据，效率远远高于传统型数据库15.（）对隐含层的输入进行归一化，更好的尺度不变性（应对内部协变量偏移），更好的优化地形（输入处于不饱和区域，从而让梯度变大）A、归一化B、白化C、数据增强D、批量归一化【正确答案】：D解析：

批量归一化对隐含层的输入进行归一化，更好的尺度不变性（应对内部协变量偏移），更好的优化地形（输入处于不饱和区域，从而让梯度变大）16.DSSM经典模型的缺点：1.Wordhashing可能造成词语冲突；2.采用词袋模型，损失了上下文语序信息；3.搜索引擎的排序由多种因素决定，用户点击时doc排名越靠前越容易被点击，仅用点击来判断正负样本，产生的噪声较大，模型难以收敛；4.效果不可控。A、1.2.3B、1.3.4C、2.3.4D、【正确答案】：D解析：

DSSM经典模型的缺点：1.Wordhashing可能造成词语冲突；2.采用词袋模型，损失了上下文语序信息；3.搜索引擎的排序由多种因素决定，用户点击时doc排名越靠前越容易被点击，仅用点击来判断正负样本，产生的噪声较大，模型难以收敛；4.效果不可控。17.对于一个分类任务，如果开始时神经网络的权重不是随机赋值的，而是都设成0，下面哪个叙述是正确的？A、其他选项都不对B、没啥问题，神经网络会正常开始训练C、神经网络可以训练，但是所有的神经元最后都会变成识别同样的东西D、神经网络不会开始训练，因为没有梯度改变【正确答案】：C解析：

018.类别不平衡指分类任务中不同类别的训练样例数目（）的情况。A、没有差别B、差别很大C、差别很小D、以上都不正确【正确答案】：B解析：

见算法解析19.无监督学习需要（）A、学习程序自己形成和评价概念，没有教师B、学习程序在教师监督下形成和评价概念C、学习程序有时需要教师，有时不需要教师，以形成和评价概念D、以上说法都不对【正确答案】：A解析：

020.在前馈神经网络中，误差后向传播（BP算法）将误差从输出端向输入端进行传输的过程中，算法会调整前馈神经网络的什么参数A、输入数据大小B、神经元和神经元之间连接有无C、相邻层神经元和神经元之间的连接权重D、同一层神经元之间的连接权重【正确答案】：C解析：

021.我们可以将深度学习看成一种端到端的学习方法，这里的端到端指的是A、输入端-输出端B、输入端-中间端C、输出端-中间端D、中间端-中间端【正确答案】：A解析：

022.独热编码的英文是：A、onehotB、twohotC、onecoldD、twocold【正确答案】：A解析：

独热编码的英文是onehot23.梯度爆炸一般出现在深层网络和权值初始化值（）的情况下A、太小B、太大C、分布不均匀D、太接近零【正确答案】：B解析：

梯度爆炸一般出现在深层网络和权值初始化值太大的情况下24.多义现象可以被定义为在文本对象中一个单词或短语的多种含义共存。下列哪一种方法可能是解决此问题的最好选择？A、随机森林分类器B、卷积神经网络C、梯度爆炸D、上述所有方法【正确答案】：B解析：

025.循环神经网络优势在于（）A、对序列的每个元素进行相同的计算，输出取决于之前的数据状态B、对序列的每个元素进行不同的计算，输出取决于之后的数据状态C、对序列的每个元素进行相同的计算，输出取决于之后的数据状态D、以上都不对【正确答案】：A解析：

026.根据numpy数组中ndim属性的含义确定程序的输出（）。array=np.array（[[1,2,3],[4,5,6],[7,8,9],[10,11,12]]）;print（array.ndim）A、（3,4）B、2C、（4,3）D、4【正确答案】：B解析：

见算法解析27.启发式搜索是寻求问题（）解的一种方法A、最优B、一般C、满意D、最坏【正确答案】：C解析：

028.使用批量归一化可以解决神经网络训练中的哪些问题？A、过拟合OverfittingB、RestrictactivationstobecometoohighorlowC、训练过慢D、以上所有【正确答案】：D解析：

029.OLAM技术一般简称为”数据联机分析挖掘”,下面说法正确的是:A、OLAP和OLAM都基于客户机/服务器模式,只有后者有与用户的交互性B、由于OLAM的立方体和用于OLAP的立方体有本质的区别C、基于WEB的OLAM是WEB技术与OLAM技术的结合.D、OLAM服务器通过用户图形借口接收用户的分析指令,在元数据的知道下,对超级立方体作一定的操作.【正确答案】：D解析：

030.在中期图像识别技术（2003-2012）中，索引的经典模型是（）。A、口袋模型B、词袋模型C、胶囊模型D、增量模型【正确答案】：B解析：

在中期图像识别技术（2003-2012）中，索引的经典模型是词袋模型。31.根据边的性质不同，概率图模型可大致分为两类：第一类是使用有向无环图表示变量间的依赖关系，称为（）；第二类是使用无向图表示变量间的相关关系，称为无向图模型或马尔可夫网（Markovnetwork）。A、贝叶斯网B、拉普拉斯网C、帕斯卡网D、塞缪尔网【正确答案】：A解析：

见算法解析32.（）有跟环境进行交互,从反馈当中进行不断的学习的过程。A、监督学习B、非监督学习C、强化学习D、线性回归【正确答案】：C解析：

033.变量选择是用来选择最好的判别器子集，如果要考虑模型效率，我们应该做哪些变量选择的考虑？:1.多个变量其实有相同的用处2.变量对于模型的解释有多大作用3.特征携带的信息4.交叉验证A、1和4B、1,2和3C、1,3和4D、以上所有【正确答案】：C解析：

这题的题眼是考虑模型效率，所以不要考虑选项234.TF-IDF模型中，TF意思是词频，IDF意思是（）。A、文本频率指数;B、逆文本频率指数C、词频指数D、逆词频指数【正确答案】：B解析：

TF-IDF模型中，TF意思是词频，IDF意思是逆文本频率指数。35.（）就是让机器通过处理和识别过程，把语音信号转变为相应的文本或信息的高技术。A、语音分析技术B、语音转化技术C、语音合成技术D、语音识别技术【正确答案】：D解析：

语音识别技术就是让机器通过处理和识别过程，把语音信号转变为相应的文本或信息的高技术。36.下面的交叉验证方法

:i.有放回的Bootstrap方法ii.留一个测试样本的交叉验证iii.

5折交叉验证iv.重复两次的5折教程验证当样本是1000时，下面执行时间的顺序，正确的是：A、i>ii>iii>ivB、ii>iv>iii>iC、iv>i>ii>iiiD、ii>iii>iv>i【正确答案】：B解析：

Boostrap方法是传统地随机抽样，验证一次的验证方法，只需要训练1次模型，所以时间最少。留一个测试样本的交叉验证，需要n次训练过程（n是样本个数），这里，要训练1000个模型。5折交叉验证需要训练5个模型。重复2次的5折交叉验证，需要训练10个模型37.为了对某图像中的目标进行分析和识别，一般需要对图像进行（）处理。A、图像加噪B、图像采集C、图像压缩D、图像分割【正确答案】：D解析：

为了对某图像中的目标进行分析和识别，一般需要对图像进行图像分割处理。38.决策树所形成的分类边界有一个明显特点，它的分类边界由若干个（）分段组成。A、与坐标轴平行B、与坐标轴垂直C、与坐标轴重合D、过坐标原点【正确答案】：A解析：

见算法解析39.Relu在零点不可导，那么在反向传播中怎么处理（）A、设为0B、设为无穷大C、不定义D、设为任意值【正确答案】：A解析：

Relu在零点不可导，那么在反向传播中设为040.目前RNN中常用的激活函数是（）A、reluB、sigmoidC、eluD、Swish【正确答案】：B解析：

目前RNN中常用的激活函数是sigmoid41.下面哪项操作能实现跟神经网络中Dropout的类似效果A、BoostingBaggingC、StackingD、Mapping【正确答案】：B解析：

042.下列哪一项在神经网络中引入了非线性？A、随机梯度下降B、修正线性单元（ReLU）C、卷积函数D、以上都不正确【正确答案】：B解析：

043.DNN不是适合处理图像问题是因为“维数灾难”，那么“维数灾难”会带来什么问题呢：A、网络结构过于复杂B、DNN根本不能处理图像问题C、内存、计算量巨大、训练困难D、神经元数量下降，所以精度下降【正确答案】：C解析：

“维数灾难”会带来内存、计算量巨大、训练困难等问题。44.关于线性回归的描述,以下说法正确的有A、基本假设包括随机干扰项是均值为0,方差为1的标准正态分布B、基本假设包括随机干扰项是均值为0的同方差正态分布C、多重共线性会使得参数估计值方差减小D、基本假设包括不服从正态分布的随机干扰项【正确答案】：B解析：

线性回归基本假设包括随机干扰项是均值为0的同方差正态分布45.深度学习是当前很热门的机器学习算法，在深度学习中，涉及到大量的矩阵相乘，现在需要计算三个稠密矩阵A,B,C的乘积ABC,假设三个矩阵的尺寸分别为m∗n，n∗p，p∗q，且mA、(AB)CB、AC(B)C、A(BC)D、所有效率都相同【正确答案】：A解析：

046.下列哪项算法是深度学习的重要基础：（）A、最小生成树算法B、最大流-最小割算法C、A*算法D、SGD反向传播【正确答案】：D解析：

深度学习的重要基础是反向传播47.2010年谷歌推出以顶点为中心的图处理系统（），其专为大规模图数据处理而设计，将图数据保存在主存储器中并采用并行计算的BSP模型AregelB、PregelCregelDregel【正确答案】：B解析：

2010年谷歌推出以顶点为中心的图处理系统Pregel，其专为大规模图数据处理而设计，将图数据保存在主存储器中并采用并行计算的BSP模型48.下属模型是一阶段网络的是（）A、YOLOv2B、rcnnC、fast-rcnnD、faster-rcnn【正确答案】：A解析：

见算法解析49.在分布式隐私保护机器学习系统中，（）可为其提供算力支持。A、DDRB、DRAMC、SRAMD、FPGA【正确答案】：D解析：

在分布式隐私保护机器学习系统中，FPGA可为其提供算力支持。50.下列哪些没有使用Anchorbox？（）A、FasterRCNNB、YOLOv1C、YOLOv2D、YOLOv3【正确答案】：B解析：

YOLOv1没有使用Anchorbox51.批规范化(BatchNormalization)的好处都有啥？A、让每一层的输入的范围都大致固定B、它将权重的归一化平均值和标准差C、它是一种非常有效的反向传播(BP)方法D、这些均不是【正确答案】：A解析：

052.尽管人工智能学术界出现“百家争鸣”的局面，但是，当前国际人工智能的主流派仍属于：A、连接主义B、符号主义C、行为主义D、经验主义【正确答案】：B解析：

尽管人工智能学术界出现“百家争鸣”的局面，但是，当前国际人工智能的主流派仍属于：符号主义53.Skip-gram在实际操作中，使用一个（）（一般情况下，长度是奇数），从左到右开始扫描当前句子。A、过滤器B、滑动窗口C、筛选器D、扫描器【正确答案】：B解析：

见算法解析54.传统机器学习和深度学习是人工智能核心技术，在工程流程上略有差别，以下步骤在深度学习中不需要做的是A、模型评估B、特征工程C、数据清洗D、模型构建【正确答案】：B解析：

055.使用批量归一化可以解决以下哪种神经网络的训练A、过拟合OverfittingB、RestrictactivationstobecometoohighorlowC、训练过慢D、B和C都有【正确答案】：D解析：

056.如何对featuremaps继续进行卷积操作？通过多通道卷积。假设上一个卷积层已得到3个3X3的featuremaps，3个2x2的卷积核可表示为具有三个通道卷积核立方体，生成一个（）大小的featuremap。A、2X2B、3X3C、2X3D、6X6【正确答案】：A解析：

见算法解析57.如果问题存在最优解，则下面几种搜索算法中，（）可以认为在这几种算法中是“智能程度相对比较高”的算法。A、广度优先搜索B、深度优先搜索C、有界深度优先搜索D、启发式搜索【正确答案】：D解析：

058.L1和L2正则化是传统机器学习常用来减少泛化误差的方法，以下关于两者的说法正确的是:A、L1正则化可以做特征选择B、L1和L2正则化均可做特征选择C、L2正则化可以做特征选择D、L1和L2正则化均不可做特征选择【正确答案】：A解析：

059.企业要建立预测模型，需要准备建模数据集，以下四条描述建模数据集正确的是（）。A、数据越多越好B、尽可能多的合适的数据C、训练集数据是建模集数据的一部分D、以上三条都正确【正确答案】：D解析：

060.以下函数中能将字符串格式的时间转换为表示时间的浮点数的为A、time.mktime(time.strptime())B、pd.to_datetime()C、datetime.datetime.strptime()D、datetime.datetime.strftime()【正确答案】：A解析：

基础概念61.形成以新一代人工智能重大科技项目为核心、现有研发布局为支撑的（）人工智能项目群。A、“1+N”B、“1+5”C、“1+3”D、“1+6”【正确答案】：A解析：

形成以新一代人工智能重大科技项目为核心、现有研发布局为支撑的“1+N”人工智能项目群。62.以下关于L1正则化和L2正则化的说法正确的是？A、防止模型欠拟合而加在损失函数后面的一项B、L1范数符合拉普拉斯分布，是完全可微的C、L1正则化项是模型各个参数的平方和的开方值D、L1正则化可以产生稀疏权值矩阵，即产生一个稀疏模型，可以用于特征选择【正确答案】：D解析：

A、防止模型过拟合而加在损失函数后面的一项；B、L1范数符合拉普拉斯分布，是不完全可微的；C、L2正则化项是模型各个参数的平方和的开方值。63.DSSM使用（）个全连接层A、两B、一C、三D、四【正确答案】：A解析：

DSSM使用两个全连接层64.下列关于XGboost算法描述中错误的是A、由于其特殊原因，无法分布式化B、xgboost在代价函数里加入了正则项，用于控制模型的复杂度；C、可以处理带有缺失值的样本D、允许使用列抽样来减少过拟合【正确答案】：A解析：

065.在CNN训练中，除了卷积偏置bias需要学习更新以外，（）也是学习跟新的重要内容A、learning_rateB、stepC、weightD、padding【正确答案】：C解析：

在CNN训练中，除了卷积偏置bias需要学习更新以外，weight也是学习跟新的重要内容66.数据分析与数据可视化密不可分，在python中，哪个是常用数据可视化工具。A、pytorchB、numpyC、pyechartsD、json【正确答案】：C解析：

数据分析与数据可视化密不可分，在python中，pyecharts是常用数据可视化工具。67.下列属于特征降维的方法有A、主成分分析PCAB、数据采样C、正则化D、最小二乘法【正确答案】：A解析：

068.已知一组数据的协方差矩阵P,下面关于主分量说法错误的是（）。A、主分量分析的最佳准则是对一组数据进行按一组正交基分解,在只取相同数量分量的条件下,以均方误差计算截尾误差最小B、在经主分量分解后,协方差矩阵成为对角矩阵C、主分量分析就是K-L变换D、主分量是通过求协方差矩阵的特征值得到【正确答案】：C解析：

069.下列哪项关于模型能力（modelcapacity）的描述是正确的？（指神经网络模型能拟合复杂函数的能力）A、隐藏层层数增加，模型能力增加B、Dropout的比例增加，模型能力增加C、学习率增加，模型能力增加D、都不正确【正确答案】：A解析：

隐藏层加深，模型的拟合能力提升，但是模型参数会增多，带来计算压力；引入dropout就是为了免模型过拟合，学习率是超参数，并不会影响模型的拟合度70.熵是为消除不确定性所需要获得的信息量，投掷均匀正六面体骰子的熵是：A、1比特B、2.6比特C、3.2比特D、3.8比特【正确答案】：B解析：

071.数据清洗的方法不包括（）A、缺失值处理B、噪声数据清除C、一致性检查D、重复数据记录处理【正确答案】：D解析：

072.下述（）不是人工智能中常用的知识格式化表示方法A、框架表示法B、产生式表示法C、语义网络表示法D、形象描写表示法【正确答案】：D解析：

知识表⽰⽅法主要有：逻辑表⽰法、产⽣式表⽰法、框架表⽰法、语义⽹络表⽰法、⾯向对象表⽰等等。答案选D73.下列哪项不是SVM的优势A、可以和核函数结合B、通过调参可以往往可以得到很好的分类效果C、训练速度快D、泛化能力好【正确答案】：C解析：

SVM的训练速度不快74.在主成分分析中，将几个主分量经过线性组合构造为一个综合评价函数时，每个主分量的权数为（）。A、每个主分量的方差B、每个主分量的标准差C、每个主分量的方差贡献率D、每个主分量的贡献率【正确答案】：C解析：

在主成分分析中，将几个主分量经过线性组合构造为一个综合评价函数时，每个主分量的权数为每个主分量的方差贡献率。75.以下关于人工神经网络（ANN）的描述错误的有（）A、神经网络对训练数据中的噪声非常鲁棒B、可以处理冗余特征C、训练ANN是一个很耗时的过程D、至少含有一个隐藏层的多层神经网络【正确答案】：A解析：

076.在线性回归算法中，我们认为误差项是符合什么分布的（）A、高斯分布B、均匀分布C、二项分布D、泊松分布【正确答案】：A解析：

077.下面（）不是有效的变量名。A、_demoB、bananaC、NumbrD、my-score【正确答案】：D解析：

my-score不是有效的变量名。78.关于支持向量机，哪项说法不正确（）A、支持向量机可以用于处理二分类及多分类问题B、支持向量机只能用于线性可分的分类问题C、支持向量机可用于回归问题D、核函数的选择对支持向量机的性能影响较大【正确答案】：B解析：

支持向量机可用用于线性可分的分类问题，也可于线性不可分的分类问题79.YOLOv3网格数为输出特征图[N,C,H,W]的（）A、CB、C*HC、H*WD、nan【正确答案】：C解析：

见算法解析80.下列哪项属于集成学习A、决策树模型B、kNN分类C、AdaboostD、k-means【正确答案】：C解析：

Adaboost属于集成学习81.下列哪个算法可以用于特征选择（）A、朴素贝叶斯B、感知器C、支持向量机D、决策树【正确答案】：D解析：

见算法解析82.某单位开展潜在变更用电客户预测分析，以历史上已完成过户办理的用户作为模型的目标样本，预测用户是否过户，该类预测分析属于（）预测A、分类B、数值C、聚类D、关联【正确答案】：A解析：

083.下列哪个神经网络结构会发生权重共享？A、卷积神经网络B、循环神经网络C、全连接神经网络D、选项A和B【正确答案】：D解析：

084.在遗传算法中，变量x的定义域为[-2，5]，要求其精度为10-6，现用二进制进行编码，则码长为（）A、20B、21C、22D、23【正确答案】：D解析：

085.（）曲线以precision、recall为横纵坐标AP曲线B、PR曲线C、mAP曲线D、RoI曲线【正确答案】：B解析：

见算法解析86.下图描述的网络是（）A、VGGB、GooLeNetC、ResNetD、Yolo【正确答案】：C解析：

下图描述的网络是ResNet87.假如你在训练一个线性回归模型，有下面两句话：1.如果数据量较少，容易发生过拟合。2.如果假设空间较小，容易发生过拟合。关于这两句话，下列说法正确的是？A、1和2都错误B、1正确，2错误C、1错误，2正确D、1和2都正确【正确答案】：B解析：

如果数据量较少，容易在假设空间找到一个模型对训练样本的拟合度很好，容易造成过拟合，该模型不具备良好的泛化能力。如果假设空间较小，包含的可能的模型就比较少，也就不太可能找到一个模型能够对样本拟合得很好，容易造成高偏差、低方差，即欠拟合88.以下关于Bagging（装袋法）的说法不正确的是A、能提升机器学习算法的稳定性和准确性，但难以避免overfittingBagging（装袋法）是一个统计重采样的技术,它的基础是BootstrapC、主要通过有放回抽样）来生成多个版本的预测分类器,然后把这些分类器进行组合D、进行重复的随机采样所获得的样本可以得到没有或者含有较少的噪声数据【正确答案】：A解析：

089.深度学习中神经网络类型很多，以下神经网络信息是单向传播的是：A、LSTMB、卷积神经网络C、循环神经网络D、GRU【正确答案】：B解析：

卷积神经网络是单向传播的90.对于有噪声、线性可分的数据，支持向量机的解决方式是（）A、软间隔B、硬间隔C、核函数D、以上选项均不正确【正确答案】：A解析：

对于有噪声、线性可分的数据，支持向量机的解决方式是软间隔91.一条规则形如：，其中“←"左边的部分称为（）A、规则长度B、规则头C、布尔表达式D、规则体【正确答案】：B解析：

见算法解析92.常用到的的社交分析算法就是（）A、社群发现B、社交发现C、社区发现D、群体发现【正确答案】：A解析：

常用到的的社交分析算法就是社群发现93.语句np.sum（arr3,axis=1）的作用是（）？注：（已导入numpy库）importnumpyasnpA、对整个数组求和B、对每一行求和C、对第1列求和D、对每一列求和【正确答案】：B解析：

见算法解析94.LSTM单元中引入了哪些门来更新当前时刻的单元状态向量?A、输入门、遗忘门B、任意门、输入门C、输出门、任意门D、遗忘门、任意门【正确答案】：A解析：

LSTM单元中引入了哪些门来更新当前时刻的单元状态向量?95.（）是计算机仿真系统，通过对三维世界的模拟创造出全新的交互系统。A、虚拟现实B、增强现实C、混合现实D、强化现实【正确答案】：A解析：

虚拟现实是计算机仿真系统，通过对三维世界的模拟创造出全新的交互系统。96.VGG-19中卷积核的大小为A、3x3B、5x5C、3x3,5x5D、不确定【正确答案】：A解析：

VGG-19中卷积核的大小为3x397.在神经网络学习中，每个神经元会完成若干功能，下面哪个功能不是神经元所能够完成的功能A、对前序相邻神经元所传递信息进行加权累加B、对加权累加信息进行非线性变化（通过激活函数）C、向前序相邻神经元反馈加权累加信息D、将加权累加信息向后续相邻神经元传递【正确答案】：C解析：

098.下面关于模型预测性能的评估以及交叉验证，说法正确的是：A、在scikit-learn包里面使用交叉验证方法，可以使用代码：fromsklearnimportcross_validationB、需要把数据分成训练集和测试集，用测试集来评估从训练集学习得来的模型的预测性能，是因为从训练集学习得来的模型可能对于训练集的数据拟合得很好，但是对于训练集以外的数据没有太大的泛化能力C、课程中的交叉验证，把数据集分成了5份，其中4份作为训练集，剩下一份作为测试集，这种方法叫做留一交叉验证法D、从训练集中得到的模型，用训练集的数据得到的预测准确率一般会比用测试集得到的预测准确率低【正确答案】：B解析：

099.循环神经网在工业上最常用的两种实现是：①.LSTM②.GRU③.CNN④.DNNA、①③B、①②C、①③D、①④【正确答案】：B解析：

CNN、DNN不属于循环神经网络100.卷积核与特征图的通道数的关系是：A、卷积核数量越多特征图通道数越少B、卷积核size越大特征图通道数越多C、卷积核数量越多特征图通道数越多D、二者没有关系【正确答案】：C解析：

卷积核数量越多特征图通道数越多1.强化学习中的两种免模型学习是（）、（）。A、逆强化学习B、时序差分学习C、蒙特卡罗强化学习D、模仿学习【正确答案】：BC解析：

在现实的强化学习任务中，环境的转移概率、奖赏函数往往很难得知，甚至很难知道环境中一共有多少状态，若学习算法不依赖于环境建模，则称为“免模型学习”，包括蒙特卡罗强化学习和时序差分学习2.下列哪些属于频繁模式挖掘算法（）A、FP-growthB、DBSCANC、AprioriD、GDBT【正确答案】：AC解析：

见算法解析3.下列哪些组件是Resnet通常不包括的（）A、残差连接B、卷积单元C、循环连接D、Attention模块【正确答案】：CD解析：

见算法解析4.下列哪些项用于对问题进行形式化A、感知B、初始状态C、动作D、环境【正确答案】：BC解析：

05.对于lstm=paddle.nn.LSTM(input_size=3,hidden_size=5,num_layers=2)，输入数据的形状可以是：A、[10,5,3]B、[5,10,3]C、[3,5,10]D、[3,10,5]【正确答案】：AB解析：

lstm输入形状为[batch_size,time_steps,input_size]，即[..,..,3]6.DecisionTree构造的重要步骤。A、特征选择B、决策树生成C、剪枝D、计算信息增益【正确答案】：ABC解析：

决策树构造只有特征选择、决策树生成、剪枝三个环节过程7.SVM中常用的核函数包括哪些?A、高斯核函数B、多项式核函数C、Sigmiod核函数D、线性核函数【正确答案】：ABCD解析：

SVM常用的核函数包括：线性核函数、多项式核函数、高斯核函数、Sigmiod核函数8.最常用的降维算法是PCA，以下哪项是关于PCA是正确的A、PCA是一种无监督的方法B、.它搜索数据具有最大差异的方向C、主成分的最大数量D、.所有主成分彼此正交【正确答案】：ABCD解析：

PCA的原理是线性映射，简单的说就是将高维空间数据投影到低维空间上，然后将数据包含信息量大的主成分保留下来，忽略掉对数据描述不重要的次要信息。而对于正交属性空间中的样本，如何用一个超平面对所有样本进行恰当合适的表达呢?若存在这样的超平面，应该具有两种性质：所有样本点到超平面的距离最近，样本点在这个超平面的投影尽可能分开9.属于卷积神经网络（CNN）的有（）。A、VGGNetB、ResNetC、AlexNetD、GoogleNet【正确答案】：ABCD解析：

010.机器学习的核心要素包括（）A、算法B、算力C、操作人员D、数据【正确答案】：ABD解析：

操作人员并不是机器学习的核心要素。11.以下哪些是数据挖掘的特点：A、大量数据。数据挖掘所处理的数据量巨大，这也是数据挖掘方法和以前的数据分析方法不一样的地方B、未知的有用的规律。数据挖掘所发现的模式或规律，应该不是显而易见的或无用地，而是对业务来说有意义的、隐含的模式或规律。C、是一个过程。他需要业务理解、数据理解、数据准备、建模、评估、部署等一系列步骤D、验证已知的知识和规律【正确答案】：ABC解析：

012.关于聚类的描述正确的是（）。A、聚类是一种非监督式学习B、聚类是一种监督式学习C、使用的数据不需要包含类别卷标D、使用的数据需要包含类别卷标【正确答案】：AC解析：

013.Python中的可变数据类型有A、字符串B、数字C、列表D、字典【正确答案】：CD解析：

014.关于幂律分布说法正确的事（）A、对集成学习影响较大B、基于相空间的距离进行分类与回归的效果都变差C、对k-means影响不大D、概率模型为基础的算法影响相对比较小【正确答案】：BD解析：

015.下列算法哪些属于K-means的变种？A、kNNB、MeanshiftC、k-means++D、以上都不是【正确答案】：BC解析：

见算法解析16.人工神经元网络与深度学习的关系是（）A、人工神经元网络是深度学习的前身B、深度学习是人工神经元网络的一个分支C、深度学习是人工神经元网络的一个发展D、深度学习与人工神经元网络无关【正确答案】：AC解析：

深度学习是实现机器学习的一种技术,现在所说的深度学习大部分都是指神经网络17.下列哪些模型可以E2E训练（）A、YOLOv3B、YOLOv2C、RCNND、fastRCNN【正确答案】：ABD解析：

见算法解析18.属于深度学习模型的选项是？A、朴素贝叶斯B、深度残差网络C、卷积神经网络CNND、循环神经网络RNN【正确答案】：BCD解析：

019.卷积神经网络中的池化层可以减小下层输入的尺寸。常见的池化有哪些？A、最小池化层B、乘积池化层C、最大池化层D、平均池化层【正确答案】：CD解析：

卷积神经网络的池化层常用的两种是最大池化层和平均池化层。20.决策树学习算法包括哪几个部分？A、特征选择B、树的生成C、分类决策规则D、树的剪枝【正确答案】：ABD解析：

k近邻算法的三要素：距离度量，k值选择，分类决策规则21.RNN循环神经网络可以对一下那些场景进行处理（）。A、自然语言处理B、图像处理C、手写体识别D、语音识别【正确答案】：ACD解析：

图像处理场景主要应用于CNN22.NMF(Non-negativeMatrixFactorization)是一种降维算法，它的特点包括A、原始矩阵的元素是非负数B、分解后矩阵的元素是非负数C、分解后矩阵的元素可以是负数D、没有“潜在语义空间的每一个维度都是正交的”这一约束条件【正确答案】：ABD解析：

023.数据挖掘的主要功能包括概念描述、趋势分析、孤立点分析及（）等方面。A、挖掘频繁模式B、分类和预测C、聚类分析D、偏差分析【正确答案】：ABCD解析：

024.在目标检测中，以下能产生候选框的算法是（）A、SelectiveSearchB、ROIpoolingC、RegionproposallayerD、C4.5【正确答案】：AC解析：

见算法解析25.深度学习目标检测算法比传统方法的优势（）A、算法适应性强B、更好的平衡精度C、可迁移学习D、数据需求少【正确答案】：ABC解析：

见算法解析26.人工神经网络的结构可分为（）。A、并行网络B、串行网络C、前馈网络D、反馈网络【正确答案】：CD解析：

027.神经网络可以按（）A、学习方式分类B、网络结构分类C、网络的协议类型分类D、网络的活动方式分类【正确答案】：ABD解析：

028.下面关于回归、分类和聚类的说法，正确的是：A、通过网站上顾客的浏览行为和购买行为来细分不同类型的顾客，甚至发现潜在的顾客，这是一个分类问题B、通过房子的面积、卧室数、卫生间数量、是否二手房等来预测房价，这是一个分类问题C、通过邮件的内容来检测收到的邮件不是不垃圾邮件，这是一个分类问题D、回归和分类都属于监督学习，而聚类属于无监督学习【正确答案】：CD解析：

029.长短时记忆网络在哪些领域有成功应用A、语音识别B、图片描述C、自然语言处理D、以上都不正确【正确答案】：ABC解析：

030.以下属于角点提取的特征描述算法的有。A、CannyB、HOGC、SURFD、SIFT【正确答案】：BCD解析：

对特征的描述有很多种方法和算子，常见的有SIFT特征描述算子、SURF特征描述算子、ORB特征描述算子、HOG特征描述、LBP特征描述以及Harr特征描述。Canny算法是多级边缘检测算法。答案BCD31.噪声数据的产生原因主要有：（）A、数据采集设备有问题B、在数据录入过程中发生了人为或计算机错误C、数据传输过程中发生错误D、由于命名规则或数据代码不同而引起的不一致【正确答案】：ABCD解析：

032.大数据智能是新一代人工智能五个技术发展方向之一，其研究面向CPH(赛博、物理人类)三元空间的知识表达新体系，链接（）A、实体B、技术C、行为D、关系【正确答案】：ACD解析：

见算法解析33.seq2seq主要由（）和（）组成，A、EncoderB、transformerC、DecoderD、dropper【正确答案】：AC解析：

见算法解析34.在随机森林中，最终的集成模型是通过什么策略决定模型结果的?A、累加制B、求平均数C、投票制D、累乘制【正确答案】：BC解析：

035.决策树构建过程中剪枝的策略有A、预剪枝B、前剪枝C、后剪枝D、再剪枝【正确答案】：AC解析：

剪枝的策略有两种：预剪枝和后剪枝。36.常用的盲目搜索方法是什么？A、随机碰撞式搜索B、精确碰撞式搜索C、不完全式搜索D、完全式搜索【正确答案】：AD解析：

037.以下属于多层前馈神经网络特点的是A、每层神经元与下一层神经元之间完全互连B、每层神经元与下一层神经元之间不完全互连C、神经元之间不存在同层连接D、神经元之间不存在跨层连接【正确答案】：ACD解析：

常用的神经网络称为“多层前馈神经网络”（multi-layerfeedforwardneuralnetwork），该结构满足以下几个特点：*每层神经元与下一层神经元之间完全互连*神经元之间不存在同层连接*神经元之间不存在跨层连接38.关于反向传播算法，它的主要不足在于（）。A、训练时间较长B、完全不能训练，训练时由于权值调整过大使得激活函数达到饱和C、易陷入局部极小值D、训练过程中，学习新样本时有一网旧样本的趋势。【正确答案】：ABCD解析：

039.状态估计的几种常用算法（）。A、高斯法B、最小二乘法C、快速分解法D、正交变换法【正确答案】：BCD解析：

040.哪些不能用来评估神经网络的计算模型对样本的预测值与真实值之间的误差大小A、优化函数B、损失函数C、梯度下降D、反向传播【正确答案】：ACD解析：

损失函数用来衡量神经网络的计算模型对样本的预测值与真实值之间的误差41.关于卷积神经网络池化层以下描述正确的是?A、池化操作采用扫描窗口实现B、池化层可以起到降维的作用C、常用的池化方法有最大池化和平均池化D、经过池化的特征图像变小了【正确答案】：ABCD解析：

池化是一种down-sampling技术，本质是基于滑动窗口的思想，可以去除特征图中的冗余信息，降低特征图的维度。常用的是最大池化和平均池化42.如下哪些是最近邻分类器的特点（）A、它使用具体的训练实例进行预测，不必维护源自数据的模型B、分类一个测试样例开销很大C、最近邻分类器基于全局信息进行预测D、可以生产任意形状的决策边界【正确答案】：ABD解析：

043.除了问题本身的定义之外，使用问题特定知识的搜索策略被认为是A、启发式搜索B、有信息搜索C、二元搜索D、无信息搜索【正确答案】：AB解析：

044.那种机器学习算法不需要对数据进行标注A、有监督学习B、无监督学习C、强化学习D、深度学习【正确答案】：BC解析：

无监督学习和强化学习不需要标注45.联想存储的特点是（）A、可以存储许多相关(激励，响应)模式对B、以分布、稳健的方式存储信息C、即使输入激励模式完全失真时，仍然可以产生正确的响应模式D、可在原存储中加入新的存储模式【正确答案】：ABCD解析：

046.不使用全连接处理序列问题的原因是（）A、时间步不能确定B、模型太简单C、只能处理分类D、算法精度不足【正确答案】：ABD解析：

047.对股票涨跌方向的判断，理论上下列哪些方法是可行的？（）A、SVMB、DBSCANC、FP-growthD、决策树【正确答案】：AD解析：

见算法解析48.使用KNN(K-NearestNeighbor)算法解决分类问题的步骤包括A、对未知数据进行正则化B、计算未知数据与已知标签数据之间的距离C、得到距离未知数据最近的k个已知标签数据D、通过已知标签数据的数量进行多数表决，作为未知数据的分类结果【正确答案】：BCD解析：

049.专家系统知识表示的方法主要有哪些？A、逻辑表示法（谓词表示法）B、框架C、产生式D、语义网络【正确答案】：ABCD解析：

050.以下哪些聚类算法属于基于原型的聚类（）。A、模糊C均值B、EM算法C、SOMD、CLIQUE【正确答案】：ABC解析：

051.以下哪些是专家系统结构的一部分？A、知识库B、推理机C、动态数据库D、解释模块【正确答案】：ABCD解析：

专家系统的结构包含人机界面、知识库、推理机、动态数据库、知识库答理系统和解释模块。52.假设我们要解决一个二类分类问题,我们已经建立好了模型,输出是0或1,初始时设阈值为0.5,超过0.5概率估计,就判别为1,否则就判别为0;如果我们现在用另一个大于0.5的阈值,那么现在关于模型说法,正确的是A、模型分类的召回率不变B、模型分类的召回率会升高C、模型分类准确率会升高或不变D、模型分类准确率降低【正确答案】：AC解析：

准确率：即预测结果正确的百分比。精确率（查准率）：预测结果为正例样本中真实为正例的比例（查得准）。召回率（查全率）：真实为正例的样本中预测结果为正例的比例（查的全，对正样本的区分能力。F-score：在实践中，我们定义了新的指标去“综合”这两个指标。具体的定义如公式（3），从数学上来看，它其实是查准率与查全率的调和平均数。对于二元分类问题，F-score综合考虑了预测结果的查准率和查全率，是一个比较好的评估指标。53.下列无监督学习算法中可解决降维问题的算法有A、PCAB、LSAC、LDAD、k-means【正确答案】：ABC解析：

k-means只能解决聚类问题54.下列有监督学习算法中可解决回归问题的算法包括A、线性回归B、逻辑回归C、神经网络D、随机森林【正确答案】：ACD解析：

逻辑回归无法解决回归问题55.对股价的预测，下列哪些方法是可行的（）A、kNNB、SVRC、线性回归D、逻辑回归【正确答案】：BC解析：

见算法解析56.图像数字化需要经过的步骤包括A、采样B、裁剪C、量化D、旋转【正确答案】：AC解析：

见算法解析57.现代的卷积神经网络，常用的模块包括哪些（）A、多分枝结构B、残差连接C、BatchNormalizationD、Sigmoid激活函数【正确答案】：ABC解析：

见算法解析58.下列哪些方法的输出结果，通常包含boundingbox？（）A、MTCNNB、FasterRCNNC、MaskRCNND、AlexNet【正确答案】：ABC解析：

见算法解析59.产生式系统的组成部分包括（）A、状态空间B、综合数据库C、规则集D、控制策略【正确答案】：BCD解析：

060.卷积神经网络中典型的模式是？A、卷积层后为池化层，然后还是卷积层-池化层。B、多个连续的池化层，然后跟着一个卷积层C、网络中最后的几个层是全连接层D、网络中最开始的几个层是全连接层【正确答案】：AC解析：

一般卷积层后为池化层，网络最后为几个全连接层。61.梯度为0的点可以是（）A、局部最优解B、全局最优解C、鞍点D、转折点【正确答案】：ABC解析：

062.防止过拟合的方法有A、增加训练数据B、减少特征值C、正则化D、追求损失函数的最小【正确答案】：ABC解析：

063.深度学习中以下哪些步骤是由模型自动完成的?A、模型训练B、特征选择C、分析定位任务D、特征提取【正确答案】：BD解析：

064.正则化是传统机器学习中重要且有效的减少泛化误差的技术，以下技术属于正则化技术的是A、L1正则化B、L2正则化C、DropoutD、动量优化器【正确答案】：ABC解析：

正则化和优化策略是深度学习的两个重要部分，L1、L2正则化和Dropout属于正则化，而动量优化属于优化策略。65.长短时记忆网络中具有三个重要开关，我们称为A、记忆门B、输入门C、输出门D、遗忘门【正确答案】：BCD解析：

066.经典逻辑推理有哪些？A、自然演绎推理B、归结演绎推理C、不确定与非单调推理D、与、或形演绎推理【正确答案】：ABD解析：

067.选择下列哪些方法可以用于表示表示智能体的状态A、结构式B、模块式C、网络式D、因子式【正确答案】：AD解析：

068.在机器学习中，如果单纯去提高训练数据的预测能力，所选模型的复杂度往往会很高，这种现象称为过拟合对于产生这种现象以下说法正确的是（）A、样本数量太少B、样本数量过多C、模型太复杂D、模型太简单【正确答案】：AC解析：

见算法解析69.基因知识图谱具备以下哪几种能力?A、辅助病例诊断B、疾病预测及诊断C、基因检测报告生成D、实体查询【正确答案】：ACD解析：

070.浅层神经网络与深度神经网络比较，其区别之处是A、浅层结构算法：其局限性在于有限样本和计算单元情况下对复杂函数的表示能力有限，针对复杂分类问题其泛化能力受到一定制约B、深度学习可通过学习一种深层非线性网络结构，实现复杂函数逼近，表征输入数据分布式表示，并展现了强大的从少数样本集中学习数据集本质特征的能力C、深度学习多层的好处是可以用较少的参数表示复杂的函数D、深度学习的实质，是通过构建具有很多隐层的机器学习模型和海量的训练数据，来学习更有用的特征，从而最终提升分类或预测的准确性【正确答案】：ABCD解析：

浅层结构算法：其局限性在于有限样本和计算单元情况下对复杂函数的表示能力有限，针对复杂分类问题其泛化能力受到一定制约，深度学习可通过学习一种深层非线性网络结构，实现复杂函数逼近，表征输入数据分布式表示，并展现了强大的从少数样本集中学习数据集本质特征的能力，深度学习多层的好处是可以用较少的参数表示复杂的函数，深度学习的实质，是通过构建具有很多隐层的机器学习模型和海量的训练数据，来学习更有用的特征，从而最终提升分类或预测的准确性71.若使用深度学习处理语义分类任务，在处理变长数据时，我们通常采取（）。A、截断过长语句B、填充随机数C、填充特殊词语D、不处理【正确答案】：AC解析：

深度学习处理长语句的常用手段72.集成学习模型的集成方式有A、同质集成B、异质集成C、本质集成D、泛化集成【正确答案】：AB解析：

若个体学习器都属于同一类别，例如都是决策树或都是神经网络，则称该集成为同质的（homogeneous）;若个体学习器包含多种类型的学习算法，例如既有决策树又有神经网络，则称该集成为异质的（heterogenous）。73.下列哪些网用到了残差连接A、FastTextBERTC、GoogLeNetD、ResNet【正确答案】：BD解析：

见算法解析74.以下关于机器学习算法与传统基于规则方法的区别中正确的是?A、传统的基于规则的方法，其中的规律可以人工显性的明确出来B、传统基于规则的方法使用显性编程来解决问题C、机器学习中模型的映射关系是自动学习的D、机器学习所中模型的映射关系必须是隐性的【正确答案】：ABC解析：

075.下面属于数据集的一般特性的有：（）A、连续性B、维度C、稀疏性D、相异性【正确答案】：BC解析：

076.神经网络解决非线性分类，是通过（）A、构造神经网络B、用激活函数C、训练权重矩阵D、让损失最大化【正确答案】：ABC解析：

077.汉语的演化史表明,量词的真实功用可能与（）没有任何关系A、隐喻机制B、个体化机制C、单复数区分D、补足音素【正确答案】：BC解析：

见算法解析78.下列选项属于静态图缺点的是（）A、代码编写较为简洁和方便B、计算图构建很长时间后才提示错误C、无法使用pdb或print语句调试执行D、控制流与Python不同，造成一定的学习门槛【正确答案】：BCD解析：

见算法解析79.下面关于随机森林和集成学习的说法，正确的是：A、随机森林只能用于解决分类问题B、随机森林由随机数量的决策树组成C、集成学习通过构建多个模型，并将各个模型的结果使用求平均数的方法集成起来，作为最终的预测结果，提高分类问题的准确率D、随机森林的弱分类器（基分类器）的特征选择是随机的【正确答案】：CD解析：

080.以下说法正确的是（）。A、聚类是监督学习B、聚类是非监督学习C、分类是非监督学习D、分类是监督学习【正确答案】：BD解析：

081.下列是svm核函数的是（）A、多项式核函数B、logistic核函数C、径向基核函数D、sigmoid核函数【正确答案】：ACD解析：

082.vgg19中的19代表了网络中哪些层的数目总和（）A、全连接层B、输入层C、池化层D、卷积层【正确答案】：ACD解析：

vgg19是常用的卷积神经网络之一，包括16层卷积层和3层全连接层，中间用到池化层83.可以有效解决过拟合的方法包括（）A、增加样本数量B、增加特征数量C、训练更多的迭代次数D、采用正则化方法【正确答案】：AD解析：

见算法解析84.下列选项中，哪项是可以用于数据采集的技术？A、FlumeB、HiveC、KafkaD、Mahout【正确答案】：AC解析：

Hive和Mahout主要用于数据的分析式处理85.决策树最常用的算法有A、ID3B、C4.5CARTD、ID4.5【正确答案】：ABC解析：

决策树最常用的算法有三种：ID3，C4.5和CART。86.下面关于逻辑回归的说法，正确的是：A、逻辑回归主要应用于二分类问题B、逻辑回归使用LogisticFunction后得到的数值在-1到1之间C、把逻辑回归应用于多分类问题时，需要使用Onevs.Rest方法D、逻辑回归得到的数值可以看作属于类别1的概率【正确答案】：ACD解析：

087.下面关于决策树的说法，正确的是：A、决策树有二叉树和多叉树B、建立决策树模型的时候，可能不需要用到数据集中的所有特征来建立决策树节点的分裂规则C、决策树子节点分裂时，选择的是最优的特征进行分裂D、决策树只能用于分类【正确答案】：ABC解析：

088.关于遗传算法和进化策略，下列说法正确的是A、遗传算法同时使用交叉和突变操作B、进化策略仅使用交叉操作C、进化策略不需要用编码的形式来表示问题D、进化策略使用纯粹的数值优化计算【正确答案】：ACD解析：

遗传算法根据问题域中个体的适应度大小，按照轮盘赌的方法选择个体，在完成选择后，还需要进行组合交叉和变异，产生出代表新的解集的种群。A项正确。遗传算法采用二进制编码杂交；而进化策略使用实数。CD正确。进化策略的每个个体都具有两个特点。1、基因，通过基因进行运算可以得到每个个体的适应度。2、变异强度，变异强度则是每次基因杂交完，基因变化的一个范围。B项错误。答案ACD89.在卷积神经网络中，一个10*10的像素在使用5*5的卷积核进行池化，在不补零的情况下能得到以下哪些大小的featuremapA、2*2B、4*4C、6*6D、8*8【正确答案】：ABC解析：

H(output)=(H(input)−F)/S+1；W(output)=(Winput−F)/S+190.人工智能算法中，决策树分类算法包括A、C4.5B、ID3C、SGDD、CART【正确答案】：ABD解析：

常见决策树分类算法包括C4.5，ID3，CART。SGD随机梯度下降算法属于降维算法。91.为增加模型的泛化能力，可以使用下列哪些方法A、L1正则化B、L2正则化C、DropoutD、增加训练集样本数量【正确答案】：ABCD解析：

4种方法均可92.机器翻译的局限性在于（）A、训练样本单一B、只能处理简单句C、基于已有的既成案例D、错误较多【正确答案】：BC解析：

见算法解析93.大规模关系分析场景下，以下哪个选项属于海量关系处理的三高需求（）A、对海量数据的高效关系发现需求B、对海量数据的高效共享需求C、对海量数据的高效存储和访问需求D、对关系分析平台的高可扩展性和高可用性【正确答案】：ACD解析：

094.英语重视哪两个问题的区分?（）A、谓语与非谓语B、可数名词与不可数名词C、冠词与数词D、单复数【正确答案】：BD解析：

见算法解析95.Svm适用于以下哪种数据集（）A、线性可分的数据集B、含有很多噪声和重叠的数据C、经过清洗较为干净的数据D、以上数据都适用【正确答案】：AB解析：

096.对于朴素贝叶斯分类器，下面说法正确的是（）A、适用于小规模数据集B、适用于多分类任务C、适合增量式训练D、对输入数据的表达形式不敏感【正确答案】：ABC解析：

097.关于线性回归说法正确的是（）A、输入特征是非随机的且互不相关的B、随机误差具有零均值，同方差的特点C、随机误差彼此间不相关D、输入特征于随机误差不相关【正确答案】：ABCD解析：

098.下列说法正确的是（）A、k折划分后，得到的是分组后的索引值B、LOO计算开销更少C、LOO比k折效果更差D、k折划分后，得到的是分组后的元素【正确答案】：AC解析：

099.以下属于深度学习算法的是A、CNNB、FCMC、FPND、GCN【正确答案】：ACD解析：

FCM算法是聚类算法，不是深度学习算法100.数据真实性具备哪两种特质？A、准确性B、不确定性C、可信赖度D、杂乱性【正确答案】：AC解析：

01.大数据要跟“互联网+医疗健康”紧密地结合起来，国家明确的支持“互联网+医疗”、“互联网+健康”所以在新的医改背景下，互联网医疗跟大数据的结合将会取得更重要的发展A、正确B、错误【正确答案】：A解析：

正确2.训练循环神经网络的算法是BPTTA、正确B、错误【正确答案】：A解析：

正确3.LR的损失函数为hingeloss（或者说是逻辑损失都可以）、而SVM的损失函数为Log损失。A、正确B、错误【正确答案】：B解析：

错误4.Python标准库os中的方法isdir（）可以用来测试给定的路径是否为文件夹。A、正确B、错误【正确答案】：A解析：

正确5.u-net也是采用了encoder-decoder这一结构A、正确B、错误【正确答案】：A解析：

正确6.人工智能技术已经由原本的单一化输出向全套解决方案转变，其渗透性也不断减弱A、正确B、错误【正确答案】：B解析：

人工智能技术已经由原本的单一化输出向全套解决方案转变，其渗透性也不断增强7.语音识别技术就是让机器通过处理和识别过程，把语音信号转变为相应的文本或信息的高技术A、正确B、错误【正确答案】：A解析：

正确8.对于多分类问题神经网络一般使用欧氏距离损失而不用交叉熵A、正确B、错误【正确答案】：B解析：

分类问题常用的损失函数为交叉熵9.在GBK和CP936编码中一个汉字需要2个字节。A、正确B、错误【正确答案】：A解析：

正确10.Python标准库os中的方法listdir（）返回包含指定路径中所有文件和文件夹A、正确B、错误【正确答案】：A解析：

正确11.人工智能就是机器展现出的智能，即只要是某种机器，具有某种或某些智能的特征或表现，都应该算作“人工智能”A、正确B、错误【正确答案】：A解析：

正确12.在处理序列数据时，较容易出现梯度消失现象的模型是RNN。A、正确B、错误【正确答案】：A解析：

RNN有短期记忆问题，无法处理很长的输入序列，训练RNN需要投入极大的成本13.目标检测的主要目的是让计算机可以自动识别图片或者视频帧中所有目标的类别，并在该目标周围绘制边界框，标示出每个目标的位置A、正确B、错误【正确答案】：A解析：

正确14.基于规则的AI系统由一连串的if-then-else规则来进行推断或行动决策。（）A、正确B、错误【正确答案】：A解析：

015.人工智能技术可通过对特征库学习自动查找系统漏洞和识别关键目标，提高攻击效率。A、正确B、错误【正确答案】：A解析：

正确16.当在内存网络中获得某个内存空间时，通常选择读取矢量形式数据而不是标量，这里需要基于内容的寻址或基于位置的寻址来完成A、正确B、错误【正确答案】：B解析：

017.购物篮模型(maket-basketmodel):用于描述两种对象之间的一对多关系A、正确B、错误【正确答案】：B解析：

多对多关系18.Mapreduce适用于可以串行处理的应用程序A、正确B、错误【正确答案】：B解析：

019.根据发音对象不同，语音识别可以分为特定人语音识别和非特定人语音识别A、正确B、错误【正确答案】：A解析：

正确20.Python2.x和Python3.x中input（）函数的返回值都是字符串。A、正确B、错误【正确答案】：B解析：

见函数库21.LSTM单元中，输入门控制当前信息的注入，遗忘门过滤上个时刻的不重要信息，然后两者处理后的信息相加后更新当前时刻的状态向量A、正确B、错误【正确答案】：A解析：

正确22.相较于机器学习经典的有监督学习、无监督学习问题，强化学习最大的特点是在交互中学习A、正确B、错误【正确答案】：A解析：

正确23.计算机视觉的主要研究方向分为图像分类、目标检测、目标跟踪和语义分割A、正确B、错误【正确答案】：A解析：

正确24.用于分类与回归应用的主要算法有决策树、BP神经网络、贝叶斯A、正确B、错误【正确答案】：A解析：

025.bagging不允许训练实例被同一个预测器多次采样。A、正确B、错误【正确答案】：B解析：

允许26.Kmean模型能自动生成K个聚类中心A、正确B、错误【正确答案】：B解析：

错误27.鼓励人工智能企业参与或主导制定国际标准，加强人工智能领域的知识产权保护，建立人工智能公共专利池，促进人工智能新技术的利用与扩散A、正确B、错误【正确答案】：A解析：

正确28.训练CNN时，可以对输入进行旋转、平移、缩放等预处理提高模型泛化能力A、正确B、错误【正确答案】：A解析：

029.DSSM模型的结构是三塔A、正确B、错误【正确答案】：B解析：

双塔30.深度学习与机器学习算法之间的区别在于，后者过程中无需进行特征提取工作，也就是说，我们建议在进行深度学习过程之前要首先完成特征提取的工作。A、正确B、错误【正确答案】：B解析：

031.AdaGrad使用的是一阶差分(firstorderdifferentiation)A、正确B、错误【正确答案】：A解析：

032.根据覆盖面不同，知识图谱可以分为通用知识图谱、行业知识图谱A、正确B、错误【正确答案】：A解析：

正确33.SPPTextMining是文本挖掘的工具A、正确B、错误【正确答案】：B解析：

034.Sigmoid是早期神经网络模型中常见的非线性变换函数A、正确B、错误【正确答案】：A解析：

正确35.谷歌研究提出，随着训练数据数量级的增加，相同机器视觉算法模型的性能呈指数上升。A、正确B、错误【正确答案】：B解析：

歌研究提出，随着训练数据数量级的增加，相同机器视觉算法模型的性能呈线性上升。36.Inception块的设计思想：多通路(multi-path)设计形式，使用不同大小的卷积核提取图像特征，并附加最大池化操作，将这四个输出层沿着通道这一维度进行拼接。最终输出特征图将包含不同大小的卷积核提取到的特征A、正确B、错误【正确答案】：A解析：

正确37.如果需要连接大量字符串成为一个字符串，那么使用字符串对象的join（）方法比运算符+具有更高的效率。A、正确B、错误【正确答案】：A解析：

正确38.飞桨支持两种深度学习建模编写方式，更方便调试的动态图模式和性能更好并便于部署的静态图模式A、正确B、错误【正确答案】：A解析：

正确39.在UTF-8编码中一个汉字需要占用3个字节。A、正确B、错误【正确答案】：A解析：

正确40.计算机视觉中最基本的几个子任务是：图像分类、物体检测、图像语义分割和实例分割A、正确B、错误【正确答案】：A解析：

正确41.LSTM是一个非常经典的面向序列的模型，可以对自然语言句子或是其他时序信号进行建模，是一种循环神经网络。A、正确B、错误【正确答案】：A解析：

正确42.Gini指数越大表示集合中被选中的样本被分错的概率越小，也就是说集合的纯度越高。A、正确B、错误【正确答案】：B解析：

注意：Gini指数越小表示集合中被选中的样本被分错的概率越小，也就是说集合的纯度越高，反之，集合越不纯。43.自然语言处理主要分为两个流程：自然语言理解和自然语言生成A、正确B、错误【正确答案】：A解析：

正确44.人工智能是对人的意识和思维过程的模拟，利用机器学习和数据分析方法赋予机器类人的能力A、正确B、错误【正确答案】：A解析：

正确45.虚拟现实技术具有多感知性、沉浸性、交互性等特征A、正确B、错误【正确答案】：A解析：

正确46.机器学习，有学习能力，通过答案+数据=规则，正确率不断提升（）A、正确B、错误【正确答案】：A解析：

正确47.卷积神经网络是更善于处理图像的网络A、正确B、错误【正确答案】：A解析：

正确48.Python字典中的“键”可以是元组。A、正确B、错误【正确答案】：A解析：

正确49.数据集太小，数据样本不足时，深度学习相对其它机器学习算法，有明显优势。A、正确B、错误【正确答案】：B解析：

错误50.卷积神经网络的并发性，比循环神经网络好A、正确B、错误【正确答案】：A解析：

正确51.PSP网络获取上下文信息的关键在于增大感受野A、正确B、错误【正确答案】：A解析：

正确52.混沌度(Perplexity)是一种常见的应用在使用深度学习处理NLP问题过程中的评估技术，混沌度越高越好A、正确B、错误【正确答案】：B解析：

053.从产业链的角度来讲，人工智能分为三层，由基础层、过程层、应用层组成A、正确B、错误【正确答案】：B解析：

人工智能产业链包括三层：基础层、技术层和应用层54.人工智能研究的先驱者认为人的智能主要表现在人能学习知识和运用知识上，知识是智能的基础于是学者们把专门的知识集、规则集和附加过程组成知识库，开发出许多专家系统（英文缩写为ES），在领域获得成功（）A、正确B、错误【正确答案

人人文库> 全部分类> 教育资料 > 考试试卷

温馨提示

1. 本站所有资源如无特殊说明，都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2. 本站的文档不包含任何第三方提供的附件图纸等，如果需要附件，请联系上传者。文件的所有权益归上传用户所有。
3. 本站RAR压缩包中若带图纸，网页内容里面会有图纸预览，若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 人人文库网仅提供信息存储空间，仅对用户上传内容的表现方式做保护处理，对用户上传分享的文档内容本身不做任何修改或编辑，并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容，请与我们联系，我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

人工智能复习复习试题及答案

文档简介

温馨提示

最新文档

评论

人工智能复习复习试题及答案

文档简介

温馨提示

最新文档

评论

相关文档