人工智能机器学习技术练习练习题及答案3-2023-练习版

上传人：唯*** IP属地：河北上传时间：2024-01-17 格式：PDF 页数：116 大小：13.20MB 积分：12 举报 版权申诉

已阅读5页，还剩111页未读，继续免费阅读

版权说明：本文档由用户提供并上传，收益归属内容提供方，若内容存在侵权，请进行举报或认领

文档简介

试题说明

本套试题共包括1套试卷

答案和解析在每套试卷后

人工智能机器学习技术练习练习题及答案3（500题）

人工智能机器学习技术练习练习题及答案3

L［单选题］假设有n组数据集，每组数据集中，x的平均值都是9,x的方差都是11,y的平均

值都是7.50,x与y的相关系数都是0.816,拟合的线性回归方程都是y=3.00+0.500*xo那

么这n组数据集是否一样？

A）一样

B）不一样

C）无法确定

2.［单选题］强化学习属于（）的一种

A）无监督学习

B）机器学习

C）监督学习

3.［单选题］如果一个SVM模型出现欠拟合，那么下列哪种方法能解决这一问题？

A）增大惩罚参数C的值

B）减小惩罚参数C的值

C）减小核系数（gamma参数）

4.［单选题］典型的分类算法是（）

A）决策树

B）k-means

C）BIRCH

5.［单选题］所谓几率，是指发生概率和不发生概率的比值。所以，抛掷一枚正常硬币，正面朝上的几率

（odds）为多少？

A）0.5

B）1

C）都不是

6.［单选题］以下哪个操作可能会产生大量小文件

A）mapper数较多的map-only任务

B）reduer数较多的任务

C）从海量数据中过滤出符合条件的少量数据

7.［单选题］下面哪些对「类型1（Type-1）J和「类型2（Type-2）J错误的描述是错误的？

A）类型1通常称之为假正类，类型2通常称之为假负类

B）类型2通常称之为假正类，类型1通常称之为假负类

C）类型1错误通常在其是正确的情况下拒绝假设而出现

8.［单选题］在回归模型中，下列哪一项在权衡欠拟合（under-fitting）和过拟合（over

fitting）中影响最大？

A）多项式阶数

B）更新权重w时，使用的是矩阵求逆还是梯度下降

C）使用常数项

>A.几何分布

A）指数分布

B）高斯分布

C）均匀分布

10.［单选题］混淆矩阵对角线上的值（）

A）越大越好

B）越小越好

C）无所谓大小

11.［单选题］对于线性回归，我们应该有以下哪些假设？

A）找到利群点很重要，因为线性回归对利群点很敏感

B）线性回归要求所有变量必须符合正态分布

C）线性回归假设数据没有多重线性相关性

12.［单选题］随机森林的分类机制是0

A）投票

B）提升

C）概率计算

13.［单选题］计算Numpy中元素个数的方法是（）。

A）np.sqrt（）

B)np.size()

C)np.identity()

D)np.nid()

14.［单选题］什么是KDD?

A）数据挖掘与知识发现

B）领域知识发现

C）文档知识发现

D）动态知识发现

15.［单选题］下面关于奇异值分解（SVD）的描述中错误的是（）。

A）奇异值分解就是把一个线性变换分解成两个线性变换

B）奇异值往往对应着矩阵中隐含的重要信息，且重要性和奇异值大小正相关

C）SVD是对PCA的改进，其计算成本更低，相同之处是两者的目标都是为了降维

D）奇异值不仅可以应用在数据压缩上，还可以对图像去噪

16.［单选题］下列关于ndarray对象描述正确的是（）。

A）ndarray对象中可以存储不同类型的元素

B）ndarray对象中存储元素的类型必须是相同的

C）ndarray对象不支持广播操作

D）ndarray对象不具备矢量运算能力

17.［单选题］下面关于回归过程的说法，错误的是

A）收集数据：采用任意方法收集数据

B）分析数据：绘出数据的可视化二维图将有助于对数据做出理解和分析，在采用缩减法求得新回归

系数之后，可以将新拟合线绘在图上作为对比

C）训练算法：找到回归系数

D）用算法：使用回归，可以在给定输入的时候预测出一个数值，这是对分类方法的提升，因为这样

只可以预测连续型数据

18.［单选题］变量之间的关系可以分为（）两大类。

A）函数关系与相关关系

B）线性相关关系和非线性相关关系

C）正相关关系和负相关关系

D）简单相关关系和复杂相关关系

19.［单选题］（_）是指对已有数据在尽量少的先验假设条件下进行探索，并通过作图，制表等手段探

索数据结构和规律的一种方法。

A）统计分析

B）验证性分析

C）数据洞见

D）探索性数据分析

20.［单选题］在Pandas中以下哪个函数可以读取csv文件？（）。

A）read_excel（）

B）read_csv（）

C）read_sql_query（）

D）read_text（）

21.［单选题］下面不属于数据科学主要研究内容的有（_）。

A）基础理论

B）数据管理

C）数据分析

D）数据商务

22.［单选题］机器学习中发生过拟合的主要原因不包括（）。

A）使用过于复杂的模型

B）数据噪声较大

0训练数据少

D）训练数据充足

23.［单选题］（_）是指在对数据进行正式计算之前，根据后续数据计算的需求对原始数据进行审计、

清洗、变换、集成等一系列处理活动。

A）数据加工

B）数据预处理

C）数据清洗

D）数据挖掘

24.［单选题］下列关于支持向量回归说法错误的是（_）。

A）支持向量回归是将支持向量的方法应用到回归问题中

B）支持向量回归同样可以应用核函数求解线性不可分的问题

C）同分类算法不同的是，支持向量回归要最小化一个凹函数

D）支持向量回归的解是稀疏的

25.［单选题］有关推荐算系统的应用背景说法正确的是（）

A）帮忙用户找出不需要的信息

B）查找用户喜欢的商品

C）一种销售的方法

D）分析用户的兴趣预测用户的需求

26.［单选题］LSTM调整参数时信息的传播方向是（）。

A）后向传播

B）前向传播

C）双向传播

D）跳跃传播

27.［单选题］两个种子点A（-l,l）,B（2,l）,其余点为（0,0）,（0,2）,（1,1）,（3,2）,（6,0）,

（6,2）,利用Kmeans算法，点群中心按坐标平均计算。最终种子点A需要移动的次

数，种子点B需要移动的次数，属于种子点A的点数（不包含A）,属于种子点B的

点数（不包含B）分别为（）

A）2,2,3,3

B）l,1,3,3

01,1,2,4

D）2,2,2,4

28.［单选题］Spark支持的分布式部署方式中哪个是错误的（）。

A）standalone

B）sparkonmesos

C）sparkonYARN

D）Sparkonlocal

29.［单选题］以下关于数据科学描述错误的是

A）数据科学研究数据的共性

B）降低计算量不是数据科学关心的问题

C）数据科学可以研究非结构化数据

D）数据科学需要与其他学科结合在一起

30.［单选题］下面属于Bagging方法的特点是（）

A）构造训练集时采用Bootstraping的方式

B）每一轮训练时样本权重不同

C）分类器必须按顺序训练

D）预测结果时，分类器的比重不同

31.［单选题］（）是并行式集成学习方法最著名的代表

A）随机森林

B）Boosting

C）Bagging

D）AdaBoost

32.［单选题］支持向量机的对偶问题是（）

A）线性优化问题

B）二次优化

C）凸二次优化

D）有约束的线性优化

33.［单选题］接受者操作特征曲线简称（_）。

A）双曲线

B）ROC曲线

C）科克曲线

D）共轲曲线

34.［单选题］下列不是SVM核函数的是：

A）多项式核函数

B）logistic核函数

C）径向基核函数

D）Sigmoid核函数

35.［单选题］BP神经网络的学习规则是（）

A）梯度上升法

B）梯度下降法

C）梯度提升法

D）梯度曲线法

36.［单选题］正常建立一条TCP连接需要（）个步骤，正常关闭一个TCP连接需要（）个步骤

A）3,3

B）3,4

04.4

D）4,3

37.［单选题］（_）直接把最终将要使用的学习器的性能作为特征子集的评价标准。

A）过滤式选择

B）包裹式选择

C）嵌入式选择

D）正则化

38.［单选题］假定你使用了一个很大Y值的RBF核，这意味着：

A）模型将考虑使用远离超平面的点建模

B）模型仅使用接近超平面的点来建模

C）模型不会被点到超平面的距离所影响

D）以上都不正确

39.［单选题］PCA在做降维处理时，优先选取哪些特征（）

A）中心化样本的协方差矩阵的最大特征值对应特征向量

B）最大间隔投影方向

C）最小类内聚类

D）最速梯度方向

40.［单选题］以下哪个模型是生成式模型:

A）贝叶斯模型

B）逻辑回归

OSVM

D）条件随机场

41.［单选题］机器学习是研究如何使用计算机（）的一门学科。

A）模拟生物行为

B）模拟人类解决问题

C）模拟人类学习活动

D）模拟人类生产活动

42.［单选题］被广泛认为AI诞生的标志的是（

A）计算机的产生

B）图灵机的出现

C）达特茅斯会议

D）神经网络的提出

43.［单选题］一条规则形如:㊉-flf2…fL,其中“一"左边的部分称为

A）规则长度

B）规则头

C）布尔表达式

D）规则体

44.［单选题］以下不属于影响聚类算法结果的主要因素有（）

A）已知类别的样本质量

B）分类准则

C）特征选取

D）模式相似性测度

45.［单选题］人工智能的目的是让机器能够（），以实现人类某些脑力劳动的机械化。

A）具有智能

B）和人一样工作

C）完全代替人的大脑

D）模拟，延伸和扩展人类的智能

46.［单选题］下列极大似然估计描述错误的是

A）极大似然估计先假定其具有某种确定的概率分布形式；

B）极大似然估计没有确定的概率分布形式；

C）概率模型的训练过程就是参数估计；

D）贝叶斯学派认为参数本身也有分布，是未观察的随机变量；

47.［单选题］关于RBF神经网络描述错误的是

A）单隐层前馈神经网络；

B）隐层神经元激活函数为径向基函数；

C）输出层是对隐层神经元输出的非线性组合；

D）可利用BP算法来进行参数优化；

48.［单选题］关于CNN,以下结论正确的是（）

A）在同样层数、每层神经元数量一样的情况下，CNN比全连接网络拥有更多的

参数

B）CNN可以用于非监督学习，但是普通神经网络不行

C）Pooling层用于减少图片的空间分辨率

D）接近输出层的filter主要用于提取图像的边缘信息

49.［单选题］读取CSV文件中的数据用（）包。

A）skiearn

B）Matplotlib

C）Pandas

D）pylab

50.［单选题］下图是两个不同BO、Bl对应的逻辑回归模型（绿色和黑色）：

关于两个逻辑回归模型中的80、01值，下列说法正确的是？

注意：y=PO+Pl*x,B0是截距，Bl是权重系数。

A）绿色模型的81比黑色模型的131大

B）绿色模型的P1比黑色模型的B1小

C）两个模型的81相同

D）以上说法都不对

51.［单选题］现有4个同时到达的作业J1,J2,J3和J4,它们的执行时间分别是1小时,3小时,5小时,7小

时，系统按单道方式运行且采用短作业优先算法，则平均周转时间是（）小时

A）4

B）5

D）7.5

52.［单选题］自然语言处理是用（）技术的一种应用

A）语音识别

B）虚拟现实

C）人工智能

D）自然语言

53.［单选题］下列对于查准率的描述，解释正确的是（_）。

A）统计分类器预测出来的结果与真实结果不相同的个数，然后除以总的样例集D的个数。

B）先统计分类正确的样本数，然后除以总的样例集D的个数。

C)预测为正的样例中有多少是真正的正样例

D)样本中的正例有多少被预测正确

54.［单选题］下面关于决策树学习相关描述不正确的有(_)。

A)决策树学习的本质是一种逼近离散值目标函数的过程

B)决策树的根节点表示分类的开始

C)中间节点表示某一个属性的属性值

D)从根节点到叶节点的路径表示一个具体的实例

55.［单选题］()的系数没有封闭形式(closed-form)的解。

A)Ridge回归

B)Lasso

C)Ridge回归和Lasso

D)以上答案都不正确

56.［单选题］中心极限定理是噪声抑制的中的统计原理，其内容是：均值分布总会收敛于一个。。

A)正态分布

B)泊松分布

C)多项式分布

D)均值分布

57.［单选题］DataFramel和RDDR最大的区别()

A)科学统计支持

B)多了多schema

C)存储方式不一样

D)外部数据源支持

58.［单选题］计算一个任意三角形的面积,S=J(p(p-a)(p-b)(p-c)),p=(a+b+c)/2,以下等价类测试用

例中，不属于无效等价类的是

A)a=5,b=3,c=6；

B)a=2,b=3,c=5；

C)a=7,b=3,c=3；

D)a=2,b=6,c=3；

59.［单选题］(假设precision=TP/(TP+FP),recall=TP/(TP+FN)。)在二分类问题中，当测试集的正例

和负例数量不均衡时，以下评价方案哪个是相对不合理的()

A)Accuracy：(TP+TN)/all

B)F-value：2recallprecision/(recall+precision)

C)G-mean：sqrt(precision*recall)

D)AUC：曲线下面积

60.［单选题］以下哪个度量不属于数据中心趋势度描述？()

A）均值

B）中位数

C）众数

D）四分位数

61.［单选题］在大数据集上训练决策树，为了使用较少时间，我们可以（）

A）增加树的深度

B）增加学习率

C）减少树的深度

D）减少树的数量

62.［单选题］机器学习训练时，Mini-Batch的大小优选为2个的嘉，如256或5120它背后的原因

是什么？

A）Mini-Batch为偶数的时候，梯度下降算法训练的更快

B）Mini-Batch设为2的嘉，是为了符合CPU、GPU的内存要求，利于并行化处理

C）不使用偶数时，损失函数是不稳定的

D）以上说法都不对

63.［单选题］下面有关可视化原理的说法，错误的是哪个（）。

A）可视化主要是为满足人类决策者对视觉信息的敏感性

B）可视化分析的方法论基础是视觉隐喻，可以对数据进行一定的抽象表示

C）高维数据可视化需要对数据进行变换，抽取有效特征,从而降低维度

D）饼图可分析数据变化的趋势

64.［单选题］Python不支持的数据类型有（）。

A）char

B）int

C）float

D）list

65.［单选题］定义域为｛飞机，火车，轮船｝的离散属性也可称为称为（_）。

A）无序属性

B）有序属性

C）连续属性

D）离散属性

66.［单选题］下面不属于NewSQL的有（—）。

A）memsql

B）trafodion

OmariaDB

D）objectivity

67.［单选题］下列中为判别模型的是（）

A）高斯混合模型

B）隐含马尔科夫模型

C）GAN模型

D）逻辑回归模型

68.［单选题］一所大学内的各年纪人数分别为：一年级200人，二年级160人，三年级130人，四年级110人

o则年级属性的众数是：

A）一年级

B）二年级

C）三年级

D）四年级

69.［单选题］多元线性回归的训练样本由（_）个属性描述。

A）一

B）二

C）三

D）多

70.［单选题］下列神经网络特点描述错误的是

A）适应性

B）由简单单元组成

C）广泛并行互连的网络

D）线性特性

71.［单选题］解决线性不可分情况下的支持向量分类机的最优化模型问题时，以下可以保证结果模型

线性可分的是

A）C=1

B）C=0

OC无限制

D）以上均不正确

72.［单选题］对于投影数据为（（V2）,（0）,（V2））o现在如果在二维空间中重建，并将它们视为原始

数据点的重建，那么重建误差是多少？

A）0%

B）10%

C）30%

D）40%

73.［单选题］对于任意值“x”，考虑到

Logistic（x）：是任意值"x”的逻辑（Logistic）函数

Logit（x）：是任意值"x”的logit函数

Logit_inv(x)：是任意值“x”的逆逻辑函数

以下哪一项是正确的？

A)Logistic(x)=Logit(x)

B)Logistic(x)=Logit_inv(x)

C)Logit_inv(x)=Logit(x)

D)都不是

74.［单选题］对抗学习中两个网络互相竞争，一个负责生成样本，另一个负责()

A)判别样本

B)计算样本

C)统计样本

D)生成样本

75.［单选题］给定的数据集包括“胡佛塔”和其他一些塔的图像。现在要使用PCA(特征脸)和最近邻

方法来构建一个分类器，可以预测新图像是否显示“胡佛塔”。该图给出了输入的训练图像样本

(a)llooverTbww1(b)Hooveilower2(c)HoowrTcwwr3

(d)OtherTbwer1(e)OthnTower2(f)OtherTower3

alt="">

为了从“特征脸”算法获得合理的性能，这些图像将需要什么预处理步骤？

A)1

B)2

C)1和2

D)都不是

76.［单选题］OLAP技术的核心是()。

A)在线性

B)对用户的快速响应

C)互操作性

D)多维分析

77.［单选题］在利用矢量形式的图像数据文件中？

A)图像的分辨率与数据文件的大小成正比；

B)如果显示其中的图像会有方块；'

C)图形由空间分布的像素的集合来表示；

D)不仅有数据还有命令；

78.［单选题］有关机器学习分类算法的Precision和Recall,以下定义中正确的是(假定tp=true

positive,tn=truenegative,fp=falsepositive,fn=falsenegative)

A)Precision=

B)Precision

C)Precision

D)Precision

79.［单选题］以下哪种距离会侧重考虑向量的方向()

A)欧式距离

B)海明距离

C)Jaccard距离

D)余弦距离

80.［单选题］下面不是有效的变量名的是。。

A)_demo

B)banana

C)Numbr

D)my-score

81.［单选题］()是二维随机变量的分布。

A)正态分布

B)二项分布

C)边缘分布

D)指数分布

82.［单选题］抖动技术可以？

A)改善图像的空间分辨率；

B)改善图像的幅度分辨率；

C)利用半输出技术实现；

D)消除虚假轮廓现象；

83.［单选题］在文本挖掘中，可以使用以下哪项命令完成将文本转换为tokens,然后将其转换为整数或

浮点向量的操作？

A)CountVectorizer

B)TF-IDF

C)词袋模型(BagofWords)

D)NERs

84.［单选题］有两个样本点，第一个点为正样本，它的特征向量是(0,T)；第二个点为负样本，它的特

征向量是(2,3),从这两个样本点组成的训练集构建一个线性SVM分类器的分类面方程是()

A)2x+y=4

B)x+2y=5

C)x+2y=3

D)以上都不对

85.［单选题］集成学习采取投票的方式来综合多个简单模型的结果，按bagging投票思想，假设一

共训练了5个简单模型，每个模型对分类结果预测如下图，则模型的最终预测结果为。类

A)D

B)C

C)B

D)A

86.［单选题］SVM的算法性能取决于()

A)核函数的选择

B)核函数的参数

C)软间隔参数C

D)以上所有

87.［单选题］9.关于K-均值算法，以下说法不正确的是

A)K-均值算法是一种划分方法。

B)K-均值算法能发现任意形状的簇。

C)K-均值算法不一定收敛于全局最优解。

D)比起DBSCAN算法来，K更好

88.［单选题］在n维空间中(n>1),下列哪种方法最适合用来检测异常值？

A)正态概率图

B)箱形图

C）马氏距离

D）散点图

89.［单选题］下列哪个方法不属于情感分析的评测？

A）COAE评测

B）cifarlO数据集评测

C）CCFTCCI评测

D）TAC评测

90.［单选题］多次“采样”，然后求取平均累积奖赏来作为期望积累奖赏的近似，这称为（_）。

A）免模型学习

B）机器学习

C）深度学习

D）蒙特卡罗强化学习

91.［单选题］在线性回归中使用正则项，你发现解的不少coefficient都是0,则这个正则项可能是

（）（1）.L0-norm；（2）.Ll-norm；（3）.L2-norm。

A）（1）（2）

B）（2）（3）

0（2）

D）⑶

92.［单选题］随机试验所有可能出现的结果称为（）。

A）基本事件

B）样本

C）全部事件

D）样本空间

93.［单选题］哪些机器学习模型经过训练，能够根据其行为获得的奖励和反馈做出一系列决策？

A）无监督学习

B）监督学习

C）强化学习

D）以上全部

94.［单选题］对于图像识别问题（比如识别照片中的猫），（）神经网络模型更适合解决这类问题

A）感知机

B）循环神经网络

C）卷积神经网络

D）多层感知机

95.［单选题］下图中主成分的最佳数量是多少？

e00000000000000

o0Z’

。

」

支0

。III

203040

PnncipalComponent

alt="">

A）7

B）30

040

D）不知道

96.［单选题］若svm出现欠拟合，以下合适的做法是

A）使用更powful的kernel

B）增加训练样本

C）使用L2正规化

D）做数据增强

97.［单选题］以下机器学习中，在数据预处理时，不需要考虑归一化处理的是。

A）逻辑回归

B）支持向量机

C）树形模型

D）神经网络

98.［单选题］下列关于冗余特征的说法错误的是

A）冗余特征是可以通过其他特征推演出来的特征

B）冗余特征是无用的特征

C）冗余特征有时候可以降低学习任务的难度

D）去除冗余特征可以减轻学习过程的负担

99.［单选题］下列分类方法中不会用到梯度下降法的是（）

A）感知机

B）最小二乘分类器

C）最小距离分类器

D）Logistic回归

100.［单选题］下列关于F1值的计算正确的是（_）。

A）F1值=正确率*召回率*/（正确率+召回率）

B）F1值=正确率*召回率*2/（正确率+召回率）

C）F1值=正确率*2/（正确率+召回率）

D）F1值=召回率*2/（正确率+召回率）

101.［单选题］决策树的基本流程遵循（_）的策略。

A）贪心

B）最优化

C）分而治之

D）顺序

102.［单选题］LSTM与RNN相比可以解决（）。

A）梯度消失

B）训练结果发散

C）需要激活函数

D）无法处理长距离的依赖的问题

103.［单选题］过拟合现象中（）

A）训练样本的测试误差最小，测试样本的正确识别率却很低

B）训练样本的测试误差最小，测试样本的正确识别率也很高

C）模型的泛化能力很高

D）通常为线性模型

104.［单选题］CNN常见的Loss函数不包括以下哪个（）

A）softmaxloss

B）sigmoid_loss

C）Contrastive_Loss

D）Siameseloss

105.［单选题］（_）是常用的估计参数隐变量的利器，它是一种迭代的方法。

A）边际似然

B）EM算法

C）贝叶斯决策

D）贝叶斯分类器

106.［单选题］下列不属于聚类性能度量外部指标的是（_）。

A）Jaccard系数

B）FM系数

C）Rand指数

D）DB指数

107.［单选题］下面选项中不是双目摄像头的内参的是（）。

A）焦距（Focallength）

B）基础矩阵（Fundamental

matrix）

C）扭曲值（Distortion）

D）光点中心（Opticalcenter）

108.［单选题］K-Means算法是。的聚类算法

A）无监督

B）有监督

C）半监督

D）以上都不对

109.［单选题］决策树的父节点和子节点的嫡的大小关系是（）。

A）父节点的嫡更小

B）子节点的燧更小

C）两者相等

D）根据具体情况而定

110.［单选题］将源程序（高级语言编写）翻译成计算机可执行的目标程序，其处理方法是（）

A）编译

B）连接

C）汇编

D）扫描

111.［单选题］（）算法是通过智能体不断与环境进行交互，通过试错的方式来获得最佳策略

A）有监督学习

B）半监督学习

C）无监督学习

D）强化学习

112.［单选题］训练集、验证集和测试集在使用过程中的顺序是

A）测试集、训练集、验证集

B）训练集、测试集、验证集

C）验证集、训练集、测试集

D）训练集、验证集、测试集

113.［单选题］在训练神经网络时，如果出现训练error过高，下列哪种方法不能大幅度降低训练

error（）

A）增加一个隐藏层

B）在隐藏层中增加更多神经元

C）对训练数据进行标准化

D）增加训练数据

114.［单选题］sparks中默认的存储级别（）。

A）MEMORY_ONLY

B）MEM0RY_ONLY_SER

OMEMORY_ANDDISK

D）MEM0RY_AND_DISK_SER

115.［单选题］对不具备泛化能力的规则转变为更一般的规则的最基础的技术为

A）最大一般泛化

B）最小一般泛化

C）最大一般特化

D）最小一般特化

116.［单选题］在深度学习中，涉及到大量矩阵相乘,现在需要计算三个稠密矩阵A,B,C的乘积ABC,假设

三个矩阵的尺寸分别为m*n,n*p,p*q,且水n〈p〈q,以下计算顺序效率最高的是：（）

A）A（BC）

B）（AB）C

C）（AC）B

D）所有效率都相同

117.［单选题］关于k-means算法，正确的描述是（）

A）能找到任意形状的聚类

B）初始值不同，最终结果可能不同

0每次迭代的时间复杂度是0（n、2）,

D）不能使用核函数

118.［单选题］Matplotlib主要是用哪种语言编写的？（）

正确回答

A）Python

B)java

C)C++

D)C

119.［单选题］以下对半结构化数据描述不正确的是（—）。

A）先有数据，后有结构

B）先有结构，后有数据

OHTML是半结构化数据

D）经过一定转换后可以用传统关系数据库存储

120.［单选题］做一个二分类预测问题，先设定阈值为0.5,概率大于等于0.5的样本归入正例类（即

1），小于0.5的样本归入反例类（即0）。然后，用阈值n（n>0.5）重新划分样本到正例类和反例类

,下面哪一种说法正确是（）1.增加阈值不会提高召回率2..增加阈值会提高召回率3..增加阈值不

会降低查准率4.增加阈值会降低查准率

A）1

B）2

01、3

D）2、4

121.［单选题］以下哪项关于决策树的说法是错误的0。

A）冗余属性不会对决策树的准确率造成不利的影响

B）子树可能在决策树中重复多次

C）决策树算法对于噪声的干扰非常敏感

D）寻找最佳决策树是NP完全问题

122.［单选题］以下哪种方法不能防止过拟合？

A）交叉验证

B）低维嵌入

C）剪枝

D）集成学习

123.［单选题］（）先对数据集进行特征选择，然后再训练学习器。

A）过滤式选择

B）包裹式选择

C）稀疏表示

D）嵌入式选择

124.［单选题］多层前馈神经网络描述错误的是

A）输出层与输入层之间包含隐含层，且隐含层和输出层都拥有激活函数的神经元；

B）神经元之间存在这同层连接以及跨层连接；

C）输入层仅仅是接收输入，不进行函数处理；

D）每层神经元上一层与下一层全互连；

125.［单选题］LVW属于哪种特征选择方法

A)包裹式

B)启发式

C)嵌入式

D)过滤式

126.［单选题］假设你在卷积神经网络的第一层中有5个卷积核，每个卷积核尺寸为7X7,具有零

填充且步幅为1。该层的输入图片的维度是224X224X3。那么该层输出的维度是多少？

A)217x217x3

B)217x217x8

0218x218x5

D)220x220x7

127.［单选题］留出法直接将数据集划分为一个互斥的集合。

A)—

B)二

D)四

128.［单选题］()是交叉验证法的一种特例。

A)自助法

B)留一法

C)交叉验证法

D)错误率分析

129.［单选题］以下()是Python中的二维图形包。

A)Matplotlib

B)Pandas

C)NumPy

D)BoKeh

130.［单选题］下列激活函数中，能够实现将特征限制到区间的是哪一个

A)Tanh

B)Logistic

OReLU

D)Sigmoid

131.［单选题］决策论中，将“期望损失"称为(_)。

A)均值

B)方差

C)风险

D)概率

132.［单选题］关于列表数据结构，下面描述正确的是()o

A)可以不按顺序查找元素

B)必须按顺序插入元素

C)不支持in运算符

D)所有元素类型必须相同

133.［单选题］关于LI、L2正则化，下列说法正确的是()。

A)L2正则化能防止过拟合，提升模型的泛化能力，但L1做不到这点

B)L2正则化技术又称为LassoRegularization

C)L1正则化得到的解更加稀疏

D)L2正则化得到的解更加稀疏

134.［单选题］20个阿里巴巴B2B技术部的员工被安排为4排，每排5个人，我们任意选其中4人送给他们

一人一本《effectiveC++》，那么我们选出的4人都在不同排的概率为：

A)5*4*5!*15!/20!

B)4*5*5!*15!/20!

C)5"4*4!*16!/20!

D)4*5*4!*16!/20!

135.［单选题］()算法是决策树学习的基本算法,其他多数决策树学习方法都是它的变体。

A)Find-S

B)KNN

C)概念

D)ID3

136.［单选题］用OpenCV读取图像所需要的函数是()。

A)cv.imshow()

B)cv.inread()

C)cv.imwriteO

D)cv.imread()

137.［单选题］测试集应尽可能与训练集

A)相容

B)相等

C)互斥

D)包含

138.［单选题］用于产生词嵌入的单向语言模型

A)BERT

B)GPT

OELMo

D)Word2Vec

139.［单选题］观察如下数据集：

删除

A,b,c,d哪个点对拟合回归线的影响最大？

A)a

B)b

C)c

D)d

140.［单选题］梯度爆炸问题是指在训练深度神经网络的时候，梯度变得过大而损失函数变为无穷。

在RNN中，下面哪种方法可以较好地处理梯度爆炸问题()

A)梯度裁剪

B)所有方法都不行

C)Dropout

D)加入正则项

141.［单选题］在测试一假设h时，发现在一包含n=1000个随机抽取样例的样本s上，它出现r=300个错误

，计算Errors(h)的标准差()

A)0.0145

B)0.145

01.45

D)14.5

142.［单选题］下列关于zookeeper自身特性说法正确的是0

A)zookeeper是一个被动协调服务组件

B)zookeeper是一个计算组件

C)zookeeper是一个主动协调服务

D)zookeeper是一个存储模型

143.［单选题］信息增益即数据集的嫡与在某特征条件下的条件嫡之差。关于信息增益，正确的说法

是：(2.0分)2.0分

A)信息增益越大，说明此特征分类能力越弱

B)信息增益越小，说明此特征克服的不确定性越大，具有更强的分类能力

C)信息增益越大，说明此特征克服的不确定性越大，具有更强的分类能力

D)信息增益越小，说明此特征分类能力越强

144.［单选题］下列有关SVM和LR说法不正确的是。

A)SVM是分类模型，LR是回归模型

B)SVM和LR都是分类模型

C)SVM是判别式模型

D）LR判别式模型

145.［单选题］对于下图，最好的主成分选择是多少？：

这里写图片描述

A）7

B）30

035

D）Can,tSay

146.［单选题］关于ndarray对象属性，下列描述错误的是（）。

A）ndim属性表示数组轴的个数

B）shape属性表示每个维度上数组的大小

C）size属性表示数组元素的总个数，等于shape属性元组元素的和

D）dtype属性表示数组中元素类型的对象

147.［单选题］假设你有以下数据：（0,2）（2,2）（3,1）输入和输出都只有一个变量。使用线性回

归模型（y=wx+b）来拟合数据。那么使用留一法（Leave-OneOut）交叉验证得到的均方误差是多少

A）10/32

B）39/27

049/27

D）55/27

148.［单选题］以下哪项不属于知识发现的过程？（）

A）数据清理

B）数据挖掘

C）知识可视化表达

D）数据测试

149.［单选题］关于基本数据的元数据是指：

A）基本元数据与数据源，数据仓库，数据集市和应用程序等结构相关的信息；

B）基本元数据包括与企业相关的管理方面的数据和信息；

C）基本元数据包括日志文件和简历执行处理的时序调度信息；

D）基本元数据包括关于装载和更新处理，分析处理以及管理方面的信息.

150.［单选题］下列哪种去噪方法能较好的保持图像边缘。（）

A）中值滤波

B）双边滤波

C）均值滤波

D）高斯滤波

151.［单选题］下列方法中，属于无监督学习的为（）

A）线性回归

B）K均值

C）神经网络

D）决策树

152.［单选题］下面说法错误的是（）

A）遗传算法直接以适应度作为搜索信息，无需导数等其他辅助信息

B）决策树算法对离散属性和连续属性进行建模

OHapfield网络不仅有不动点吸引子，也有其它类型的吸引子

D）决策树是一种混合算法，它综合了多种不同的创建树的方法

153.［单选题］在Pandas中tail（）这个函数是做什么的?（）0

A）用来创建数据

B）用来分析数据

C）用来计算数据

D）用来展现数据

154.［单选题］主成分分析的优化目标是一个（_）。

A）不含约束条件的二次规划问题

B）含有约束条件的二次规划问题

C）不含约束条件的线性规划问题

D）含有约束条件的线性规划问题

155.［单选题］Spark的四大组件下面哪个不是

A）SparkStreaming

B）Mlib

C）Graphx

D）SparkR

156.［单选题］设乂={1,2,3}是频繁项集，则可由X产生（）个关联规则

A）4

B）5

C）6

D）7

157.［单选题］机器学习的经典定义是：（）

A）利用技术进步改善系统自身性能

B）利用技术进步改善人的能力

C）利用经验改善系统自身的性能

D）利用经验改善人的能力

158.［单选题］下图是哪一种算法表示（）

A）K-近邻算法

B）贝叶斯

C）一元线性回归

D）多项式回归

159.［单选题］关于梯度下降，以下说法中不合适的是：

A）应该沿着梯度反方向调整参数

B）应该沿着梯度同方向调整参数

C）对损失函数而言，梯度向量的反方向是其函数值下降最快的方向

D）调整的步长由学习率控制

160.［单选题］支持向量回归与传统回归模型的差别是（）。

A）模型输出与真实值相同

B）模型输出与真实值存在e偏差

C）模型输出大于真实值

D）模型输出小于真实值

161.［单选题］（_）是指能够通过数据来帮助用户实现其某一个目标的产品。

A）数据产品

B）电子产品

C）数据系统

D）电子系统

162.［单选题］二分类任务中，有三个分类器hl,h2,h3,三个测试样本xl,x2,x3。假设1表示分类结果正

确,0表示错误,hl在xl,x2,x3的结果分别（l,l,0）,h2,h3分别为（0,1,1）,（1,0,1）,按投票法集成三个

分类器，下列说法正确的是（）（注：0,1不是类别标签，而是模型预测结果是正确还是错误的意思）

A）集成提高了性能

B）集成没有效果

C）集成降低了性能

D）集成效果不能确定

163.［单选题］在概率模型中，利用已知变量推测未知变量的分布称为？

A）推论

B）推断

C）推演

D）推算

164.［单选题］在HMM中，如果已知观察序列和产生观察序列的状态序列，那么可用以下哪种方法直接

进行参数估计（）

A）EM算法

B）维特比算法

C）前向后向算法

D)极大似然估计

165.［单选题］概念分层图是()图

A)无向无环

B)有向无环

C)有向有环

D)无向有环

166.［单选题］以下有关机器学习理解不正确的是()。

A)查询大量的操作数据去发现新的信息

B)从大量的业务数据中分析有兴趣的新颖知识辅助决策的过程

C)机器学习的结果不一定能辅助决策

D)需要借助统计学或机器学习的一些算法

167.［单选题］在线性模型y=wlxl+w2x2+…+wnxn中，［wl,w2,…，wn］值代表()

A)预测值

B)特征值

C)输入值

D)模型参数

168.［单选题］回归方程判定系数的计算公式1?2=5$口/5$丁=1-55£/55丁,对判定系数描述错误的是()。

A)式中的SSE指残差平方和

B)式中的SSR指总离差平方和

C)判定系数用来衡量回归方程的扰合优度

D)判定系数R2等于相关系数的平方

169.［单选题］p尾法确定图像分割的阈值，适用于(_)的情况。

A)已知阈值范围

B)已知图像灰度范围

C)已知目标所占全图象百分比

D)图像类间方差最大化

170.［单选题］关于OLAP的特性，下面正确的是：(1)快速性(2)可分析性(3)多维性(4)信息性

(5)共享性

A)(2)(3)

B)(3)(4)

0(2)(3)(4)

D)(2)(3)(4)(5)

171.［单选题］以下对Volume相关描述不正确的是(___)0

A)Volume是指数据量大

B)就目前而言，当数据量达到拍字节以上时，一般称为大数据

C)大数据时间分布是均匀的

D)数据量大是相对计算与存储能力而定的

172.［单选题］学习器的实际预测输出与样本的真实输出之间的差异称为_。

A)错误率

B)精度

C)误差

D)查准率

173.［单选题］对于正态密度的贝叶斯分类器，各类协方差矩阵相同时，决策函数为()

A)线性决策函数

B)非线性决策函数

C)最小距离分类器

D)以上都有可能

174.［单选题］以下不属于数据科学的研究目的的是(__)o

A)大数据及其运动规律的揭示

B)从数据到智慧的转化

C)数据解释

D)数据驱动型决策支持

175.［单选题］你在20K文档的输入数据上为机器学习模型创建了文档-词矩阵(document-term

matrix)»以下哪项可用于减少数据维度？(1)关键词归一化(KeywordNormalization)；(2)潜在语义

索引(LatentSemanticIndexing)；(3)隐狄利克雷分布(LatentDirichletAllocation).

A)只有(1)

B)(2)(3)

0(1)(3)

D)(1)(2)(3)

176.［单选题］假设我们使用kNN训练模型，其中训练数据具有较少的观测数据(下图是两个属性

x、y和两个标记为"+”和"o”的训练数据)。现在令k=1,则图中的Leave-One-Out交

叉验证错误率是多少？

A)0%

B)20%

C)50%

D)100%

177.［单选题］以下哪种NLP模型的准确性最高？

A)BERT

B)XLNET

C)GPT-2

D)ELMo

178.［单选题］关于ZooKeeper临时节点的说法正确的是0

A）创建临时节点的命令为：create-s/tmpmyvalue

B）一旦会话结束，临时节点将被自动删除

C）临时节点不能手动删除

D）临时节点允许有子节点

179.［单选题］k近邻算法在（）的情况下效果较好。

A）样本较多但典型性不好

B）样本较少但典型性好

C）样本呈团状分布

D）样本呈链状分布

180.［单选题］下列表述中，在k-fold交叉验证中关于选择K说法正确的是：

A）较大的K并不总是好的，选择较大的K可能需要较长的时间来评估你的结果

B）相对于期望误差来说，选择较大的K会导致低偏差（因为训练folds会变得与整个数据集相似）

C）在交叉验证中通过最小化方差法来选择K值

D）以上都正确

181.［单选题］使用high（infinite）regularisation时偏差会如何变化？

alt="">

有散点图“a”和“b”两类（蓝色为正，红色为负）。在散点图“a”中，使用了逻辑回归（黑线是决策

边界）对所有数据点进行了正确分类。

A）偏差很大

B）偏差很小

C）不确定

D）都不是

182.［单选题］有如下数据集，分别使用1-最近邻,3-最近邻，对数据点x=5.0分类，则:

XOS3J045464.952S3ss7。95

Y•■•*

class="fr-ficfr-dibcursor-hover"

A）最近邻:+；3-最近邻：-

B）最近邻：+；3-最近邻：+

C）最近邻:-；3-最近邻：-

D）最近邻:-；3-最近邻:+

183.［单选题］因为文本数据在可用的数据中是非常无结构的，它内部会包含很多不同类型的噪点，所

以要做数据预处理。以下不是自然语言数据预处理过程的是：

A）词汇规范化

B）词汇关系统一化

C）对象标准化

D）噪声移除

184.［单选题］下列贝叶斯网结构中不属于三种典型的依赖关系

A）同父结构

B）选择结构

C）顺序结构

D）V型结构

185.［单选题］下图显示了三个逻辑回归模型的AUC-ROC曲线。不同的颜色表示不同超参数值的曲线。

以下哪个AUC-ROC会给出最佳果？

style="width：295px；"class="fr-ficfr-filfr-dibcursor-hover">

A）黄色

B）粉红色

C）黑色

D）都相同

186.［单选题］以下有关随机森林算法的说法错误的是：

A）随机森林算法的分类精度不会随着决策树数量的增加而提高

B）随机森林算法对异常值和缺失值不敏感

C）随机森林算法不需要考虑过拟合问题

D）决策树之间相关系数越低、每棵决策树分类精度越高的随机森林模型分类效果越好

187.［单选题］任何一个核函数都隐式地定义了一个（__）空间。

A）希尔伯特空间

B）再生希尔伯特空间

-4

OO1O2O3OO7

Falseposith/erata

c）再生核希尔伯特空间

D）欧式空间

188.［单选题］下面哪项不属于循环神经网络的输出模式。（）

A）单输出

B）多输出

C）同步多输出

D）异步多输出

189.［单选题］下面关于SVM算法叙述不正确的是（）

A）SVM在解决小样本、非线性及高维模式识别问题中具有优势

B）SVM是一种基于经验风险最小化准则的算法

C）SVM求得的解为全局唯一最优解

D）SVM最终分类结果只与少数支持向量有关

190.［单选题］对分类任务来说，学习器从类别标记集合中预测出一个标记，最常见的结合策略是

（_）0

A）投票法

B）平均法

C）学习法

D）排序法

191.［单选题］（一）度量了学习算法的期望预测与真实结果的偏离程度。

A）偏差

B）方差

C）均方差

D）泛化误差

192.［单选题］tf.nn.rnn_ceH.BasicLSTMCell（n.hidden,forget_bias=l.0,

state_is_tuple=True）函数中的参数forget_bias的含义是（）。

A）神经元个数

B）遗忘系数

C）返回状态

D）神经元类型

193.［单选题］以下名称中不属于“属性张成的空间”的是（—）。

A）属性空间

B）样本空间

C）输入空间

D）对偶空间

194.［单选题］下面是交叉验证的几种方法：

1/Bootstrap

2/留一法交叉验证

3/5折交叉验证

4/重复使用两次5折交叉验证

请对上面四种方法的执行时间进行排序，样本数量为1000。

A）1>2>3>4

B）2>4>3>1

C）4>1>2>3

D）2>4>3>1

195.［单选题］下列关于支持向量机优化性问题的形式说法正确的是

A）它是一个凸二次规划问题

B）它是一个凸一次规划问题

C）它是一个凹二次规划问题

D）它是一个凹一次规划问题

196.［单选题］关于机器学习算法正确的是0

A）LR模型在加入正则化项后Variance将增大

B）线性SVM是寻找最小边缘的超平面的一个分类器

C)xgboost和GDBT都是属于boosting算法

D)xgboost和随机森林都是属于bagging算法

197.［单选题］下列关于L1正则化与L2正则化的描述，错误的是0。

A)L1范数正则化有助于降低过拟合风险

B)L2范数正则化有助于降低过拟合风险

C)L1范数正则化比L2范数正则化更有易于获得稀疏解

D)L2范数正则化比L1范数正则化更有易于获得稀疏解

198.［单选题］以下哪种方法不属于特征选择的标准方法：

A)嵌入

B)过滤

C)包装

D)抽样

199.［单选题］假正率是指(_)o

A)正样本预测结果数/正样本实际数

B)被预测为负的正样本结果数/正样本实际数

C)被预测为正的负样本结果数/负样本实际数

D)负样本预测结果数/负样本实际数

200.［单选题］以下集合是凸集的是

A){(x,y)|y=x+l}

B){(x,y)|x的平方+y的平方=1}

C){(x,y)|x的平方+y的平方>1}

D){(x,y)|x=ly=l}

201.［单选题］下列哪项不是目前深度学习的必备技术()

A)卷积可视化解释

B)反向传播算法

0非线性激活函数

D)深度神经网络

202.［单选题］有四个整数a、b、c、d,且c>

D,贝11"a>b"是"a-c>b-d”的：()

A)必要不充分条件

B)充分不必要条件

C)充要条件

D)既不充分也不必要条件

203.［单选题］归纳推理是()推理

A)从一般到个别

B）从个别到一般

C）从个别到个别

D）从一般到一般

204.［单选题］一监狱人脸识别准入系统用来识别待进入人员的身份，此系统识别狱警、小偷、送餐员

、其他人员4种不同人员。下列学习方法最适合此种应用需求的是（）。

A）二分类问题

B）层次聚类问题

C）多分类问题

D）回归问题

205.［单选题］关于引入模块的方式，错误的是（）o

A）importmath

B）fromfibimportFibonacci

C）frommathimport*

D）from*importfib

206.［单选题］现在有一个tcp服务端监听了80端口，问最多同时能建立多少连接

A）1023

B）65534

064511

D）非常多基本和内存大小相关

207.［单选题］假定你使用阶数为2的线性核SVM,将模型应用到实际数据集上后，其训练

准确率和测试准确率均为100机现在增加模型复杂度（增加核函数的阶），

会发生以下哪种情况（）

A）过拟合

B）欠拟合

C）什么都不会发生，因为模型准确率已经到达极限

D）以上都不对

208.［单选题］我们想在大数据集上训练决策树，为了使用较少时间，我们可以（）

A）增加树的深度

B）增加学习率

C）减少树的深度

D）减少树的数量

209.［单选题］下列关于半监督支持向量机说法错误的是（_）。

A）半监督支持向量机是针对二分类问题的学习算法

B）半监督支持向量机寻求一个在所有样本上间隔最小化的划分超平面

C）半监督支持向量机采用局部搜索来迭代地寻找其优化问题的近似解

D）半监督支持向量机试图考虑对未标记样本进行各种可能的标记指派

210.［单选题］下面不属于后台自动化的有(_)。

A)hyperscience

B)datafox

C)aptricity

D)appzen

211.［单选题］关于Hadoop技术描述错误的是？()

A)HDFS是一个分布式文件系统

B)联盟链

0HDFS适合存储大量的小文件

D)HDFS存储空间由数据节点数决定

212.［单选题］协同过滤算法解决的是数据挖掘中的哪类问题？()

A)分类问题

B)聚类问题

C)推荐问题

D)自然语言处理问题

213.［单选题］考虑如下数据集，其中CustomerID(顾客id),TransactionID(事务id),Items

Bought(购买项)。如果将每个事务id看成一个购物篮，计算项集{e},{b,d},{b,

D,e}的支持度:

A)s({e})=0.8s({b,d})=0.2s({b,

D,e})=0.2

B)s({e})=0.7s({b,d})=0.3s({b,

D,e})=0.3

C)s({e})=0.6s({b,d})=0.4s({b,

D,e})=0.3

D)s({e})=0.8s({b,d})=0.ls({b,

D,e})=0.1

214.［单选题］以下机器学习中，在数据预处理时，不需要考虑归一化处理的是()

A)逻辑回归

B)支持向量机

C)树形模型

D)神经网络

215.［单选题］下面关于非监督学习算法的说法正确的是

A)数据要是成对的

B)算法准确率非常高

C)没有经验数据可供学习

D)需要一定的经验数据

216.［单选题］互为对偶的两个线性规划问题的解存在关系（）

A）原问题无可行解，对偶问题也无可行解

B）对偶问题有可行解，原问题可能无可行解

C）若最优解存在，则最优解相同

D）一个问题无可行解，则另一个问题具有无界解

217.［单选题］（）属于SVM应用。

A）文本和超文本分类

B）图像分类

C）新文章聚类

D）以上均是

218.［单选题］当不知道数据所带标签时，可以使用0促使带同类标签的数据与带其他标签的数据相分

离。

A）分类

B）聚类

C）关联分析

D）隐马尔可夫链

219.［单选题］专家系统中知识库的知识可以获取的来源是（）。口*

A）领域专家

B）专家系统的用户

C）计算机系统管理员

D）专家系统程序的开发者

220.［单选题］（_）是指样本空间中具有代表性的点。

A）样本点

B）原点

C）原型

D）实例

221.［单选题］请阅读下列一段程序：

Arr=np.arange（12）.reshape（3,4）

Arr.shape

运行上述程序，它最终执行的结果为（）。

A）3

B）4

0（3,4）

D）（1,2）

222.［单选题］以下哪项是非线性降维方法

A）PCA（主成分分析）

B）LDA（线性判别）

C）ICA（独立成分分析）

D）KPCA（核化线性降维）

223.［单选题］下面不属于农业的有（_）。

A）farmers

B）farmlogs

C）prospera

D）uber

224.［单选题］以下哪项不属于图像分割的目的。（）

A）把不同类标分开。

B）提取不同区域的特征。

C）识别图像内容，或对图像进行分类。

D）对未处理噪声的图像进行平滑。

225.［单选题］假设已经使用python第三方库sklearn创建线性模型实例linear_model,则

linear_model.coef中,属性coef的作用是（）

A）sigmoid函数

B）激活函数

C）模型的参数

D）以上都不是

226.［单选题］关于梯度下降，以下说法中不合适的是：

A）应该沿着梯度反方向调整参数

B）应该沿着梯度同方向调整参数

C）调整的步长由学习率控制

D）对损失函数而言，梯度向量的反方向是其函数值下降最快的方向

227.［单选题］避免直接的复杂非线性变换，采用线性手段实现非线性学习的方法是（）

A）核函数方法

B）集成学习

C）线性鉴别分析

D）Logistic回归

228.［单选题］在逻辑回归输出与目标对比的情况下，以下评估指标中（）不适用。

A）AUC-R0C

B）准确度

C）Logloss

D）均方误差

229.［单选题］如右图所示无向图，节点G的马尔可夫毯为（）

A）{D,E）

B）{I,J}

0{D.E.I.J）

D）{D,E,F,H,I,J}

230.［单选题］以下对智慧描述不正确的是（—）。

A）智慧是人类超出知识的那一部分能力

B）智慧是人类的创造性设计、批判性思考和好奇性提问的结果

C）智慧是从信息中发现的共性规律、模型、模式、理论、方法等

D）智慧运用知识并结合经验创造性的预测、解释和发现

231.［单选题］下列是机器学习中降维任务的准确描述的为

A）依据某个准则对项目进行排序

B）将其映射到低维空间来简化输入

C）预测每个项目的实际值

D）对数据对象进行分组

232.［单选题］下面关于深度学习相关描述不正确的有（_）。

A）深度学习是一种特征学习方法

B）深度学习通过足够多的简单转换函数及其组合方式来学习一个复杂的目标函数

C）深度学习的关键在于计算观测书记的分层特征及其表示

D）ANN不是深度学习

233.［单选题］当训练样本近似线性可分时,通过（），学习一个（）。

A）硬间隔，最大化非线性支持向量机

B）软间隔，最大化线性支持向量机

C）硬间隔，最大化线性支持向量机

D）软间隔，最大化非线性支持向量机

234.［单选题］以下哪个模型不是分类模型（）

A）最近邻

B）K均值

C）朴素贝叶斯

D）逻辑回归

235.［单选题］若设1.启动，2.诊断，3.建立，4.行动，5.学习，则DMM模型中的顺序为（_

人人文库> 全部分类> 教育资料 > 辅导培训

温馨提示

1. 本站所有资源如无特殊说明，都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2. 本站的文档不包含任何第三方提供的附件图纸等，如果需要附件，请联系上传者。文件的所有权益归上传用户所有。
3. 本站RAR压缩包中若带图纸，网页内容里面会有图纸预览，若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 人人文库网仅提供信息存储空间，仅对用户上传内容的表现方式做保护处理，对用户上传分享的文档内容本身不做任何修改或编辑，并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容，请与我们联系，我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

人工智能机器学习技术练习练习题及答案3-2023-练习版

文档简介

温馨提示

最新文档

评论

人工智能机器学习技术练习练习题及答案3-2023-练习版

文档简介

温馨提示

最新文档

评论

相关文档