2023年能源大数据应用开发技能竞赛备考试题库汇总-上(单选题部分)_第1页
2023年能源大数据应用开发技能竞赛备考试题库汇总-上(单选题部分)_第2页
2023年能源大数据应用开发技能竞赛备考试题库汇总-上(单选题部分)_第3页
2023年能源大数据应用开发技能竞赛备考试题库汇总-上(单选题部分)_第4页
2023年能源大数据应用开发技能竞赛备考试题库汇总-上(单选题部分)_第5页
已阅读5页,还剩131页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

2023年能源大数据应用开发技能竞赛备考试题库汇总-上(单选

题部分)

一、单选题

I.DataWorks中不同角色拥有不同的权限,可以通过角色授权来控制成员的操作

权限。角色主要有组织管理员'项目管理员'开发员'防客等,其中开发角色不

具备什么权限。

A、添加项目成员

B、新建任务

C、新建函数

D、上传资源

答案:A

2.下列属于无监督学习的是()。

AxK-means

B、SVM

c、最大熾

D、CRF

答案:A

3.关于岭回归,下列说法错误的是0。

A、属于线性回归

B、使用L2正规项

C、使用L1正规项

D、基于最小二乘法

答案:C

4.以下哪个分类方法可以较好地避免样本的不平衡问题()o

A、KNN

B、SVM

C、Bayes

D、神经网络

答案:A

5.MapReduce默认的分区函数是()。

A、hash

B、disk

C、reduce

Dxmap

答案:A

6.关于SOM神经网络描述错误的是:(_)o

A、一种竞争学习型的无监督神经网络

B、将高维输入数据映射到低维空间,保持输入数据在高维空间的拓扑结构

C、SOM寻优目标为每个输出神经元找到合适的权重

D、输出层神经元以矩阵方式排列在二维空间

答案:C

7.下面关于展示数据管理说法不正确的是O

A、大厅场景数据应基于数据中台统一获取

B、建立大厅数据质量常态巡检核查机制

C、不得违规存储、处理涉及敏感数据。

D、历史数据需要删除

答案:D

8.下面关于k近邻学习算法的说法,正确的是()。

A、k近邻可以用于分类,但是不能用于回归

B、k近邻属于“急切学习”

C、k近邻用于分类时,对于新的样本,计算离其最近的k个样本的平均值,作

为新样本的预测值

D、k近邻用于分类时,对于新的样本,根据其k个最近邻样本的类别,通过多

数表决的方式预测新样本的类别

答案:D

9.下列关于网络用户行为的说法中,错误的是()o

A、网络公司能够捕捉到用户在其网站上的所有行为

B、用户离散的交互痕迹能够为企业提升服务质量提供参考

C、数字轨迹用完即自动删除

D、用户的隐私安全很难得以规范保护

答案:C

10.下列关于LSTM的说法,错误的是()o

A、LSTM中存在Sigmoid函数

B、LSTM中存在tanh函数

CxLSTM又称长短时记忆网络

D、RNN是LSTM的变种

答案:D

11.如果要将读写位置移动到文件开头,需要使用的命令是()o

A、close

B、seek(0)

Cxtruncate

D、write('stuff')

答案:B

12.服务(),提供多模式电力交易大数据分析服务,开展电力交易市场化配置

和风险预警数据应用,提高交易辅助决策和资源优化配置能力。

A、电力供用电市场

B、电力客户

C、电力市场用户

D、电力资源市场化配置

答案:D

13.提供能源()服务,提升上下游企业和能源生态圈的大数据运营服务能力。

A、大数据增值

B、支撑

C、运营

D、分析

答案:A

14.深度学习防止过拟合下列说法正确的是

A、BN(批归一化)

B、增强数据集样本数目、做一些数据增强的操作

C、限制模型的学习能力

D、以上都可以

答案:D

15.()是指通过训练而得到一种识别规则,通过此识别规则可以得到一种特征

分类,使图像识别技术能够得到高识别率。

A、预处理

B、特征抽取和选择

C、分类器设计

D、分类决策

答案:C

16.构建一个神经网络,将前一层的输出和它自身作为输入,下列哪一种架构有

反馈连接

A、循环神经网络

B、卷积神经网络

C、限制玻尔兹曼机

D、都不是

答案:A

17.对于一个图像识别问题(在一张照片里找出一只猫),下面哪种神经网络可以

更好地解决这个问题()

A、循环神经网络

B、感知机

C、多层感知机

D、卷积神经网络

答案:D

18.下面算法中属于图像锐化处理的是()o

A、低通滤波

B、加权平均法

C、咼通滤波

D、中值滤波

答案:C

19.假设我们有一个使用ReLU激活函数(ReLUactivationfunction)的神经网络,

假如我们把ReLU激活替换为线性激活,那么这个神经网络能够模拟出同或函数

(XNORfunction)吗?

A、能

B、依情况而定

C、不一定

D、不能

答案:D

20.Hadoop中MapReduce组件擅长处理()场景的计算任务。

A、迭代计算

B、离线计算

C、实时交互计算

D、流式计算

答案:B

21.设X={1,2,3}是频繁项集,则可由X产生()个关联规则?

A、4

B、5

C、6

D、7

答案:C

22.开展数据产品研发'发布等活动时,应确保遵从国家法律法规、数据主体授

权范围、公司相关规章制度等()保护要求。

A、数据使用

B、数据研发

C、数据交换

D、数据安全

答案:D

23.如果对样本分类,不可以选择的方法是(?)

A、层次聚类法

B、K-均值聚类法

C、两步聚类法

D、混合聚类法

答案:D

24.随机森林中的随机是指。

A、随便构建树模

B、随机选择一个树模型

C、随机选择多个树模型

D、在构建每个树模型时随机选择样本和特征

答案:D

25.CREATETABLEAS创建表,后面需要添加查询语句类型是:()。

A、INSERT

B、UPDATE

GSELECT

D、DELETE

答案:c

26.下面哪个操作肯定是宽依赖()

A、map

B、fIatMap

C、reduceByKey

D、sampIe

答案:C

27.下面关于Hive四种排序方式的区别,描述正确的是()

A、order

B、sort

C、distribute

DxcIuster

答案:B

28.?时间序列数据更适合用()做数据规约。

A、小波变换

B、主成分分析

C、决策树

D、直方图

答案:A

29.HDFS集群中的namenode职责不包括()

A、维护HDFS集群的目录树结构

B、维护HDFS集群的所有数据块的分布'副本数和负载均衡

C、负责保存客户端上传的数据

D、响应客户端的所有读写数据请求

答案:C

30.批规范化(BatchNormaIization)的好处都有什么

A、让每一层的输入的范围都大致固定

B、它将权重的归一化平均值和标准差

C、它是一种非常有效的反向传播(BP)方法

D、这些均不是

答案:A

31.下列关于循环神经网络说法错误的是()o

A、长短期记忆网络是进行优化过后的循环神经网络

B、RNN是一类可用于处理序列数据的神经网络

C、循环神经网络广泛应用于自然语言处理领域,例如语音识别、语言建模和机

器翻译等

D、LSTM引入了一个基于循环神经网络(RNN)的架构后,梯度消失问题得以解

答案:D

32.以下不属于神经网络模型的是()

A、DNN

B、CNN

GKNN

D、RNN

答案:C

33.在MapReduce中,reduce()函数可以将()值相同的输入进行合并处理。

A、input

B、key

C、vaIue

D、number

答案:B

34.下列属于中台发展期的战略为

A、“中台战略”

B、“双中台”

C、“多中台”

D、“融合中台”

答案:C

35.依据(),建立基于负面清单的公司对内数据共享机制,坚持“以共享为原

则'不共享为例外”,改变当前“一事一议”'层层审批的数据应用授权方式。

A、《中华人民共和国民法典》

B、《中华人民共和国网络安全法》

C、《国家电网有限公司数据管理办法》

D、《中央企业商业秘密保护暂行规定》

答案:C

36.下列哪个用于说明在RDD上执行何种计算()o

A、分区;

B、算子;

C、日志;

D、数据块;

答案:B

37.pandas的常用类不包括()。

AvSeries

B、DataFrame

CxPaneI

D、Index

答案:C

38.企业中台不包含()

A、业务中台

B、数据中台

C、技术中台

D、服务中台

答案:D

39.Ndarray是一个通用的()数据容器

A、单维同类

B、单维多类

C、多维同类

D、多维多类

答案:C

40.MapReduce计算框架的输人数据结构是()。

A、key-vaIue

B、input-output

C、map-reduce

D、key-coIumn

答案:A

41.Relief的扩展变体ReIief-F能够处理(_)问题。

A、二分类

B、多分类

C、回归

D、降维

答案:B

42.某公司要建立资料库,该資料库要用ElasticSearch进行检索,请问下列哪

些选项可以放到资料库中?

A、Word文档

B、公司宣传视频

C、产品设计图

D、以上全部正确

答案:D

43.Maxpute中负责对等待提交的task进行排序的模块是:()。

AxscheduIer

BxcontrolIer

Cxexecutor

D、worker

答案:A

44.当我们需要在一张图表中特意指出某个特殊点,并加上标注达到醒目的目的

时,需要用至1」(_)函数。

A、pit.axvspan()

B、pit.axhspanO

Cxpit.annotate()

D、pit.text()

答案:C

45.()方面,研究基于大数据的电能质量和计量数据分析技术,建立典型用电

设备电能质量信息库、指标体系和大数据分析平台,提供电能质量辅助决策分析

服务;

A、电测量技术

B、大数据测量技术

C、电能技术

D、用电技术

答案:A

46.以下算法中不属于基于深度学习的图像分割算法是()。

A、FCN

B、deepIab

C、Mask-RCNN

D、kNN

答案:D

47.数据仓库仅仅是提供存储的,提供一种()的服务,不面向最终分析用户:而

数据集市是()的,面向最终用户。

A、面向数据管理、面向分析应用

B、面向分析应用、面向数据管理

C、面向分析应用、面向事务交互

D、面向事务交互、面向数据管理

答案:A

48.在反向传播的过程中,首先被计算的是变量O的梯度,之后将其反向传播。

A、连接权重

B、损失函数

C、激活函数

D、特征映射

答案:C

49.关于神经网络中经典使用的优化器,以下说法正确的是?

A、Adam的收敛速度比RMSprop慢

B、相比于SGD或RMSprop等优化器,Adam的收敛效果是最好的

C、对于轻量级神经网络,使用Adam比使用RMSprop更合适

D、相比于Adam或RMSprop等优化器,SGD的收敛效果是最好的

答案:D

50.在MapReduce中,哪个组件是用户不指定也不会有默认的()

Axbiner

BxOutputFormat

C、Partitioner

D、InputFormat

答案:A

51.下列关于数据转换,正确的是()o

A、json内的取值只能有统一格式

B、pdf文件在不同平台上打开显示不同

C、可以通过python将csv文件转换成ExceI格式

D、excel存储数据的量无限制

答案:C

52.加强数据合规管理顶层设计,强化跨专业、跨层级统筹协调,建立健全()

工作机制,确保公司数据合规管理工作有力'有序、有效推进。

A、闭环

B、协同

C、安全

D、监控

答案:B

53.2*1的数组与1*3的数组相加结果为()o

A、2*3的数组

Bv1*1的数组

G3*2的数组

D、以上都不对

答案:A

54.感知机中,()是M-P神经元,也称为阈值逻辑单元。

A、输入层

B、输出层

C、第一层

D、第二层

答案:B

55.深度学习中的“深度”是指O。

A、计算机理解深度

B、中间神经元网络的层次很多

C、计算机的求解更加精确

D、计算机对问题的处理更加灵活

答案:B

56.在《国家电网公司“十三五”科技战略研究报告》中指出,十二五期间“先

进计算与电力大数据技术取得良好开端”,主要体现在:在()及专业应用实现

基础上,探索了大数据平台基础体系架构与应用规范

A、技术中台

B、公司一体化信息平台

C、公司统一管理平台

D、数据中台

答案:B

57.神经网络的训练结果模型不包括()。

A、权重矩阵

B、偏置参数

C、超参数

D、计算图

答案:C

58.做好数据识别和分类分级,通过数据盘点理清数据状况,建立数据目录,以

数据目录为基础梳理形成数据共享()

A、白名单

B、分级目录

C、备忘录

D、负面清单

答案:D

59.卷积神经网络可以对一个输入进行多种变换(旋转、平移、缩放),这个表

述正确吗()

A、对的

B、不知道

C、看情况

D、不对

答案:D

60.下列关于运算符优先级的说法不正确的是()

A、运算符按照优先级顺序表进行运算

B、同一优先级的运算符在表达式中都是按照从左到右的顺序进行运算的

C、同一优先级的运算符在表达式中都是按照从右到左的顺序进行运算的

D、括号可以改变运算的优先次序

答案:C

61.Spark核心层主要关注()问题。

A、存储

B、计算

C、传输

D、连接

答案:B

62.Maxpute架构由四层组成,每一层完成不同的工作。现在执行命令"selectc

ount(*)fromtable_a^^,最终由()处理该命令并返回结果。

A、计算层

B、客户端

C、接入层

D、逻辑层

答案:A

63.()是公司大数据应用工作的归口管理部门。

A、互联网部

B、信息化部

C、数字化工作部

D、科技信息部

答案:C

64.下列哪个不是专门用于可视化时间空间数据的技术:O。

A、等高线图

B、饼图

C、曲面图

D、矢量场图

答案:B

65.回归问题和分类问题的区别是什么?

A、回归问题与分类问题在输入属性值上要求不同

B、回归问题有标签,分类问题没有

C、回归问题输出值是连续的,分类问题输出值是离散的

D、回归问题输出值是离散的,分类问题输出值是连续的

答案:C

66.自然语言处理、语音识别'股票交易、气象预测等应用适合采用(_)处理。

A、循环神经网络

B、卷积神经网络

C、多层神经网络

D、单层神经网络

答案:A

67.用onehot对某个只有一个属性的样本进行编码,下面可能是编码结果的是()。

A、1010

B、1100

C、1111

D、1000

答案:D

68.有监督的学习和无监督的学习的根本区别在于:

A、学习过程是否需要人工干预

B、学习样本是否需要人工标记

C、学习结果是否需要人工解释

D、学习参数是否需要人工设置

答案:B

69.给定测试样本,基于某种距离度量找出训练集中与其最靠近的k个训练样本,

然后基于这k个样本的信息来进行预测。这种学习算法称为(_)。

A、k-means

B、k近邻学习

C、随机森林

D、决策树

答案:B

70.以下哪个是有关数据科学研究目的的原则?()

A、DIKUW原则

B、5W1H原则

C、6s原则

D、PDCA原则

答案:A

71.假设你有5个大小为7x7、边界值为0的卷积核,同时卷积神经网络第一层

的深度为1。此时如果你向这一层传入一个维度为224x224x3的数据,那么神经

网络下一层所接收到的数据维度是多少

A、218x218x5

B、217x217x8

G217x217x3

D、220x220x5

答案:A

72.下面哪个色彩空间最接近人的视觉系统的特点()。

A、RGB空间

B、CMY空间

GCMYK空间

DvHSI空间

答案:D

73.下列。不是神经网络的代表。

A、卷积神经网络

B、递归神经网络

C、残差网络

D、xgboost算法

答案:D

74.()可以使神经网络模型拟合复杂函数的能力增加。

A、隐藏层层数增加

B、Dropout比例增加

C、增大学习率

D、增加训练轮数

答案:A

75.()是TensorFlow的核心数据单位。

A、张量

B、向量

C、矩阵

D、数组

答案:A

76.卷积神经网络中池化层的作用是。。

A、降低卷积层对位置的敏感性,同时降低对空间降采样表示的敏感性

B、权值初始化

C、对图像实现边缘检测

D、提取输入的不同特征

答案:A

77.以下表名不符合数据中台分析层命名规范的是()。

A、dim_cst_cust_df

B、dim_cst_cust

C、dwscstcustdf

D、dwdcstcust

答案:D

78.国网公司坚持数据“一处生成、多处使用”,明确权威数据源引用规范,开

展权威数据源中台标注,推进权威数据源在中台的落地应用,常态推进()治理。

A、数据源头

B、数据中台

C、业务中台

D、数据应用

答案:A

79.相关关系是一种与函数关系区别的非确定性关系,而相关分析就是研究事物

或现象之间是否存在这种非确定性关系的统计方法,以下不属于相关性分析方法

的是()o

A、Pearson相关系数

B、Spearman秩相关系数

C\KendaII相关系数

D、傅里叶系数

答案:D

80.假设给定一个长度为n的不完整单词序列,希望预测下一个字母是什么,如

输入是predicti。(9个字母组成),希望预测第十个字母是什么。适用于解决

这个工作的是()。

A、循环神经网络

B、全连接神经网络

C、受限波尔兹曼机

D、卷积神经网络

答案:A

81.以下哪种方法可以将json字符串转换为Python形式()。

Axread_json

B、json.trans

C、json.loads

D、json.dumps

答案:C

82.下面关于循环神经网络说法错误的是()

A、循环神经网络用于静态输出

B、循环神经网络通过使用带自反馈的神经元,能够处理任意长度的时序数据

C、循环神经网络具有短期记忆能力,相当于存储装置,因此其计算能力十分强

D、循环神经网络时间扩展,神经元与多个时间输出计算

答案:A

83.预训练模型是指。。

A、先训练一个模型作为基准

B、在正式训练之前,做一次试验训练

C、已经在大数据集上训练好的一个模型

D、预先根据任务特点,对模型结构进行调整

答案:C

84.国网公司数据管理坚持()的原则。

A、面向专业

B、面向基层

C、面向应用

D、面向专业、面向基层、面向应用

答案:D

85.卷积神经网络的结构不包括()o

A、池化层

B、卷积层

C、激活层

D、全连接层

答案:C

86.混淆矩阵中的T%16,FP=12,FN=8,TN=4,准确率是()。

A、1212122023年1月4日

B、1212122023年1月2日

C、1212122023年4月7日

D、1212122023年1月7日

答案:B

87.通常“落伍者”是影响MapReduce总执行时间的主要影响因素之一,为此Ma

pReduce采用()机制来解决。

A、分布式计算

B、惰性计算

C、推测性执行的任务备份

D、先进先出

答案:C

88.长短时记忆网络属于一种()o

A、全连接神经网络

B、门控RNN

GBP神经网络

D、双向RNN

答案:B

89.k近邻学习是一种(_)。

A、监督学习方法

B、半监督学习方法

C、无监督学习方法

D、测试方法

答案:A

90.综合类大数据应用管理,主要包括(),由互联网部统一组织开展。

A、应用需求

B、分析应用

C、成果管理

D、以上都是

答案:D

91.假设你有5个大小为7x7、边界值为0的卷积核,同时卷积神经网络第一层

的深度为1。此时如果你向这一层传入一个维度为224x224x3的数据,那么神经

网络下一层所接收到的数据维度是多少()

A、218x218x5

B、217x217x8

C、217x217x3

D、220x220x5

答案:A

92.根据国家电网互联[2020]745号《国家电网有限公司关于进一步规范数据安

全工作的通知》,以下说法错误的是()o

A、商业秘密、工作秘密、个人信息等纳入负面清单的数据,由数据使用方提出

申请,经数据产生的总部业务部门和数据归口管理部门审批后方可对内跨部门、

跨单位给数据使用方使用。

B、公司对外提供数据时,应根据有关要求,执行标准统一的数据开放策略。

C、涉密数据按照公司保密规章制度执行,严格履行相关保密合规审核流程。

D、除国家机关依法调取数据外,原则上公司明细业务数据不对外提供。

答案:B

93.优化O,建立设备绩效和供应商业绩之间的关联关系,实现设备质量评价

管理闭环,建立健全供应商信用风险评估体系,优化采购模式与供应商管理。

A、设备质量监管

B、设备物资供应链

C、设备供应商管理

D、设备质量评价管理

答案:B

94.安全巡检属于信息系统安全过程管理的()阶段。

A、运行

B、测试

C、科研

D、上线

答案:A

95.如果增加神经网络的宽度,精确度会增加到一个阈值,然后开始降低。造成

这一现象的原因可能是Oo

A、只有一部分核被用于预测

B、当核数量增加,神经网络的预测能力降低

C、当核数量增加,其相关性增加,导致过拟合

D、以上都不对

答案:C

96.关于Python的全局变量和局部变量,以下选项中描述错误的是()

A、使用global保留字声明简单数据类型变量后,该变量作为全局变量使用

B、局部变量指在函数内部使用的变量,当函数退出时,变量依然存在,下次函

数调用可以继续使用

C、简单数据类型变量无论是否与全局变量重名,仅在函数内部创建和使用,函

数退出后变量被释放

D、全局变量指在函数之外定义的变量,一般没有缩进,在程序执行全过程有效

答案:B

97.基于词的n元文法模型,其最后的粗分结果集合大小ONo

A、大于

B、大于等于

G小于

D、小于等于

答案:B

98.对于依托公共服务能力平台开发的大数据应用,应遵循平台有关规范,重点

开展—、数据建模以及数据展示等工作,安全防护'三方测试等相关要求统一

纳入公共服务能力平台进行管理,可不再单独开展。

A、数据查询

B、数据清洗

C、数据分类

D、数据溯源

答案:D

99.决策树中的叶结点对应于(_)。

A、属性

B、样本

C、决策结果

D、标签值

答案:C

100.依据《国家电网有限公司数据管理办法》,建立基于负面清单的公司对内数

据共享机制,坚持“以O为原则、不共享为例外”,改变当前“一事一议”、

层层审批的数据应用授权方式。

A、共享

B、共建

C、共通

D、共赢

答案:A

101.数据安全,是指通过采取必要措施,确保数据处于有效保护和()的状态,

以及具备保障持续安全状态的能力。

A、合法利用

B、合法获取

C、规范使用

D、安全传输

答案:A

102.加强数据传输、存储过程中的安全管理,釆取加密、隔离、备份等安全技术

手段,确保符合相应安全条件或技术标准,具备O能力,防范数据泄露、篡改、

损毁、丢失风险。

A、共享

B、灾备

C、安全

D、保护

答案:B

103.神经网络训练过程中,一般会遇到停滞期,即神经网络在进入全局最小值之

前陷入局部最小值。以下哪个策略可以避免上述情况?

A、增加参数数量

B、减少参数数量

C、在开始时将学习率降低10倍

D、改变几个时期的学习率

答案:D

104.假设我们有一个使用ReLU激活函数(ReLUactivationfunction)的神经网络,

假如我们把ReLU激活替换为线性激活,那么这个神经网络能够模拟出同或函数

(XNORfunction)吗

A、可以

B、不好说

C、不一定

D、不能

答案:D

105.LSTM网络引入门控机制来控制信息传递的路径,其中输入门的作用是()

A、控制上一个时刻的内部状态需要遗忘多少信息

B、控制上一个时刻的内部状态有多少信息需要保存

C、控制当前当刻的候选状态有多少信息需要保存

D、控制当前当刻的内部状态有多少信息需要输出给外部状态

答案:C

106.下列关于深度学习中优化问题说法错误的是()。

A、当优化问题的数值解接近局部最优值时,随着目标函数解的梯度接近或变为

零,通过最终迭代获得的数值解可能仅使目标函数局部最优,而不是全局最优

B、在深度学习优化问题中,经常遇到的是梯度爆炸或梯度消失

C、优化问题中设置的学习率决定目标函数能否收敛到局部最小值,以及何时收

敛到最小值

D、一般来说,小批量随机梯度下降比随机梯度下降和梯度下降的速度慢,收敛

风险较大

答案:D

107.可视分析学是一门以可视交互为基础,综合运用O、数据挖掘和人机交互

等技术等多个学科领域的知识。

A、图像学

B、人工智能

C、分析学

D、图形学

答案:A

108.严格遵守国家法律、法规和公司相关规定,在保护国家秘密和企业秘密,且

不损害公司及客户'供应商等相关方权益的前提下,有序推动数据对外幵放,重

点防范对外幵放过程中的()数据泄露。

A、明细

B、业务

C、敏感

D\隐私

答案:C

109.电力线和信号线应分别敷设在()、()或桥架内,走线应整齐美观安全。

A、走线架

B、强电线槽,弱电线槽

C、弱电线槽,强电线槽

D、槽钢

答案:B

110.年度大数据应用需求由()重抽组织开展储备与立项工作。

A、数字化部

B、财务部

C、大数据中心

D、发展部

答案:A

111.总部与各单位按两级贯通模式部署,并支持()成果共享。

A、一级

B、两级

G三级

D、四级

答案:B

112.下面哪个属于映射数据到新的空间的方法?

A、傅立叶变换

B、特征加权

C、渐进抽样

D、维归约

答案:A

113.数据清洗的方法不包括O。

A、缺失值处理

B、噪声数据清除

C、一致性检查

D、重复数据记录处理

答案:D

114.构建()客户画像,设计全网客户标签体系,形成客户标签库,全面及时分

析客户行为活动,深度提炼客户行为特征规律,实现客户行为动态画像。

A、全量

B、多维动态

C、全方面

D、多维

答案:B

115.在lncep■tionNet中,使用()和单层的全连接层替换掉了VCG的三层全连

接层。

A、全局最大池化层

B、全局最小池化层

C、卷积层

D、全局平均池化层

答案:D

116.在线性回归中,最小二乘法就是试图找到一条直线,使所有样本到直线上的

之和最小。

A、欧式距离

B、城市距离

C、余弦距离

D、马氏距离

答案:A

117.在统计语言模型中,通常以概率的形式描述任意语句的可能性,利用最大相

似度估计进行度量,对于一些低频词,无论如何扩大训练数据,出现的频度仍然

很低,下列哪种方法可以解决这一问题

A、一元切分

B、一元文法

C、数据平滑

D、N元文法

答案:C

118.按照数据全生命周期安全合规思路,做好数据()顶层设计,统筹推进数据

合规管理体系建设,强化数据合规风险管控,促进公司数字化转型发展,为建设

具有中国特色国际领先的能源互联网企业作出积极贡献。

A、模型建设

B、安全管理

C、数据规划

D、合规管理

答案:D

119.假设已经建立了一个神经网络,决定将权重和偏差初始化为零。以下哪项陈

述是正确的?

A、第一隐藏层中的每个神经元将执行相同的计算。因此,即使在梯度下降的多

次迭代之后,层中的每个神经元将执行与其他神经元相同的计算。

B、第一隐层中的每个神经元在第一次迭代中执行相同的计算。但是在梯度下降

的一次迭代之后,他们将学会计算不同的东西,因为已经“破坏了对称性”。

C、第一个隐藏层中的每个神经元将执行相同的计算,但不同层中的神经元执行

不同的计算,因此完成了课堂上所描述的“对称性破坏”。

D、即使在第一次迭代中,第一个隐藏层的神经元也会执行不同的计算,因此,

它们的参数会以自己的方式不断演化

答案:A

120.关于pandas库的文本操作,下列说法错误的是()。

A、Replace方法用于替换字符串

B、Slice方法不是通过截取字符实现文本索引操作的

C、Upper方法可将Series各元素转换为大写

D、存在一些特殊的方法是Python原生str类型所没有的

答案:B

121.回溯“深度学习”领域的学术脉络,2017年-2020年间研究量最多的主题是

A、特征提取

B、卷积神经网络

C、人工智能

D、迁移学习

答案:B

122.从网络的原理上来看,结构最复杂的神经网络是()。

A、卷积神经网络

B、长短时记忆神经网络

C、GRU

D、BP

答案:B

123.为了提高系统性能,Spark采取“惰性计算模式”,具体为。。

A、执行Transformation操作时不会提交,只有执行Action操作时才会被提交

到集群中开始被执行

B、执行Action操作时不会提交,只有执行Transformation操作时才会被提交

到集群中开始被执行

C、只有执行完Action操作和Transformation操作时,所有操作才会被提交到

集群中开始被执行

D、执行完Action操作或Transformation操作时都不会提交到集群

答案:A

124.从内外部环境与市场需求来看,以下哪一项不是大数据应用的业务规划将聚

焦核心领域。

A、电网运营

B、经营管理

C、客户服务

D、科技创新

答案:D

125.智能电网综合支撑技术,在()的智能电网管理及运维关键技术中,应用大

数据和先进计算技术,研究电网设备状态信息集成与综合分析技术;

A、分布节能

B、高效节能

C、集约高效

D、分布高效

答案:C

126.长短时记忆神经网络被设计用来解决什么问题?()

A、传统RNN存在的梯度消失/爆炸问题

B、传统RNN计算量大的问题

C、传统RNN速度较慢的问题

D、传统RNN容易过过拟合的问题

答案:A

127.关于LDA和PCA的描述,下列说法中错误的是?

A、PCA是无监督的,LDA是有监督的

B、LDA最多可以降到k-2维

C、LDA可能会过拟合数据

D、PCA是去掉原始数据冗余的维度,LDA是选择一个最佳的投影方向,使得投影

后相同类别的数据分布紧凑,不同类别的数据尽量相互远离

答案:B

128.负责关键信息基础设施安全保护工作的部门,应当建立健全本行业、本领域

的网络安全监测预警和(),并按照规定报送网络安全监测预警信息。

A、网络安全风控机制

B、信息通报制度

C、网络安全风险库

D、信息预警制度

答案:B

129.数据中台建立数据安全传输机制,根据数据保护需求,实现两级数据中台之

间、与()之间的安全传输。

A、外部用户

B、内部用户

C、全部用户

D、指定用户

答案:A

130.a=[1,2,3.4,5],切片时如果需要取[2,3.4],则下列结果正确的是()

A、a[1:4]

B、a[-2:]

C、a[1:-1]

D、a[::2]

答案:C

131.数据中台由O、()()、()、()五大板块组成,采用总部和省市

公司两级部署模式构建。

A、贴源层、共享层、分析层、统一数据服务调度和数据

B、贴源层、应用层、分析层、统一数据服务调度和数据

C、服务层、共享层、应用层、统一数据服务调度和数据

D、服务层、共享层、分析层、统一数据服务调度和数据

答案:A

132.神经网络感知机只有()神经元进行激活函数处理,即只拥有一层功能神经元。

A、输出层

B、输入层

C、感知层

D、网络层

答案:A

133.为保障大数据应用的快速开发和敏捷迭代,按照依托()两种类型实施差异化

管控。

A、共享平台开发和独立开发

B、共享平台开发和个人开发

C、公共服务能力平台开发和独立开发

D、公共服务能力平台开发和个人开发

答案:C

134.《中华人民共和国数据安全法》中的数据,是指任何以电子或者其他方式对

()的记录。

A、数据

B、信息

C、文件

D、知识

答案:B

135.Transformer架构首先是由下列哪项引入的?

A、GloVe

B、BERT

CxOpen

D、ULMFit

答案:c

136.plt.contourf(X,Y,f(X,Y),8,aIpha=.75,cmap=p11.cm.hot),cmap表示()»

A、图例风格

B、颜色映射风格

C、网格线类型

D、透明度

答案:B

137.建立与政府主管部门、行业协会、专家学者的有效沟通机制,组织各级单位

积极参与《数据安全法》、《》等国家'地方和行业数据相关法律法规。

A、《个人信息保护法》

B、《网络安全法》

C、《保守国家秘密法》

D、《网络产品和服务安全审查办法(试行)》

答案:A

138.在Apriori算法中,候选项集划分为不同的桶,存放在()中。

A、字典

B、集合

C、Hash树

D、列表

答案:C

139.多分类图像识别任务常采用O作为输出的编码方式。

A、二进制编码

B、one-hot编码

C、霍夫曼编码

D、曼切斯特编码

答案:B

140.关于下面代码的描述,错误的是n=1deffunc(a,b):c=a*breturncs=func(He

IIo,2)print(c)

A、打印输出字符串:HeiIoHeIIo$运行结果是出错,出错类型是NameError:|运

行结果是出错,出错类型是NameError:|c是一个局部变量|n是一个全局变量

B、运行结果是出错,出错类型是NameError:

C、c是一个局部变量

D、n是一个全局变量

答案:A

141.假设有100,000张带标签的图片是使用汽车的前置摄像头拍摄的,这也是模

型训练的数据分布,如果可以从互联网上获得更大的数据集,即使互联网数据的

分布不相同,这也可能对训练有所帮助。在刚刚开始着手这个项目,要做的第一

件事是什么?假设下面的每个步骤将花费大约相等的时间(大约几天)。

A、花几天时间去获取互联网的数据,这样就能更好地了解哪些数据是可用的。

B、花几天的时间检查这些任务的人类表现,以便能够得到贝叶斯误差的准确估

计。

C、花几天的时间使用汽车前置摄像头采集更多数据,以更好地了解每单位时间

可收集多少数据。

D、花几天时间训练一个基本模型,看看它会犯什么错误

答案:D

142.数据质量的基本属性不包括()

A、正确性

B、时效性

C、一致性

D、完整性

答案:B

143.下列关于长短时神经网络的叙述错误的是()。

A、引用自循环思想

B、产生梯度长时间持续流动的路径

C、积累的时间尺度不可以因输入序列而改变

D、可应用于语音识别和机器翻译

答案:C

144.长短时记忆神经网络通过什么来缓解梯度消失问题()

A、增加网络深度

B、减少网络神经元

C、使用双向的网络结构

D、增加一个用来保存长期状态的单元

答案:D

145.创建RDS实例后,您需要设置RDS实例的白名单,以允许()设备访问该R

DS实例。

A、外部

B、内部

C、任意

D、非安全

答案:A

146.在池化中,当步长小于卷积核的大小时会称为重叠池化。与非重叠池化相比,

下面哪个不是重叠池化的优点?()

A、损失信息少

B、获得的图像特征更丰富

C、提高卷积神经网络的正确率

D、减少计算量

答案:D

147.按照《关于进一步加强公司数据安全的通知》,应严格电网省侧和经营管理

数据对外发布共享。遵循O的原则,确保生产经营数据及分析结果数据不出网

(管理信息大区和生产控制大区)、不触媒。

A、以共享为原则、不共享为例外

B、最小化授权

C、明细业务数据不出中台

D、谁主管谁负责,谁使用谁负责

答案:C

148.以下属于Python脚本程序转变为可执行程序的第三方库的是:

Axrequests

B、pyinstaIIer

Cxnumpy

D、scrapy

答案:B

149.使用copy模块深拷贝的方法为()。

A、copy()

B、deepcopy,copy()

C、copy,deepcopy()

D、deepcopy,deepcopy()

答案:c

150.考虑值集(12243324556826}的四分位数极差是。。

A、21

B、24

C、55

D、3

答案:A

151.一般将原始业务数据分为多个部分,用于构建模型的是。

A、训练集

B、测试集

C、验证集

D、全部数据

答案:A

152.多义现象可以被定义为在文本对象中一个单词或短语的多种含义共存。下列

哪一种方法可能是解决此问题的最好选择?

A、随机森林分类器

B、卷积神经网络

C、梯度爆炸

D、上述所有方法

答案:B

153.大数据应用承建单位应基于项目建设方案编制实施方案不包括

A、数据溯源

B、数据申请

C、数据需求调研

D、数据建模

答案:C

154.在情感分析任务中,其目的是将无结构化的情感文本转化成计算机容易识别

和处理的结构化文本,进而供情感分析上层的研究和应用服务的是()

A、情感信息检索

B、情感信息抽取

C、情感信息分类

D、情感信息归纳

答案:B

155.对于神经网络的说法,下面正确的是:(_)。1.增加神经网络层数,可能会增

加测试数据集的分类错误率2.减少神经网络层数,总是能减小测试数据集的分

类错误率3.增加神经网络层数,总是能减小训练数据集的分类错误率

A、1

B、1、3

C、1、2

D、2

答案:A

156.Hive的数据最终存储在()

A、HDFS

B、HBase

GRDBMS

D、Metastore

答案:A

157.通过数据资产核查及可视化的建设,可以帮助公司合理评估、规范高效的管

控公司数据資产信息,又可以挖掘和发挥数据资产价值并促进持续增值,推动公

司向()管理转型。

A、数据质量

B、数据治理

C、数据分析

D、数据驱动

答案:D

158.下列关于凝聚层次聚类技术的描述中,合适的是()。

A、抗噪声和异常值

B、MAX(全链)聚类中合并距离最远的两个簇

C、两个簇合并后,只保留一个簇

D、没有可以直接最小化的目标函数

答案:D

159.下列哪些不是目前机器学习所面临的问题是()。

A、测试集的规模

B、维度灾难

C、特征工程

D、过拟合

答案:A

160.网络运营者发布、共享'交易或向境外提供重要数据前,应当评估可能带来

的安全风险,并报经()部门同意

A、安全监察

B、上级主管

C、工业和信息化

D、行业主管监督

答案:D

161.MapReduce任务map输出结果将被写入()。

A、HDFS文件系统

B、新的记录文件

G磁盘(Linux文件系统)

D、主数据库

答案:C

162.HBase是一种可伸缩、高可靠、高性能、分布式和面向()的动态模式数据

库。

A、列

B、行

C、行和列

D、元组

答案:A

163.LSTM的3个门分别是()o

A、遗忘门、输入门、输出门

B、输入门、更新门、输出门

C、输入门、重置门、遗忘门

D、遗忘门、更新门、输出门

答案:A

164.数据中台提供统一的身份认证和操作鉴权能力,确保在数据传输、存储、访

问过程中的数据安全;提供数据访问权限控制、保护业务核心数据、防止()能

力。

A、数据泄露

B、数据错乱

C、数据分散

D、数据无效

答案:A

165.下面哪一个主流任务没有用到卷积层

A、中英文互译

B、场景文字检测

C、为图像自动生成标题

D、中文分词

答案:D

166.假如你使用YOLO算法,使用19x19格子来检测20个分类,使用5个锚框(a

nchorbox)0在训练的过程中,对于每个图像你需要输出卷积后的结果y作为神

经网络目标值(这是最后一层),y可能包括一些“?”或者“不关心的值”。

请问最后的输出维度是多少。

A、19x19x(25x20)

B、19x19x(20x25)

C、19x19x(5x25)

D、19x19x(5x20)

答案:c

167.MapReduce计算框架的输入是()数据结构。

Axkey-vaIue

B、input-output

C、map-reduce

D、key-coIumn

答案:A

168.资产评估应用实现全链路的数据资产监管和价值追踪,具体包括资产使用评

估'()评估和敏感数据评估等功能。

A、资产使用评估

B、资产价值

C、敏感数据评估

D、数据质量评估

答案:B

169.MapReduce任务map输出结果将被写入()。

A、HDFS文件系统

B、新的记录文件

C、磁盘(Linux文件系统)

D、主数据库

答案:C

170.将合规管理要求全面嵌入公司数据活动,在各领域、各环节确定合规管理重

点,覆盖O,促进公司数据活动全面合规。

A、数据生产

B、数据全生命周期

C、数据存储

D、数据销毁

答案:B

171.以下哪项工作属于数据应用优化生产运行,提升电网质效。

A、优化设备运维策略

B、优化能源配置

C、提升电网防灾抗灾能力

D、优化设备物资供应链

答案:C

172.下列关于神经网络结构的权重共享现象的描述正确的是()。

A、只有全连接神经网络会出现

B、只有卷积神经网络(CNN)会出现

C、只有循环神经网络(RNN)会出现

D、卷积神经网络和循环神经网络都会出现

答案:D

173.下列关于随机森林和GBDT的书法正确的是()

A、在随机森林的单个树中,树和树之间是有依赖的,而GBDT中的单个树之间是

没有依赖的

B、这两个模型都使用随机特征子集,来生成许多单个的树

C、我们可以并行地生成GBDT单个树,因为它们之间是没有依赖的

D、GBDT训练模型的表现总是比随机森林好

答案:B

174.公司大数据应用需求与立项管理遵循()管理规范,严格落实项目制管理要

求,主要包括需求征集、评审、储备、立项和计划编制与调整等工作。

A、大数据应用项目

B、数字化项目

C、信息化项目

D、数据研发项目

答案:B

175.健全数据合规管理体系,落实管理职责,强化横向协调和纵向指导,突出事

前防范和过程管控,加强违规事件应对处置,严格管控()。

A、数据安全风险

B、信息安全风险

C、数据合规风险

D、数据泄露风险

答案:C

176.每?个神经元都有输入、处理函数和输出。神经元组合起来形成了网络,可

以拟合任何函数。为了得到最佳的神经网络,我们用梯度下降方法不断更新模型

给定上述关于神经网络的描述,什么情况下神经网络模型被称为深度学习模型?

A、力口?更多层,使神经网络的深度增加

B、有维度更高的数据

C、当这是一个图形识别的问题时

D、以上都不正确

答案:A

177.ODPS-SQL进行操作连接表的关键字错误的是()

A、Ieft

B、right

Cxouter

D、inner

答案:C

178.下列描述中不属于数据治理内容的是()

A、理解自己的数据

B、行为规范的制定

C、岗位职责的定义

D、获得更多的数据

答案:D

179.下列哪项关于模型能力(modelcapacity指神经网络模型能拟合复杂函数的

能力)的描述是正确的()

A、隐藏层层数增加,模型能力增加

B、Dropout的比例增加,模型能力增加

C、学习率增加,模型能力增加

D、都不正确

答案:A

180.MapReduce的Shuffle过程中哪个操作是最后做的()

A、溢写

B、分区

C、排序

D、合并

答案:D

181.公司在我国境内收集和产生的个人信息和重要数据应当在O存储。

A、境内

B、境外

C、私有玄

D、公共云

答案:A

182.数据需求部门向科信部确认数据的开放权限,需要详细说明所开放的数据名

称、数据()、数据提供系统、需求部门'提供方式、数据的定义'统计口径以

及共享范围和开放权限等。

A、权限

B、范围

C、内容

D、类型

答案:C

183.对于一个分类任务,如果开始时神经网络的权重不是随机赋值的,而是都设

成0,下面哪个叙述是正确的?

A、神经网络不会开始训练,因为没有梯度改变

B、没有问题,神经网络会正常开始训练

C、神经网络可以训练,但是所有的神经元最后都会变成识别同样的东西

D、其他选项都不对

答案:C

184.BP神经网络具有很的表示能力,它经常遭遇(),其训练误差持续降低,

但测试误差却可能上升。

A、欠拟合

B、误差过大

C、误差过小

D、过拟合

答案:D

185.如果训练一个RNN网络时发现权重与激活值都是NaN,则导致这个问题最有

可能的原因是()。

A、梯度消失

B、梯度爆炸

C、ReLU

D、Sigmoid

答案:B

186.大数据应用管理包括大数据应用()等全生命周期管理及大数据应用能力建

设。

A、需求立项、开发实施、发布应用、经营管理

B、需求立项、开发实施、发布应用、成果评价

C、需求立项、发布应用、经营管理、成果评价

D、需求立项、开发实施、经营管理、成果评价

答案:B

187.下面算法属于局部处理的是O。

A、灰度线性变换

B、二值化

C、傅里叶变换

D、中值滤波

答案:D

188.大数据应用需求分为()需求和即时需求两类。

A、年度

B、半年度

C、季度

D、月度

答案:A

189.假设输入是一个300X300的彩色(RGB)图像,而没有使用卷积神经网络。

如果第一个隐藏层有100个神经元,每个神经元与输入层进行全连接,那么这个

隐藏层有多少个参数(包括偏置参数)?

A、9,000,001

B、9,000,100

C、27,000,001

D、27,000,100

答案:D

190.考虑下面的3项频繁集的集合:{1,2,3},{1,2,4},{1,2,5},{1,3,

4},{1,3,5},{2,3,4},{2,3,5},{3,4,5}假定数据集中只有5个项,

采用合并策略,由候选产生过程得到4项集不包含()

A、1,2,3,4

B、1,2,3,5

C、1,2,4,5

D、1,3,4,5

答案:c

191.单个神经元模型不能解决()。

A、线性二分类

B、XOR问题

C、线性二判别

D、以上都不是

答案:B

192.()负责数据合规归口管理,负责数据合规技术审查,持续提升数据合规管

理水平。

A、互联网部

B、信通公司

C、办公室

D、安监部

答案:A

193.下列关于算法进化的描述错误的是()o

A、算法1.0的典型算法是精度分析,是实验分析技术的核心

B、算法2.0的典型算法是线性回归,是问卷领域数据分析的核心

C、算法3.0的典型算法是数据挖掘类方法,是数据库领域的核心

D、算法4.0的典型算法是DM类算法,时超大数据分析的基础

答案:A

194.《国家电网有限公司数据共享负面清单管理细则》自()起施行。

A、2020年3月30日

B、2021年3月30日

C、2020年6月30日

D、2021年6月30日

答案:B

195.对于依托公共服务能力平台开发的大数据应用,应遵循平台有关规范,重点

开展数据溯源、数据建模以及数据展示等工作,安全防护、三方测试等相关要求

统一纳入()进行管理,可不再单独开展。

A、数据中台

B、大数据应用建设平台

C、公共服务能力平台

D、人工智能平台

答案:C

196.RNN不同于其它神经网络的地方在于()o

A、实现了记忆功能

B、速度快

C、精度高

D、易于搭建

答案:A

197.Project被设置了“保护模式”以后,以下()说法是正确。

A、所有人都无法访问该Project中的数据

B、只有管理员可以访问该Project中的数据

C、用户可以在本Project中访问数据,但是不能将数据导出到外部。

D、以上全部

答案:C

198.下列关于线性回归分析中的残差说法正确的是()。

A、残差均值总是为零

B、残差均值总是约等于零

C、残差均值总是大于零

D、以上答案都不正确

答案:A

199.在一个神经网络中,知道每一个神经元的权重和偏差是最重要的一步。如果

知道了神经元准确的权重和偏差,便可以近似任何函数,但怎么获知每个神经的

权重和偏移呢?

A、搜索每个可能的权重和偏差组合,直到得到最佳值

B、赋予一个初始值,然后检查跟最佳值的差值,不断迭代调整权重

C、随机赋值,听天由命

D、以上都不正确的

答案:B

200.下列不是NoSQL数据库的是。

A、MongoD

B\BigTabIe

C、HBase

D、Access

答案:D

201.大数据的4V特性中,哪一个是错误的:()o

A、数据量大

B、价值密度高

C、增长快

D、维度高

答案:B

202.以下不符合大数据问题处理范畴的是

A、1TB数据,秒级提交结果

B、1TB数据,分钟级提交结果

C、1TB数据,半小时内提交结果

D、1TB数据,一天内提交结果

答案:D

203.关于机器学习模型训练步骤的说法,错误的是()。

A、测试集能够测试模型对于未知数据的拟合效果

B、验证集能够用于防止模型过拟合

C、划分数据集时需要注意数据是否为同分布

D、模型训练需要准备多个备选算法用于效果比较

答案:B

204.参考公司()按域进行数据分类。

A、维度模型

B、公共数据模型(SG-CIM)

C、通用数据模型

D、业务分类

答案:B

205.{'name':'john',code':6734,dept':'sales'}这种类型数据属于。

A、列表

B、元组

G集合

D、字典

答案:D

206.列表中可以放()个字符串

A、1

B、255

C、无限个

D、由用户自己定义

答案:C

207.关键信息基础设施的运营者采购网络产品和服务,应当按照规定与提供者签

订(),明确安全和保密义务与责任。

A、合作协议

B、安全保密协议

C、安全补充条款

D、保密涵

答案:B

208.当不知道数据所带标签时,可以使用哪种技术促使带同类标签的数据与带其

他标签的数据相分离?

A、分类

B、聚类

C、关联分析

D、隐马尔可夫链

答案:B

209.假设文件不存在,如果使用。pen方法打开文件会报错,那么该文件的打开

方式是下列哪种模式Oo

A、r

B、w

C\a

D、b

答案:A

210.若a=np.array([5,1,2,3]),a.sort(),则数组a的结果是()o

A、[5,1,2,3];

B、[1,2,3,5];

G[3,2,1,51;

D、11;

答案:B

211.结构化数组不能使用以下哪种数据类型创建()o

A、元组列表

B、字符串

C、字典

D、整数

答案:D

212.DAGScheduler的作用是什么()

A、负责分配任务;

B、负责调度Worker的运行;

C、负责创建执行计划;

D、负责清理执行完毕的任务;

答案:C

213.数据传输环节,在互联网大区传输重要数据时应()。采用公司统一密码基

础设施签发的密钥或证书,实现企业重要数据的加密传输。

A、安全保密

B、适时销毁

C、加密保护

D、内网存储

答案:C

214.常用的图像特征不包括

A、颜色特征

B、形状特征

G纹理特征

D、像素特征

答案:D

215.大数据计算服务(Maxpute,原ODPS)tunne丨命令?供了丰富的参数,可以

通过参数设置,对上传或者下载操作进行控制,现在有一个大文件要上传至。dp

s某表中,想先检查一下该文件内容是否和表的定义匹配,并不实际上传,以免

文件中有错误记录会导致上传出错。可以使用哪个参数实现这个功能?

A、错误记录丢弃:-dbr

B、字段分隔符:一千

G扫瞄选项:-s

D、空字符串显示:-ni

答案:C

216.机房照明一般要求有()

A、正常照明

B、保证照明

C、事故照明

D、以上都是

答案:D

217.下列代码:deffoo():print(starting...)whiIeTrue:res=yieId4print(re

s:,res)foo()返回的是

A、res

B、4

C、starting...

D、以上都不对

答案:D

218.构建多维动态客户画像,设计全网客户标签体系,形成O,全面及时分析

客户行为活动,深度提炼客户行为特征规律,实现客户行为动态画像。

A、客户标签库

B、客户画像

C、客户行为库

D、用户画像

答案:A

219.向量空间模型的缺陷不包括()。

A、维度灾难

B、模型稀疏性

C、语义信息缺失

D、无法计算文本相似度

答案:D

220.批规范化(BatchNormalization)的好处都有()?

A、让每一层的输入的范围都大致固定

B、它将权重的归一化平均值和标准差

C、它是一种非常有效的反向传播(BP)方法

D、这些均不

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论