2023年能源大数据应用开发技能竞赛理论练习测试卷_第1页
2023年能源大数据应用开发技能竞赛理论练习测试卷_第2页
2023年能源大数据应用开发技能竞赛理论练习测试卷_第3页
2023年能源大数据应用开发技能竞赛理论练习测试卷_第4页
2023年能源大数据应用开发技能竞赛理论练习测试卷_第5页
已阅读5页,还剩54页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第页2023年能源大数据应用开发技能竞赛理论练习测试卷1.在InceptionNet中,使用()和单层的全连接层替换掉了VCG的三层全连接层。A、全局最大池化层B、全局最小池化层C、卷积层D、全局平均池化层【正确答案】:D2.以下内容符合物体识别任务的是()。A、不能对图像进行压缩或剪裁B、遵守误差最小准则和最佳近似准则C、可以不指定分类的类别数量D、事先给定样本的分布特征【正确答案】:B解析:

遵守误差最小准则和最佳近似准则为实现物体识别任务的最优化准则3.常见的核函数主要包括。()A、多项式核B、高斯核C、线性核D、以上全部【正确答案】:D4.下列关于Python第三方库的安装方法说法错误的是()。A、使用集成安装工具B、使用pip命令C、访问UCI网站下载安装文件D、联系第三方库作者索要安装文件【正确答案】:D5.高斯核也称为()。A、多项式核B、拉普拉斯核C、RBF核D、Sigmoid核【正确答案】:C6.公司内部共享数据时,应遵照()开展。原则上除列入负面清单的数据外,其余数据均可在公司内部共享。A、数据共享负面清单B、数据业务管理C、运维职责划分D、使用单位【正确答案】:A7.按照共享能力中心设计原则,不包括()。A、独立性B、高内聚C、完整性D、强拆分【正确答案】:A8.下列属于无监督学习的是()。A、K-meansB、SVMC、最大熵D、CRF【正确答案】:A9.a=[[1,2,3],(4,5,6),7,8,9],请问a[1]是哪种数据类型?A、字符串B、列表C、集合D、元组【正确答案】:D10.某公司要建立资料库,该资料库要用ElasticSearch进行检索,请问下列哪些选项可以放到资料库中?A、Word文档B、公司宣传视频C、产品设计图D、以上全部正确【正确答案】:D11.下列描述中不属于数据治理内容的是()A、理解自己的数据B、行为规范的制定C、岗位职责的定义D、获得更多的数据【正确答案】:D12.倒传递神经网络(BP神经网络)的训练顺序为何?(A:调整权重;B:计算误差值;C:利用随机的权重产生输出的结果)A、BCB、CAC、BAD、CBA【正确答案】:D13.大数据应用的业务规划将聚焦核心领域,打造共()大重点业务、12个业务领域、34项业务方向。A、4B、5C、6D、7【正确答案】:B14.国网数据中台,是在下面()阶段的基础上发展过来的。A、营销服务中心B、全业务统一数据中心C、海量历史/实时数据中心D、电网GIS数据中心【正确答案】:B15.以下哪一个不是LSTM三个门中的一个门()A、输入门B、遗忘门C、输出门D、迭代门【正确答案】:D16.长短时记忆网络属于一种()。A、全连接神经网络B、门控RNNC、BP神经网络D、双向RNN【正确答案】:B17.以下扫描算子中用于对列存表进行扫描的算子是:()。A、SeqScanB、CstoreScanC、SubqueryScanD、ValuesScan【正确答案】:B18.下面算法中属于图像锐化处理的是()。A、低通滤波B、加权平均法C、高通滤波D、中值滤波【正确答案】:C19.大数据计算服务(MaxCompute,原ODPS)tunnel命令?供了丰富的参数,可以通过参数设置,对上传或者下载操作进行控制,现在有一个大文件要上传至odps某表中,想先检查一下该文件内容是否和表的定义匹配,并不实际上传,以免文件中有错误记录会导致上传出错。可以使用哪个参数实现这个功能?A、错误记录丢弃:-dbrB、字段分隔符:-fC、扫瞄选项:-sD、空字符串显示:-ni【正确答案】:C20.一般将原始业务数据分为多个部分,用于构建模型的是()A、训练集B、测试集C、验证集D、全部数据【正确答案】:A21.各地区、各部门应当按照数据()保护制度,确定本地区、本部门以及相关行业、领域的重要数据具体目录,对列入目录的数据进行重点保护。A、分类分级B、分级分域C、分层分级D、分类分域【正确答案】:A解析:

《中华人民共和国数据安全法》第二十一条:各地区、各部门应当按照数据分类分级保护制度,确定本地区、本部门以及相关行业、领域的重要数据具体目录,对列入目录的数据进行重点保护。22.大数据应用应严格遵守国家数据安全相关法律法规和公司数据安全相关规定,严格保护国家秘密、公司商业秘密、个人信息安全,严格执行()等环节安全管理要求,确保大数据应用工作安全合规。A、数据获取、数据拷贝、数据储存、数据使用、数据共享、数据销毁B、数据获取、数据清洗、数据储存、数据使用、数据共享、数据销毁C、数据获取、数据传输、数据储存、数据使用、数据共享、数据销毁D、数据获取、数据传输、数据储存、数据使用、数据共享【正确答案】:C23.下列哪项所描述的相关技术是错误的?AdaGrad使用的是一阶差分(firstorderdifferentiation)B、L-BFGS使用的是二阶差分(secondorderdifferentiation)C、AdaGrad使用的是二阶差分(secondorderdifferentiation)D、以上都不是【正确答案】:C解析:

AdaGrad是梯度下降法,用的是一阶导数信息,L-BFGS是拟牛顿法,用到了二阶导数信息24.以下哪项工作属于数据应用优化生产运行,提升电网质效。A、优化设备运维策略B、优化能源配置C、提升电网防灾抗灾能力D、优化设备物资供应链【正确答案】:C25.以下不属于神经网络模型的是()A、DNNB、CNNC、KNND、RNN【正确答案】:C解析:

神经网络的具体形式:卷积神经网络模型(CNN)、网络森林(KNN)、循环神经网络模型(RNN)26.CNN中用来完成分类的是()A、卷积层B、池化层C、全连接层D、激活层【正确答案】:C27.以下关于字典类型的描述,正确的是()A、字典类型的值可以是任意数据类型的对象B、字典类型可迭代,即字典的值不可以是字典类型的对象C、表达式D、字典类型的键可以是列表和其他数据类型【正确答案】:A28.pandas的常用类不包括()。A、SeriesB、DataFrameC、PanelD、Index【正确答案】:C29.按照《关于进一步加强公司数据安全的通知》,应严格电网省侧和经营管理数据对外发布共享。遵循()的原则,确保生产经营数据及分析结果数据不出网(管理信息大区和生产控制大区)、不触媒。A、以共享为原则、不共享为例外B、最小化授权C、明细业务数据不出中台D、谁主管谁负责,谁使用谁负责【正确答案】:C30.()负责HDFS数据存储。A、NameNodeB、JobTrackerC、DataNodeD、SecondaryNameNode【正确答案】:C31.Ndarray是一个通用的()数据容器A、单维同类B、单维多类C、多维同类D、多维多类【正确答案】:C32.对参数进行L2正则,是机器学习常用的防止过拟合的方法。请问对参数做L2正则,下列()是对参数本身做先验分布假设。A、高斯分布B、拉普拉斯分布C、泊松分布D、均匀分布【正确答案】:A33.以下程序的输出结果是:x=['90','87','90']n=90print(x.count(n))A、NoneB、1C、2D、0【正确答案】:D34.卷积核大小是4*4,则其步长不能是()。A、0B、1C、2D、3【正确答案】:A35.E.A.Feigenbaum等人在著名的《人工智能手册》(第三卷,把机器学习划分为:机械学习、示教学习、类比学习和____。A、符号主义学习B、监督学习C、无监督学习D、归纳学习【正确答案】:D36.以下选项,不属于程序流程图基本元素的是()A、循环框B、起始框C、判断框D、连接点【正确答案】:A37.Hadoop是一个开发和运行处理大规模数据的软件平台,是Appach的一个用()语言实现开源软件框架。A、javaB、C++C、R语言D、以上都不是【正确答案】:A38.在《国家电网公司“十三五”科技战略研究报告》中指出,十二五期间“先进计算与电力大数据技术取得良好开端”,主要体现在:在()及专业应用实现基础上,探索了大数据平台基础体系架构与应用规范A、技术中台B、公司一体化信息平台C、公司统一管理平台D、数据中台【正确答案】:B39.各级()是本单位信息系统运行风险预警的管理部门,负责建立本单位信息系统运行风险预警管控机制负责与本单位业务应用部门的横向协调负责本单位信息系统运行风险预警管控工作的全过程监督、检查、评价。A、信息通信调度B、信通公司C、信息通信职能管理部门D、国网信通部【正确答案】:C40.EDA方法与传统统计学中的验证性分析方法的主要区别在于()①EDA不需要事先假设,而验证性分析需要事先提出假设;②EDA需要事先假设,而验证性分析不需要事先提出假设;③EDA中采用的方法往往比验证性分析复杂;④EDA中采用的方法往往比验证性分析简单;⑤在一般数据科学项目中,探索性分析在先,而验证性分析在后A、①③⑤B、②③⑤C、①④⑤D、②④⑤【正确答案】:C41.卷积神经网络的第一层中有10个卷积核,每个卷积核尺寸为5*5,步长为1,不补零,该层的输入图片的维度是224x224x3,那么该层输出的维度是()A、220x220x10B、220x220x5C、224x224x10D、224x224x5【正确答案】:A42.以()为导向,发挥电力数据覆盖广优势,提供智能、精准、高效、便捷的公共服务。A、民生需求B、社会发展C、公共需求D、经济发展【正确答案】:A43.如何交换二维Numpy数组中的两列()。在数组arr中交换列1和2。arr=np.arange(9).reshape(3,3)A、arr[:,[1,0,2]]B、arr[:,[1,0,3]]C、arr[:,[1,0,1]]D、arr[:,[1,0]]【正确答案】:A44.以下()不属于开源数据湖解决方案。A、DLIB、IcebergC、HudiD、Open【正确答案】:A45.相关分析与回归分析的一个重要区别是()A、前者研究变量之间关系的密切程度,后者研究变量间的变动关系,并用方程式表示B、前者研究变量之间的变动关系,后者研究变量间关系的密切程度C、两者都研究变量间的变动关系D、两者都不研究变量间的变动关系【正确答案】:A46.大数据和算法关系以下描述正确的是:A、数据跟算法没有关系B、算法比数据更重要C、数据比算法更重要D、没有数据的算法没有意义,失去了算法的数据无法应用【正确答案】:D47.数据活动涉及公司商业秘密、工作秘密的,应该严格执行《国家电网有限公司保密工作管理办法》等有关规定,按照()实行分类管理。A、工作需要B、涉密程度C、归口部门D、数据类型【正确答案】:B48.根据数据质量核查和治理情况,互联网部对数据质量问题发生数、()、整改完成率等进行评估和通报,促进公司整体数据质量水平提升。A、整改量B、整改及时率C、问题频率D、问题整改情况【正确答案】:B49.以下哪些CNN模型不是在imagenet比赛中兴起的?AlexNetB、VGG19C、ResNetD、Mask-RCNN【正确答案】:D50.公司大数据应用需求与立项管理遵循()管理规范,严格落实项目制管理要求,主要包括需求征集、评审、储备、立项和计划编制与调整等工作。A、技术服务项目B、科技项目C、信息化项目D、数字化项目【正确答案】:D51.通过SQL,您如何根据“FirstName”列降序地从“Persons”表返回所有记录?A、SELECT*FROMPersonsSORT'FirstName'DESCB、SELECT*FROMPersonsORDERBYFirstNameDESCC、SELECT*FROMPersonsORDERFirstNameDESCD、SELECT*FROMPersonsSORTBY'FirstName'DESC【正确答案】:B解析:

SELECT*FROMPersonsORDERBYFirstNameDESC升序位ASC默认降序52.下列关于hive说法正确的是()A、一种数据仓库工具B、一种数据处理工具C、一种可视化工具D、一种分析算法【正确答案】:A53.大数据应用需求分为()需求和即时需求两类。A、年度B、半年度C、季度D、月度【正确答案】:A54.可是分析学是一门以可视交互为基础,综合运用()、数据挖掘和人机交互等技术等多个学科领域的知识。A、图像学B、人工智能C、分析学D、图形学【正确答案】:D解析:

可视分析学被定义为一门由可视交互界面为基础的分析推理科学。它综合了图形学、数据挖掘和人机交互等技术55.在一个神经网络中,知道每一个神经元的权重和偏差是最重要的一步。如果知道了神经元准确的权重和偏差,便可以近似任何函数,但怎么获知每个神经的权重和偏移呢?A、搜索每个可能的权重和偏差组合,直到得到最佳值B、赋予一个初始值,然后检查跟最佳值的差值,不断迭代调整权重C、随机赋值,听天由命D、以上都不正确的【正确答案】:B56.当决策树很小时,训练和检验误差都很大,这种情况称作(___)。A、模型拟合不足B、模型过拟合C、泛化能力好D、模型拟合适当【正确答案】:A57.聚焦()经济发展新趋势,坚持维护数据安全合规和促进数据开发利用并重,持续优化数据合规管理机制与策略,支撑、赋能公司高质量发展。A、新能源B、社会科技C、信息技术D、能源数字【正确答案】:D58.Maxcompute执行某个SQL时返回信息中包括“J3_1_2_Stg1”,以下说法中正确的是:()。A、当前Task(ID为3)依赖于ID为1的任务,该Task的Workercount为2B、当前Task(ID为3)依赖于ID为1的任务,同时触发ID为2的任务C、当前Task(ID为3)有2个Reducer,1个mapperD、当前Task(ID为3)依赖于ID为1和ID为2的两个Task【正确答案】:D59.从电网科技发展战略和国家科技发展战略结合、推进基础支撑技术与电网发展的全面融合的角度来看,国家电网公司提出“需要利用先进计算与()成果,探索先进计算体系及高性能计算技术,研究电力大数据分析挖掘算法、优化策略和可视化展现技术,以及电力大数据仿真、测试与评价技术;开展面向智能电网的各业务领域大数据典型应用。”A、新能源技术B、电网安全与控制技术C、大数据技术D、重点跨领域技术【正确答案】:C60.下列说法错误的是()A、当目标函数是凸函数时,梯度下降算法的解一般就是全局最优解B、进行PCA降维时,需要计算协方差矩C、沿负梯度的方向一定是最优的方向D、利用拉格朗日函数能解带约束的优化问题【正确答案】:C61.构建从公司总部到各级单位协调一致、符合实际的合规管理架构,确保数据在各层级、各单位、各板块之间合法合规流转,推动()共享应用。A、数据融合B、数据治理C、数据统计D、数据维护【正确答案】:A62.[i**iforiinrange(3)]运行结果是()。A、[1,1,4]B、[0,1,4]C、[1,2,3]D、(0,1,4)【正确答案】:A63.赋能基层智慧作业,实现任务的智能推送和流程的自动接续,实现管理审批环节的线上自动处理,推动基层业务()。A、高效化B、放管服C、智慧作业D、自动化【正确答案】:B64.考虑值集{1、2、3、4、5、90},其截断均值(p=20%)是()A、2B、3C、3.5D、5【正确答案】:C65.银行进行户购买力分析,首先获取户历史账年,确定其中各项南品的计算权重,得出每位客户的购买力评分并存储记录,最后将结果以图表显示。请问该过程对应于以下哪个项目数据流程设计。A、数据源-》数据处理-》数据落地-》数据可视化B、数据可视化-》数据源-》数据处理-》数据落地C、数据可视化--》数据源-》数据落地--》数据处理D、数据源--》数据落地-》数据处理-》数据可视化【正确答案】:A66.以下数据业务图谱实体中,()是数据实体。A、设备专业B、配电管理C、隐患管理D、隐患记录【正确答案】:D67.以下哪种参数是用*来接收,不是必传的?A、位置参数B、默认值参数C、可变参数D、关键字参数【正确答案】:C解析:

函数中定义四种参数的顺序:位置参数、默认参数,可变参数、关键字参数。1.位置参数:位置参数是按照参数的位置来进行传参,A就是位置参数,位置参数是必传的。位置参数调用时也可以通过指定名字调用,例如A=lily。2.默认参数:默认参数是在定义形参的时候,给函数默认赋一个值,B就是默认参数。以后在调用的时候若是没传入这个参数,它就使用默认的值,若是给默认参数传值的话,它就会使用传入的值。默认值参数必须放在位置参数后面定义。默认参数是非必传的,3.可变参数:可变参数也叫参数组,非必传,是用*来接收的它不限时参数的个数,传几个都可以,会把参数放到一个元祖里。4.关键字参数:关键字参数是用**来接收的,非必传,同样不限参数的个数,调用的时候必须使用关键字传参,否则会报错。68.以下关于组合数据类型的描述,错误的是()A、字典类型的键可以用的数据类型包括字符串,元组以及列表B、集合类型是一种具体的数据类型C、序列l类型和映射类型都是一类数据类型的总称D、python的集合类型跟数学中的集合概念一致,都是多个数据项的无序组【正确答案】:A69.训练一个RNN网络,如果权重与激活值都是,下列选项中,哪一个是导致这个问题的最有可能的原因()A、梯度消失B、梯度爆炸C、ReLU函数作为激活函数g(.),在计算g(z)时,z的数值过大了D、Sigmoid函数作为激活函数g(.),在计算g(z)时,z的数值过大了【正确答案】:B70.依据《国家电网有限公司数据管理办法》,建立基于负面清单的公司()机制,坚持“以共享为原则、不共享为例外”,改变当前“一事一议”、层层审批的数据应用授权方式。A、对外数据共享B、对内数据共享C、对外数据交换D、对内数据使用【正确答案】:B71.时间序列数据更适合用()做数据规约。A、小波变换B、主成分分析C、决策树D、直方图【正确答案】:A72.相关关系是一种与函数关系区别的非确定性关系,而相关分析就是研究事物或现象之间是否存在这种非确定性关系的统计方法,以下不属于相关性分析方法的是()。A、Pearson相关系数B、Spearman秩相关系数C、Kendall相关系数D、傅里叶系数【正确答案】:D解析:

傅里叶分析Fourieranalysis分析学中18世纪逐渐形成的一个重要分支,主要研究函数的傅里叶变换及其性质。又称调和分析。73.一个卷积层的卷积核大小为5×5,padding为2,stride为1,输出通道为3,没有偏置,对于3×10×10(C×H×W)的输入,其计算量和参数量为()A、22500;225B、7500;75C、2500;25D、27500;275【正确答案】:A74.例句1:JanewantstogotoShenzhen.例句2:BobwantstogotoShanghai.构建词袋模型形成的是(),例句1,2对应的向量为()。A、[Jane,wants,to,go,Shenzhen,Bob,Shanghai],[1,1,2,1,1,0,0],[0,1,2,1,0,1,1]B、[Jane,wants,to,go,Shenzhen],[1,1,1,1,1],[0,1,1,1,1]C、[Jane,wants,to,go,Shenzhen,Bob,Shanghai],[1,1,1,1,1,0,0],[0,1,1,1,0,1,1]D、[bob,wants,to,go,Shenzhen],[0,1,1,1,1],[1,1,1,1,1]【正确答案】:A75.国网公司数据管理以数据资产()为目标。A、易懂B、易取C、易用D、易懂、易取、易用【正确答案】:D76.下列关于机器学习的特征工程步骤的说法,错误的是()。A、数据标准化将具有量纲差异的数据缩小至一个更小的区间内B、数据离散化最终将连续型数据转化为离散型数据C、特征选择仅考虑特征的重要性D、特征构造基于原始数据既有的特征构造新的特征【正确答案】:C77.Python语言采用严格的“缩进”来表明程序的格式框架。下列缩进格式描述不正确的是()。A、缩进指在代码行前面添加空格或TabB、在Python程序中,缩进不是任意的C、缩进可以使程序更有层次感、更有结构感,从而是程序更易读。D、平级的语句行(代码块)的缩进可以不相同。【正确答案】:D78.当总体为正态总体,方差已知,样本量为40,此时进行均值检验,应采用()统计量进行检验。A、卡方检验B、t检验C、F检验D、Z检验【正确答案】:D79.关于DataFrame与RDD在结构上的区别,以下描述错误的是()A、DataFrame可以看作是分布式的Row对象的集合,在二维表数据集的每一列都带有名称和类型。B、RDD是分布式的Java对象的集合C、RDD在转换数据形式时效率相对较高DataFrame提供了比RDD更丰富的算子【正确答案】:C解析:

DataFrame除了提供了比RDD更丰富的算子以外,更重要的特点是提高执行效率、减少数据读取以及执行计划的优化,80.Hadoop中combiner函数的功能是()A、数据排序B、数据标记C、数据分析D、数据合并【正确答案】:D81.np.dot([[1,2,3],[1,2,3],[1,2,3]],[[2,1,1],[2,1,1],[2,1,1]])的结果是()。A、[[1266][1266][1266]]B、[[223][223][223]]C、[[123][123][123]]D、[[211][211][211]]【正确答案】:A82.CNN中池化层所起的作用是()。A、识别图像中的子模式B、识别图像中位于不同位置的模式C、提高图像采样率D、获取图像的恒定表征【正确答案】:D解析:

池化层的作用是(1)对感受域内的特征进行选择,提取区域内最具代表性的特征,能够有效地减少输出特征数量,进而减少模型参数量。(2)加强图像特征的不变性,使之增加图像的偏移、旋转等方面的鲁棒性。83.大数据的最显著特征是()。A、数据规模大B、数据类型多样C、数据处理速度快D、数据价值密度高【正确答案】:A84.以下哪种卷积神经网络的设计引入了残差网络结构()A、LeNetB、AlexNetC、GoogLeNetD、ResNets【正确答案】:D85.人工智能平台总体架构由()组成A、平台层B、应用层C、服务层D、全部【正确答案】:D86.(假设precision=TP/(TP+FP),recall=TP/(TP+FN))在二分类问题中,当测试集的正例和负例数量不均衡时,以下评价方案哪个是相对不合理的()。Accuracy:(TPTN)/allB、F-value:2*recall*precision/(recallprecision)C、G-mean:sqrt(precision*recall)D、AUC:曲线下面积【正确答案】:A87.下列关于RBM说法错误的是(__)。A、学习过程很快B、RBM训练可以看作对一个深层BP网络的网络权值参数的初始化C、RBM不用人工选择特征D、RBM有标签样本集【正确答案】:A88.()不仅可用于多层前馈神经网络,还可用于其他类型的神经网络。A、感知机B、神经元C、神经系统D、误差逆传播【正确答案】:D解析:

“误差逆传播算法(backpropagationBP算法)是迄今最成功的的神经网络算法。显示任务中使用神经网络时,大多是在使用BP算法进行训练。不仅适用于多层前馈神经网络,还可以用于其他类型的神经网络,训练递归。”89.做好数据识别和分类分级,通过数据盘点理清数据状况,建立数据目录,以数据目录为基础梳理形成()A、数据共享负面清单B、大数据清单C、数据目录清单D、数据集成清单【正确答案】:A90.面向政府机构或非营利性组织等,从服务中央决策部署落地实施、社会治理现代化等方面,提供的公益性数据服务为()。A、政府监管类B、公益服务类C、商务增值类D、公共开放类【正确答案】:B91.输入图片大?为200×200,依次经过一层卷积(kernelsize5×5,padding1,stride2),pooling(kernelsize3×3,padding0,stride1),又一层卷积(kernelsize3×3,padding1,stride1)之后,输出特征图大小为()。A、95B、96C、97D、98【正确答案】:C92.()是空语句,一般用做占位语句,不做任何事情。A、breakB、passC、continueD、print【正确答案】:B93.已知:(1)大脑是有很多个叫做神经元的东西构成,神经网络是对大脑的简单的数学表达。(2)每一个神经元都有输入、处理函数和输出。(3)神经元组合起来形成了网络,可以拟合任何函数。(4)为了得到最佳的神经网络,我们用梯度下降方法不断更新模型。给定上述关于神经网络的描述,什么情况下神经网络模型被称为深度学习模型?A、加入更多层,使神经网络的深度增加B、有维度更高的数据C、当这是一个图形识别的问题时D、以上都不正确【正确答案】:A94.有关Hadoop的陈述哪个是错误的()。A、它运行在通用硬件上;B、它是Apache软件基金会(ASF)下的项目C、hadoop对数据的处理是有延迟的D、它是最好的实时流式数据处理框架E、Hadoop对数据的处理是有延迟的;【正确答案】:D95.()用于将非线性引入神经网络,它会将值缩小到较小的范围内。A、损失函数B、优化函数C、激活函数D、目标函数【正确答案】:C96.循环神经网络适合处理的数据为?A、节点数据B、序列数据C、结构化数据D、图像数据【正确答案】:B97.在聚类分析任务中,簇内相似度()且簇间相似度()时,聚类效果比较好。A、低,低B、低,高C、高,低D、高,高【正确答案】:C98.下列哪个不属于个人信息影响评估原则()。A、个人信息的处理目的、处理方式等是否合法、正当、必要B、对个人的影响及风险程度C、谁主管谁负责D、所采取的安全保护措施是否合法、有效并与风险程度相适应【正确答案】:C99.对于神经网络的说法,下面正确的是:(__)。1.增加神经网络层数,可能会增加测试数据集的分类错误率2.减少神经网络层数,总是能减小测试数据集的分类错误率3.增加神经网络层数,总是能减小训练数据集的分类错误率A、1B、1、3C、1、2D、2【正确答案】:A100.重要数据的处理者应当按照规定对其数据处理活动定期开展风险评估,并向有关主管部门报送()。A、风险评估报告B、数据安全风险清单C、应急补救措施D、风险报告单【正确答案】:A解析:

《中华人民共和国数据安全法》第三十条:重要数据的处理者应当按照规定对其数据处理活动定期开展风险评估,并向有关主管部门报送风险评估报告。风险评估报告应当包括处理的重要数据的种类、数量,开展数据处理活动的情况,面临的数据安全风险及其应对措施等。1.秉持()等数字化转型理念,企业中台已成为助力数字化转型的重要抓手,为企业创新注入强大动能。A、数据驱动B、数据创新C、集成创新D、合作共赢【正确答案】:ACD2.根据训练数据是否拥有标记信息,学习任务可大致分为(___)和(___)。A、监督学习B、训练集C、无监督学习D、测试集【正确答案】:AC3.以下算法中可以应用于图像分割的是()。A、边缘检测技术B、阈值分割技术C、基于区域的分割技术D、区域生长方法【正确答案】:ABCD4.中台的设计原则()A、企业级复用原则B、稳态业务沉淀原则C、共性业务服务原则D、企业全局复用原则【正确答案】:ABC5.下面哪些属于可视化高维数据技术()。A、矩阵B、平行坐标系C、星形坐标D、散布图【正确答案】:ABC6.ETL技术主要涉及()操作。A、抽取B、转换C、加载D、分析【正确答案】:ABC7.人工智能平台总体架构由平台层、应用层、服务层组成。其中,平台层包括()、()、()、()、()支撑A、模型库B、样本库C、模型平台D、底层硬件算力【正确答案】:ABCD8.以下有关生成对抗网络的说法正确的是()。A、生成器可以由Autoencoder实现B、生成器用来产生带有随机噪声的一定分布数据和真实样本数据的映射关系,判别器用来区别实际数据和生成器产生的数据C、生成器和判别器需要交替训练,不断增加两者的性能,直至达到某种博弈的平衡D、生成器和判别器的代价函数在训练过程中是同时优化的【正确答案】:ABC9.以下()是scipy.stats可实现的连续随机变量方法。A、rvsB、pdfC、ppfD、cdf【正确答案】:ABCD10.常用的池化层有哪些?A、MaxPoolingB、AveragePoolingC、MinPoolingD、MedianPooling【正确答案】:AB11.下列表示同一种学习方法的是(__)。A、集成学习B、多分类器系统C、基于委员会的学习D、平均策略【正确答案】:ABC12.梯度为0的点可能是A、局部最优解B、全局最优解C、鞍点D、转折点【正确答案】:ABC13.关于HDFS集群中的DataNode的描述不正确的是()。A、DataNode之间都是独立的,相互之间不会有通信B、存储客户端上传的数据的数据块C、一个DataNode上存储的所有数据块可以有相同的D、响应客户端的所有读写数据请求,为客户端的存储和读取数据提供支撑【正确答案】:AC14.在假设检验中,当原假设为“伪”,但数据分析人员没有拒绝它时犯的错误叫()。A、α错误B、β错误C、取伪错误D、弃真错误【正确答案】:BC15.数据挖掘的挖掘方法包括()。A、聚类分析B、回归分析C、神经网络D、决策树算法【正确答案】:ABCD16.大数据应用是指综合应用公司内部电力生产运行、经营管理、客户服务等业务活动所产生的数据资源,以及获取的外部数据资源,通过数据分析挖掘,释放数据资源价值,(),赋能公司提质增效,支撑行业高质量发展,服务国家治理现代化。A、发现新知识B、创造新价值C、提升新能力D、增强新动能【正确答案】:ABC17.Python中jieba库支持哪几种模式()。A、精准模式B、匹配模式C、全模式D、搜索引擎模式【正确答案】:ACD18.下面关于池化的描述中,正确的的说法有哪些?A、池化方法也可以自定义B、池化在CNN中没有增加可训练的参数,但减少较多的计算量,加快模型训练时间C、池化的常用方法包括最大化池化、最小化池化、平均化池化、全局池化D、在人脸识别中采用较多池化的原因是为了获得人脸部的高层特征【正确答案】:ABD19.大数据成果应用管理,主要包括:A、成果共享B、成果应用C、成果推广D、成果变现【正确答案】:ABC20.在大数据计算服务SQL中使用distributeby和sortby可以对数据进行局部排序,以下对distributeby、sortby的用法描述正确的有:()。A、数据会按照distributeby指定的列进行分片,hash值相同的数据会在一个分片中B、使用sortby子句时,必须有distributeby子句C、sortby和orderby的用法没有区别D、在一个分片中,数据会按照sortby指定的列进行局部排序【正确答案】:ABD21.下面哪些是基于核的机器学习算法(__)。A、最大期望算法B、径向基核函数C、线性判别分析法D、支持向量机【正确答案】:BCD22.大数据应用应严格遵守国家数据安全相关法律法规和公司数据安全相关规定,严格执行数据获取、____、____、____、数据共享、数据销毁等环节安全管理要求,确保大数据应用工作安全合规。A、数据传输B、数据存储C、数据分析D、数据使用【正确答案】:ABD23.下面关于JSON数据格式,哪些说法是正确的()。A、jsonloads载入json格式数据后会用类似数组的方式把数据转换成数据表B、具有数据结构紧凑可读性强的优点C、Python中可以使用JSON模块把Json格式字符串解码转换成Python对象D、网络中交换数据最常见的格式之一【正确答案】:BCD24.下列哪些方法是常见解决分类模型之类别不平衡问题的方法。A、欠采样B、过采样C、强化学习D、生成对抗网络【正确答案】:ABD25.经典LSTM网络中使用tanh激活函数的模块是()A、输入门B、输出门C、遗忘门D、更新门【正确答案】:AB26.关于神经网络,下列说法正确的是()A、增加网络层数,可能会增加测试集分类错误率B、增加网络层数,一定会增加训练集分类错误率C、减少网络层数,可能会减少测试集分类错误率D、减少网络层数,一定会减少训练集分类错误率【正确答案】:AC27.加强数据安全()能力建设,提高对各类数据安全事件发现、响应和溯源能力。A、监测B、预警C、审计D、处置【正确答案】:ABCD28.空间域滤波是直接以图像中的像素操作为基础的滤波,空间滤波器有时也可称为()。A、空间掩膜B、核C、模板D、窗口【正确答案】:ABCD29.数据故事化描述应遵循的基本原则A、忠于原始数据原则B、设定共同场景原则C、有效性利用原则D、3C精神原则【正确答案】:ABCD30.假定你现在在解决一个有着非常不平衡的分类问题,即主要类别占据了训练数据的99%。现在你的模型在测试集上表现为99%的准确率。下面表述正确的是A、准确度并不适合于衡量不平衡类别问题B、准确度适合于衡量不平衡类别问题C、精确率和召回率适合于衡量不平衡类别问题D、精确率和召回率不适合于衡量不平衡类别问题【正确答案】:AC31.为了保证应用获得可预期的性能,需要设置OTS表的()。A、预留存储空间B、预留处理内存C、预留写吞吐量D、预留读吞吐量【正确答案】:CD32.以下关于Hbase说法正确的是()。A、面向列的数据库B、非结构化的数据库C、支持大规模的随机、实时读写D、采用松散数据模型【正确答案】:ABCD33.应用层表命名:ADS_{数据域简称}_{项目名简称}_{自定义表名}_{刷新周期编码}{分区增量编码}。其中()()为非必填。A、{刷新周期编码}B、{分区增量编码}C、{项目名简称}D、{自定义表名}【正确答案】:AB34.公司大数据应用需求与立项管理遵循数字化项目管理规范,严格落实项目制管理要求,主要包括()和计划编制与调整等工作。A、需求征集B、评审C、储备D、立项【正确答案】:ABCD35.对于Maxcompute的多路输出(multiinsert),()描述是不正确的。A、对于源表为分区表的,相同的一个分区不能出现多次B、目标表为分区表的,对于不同的分区,可以混合使用insertC、一般情况下,单个sql中最多可以写128路输出D、对于源表为未分区表的,该表可以出现多次【正确答案】:BCD36.下列属于评估方法的有:A、留出法B、交叉验证法C、自助法D、反向验证法【正确答案】:ABC37.以下关于数据服务说法错误的是:()。A、数据服务采用Serverless架构B、支持弹性扩展C、数据服务的功能包括:API生成、API注册、API调用和API运营【正确答案】:ABC38.训练CNN时,GPU显存溢出,此时可以采取的措施有()。A、减少B、移除一些卷积层C、减少图片输入大小D、增加激活函数【正确答案】:ABC39.使用Python操作目录以下哪些符合()。A、mkdir:用于以数字权限模式创建目录B、getcwd:用于返回当前工作目录C、chdir:用于改变当前工作目录到指定的路径D、rmdir:用于删除指定路径的目录。仅当这文件夹是空的才可以,否则,抛出OSError。【正确答案】:ABCD40.在SQL语言中,关于DML的理解错误的是()?A、DML是数据查询语言B、DML是数据操纵语言C、DML是数据定义语言DML是数据控制语言【正确答案】:ACD41.相对于普通的神经网络,循环神经网络(RNN)的“循环”主要体现在()。A、训练过程中的反向传播次数更多B、训练经过一定轮次之后将参数归零C、深层节点的输出会反过来影响浅层节点D、每个节点自循环【正确答案】:CD42.Loader可以实现以下()转换规则。A、长整型时间转换B、增量转换C、拼接转换D、空值转换【正确答案】:ABCD43.按规定开展网络安全等级保护测评,强化()等技术措施;除非获得用户明确授权,未经脱敏处理的原始用户隐私数据等敏感数据限于公司内网传输、存储。A、信息脱敏B、定密加密C、去标识化D、去中心化【正确答案】:ABC44.在Windows系统中通过Geany编写Python程序,运行Python程序的常用步骤是()。A、菜单Build>ExecuteB、茉单Execute>BuildC、按F5D、按F10【正确答案】:AC45.关于分析学习和归纳学习的比较,说法正确的是()。A、归纳学习拟合数据假设,分析学习拟合领域理论的假设B、归纳学习论证方式为统计推理,分析学习为演绎推理C、归纳学习不需要隐式的先验知识D、训练数据不足时归纳学习可能会失败【正确答案】:ABCD46.在数据安全领域常用的P2DR模型中,P2、D和R代表的是()。A、策略B、防护C、检测D、响应【正确答案】:ABCD47.以下图像技术中属于图像处理技术的是()。A、图像编码B、图像合成C、图像增强D、图像分类【正确答案】:AC48.以下()场景可以使用大数据计算服务(MaxCompute,原ODPS)的TunnelSDK方式实现。A、定时批量上传数据B、下载某个分区表的一个分区的数据C、一次性上传本地格式化文本文件D、随时变化的数据,通过事件(消息)驱动触发【正确答案】:ABC49.以习近平新时代中国特色社会主义思想为指导,全面贯彻习近平总书记关于网络强囯的重要思想和国家网络空间安全战略、国家大数据发展战略,认真落实囯务院国资委加强合规管理、建设法治央企工作部署,紧扣()要求,秉持“引领规范、支撑推动”理念。A、稳B、进C、育D、开【正确答案】:ABCD50.下列哪些是传统RDBMS的缺点()A、表结构schema扩展不方便B、全文搜索功能较弱C、大数据场景下I/O较高D、存储和处理复杂关系型数据功能较弱【正确答案】:ABCD51.大数据计算服务(MaxCompute,原ODPS)的图计算引擎是分布式的,在加载数据时,系统默认()将数据分配到不同的Worker中。A、根据边的权值进行hash并对Worker数取模B、完全随机分配C、根据顶点ID的hash值对Worker数取模D、按照点ID值排序,再平均分配给Worker【正确答案】:ABCD52.DataWorks中,调度系统提供了一些常用的时间参数,周期性调度任务使用这些参数后,在调度运行时参数会自动赋值为具体的时间,以下哪些参数是调度系统内置时间参数?A、{yyyymmdd}B、{date}C、{yyyy-mm-dd}D、{bdp.system.cyctime}【正确答案】:BD53.关于DataWorks和MaxCompute的关系,下列说法中正确的是:()。A、DataWorks是基于MaxCompute作为计算弓摩的B、DataWorks是基于MaxCompute作为存储弓|擎的C、DataWorks可以使用Hadoop作为底层引擎DataWorks的底层计算引擎是【正确答案】:AB54.下面提到的编程框架,()是MaxCompute支持的。A、SQLB、MapReduceC、MPID、Graph【正确答案】:ABCD55.下列场景适合使用Python的是()。A、可作为脚本语言,快速编写小型程序、脚本等B、可应用在数据科学、交互式计算及可视化领域C、可作为胶水语言,整合如C++等语言代码D、Python适用于低延时、高利用率的应用场景【正确答案】:ABC56.()等都是Scikit-Learn中包含的算法。A、SVMB、随机森林C、Lasso回归D、密度聚类【正确答案】:ABCD57.从内外部环境与市场需求来看,大数据应用的业务规划将聚焦在()核心领域上。A、电网运营B、经营管理C、客户服务D、业务创新E、对外服务【正确答案】:ABCDE58.按照公司战略实施要求,立足数据发展需要,以“”为核心,建立健全数据合规管理体系。A、可靠B、可管C、可控D、可信【正确答案】:BCD59.以下属于图像分割的算法的是:()。A、阈值分割方法B、区域增长细分C、边缘检测分割方法D、基于聚类的分割E、基于CNN中弱监督学习的分割【正确答案】:ABCDE60.下列对流式计算的链路描述正确的是:()。A、流计算全链路整体上更加强调数据的实时性B、链路包括数据实时采集、数据实时计算、数据实时集成C、一个流计算作业必须至少使用一个流数据作为源D、流计算将计算的结果数据支持写入目的数据【正确答案】:ABCD61.层次聚类试图在不同层次对数据集进行划分。这里数据集的划分可采用(__)或(__)策略。A、自顶向下B、自底向上C、自左至右D、自右至左【正确答案】:AB62.关于现阶段大数据技术体系,说法正确的是()。A、基础设施提供数据计算、数据存储、数据加工等服务B、流处理、统计工具、日志分析都属于常用的开源工具C、数据资源代表的是生成数据的机构D、数据源与APP为数据科学和大数据产业生态系统提供数据内容【正确答案】:ABCD63.下列目标检测网络中,哪个是单阶段的网络A、Faster-RNNB、SSDC、YOLOV3D、Cascade-RNN【正确答案】:BC64.数据应用的重点业务中赋能电网转型升级包括()。A、优化人员配置B、优化生产运行C、优化设备管控D、优化能源配置【正确答案】:BCD65.下列说法中正确的是()。A、云计算的主要特点是非常昂贵。B、大数据是多源、异构、动态的复杂数据,即具有4V特征的数据C、大数据是数据科学的研究对象之一D、MapReduce是采用云计算这种新的计算模式研发出的具体工具软件(或算法)【正确答案】:BCD66.推进大数据在促进清洁能源消纳,基于大数据划分电网安全运行边界条件,优化()的调度管理,支撑智慧能源体系建设。A、新能源调度B、源网荷储协调C、清洁能源消纳D、新能源发电预测【正确答案】:BC67.常见的图像分割算法有()。A、基于区域的分割方法B、基于人工勾画的分割方法C、基于边缘的分割方法D、基于阈值的分割方法【正确答案】:ACD68.MySQL的CloudDBA的慢SQL指的是A、查看慢日志趋势B、统计信息C、原因分析D、优化建议【正确答案】:AB69.关于Hbase存储模型的描述正确的是:()。A、即使是:key值相同,qualifier也相同的多个KeyValue也可能有:多个,此时使用时间戳来区分B、同一个key值可以关联多个valueC、keyvalue中期有:时间戳,类型等关键信息D、每一个keyvalue都有:一个qualifier标识【正确答案】:ABCD70.电力大数据服务社会治理,具体是指()。A、助力智慧城市科学发展B、助力乡村振兴战略落地C、助力经济社会绿色发展D、助力突发事件研判【正确答案】:ABCD71.关于神经网络模型的说法,哪些是不正确的()A、神经网络的工作原理与生物体内的神经元是完全一样的B、训练神经网络的实质是对复杂函数求参数最优解的过程C、增加神经网络的层数和增加每层的神经元个数的效果是一样的D、神经网络只能进行二分类,不能进行更多种类的分类了【正确答案】:ACD72.当图像分类的准确率不高时,可以考虑以下哪种方法提高准确率()。A、数据增强B、调整超参数C、使用预训练网络参数D、减少数据集【正确答案】:ABC73.阿里云实时计算中数据源表和数据维表之间支持的join操作主要包括以下哪些()?A、RIGHTB、LEFTC、INNERD、OUTTER【正确答案】:BC74.卷积神经网络中常用的池化函数包括()。A、最大池化函数B、L2范数C、相邻矩形区域内的平均值D、基于据中心像素距离的加权平均函数【正确答案】:ABCD75.下列属于结合策略的是(__)。A、投票法B、平均法C、学习法D、排序法【正确答案】:ABC76.直方图修正法包括()。A、直方图统计B、直方图均衡C、直方图过滤D、直方图规定化;【正确答案】:BD77.以下哪些滤波器能在卷积窗口的边界上使卷积掩膜中心像素和它的4-邻接点的系数降至0附近()。A、同态滤波B、高斯滤波C、巴特沃斯滤波D、中值滤波【正确答案】:BC78.数据存储环节,企业重要数据原则上应存储于管理信息大区,在互联网大区存储企业重要数据时应加密存储。落实重要()等技术应用。A、数据备份B、访问控制C、安全审计D、加密保护【正确答案】:ABC79.下面哪些方法有助于解决深度网络的梯度消失问题()A、增加网络深度B、使用Sigmoid激活函数C、使用ReLU激活函数D、采用batchnormalization【正确答案】:CD80.对象存储ObjectStorageService(简称OSS),是阿里云对外提供的()()和()云存储服务。A、海量B、安全C、可靠D、高可靠【正确答案】:ABD81.以下哪些选项是Kafka的特点?A、支持消息随机读取B、高吞吐C、分布式D、消息持久化【正确答案】:BCD82.图像数字化应该包括哪些过程()。A、采样B、模糊C、量化D、统计【正确答案】:AC83.关于数据中台、数据平台、数据仓库三者的区别描述正确的是:A、数据中台是企业级的逻辑概念,体现企业B、数据仓库是一个相A具体的功能概念,是存储和管理一个或多个主题数据的集合,为业务提供服务的方式主要是分析报表;C、数据平台是在大数据基础上出现的融合了结构化和非结构化数据的数据基础平台,为业务提供服务的方式主要是直接提供数据集;D、数据中台距离业务更近,为业务提供速度更快的服务;E、数据仓库是为了支持管理决策分析,而数据中台则是将数据服务化之后提供给业务系统,不仅限于分析型场景,也适用于交易型场景;【正确答案】:ABCDE84.对于神经网络,以下哪些是超参数?A、神经网络的层数B、神经网络的学习率C、神经网络的权重D、神经网络的偏置【正确答案】:AB85.许多功能更为强大的非线性模型可在线性模型基础上通过引入()和()而得。A、层级结构B、高维映射C、降维D、分类【正确答案】:AB86.大数据应用建设及运营过程中如发生数据安全问题,应立即暂停大数据应用建设或运营工作,向____、____、法规部及相关专业管理等部门报告。A、数字化部B、信通公司C、安规部D、总师室【正确答案】:AC87.MaxCompute中用户认证(Authentication)的主要功能是检查请求(Request)发送者的真实身份。它一般包括:()。A、正确验证消息发送方的真实身份B、正确验证接收到的消息在途中是否被篡改C、正确验证用户状态,包括是否欠费等D、用户需要提取用户个性化信息时进行用户个性化认证【正确答案】:AB88.下列哪些选项属于桌面运维人员在对桌面计算机及外设进行日常运行时的工作范围()A、到货验收,资产登记B、外设安装、调试、与计算机或网络的连接及更换耗材C、提供耗材D、计算机硬件的安装、调试、从局域网接入交换机至设备网线的跳接【正确答案】:ABD89.下面()函数不是字符串处理函数。A、TRUNCB、TO_CHARC、SUBSTRD、INSTR【正确答案】:AB90.Hadoop组件Zookeeper的设计目标和主要特点包括()。A、简单性B、自我复制C、顺序访问D、高速读取【正确答案】:ABCD91.下列哪些情况下SOL自诊断可以识别,并上报告警信息?A、数据倾斜。B、SQL语句不下推C、大表Broadcast.D、HashJoin中大表做内表【正确答案】:ABCD92.及时将数据活动中产生的智力成果纳入公司知识产权体系进行保护,妥善处理好数据()的关系。A、内部共享B、对外开放C、知识产权保护D、数据安全【正确答案】:ABC93.大数据成果应用管理,主要包括____、____、____等内容。A、成果共享B、成果应用C、成果交易D、成果推广【正确答案】:ABD94.有两种策略常用来缓解BP网络的过拟合,分别是()和()。A、晚停B、早停C、正则化D、加入损失函数【正确答案】:BC95.定期开展数据合规典型案例分析,明晰数据合规管理(),提升公司整体数据合规管理能力。A、重点环节B、重点内容C、关键环节D、关键内容【正确答案】:BC96.Hadoop生态系统中,核心是()。A、FlumeB、MapReduceC、PigD、HDFS【正确答案】:BD97.MaxCompute图模型的数据结构中包含的元素有:()。A、节点B、有向边C、无向边D、队列【正确答案】:AB98.数据应用优化生产运行,提升电网质效包括()。A、优化源网荷储协调和清洁能源消纳的调度管理B、优化配电网运行C、提升电网防灾抗灾能力D、优化设备物资供应链【正确答案】:ABC99.在SQL语言分类中,以下属于DML的是:A、updateB、selectC、insertD、delete【正确答案】:ACD100.将相关内容纳入年度培训计划,实现各级领导班子成员、()等重点人员数据合规培训全覆盖。A、管理人员B、重要风险岗位人员C、新入职人员D、境外人员【正确答案】:ABCD1.采集个人信息数据时,遵循合法、正当、必要、最小化、准确性、可问责性的原则下,无需获得个人信息主体同意。A、正确B、错误【正确答案】:B解析:

《中华人民共和国网络安全法》第四十一条网络运营者收集、使用个人信息,应当遵循合法、正当、必要的原则,公开收集、使用规则,明示收集、使用信息的目的、方式和范围,并经被收集者同意。2.ADS表存在主键,即可根据主键使用delete删除纪录。()A、正确B、错误【正确答案】:B3.国网湖南省电力有限公司“十四五”数字化规划基准年为2021年.A、正确B、错误【正确答案】:B4.命题逻辑无法把它所描述的客观事物的结构及逻辑特征反映出来,也不能把不同事物间的共同特征表述出来。A、正确B、错误【正确答案】:A5.探索性数据分析与传统统计学中的验证性方法类似,他们都要事先提出假设。A、正确B、错误【正确答案】:B6.Bayes法是一种在已知后验概率与类条件概率的情况下的模式分类方法,待分样本的分类结果取决于各类域中样本的全体。A、正确B、错误【正确答案】:B7.当簇具有非球形形状时,K-means很难检测到自然的簇。A、正确B、错误【正确答案】:A8.公司建成全球最大、央企领先的一体化集团级信息系统,建成北京、上海、深圳三地集中式数据中心。A、正确B、错误【正确答案】:B9.贝叶斯决策是根据后验概率进行决策的一种方法。()A、正确B、错误【正确答案】:A10.Spark组件不包括ResourceManager、Executor、Driver、RDDA、正确B、错误【正确答案】:B11.虚假数据的存在会影响数据分析的信度。A、正确B、错误【正确答案】:A12.湖南省坚持“三新四高”发展战略,聚焦国家重要先进制造业、科技创新、内陆地区改革开放,旨在推动中部地区崛起和长江经济带发展。A、正确B、错误【正确答案】:B解析:

2020年,湖南提出大力实施“三高四新”战略,即打造“三个高地”、践行“四新”使命。“三个高地”为国家重要先进制造业高地、具有核心竞争力的科技创新高地、内陆地区改革开放高地;“四新”使命为在推动高质量发展上闯出新路子,在构建新发展格局中展现新作为,在推动中部地区崛起和长江经济带发展中彰显新担当,奋力谱写新时代坚持和发展中国特色社会主义的湖南新篇章。13.业务运营类项目包括开发工作完成或购买套装软件后的配套安装、配置调试和培训等工作的项目;以对系统运行、业务应用、用户行为等的常态统计分析为基础,开展系统优化改造、应用敏捷迭代、内容更新升级、网络安全服务、可研论证评估、后评估、绩效评估等相关工作的项目。A、正确B、错误【正确答案】:A14.K-means在进行邻近性度量时的距离是欧几里得距离。A、正确B、错误【正确答案】:B15.噪声数据的主要表现不包括重复数据。A、正确B、错误【正确答案】:A16.开展数据处理活动应当依照法律、法规的规定,建立健全全流程数据安全管理制度,组织开展数据安全教育培训,采取相应的技术措施和其他必要措施,保障数据安全。A、正确B、错误【正确答案】:A解析:

《中华人民共和国数据安全法》第二十七条:开展数据处理活动应当依照法律、法规的规定,建立健全全流程数据安全管理制度,组织开展数据安全教育培训,采取相应的技术措施和其他必要措施,保障数据安全。利用互联网等信息网络开展数据处理活动,应当在网络安全等级保护制度的基础上,履行上述数据安全保护义务。17.命题是可以判断真假的语句。A、正确B、错误【正确答案】:B18.在新兴产业运营能力升级方面,打造以数据、资金、物资、技术、人才等资源的高速流动机制、资源连接渠道,实现新兴产业资源供需的有机协同与快速响应。A、正确B、错误【正确答案】:A19.各单位对本单位数据共享工作负责,参照总部数据共享职责分工,明确数据共享职责界面,建立数据共享工作机制,落实公司数据共享工作要求,组织做好本单位数据共享工作。A、正确B、错误【正确答案】:A20.根据项目实际情況,可将结算并入竣工决算中一起编制。项目竣工决算报告应在项目竣工验收通过后三个月内完成。A、正确B、错误【正确答案】:A21.对于ADS的数据一致性问题,当updateType=realtime时,不支持事务,并且仅遵循会话一致性的设计,所以ADS并不能作为OLTP系统使用。A、正确B、错误【正确答案】:B22.IQR方法不适用于监测异常值。A、正确B、错误【正确答案】:B23.特征提取技术并不依赖于特定的领域。A、正确B、错误【正确答案】:B24.维护数据安全,应当坚持总体国家安全观,建立健全数据安全治理体系,提高数据安全保障能力。A、正确B、错误【正确答案】:A解析:

《中华人民共和国数据安全法》第四条:维护数据安全,应当坚持总体国家安全观,建立健全数据安全治理体系,提高数据安全保障能力。25.数字化转型需要“另起炉灶、从头再来”。A、正确B、错误【正确答案】:B26.各单位要坚持维护数据安全和促进数据开发利用并重,以数据开发利用促进数据安全,以数据安全保障数据开发利用和产业发展。A、正确B、错误【正确答案】:A解析:

《中华人民共和国数据安全法》第十三条:国家统筹发展和安全,坚持以数据开发利用和产业发展促进数据安全,以数据安全保障数据开发利用和产业发展。27.贴源层存放着最细粒度的明细事实数据和维度数据。A、正确B、错误【正确答案】:B28.数据授权流程包括需求提报、专业审核、授权实施三个环节。A、正确B、错误【正确答案】:A29.公司各专业、各单位信息化基础不同、能力不一,对数字化转型的边界和目标认识有差异,导致对数字化转型的战略认知有区别。A、正确B、错误【正确答案】:A30.语义网络系统由两部分组成:由语义网络组成的知识库和用于求解问题的解释程序即推理机。A、正确B、错误【正确答案】:A31.专项核查由发起人负责,发起人可以是业务部门、三大支撑机构、互联网部或者这些单位的联合体。A、正确B、错误【正确答案】:B32.到“十四五”末,信息通信网络全面实现网络设备国产化率95%A、正确B、错误【正确答案】:B33.公司数据中台初步建成,汇聚166套业务系统(137套二级部署系统、29套一级部署系统)核心数据、调控云和采集系统的实时数据,以及石油、煤炭、天然气、水资源、发电等企业外部数据。A、正确B、错误【正确答案】:A34.单个谓词是谓词公式。A、正确B、错误【正确答案】:A35.国网公司各分部和各单位可按要求自主决策推进数据开放事宜A、正确B、错误【正确答案】:B36.数组的切片是原数组的副本。()A、正确B、错误【正确答案】:B37.各部门、各分部和公司各单位要按照“谁主管谁负责,谁运营谁负责,谁使用谁负责,管业务必须管安全”的总体原则,落实数据安全保护要求。A、正确B、错误【正确答案】:B38.CLIQUE是一种基于网格的聚类算法。A、正确B、错误【正确答案】:A39.大数据计算服务(MaxCompute,原ODPS)中的日志表log是一张分区表,分区键是dt,每天产生一个分区用于存储当天新增的数据,现在共有dt=’20160101’至dt=’20160131’共31个分区的数据,为了删除20160101当天新增的数据,可以通过alter方式实现。A、正确B、错误【正确答案】:A40.进行数据抽样操作时,需要指定要进行抽样的时间以及要进行抽样的数据记录的条数限制。()A、正确B、错误【正确答案】:A41.RDD中的数据被分区存储在集群中,使得任务可以并行执行。A、正确B、错误【正确答案】:A42.人工智能是智能计算机系统,即人类智慧在机器上的模拟,或者说是人们使机器具有类似于人的智慧(对语言能理解、能学习、能推理)。A、正确B、错误【正确答案】:A43.2023-2025年,实现业务中台对公司重点应用支撑覆盖率达到90%,实现中台服务可用率到达95%以上。A、正确B、错误【正确答案】:A44.人工智能的研究长期目标是使现有的电子计算机更聪明,更有用,使它不仅能做一般的数值计算及非数值信息的数据处理,而且能运用知识处理问题,能模拟人类的部分智能行为。A、正确B、错误【正确答案】:B45.重构原数据超市,能够提升用户“读数、找数、用数”体验。A、正确B、错误【正确答案】:A46.开展涉及国家秘密的数据处理活动,应当遵循国家有关法律法规要求。A、正确B、错误【正确答案】:A解析:

《中华人民共和国数据安全法》第五十三条:开展涉及国家秘密的数据处理活动,适用《中华人民共和国保守国家秘密法》等法律、行政法规的规定。在统计、档案工作中开展数据处理活动,开展涉及个人信息的数据处理活动,还应当遵守有关法律、行政法规的规定。47.数字化工作就是建设信息系统。A、正确B、错误【正确答案】:B48.数据接入方式主要有两种,全量数据接入、增量数据接入。A、正确B、错误【正确答案】:B49.SparkJob默认的调度模式是FIFO。A、正确B、错误【正确答案】:A50.国网湖南省电力有限公司数字化系统深化应用促基层减负专项行动,营销专业反馈问题最多的是新增需求A、正确B、错误【正确答案】:A51.人工神经网络可以用来处理冗余特征。A、正确B、错误【正确答案】:A52.公司内部共享数据时,应遵照数据共享负面清单开展。原则上所有数据均可在公司内部共享。A、正确B、错误【正确答案】:B53.电网数字化储备项目下达计划前,须完成可研批复。限上项目由各单位互联网职能管理部门负责批复,限下项目由各单位信通公司负责批复。A、正确B、错误【正确答案】:B54.可信度带有较大的主观性和经验性,其准确性难以把握A、正确B、错误【正确答案】:A55.搭建大数据应用分析环境,可以实现自助式数据处理、统计分析、数据挖掘、人工智能等在线服务。A、正确B、错误【正确答案】:A56.在0,1,„,9,这10个数字当中,一次任取两个,则抽到5这个数字的概率是0.1.A、正确B、错误【正确答案】:B57.国网湖南省电力有限公司2021年大数据应用及数据增值服务专项工作的工作原则包括聚焦需求,不包括价值创造。A、正确B、错误【正确答案】:B58.专家系统的结构选择不需要根据系统的应用环境和所执行任务的特点就可以确定。A、正确B、错误【正确答案】:B59.政府监管类和公共开放类需求由相关业务部门承接,公益服务类和商务增值类需求由开展数据应用的业务部门(单位)承接A、正确B、错误【正确答案】:A60.分类与回归是同一概念的不同称呼。A、正确B、错误【正确答案】:B61.《国家电网有限公司数据管理办法》指出:坚持问题导向,以业务和应用为驱动,加强数据管理,满足生产需要、促进业务发展、创造业务价值。A、正确B、错误【正确答案】:B62.Kafka通过每个Producer分配唯一ID避免任务重复执行。A、正确B、错误【正确答案】:A63.产生式系统的构成规则库,综合数据库两部分。A、正确B、错误【正确答案】:B64.数字化转型可以看做是打造传统意义上的互联网企业。A、正确B、错误【正确答案】:B65.任何国家或者地区在与数据和数据开发利用技术等有关的投资、贸易等方面对中华人民共和国采取歧视性的禁止、限制或者其他类似措施的,中华人民共和国可以根据实际情况对该国家或者地区对等采取措施。A、正确B、错误【正确答案】:A解析:

《中华人民共和国数据安全法》第二十六条:任何国家或者地区在与数据和数据开发利用技术等有关的投资、贸易等方面

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论