2023年能源大数据应用开发技能竞赛理论练习试卷附答案_第1页
2023年能源大数据应用开发技能竞赛理论练习试卷附答案_第2页
2023年能源大数据应用开发技能竞赛理论练习试卷附答案_第3页
2023年能源大数据应用开发技能竞赛理论练习试卷附答案_第4页
2023年能源大数据应用开发技能竞赛理论练习试卷附答案_第5页
已阅读5页,还剩52页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第页2023年能源大数据应用开发技能竞赛理论练习试卷附答案1.《国家电网公司信息系统事故调查规程》规定:各区域电网公司、省(自治区、直辖市)电力公司、国家电网公司直属单位或其所属任一地区供电公司本地网络完全瘫痪,且影响时间超过()小时,将构成二级信息系统事故。A、12B、24C、32D、40【正确答案】:B2.df.head(n)是指显示A、Dataframe数据中的前n行B、Dataframe数据中的后n行C、Dataframe数据中的前n列Dataframe数据中的后n列【正确答案】:A3.以下说法错误的是()A、数据集中每个数据项作为单个图元素表示B、数据可视化技术提供多种数据分析和图形化方法C、数据可视化可以帮助决策者更直观的观察和分析数据D、多维数据无法进行数据可视化【正确答案】:D4.下列关于对大数据特点的说法中,错误的是()。A、数据规模大B、数据类型多样C、数据价值密度高D、数据处理速度快【正确答案】:C5.现实中往往会遇到“不完整”的训练样本,在这种存在属性变量值未知的情形下,可用()。A、边际似然B、EM算法C、贝叶斯决策D、贝叶斯分类器【正确答案】:B6.健全数据合规管理体系,落实管理职责,强化横向协调和纵向指导,突出事前防范和过程管控,加强违规事件应对处置,严格管控()。A、数据安全风险B、信息安全风险C、数据合规风险D、数据泄露风险【正确答案】:C7.SVM算法中,对于线性不可分的情况,通过使用非线性的映射函数可以将低维不可分的样本转化到高维空间使其线性可分,这样的非线性映射函数称为()A、激活函数B、核函数C、超函数D、转换函数【正确答案】:B8.AlexNet使用ReLU激活函数的好处不包括以下哪个方面?()A、梯度为0时神经元难以正常工作B、开销小、计算快C、提高了网络训练速度D、缓解了梯度消失问题【正确答案】:A9.关于Python语言的浮点数类型,以下选项中描述错误的是A、浮点数类型与数学中实数的概念一致B、浮点数类型表示带有小数的类型C、Python语言要求所有浮点数必须带有小数部分D、小数部分不可以为0【正确答案】:D10.批规范化(BatchNormalization)的好处都有什么A、让每一层的输入的范围都大致固定B、它将权重的归一化平均值和标准差C、它是一种非常有效的反向传播(BP)方法D、这些均不是【正确答案】:A11.公司大数据应用建设应按照电网数字化建设要求,遵循公司大数据应用统一技术架构与标准,充分利用()等各类企业级大数据应用公共服务能力平台进行开发和实施。A、电网资源业务中台B、全业务数据中心C、数据中台D、数字化能力开放平台【正确答案】:C12.《中华人们共和国网络安全法》规定:国家采取措施,()来源于中华人民共和国境内外的网络安全风险和威胁,保护关键信息基础设施免受攻击、侵入、干扰和破坏,依法惩治网络违法犯罪活动,维护网络空间安全和秩序。A、监测、防御、反击B、监测、防御、处置C、检测、防御、反击D、检测、防御、处置【正确答案】:B13.关于下面代码的描述,错误的是(),代码是n=1deffunc(a,b):c=a*breturncs=func("Hello",2)print(c)A、打印输出字符串:"HelloHello"B、运行结果是出错,出错类型是NameError:name'c'isnotdefinedC、c是一个局部变量D、n是一个全局变量【正确答案】:A14.数据使用方对负面清单内的数据使用完毕后,应及时()相关数据。A、注销B、销毁C、删除D、存档【正确答案】:B15.LSTM的3个门分别是()。A、遗忘门、输入门、输出门B、输入门、更新门、输出门C、输入门、重置门、遗忘门D、遗忘门、更新门、输出门【正确答案】:A16.与HMM和MEMM模型相比,CRF模型的优势不包含()。A、特征灵活B、速度快C、可容纳较多上下文信息D、全局最优【正确答案】:B17.对于查询结果中有多个空值NULL的情况,SELECT命令中使用了DISTINCT和ORDERBYASC的结果是()A、空值只出现一次,排在最前面B、空值只出现一次,排在最后面C、空值出现多次,排在最前面D、空值出现多次,排在最后面【正确答案】:A18.CNN中用来完成分类的是()A、卷积层B、池化层C、全连接层D、激活层【正确答案】:C19.以下哪项不是公司各级大数据中心、信通公司的负责事项?A、负责组织开展大数据应用平台、服务目录等基础环境建设,保障数据及运营安全,提供数据、算法和算力资源支持B、负责发布存储的数据目录和数据获取渠道C、协同开展大数据应用建设,并参与需求评审、应用推广等工作D、负责大数据应用技术前瞻性研究,负责大数据应用技术架构设计、技术选型验证和信息安全技术保障【正确答案】:D20.建立与政府主管部门、行业协会、专家学者的有效沟通机制,组织各级单位积极参与《数据安全法》、《》等国家、地方和行业数据相关法律法规。A、《个人信息保护法》B、《网络安全法》C、《保守国家秘密法》D、《网络产品和服务安全审查办法(试行)》【正确答案】:A21.下列()命令是删除文件。A、dfs-clearB、dfs-lsC、dfs-rmD、dfs-del【正确答案】:C22.优化配电网运行,构建()等应用场景,优化停电策略,降低停电影响,提升配电网可靠性。A、精准停电分析B、精准故障抢修C、优化停电策略D、降低停电影响【正确答案】:B23.下列关于LSTM的说法,错误的是()。A、LSTM中存在Sigmoid函数B、LSTM中存在tanh函数C、LSTM又称长短时记忆网络D、RNN是LSTM的变种【正确答案】:D24.下列关于文本分类的说法不正确的是()。A、文本分类是指按照预先定义的主题类别,由计算机自动地为文档集合中的每个文档确定一个类别B、文本分类大致可分为基于知识工程的分类系统和基于机器学习的分类系统C、文本的向量形式一般基于词袋模型构建,该模型考虑了文本词语的行文顺序D、构建文本的向量形式可以归结为文本的特征选择与特征权重计算两个步骤【正确答案】:C25.如果自变量有连续型变量,则不适用的分类预测方法有()A、逻辑回归B、神经网络C、SVM算法D、C4.5算法【正确答案】:D26.当前人工智能算力持续突破,面向训练用和推断用的芯片仍在快速推进,基于___的训练芯片持续增多A、CPUB、GPUC、FPGAD、5G通讯【正确答案】:B27.()将基础的、共性的、稳定的业务功能沉淀形成共享服务,供前端应用调用,并将相关业务生成的数据存储在业务中台,按需调用数据中台服务。A、业务中台B、数据中台C、技术中台D、前台【正确答案】:A28.以下表达式,正确定义了一个集合数据对象的是:A、x={200,’flg’,20.3}B、x=(200,’flg’,20.3)C、x=[200,’flg’,20.3]D、x={‘flg’:20.3}【正确答案】:A29.给出如下代码,可以输出“python”的是()s='Pythonisbeautiful!'A、print(s[:–14]);B、print(s[0:6].lower());C、print(s[0:6]);D、print(s[–21:【正确答案】:B30.高斯核也称为()。A、多项式核B、拉普拉斯核C、RBF核D、Sigmoid核【正确答案】:C31.若a=np.array([5,1,2,3]),a.sort(),则数组a的结果是()。A、[5,1,2,3];B、[1,2,3,5];C、[3,2,1,5];D、11;【正确答案】:B32.数据合规管理工作的核心不包括()A、客观B、可管C、可控D、可信【正确答案】:A33.设计为8层的卷积神经网络AlexNet网络成功使用(),其效果远远地超过了Sigmoid函数。A、ReLUB、sigmoid函数C、tanhD、sin【正确答案】:A34.数据质量的基本属性不包括()A、正确性B、时效性C、一致性D、完整性【正确答案】:B35.关于普通的平原网络与深度残差网络的区别,下面哪个说法是不正确的?()A、深度残差网络有很多旁路的支线将输入直接连到后面的层,使得后面的层可以直接学习残差B、传统的卷积层或全连接层在信息传递时,或多或少会存在信息丢失、损耗等问题C、ResNetD、在实际项目中,平原网络和深度残差网络没有区别【正确答案】:D36.令N为数据集的大小[注:设训练样本(xi,yi),N即训练样本个数],d是输入空间的维数(注:d即向量xi的维数)。则硬间隔SVM问题的原始形式[即在不等式约束[y(wTx+b)≥1]下最小化(1/2)wTw]在没有转化为拉格朗日对偶问题之前是()。A、一个含N个变量的二次规划问题B、一个含N+1个变量的二次规划问题C、一个含d个变量的二次规划问题D、一个含d+1个变量的二次规划问题【正确答案】:D37.以下关于语言类型的描述中,错误的是______。A、解释是将源代码逐条转换成目标代码同时逐条运行目标代码的过程B、静态语言采用解释方式执行,脚本语言采用编译方式执行C语言是静态编译语言,Python语言是脚本语言D、编译是将源代码转换成目标代码的过程【正确答案】:B38.单个神经元模型不能解决()。A、线性二分类B、XOR问题C、线性二判别D、以上都不是【正确答案】:B39.移动平均法是测定()的一种较为简单的方法。A、长期趋势B、循环变动C、季节变动D、不规则变动【正确答案】:A40.关于选择k折交叉检验中的“k”的值,以下说法正确的是A、k并不是越大越好,更大的k会减慢检验结果的过程B、选择更大的k会导致降低向真实期望错误的倾斜C、选择总是能最小化交叉验证中方差的kD、以上都是【正确答案】:D41.以下哪种方法不属于特征选择的标准方法:()A、嵌入B、过滤C、包装D、抽样【正确答案】:D42.Spark的()组件用于支持实时计算需求。A、SparkSQLB、SparkStreamingC、SparkGraphXD、SparkMLLib【正确答案】:B43.相关关系是一种与函数关系区别的非确定性关系,而相关分析就是研究事物或现象之间是否存在这种非确定性关系的统计方法,以下不属于相关性分析方法的是()。A、Pearson相关系数B、Spearman秩相关系数C、Kendall相关系数D、傅里叶系数【正确答案】:D44.在深度学习中,我们经常会遇到收敛到localminimum,下面不属于解决localminimum问题的方法是()A、随机梯度下降B、设置MomentumC、设置不同初始值D、增大batch【正确答案】:D45.从内外部环境与市场需求来看,哪项是大数据应用的业务规划将聚焦核心领域。A、电网运营B、科技创新C、新兴产业D、供电保障【正确答案】:A46.梯度提升树属于()模型。A、概率模型B、集成模型C、距离模型D、神经网络模型【正确答案】:B47.参考公司()按域进行数据分类。A、维度模型B、公共数据模型(SG-CIM)C、通用数据模型D、业务分类【正确答案】:B48.从宏观角度看,数据可视化的功能不包括()A、信息记录B、信息的推理分析C、信息清洗D、信息传播【正确答案】:C49.下面代码的执行结果是()print(1.23e-45.67e8j.real)A、12300B、1.23C、5.67E+8D、0.000123【正确答案】:D50.ADS创建普通表时,关于updateType属性()说法是错误的。A、合法的取值为realtime或者batch,该值不显式指定时,默认取batchB、该值为realtime时,对应的表必须指定合法的主键并且必须指定二级分区C、通过该属性指定数据的更新方式D、该值为batch时,如果要支持增量导入,必须指定二级分区【正确答案】:B51.()不仅可用于多层前馈神经网络,还可用于其他类型的神经网络。A、感知机B、神经元C、神经系统D、误差逆传播【正确答案】:D52.Hive是基于Hadoop的数据仓库软件,最大可以查询有管理()级别的分布式数据。A、PBB、GBC、MBD、TB【正确答案】:A53.长短时记忆网络属于一种()。A、全连接神经网络B、门控RNNC、BP神经网络D、双向RNN【正确答案】:B54.sigmoid导数为()A、f(z)B、f(1-z)C、f(1+z)f(1-z)D、f(z)(1-f(z))【正确答案】:D55.在回归分析中,说法正确的是()。A、解释变量和被解释变量都是随机变量B、解释变量为非随机变量,被解释变量为随机变量C、解释变量和被解释变量都为非随机变量D、解释变量为随机变量,被解释变量为非随机变量【正确答案】:B56.在SQL查询时,使用WHERE子句指出的是(?)A、查询目标B、查询结果C、查询条件D、查询视图【正确答案】:C57.在MySQL中,通常使用()语句来进行数据的检索、输出操作。A、SELECTB、INSERTC、DELETED、UPDATE【正确答案】:A58.常用的图像去噪方法有()。A、高斯滤波B、中值滤波C、P-M方程去噪D、以上答案都正确【正确答案】:D59.依据《国家电网有限公司数据管理办法》,建立基于()的公司对内数据共享机制。A、负面清单B、层层审批C、一事一议D、数据应用【正确答案】:A60.使用pivot_table函数制作透视表时,要用下列()参数设置行分组键。A、datB、valuesC、columnsD、Index【正确答案】:D61.Scipy库不包含以下哪种功能()。A、线性代数模块B、傅里叶变换C、信号和图像图例D、提供机器学习等算法【正确答案】:D62.公司()要加强对涉及企业秘密的数据保护工作的组织、指导。A、互联网部B、信通公司C、保密办D、安监部【正确答案】:C63.数据的异构性问题中,下列属于专用格式的是()A、XMLB、CSVCLASSD、OWL【正确答案】:C64.BP神经网络具有很的表示能力,它经常遭遇(),其训练误差持续降低,但测试误差却可能上升。A、欠拟合B、误差过大C、误差过小D、过拟合【正确答案】:D65.()应当为公安机关,国家安全机关依法爱护国家安全和侦查犯罪的活动提供技术支持和帮助。A、网络建设者B、网络建设者C、网络运营者D、网络使用者【正确答案】:C66.一个MapReduce程序中的MapTask的个数由什么决定()A、输入的总文件数B、客户端程序设置的mapTask的个数C、FileInputFormat.getSplits(JobContextjob)计算出的逻辑切片的数量D、输入的总文件大小/数据块大小【正确答案】:C67.在MapReduce中,哪个组件是用户不指定也不会有默认的()A、CombinerB、OutputFormatC、PartitionerD、InputFormat【正确答案】:A68.公司新建信息系统需严格遵循公司信息化架构(含业务架构、()、数据架构、技术架构、安全架构)总体设计,并满足相应架构标准、规范及要求。A、资产架构B、软件架构C、应用架构D、管理架构【正确答案】:C69.受到治安管理处罚的人员,()不得从事网络安全管理和网络运营关键岗位的工作;受到刑事处罚的人员,()不得从事网络安全管理和运营关键岗位的工作。A、五年内,十年内B、三年内,终身C、三年内,十年内D、五年内,终身【正确答案】:D70.运行以下程序,从键盘输入1+2与4j,则输出结果是:x=eval(input())y=eval(input())print(abs(x+y))A、5.0B、5C、<class‘complex’>D、<class‘float’>【正确答案】:A71.用onehot对某个只有一个属性的样本进行编码,下面可能是编码结果的是()。A、1010B、1100C、1111D、1000【正确答案】:D72.下列关于RBM说法错误的是(__)。A、学习过程很快B、RBM训练可以看作对一个深层BP网络的网络权值参数的初始化C、RBM不用人工选择特征D、RBM有标签样本集【正确答案】:A73.一般将原始业务数据分为多个部分,()用于模型的构建。A、训练集B、测试集C、验证集D、全部数据【正确答案】:A74.对生成对抗网络(GenerativeAdversarialNetmork)描述不正确的有()A、GAN是一种区别学习模型。B、GAN包含生成网络和判别网络两个网络。C、GAN是一种生成学习模型。D、生成网络和判别网络分别依次迭代优化。【正确答案】:A75.卷积的过程是让过滤器在图像上()。A、缩放B、剪切C、窗口滑动D、镜像对称【正确答案】:C76.下列关于PEST分析法中分析的外部环境因素说法中,错误的是()。A、政治(Political)B、经济(Economic)C、科学(Science)D、技术(Technology)【正确答案】:C77.关于L1、L2正则化下列说法正确的是?A、L2正则化能防止过拟合,提升模型的泛化能力,但L1做不到这点B、L2正则化技术又称为LassoRegularizationC、L1正则化得到的解更加稀疏D、L2正则化得到的解更加稀疏【正确答案】:C78.时间序列中除去趋势、周期性和季节性之后的偶然性波动,称为:()。A、趋势B、季节性C、周期性D、随机性【正确答案】:D79.为什么要对输入x进行归一化?A、让参数初始化更快B、让代价函数更快地优化C、更容易做数据可视化D、是另一种正则化——有助减少方差【正确答案】:B80.下列关于模型能力(modelcapacity,指神经网络模型能拟合复杂函数的能力)的描述正确的是()。A、隐藏层层数增加,模型能力增加B、DropoutC、学习率增加,模型能力增加D、以上都不正确【正确答案】:A81.下列关于支持向量的说法正确的是()A、到分类超平面的距离最近的且满足一定条件的几个训练样本点是支持向量B、训练集中的所有样本点都是支持向量C、每一类样本集中都分别只有一个支持向量D、支持向量的个数越多越好【正确答案】:A82.Hadoop生态系统中,HBase是一种()。A、分布式文件系统B、数据仓庢C、实时分布式数据库D、分布式计算系统【正确答案】:C83.输入图片大?为200×200,依次经过一层卷积(kernelsize5×5,padding1,stride2),pooling(kernelsize3×3,padding0,stride1),又一层卷积(kernelsize3×3,padding1,stride1)之后,输出特征图大小为()。A、95B、96C、97D、98【正确答案】:C84.关于神经网络结构的权重共享现象,下面哪个选项是正确的()A、只有全连接神经网络会出现B、只有卷积神经网络(CNN)会出现C、只有循环神经网络(RNN)会出现D、卷积神经网络和循环神经网络都会出现【正确答案】:D85.数据湖探索(DataLakeInsight,简称DLI)是支持以下()形式的大数据计算分析服务。A、流式处理B、批处理C、流批一体D、都不支持【正确答案】:C86.下面有关线性判别分析错误的说法是哪个?A、通过对原始的数据进行线性变换,使得不同类的样本尽量分开B、线性变换可以使同类样本的方差变大C、线性变换可以使不同类别样本的距离加大D、提高不同类样本的可分性【正确答案】:B87.国网数据中台,是在下面()阶段的基础上发展过来的。A、营销服务中心B、全业务统一数据中心C、海量历史/实时数据中心D、电网GIS数据中心【正确答案】:B88.有监督的学习和无监督的学习的根本区别在于()A、学习过程是否需要人工干预B、学习样本是否需要人工标记C、学习结果是否需要人工解释D、学习参数是否需要人工设置【正确答案】:B89.下面哪项操作能实现跟神经网络中Dropout的类似效果?A、BoostingBaggingC、StackingD、Mapping【正确答案】:B90.中台建设目标A、大前台,强中台,活后台B、活前台,大中台,强后台C、小前台,强中台,大后台D、小前台,强中台,活后台【正确答案】:B91.AI芯片也被称为AI加速器,是专门用于处理人工智能应用中的大量计算任务的功能模块。A、正确B、错误C、视情况而定D、以上均不正确【正确答案】:A92.()算法可以较好的避免样本的不平衡问题。A、KNNB、SVMC、BayesD、神经网络【正确答案】:A93.下列哪个神经网络结构会发生权重共享()。A、卷积神经网络B、循环神经网络C、全连接神经网络D、选项A和B【正确答案】:D94.下列哪一项不是神经网路常用的激活函数()A、Sigmoid函数B、sin函数C、sign函数D、tanh函数【正确答案】:B95.数据应用的重点业务中赋能电网转型升级不包括()。A、优化人员配置B、优化生产运行C、优化设备管控D、优化能源配置【正确答案】:A96.引入激活函数的目的是()A、加入额外的计算单元B、加快计算速度C、增加神经网络模型的非线性拟合能力D、方便反向传播计算【正确答案】:C97._____年年底前,明确数据传输、存储管理规范和标准A、2023B、2021C、2022D、2025【正确答案】:C98.()用于将非线性引入神经网络。它会将值缩小到较小的范围内。A、损失函数B、优化函数C、激活函数D、目标函数【正确答案】:C99.各地区、各部门应当按照数据()保护制度,确定本地区、本部门以及相关行业、领域的重要数据具体目录,对列入目录的数据进行重点保护。A、分类分级B、分级分域C、分层分级D、分类分域【正确答案】:A100.下面关于展示数据管理说法不正确的是()A、大厅场景数据应基于数据中台统一获取B、建立大厅数据质量常态巡检核查机制C、不得违规存储、处理涉及敏感数据。D、历史数据需要删除【正确答案】:D1.在MaxCompute中通过SQL创建了一张分区表,createtablet_student(namestring,scorebigint),下面的SQL语句中语法正确的有:()。A、select*fromt_studentorderbyscorelimit100;B、select*fromtstudentorderbyscore;C、selectname,scoreaspfromt_studentorderbyplimit100;D、selectname,scoreassfromtstudentorderbyscorelimit100;【正确答案】:ABCD2.以下关于循环神经网络的说法正确的有()A、神经元自带反馈B、智能处理固定长度的文本C、适合处理序列数据D、能处理任意长度的文本【正确答案】:ACD3.确保数据收集、传输、存储、加工、()等环节数据合规管理机制制度化、规范化,促进数据依法合规利用,维护公司合法权益,支撑公司战略目标实现。A、使用B、内部共享C、对外开放D、销毁【正确答案】:ABCD4.数据活动涉及公司商业秘密、工作秘密的,应严格执行()等有关规定,履行涉密审查流程,根据有关规定及工作需要确定知悉范围,并按照涉密程度实行分类管理。A、《信息安全技术网络安全等级保护基本要求》B、《中华人民共和国网络安全法》C、《囯家电网有限公司保密工作管理办法》D、《囯家电网公司保护商业秘密规定》【正确答案】:CD5.MaxcomputeSQL支持的Join操作类型包括:()。A、INNERJOINB、LEFTOUTERJOINC、FULLOUTERJOIND、RIGHTOUTERJOIN【正确答案】:ABCD6.数据中台是企业级数据能力共享平台。数据通过分层与水平分解,经过汇聚、(),沉淀公共的数据能力,根据业务场景进行服务封装,形成企业级数据服务,支撑前端应用敏捷迭代和快速构建,实现数据价值共享。A、存储B、整合C、分析D、加工【正确答案】:ABCD7.在正则化公式中,λ为正则化参数,关于λ描述正确的是()。A、若正则化参数λ过大,可能会导致出现欠拟合现象B、若λ的值太大,则梯度下降可能不收敛C、取一个合理的λ值,可以更好的应用正则化D、如果令λ的值很大的话,为了使CostFunction尽可能的小,所有θ的值(不包括θ0)都会在一定程度上减小【正确答案】:ABCD8.Spark容错性的方式有哪些()。A、数据检查点;B、存储原始数据;C、记录数据的更新;D、自建数据版本;【正确答案】:AC9.实时计算是一种持续、低时延、事件触发的计算任务,一般的数据处理过程涉及如下哪几个步骤()?A、实时数据源获取B、数据定时传输C、结果实时展示D、数据实时计算【正确答案】:ACD10.以下()是scipy中的模块。A、clusterB、constantsC、integrateD、io【正确答案】:ABCD11.下列模型属于机器学习生成式模型的是()。A、朴素贝叶斯B、隐马尔科夫模型C、线性回归模型D、深度信念网络【正确答案】:ABD12.正则表达式可以用非常灵活的方式来处理字符串,在大数据计算服务SQL中的正则函数支持POSIX格式,以下对正则表达式描述正确的有:()。A、[[:blank::]]匹配空格和TAB制表符B、$匹配行尾C、[[:digint:]]匹配数字字符D、[[:alnum:]]匹配字母字符和数字字符E、[[:digint:]]匹配数字字符【正确答案】:ABCD13.对前馈神经网络的描述正确的是A、层与层之间通过“全连接”进行连接,即两个相邻层之间神经元完全成对连接B、各个神经元接受前一级神经元的输入,并输出到下一级C、同一层内神经元之间存在全连接D、同一层内的神经元互相不连接【正确答案】:ABD14.以下有关特征数据归一化的说法正确的是()。A、特征数据归一化加速梯度下降优化的速度B、特征数据归一化有可能提高模型的精度C、线性归一化适用于特征数值分化比较大的情况D、概率模型不需要做归一化处理【正确答案】:ABD15.加强非结构化数据的挖掘应用,构建()等智能化服务场景,提升服务的智能交互能力。A、智能客服B、智能预测C、智能座席D、智能服务【正确答案】:AC16.数据增值存在于哪些过程中()。A、数据对象的封装B、数据系统的研发C、数据的集成应用D、基于数据的创新【正确答案】:ABCD17.以下有关生成对抗网络的说法正确的是()。A、生成器可以由Autoencoder实现B、生成器用来产生带有随机噪声的一定分布数据和真实样本数据的映射关系,判别器用来区别实际数据和生成器产生的数据C、生成器和判别器需要交替训练,不断增加两者的性能,直至达到某种博弈的平衡D、生成器和判别器的代价函数在训练过程中是同时优化的【正确答案】:ABC18.下列关于RNN、LSTM、GRU说法正确的是(__)。A、RNN引入了循环的概念B、LSTM可以防止梯度消失或者爆炸C、GRU是LSTM的变体D、RNN、LSTM、GRU是同一神经网络的不同说法,没有区别【正确答案】:ABC19.下面是Python的特点和优点是()。A、解释性B、动态特性C、面向对象D、语法简洁【正确答案】:ABCD20.Spark的部署模式包括()。A、本地模式B、standalone模式C、SparkonyarnD、mesos模式【正确答案】:ABCD21.预剪枝使得决策树的很多分子都没有展开,会导致()。A、显著减少训练时间开销B、显著减少测试时间开销C、降低过拟合风险D、提高欠拟合风险【正确答案】:ABCD22.关于总体和样本的说法,正确的是:A、总体也就是研究对象的全体B、如果总体是某一条生产线上生产的全部产品,那么样本可以是每间隔10秒抽取的产品C、样本是从总体的随机抽样D、如果总体是某一小学的1000名学生,那么样本可以是一年级的100名学生【正确答案】:ABC23.深度学习的实质及其与浅层学习的说法正确的是(__)。A、DL强调模型深度B、DL突出特征学习的重要性.特征变换+非人工C、没有区别D、以上答案都不正确【正确答案】:AB24.下列说法正确的是()。A、cookielib库提供可存储cookie的对象,以便于与urllirequest库配合使用来进行访问B、过于频繁的爬虫不会带给网站额外的压力C、使用split()可以进行字符串的拆分D、正则表达式可以实现对爬取信息的快速过滤【正确答案】:ACD25.在假设检验中,当原假设为“伪”,但数据分析人员没有拒绝它时犯的错误叫()。A、α错误B、β错误C、取伪错误D、弃真错误【正确答案】:BC26.在Spark中,弹性分布式数据集的特点包括()。A、可分区B、可序列化C、可直接修改D、可持久化【正确答案】:ABD27.空间域滤波是直接以图像中的像素操作为基础的滤波,空间滤波器有时也可称为()。A、空间掩膜B、核C、模板D、窗口【正确答案】:ABCD28.参考数据用于对其他数据进行分类,通常是静态,并有一个有限的可选值范围,下列哪些数据属于参考数据()。A、组织机构B、电压等级C、物料D、合同类型【正确答案】:BD29.完整性约束通常包括()A、实体完整性B、域完整性C、参照完整性D、用户定义完整性【正确答案】:ABCD30.卷积神经网络使用()关键技术来利用自然信号的属性。A、局部连接B、权值共享C、多卷积核D、池化【正确答案】:ABCD31.我们希望减少数据集中的特征数量。你可以采取以下哪一个步骤来减少特征()。A、使用正向选择法(ForwardSelection)B、使用反向消除法(BackwardElimination)C、逐步选择消除法(Stepwise)D、计算不同特征之间的相关系数,删去相关系数高的特征之一【正确答案】:ABCD32.感知机能容易实现逻辑(__)、(__)、(__)运算A、加减B、与C、或D、非【正确答案】:BCD33.大数据计算服务中,表ods_sale_detail存放的是销售明细记录,建表语句如下:createtableods_sale_detail(sale_datedatetime,regionstring,amtdecimal);其中sale_date字段表示销售的日期,amt表示销售金额,想要找出所有汇总销售额大于10000的日期以及当日的销售额,以下()SQL可以达到这个目的。A、selectsale_date,sum(amt)fromods_sale_detailgroupbysale_datewhereamt>10000;B、selectsale_date,sum(amt)fromods_sale_detailgroupbysale_datewheresum(amt)>10000;C、selectsale_date,sum(amt)fromods_sale_detailgroupbysale_datehavingsum(amt)>10000;D、select*from(selectsale_date,sum(amt)s_amtfromsale_dategroupbysale_date)subwheres_amt>10000;【正确答案】:CD34.语音识别的方法包括()。A、声道模型方法B、模板匹配的方法C、利用人工神经网络的方法D、语音知识方法【正确答案】:ABCD35.以下()属于数据统计分析工具。A、WekaB、SASC、SPSSD、Matlab【正确答案】:ABCD36.应用层表命名:ADS_{数据域简称}_{项目名简称}_{自定义表名}_{刷新周期编码}{分区增量编码}。其中()()为非必填。A、{刷新周期编码}B、{分区增量编码}C、{项目名简称}D、{自定义表名}【正确答案】:AB37.卷积神经网络中常用的池化函数包括()。A、最大池化函数B、L2范数C、相邻矩形区域内的平均值D、基于据中心像素距离的加权平均函数【正确答案】:ABCD38.在建立模型时,需要用到()。A、训练数据B、测试数据C、原始数据D、验证数据【正确答案】:ABD39.技术中台是企业级技术能力共享平台。通过对技术能力持续的平台化沉淀,为业务中台、数据中台及前台提供()的技术创新共享服务,助力企业数字化应用快速建设。A、统一B、易用C、便捷D、强健【正确答案】:ABD40.以下哪些模型结构中出现循环连接的结构A、LSTMB、GRUC、TransformerD、text-convolution【正确答案】:ABC41.MapReduce与HBase的关系,哪些描述是正确的()。A、两者不可或缺,MapReduce是HBse可以正常运行的保证B、两者不是强关联关系,没有MapReduce,HBase可以正常运行C、MapReduce可以直接访问HbaseD、它们之间没有任何关系【正确答案】:BC42.主要面向或关注“过去”的数据分析过程为:A、描述性分析B、诊断性分析C、预测性分析D、规范性分析【正确答案】:AB43.以下属于物化算子的有:()。A、ResultB、SortC、AggD、Material【正确答案】:BCD44.相对于普通的神经网络,循环神经网络(RNN)的“循环”主要体现在()。A、训练过程中的反向传播次数更多B、训练经过一定轮次之后将参数归零C、深层节点的输出会反过来影响浅层节点D、每个节点自循环【正确答案】:CD45.对于Maxcompute的多路输出(multiinsert),()描述是不正确的。A、对于源表为分区表的,相同的一个分区不能出现多次B、目标表为分区表的,对于不同的分区,可以混合使用insertC、一般情况下,单个sql中最多可以写128路输出D、对于源表为未分区表的,该表可以出现多次【正确答案】:BCD46.哪些是深度学习快速发展的原因?A、现在我们有了更好更快的计算能力。B、神经网络是一个全新的领域。C、我们现在可以获得更多的数据。D、深度学习已经取得了重大的进展,比如在在线广告、语音识别和图像识别方面有了很多的应用【正确答案】:AC47.在大数据计算服务SQL中使用distributeby和sortby可以对数据进行局部排序,以下对distributeby、sortby的用法描述正确的有:()。A、数据会按照distributeby指定的列进行分片,hash值相同的数据会在一个分片中B、使用sortby子句时,必须有distributeby子句C、sortby和orderby的用法没有区别D、在一个分片中,数据会按照sortby指定的列进行局部排序【正确答案】:ABD48.依据《信息安全技术网络安全等级保护基本要求》《信息安全技术个人信息安全规范》等标准文件,落实数据()、()、()和()等技术要求。A、完整性B、保密性C、备份恢复D、个人信息保护【正确答案】:ABCD49.电力大数据服务社会治理,具体是指()。A、助力智慧城市科学发展B、助力乡村振兴战略落地C、助力经济社会绿色发展D、助力突发事件研判【正确答案】:ABCD50.下列跟人工智能场景相关的是()。A、图像识别B、人脸识别C、语音识别D、语义分析【正确答案】:ABCD51.大数据计算服务(MaxCompute,原ODPS)中的MapReduce是一种编程模型,用于大规模数据集的并行运算,它极大地方便了编程人员在不会分布式并行编程的情况下,将自己的程序运行在分布式系统上。其中,两个主要阶段Map和Reduce相互配合,可以完成对海量数据的处理。关于这两个阶段的关系,说法正确的有:()。A、一个reduce的输入数据可能来自于多个map的输出B、一个MR处理可以不包括任何mapC、一个MR处理可以不包括任何reduceD、一个map的输出结果可能会被分配到多个reduce上去【正确答案】:ACD52.以下哪几项属于汉语未登录词的类型()。A、存在于词典但出现频率较少的词B、新出现的普通词汇C、专有名词D、专业名词和研究领域名称【正确答案】:BCD53.随机森林的随机性主要体现在()。A、决策树选择的随机性B、数据集的随机性C、待选特征的随机性D、参数选择的随机性【正确答案】:BC54.大数据计算服务中,检查数据何时被修改时需要参考lastmodifiedtime属性,对于分区表,在分区级别和表级别都有lastmodified属性。对此属性的影响,以下描述正确的有:()。A、更新一个分区中的数据时,只会影响该分区的lastmodifiedtime属性B、更新一个分区中的数据时,表的lastmodifiedtime属性会被更新C、更新一个分区中的数据时,分区的lastodifiedtime属性会被更新D、更新一个分区中的数据时,不会更新表和分区的lastmodifiedtime【正确答案】:BC55.下列哪几种神经网络结构会发生权重共享()。A、卷积神经网络AlexNetB、循环神经网络LSTMC、卷积神经网络ResNetD、全连接神经网络【正确答案】:ABC56.python中,字符串格式化的方式()。A、%格式化B、str.format()C、inD、input【正确答案】:AB57.相对于DNN模型,CNN模型做了哪些改变?A、局部连接B、使用了relu激活函数C、参数共享D、增加了batch【正确答案】:AC58.噪声数据的产生原因主要有()。A、数据采集设备有问题B、在数据录入过程中发生了人为或计算机错误C、数据传输过程中发生错误D、由于命名规则或数据代码不同而引起的不一致【正确答案】:ABCD59.下列的哪种方法可以用来降低深度学习模型的过拟合问题?A、增加更多的数据B、使用数据扩增技术(dataugmentation)C、使用归纳性更好的架构D、正则化数据【正确答案】:ABCD60.列存表有以下哪些特性:A、insert效率高B、适用于OLAPC、select效率高D、update效率高【正确答案】:BC61.RNN在NLP领域的应用包括(__)。A、语言模型与文本生成B、机器翻译C、语音识别D、图像描述生成【正确答案】:ABCD62.训练CNN时,GPU显存溢出,此时可以采取什么办法()A、减少mini_batch大小B、移除一些卷积层C、减少图片输入大小D、增加激活函数【正确答案】:ABC63.在决策树基本算法中,有三种情形会导致递归返回,这三种情形分别是(__)。A、当前结点包含的样本全属于同一类别,无需划分B、当前属性集为空,或是所有样本在所有属性上取值相同,无法划分C、当前结点包含的样本集合为空,不能划分D、当前结点包含的样本不属于同一类别,不可划分【正确答案】:ABC64.以下关于卷积神经网络,说法不正确的是?A、卷积神经网络只能有一个卷积核B、卷积神经网络可以有多个卷积核,但是必须同大小C、卷积神经网络可以有多个卷积核,可以不同大小D、卷积神经网络不能使用在文本这种序列数据中【正确答案】:ABD65.通过互联网电子渠道交互数据时,对需利用互联网电子渠道交互或发布用户的业务数据,应采用符合公司安全防护方案的业务数据交互方式,并经()测评。A、公安机关B、安全保密机构C、安全专家委员会审查D、安全检测机构【正确答案】:CD66.以下()是一元通用函数。A、np.add()B、np.maximum()C、np.exp()D、np.sqrt()【正确答案】:CD67.下列既可以用于分类,又可以用于回归的机器学习算法有:A、k近邻B、逻辑回归C、决策树D、线性回归【正确答案】:AC68.下列关于自然语言处理中的关键词提取的说法正确的是()。A、关键词提取是指用人工方法提取文章关键词的方法B、TF-IDF模型是关键词提取的经典方法C、文本中出现次数最多的词最能代表文本的主题D、这个问题设计数据挖掘,文本处理,信息检索等领域【正确答案】:BD69.以习近平新时代中国特色社会主义思想为指导,全面贯彻习近平总书记关于网络强囯的重要思想和国家网络空间安全战略、国家大数据发展战略,认真落实囯务院国资委加强合规管理、建设法治央企工作部署,紧扣()要求,秉持“引领规范、支撑推动”理念。A、稳B、进C、育D、开【正确答案】:ABCD70.大数据应用建设及运营过程中如发生数据安全问题,应立即暂停大数据应用建设或运营工作,向____、____、法规部及相关专业管理等部门报告。A、数字化部B、信通公司C、安规部D、总师室【正确答案】:AC71.以下哪些属于深度学习中的优化算法()。A、SGDB、AdamC、MomentumD、MSELoss【正确答案】:ABC72.下列哪个神经网络结构会发生权重共享。A、卷积神经网络B、循环神经网络C、全连接神经网络D、Softmax层【正确答案】:AB73.为了保证应用获得可预期的性能,需要设置OTS表的()。A、预留存储空间B、预留处理内存C、预留写吞吐量D、预留读吞吐量【正确答案】:CD74.数据应用的重点业务中赋能电网转型升级包括()。A、优化人员配置B、优化生产运行C、优化设备管控D、优化能源配置【正确答案】:BCD75.区块链是()等计算机技术的新型应用模式。A、分布式数据存储B、点对点传输C、共识机制D、加密算法【正确答案】:ABCD76.进一步完善数据共享负面清单,持续开展与客户、供应商等各类合作协议的梳理和修订,增加数据在公司内部流转的()条款,推动跨专业数据贯通融合和价值挖掘。A、授权B、书面C、同意D、协商【正确答案】:AC77.在Windows系统中通过Geany编写Python程序,运行Python程序的常用步骤是()。A、菜单Build>ExecuteB、茉单Execute>BuildC、按F5D、按F10【正确答案】:AC78.关于ADS和DMS功能,说法正确的有:()。A、可以进行用户和权限管理B、可以导入数据C、可以进行DB容量管理D、可以查看性能报告【正确答案】:ABCD79.公司各单位互联网职能管理部门是本单位大数据应用工作的归口管理部门,负责A、负责本单位大数据应用工作计划编制与推进落实;B、负责协调跨专业大数据应用建设;C、负责本单位大数据应用成果管理,编制成果推广目录;D、负责本单位大数据应用人才培养,组建本单位大数据应用专家人才库;E、负责本单位大数据对外合作交流工作【正确答案】:ABCDE80.促进能源大数据分类洞察、供需匹配、策略优化的产品化,强化大数据服务业务创新及市场化运营能力,打造()创新点。A、电力服务B、能源服务C、金融服务D、数据增值服务【正确答案】:CD81.下列有关Flume的描述正确的是()。A、Flume具有一定的容错性;B、Flume使用Java编写;C、Flume不支持failover;D、Flume是一个分布式的轻量级工具,适应各种方式的数据收集;【正确答案】:ABD82.ADS的数据导人job提交后,可以通过:()方法查询当前的导入状态。A、使用log命令:logB、使用命令:showstatusforC、用SQL:selectstatefrominformation_schema.current_jobwherejob_id='<jobid>'D、使用DMS,通过菜单项查看:导入导出=>导入状态【正确答案】:CD83.以下哪些应用适合使用循环神经网络来完成?()。A、看图说话B、机器翻译C、社交网络用户情感分类D、从一张合影照片找到特定的人【正确答案】:ABC84.关于Maxcompute中tunnelupload的分隔符,说法正确的是:()。A、列分隔符不能包含行分隔符B、支持多个字符的行列分隔符C、转义字符分隔符,在命令行方式下在只支持\r、\n和\tD、缺省为空格【正确答案】:BC85.通常情况下,通过DataWorks的工作空间实现数据开发和运维,包含以下操作:A、建表并上传数据B、创建业务流程、同步任务C、设置周期和依赖D、运行及排错【正确答案】:ABCD86.严格采取()的方式收集数据,对照法律法规、规章、国家与行业标准,区分数据收集对象和收集方式,制定有效的安全管理策略和保障措施。A、合规B、合法C、最小化D、正当【正确答案】:BD87.深度神经网络的构成中,把卷积层放在前面,全连接层放在后面。以下说法正确的是?A、用卷积层提取特征B、pooling的下采样能够降低overfittingC、全连接层只能有一层D、激活函数relu可以用到卷积层【正确答案】:ABD88.企业中台按照中台架构可以分为:A、服务中台B、业务中台C、数据中台D、管理中台E、技术中台【正确答案】:BCE89.浙江数据中台部署方式A、一级部署B、二级部署C、三级部署D、集中部署【正确答案】:ABD90.常用的代价函数有()。A、均方误差B、均方根误差C、平均绝对误差D、交叉熵【正确答案】:ABCD91.下列算法,哪些属于深度学习模型A、支持向量机SVMB、深度残差网络C、集成学习GBDTD、卷积神经网络CNN【正确答案】:BD92.下面关于Python中的列表和字典说法正确的是()。A、字典和列表都可以通过“[]”操作符访问元素的值B、列表的索引必须是整型数或者切片C、字典不过是列表的另一个名字。二者没有区别D、字典的长度是动态的,而列表的长度是固定的【正确答案】:AB93.哪些是离线批处理的特点?A、处理数据量巨大,PB级B、处理时间要求高C、容易产生资源抢占D、多个作业调度复杂【正确答案】:ACD94.下面对LDA判别分析的思想描述正确的是()。A、同类样例的投影点尽可能近B、异类样例的投影点尽可能远C、同类样例的投影点尽可能远D、异类样例的投影点尽可能近【正确答案】:AB95.下列哪些情况下SOL自诊断可以识别,并上报告警信息?A、数据倾斜。B、SQL语句不下推C、大表Broadcast.D、HashJoin中大表做内表【正确答案】:ABCD96.当MaxCompute中某个字段取值为double,以下说法正确的是:()。A、double类型中使用丨nf表示无穷大B、double类型中使用标识无穷小C、所有数据类型都可以有空值Datetime类型默认支持时区为GMT+8【正确答案】:ACD97.关于Inception网络下面哪些说法是正确的()。A、Inception网络包含了各种网络的体系结构(类似于随机删除节点模式,它会在每一步中随机选择网络的结构)因此它具有随机删除节点的正则化效应B、Inception块通常使用1x1的卷积来减少输入卷积的大小,然后再使用3x3和5x5的卷积C、一个inception块允许网络使用1x1,3x3,5x5的和卷积个池化层的组合D、通过叠加inception块的方式让inception网络更深,不会损害训练集的表现【正确答案】:BC98.下面关于中台架构,中台之间关系说法正确的是()A、数据中台接收业务中台传输的数据,通过大数据算法、建模等技术,对数据进行清洗加工和分析处理B、其结果支撑业务中台供前端业务应用即时调用C、前端业务应用产生的新数据又流转到数据中台形成闭环D、技术中台为业务中台、数据中台分别提供相应的技术服务。【正确答案】:ABC99.关于MaxCompute的视图的描述,下列正确的是:()。A、视图可以引用视图,包括自身B、创建视图时,必须对引用表有读权限C、如果想保存当前视图中的数据,可以插入一张表或者使用物化视图D、视图只能包含一个有效的select语句【正确答案】:BD100.根据业界研究,企业数字化转型在()三方面都呈现出新的趋势A、要素驱动B、流程变革C、技术创新D、价值创造【正确答案】:ABD1.《国家电网有限公司数据管理办法》指出:坚持问题导向,以业务和应用为驱动,加强数据管理,满足生产需要、促进业务发展、创造业务价值。A、正确B、错误【正确答案】:B2.数据管理方面,健全规范公司数据管理标准,构建统一数据模型(SG-IMS)。A、正确B、错误【正确答案】:B3.电网生产数字化转型方面,实现电网数据与业务数据融通共享,电网全景“一览无遗”、智能业务“一键生成”、协同作业“一线贯通”,有力提升湖南公司能源保障及系统运行可靠性。A、正确B、错误【正确答案】:A4.在互联网大区传输重要数据时应加密保护,采用公司统一密码基础设施签发的密钥或证书。A、正确B、错误【正确答案】:A5.数字化转型既符合中央精神和国家工作要求,也高度契能源互联网的内涵和发展重点,更加具有时代特色。A、正确B、错误【正确答案】:A6.PCA的步骤包括构建协方差矩阵、矩阵分解得到特征值和特征向量、特征值排序、特征值归一化。A、正确B、错误【正确答案】:B7.预测性分析用于发现隐藏在大型数据集中的有意义联系。A、正确B、错误【正确答案】:B8.当簇具有非球形形状时,K-means很难检测到自然的簇。A、正确B、错误【正确答案】:A9.进行数据抽样操作时,需要指定要进行抽样的时间以及要进行抽样的数据记录的条数限制。()A、正确B、错误【正确答案】:A10.提供数据产品服务的社会公益类流程包括需求受理、保密合规审核、签订合同(协议)、提供服务四个环节A、正确B、错误【正确答案】:B11.Kafka通过每个Producer分配唯一ID避免任务重复执行。A、正确B、错误【正确答案】:A12.从事数据交易中介服务的机构提供服务,应当要求数据提供方说明数据来源,审核交易双方的身份,但不能留存审核、交易记录。A、正确B、错误【正确答案】:B13.分类器的期望误差不受训练数据可变性的影响,因为训练集合的决策边界相同。A、正确B、错误【正确答案】:B14.ADS的高度智能优化策略是指:CBO。A、正确B、错误【正确答案】:A15.参考数据是对特定数据项允许取值集合的名称、代码值、含义、用途的规范定义。A、正确B、错误【正确答案】:A16.开展大数据应用成果年度征集遴选工作,印发大数据应用成果集,发布推介年度大数据应用优秀成果。A、正确B、错误【正确答案】:A17.预测性分析是一种将知识转换为智慧的分析过程。A、正确B、错误【正确答案】:B18.("x){P(x)àP(x)}消去蕴含符号得:($x){ØP(x)ÚP(x)}。A、正确B、错误【正确答案】:B19.推进基础资源商业化运营。深入挖掘公司现有场站、杆塔、沟道等电网基础资源的共享渠道和应用潜能,面向运营商、互联网企业等推进基础资源商业化运营,提高存量资产利用效率。可以适当降低安全底线。A、正确B、错误【正确答案】:B20.开展涉及国家秘密的数据处理活动,应当遵循国家有关法律法规要求。A、正确B、错误【正确答案】:A21.单个谓词是谓词公式。A、正确B、错误【正确答案】:A22.《中华人民共和国数据安全法》首次提出了“重要数据”概念。A、正确B、错误【正确答案】:B23.加强数据对外开放的底层设计,统筹推进公司数据开放工作,建立规范的数据开放标准、流程,实现数据有序对外开放。A、正确B、错误【正确答案】:B24.数据安全,是指通过采取必要措施,确保数据处于有效保护和合法利用的状态,以及具备保障持续安全状态的能力。A、正确B、错误【正确答案】:A25.当相关系数r=0时,说明现象之间完全无关.A、正确B、错误【正确答案】:B26.各单位要坚持维护数据安全和促进数据开发利用并重,以数据开发利用促进数据安全,以数据安全保障数据开发利用和产业发展。A、正确B、错误【正确答案】:A27.虚假数据的存在会影响数据分析的信度。A、正确B、错误【正确答案】:A28.2021年,公司科技互联网专业需制定并印发《国网湖南电力新兴业务职责建议方案》、《1+10新兴产业升级专项行动方案》,结合“转抓强”主题活动为总抓手,高位推动新兴产业升级攻坚工程落实见效。A、正确B、错误【正确答案】:A29.各业务部门参考互联网部评价标准对各二级单位的数据质量管理工作进行评价并制定考核规定。A、正确B、错误【正确答案】:A30.2021年公司数据增值服务工作的总体布局为“一体四翼”。A、正确B、错误【正确答案】:A31.开展数据处理活动应当加强风险监测,发现数据安全缺陷、漏洞等风险时,应当立即采取补救措施;发生数据安全事件时,应当立即采取处置措施,按照规定不用及时告知用户并向有关主管部门报告。A、正确B、错误【正确答案】:B32.公司各级业务部门负责重要数据相关业务系统开通、数据采集、使用和发布环节的安全审核。A、正确B、错误【正确答案】:A33.基于数据共享需求和专业审核意见,国网互联网部从数据归口管理角度,组织对数据安全、合规、技术方式等进行审核、确认。A、正确B、错误【正确答案】:A34.K-means在进行邻近性度量时的距离是欧几里得距离。A、正确B、错误【正确答案】:B35.采集个人信息数据时,遵循合法、正当、必要、最小化、准确性、可问责性的原则下,无需获得个人信息主体同意。A、正确B、错误【正确答案】:B36.直接提供明细数据的社会公益类流程包括需求受理、需求分析与初审、保密合规审核、数据归口审核、签订合同(协议)、提供服务六个环节A、正确B、错误【正确答案】:A37.RDD中的数据被分区存储在集群中,使得任务可以并行执行。A、正确B、错误【正确答案】:A38.开展冬奧对旅游等关联行业协同发展分析,能够研判冬奥赛区及周边经济运行与人员流动状况,助力冬奥拉动区域及产业发展。A、正确B、错误【正确答案】:A39.数字化转型是数据业务化的过程,重点是挖掘数据价值,打造数字生态,赋能传统产业,拓展新兴产业,一般包括产业数字化和数字产业化两个方面。A、正确B、错误【正确答案】:A40.使用MaxcomputeSQL:createtablet1liket2;建表时,表t1不会具有表t2的生命周期属性。A、正确B、错误【正确答案】:A41.国网湖南省电力有限公司数字化系统深化应用促基层减负专项行动,营销专业反馈问题最多的是新增需求A、正确B、错误【正确答案】:A42.下列函数中,time()是Python内置函数。A、正确B、错误【正确答案】:B43.数据责任部门结合实际应用需要,在线提出数据共享需求,明确数据范围、数据用途、数据获取方式等。A、正确B、错误【正确答案】:B44.政府监管类主要包括需求受理、需求分析与初审、数据归口审核、签订合同(协议)、提供服务五个环节A、正确B、错误【正确答案】:B45.实时在线数据分析服务,主要指对数据更新频率要求为日级以下数据进行流式加工处理的功能需求。A、正确B、错误【正确答案】:A46.统筹公司数据、知识、成果等资源围绕数据中台打造开放式的大数据应用发展模式,能够推动资源共享和跨界融合,主动融入新发展格局,带动产业链上下游共同发展构建互利共赢的能源数字新生态。A、正确B、错误【正确答案】:A47.图搜索算法中,CLOSE表用来登记待考察的节点A、正确B、错误【正确答案】:B48.打造源网荷储协同互动服务。就是挖掘负荷侧资源潜力,推动各类电源、电网、负荷和储能协同优化,提升电网协调控制能力和客户用能效率,促进清洁能源消纳。A、正确B、错误【正确答案】:A49.阶跃函数与sigmoid函数均为典型激活函数()。A、正确B、错误【正确答案】:A50.启发式搜索一定比盲目式搜索好A、正确B、错误【正确答案】:B51.Apriori算法是一个聚类算法。A、正确B、错误【正确答案】:B52.语义网络系统由两部分组成:由语义网络组成的知识库和用于求解问题的解释程序即推理机。A、正确B、错误【正确答案】:A53.特征提取技术并不依赖于特定的领域。A、正确B、错误【正确答案】:B54.公司数据中台初步建成,汇聚166套业务系统(137套二级部署系统、29套一级部署系统)核心数据、调控云和采集系统的实时数据,以及石油、煤炭、天然气、水资源、发电等企业外部数据。A、正确B、错误【正确答案】:A55.公司科技互联网专业2021年重点任务:推动“科技创新、数字化、新兴产业”三大工作齐头并进,全面提升公司科技互联网专业管理质效。具体要做好3个方面23项工作。A、正确B、错误【正确答案】:A56.建立横向部门之间、纵向各单位之间职责清晰、分工负责、协同配合的工作机制,共同推动公司数据安全管理工作。A、正确B、错误【正确答案】:B57.基于数据中台组件和能力,研究枃构建

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论