能源大数据应用开发技能竞赛理论考试题（附答案）

上传人：共*** IP属地：河北上传时间：2025-11-09 格式：DOCX 页数：424 大小：494.71KB 积分：12 举报 版权申诉

已阅读5页，还剩419页未读，继续免费阅读

版权说明：本文档由用户提供并上传，收益归属内容提供方，若内容存在侵权，请进行举报或认领

文档简介

能源大数据应用开发技能竞赛理论考试题(附答案)展()风险识别与评估工作。2.总部与各单位按两级贯通模式部署，并支持()成果共享。3.综合类大数据应用管理，主要包括(),由互联网部统一组织A、应用需求参考答案：D4.子集搜索中，逐渐增加相关特征的策略称为()。A、前向搜索B、后向搜索C、双向搜索D、不定向搜索5.资产评估应用实现全链路的数据资产监管和价值追踪，具体包括资产使用评估、()评估和敏感数据评估等功能。A、资产使用评估B、资产价值C、敏感数据评估D、数据质量评估6.重视能力建设，加强大数据应用关键技术研究、软硬件环境建设，推动技术、资源和管理的有机融合，建立常态化人才培养机制，持续提升公司大数据(),为公司数字化转型注入强大动力。A、分析挖掘能力B、应用开发能力C、特征处理能力D、安全管理能力A、大前台，强中台，活后台B、活前台，大中台，强后台C、小前台，强中台，大后台D、大前台，强中台，活后台参考答案：B8.中台的出发点和落脚点A、高效便捷可复用B、稳定高效便捷C、敏捷高效可复用D、稳定便捷可复用9.智能电网综合支撑技术，在()的智能电网管理及运维关键技术中，应用大数据和先进计算技术，研究电网设备状态信息集成A、分布节能B、高效节能C、集约高效D、分布高效10.至十四五末，公司全面建成企业中台，企业中台公共服务共享使用率达到()D、以上答案都不正确12.长短时记忆网络属于一种()。A、全连接神经网络D、双向RNN13.长短时记忆神经网络被设计用来解决什么问题?()A、传统RNN存在的梯度消失/爆炸问题B、传统RNN计算量大的问题C、传统RNN速度较慢的问题D、传统RNN容易过过拟合的问题14.在做CNN时，输入图片大小为37×37,经过第一层卷积层(有25个卷积核，每个卷积核的大小为5×5,不做填充，步长为1),与池化层(Maxpooling大小为3×3,不做填充，步长为1),输出图片再通过一次卷积层(有100个卷积核，每个卷积核的大小为4×4,不做填充，步长为1),与池化层maxpooling(Maxpooling大小为2×2,不做填充，步长为1),最终输出特征图大小为()。参考答案：C15.在支持向量机中，核函数的主要作用是()。A、将低维空间中线性不可分的数据映射到高维空间，使其线性B、将高维空间中线性不可分的数据映射到低维空间，使其线性C、将高维空间中线性可分的数据映射到低维空间，使其线性不D、将低维空间中线性可分的数据映射到高维空间，使其线性不16.在一个神经网络中，下面哪种方法可以用来处理过拟合()B、分批归一化(BatchD、都可以18.在选择神经网络的深度时，下面哪些参数需要考虑?1神经网络的类型(如MLP,CNN);2输入数据；3计算能?(硬件和软件能?决定);4学习速率；5映射的输出函数。19.在线性回归中，最小二乘法就是试图找到一条直线，使所有样本到直线上的()之和最小。A、欧式距离B、城市距离C、余弦距离20.在下列哪些应用中，可以使用深度学习来解决问题?A、蛋白质结构预测B、化学反应的预测C、外来粒子的检测21.在梯度下降算法中，通常采用多种策略避免()A、全局最小B、局部最小C、全局最大D、局部最大参考答案：B22.在数据集中，记录关于一个事件或对象的描述称为()。B、元素C、属性D、样本参考答案：D23.在输出层不能使用以下哪种激活函数来分类图像?24.在手写数字识别的例子中，输入的图片为长和宽都是28像素的图片，输出判断数字0-9的概率。要构建前馈型神经网络去解决这个问题，输入层是()维的，输出层是()维的参考答案：C25.在实现前向传播和反向传播中使用的“cache”是什么A、它用于跟踪我们正在搜索的超参数，以加速计算B、用于在训练期间缓存代价函数的中间值C、我们使用它传递反向传播中计算的变量到相应的前向传播步骤，它包含对于前向传播计算导数有用的变量D、我们使用它传递前向传播中计算的变量到相应的反向传播步骤，它包含对于反向传播计算导数有用的变量26.在神经网络中，以下哪种技术用于解决过拟合()。A、减少网络容量B、添加权重正则化参考答案：D27.在情感分析任务中，其目的是将无结构化的情感文本转化成计算机容易识别和处理的结构化文本，进而供情感分析上层的研究和应用服务的是()A、情感信息检索B、情感信息抽取C、情感信息分类D、情感信息归纳参考答案：B28.在聚类分析任务中，簇内相似度()且簇间相似度()时，聚类效果比较好。A、低，低B、低，高C、高，低D、高，高参考答案：C29.在回归分析中，说法正确的是()。A、解释变量和被解释变量都是随机变量B、解释变量为非随机变量，被解释变量为随机变量C、解释变量和被解释变量都为非随机变量D、解释变量为随机变量，被解释变量为非随机变量30.在回归分析中，代表了数据点和它在回归直线上相应位置的差异的是：()。A、总偏差平方和B、残差平方和C、回归平方和D、相关指数R231.在抽样方法中，当合适的样本容量很难确定时，可以使用的抽样方法是()。A、有放回的简单随机抽样B、无放回的简单随机抽样C、分层抽样D、渐进抽样32.在池化中，当步长小于卷积核的大小时会称为重叠池化。与非重叠池化相比，下面哪个不是重叠池化的优点?()A、损失信息少B、获得的图像特征更丰富C、提高卷积神经网络的正确率D、减少计算量参考答案：D33.在SQL查询时，使用WHERE子句指出的是(?)A、查询目标B、查询结果C、查询条件D、查询视图34.在OneData方法论中，OneService理论描述错误的是哪项()?A、数据标准化B、主题式数据服务C、统一但多样化数据服务D、跨源数据服务35.在MySQL中，通常使用()语句来进行数据的检索、输出操36.在MapReduce中，哪个组件是用户不指定也不会有默认的()37.在MapReduce中，reduce()函数可以将()值相同的输入进行合并处理。参考答案：B38.在InceptionNet中，使用()和单层的全连接层替换掉了VCG的三层全连接层。A、全局最大池化层B、全局最小池化层C、卷积层D、全局平均池化层参考答案：D39.在Hadoop的分区阶段，默认的Partitioner是()。D、用户自定义的Partitioner参考答案：C40.在《国家电网公司“十三五”科技战略研究报告》中指出，十二五期间“先进计算与电力大数据技术取得良好开端”,主要体现在：在()及专业应用实现基础上，探索了大数据平台基础体系架构与应用规范A、技术中台B、公司一体化信息平台C、公司统一管理平台D、数据中台41.运行以下程序，从键盘输入1+2与4j,则输出结果是：x=eval(input())y=eval(input()42.运行下面的代码后，变量n的类型是()。n={}C、未知类型参考答案：D43.阅读以下文字：假设我们拥有一个已完成训练的、用来解决车辆检测问题的深度神经网络模型，训练所用的数据集由汽车和卡车的照片构成，而训练目标是检测出每种车辆的名称(车辆共有10种类型)。现在想要使用这个模型来解决另外一个问题，问题数据集中仅包含一种车(福特野马)而目标变为定位车辆在照片中的位置A、除去神经网络中的最后一层，冻结所有层然后重新训练B、对神经网络中的最后几层进行微调，同时将最后一层(分类层)更改为回归层C、使用新的数据集重新训练模型D、所有答案均不对44.语音识别的应用场景包括()A、语音转文本B、语音合成C、人机交互45.语句np.random.randn(5,4)的运算结果是()。A、生成一个5行4列的随机矩阵B、将矩阵的第5行第4列改成一个随机值C、将矩阵的第4行第3列改成一个随机值D、将矩阵的第5列和第4列都用随机值代替46.有一个44x44x16的输入，并使用大小为5x5的32个卷积核进行卷积，步长为1,无填充(nopadding),输出是多少?()参考答案：B47.有关深度学习加速芯片，以下的说法中不正确的是：A、GPU既可以做游戏图形加速，也可以做深度学习加速B、用于玩游戏的高配置显卡，也可以用于深度学习计算。D、FPGA最早是作为CPLD的竞争技术而出现的下说法中不正确的是：()。A、将数据分组部署在不同GPU上进行训练能提高深度神经网络的训练速度。B、TensorFlow使用GPU训练好的模型，在执行推断任务时，也必须在GPU上运行。C、将模型中的浮点数精度降低，例如使用float16代替float32,可以压缩训练好的模型的大小。D、GPU所配置的显存的大小，对于在该GPU上训练的深度神经网络的复杂度、训练数据的批次规模等，都是一个无法忽视的影响因素49.有关Hadoop的陈述哪个是错误的()。A、它运行在通用硬件上；B、它是Apache软件基金会(ASD、它是最好的实时流式数据处理框架；E、Hadoop对数据的处理是有延迟的；50.由于不同类别的关键词对排序的贡献不同，检索算法一般把查询关键词分为几类，以下哪一类不属于此关键词类型的是()。A、引用词B、普通关键词C、高频词汇D、扩展关键词51.优化配电网运行，构建()等应用场景，优化停电策略，降低停电影响，提升配电网可靠性。A、精准停电分析B、精准故障抢修C、优化停电策略D、降低停电影响52.优化(),建立设备绩效和供应商业绩之间的关联关系，实现设备质量评价管理闭环，建立健全供应商信用风险评估体系，优化采购模式与供应商管理。A、设备质量监管B、设备物资供应链C、设备供应商管理D、设备质量评价管理53.应严格执行“规划指导计划、计划确定项目、项目安排资金”的要求，制定专项规划，落实投资计划，保障网络安全费用不低于信息化投入的()54.引入激活函数的目的是()A、加入额外的计算单元B、加快计算速度C、增加神经网络模型的非线性D、方便反向传播计算55.银行进行户购买力分析，首先获取户历史账年，确定其中各项南品的计算权重，得出每位客户的购买力评分并存储记录，最后将结果以图表显示。请问该过程对应于以下哪个项目数据流程设A、数据源->数据处理->数据落地->数据可视化B、数据可视化->数据源->数据处理->数据落地56.以下有关国网链平台的说法错误的是()B、总体架构为“一主两侧多从”B、起始框59.以下统计学知识，数据科学中不常用的是()。A、归纳分析法B、描述统计C、推断统计D、基本分析法60.以下算法中不属于基于深度学习的图像分割算法是()。参考答案：D61.以下说法错误的是()A、数据集中每个数据项作为单个图元素表示B、数据可视化技术提供多种数据分析和图形化方法C、数据可视化可以帮助决策者更直观的观察和分析数据D、多维数据无法进行数据可视化62.以下属于深度学习框架的是()。D、以上答案都正确63.以下属于浅层学习模型的是()。参考答案：C64.以下属于Python脚本程序转变为可执行程序的第三方库的65.以下扫描算子中用于对列存表进行扫描的算子是：()。66.以下内容符合物体识别任务的是()。A、不能对图像进行压缩或剪裁B、遵守误差最小准则和最佳近似准则C、可以不指定分类的类别数量D、事先给定样本的分布特征参考答案：B67.以下哪种卷积神经网络的设计引入了残差网络结构()68.以下哪种参数是用*来接收，不是必传的?A、位置参数B、默认值参数C、可变参数D、关键字参数参考答案：C69.以下哪种不是自适应学习率方法()。参考答案：A70.以下哪种不是常用的数据选择方法()A、留一法B、留出法C、十则交叉验证法参考答案：D71.以下哪种不是Hive支持的数据类型()参考答案：D72.以下哪一个是ResNet-18的网络结构?()A、4个残差块各有4个卷积层(不包括恒等映射的1x1卷积层),B、3个残差块各有5个卷积层(不包括恒等映射的1x1卷积层),加上最后一个全连接层C、4个残差块各有3个卷积层(不包括恒等映射的1x1卷积层),D、5个残差块各有3个卷积层(不包括恒等映射的1x1卷积层),73.以下哪一个不是LSTM三个门中的一个门()A、输入门B、遗忘门C、输出门D、迭代门A、训练网络直到达到误差函数中的局部最小值B、在每次训练期后在测试数据集上模拟网络，当泛化误差开始增加时停止训练C、在中心化权重更新中添加一个梯度下降加速算子，以便训练更快地收敛D、更快的方法是反向传播算法参考答案：B75.以下哪项不是公司各级大数据中心、信通公司的负责事项?A、负责组织开展大数据应用平台、服务目录等基础环境建设，保障数据及运营安全，提供数据、算法和算力资源支持B、负责发布存储的数据目录和数据获取渠道C、协同开展大数据应用建设，并参与需求评审、应用推广等工作D、负责大数据应用技术前瞻性研究，负责大数据应用技术架构设计、技术选型验证和信息安全技术保障76.以下哪个是有关数据科学研究目的的原则?()A、DIKUW原则B、5W1H原则C、6S原则D、PDCA原则参考答案：A77.以下哪个不是Spark的组件()78.以下关于最大似然估计MLE的说法正确的是A、MLE中加入了模型参数本身的概率分布B、MLE认为模型参数本身概率是不均匀的C、MLE体现了贝叶斯认为参数也是随机变量的观点D、MLE是指找出一组参数，使得模型产生出观测数据的概率最大79.以下关于字符串类型的操作的描述，错误的是：A、str.replace(x,y)方法把字符串str中所有的x子串都替换成yB、想把一个字符串str所有的字符都大写，用str.upper()C、想获取字符串str的长度，用字符串处理函数80.以下关于人工神经网络(ANN)的描述错误的有()。A、神经网络对训练数据中的噪声非常鲁棒B、可以处理冗余特征C、训练ANN是一个很耗时的过程D、至少含有一个隐藏层的多层神经网络81.以下关于函数的描述，错误的是A、使用函数的目的只是为了增加代码复用B、函数是一种功能抽象C、使用函数后，代码的维护难度降低了D、函数名可以是任何有效的Python标识符82.以下关于traintestsplit函数的说法正确的是()。83.以下关于Python程序的基本语法元素，错误的描述是：A、变量是由用户定义的用来保存和表示数据的一种语法元素B、Python语言只能用4个空格的缩进来实现程序的强制可读性C、变量的命名规则之一是名字的首位不能是数字D、变量标识符是一个字符串，长度是没有限制的参考答案：B84.以下关于Hadoop中MapReduce说法正确的是()。A、可以没有reduce任务B、Reducer输入为随机输入C、shuffle主要实现数据可视化功能D、一个reducer只能从一个map复制所需要的partition85.以下符合大数据问题处理范畴的是：A、1KB数据，1小时内提交结果B、1MB数据，2小时内提交结果C、1GB数据，3小时内提交结果D、1TB数据，0.5小时内提交结果86.以下对Python程序设计风格描述错误的选项是：A、Python中不允许把多条语句写在同一行C、Python语句中，增加缩进表示语句块的开始，减少缩进表示语句块的退出D、Python可以将一条长语句分成多行显示，使用续航符“\”([[10,7,4],[3,2,1]])print(np.p参考答案：B88.以下代码的输出结果为()。a=np.array([[5,3,2],[2,89.以下程序的输出结果是：x=[90','87','90]n=90print(x.print(x)print(ab,end="")myab(ab,2)print93.以下不属于神经网络模型的是()94.以下不属于大数据应用业务规划五大核心领域的是()。C、对内服务96.以下表名不符合数据中台分析层命名规范的是()。97.以下()是数据业务图谱底座具备的功能。A、数据检索B、图谱展示C、动态数据集A、http://service.odps.aliyunB、http://odps-ext.aliyun-C、http://service.odps.hangzhD、http://odps-int.aliyun-99.以下()不属于开源数据湖解决方案。102.以电力数据()服务为核心动能，驱动新兴业务拓展。法估计参数的准则是()。104.已知一组数据X1,X2,X3,X4,X5的平均数是2,方差是1/3,是：()。105.已知池中有两种鱼，比例为7:3,若随机捞上一条，按照70%和30%概率随机猜测其种类，则整体误差最接近于：必须将设置得非常小，以防止发散；这将减慢学习速度。C、这将导致tanh的输入也非常大，导致单元被“高度激活”。与权重从小值开始相比，加快了学习速度。D、这将导致tanh的输入也非常大，从而导致梯度接近于零。因此，优化算法将变得缓慢107.移动平均法是测定(?)的一种较为简单的方法。A、长期趋势B、循环变动C、季节变动D、不规则变动 ()可溯，持续提升科学决策能力、业务运行效率和风险管控水A、问题B、异常D、投诉109.依托数据建模与仿真，实现经营管理的流程可视、()可控、问题可溯，持续提升科学决策能力、业务运行效率和风险管控水A、业务D、运营参考答案：D110.依据《国家电网有限公司数据管理办法》坚持()A、以共享为原则、不共享为例外B、一事一议C、层层审批的数据应用授权方式111.依据《国家电网有限公司数据管理办法》,建立基于负面清单的公司()机制，坚持“以共享为原则、不共享为例外”,改变A、对外数据共享B、对内数据共享C、对外数据交换D、对内数据使用参考答案：B112.依据《国家电网有限公司数据管理办法》,建立基于()的公司对内数据共享机制。A、负面清单B、层层审批C、一事一议D、数据应用113.依据《国家电网有限公司数据管理办法》,建立基于()的公司对内数据共享机制，坚持“以共享为原则、不共享为例外”,改变当前“一事一议”、层层审批的数据应用授权方式。A、负面清单B、管理职责C、运维单位114.依据()等法规制度，保护商业秘密和工作秘密数据。A、《中华人民共和国民法典》B、《中华人民共和国网络安全法》C、《全国人大常委会关于加强网络信息保护的决定》D、《中央企业商业秘密保护暂行规定》115.依据(),建立基于负面清单的公司对内数据共享机制，坚持“以共享为原则、不共享为例外”,改变当前“一事一议”、层层审批的数据应用授权方式。A、《中华人民共和国民法典》B、《中华人民共和国网络安全法》C、《国家电网有限公司数据管理办法》D、《中央企业商业秘密保护暂行规定》116.一组数据有8个特征，计算出其8个特征值从大到小依次为累计百分比达到80%以上的特征值对应的主成分，则至少应选择几个主成分()。117.一位母亲记录了儿子3～9岁的身高，由此建立的身高与年龄的回归直线方程为y=7.19x+73.93,据此可以预测这个孩子10岁时的身高，则正确的叙述是()。B、身高一定超过146.00cmC、身高一定高于145.00cm118.一年四个季度，第二到第四个季度对于上个季度的销售额增长率分别为5%、10%、15%,请问第四个季度相对于第一季度的增长率约为()参考答案：D119.一个卷积层的卷积核大小为5×5,padding为2,stride为1,输出通道为3,没有偏置，对于3×10×10(C×H×W)的输入，其计算量和参数量为()参考答案：A120.一般情况下，整数用十进制表示，如果用其他进制表示一个数，错误的描述选项是：A、0o1010表示一个八进制数B、1010b表示一个二进制数C、Ob1010表示一个二进制数D、0x1010表示一个十六进制数参考答案：B121.业务中台提供“()”创新能力和统一的企业级共享服务，持续提升业务创新效率。A、敏捷、快速、低成本B、快速、便捷、低成本C、敏捷、高效、快速D、高效、便捷、可持续122.业务中台从管理上破除了系统建设的()壁垒，形成灵活、轻量、便捷的共享能力中心A、部门级B、管理级C、公司级D、企业级123.要解决的问题只有少量的数据，但幸运的是有一个之前训练过的针对类似问题的神经网络模型。最佳方案是()。A、对于新的数据集重新训练模型B、冻结除第一层之外的所有层，微调第一层C、评估模型每一层的功能，然后选择其中的某些层D、冻结除最后一层之外的所有层，重新训练最后一层124.要级联删除用户创建的表等数据库对象，使用关键字()。125.严格遵守国家法律、法规和公司相关规定，在保护国家秘密和企业秘密，且不损害公司及客户、供应商等相关方权益的前提下，有序推动数据对外开放，重点防范对外开放过程中的()数据泄露。A、明细C、敏感D、隐私126.训练一个RNN网络，如果权重与激活值都是NaN,下列选项中，哪一个是导致这个问题的最有可能的原因()A、梯度消失B、梯度爆炸C、ReLU函数作为激活函数g(.),在计算g(z)时，z的数值过大了D、Sigmoid函数作为激活函数g(.),在计算g(z)时，z的数值过大了127.训练样本集S含有天气、气温、人体感受、风力4个指标，已知天气的熵为0.694,温度的熵为0.859,人体感受的熵为0.952,风力的熵为0.971,如使用ID3算法，选择()为树模型的分界A、天气B、气温C、人体感受D、风力128.循环神经网络适合处理什么数据()A、节点数据B、序列数据C、结构化数据D、图像数据129.选择神经网络的深度时，对于下面参数：①神经网络的类型 (如MLP,CNN);②输入数据；③计算能力(硬件和软件能力决定);④学习速率；⑤映射的输出函数。需要考虑的是()。130.需要生成一个[a,b]之间的整数，采用下列哪个代码()C、知识产权132.信息系统账号要定期清理，时间间隔不超过()个月。133.向量空间模型的缺陷不包括()。A、维度灾难B、模型稀疏性C、语义信息缺失D、无法计算文本相似度134.相关关系是一种与函数关系区别的非确定性关系，而相关分析就是研究事物或现象之间是否存在这种非确定性关系的统计方法，以下不属于相关性分析方法的是()。A、Pearson相关系数C、Kendall相关系数D、傅里叶系数135.线性判别分析(LDA)从贝叶斯决策理论阐释，当两类数据同先验且满足()时，LDA达到最优分类。A、满足高斯分布B、协方差相等C、满足高斯分布且协方差相等D、协方差不等136.现阶段的大数据技术体系主要类型不包括()。A、数据源与APPB、基础设施D、数据资源137.县级以上地方人民政府有关部门的网络安全保护和(),根据国家有关规定确定。A、调研指导职责B、监督管理职责C、行政执法职责D、制度规划职责138.下面与HDFS类似的框架是()139.下面有关线性判别分析错误的说法是哪个?A、通过对原始的数据进行线性变换，使得不同类的样本尽量分开B、线性变换可以使同类样本的方差变大C、线性变换可以使不同类别样本的距离加大D、提高不同类样本的可分性参考答案：B([[1,2],[3,41])y=np.linalg.iD、以上答案均不正确参考答案：B141.下面算法中属于图像锐化处理的是()。A、低通滤波B、加权平均法142.下面哪种说法有关机器学习的认识是错误的?()A、高质量的数据、算力和算法对一个机器学习项目是必不可少文本等复杂数据。C、机器学习算法很多，后期出现的算法比早期出现的算法性能143.下面哪种不属于数据预处理的方法：()。A、变量代换B、离散化D、估计遗漏值参考答案：D144.下面哪个属于映射数据到新的空间的方法?A、傅立叶变换B、特征加权C、渐进抽样D、维归约145.下面哪个激活函数可以实现max(0,x)的功能()。146.下面哪个程序负责HDFS数据存储()147.下面关于展示数据管理说法不正确的是()A、大厅场景数据应基于数据中台统一获取B、建立大厅数据质量常态巡检核查机制C、不得违规存储、处理涉及敏感数据。D、历史数据需要删除148.下面关于循环神经网络说法错误的是()A、循环神经网络用于静态输出B、循环神经网络通过使用带自反馈的神经元，能够处理任意长度的时序数据C、循环神经网络具有短期记忆能力，相当于存储装置，因此其计算能力十分强大D、循环神经网络时间扩展，神经元与多个时间输出计算149.下面关于聚类分析说法错误的是(?)A、一定存在一个最优的分类B、聚类分析是无监督学习C、聚类分析可以用于判断异常值150.下面关于查看Hive表信息描述正确的是()A、DESC查看表的描述是以建表语句的形式展示的D、查看表的描述是以表格的形式展示的E、使用DESC查看表table1:DESH、TABLE可以查看表的数据参考答案：C151.下面关于Hive四种排序方式的区别，描述正确的是()152.下面关于Hive各个格式使用场景描述错误的是()A、Parquet对于大型查询的类型是高效的，对于扫描特定表格中的特定列的查询，Parquet特别有用B、目前Parquet默认使用gzip压缩格式C、ORC可以支持复杂的数据结构(比如Map等)D、RCFile是一种行列存储相结合的存储方式154.下面代码的输出结果是()。print(0.155.下面不属于池化操作()A、连接池化B、一般池化C、重叠池化D、金字塔池化156.下列选项中，不符合《国家电网有限公司大数据应用管理办法》第二章职责分工第六条的是()。A、审议决策公司数据管理重大事项B、协调解决数据管理重要问题C、对公司数据管理工作进行监督指导D、公司数据管理体系和规章制度建设参考答案：D157.下列选项中，()不是经典图像分割方法A、基于内容的分割方法B、基于阈值的分割方法C、基于边缘的分割方法D、基于基因编码的分割方法158.下列缩进格式描述不正确的是()。A、缩进指在代码行前面添加空格或Tab;B、在Python程序中，缩进不是任意的；C、缩进可以使程序更有层次感、更有结构感，从而是程序更易D、平级的语句行(代码块)的缩进可以不相同。159.下列说法错误的是()A、当目标函数是凸函数时，梯度下降算法的解一般就是全局最优解B、进行D、沿负梯度的方向一定是最优的方向E、利用拉格朗日函数能解带约束的优化问题参考答案：C160.下列属于无监督学习的是()。161.下列哪种业务场景中，不能直接使用Reducer充当CombinerB、max求最大值162.下列哪一种情况被称为过学习现象：A、在训练集上A优于B,在测试集上A也优于BB、在训练集上A优于B,在测试集上B优于AC、相对于分类数据集，决策树过于简单D、在训练集上决策树的误差很小163.下列哪一项在神经网络中引入了非线性()A、随机梯度下降修B、正线性单元(ReLU)C、卷积函数D、以上答案都不正确164.下列哪一项在神经网络中引入了非线性()B、激活函数C、卷积函数D、都不正确参考答案：B165.下列哪一项不是神经网路常用的激活函数()166.下列哪些项所描述的相关技术是错误的?B、L-BFGS使用的是二阶差分(secondC、AdaGrad使用的是二阶差分167.下列哪些不是目前机器学习所面临的问题是()。A、测试集的规模B、维度灾难C、特征工程D、过拟合168.下列哪项关于模型能力(modelcapacity)的描述是正确的?(指模型能近似复杂函数的能力)A、隐层层数增加，模型能力增加B、Dropout的比例增加，模型能力增加C、学习率增加，模型能力增加D、都不正确169.下列哪个神经网络结构会发生权重共享()。A、卷积神经网络B、循环神经网络C、全连接神经网络D、选项A和B170.下列哪个程序通常与NameNode在一个节点启动()参考答案：D171.下列哪个不是专门用于可视化时间空间数据的技术：()。A、等高线图B、饼图C、曲面图172.下列哪个不是专门用于可视化时间空间数据的技术()。A、等高线图B、饼图C、曲面图173.下列描述中不属于数据治理内容的是()A、理解自己的数据B、行为规范的制定C、岗位职责的定义D、获得更多的数据174.下列描述中不属于规整数据(TidyData)三个基本原则的是A、每一类观察单元构成一个关系(表)B、每个观察占且仅占一行C、每个变量占且仅占一列D、每个观察占且仅占一个关系(表)176.下列关于支持向量的说法正确的是()A、到分类超平面的距离最近的且满足一定条件的几个训练样本点是支持向量B、训练集中的所有样本点都是支持向量C、每一类样本集中都分别只有一个支持向量D、支持向量的个数越多越好参考答案：A177.下列关于长短时神经网络的叙述错误的是()。A、引用自循环思想B、产生梯度长时间持续流动的路径C、积累的时间尺度不可以因输入序列而改变D、可应用于语音识别和机器翻译参考答案：C178.下列关于运算符优先级的说法不正确的是()A、运算符按照优先级顺序表进行运算B、同一优先级的运算符在表达式中都是按照从左到右的顺序进行运算的C、同一优先级的运算符在表达式中都是按照从右到左的顺序进行运算的D、括号可以改变运算的优先次序179.下列关于线性回归分析中的残差说法正确是A、残差均值总是为零B、残差均值总是小于零C、残差均值总是大于零D、以上说法都不对180.下列关于误差的说法，正确的是()。A、训练样本容量增加，泛化误差也会增加B、过拟合指数据在训练集上的误差过大C、过拟合可以通过减少模型参数数量解决D、交叉验证不重复使用数据181.下列关于特征编码的叙述中，不正确的是()。A、特征编码是将非数值型特征转换成数值型特征的方法；B、数字编码与特征的排序无关；C、One-Hot编码中，原始特征有n种取值，转换后就会产生nD、哑变量编码解决了One-Hot编码中存在线性关系的问题；182.下列关于随机森林和GBDT的书法正确的是()A、在随机森林的单个树中，树和树之间是有依赖的，而GBDT中的单个树之间是没有依赖的B、这两个模型都使用随机特征子集，来生成许多单个的树C、我们可以并行地生成GBDT单个树，因为它们之间是没有依D、GBDT训练模型的表现总是比随机森林好参考答案：B183.下列关于算法进化的描述错误的是()。A、算法1.0的典型算法是精度分析，是实验分析技术的核心B、算法2.0的典型算法是线性回归，是问卷领域数据分析的核心C、算法3.0的典型算法是数据挖掘类方法，是数据库领域的核心D、算法4.0的典型算法是DM类算法，时超大数据分析的基础184.下列关于数据转换，正确的是()。A、json内的取值只能有统一格式B、pdf文件在不同平台上打开显示不同C、可以通过python将csv文件转换成Excel格式D、excel存储数据的量无限制185.下列关于数据交易市场的说法中，错误的是()。A、数据交易市场是大数据产业发展到一定程度的产物B、商业化的数据交易活动催生了多方参与的第三方数据交易市场C、数据交易市场通过生产数据、研发和分析数据，为数据交易186.下列关于数据分析的说法正确的是()B、诊断性分析是对规范性分析的进一步理解187.下列关于数据仓库最终目的的描述正确的是()B、MAX(全链)聚类中合并距离最远的两个簇C、两个簇合并后，只保留一个簇189.下列关于集成学习方法的说法错误的是()A、Boosting是一族可将弱学习器提升为强学习器的算法B、随机森林是Bagging的一个扩展变体C、随机森林简单、容易实现、计算开销小D、Boosting是个体学习器间不存在强依赖关系、可同时生成的并行化方法190.下列关于机器学习的特征工程步骤的说法，错误的是()。A、数据标准化将具有量纲差异的数据缩小至一个更小的区间内B、数据离散化最终将连续型数据转化为离散型数据C、特征选择仅考虑特征的重要性D、特征构造基于原始数据既有的特征构造新的特征191.下列关于对大数据特点的说法中，错误的是()。A、数据规模大B、数据类型多样C、数据价值密度高D、数据处理速度快192.下列关于tensorflow的描述中，不正确的是()。A、TensorFlow的计算图中每个节点代表一个操作，如加法、减法等B、TensorFlow的张量是作为非子叶节点出现的(注：不能作为非子叶节点出现)C、基于梯度的机器学习算法会受益于TensorFlow的自动求微分能力193.下列关于Sigmoid函数的说法错误的是()。A、存在梯度爆炸的问题B、不是关于原点对称C、计算D、存在梯度消失的问题194.下列关于RBM说法错误的是()。A、学习过程很快B、RBM训练可以看作对一个深层BP网络的网络权值参数的初始化C、RBM不用人工选择特征D、RBM有标签样本集195.下列关于Pytorch的描述中，正确的是()。A、Pytorch可以视作加入了GPU支持的NumpyB、Pytorch采用静态的、命令式的编程语言C、Pytorch的网络都是有向无环图的集合，可以直接定义D、Pytorch的底层代码高度工业化，不容易看懂196.下列关于Python第三方库的安装方法说法错误的是()。A、使用集成安装工具B、使用pip命令C、访问UCI网站下载安装文件D、联系第三方库作者索要安装文件197.下列关于LSTM的说法，错误的是()。A、LSTM中存在Sigmoid函数B、LSTM中存在tanh函数C、LSTM又称长短时记忆网络198.下列关于hive说法正确的是()A、一种数据仓库工具B、一种数据处理工具C、一种可视化工具D、一种分析算法199.下列关于Hadoop组件的说法，正确的有()①HDFS是基于流数据模式访问和处理超大文件的需求而开发的，可以运行于廉价的商用服务器上；②Hive是一种可以存储、查询和分析存储在Hadoop中的大规模数据的机制；③Flume采用了Agent、Gossip和Storage三层架构；④Sqoop主要设计目的是在Hadoop与传统数据库之间进行数据的ETL操作200.下列代码中，返回每一列中的非空值的个数的是()参考答案：B("res:",res)foo()返回的是D、以上都不对n=1s=1whilen&;lt;5:s=s*nn=n+1203.下列场景中最有可能应用人工智能的是()。A、刷脸办电B、舆情分析C、信通巡检机器人204.下列不属于深度学习内容的是()A、深度置信网络B、受限玻尔兹曼机C、卷积神经网络D、贝叶斯学习205.下列不属于深度学习的是()。A、监督学习B、无监督学习C、强化学习D、自主学习206.下列不属于action操作的是()参考答案：B207.下列不是NoSQL数据库的是()208.下列表达式的值为True的是()。(2**=3)&;;lt;(2*=3)209.我们在使用pandas时需要怎样导入计算模式。A、活性B、惰性C、实时D、非实时参考答案：B211.为了提高系统性能，Spark采取“惰性计算模式”,A、执行Transformation操作时不会提交，只有执行Action操作时才会被提交到集群中开始被执行时才会被提交到集群中开始被执行C、只有执行完Action操作和Transformation操作时，所有操作才会被提交到集群中开始被执行D、执行完Action操作或Transformation操作时都不会提交到集群212.为了保证数据服务API的可用性，数据服务允许的API结果213.网络运营者发布、共享、交易或向境外提供重要数据前，应当评估可能带来的安全风险，并报经()部门同意A、安全监察B、上级主管C、工业和信息化D、行业主管监督参考答案：D214.通过数据盘点理清数据状况，建立数据目录，以()为基础梳理形成数据共享负面清单，结合负面清单明细进行数据安全分级，识别数据保护对象A、资产目录B、个人信息C、商业秘密D、数据目录215.通过池化降低空间维度的做法不但降低了计算开销，还使得卷积神经网络对于噪声具有()。A、健壮性B、静态性C、局部性D、准确性216.提升卷积核(convolutionalkernel)的大小会显著提升卷积神经网络的性能，这种说法是A、正确的B、错误的217.梯度下降法中，为什么梯度要加一个负号?218.随机森林中的随机是指()A、随便构建树模B、随机选择一个树模型C、随机选择多个树模型D、在构建每个树模型时随机选择样本和特征219.数据资源主要是指能够被企业及组织访问和使用的所有数据信息的集合，通常表现为数据库、文档、图片、()等形式。A、脚本C、压缩文件D、备份文件220.数据资产质量管理遵循“谁产生、谁负责”的原则，明确数据资产质量的责任归属，同一责任人产生的同一数据项一年内出现()以上质量问题，对责任单位予以通报批评，同时按照公司员工奖惩规定第十二条追究相关人员责任，具体惩处按照公司员工违规违纪行为惩处细则第十三条执行。A、一次C、三次D、三次以上221.数据中台由贴源层、共享层、()、统一数据服务调度和数据资产管理五大板块组成B、分析层C、数据层D、模型层B、贴源层、应用层、分析层、统一数据服务调度和数据保护业务核心数据、防止()能力。224.数据中台当中，分区增全量统一编码为()表示增量225.数据中台采用总部和()两级部署模式构建。A、省市公司C、省公司D、市县公司226.数据应用的重点业务中赋能电网转型升级不包括()。A、优化人员配置B、优化生产运行C、优化设备管控D、优化能源配置参考答案：A227.数据使用是指需要某一专业数据的部门或单位(以下简称“需求方”)向数据归口管理部门或单位(以下简称“提供方”)申请使用数据的过程。需求方根据专业管理需要，填写(),并提供相关需求文档至提供方。C、《全业务统一数据中心数据使用备案表》D、《业务数据使用申请表》228.数据全生命周期安全防护，不包括()。A、数据采集环节B、数据传输环节C、数据存储环节D、数据建模分析节229.数据库设计中的概念结构设计的主要工具是()A、数据模型C、新奥尔良模型D、概念模型230.数据科学项目应遵循一般项目管理的原则和方法，涉及()。A、整体、范围、时间、成本、质量、沟通、风险、宣传、消费B、整体、范围、时间、成本、质量、人力资源、沟通、风险、C、整体、范围、时间、成本、质量、人力资源、运维、采购、D、整体、范围、时间、成本、质量、人力资源、采购、宣传、运维231.数据归一化属于下面哪个阶段()A、数据采集B、数据预处理C、特征提取D、特征选择232.数据分析思维模式主要从()入手，最终改变()233.数据的异构性问题中，下列属于专用格式的是()参考答案：C234.数据传输环节，在互联网大区传输重要数据时应()。A、加密保护C、明文接收D、任意操作参考答案：A235.数据产品和服务提供方与使用方应签署相关使用协议，明确约束()等双方权利义务。A、使用范围B、安全规则C、使用规则D、保密规则参考答案：C236.数据仓库仅仅是提供存储的，提供一种()的服务，不面向最终分析用户：而数据集市是()的，面向最终用户。A、面向数据管理、面向分析应用C、面向分析应用、面向事务交互D、面向事务交互、面向数据管理237.数据变换的策略包括()。A、平滑处理、特征构造、聚集、标准化、离散化B、平滑处理、特征构造、聚集、审计、离散化C、平滑处理、特征构造、聚集、审计、离散化D、特征构造、聚集、标准化、审计、离散化238.树的深度3学习速率A、只有D、都正确239.输入图像已被转换为大?为28×28的矩阵和大?为7×7的步幅为1的核?/滤波器。卷积矩阵的大?是多少?padding1,stride2),pooling(kernelsize3×3,padding0,str又一层卷积(kernelsize3×3,padding1,stride1)之后，输出特征图大?为()。参考答案：C241.受到治安管理处罚的人员，()不得从事网络安全管理和网络运营关键岗位的工作；受到刑事处罚的人员，()不得从事网络安全管理和运营关键岗位的工作。A、五年内，十年内B、三年内，终身C、三年内，十年内D、五年内，终身参考答案：D242.视觉通道表现力评价指标不包括()A、精确性B、可辨认性C、可分离性D、可转换性参考答案：D243.使用预训练模型进行特征提取，要训练的部分是()。A、全连接分类器B、高层卷积层C、底层卷积层D、整个网络参考答案：A244.使用pivot_table函数制作透视表时，要用下列()参数设置行分组键。245.使用ODPSSQL“createtablet1liket2;”建表时，表t1不会具有B、生命周期C、二级分区D、字段的注释246.使用copy模块深拷贝的方法为()。247.实现多分类任务的神经网络，输出层的神经元个数一般选择A、与类别数一致C、2个D、类别数的2倍248.时间序列中除去趋势、周期性和季节性之后的偶然性波动，称为：()。B、季节性C、周期性D、随机性249.神经网络模型(NeuralNetwork)因受?类大脑的启发而得名。神经网络由许多神经元(Neuron)组成，每个神经元接受一个输入，对输入进行处理后给出一个输出，请问下列关于神经元的描述中，哪一项是正确的?A、每个神经元可以有一个输入和一个输出B、每个神经元可以有多个输入和一个输出C、每个神经元可以有一个输入和多个输出D、上述都正确参考答案：D250.神经网络建模步骤一般是()。1模型评估；2网络配置；3模型训练；4数据准备；5模型预测参考答案：D251.神经网络的训练结果模型不包括()。A、权重矩阵B、偏置参数C、超参数D、计算图252.什么是KDD?()A、数据挖掘与知识发现B、领域知识发现C、文档知识发现D、动态知识发现253.深度学习防止过拟合下列说法正确的是A、BN(批归一化)B、增强数据集样本数目、做一些数据增强的操作C、限制模型的学习能力A、样本量充足 (),建立体系化、多层次的告知同意机制，并采取必要的技术A、信息加工方式体骰子的熵是()。参考答案：C257.若训练过程的目标是预测连续值，此类学习任务称为()。A、回归B、分类D、学习258.若arr=np.array([[1,2,3,],[4,5,6,],[7,8,9,]]),则arr[:2,1:]的输出为参考答案：A259.若a=np.array([5,1,2,3]),a.sort(),则数组a的结果是()。参考答案：B260.若a=‘abcd',若想将a变为‘ebcd',则下列语句正确的是261.如果自变量有连续型变量，则不适用的分类预测方法有(?)A、逻辑回归B、神经网络C、SVM算法D、C4.5算法参考答案：D262.如果增加神经网络的宽度，精确度会增加到一个阈值，然后开始降低。造成这一现象的原因可能是()。A、只有一部分核被用于预测B、当核数量增加，神经网络的预测能力降低C、当核数量增加，其相关性增加，导致过拟合参考答案：C263.如果线性回归模型中的随机误差存在异方差性，那么参数的OLS估计量是()。A、无偏的，有效的B、无偏的，非有效的C、有偏的，有效的D、有偏的，非有效的264.如果问题存在最优解，则下面几种搜索算法中，广度优先搜索必然可以得到该最优解，()可以认为是“智能程度相对比较A、无界深度优先搜索B、深度优先搜索C、有界深度优先搜索D、启发式搜索265.如果对样本分类，不可以选择的方法是(?)A、层次聚类法B、K-均值聚类法C、两步聚类法D、混合聚类法参考答案：D266.企业中台不包含()A、业务中台B、数据中台C、技术中台D、服务中台267.朴素贝叶斯分类器的朴素之处在于：A、只能处理低维属性B、只能处理离散型属性C、分类效果一般D、属性之间的条件独立性假设268.评估完模型后，发现模型存在高偏差，应如何解决()A、减少模型的特征数量B、增加模型的特征数量C、增加样本数量D、以上说法都正确269.批规范化(BatchNormalization)的好处都有()?A、让每一层的输入的范围都大致固定B、它将权重的归一化平均值和标准差C、它是一种?常有效的反向传播(BP)方法D、这些均不是270.年度需求由()统筹组织开展储备与立项工作。A、互联网部B、信息化部C、数字化工作部D、科技信息部参考答案：C271.你正在训练一个RNN网络，你发现你的权重与激活值都是NaN,下列选项中，哪一个是导致这个问题的最有可能的原因()A、梯度消失B、梯度爆炸C、ReLU函数作为激活函数g(.),在计算g(z)时，z的数值过大了D、Sigmoid函数作为激活函数g(.),在计算g(z)时，z的数值过大了参考答案：B272.某数据集包含以下项(时间、区域、销售金额想通过一张图标把上述信息全部展示出来适合使用()。A、雷达图B、饼图D、树图273.某电商网站的订单表ods_market_orders有如下字段：order_id'订单ID',order_time'订单时间'(unix时间戳),user_id'买家最多的商品排名，以下哪个SQL语句是正确的?274.面向政府机构或非营利性组织等，从服务中央决策部署落地实施、社会治理现代化等方面，提供的公益性数据服务为()。A、政府监管类B、公益服务类C、商务增值类D、公共开放类275.美国海军军官莫里通过对前人航海日志的分析，绘制了新的航海路线图，标明了大风与洋流可能发生的地点。这体现了大数据分析理念中的()。A、在数据基础上倾向于全体数据而不是抽样数据B、在分析方法上更注重相关分析而不是因果分析C、在分析效果上更追究效率而不是绝对精确D、在数据规模上强调相对数据而不是绝对数据276.每?个神经元都有输入、处理函数和输出。神经元组合起来形成了网络，可以拟合任何函数。为了得到最佳的神经网络，我们用梯度下降方法不断更新模型给定上述关于神经网络的描述，什么情况下神经网络模型被称为深度学习模型?A、加?更多层，使神经网络的深度增加B、有维度更高的数据C、当这是一个图形识别的问题时277.列表中可以放()个字符串C、无限个D、由用户自己定义构建词袋模型形成的是(),例句1,2对应的向量为()。279.离散程度的测度值愈大，则()。A、映变量值愈分散，算术平均数代表性愈差B、映变量值愈集中，算术平均数代表性愈差C、映变量值愈分散，算术平均数代表性愈好D、映变量值愈集中，算术平均数代表性愈好参考答案：A280.考虑以下两个随机数组a和b:a=np.random.randn(4,3)<a.shape=(4,3);b=np.random.randn(3,2)&c=a*b,c的维度是什么?D、计算不成立因为这两个矩阵维度不匹配281.考虑某个具体问题时，你可能只有少量数据来解决这个问题。不过幸运的是你有一个类似问题已经预先训练好的神经网络。可以用下面哪种方法来利用这个预先训练好的网络()A、把除了最后一层外所有的层都冻住，重新训练最后一层B、对新数据重新训练整个模型C、只对最后几层进行调参(fineD、对每一层模型进行评估，选择其中的少数来用282.考虑某个具体问题时，可能只有少量数据来解决这个问题。不过有一个类似问题已经预先训练好的神经网络。可以用下面哪种方法来利用这个预先训练好的网络?A、把除了最后一层外所有的层都冻结，重新训练最后一层B、对新数据重新训练整个模型C、只对最后?层进行调参(fineD、对每一层模型进行评估，选择其中的少数来用283.考察一个由三个卷积层组成的CNN:kernel=3×3,stride=2,padding=SAME。最低层输出100个特征映射(featuremap),中间层200个特征映射，最高层400个特征映射。输入是200×300的RGB图片，总参数的数量是多少?()284.考察一个由三个卷积层组成的CNN,卷积核大小为3*3,步长为2,paddding方式为SAME。最低层输出100个特征图，中间层输出200个特征图，最高层输出400个特征图。输入为200*300的RGB图像，则总参数量为()285.开展数据产品研发、发布等活动时，应确保遵从国家法律法规、数据主体授权范围、公司相关规章制度等()保护要求。A、数据使用B、数据研发C、数据交换D、数据安全286.绝对多数投票法的基本思想是()。A、对于若干和弱学习器的输出进行平均得到最终的预测输出B、少数服从多数，数量最多的类别为最终的分类类别C、不光要求获得最高票，还要求票过半数D、将训练集弱学习器的学习结果作为输入，将训练集的输出作为输出，重新训练一个学习器来得到最终结果参考答案：C287.决策树是基于()结构来进行决策的。288.卷积神经网络中卷积的主要作用是()B、提取一个局部区域的特征敏感性B、权值初始化确的是()。A、同样模式的内容(如鸟嘴)在图像不同位置可能出现B、池化之后的图像主体内容基本不变C、不同种类鸟的相同部位(如鸟嘴)形状相似291.卷积神经网络的结构不包括()。A、池化层C、激活层D、全连接层5*5,步长为1,不补零，该层的输入图片的维度是224x224x3,那么该层输出的维度是()293.卷积核大小是4*4,则其步长不能是()。294.卷积的过程是让过滤器在图像上()。B、剪切C、窗口滑动D、镜像对称295.聚焦()经济发展新趋势，坚持维护数据安全合规和促进数据开发利用并重，持续优化数据合规管理机制与策略，支撑、赋能公司高质量发展。A、新能源B、社会科技C、信息技术D、能源数字296.阶跃函数与sigmoid函数均为典型激活函数()。B、错误297.将原始数据进行集成、变换、维度规约、数值规约是在以下哪个步骤的任务：()。A、频繁模式挖掘B、分类和预测C、数据预处理D、数据流挖掘参考答案：C298.将一副图像进行分割后，分割出的区域彼此之间()重叠。A、可以B、不可以C、根据任务需要确定是否可以D、根据分割方法确定是否可以参考答案：B299.将两篇文本通过词袋模型变为向量模型，通过计算向量的()来计算两个文本间的相似度。A、正弦距离B、余弦距离C、长度参考答案：B300.将合规管理要求全面嵌入公司数据活动，在各领域、各环节确定合规管理重点，覆盖(),促进公司数据活动全面合规。A、数据生产B、数据全生命周期C、数据存储D、数据销毁301.建立与政府主管部门、行业协会、专家学者的有数据相关法律法规。A、《个人信息保护法》C、《保守国家秘密法》D、《网络产品和服务安全审查办法(试行)》302.假设拥有一个已完成训练的、用来解决车辆检测问题的深度神经网络模型，训练所用的数据集由汽车和卡车的照片构成，而训练目标是检测出每种车辆的名称(车辆共有10种类型)。现在想要使用这个模型来解决另外一个问题，问题数据集中仅包含一种车(福特野马)而目标变为定位车辆在照片中的位置。A、除去神经网络中的最后一层，冻结所有层然后重新训练B、对神经网络中的最后几层进行微调，同时将最后一层(分类层)更改为回归层C、使用新的数据集重新训练模型D、所有答案均不对303.假设已经在ImageNet数据集(物体识别)上训练好了一个卷积神经网络。然后给这张卷积神经网络输入一张全白的图片。对于这个输入的输出结果为任何种类的物体的可能性都是一样的，对吗?C、依情况而定的神经网络，假如我们把ReLU激活替换为线性激活，那么这个神经网络能够模拟出同或函数(XNORfunction)吗?B、依情况而定C、不一定D、不能305.假设我们使用原始的非线性可分版本的Soft-SVM优化目标函数。我们需要做什么来保证得到的模型是线性可分离的()C、正无穷大D、C负无穷大306.假设文件不存在，如果使用open方法打开文件会报错，那么该文件的打开方式是下列哪种模式()。307.假设数据集中有100条数据，设置batch_size为4,那么跑完一轮模型会迭代多少次()。308.假设输入是一个300×300的彩色(RGB)图像，而没有使用卷积神经网络。如果第一个隐藏层有100个神经元，每个神经元与输入层进行全连接，那么这个隐藏层有多少个参数(包括偏置参数)?309.假设你正在训练一个LSTM网络，你有一个10,000词的词汇表，并且使用一个激活值维度为100的LSTM块，在每一个时间310.假设你在卷积神经网络的第一层中有5个卷积核，每个卷积核尺寸为7B7,具有零填充且步幅为1。该层的输入图片的维度是224B224B3。那么该层输出的维度是多少()参考答案：C311.假设你有5个大小为7x7、边界值为0的卷积核，同时卷积神经网络第一层的深度为1。此时如果你向这一层传入一个维度为224x224x3的数据，那么神经网络下一层所接收到的数据维度是多少312.假设你需要调整超参数来最小化代价函数(costfunction),会使用下列哪项技术A、穷举搜索B、随机搜索D、都可以313.假定在神经网络中的隐藏层中使用激活函数X。在特定神经活函数?314.加强数据传输、存储过程中的安全管理，采取加密、隔离、备份等安全技术手段，确保符合相应安全条件或技术标准，具备()能力，防范数据泄露、篡改、损毁、丢失风险。B、灾备C、安全D、保护315.加强公司数据()管理，按规定做好报批、安全评估、认证等工作。A、跨企业B、跨网C、跨境D、跨部门316.及时将数据活动中产生的()纳入公司知识产权体系进行保护，妥善处理好数据内部共享、对外开放与知识产A、智力成果B、软件产品C、数据D、算法317.基于词的n元文法模型，其最后的粗分结果集合大小()N。A、大于B、大于等于C、小于D、小于等于参考答案：B318.机器学习中，下面哪些方法不可以避免分类中的过拟合问A、增加样本数量D、正则化319.混淆矩阵中的TP=16,FP=12,FN=8,TN=4,准确率是()。320.回归任务中最常用的性能度量是A、均方误差B、查准率C、查全率参考答案：A321.合作单位和供应商的开发测试环境与公司()应做好隔离。A、内网环境B、测试环境C、生产环境D、业务环境322.国网数据中台，是在下面()阶段的基础上发展过来的。A、营销服务中心B、全业务统一数据中心C、海量历史/实时数据中心参考答案：B323.国网公司数据管理以数据资产()为目标。D、易懂、易取、易用参考答案：D324.国网公司数据管理坚持()的原则。A、面向专业B、面向基层C、面向应用D、面向专业、面向基层、面向应用325.国网公司坚持数据“一处生成、多处使用”,明确权威数据源引用规范，开展权威数据源中台标注，推进权威数据源在中台的落地应用，常态推进()治理。A、数据源头B、数据中台C、业务中台D、数据应用326.国家推进网络安全社会化服务体系建设，鼓励有关企业、机构开展网络安全认证、检测和()等安全服务B、网络安全技术C、风险评估D、风险预防327.国家提倡诚实守信，()的网络行为，推动传播社会注意核心价值观，实行措施提高全社会的网络安全意识和水平，形成全社会共同参加促进网络安全的良好环境。B、健康文明C、团结互助D、和平友爱328.国家电网公司信息化工作坚持“统一领导，统一规划，(),统一组织实施”的“四统一”原则。A、统一运作B、统一管理C、统一设计D、统一标准329.关于脏数据和乱数据的区分，以下哪种不属于脏数据()。A、含有缺失数据B、冗余数据C、噪声数据D、不规则形态数据(a,b):c=a*breturncs=func(A、打印输出字符串："HelloHello"$运行结果是出错，出错类型是NameError:B、运行结果是出错，出错类型是NameError:C、是一个局部变量D、n是一个全局变量参考答案：A331.关于图像分割说法正确的是()。A、图像分割是对图像中的每个像素加标签的一个过程B、对像素加标签会使具有相同标签的像素具有某种共同视觉特性C、在电网的应用中，我们主要用来进行细粒度分析D、以上答案都正确参考答案：D332.关于机器学习模型训练步骤的说法，错误的是()。A、测试集能够测试模型对于未知数据的拟合效果B、验证集能够用于防止模型过拟合C、划分数据集时需要注意数据是否为同分布D、模型训练需要准备多个备选算法用于效果比较333.关于对决策树进行剪枝的说法中不正确的是(?)A、先剪枝和后剪枝都可以降低决策树的过拟合风险B、后剪枝决策树的训练时间会比先剪枝决策树和未剪枝决策树长很多C、先剪枝和后剪枝都是利用验证集精度来判断是否剪枝的D、一般来说，后剪枝要比先剪枝的效果好很多参考答案：D334.关于TF-IDF模型，以下描述错误的是()。B、IDF是逆文本频率C、该模型是一种统计方法D、该模型基于聚类方法335.关于SOM神经网络描述错误的是：()。A、一种竞争学习型的无监督神经网络B、将高维输入数据映射到低维空间，保持输入数据在高维空间的拓扑结构C、SOM寻优目标为每个输出神经元找到合适的权重D、输出层神经元以矩阵方式排列在二维空间参考答案：C336.关于Python语言的浮点数类型，以下选项中描述错误的是A、浮点数类型与数学中实数的概念一致B、浮点数类型表示带有小数的类型C、Python语言要求所有浮点数必须带有小数部分D、小数部分不可以为0337.关于Python的全局变量和局部变量，以下选项中描述错误的A、使用global保留字声明简单数据类型变量后，该变量作为全局变量使用B、局部变量指在函数内部使用的变量，当函数退出时，变量依然存在，下次函数调用可以继续使用C、简单数据类型变量无论是否与全局变量重名，仅在函数内部创建和使用，函数退出后变量被释放D、全局变量指在函数之外定义的变量，一般没有缩进，在程序执行全过程有效338.关于Pandas层次化索引，下列说法错误的是A、层次化索引是指Pandas对象在一个轴方向上具有多层索引B、层次化索引至多只能有两层索引C、可以使用swaplevel()方法对层次化索引的位置交换顺序D、使用sort_index()可以对索引进行排序339.关于OLAP和OLTP的区别描述，不正确的是()。A、OLAP主要是关于如何理解聚集的大量不同的数据.它与OTAP应用程序不同。340.关于OLAP的特性，下面正确的是：(1)快速性(2)可分析性(3)多维性(4)信息性(5)共享性()参考答案：D341.关于Attention-basedModel,下列说法正确的是()。A、相似度度量模型B、是一种新的深度学习网络C、是一种输入对输出的比例模型D、都不对342.关联规则的评价指标是()。A、均方误差、均方根误差B、Kappa统计、显著性检验C、支持度、置信度D、平均绝对误差、相对误差343.关键信息基础设施的运营者采购网络产品和服务，可能影响国家安全的应当通过国家()会同国务院有关部门组织国家安全A、网信部门B、安全部门C、公安部门D、国防部门344.鼓励各部门、各单位结合实际应用需求对已发布成果进行适应性改造，避免低水平的重复开发。改造后的成果可按照成果发布流程，重新发布到()。A、数字化能力开放平台B、全业务中台C、公共服务能力平台D、公司门户网站345.构建客户群体特征分析及细分模型，评估优化潜力，为用户智能推荐个性化服务方案，满足()服务需求。A、精准化B、个性化C、差异化D、特色化346.构建从公司总部到各级单位协调一致、符合实际的合规管理架构，确保数据在各层级、各单位、各板块之间合法合规流转，推动()共享应用。A、数据融合B、数据治理C、数据统计D、数据维护347.构建()客户画像，设计全网客户标签体系，形成客户标签库，全面及时分析客户行为活动，深度提炼客户行为特征规律，实现客户行为动态画像。A、全量B、多维动态C、全方面348.公司新建信息系统需严格遵循公司信息化架构(含业务架构、 ()、数据架构、技术架构、安全架构)总体设计，并满足相应架构标准、规范及要求。A、资产架构B、软件架构C、应用架构D、管理架构349.公司网络安全和信息化领导小组是数据管理工作的领导决策机构，下列哪项不是其主要职责()A、评估公司数据管理工作制度B、审议决策公司数据管理重大事项C、协调解决数据管理重要问题D、对公司数据管理工作进行监督指导350.公司数据质量管理主要包括()A、数据质量规则管理B、数据质量核查C、数据问题整改与质量评估351.公司企业中台基于()构建，是企业级能力共享平台。B、国网云C、阿里云352.公司内部共享数据时，应遵照()开展。原则上除列入负面清单的数据外，其余数据均可在公司内部共享。A、数据共享负面清单B、数据业务管理C、运维职责划分D、使用单位353.公司对外提供数据时，应根据()有关要求，执行差异化的数据开放策略。涉密数据按照公司保密规章制度执行，严格履行相关保密合规审核流程。A、《中华人民共和国网络安全法》B、《中央企业商业秘密保护暂行规定》C、《国家电网有限公司数据管理办法》D、《国家电网有限公司关于数据对外开放的指导意见》354.公司大数据应用需求与立项管理遵循()管理规范，严格落实项目制管理要求，主要包括需求征集、评审、储备、立项和计划编制与调整等工作。A、技术服务项目B、科技项目C、信息化项目D、数字化项目355.公司大数据应用建设应按照电网数字化建设要求，遵循公司大叔苏剧应用统一技术架构与标准，充分利用()等各类企业级大数据应用公共服务能力平台进行开发和实施。A、电网资源业务中台B、全业务数据中心C、数据中台D、数字化能力开放平台参考答案：C356.公司()委员会负责数据合规管理工作统筹领导。A、信息安全B、网络安全C、安全领导D、合规管理参考答案：D357.根据数据质量核查和治理情况，互联网部对数据质量问题发生数、()、整改完成率等进行评估和通报，促进公司整体数据质量水平提升。A、整改量B、整改及时率C、问题频率D、问题整改情况358.根据数据分级分类管理要求，建立()。A、数据访问权限制度B、数据备份制度C、数据安全加密制度D、数据审计制度360.各级通信运行管理部门应建立完整的管理体系和管理制度，按照国家电网公司和本地区()制定的通信运行管理规程、管理办法、实施细则等开展技术监督工作。A、通信主管部门B、数据中心运维单位D、科信部361.各地区、各部门应当按照数据()保护制度，确定本地区、本部门以及相关行业、领域的重要数据具体目录，对列入目录的数据进行重点保护。A、分类分级B、分级分域C、分层分级D、分类分域362.各单位应遵循()原则，优化数据安全防护架构，推进数据保护技术研究与应用，强化数据全生命周期的安全保护。B、“不共享”C、“三同步”D、“两同步”363.个人信息数据收集应遵循不包括()的原则B、正当C、必要364.个人信息保护影响评估报告和处理情况记录应当至少保存()A、一参考答案：D365.高斯核也称为()。A、多项式核B、拉普拉斯核参考答案：C366.服务(),提供多模式电力交易大数据分析服务，开展电力交

人人文库> 全部分类> 教育资料 > 中学教育

温馨提示

1. 本站所有资源如无特殊说明，都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2. 本站的文档不包含任何第三方提供的附件图纸等，如果需要附件，请联系上传者。文件的所有权益归上传用户所有。
3. 本站RAR压缩包中若带图纸，网页内容里面会有图纸预览，若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 人人文库网仅提供信息存储空间，仅对用户上传内容的表现方式做保护处理，对用户上传分享的文档内容本身不做任何修改或编辑，并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容，请与我们联系，我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

能源大数据应用开发技能竞赛理论考试题（附答案）

文档简介

温馨提示

最新文档

评论

能源大数据应用开发技能竞赛理论考试题（附答案）

文档简介

温馨提示

最新文档

评论

相关文档