数据中台运维资质考试题及答案_第1页
数据中台运维资质考试题及答案_第2页
数据中台运维资质考试题及答案_第3页
数据中台运维资质考试题及答案_第4页
数据中台运维资质考试题及答案_第5页
已阅读5页,还剩45页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

数据中台运维资质考试题及答案1、在FusionInsight产品中,关于KafkaTpoic,一下描述不正确的有:()。A、每个Topic只能被分成一个partition(分区)(正确答案)B、Topic的partition数量可以在创建时配置C、每个partition的存储层对应一个log文件,log文件中记录了所有的信息数据D、每条发布到Kafka的信息都有一个类别,这个类别被称为Topic,也可以理解为一个存储消息的队列2、Hbase中的Region是由:()服务进程来管理的。A、HRegionServer(正确答案)B、ZookeeperC、HmasterD、DataNodeE、美索不达米亚文明3、Hbase中数据存储的文件格式是:()。A、HlogB、TextFileC、Hfile(正确答案)D、SequenceFile4、FusionInsightManager对服务的管理操作,下面说法错误的是:()。A、可以设置不常用的服务隐藏显示(正确答案)B、可以添加和卸载服务C、可以对服务进行启停操作D、可以查看服务的当前状态5、以下()选项属于FusionInsightSparkSQL的优点。A、稳定和高性能B、SQL兼容性C、支持数据插入,更新和删除D、以上全部正确(正确答案)6、FusionInsightHD中Loader从SFTP服务器导入文件时,不需要做编码转换和数据转换且速度最快的文件类型是:()。A、graph-fileB、binary-file(正确答案)C、text-fileD、sequence-file7、关于Kafka磁盘容量不足的告警,对于可能的原因以下分析不正确的是:()。A、业务规划不合理,导致数据分配不均,使部分磁盘达到使用率上限B、Broker节点故障导致(正确答案)C、数据保存时间配置过长,数据累计达到磁盘使用率达到上限D、用于存储Kafka数据的磁盘配置,无法满足当前业务数据流量,导致磁盘使用率达到上限8、HDFS中的主备仲裁,是由:()组件控制的。A、ZookeeperFailoverController(正确答案)B、NodeManagerC、ResourceManagerD、HDFSClient9、以下关于Zookeeper的Leader节点在接收到数据变更请求后的读写流程说法正确的是:()A、仅写入内存B、同时写入硬盘和内存C、先写入内存再写入硬盘D、先写入硬盘再写入内存(正确答案)10、Flink中的()接口属于流数据处理,()接口用于批处理。A、DataBatchAPI,DataStreamAPIB、StreamAPI,BatchAPIC、DataStreamAPI,DataSetAPI(正确答案)D、BatchAPI,StreamAPI11、以下关于HiveSQL基本操作描述正确的是:()。A、加载数据到Hive时数据必须是HDFS的一个路径B、创建外部表必须要指定location信息C、创建外部表使用external关键字,创建普通表需要指定internal关键字D、创建表时可以指定列分隔符(正确答案)12、如果需要由数据生产者决定数据发送给目标Blot的某一个确定的Task,应该选择以下()消息发布策略。A、局部字段分组B、广播分组C、直接分组(正确答案)D、全局分组13、为保证流应用的快照存储的可靠性,快照主要存储在:()。A、本地文件系统中B、JobManager的内存中C、HDFS中(正确答案)D、可靠性高的单击数据库中14、下列()不属于创建Loader作业时必须项。A、优先级(正确答案)B、名称C、连接D、类型15、以下关于Zookeeper关键特性中的原子性说法正确的是:()。A、客户端发送的更新会按照他们发送的顺序进行应用B、鞥新只能全部完成或失败,不会部分完成(正确答案)C、一条消息被一个server接受,将会被所有的server接受D、集群中无论那台服务器,对外展示的均是统一视图16、查看Kafka某Topic的partition详细信息时,使用如下()命令。A、bin/kafka-topic.sh--createB、bin/kafka-topic.sh--deleteC、bin/kafka-topic.sh--listD、bin/kafka-topic.sh--describe(正确答案)17、以下关于Kafka的描述错误的是:()。A、使用java、scala语言实现B、用作活动流和运营数据处理管道的基础C、由ApacheHadoop开发,并于2011年开源(正确答案)D、具有消息持久化、高吞吐、实时等特性18、在很多小文件场景下,Spark会起很多Task,当SQL逻辑中存在shuffle操作时,会大大增加hash分桶数,严重影响性能,FusionInsight中,针对小文件的场景通常采用()算子来对Table中的小文件生成的Partition进行合并,减少partition数,从而避免在shuffle的时候,生成过多的hash分桶,提升形成。A、groupbyB、coalosceC、connectD、join(正确答案)19、FusionInsightHD中Hbase默认使用()组件作为其底层文件存储系统。A、FileB、KafkaC、HDFS(正确答案)D、Memory20、以下关于Kafka消息消费者Consumer读取消息描述错误的是:()。A、consumer使用offset来记录读取位置B、Kafka的一个Topic可以理解为一个队列,即一个消息C、生产者产生的消息逐条放到Topic尾部D、消费者从右至左读取消息(正确答案)21、FusionInsightHD系统中,下面()方法不能查看到Loader作业的执行结果。A、通过LoaderUI界面查看B、通过YARN任务管理查看C、通过NodeManager查看(正确答案)D、通过Manager的告警查看22、部署FusionInsightHD时,同一集群内的FlumeServer节点建议至少部署()个。A、1B、3C、4D、2(正确答案)23、YARN中默认的资源调度器是:()。A、FIFO调度器B、容量调度器(正确答案)C、Fair调度器D、以上全部是24、下列选项中,关于Zookeeper可靠性含义说法正确的是:()。A、可靠性通过主备部署模式实现B、可靠性是指更新只能成功或者失败,没有中间状态C、可靠性是指无论哪一个server,对外展示的均是同一个视图D、可靠性是指一个消息被一个server接受,它将被所有的server接受(正确答案)25、在FusionInsight产品中,关于创建Kafka的Topic,以下描述正确的是:()。A、在创建Kafka的Topic时,必须设置PartitionB、在创建Kafka的Topic时,必须设置Partition副本数C、设置多副本可以增强Kafka服务的容灾能力(正确答案)D、以上全部正确26、对于Hive中关于普通标和外部表描述不正确的是:()。A、默认创建普通表B、删除外部表时,只删除外部表数据而不删除元数据(正确答案)C、外部表实质上是将已存在的HDFS文件路径与表关联起来D、删除普通表时,元数据和数据同时被删除27、YARN的基于标准调度,是对下列选项中的()进行标签化。A、AppMasterB、ResourceManagerC、NodeManager(正确答案)D、Container28、关于Hive与传统数据仓库的对比,下列描述错误的是:()。A、Hive元数据存储独立于数据存储之外,从而解耦合元数据和数据,灵活性高,二传统数据仓库数据应用单一,灵活性低B、Hive基于HDFS存储,理论上存储可以无限扩容,而传统数据仓库存储量有上限C、由于Hive的数据存储在HDFS上,所以可以保证数据的高容错,高可靠D、由于Hive基于大数据平台,所以查询效率比传统数据仓库快(正确答案)29、Hbase元数据MetaRegion路由器信息存放在()。A、ZookeeperB、Meta表(正确答案)C、HMasterD、Root表30、下列()命令是删除文件。A、dfs-clearB、dfs-lsC、dfs-rm(正确答案)D、dfs-del31、传统处理数据的数据规模的单位是:()。A、TBB、EBC、PBD、GB(正确答案)32、FusionInsightHD系统中,Flume数据流在节点内不需要()组件。A、SourceB、SinkC、Topic(正确答案)D、Channel33、Flume用于收集数据,其传输的数据基本单位是()。A、SplitB、BlockC、Event(正确答案)D、Packet34、在FusionInsightHD中,创建Loader作业的进行数据转换正确步骤是()。A、设置输入-转换-输出(正确答案)B、抽取-转换-输出C、加载-转换-输出D、加载-转换-抽取35、在Flink的运行过程中,负责申请资源的角色是:()。A、ResourceManagerB、JobManager(正确答案)C、ClientD、TaskManager36、关于Hive建表基本操作,描述正确的是:()。A、一旦表建好,不可再修改表名B、一旦表建好,不可再增加新列C、创建外表时需要指定external关键字(正确答案)D、一旦表建好,不可再修改列名37、Hadoop框架是用下面()语言写的。A、PytyonB、Java(正确答案)C、C++D、Scala38、Hive常被用来处理()场景。A、事务性处理B、批量计算(正确答案)C、实时性计算D、流计算39、大数据最显著的特征是:()。A、数据规模大(正确答案)B、数据类型多样C、数据处理速度快D、数据价值密度高40、使用Hbase客户端批量写入10条数据,某个HRegionServer节点上包含两个Region,分别是A和B,10条数据中有6条属于A,4条属于B,请问写入这10条数据需要向HRegionServer发送()次RPC请求。A、10B、6C、2D、1(正确答案)41、关于DataSet,下列说法不正确的是:()。A、DataSet不需要反序列化就可以执行大部分操作B、DataSet是一个由特定域的对象组成的强类型集合C、DataSet与RDD高度类似,性能比RDD好D、DataSet执行sort,filter,shuffle登录需要进行反序列化(正确答案)42、Kafka集群中,Kafka服务端的角色是:()。A、Broker(正确答案)B、ConsumerC、ZookeeperD、Producer43、创建Loader作业时,可以在以下()步骤中设置Map数。A、输出(正确答案)B、输入设置C、转换D、基本信息44、Hive中的这条命令“ALTERTABLEEMPLOYEELADDCOLUMNS(columnsstring)”,是:()含义。A、创建表B、删除表C、添加列(正确答案)D、修改文件格式45、下列()选项属于Hive的数据存储模型。A、桶B、数据库C、分区D、以上全都正确(正确答案)46、YARN中设置队列QueueA的最大使用资源量,需要配置()参数。A、yarn.scheduler.capacity.root.QueueA.minimum-user-limit-percentB、yarn.scheduler.capacity.root.QueueA.maximum-capacity(正确答案)C、yarn.scheduler.capacity.root.QueueA.minimum-user-limit-factorD、yarn.scheduler.capacity.root.QueueA.state47、以下关于FusionInsightCTBase的描述不正确的是:()。A、CTBase的读写接口,统一封装了行定义的接口,自动进行冷字段的合并和解析,不需要在应用程序中进行合并和解析B、CTBase是基于Hbase的聚簇表开发框架(正确答案)C、CTBase提供了一套WebUI进行元数据定义,提供了只管医用的表设计工具,降低表设计的难度D、CTBase的javaAPI提供了一套Hbase连接池管理的接口,内部连接共享,减少客户端应用开发的难度48、Flume数据采集过程中,下列选项中能对数据进行过滤和修饰的是:()。A、SinkB、ChannelC、ChannelSelectorD、Interceptor(正确答案)49、关于HIVE的描述不正确的是:()。A、Hive最佳使用场景是大数据集的批处理作业B、Hive可以实现在大规模集群上实现低延迟快速查询(正确答案)C、Hive构建在基于静态批量处理的Hadoop之上,Hadoop通常有较高的延迟并且在提交作业和调度的时候需要大量的开销D、Hive查询操作过程严格遵循HadoopMapReduce的作用执行模型,Hive将用户的HiveSQL语句通过解释器转换为MapReduceHadoop集群上50、硬件故障被认为是常态,为了解决这个问题,HDFS设计了副本机制,默认情况下,一份文件,HDFS会存放()份。A、3(正确答案)B、5C、2D、151、Hbase的底层以()形式存在。A、keyvalue(正确答案)B、列存储C、行存储D、实时存储52、华为FusionInsightHD是国内首家符合国家金融等级保护的大数据平台,其安全性体现在以下()方面。A、系统安全B、权限认证C、数据安全D、以上全部正确(正确答案)53、在Flink框架中,下列()是流处理和批处理的计算引擎。A、standaloneB、Runtime(正确答案)C、FlinkCoreD、DataStream54、在WebHCat架构中,用户能够通过安全的HTTPS协议执行以下()操作。A、执行HiveDDL操作B、运行MapReduce任务C、运行HiveSQL任务D、以上全部正确(正确答案)55、关于FusionInsightmanager界面Hive日志收集的描述中不正确的是:()。A、可以指定实例进行日志收集B、可以指定节点IP进行收集C、可以指定用户进行日志收集(正确答案)D、可以指定时间段进行日志收集56、Kafka集群在运行期间,直接依赖于下列()组件。A、sparkB、zookeeper(正确答案)C、hdfsD、hbase57、Hbase的某张表的RowKey划分Splitkey为9.E.a.z.请问表里面有()个Region。A、6B、5(正确答案)C、4D、358、YARN调度器分配资源的顺序是:()。A、任意机器--本地资源--同机架B、任意机器--同机架--本地资源C、本地资源--同机架--任意机器(正确答案)D、同机架--任意机器--本地资源59、FusionInsightManager用户权限管理不支持()配置。A、给用户配置角色B、给用户组配置角色C、给角色配置权限D、给用户组配置权限(正确答案)60、当zookeeper集群节点数为5时,请问集群的容灾能力和()节点时等价的。A、3B、4(正确答案)C、5D、以上全不正确61、在HBase写数据的业务逻辑实现过程中,如下()接口或类是不需要涉及的。A、PutB、HTableC、HBaseAdmin(正确答案)D、PutList62、在MapReduce的应用程序开发中,下列()JAVA类负责管理和运行一个计算任务。A、lob(正确答案)B、ContextC、FileSystemD、Configuration63、HDFS客户端所在节点的系统时间与FusioninsightHD集群的系统时间要保持一致,若有时间差,那么时间差应小于()分钟。A、5(正确答案)B、10C、20D、3064、关于Streaming的拓扑(Topology),下面描述错误的是:()。A、一个Topology是由一组Spout组件和Bolt组件通过StreamGroupings进行连接的有向无环图(DAG)B、Topology会一直运行,直到它被显式killC、业务逻辑都被封装Topology中D、一个Topology只可以指定启动一个Worker进程(正确答案)65、对于运行在MapReduce平台上的应用程序,此应用程序所依赖的jar包会被放到()。A、HIVEB、HBASEC、HDFS(正确答案)D、DB66、FusionlnsihtHD中,Oozie客户端的JAVAAPI在运行任务时会调用OozieClient类的()方法。A、suspendB、getJobInfoC、submitD、run(正确答案)67、将数据块存储大小设置为128M,HDFS客户端在写文件时,当写入一个100M大小的文件,实际占用储存空间为:()。A、128MB、100M(正确答案)C、64MD、50M68、当一个MapReduce应用程序被执行时,如下()动作是map阶段之前发生的。A、split(正确答案)B、combineC、partitionD、sort69、在FusioninsightHD的客户端,执行kinit{账号}命令是为了得到KDC的()内容。A、Krb5.confB、TGT(正确答案)C、STD、jaas.conf70、HDFS集群跟目录下存在一个文件text.txt,下列()命令可以查到此文件所存储的DatNode节点信息。A、hdfsfsck/test.txt-filesB、hdfsfsck/text.txt-locations(正确答案)C、hdfsfsck/test.txt-blocksD、hdfsfsck/test.txt-list-corruptfileblocks71、在FusioninsightHD中,可以在()查看MapReduce应用程序的运行结果。A、FusioninsightManager的web界面B、LoaderWeb界面C、Solrweb界面D、YamWeb界面(正确答案)72、MapReduce任务最终是在下列()中被执行的。A、NodeManagerB、container(正确答案)C、ResourceManagerD、AppMaster73、Yam中()角色是管理单个节点资源(CPU/Memory)的。A、NodeManager(正确答案)B、ResourceManagerC、DataNodeD、NameNode74、下来()Redis命令属于原子操作。A、INCR(将储存的数字值增一)B、HINCRBY(为哈希表key中的域field的值加上增量increment)C、LPUSH(对链表的push操作)D、以上都是(正确答案)75、在Spark中,假设lines是一个DStream对象,filter语句可以过滤掉80%的数据,针对以下两个语句说法正确的是:()。X:lines.filter(...).groupByKey(...)A、X比Y的性能更高(正确答案)B、X比Y的性能更低C、X和Y和性能一样D、无法确性X和Y的性能差异Y:lines.groupByKey(...).filter(...)A、客户端缓存有集群的拓扑信息B、服务端缓存有集群的拓扑信息C、两者都是(正确答案)D、两者多不是76、关于Redis集群拓扑信息,下面描述正确的是:()。A、要求Python版本不低于2.6.6,不高于2.7.0B、客户端必须装有setuptools,且版本不低于5.0C、hive_python_client脚本提供了直接执行SQL的功能,如hive_python_client"showtables5D、Python二次开发不支持安全集群(正确答案)77、FusionlnsightHDV100R002C60中,关于Hive的Python接口类型,以下描述不正确的是:()。A、32MBB、64MBC、128MB(正确答案)D、256MB78、FusionInsightHD系统中HDFS默认BlockSize是:()。A、内存B、CPUC、Container(正确答案)D、磁盘空间79、Hadoop系统中YARN资源的抽象是用:()表示。A、CB、C++C、JAVAD、Scala(正确答案)80、Spark是用以下()编程语言实现的。A、TGT全称为票据授权服务票据,主要由KDC服务器生成B、TGT一次生成之后,可以无限期使用。(正确答案)C、TGT在客户端的存在方式可以是在内存中存储,也可以在本地以文件的形式存储。D、TGT中主要的信息有当前该票据的有效时长和授予该TGT的服务端IP以及分发给的客户端名称。81、关于Kerberos的TGT以下说法错误的是:()。A、TGT(正确答案)B、STC、PTD、TOKEN82、FusionInsightHD系统中,用户登录到客户端,请求服务端的某个应用,客户端需要先向认证服务器请求消息获取如下()。A、HMasterB、DataNodeC、RegionServer(正确答案)D、ZooKeeper83、Hadoop平台中HBase的Region是由:()服务进程来管理。A、ZooKeeperB、HDFSC、MasterD、meta表(正确答案)84、FusionInsightHD系统中HBase的最小处理单元是Region,UserRegion和RegionServer之间的路由信息是保存在()。A、HTMLB、XMLC、二维表(正确答案)D、JSON85、以下()数据不属于半结构化数据。A、user_permissionB、whoami(正确答案)C、whoD、get_user86、FusionInsightHD中,如果需要查看当前登录HBase的用户和权限组,可以在HBaseshell中执行()命令。A、OS分区B、数据分区C、元数据分区D、管理分区(正确答案)87、FusionInsightHD系统中,()不属于集群节点的磁盘分区。A、服务级别的配置可对所有实例生效B、实例级别的配置只针对本实例生效C、实例级别的配置对其他实例也生效(正确答案)D、配置保存后需要重启服务才能生效88、FusionInsightManager对服务的配置功能说法不正确的是:()。A、createtableregion1(ctid_valueint)distributebyreplication(正确答案)B、createtableregion1(ctid_valueint);C、Createtableregion1(ctid_valueint)replication;D、以上都不正确;89、在FusionInsightLibrA中,下列()命令可以用于创建复制表。A、小波B、调和C、剪枝(正确答案)D、回归90、在决策树创建时,由于数据中的噪声和离群点,许多分枝反映的是训练数据中的异常,()方法处理这种过分拟合数据问题。A、ID3使用的信息增益B、C4.5使用的增益率C、CART使用的基尼指数D、NNM使用的梯度下降(正确答案)91、下面()不是属性选择度量。A、A—atomictty原子性:事务的所有操作要么全部完成,要么全部不完成B、C—consistency一致性:事务始终保证系统处于一致性的状态,不影响一致性C、I—Isolation隔离性:事务执行是隔离的,3个隔离级别(正确答案)D、D—Durability持久性:事务的结果是持久的92、下面关于ACID解释错误的是:()。A、Precision,Recall(正确答案)B、Recall,PrecisionC、Precision,RocD、Recall,Roc93、以下两种描述分别对应:()两种分类算法的评价标准。A、解析器从客户端应用获取输入的数据B、解析器对数据解析后,将数据分发诶各个处理单元进行处理C、各个处理单元把接受到的数据存储到各自的逻辑磁盘中D、每一个处理单元的逻辑磁盘只能是服务器自带的物理磁盘(正确答案)94、下列关于FusionInsightLibrA数据均匀分布的存储描述错误的是:()。A、analyze语句可收集与数据库中表内容相关的统计信息,统计结果存储在系统表PG_STATISTIC中B、建议对一个刚执行过大批量插入操作的表执行analyze语句,以便使LibrA内的优化器模块根据这些统计数据获得更优的输出,进而影响业务性能C、执行计划生成器会使用PG_STATISTIC表中的统计数据,以生成最有效的查询执行计划D、analyze语句中使用-pop选项,可避免当数据库中数据量过大时内存紧张(正确答案)95、在FusionInsightLibrA中,下面对analyze使用的描述错误的是:()。A、根结点(rootnode)B、内部结点(internalnode)C、外部结点(externalnode)(正确答案)D、叶结点(leafnode)96、决策树中不包含:()结点。A、CDMB、DRSC、RDSD、SG-ETL(正确答案)97、以下()组件不是华为产品的。A、barrier周期性的插入到数据流中,并作为数据流的一部分随之流动B、barrier是Flink快照的核心C、一个barrier将本周期快照的数据与下一周期快照的数据分隔开来D、在插入barrier的时候,会暂时阻断数据(正确答案)98、下列关于Flinkbarrier描述错误的是:()。A、HDFS(正确答案)B、HadoopC、MemoryD、MapReduce99、FusionInsightHDHBase默认使用()作为其底层文件存储系统。A、不会检查数据的有效性B、周期性地将本节点的Block相关信息发送给NameNodeC、不同的DataNode存储的Block一定是不同的(正确答案)D、一个DataNode上的Block可以是相同的100、华为FusionInsightHD系统中关于HDFS的DataNode的说法正确的是:()。A、yarn.scheduler.capacity.root.QueueA.user-limit-factorB、yarn.scheduler.capacity.root.QueueA.minimum-user-limit-percentC、yarn.scheduler.capacity.root.QueueA.capacity(正确答案)D、yarn.scheduler.capacity.root.QueueA.state101、YARN服务中,如果要给队列QuqueA设置容量为30%,应该配置()参数。A、RegionB、ColumnFamily(正确答案)C、ColumnD、Row102、HBase中Region的物理存储单元是:()。A、服务级别的配置可对所有实例生效B、实例级别的配置只针对本实例生效C、实例级别的配置对其他实例也生效(正确答案)D、配置保存好需要重启服务才能生效103、FusionInsightManager对服务的配置功能说法不正确的是:()。A、Supervisor负责资源的分配和任务的调度B、Supervisor负责接受Nimbus分配的任务,启动停止属于自己管理的Worker进程(正确答案)C、Supervisor是运行具体处理逻辑的进程D、Supervisor是在Topology中接收数据然后执行处理的组件104、关于FusionInsightHDStreaming的Supervisor描述正确的是:()。A、客户端所发送的更新会按照他们被发送的顺序进行应用B、一条消息要被超过半数的Server接收,他将可以成功写入磁盘C、消息更新只能成功或失败,没有中间状态D、Zookeeper节点数必须为奇数个(正确答案)105、下面关于Zookeeper的特性描述错误的是:()。A、支持对已建立的总连接数做阈值控制B、支持对每个用户已经建立的连接数做阈值控制C、支持对某个特定用户已建立的连接数做阈值控制(正确答案)D、支持对单位时间内所建立的连接数做阈值控制106、在FusionInsightHD中,以下()不属于Hive的流控特性。A、Split过程中B、Flush过程中C、Compaction过程中(正确答案)D、HFile分开过程中107、HBase中一个Region进行Split操作时,将一个HFile文件真正分开到两个Region的过程发生在以下()阶段。A、迭代计算B、离线计算(正确答案)C、实时交互计算D、流式计算108、Hadoop中MapReduce组件擅长处理()场景的计算任务。A、手动清除警告B、启停服务实例C、删除服务实例D、查询历史监控(正确答案)109、FusionInsightHD系统审计日志不可用记录下面()操作。A、第3个用户提交任务时,每个用户最多获得33.33%的资源B、第2个用户提交任务时每个用户最多获得50%的资源C、第4个用户提交任务时,每个用户最多获得25%的资源D、第5个用户提交任务时,每个用户最多获得20%的资源(正确答案)110、假设每个用户最低资源保障设置为yarn,scheduler,capacity,root,QueueA.minimum-user-limit-percent=24。则以下说法错误的是:()。A、StandaloneB、Mesos(正确答案)C、YARND、Docker111、Spark自带的资源管理框架是:()。A、RDD具有血统机制(Lineage)B、RDD默认存储在磁盘(正确答案)C、RDD是一个只读的,可分区的分布式数据集D、RDD是Spark对基础数据的抽象112、关于RDD,下列说法错误的是:()。A、只要有一个HiveServer不可用,整个Hive集群便不可用(正确答案)B、MotaStore用于提供元数据服务,依赖于DBServiceC、在同一时间点、HiveServer只要一个处于Active状态,另一个则处于Standby状态D、HiveServer负责接收客户端请求.解析.执行HQL命令并返回查询结果113、关于Hive在FusionInsightHD中的架构描述错误的是:()。A、切换Leader主各节点(正确答案)B、启动Loader实例C、配置Leader参数D、查看Loader服务状态114、在FusionInsightManager界面中、对Loader的操作不包括:()选项。A、kafka集群数据同步方案(正确答案)B、kafka单集群内数据备份C、kafka单集群内数据恢复D、以全部不对115、kafka-clustermirroring工具可以实现()功能。A、每条消息在文件中的位置称为offset(偏移量)B、消费者通过(offset.partition.topic)跟踪记录C、唯一标记一条消息D、Offset是一个String型字符串(正确答案)116、以下关于KafkaPartition偏移量的描述不正确的是:()。A、mapB、saveAsTextFile(正确答案)C、FilterD、reduceByKey117、RDD有Transformation和Action算子,下列属于Action算子的是:()。A、metastoreB、Statestore(正确答案)C、StoreageD、Warehouse118、在Zookeeper和Yarn的协同工作中,当ActiveResourceManager产生故障时,StandbyResourceManager会从()目录中获取Application相关信息。A、3B、2(正确答案)C、1D、4119、HDFS的副本放置策略中,同一机架不同的服务器之间的距离是:()。A、digestB、sasl(正确答案)C、authD、world120、Zookeeper的Scheme认证方式不包括:()。A、实时交互计算B、迭代计算C、流式计算D、离线计算(正确答案)121、下列选项中适合MapReduce的场景有:()。A、dfs-putB、dfs-catC、dfs-get(正确答案)D、dfs-mkdir122、下列()命令是从HDFS下载目录/文件到本地。A、由RegionServer进行裁决B、HMaster为双主模式,不需要进行裁决C、通过ZooKeeper进行裁决(正确答案)D、随机选举123、HBase的主HMaster是:()选举的。A、Hive最终将数据存储在HDFS中B、Hive是Hadoop平台的数据仓库工具C、HQL可以通过MapReduce执行任务D、Hive对HBase有强依赖(正确答案)124、关于Hive与Hadoop其他组件的关系,以下描述错误的是:()。A、SparkStreaming与Flink相比,时延更低(正确答案)B、Flink流式处理引擎能够同时提供支持流处理和批处理应用的功能C、checkpoint实现了Flink的容错D、与FusionInghtHD中的Streaming相比,Flink具有更高的吞吐量125、以下关于Flink关键特性描述不正确的是:()。A、Kafka针对Partition的复制需要选出一个Leader。由该Leader负责Partition的读写操作。其他的副本节点只是负责数据同步B、由于LeaderServer承载了全部的请求压力。因此从集群的整体考虑,Kafka会将Leader均衡的分散在每个实例上,来确保数据均衡C、一个Kafka集群各个节点间不可能互为Leader和Flower(正确答案)D、如果Leader失效。那么将会有其他follower来接管(成为新的Leader)126、为了提高Kafka的容错性,Kafka支持Partition的复制策略,以下关于LeaderPartition和FollowerPartition的描述错误的是:()。A、一个barrier将本周期快快照的数据与下一个周期快照的数据分隔开来B、barrier是Flink快照的核心C、在插入barrier的时候,会暂时阻断数据流(正确答案)D、barrier周期性插入到数据流中,并作为数据流的一部分随之流动127、下列关于Flinkbarrieer描述错误的是:()。A、.Supervisor是在Topology中接受数据然后执行处理的组件B、Supervisor负责接受Nimbus分配的任务,启动和停止属于自己管理的Worker进程(正确答案)C、Supervisor负责资源分配和任务调度D、Supervisor是运行具体处理逻辑的过程128、关于FusionInsightHDStreaming的Supervisor描述正确的是:()。A、一个用户提交任务,可以使用QueueA的100%的资源B、如果QueueA中已经有2个用户的任务运行,这时第3个用户提交的任务需要等待释放资源C、QueueA中必须保障每个用户至少得到50%的资源D、QueueA中的每个用户最多只能获得50%的资源(正确答案)129、Hadoop中、如果yarn,scheduler.capacity.root.QueueA.minim.m-user-limit-percent设置为50,下面说法错误的是:()。A、分布式锁机制B、Watcher(正确答案)C、CheckpointD、ACK130、Streaming主要通过zookeeper提供以下的()实现事件侦听。A、选举Master节点B、保证各节点上数据的一致性C、分配集群资源(正确答案)D、存储及群中服务器信息131、Zookeeper在分布式应用中的主要作用不包括:()选项。A、HDFSClientB、NodeManagerC、ResourceManagerD、ZooKeeperFailoverController(正确答案)132、HDFS中Namenode的主备仲裁,是由:()组件控制的。A、4B、3C、2(正确答案)D、1133、安装FusionInsightHD的Streaming组件是,Nimbus角色要求安装()个节点。A、3、NB、N、NC、2、N(正确答案)D、2、2134、在有N个节点FusionInsightHD集群中部署HBase时、推荐部署()个HMaster进程,()个RegionServer进程。A、channelB、Transformation(正确答案)C、sinkD、source135、Flink的数据转换操作在:()环节中完成。A、数据交换(正确答案)B、监控告警C、链路监测D、任务调度136、数据中台功能架构中数据接入包含:()能力。A、分布式数据仓库B、分布式关系数据库C、流计算D、任务调度(正确答案)137、以下()能力不属于数据中台能力架构中存储计算能力。A、安全管理B、数据开发C、数据资产目录(正确答案)D、计量管理138、数据中台功能架构中数据资产管理包含:()能力。A、内存计算B、标签管理C、任务调度(正确答案)D、服务目录139、数据中台功能架构中运营管理包含:()能力。A、贴源层B、轻度汇总层(正确答案)C、共享层D、分析层140、以下()选项不属于数据中台三层架构。A、贴源层B、共享层C、分析层(正确答案)D、整合明细层141、分析应用计算后的分析主题数据存储在:()。A、营销服务中心B、全业务统一数据中心(正确答案)C、海量历史/实时数据中心D、电网GIS数据中心142、国网数据中台,是在下面()数据中心阶段的基础上发展过来的。A、统计B、删除C、新增(正确答案)D、修改143、数据中台在汇聚生产库的结构化数据时,最多的数据处理操作是:()。A、OGGB、InformaticaC、SDRD、DRS(正确答案)144、华为8.0数据中台数据复制产品是:()。A、MRS(正确答案)B、GBase8AC、DWSD、DAYU145、华为8.0数据中台架构贴源层数据存储产品是:()。A、hdfsfsck/(正确答案)B、hdfsfsck–deleteC、hdfsdfsadmin–reportD、hdfsbalancer–threshold1146、下列()HDFS命令可用于检测数据块的完整性。A、用来过滤数据B、用来优化随机读取的性能C、会增加存储的消耗(正确答案)D、可以准确判断某条数据不存在147、下列关于HBase的BloomFilter特性理解正确的是:()。A、GTMB、WLMC、CN(正确答案)D、DN148、以下()组件负责接收来自应用的访问请求,并向客户端返回执行结果。A、GTMB、WLM(正确答案)C、CND、DN149、以下()组件负责控制系统资源的分配,防止过量业务负载对系统的冲击而导致业务拥塞。A、GTM(正确答案)B、WLMC、CND、DN150、以下()组件负责生成和维护全局事务ID、事务快照、时间戳等全局唯一信息。A、GTMB、WLMC、CND、DN(正确答案)151、以下()组件负责存储业务数据、执行数据查询任务以及向CN返回执行结果。A、gsqlB、GDS(正确答案)C、DataStudioD、DSC152、以下()工具可以实现大量数据的快速导入和导出。A、主备从架构(正确答案)B、一主多备架构C、两者兼有D、其他153、DWSDN的高可用架构是:()。A、GTMB、WLMC、CN(正确答案)D、DN154、以下()组件采用Active-Active高可用模式。A、设置CN心跳超时时间的值大于0B、集群中的CN总数必须大于等于3C、多CN故障时只能剔除一个CND、CN剔除以后,逻辑集群的创建、删除、扩容、缩容、回滚、显示操作可以执行(正确答案)155、以下不属于CN自动剔除约束的是:()。A、BLOB选项1C、BYTEAD、TEXT(正确答案)156、下面()不是二进制类型。A、INTERSECT(正确答案)B、RAWC、EXECPTD、UNION157、查询集合操作中,表示交集的是:()。A、WHERE子句B、MINUS(正确答案)C、LIMIT子句D、ORDERBY子句158、下面()子句专用于GroupBy操作中的条件过滤功能。A、STRICTB、HAVING子句(正确答案)C、USAGED、159、要级联删除用户创建的表等数据库对象,使用关键字()。A、EXECUTEB、CASCADEC、CREATE(正确答案)D、USAGE160、如果要在某个模式下创建对象,该用户对此模式应具有:()权限。A、INSERTB、SELECTC、SELECT(正确答案)D、DELETE161、CREATETABLEAS创建表,后面需要添加查询语句类型是:()。A、作为分布列的字段尽量聚集B、UPDATE(正确答案)C、尽量选择在查询中存在形如col=10001过滤条件的字段D、162、表设计时选择分布列的原则包括:()。A、gs_clean(正确答案)B、选择查询中关联条件作为分布列C、gs_dumpD、gs_ctrl163、用来清理残留事务的工具是:()。A、AccessShareLockB、gs_guc(正确答案)C、ShareUpdateExclusiveLockD、ExclusiveLock164、Insert事务使用的锁模式是:()。A、DAGB、RowExclusiveLockC、WFG(正确答案)D、DLC165、数据库利用()进行死锁检测。A、读读B、RPCC、读写(正确答案)D、上述都包括166、MVCC用于解决()事务冲突。A、FIFOB、写写C、SLRU(正确答案)D、RANDOM167、CLOG日志缓冲区使用()算法。A、xminB、LRU(正确答案)C、dataD、cid168、MULTIXACT日志存储的内容针对的是记录()。A、GTM(正确答案)B、xmaxC、DND、CM_SERVER169、CSN的推进和分配在()管理。A、行执行引擎B、CNC、行列混合执行引擎D、以上都是(正确答案)170、执行引擎的类型包括:()。A、SeqScanB、向量化执行引擎(正确答案)C、SubqueryScanD、ValuesScan171、以下扫描算子中用于对列存表进行扫描的算子是:()。A、4B、CstoreScan(正确答案)C、2D、1172、Agg算子的实现策略有:()。A、performanceB、3(正确答案)C、analyzeD、verbose173、以下不是EXPLAIN命令选项的是:()。A、支持行存表数据加密,不支持列存表加密(正确答案)B、prettyC、使用KMS服务加密D、加密密钥层次结构有三层174、以下关于DWS数据库透明加密的特点,错误的是:()。A、startedB、支持集群级别配置C、commit(正确答案)D、inprogress175、以下不属于事务上层系统状态的是:()。A、流式处理B、beginC、流批一体(正确答案)D、都不支持176、数据湖探索(DataLakeInsight,简称DLI)是支持以下()形式的大数据计算分析服务。A、DLI(正确答案)B、批处理C、HudiD、OpenDelta177、以下()不属于开源数据湖解决方案。A、UTF-8(正确答案)B、IcebergC、GB2312D、Base64178、DLI支持以下()字符码的数据。A、1.准备数据2.编辑并提交作业3.购买队列4.查看作业状态B、ASCIIC、1.购买队列2.准备数据3.编辑并提交作业4.查看作业状态(正确答案)D、1.编辑并提交作业2.准备数据3.购买队列4.查看作业状态179、使用DLI的正确操作顺序为:()。A、ORCFileB、1.准备数据2.购买队列3.编辑并提交作业4.查看作业状态C、SequenceFile(正确答案)D、RCFile180、以下()文件格式为纯行式存储。A、分析挖掘模型更好地落地固化与应用B、ParquetFileC、让标签以更加直观的方式进行可视化展示D、数据趋势预测(正确答案)181、下列不是普元标签产品解决的问题是:()。A、插入B、对庞大的标签体系进行统一有序的管理(正确答案)C、删除D、追加182、修改资源的化导入excel的操作列应该填写()。A、创建索引B、更新C、更新索引(正确答案)D、删除说因183、资源注册页面,点击solr增量索引的作用是:()。A、启动extractor(正确答案)B、增加索引C、配置连接信息D、安装驱动包184、采集数据字典首先应该()。A、循环执行(正确答案)B、对数据库用户授权C、手动执行D、定时立即执行185、元数据采集任务的启动方式不包括:()。A、数据接入B、定时执行C、数据服务D、应用研发(正确答案)186、以下()能力不属于数据中台能力架构能力。A、JDK1.5以上版本B、存储计算C、JDK1.7以上版本D、JDK1.6以上版本(正确答案)187、数据订阅功能将数据库中关键业务的数据变化信息缓存并提供统一的SDK接口,方便下游业务订阅、获取、并消费,关于数据订阅服务开发环境使用的JAVA版本SDK版本,描述正确的是:()。A、服务IDB、JDK1.8以上版本(正确答案)C、表名D、库名188、以下()不是订阅数据包含的内容。A、Postgres->GaussDBB、数据库类型(正确答案)C、Mysql->GaussDB(forMySQL)D、Postgres->GaussDB189、在线迁移同步过程中可能因数据冲突、数据加工、异构类型转化、对象缺失等因素导致数据异常,用户可以通过“异常数据”页签查看,以帮助异常写入的排查。下列同步过程中,支持异常诊断的是:()。A、本地自建库B、Oracle->RDSforMySQLC、本云ECS自建库D、本地云上数据库(正确答案)190、在线迁移新建任务配置时,在“场景选择”页面,不属于源数据库来源的是:()。A、ABCedB、本云云数据库C、abcd001D、abcd#001(正确答案)191、在DRS中,以下迁移任务命名错误的是:()。A、创建用户(正确答案)B、ab-cdC、级别D、描述192、DRS查看迁移任务中的迁移日志,不

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论