大数据HCIA模拟题及答案_第1页
大数据HCIA模拟题及答案_第2页
大数据HCIA模拟题及答案_第3页
大数据HCIA模拟题及答案_第4页
大数据HCIA模拟题及答案_第5页
已阅读5页,还剩13页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

大数据HCIA模拟题及答案

1、FusionlnsightHD部署时,同一集群内的Flumeserver节点建议至少部

署几个?

A、1

B、2

C、3

D、4

答案:B

2、Flink中的()接口用于流数据处理,()接口用于批处理?

A、BatchAPI,StreamAPI

B、DataStreamAPI,DataSetAPI

C、StreamAPI,BatchAPI

D、DataBatchAPI,DataStreamAPI

答案:B

3、FusionlnsightHadoop集群中,在某节点上通过df-hT查询,看到的分

区包含以下几

个:/var/log/srv/BigData/srv/BigData/hadoop/data5/srv/BigData/solr/sol

rserver3/srv/BigData/dbdataom这些分区所对应磁盘最佳Raid级别的规划组

合是?

A、RaidORaidlRaidONon-Raidl

B、RaidlRaidlNon-RaidNon-RaidRaidl

C、RaidORaidORaidORaidORaidO

D、Non-RaidNon-RaidNon-RaidNon-RaidRaidl

答案:B

4、关于HBase的RegionSplit分裂流程的描述不正确的是()

A、Split过程中该表会暂停服务

B、Split为了减少Region中数据大小,从而将一个Region分裂成两个

Region

C、Split过程中被分裂的Region会暂停服务

D、Split过程中并没有真正的将文件分裂,仅仅是创建了引用文件

答案:A

5、Hadoop系统中YARN资源的抽象是用什么表示?

A、内存

B、CPU

C、Container

D、磁盘空间

答案:C

6、Hadoop系统中关于客户端向HDFS文件系统上传文件说法正确的是?

A、客户端的文件数据经过NameNode传递给DataNode

B、客户端将文件划分为多个Block,根据DataNode的地址信息,按顺序

写入每一个DataNode中

C、客户端根据DataNode的地址信息,按顺序将整个文件写入每一个

DataNode中,然后由DataNode将文件划分为多个Block

D、客户端只上传数据到一个DataNode,然后由NameNode负责Block复制

答案:B

7、YARN中默认的资源调度器是什么

A、FIFO调度器

B、容量调度器

C、Fair调度器

D、以上全不正确

答案:A

8、下列关于Flinkbarrier描述错误的是()

A、barrier周期性的插入到数据流中,并作为数据流的一部分随之流动

B、barrier是Flink快照的核心

C、一个barrier将本周期快照的数据与下一周期快照的数据分隔开来

D、在插入barrier的时候,会暂时阻断数据流

答案:D

9、Flink是流计算处理和批处理平台,()是数据批处理和流处理的核心

引擎。()

A、Runtime

B、DataStream

C、DataSet

D、FlinkCore

答案:A

10>下面关于ZooKeeper描述错误的是()

A、一条消息被一半以上的server接收,他将写入磁盘

B、ZooKeeper的节点数必须是奇数个

C、消息更新只有成功和失败,没有中间状态

D、客户端发送的更新会按照他们发送的顺序被应用

答案:B

11、Kafka集群在运行期间,直接依赖于下面哪些组件?()

A、HBase

B、Spark

C、HDFS

D、Zookeeper

答案:D

12、以下关于Hive的描述不正确的是?

A、Hive可以实现在大规模数据集上实现低延迟快速的查询。

B、Hive构建在基于静态批处理的Hadoop之上,Hadoop通常都有较高的延

迟并且在作业提交和调度的时候需要大量的开销

C、Hive的最佳使用场合是大数据集的批处理作业

D、Hive查询操作过程严格遵守HadoopMapReduce的作业执行模型,Hive

将用户的HiveQL语句通过解释器转为MapReduce作业提交到Hadoop集群上

答案:A

13、安装FusionlnsightHD的Streaming组件Nimbus角色要求安装几个节

点?

A、4

B、3

C、2

D、1

答案:C

14、Kafka集群中,Kafka服务端部署的角色是?

A、Producer

B、ZooKeeper

C、Broker

D、Consumer

答案:C

15、华为FusionlnsightHD系统中关于HDFS的DataNode说法正确的是?

A、不会检查数据的有效性

B、周期性地将本节点的Block发送给NameNode

C、不同的DataNode存储的Block一定是不同的

D、一个DataNode上的Block可以是相同的

答案:D

16、HDFS中NameNode的主备仲裁,是有那个组件控制的?

A、HDFSClient

B、ResourceManager

C、ZooKeeperFailoverController

D、NodeManager

答案:c

17、下面关于zookeeper的说法错误的是()

A、zookeeper使用自定义的原子消息协议,保证整个系统中节点数据的一

致性

B、Zookeeper集群在启动时就选举出Leader角色

C、Leader节点在接受到数据变更请求后,先写磁盘再写内存。

D、如果zookeeper在同步消息过程中发生中断,故障恢复后可根据故障前

的状态继续同步,即支持断点续传

答案:D

18、Hadoop平台中,要查看YARN服务中一个application的信息,通常

需要使用什么命令?

A、container

B、jar

C、application-attempt

D、Application

答案:D

19、以下关于FusionlnsightCTBase的描述不正确的是?

A、CTBase的读写数据接口,统一封装了行定义的接口,自动进行冷字段

的合并和解析,不需要在应用程序中进行合并和解释

B、CTBase是基于HBase的聚簇表开发框架

C、CTBase提供了一套WebUI进行元数据定义,提供了只管医用的表设计

工具,降低表设计的难度

D、CTBase的javaAPI提供一套HBase连接池管理的接口,内部进行连接

共享,减少客户端应用开发难度。

答案:B

20、关于FusionlnsightHD中Loader作业描述正确的是?

A、Loader将作业提交到Yarn执行后,如果此时Loader服务出现异常,

则此作业执行失败。

B、Loader将作业提交到Yam执行后,如果某个Mapper任务执行失败,

能够自动进行重试。

C、Loader作业执行失败后将会产生垃圾数据,需要用户手动清除。

D、Loader将一个作业提交至Yarn执行后,该作业执行完成前,不能再提

交其他作业。

答案:B

21、以下关于FusionlnsightManager界面Hive日志收集的描述,哪个选

项不正确?()

A、可指定特定用户进行日志收集,例如仅下载Use”用户产生的日志。

B、可指定时间段进行日志收集,比如只收集2016-1-1到2016-1收0的日

,士已、O

C、可指定实例进行日志收集,比如指定收集metstore的日志。

D、可指定节点IP进行日志收集,例如仅下载某个IP的日志。

答案:A

22>华为FusionlnsightHD系统中关于HDFS的DataNode的说法正确的是?

A、不会检查数据的有效性

B、周期性地将本节点的Block相关信息发送给NameNode

C、不同的DataNode存储的Block一定是不同的

D、一个DataNode上的Block可以是相同的

答案:B

23>哪个不是Flume的channel类型?

A、MemoryChannel

B、FileChannel

C、JDBCChannel

D>HDFSChannel

答案:D

24、下面哪些场景不是Flink组件擅长的?()

A、批处理

B、迭代计算

C、数据存储

D、流处理

答案:C

25、采用Flume传输数据过程中,为了防止因Flume进程重启而丢失数据,

推荐使用以下哪种channel类型?

A、MemoryChannel

B、FileChannel

C、JDBCChannel

D、HDFSChannel

答案:B

26、YARN中默认的资源调度器是?()

A、FIFO调度器

B、容量调度器

C、Fair调度器

D、以上全不正确

答案:B

27^FusionlnsightManager对服务的管理操作,下面说法错误的是?

A、可对服务进行启停重启操作

B、可以添加和卸载服务

C、可设置不常用的服务隐藏或显示

D、可查看服务的当前状态

答案:C

28、以下哪些选项属于FusionlnsightSparkSQL的优点?

A、支持数据插入、更新和删除

B、长稳测试

C、以上全都正确

D、稳定和高性能

E、SQL兼容性

答案:C

29、当ZooKeeper集群的节点数为5节点时,请问集群的容灾能力和多少

节点是等价的?()

A、3

B、4

C、6

D、以上说法都不对

答案:C

30^关于FusionlnsightHD安装流程正确的是?

A、安装Manager->执行preinstall->LLD工具进行配置->安装集群-〉安装

后检查->安装后配置

B、LLD工具进行配置->执行preinstall->安装Manager-〉安装集群-〉安装

后检查->安装后配置

C、安装Manager->LLD工具进行配置->执行preinstall->安装集群->安装

后检查->安装后配置

D、LLD工具进行配置->执行preinstall->安装集群->安装Manager->安装

后检查->安装后配置

答案:B

31、KafkaClusterMirroring工具可以实现以下哪些功能?

A、Kafka跨集群数据同步方案

B、Kafka单集群内数据备份

C、Kafka但集群内数据恢复

D、以上全不正确

答案:A

32、Spark应用在运行时,Stage划分的依据是什么?

A、shuffle

B、taskSet

C、action

D、task

答案:A

33>关于FusionlnsightManager中的Controller和NodeAgent,说法正

确的是?

A、Controller每陪3秒向NodeAgent发送心跳

B、NodeAgent接受Contcolleir下发的命令,执行具体的动作

C、每个节点都必须部署Controller

D、NodeAgent是开源增强的

答案:B

34、FusionlnsightHD中,如果需要查看当前登录HBase的用户和权限组,

可以在HBaseshell中执行什么命令?

A、use_permission

B、whoami

C、who

D>get_user

答案:B

35、加载数据到Hive表,哪种方式不正确?

A、直接将本地路径的文件load到Hive表中

B、将HDFS上的额文件load到Hive表中

C、Hive支持insertinto单条记录的方法,所以可以直接在命令行插入单

条记录

D、将其他表的结果集insertinto到Hive表中

答案:c

36、在FusionlnsighlHD中,创建Loader作业的进行数据转换的正确步骤

是()

A、加载、转换、输出

B、输入设置、转换、输出

C、加载、转化、抽取

D、抽取、转换、输出

答案:B

37、Hadoop的HBase不适合哪些数据类型的应用场景?

A、大文件应用场景

B、海量数据应用场景

C、高吞吐率应用场景

D、半结构化数据应用场景

答案:A

38、Hive不适用于以下哪个场景

A、非实时分析,例如日志分析,统计分析

B、数据挖掘,例如用户行为分析,兴趣分析,区域展示

C、数据汇总,例如每天,每用户点击数,点击排行

D、实时在线数据分析

答案:D

39、在有N个节点FusionlnsightHD集群中部署HBase时,推荐部署()

个HMaster进程,。个RegionServer进程?

A、2,2

B、2.N

C、3.N

D、N.N

答案:B

40、FusionlnsightHDManager界面Hive日志收集,那个选项不正确?

A^可指定实例进行日志收集,比如指定单独收集MetaStore的臼志

B、可指定时间段进行日志收集,比如只收集2016-1T到行16志收0的日

C、可指定节点IP进行曰志收集,例如仅下载某个IP的日志

D、可指定特定用户进行日志收集,例如仅下载use”用户产生的日志

答案:D

41、下列关于worker(工作进程)、Executor(线程)、task(任务)说

法正确的是?O

A、每个Executor(线程)可以运行多个task(任务)

B^每个Executor(线程)可以运行不同组件(spout或bolt)的task

(任务)

C、每个worker可以运行多个Executor(线程)

D、每个worker只能为一个拓扑运行Executor(线程)

答案:ABCD

42、Loader提供了哪些方式或接口实现作业管理?

A、REST接口

B、WEBUI

C、Linux命令行

D、JavaAPI

答案:ABCD

43、下面哪些是MapReduce的特点?

A、实时计算

B、易于编程

C、高容错性

D、良好的扩展性

答案:BCD

44、Hadoop的HBase主要特点有哪些?

A、高可靠性

B、高性能

C、面向列

D、可伸缩

答案:ABCD

45、FusionlnsightHD平台中,哪些组件支持对表、列加密?()

A、Flink

B、HBase

C、Hive

D、HDFS

答案:BC

46、Spark适用于以下哪些场景?

A、批处理

B、交互式查询

C、实时流处理

D、图计算

答案:ABC

47、HBase中以下哪种场景会出发Flush操作?

A、HBase定期刷新Memstore,默认周期为1小时

B、当WALs中文件数量达到阈值时

C、Region中MemStore的总大小,达到了预设的FlushSize阈值

D、MemStore占用内存的总量和RegionServer总内存比值超出了预设的阈

值大小

答案:ABCD

48、FusionlnsightManager界面显示Hive服务状态为Bad时,可能原因

有哪些?

A、DBService不可用

B、HDFS服务不可用

C、MetaStore实例不可用

D、HBase服务不可用

答案:ABC

49、以下对与Supervisor的描述正确的是

A、Nimbus主备部署,解决Nimbus单点问题,支持主从热切换。

B、Supervisor失效后能够自动恢复,并且不影响正在运行的业务。

C、Worker失效后能够自动恢复,继续运行。

D、集群内节点失效后在该节点上的任务会被重分配到其他正常节点。

答案:ABCD

50、以下哪些选项属于Hive的数据存储模型?

A、以上全都正确

B、桶

C、数据库

D、表

E、分区

答案:ABCDE

51、大数据分析相关技术主要特征有哪些?

A、以精确样本为基础

B、机器学习,全量特征

C、数据背后事件关联性分析

D、以海量数据为基础

答案:BCD

52、以下属于HiveSQL中DDL(数据定义语言)的是?

A、删除表

B、数据导入

C、修改表

D、建表

答案:ACD

53、MapReduce过程中,以下属于Shuffle机制的是?

A、Copy

B、Partition

C^Combine

D、Sort/Merge

答案:AD

54、若在消息处理过程中允许部分信息丢失,关闭消息可靠性处理机制的

方式有以下哪些?

A、将参数Config.Topology_ACKERS设置为错

B、Bolt发送消息时使用Unanchor方式发送

C、Spout发送消息时,使用不指定消息messagelD的接口进行发送

D、将参数Config.Topology_ACKERS设置为0

答案:BCD

55^以下关于KafkaLogs中segmentfile的说法正确的有?

A、使index元数据全部映射到menory,可以避免sementfile的index数

据10磁盘操作

B、索引文件稀疏存储,可以大幅减低index文件元数据占用空间大小

C、稀疏存储,即将原来的完整数据,只间隔的选择多条进行存储

D、通过索引信息可以快速定位message

答案:ABCD

56、ZKFC进程部署在HDFS中的以下哪个节点上?

A^ActiveNameNode

B^StandbyNameNode

C、DataNode

D、以上全不正确

答案:AB

57、在Streaming的处理节点Bolt中,可以完成以下哪些操作?

A、业务处理

B、连接数据库

C、过滤(filter)

D、连接运算

答案:ABCD

58、FusionlnsightHD集群中包含了多种服务,每种服务又由若干角色组

成,下面哪些是服务的角色?

A、HDFS

B、NameNode

C、DataNode

D、HBase

答案:BC

59、Flink流式处理的数据源类型包括?

A、Files

B、Collections

C、JDBC

D、Socketstreams

答案:ABD

60、在Fusioninsight集群中,Spark主要与以下哪些组件进行交互?()

A、Hive

B、YARN

C、HDFS

D、Zookeeper

答案:BCD

615FusionlnsightHD系统中使用Streaming客户端Shell命令查看拓扑

或者提交拓扑失败,以下哪些定位手段是正确的?

A、查看客户端异常堆栈,判断是否客户端使用问题

B、查看主Nimbus的运行日志,判断是否Nimbus服务端异常

C、查看Supervisor运行日志,判断是否Supervisor异常

D、查看Worker运行日志

答案:AB

62>FusionlnsightManager与外部平台对接时,支持哪些接口?

A、SNMP

B、VPN

C、BGP

D、Syslog

答案:AD

63、下列哪些措施是为了保障数据的完整性

A、元数据可靠性保证

B、重建失效数据盘的副本数据

C、安全模式

D、集群数据均衡

答案:ABCD

64、在华为大数据解决方案中,hadoop层包含以下哪些组件?()

A、Hive

B、Spark

C^Miner

D、Flink

答案:ABD

65、下列关于HBase存储模型的描述正确的是

A、同一个Key值可以关联多个Value

B、KeyValue中拥有时间戳,类型等关键信息

C、即使是Key值相同,Qualifier也相同的多个KeyValue,也可能有多个,

此时使用时间戳来区分

D、每一个KeyValue都拥有一"Qualifier标识

答案:ABCD

66下列关于Flink中Transformation的说法正确的是?

A、可以通过window设定时间窗口

B、Filtor操作是对每个元素执行boolean函数

C、flatMap可以对文本进行切分

D、keyBy是将源头数据按照key进行分组,以保证同一个key的元数据分

到同样的组中

答案:ABD

67、在Loader历史作业记录中,可以查看以下哪些内容?

A、错误行/文件数量

B、作业状态

C、脏数据连接

D、作业开始/运行时间

答案:ABCD

68、以下属于Streaming的特点的是?

A、属于事件驱动

B、延迟低

C、可做连续查询

D、数据先存储在计算

答案:ABC

69、FusionlnsightHD在安装集群成功后,有哪些项需要检查?

A、Service组件健康状态

B、系统是否有告警

C、服务的配置状态是否为已同步

D、主机健康状态

答案:ABCD

70、FusionlnsightHD数据高可靠性体现在以下哪些方面?()

A、第三方备份系统集成

B、关键数据掉电保护

C、跨数据中心容灾

D、硬盘热插拔

答案:ABCD

71、Zookeeper的增强特性包括在审计日志中添加ephemeralnode被删除

的审计日志。()

A、正确

B、错误

答案:A

72、Flume的properties配置文件中可以配置多个channel来传输数据。

A、正确

B、错误

答案:A

73、FusionlnsightManager支持大规模集群的安装部署、监控、告警、用

户管理、权限管理、审计、服务管理、健康检查、问题定位、升级和补丁。

A、正确

B、错误

答案:A

74、华为FusionlnsightHD系统中,对存储副本为3个的数据块,当有一

个节点上该数据块丢失时,需要手动复制一个副本到该节点。(B)

A、正确

B、错误

答案:B

75、Fusioninsight中Hive包含2个角色,HiveServer和MetaStore.

A、正确

B、错误

答案:A

76、在YARN的任务调度中,一旦ApplicationMaster申请到资源后,便与

对应的ResourceManager通信,要求它启动任务。

A、正确

B、错误

答案:B

77、topology的处理逻辑都在bolt中。

A、正确

B、错误

答案:A

78、假设HDFS在写入数据时只存2份,那么在写入过程中,HDFSClient

先将数据写入DataNodel,再将数据写入DataNode2。()

A、正确

B、错误

答案:B

79、Flume的数据流可以根据headers的信息发送到不同的Channel中。

A、正确

B、错误

答案:A

80、FusionlnsightHD集群中的节点只安装了一块网卡,也可以采用双平

面隔离组网方案。

A、正确

B、错误

答案:B

81、Fusioninsighttool是为技术支持工程师和维护工程师提供的一套健

康检测工具,能够检查集群相关节点、服务的健康状态,提前发现集群中潜在

的问题,并生成健康检查报告。方便技术支持工程师各维护工程师快速了解系

统的健康状况。()

A、正确

B、错误

答案:A

82、FusionlnsightHD中Loader作业提交到YARN后,作业不能手动停止。

A、正确

B、错误

答案:B

83、Kafka是一个分布式的消息发布订阅系统,它只是进行消息的转发,

并不会保存消息。

A、正确

B、错误

答案:B

84、FusionlnsightHD产品中,zookeeper服务不可用会导致kafka服务不

可用。

A、正确

B、错误

答案:A

85、HBase的数据文件HFile中一个KeyValue格式包含Key、Value、

TimeStamp>KeyType等内容。

A、正确

B、错误

答案:A

86、Flink中的TaskSlot主要用于资源隔离,其中包含内存资源和CPU资

源。

A、正确

B、错误

答案:B

87、HDFS支持大文件存储,同时支持多个用户对同一个文件

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论