大数据HCIA题库+答案_第1页
大数据HCIA题库+答案_第2页
大数据HCIA题库+答案_第3页
大数据HCIA题库+答案_第4页
大数据HCIA题库+答案_第5页
已阅读5页,还剩24页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

大数据HCIA题库+答案

一、单选题(共41题,每题1分,共41分)

1.硬件故障被认为是常态,为了解决这个问题,HDFS设计了副本机

制。默认情况下,一份文件,HDFS会存()份?

A、4

B、3

C、5

D、2

正确答案:B

2.spark的核心模块是?

A、sparkcore

B、mapreduce

C、sparkstreaming

D、sparksql

正确答案:A

3.传统数据处理的数据规模的单位是?

A、TB

B、EB

C、PB

D、GB

正确答案:D

4.FusionlnsightUD产品中,关于Kafka组件部署说法不正确的是?

A、Kafka强依赖于ZooKeeper,安装Kafka必须安装ZooKeeper

B、Kafka部署的实例个数不得小于2

C、Kafka的服务端可以产生消息

D、Consumer作为Kafka的客户端角色专门进行消息的消费

正确答案:C

5.下面关于ZooKeeper描述错误的是()

A、一条消息被一半以上的server接收,他将写入磁盘

B、ZooKeeper的节点数必须是奇数个

C、消息更新只有成功和失败,没有中间状态

D、客户端发送的更新会按照他们发送的顺序被应用

正确答案:B

6.HBase的物理存储单元是什么?

A^Region

B、ColumnFamily

C、Column

D、ROW

正确答案:B

7.关于HBase的Region分裂流程Split的描述不正确的是?

A、Split过程中并没有真正的将文件分开,仅仅是创建了引用文件

B、Split为了减少Region中数据大小,从而将一个Region分裂成

两个Region

C、Split过程中该表会暂停服务

D、Split过程中被分裂的Region会暂停服务

正确答案:C

8.Kafka集群中,Kafka服务端部署的角色是?

ANProducer

B、Consumer

C>ZooKeeper

D>Broker

正确答案:D

9.创建Loader作业时,可以在以下哪个步骤中设置Map数?

A、输出

B、转换

C、输入设置

D、基本信息

正确答案:A

10.关于DataSet,下列说法不正确的是?()

A、DataSet是一个由特定域的对象组成的强类型集合

B、DataSet不需要反序列化就可执行大部分操作

C、DataSet执行sort、filter、shuffle等操作需要进行反序列化

D、DataSet与RDD高度类似,性能比RDD好

正确答案:C

11.FusionlnsightHD系统中,LDAP数据同步方式是哪个?

A、单向同步

B、双向同步

C、隔离不同步

D、数据交叉同步

正确答案:A

12.HBase中数据存储的文件格式是什么?

A、HFile

B、HLog

C、TextFile

SoquenceFile

正确答案:A

13.HBase中数据存储的文件格式是什么?

A、HFile

SequenceFile

C、Log

DsTXTfile

正确答案:A

14.Flume用于收集数据,其传输的数据基本单位是?

A、Split

B、Block

C、Event

D>Packet

正确答案:C

15.Hadoop中MapReduce组件擅长处理哪种场景的计算任务?

A、实时交互计算

B、流式计算

C、离线计算

D、迭代计算

正确答案:C

16.关于Hive与Hadoop其他组件的关系,以下描述错误的是?

A、Hive最终将数据存储在HDFS中

B、HivoSQL其本质是执行MapReduce任务

C、Hive是Hadoop平台的数据仓库工具

D、Hive对HBase有强依赖

正确答案:D

17.关于Kafka磁盘容量不足的告警,对于可能的原因以下分析不正

确的是?

A、用于存储Kafka数据的磁盘配置(如磁盘数目、大小等),无法

满足当前业务数据流量,导致磁盘使用率达到上限

B、数据保存时间配置过长,数据累积达到磁盘使用率上限

C、业务规划不合理,导致数据分配不均匀,使部分磁盘达到使用率

上限

D、Broker节点故障导致

正确答案:D

18.FusionlnsightHD系统中HDFS的Block默认保存几份?

A、3份

B、2份

C、1份

D、不确定

正确答案:A

19.下列哪个不是HBase读取数据流程中涉及的角色或服务?()

A、HDFS

B、Zookeeper

C>HMaster

D>HRegionServer

正确答案:C

20.HDFS中的主备仲裁,是由哪个组件控制的?

A^ZooleeperFailoverController

B、NodeManager

C、ResourceManager

D、HDFSClient

正确答案:A

21.Spark是以下哪种编程语言实现的?

A、C

B>Ci।

C、JAVA

D、Scala

正确答案:D

22.hbase的底层数据以()的形式存在的?

A、行存储

B、列存储

C、keyvalue

D、实时存储

正确答案:C

23.FusionlnsightHD的Manager界面对Loader的操作不包括下列

哪个?

A、启动Loader实例

B、查看Loader服务状态

C、配置Loader参数

D、查看Loader运行日志

正确答案:D

24.以下关于IIBase二级索引的描述哪一项是正确的()

A、二级索引把要查找的列与rowkey关联成一个索引表

B、此时列成新的rowkey,原rowkey成为value

C、二级索引查询了2次

D、以上全都正确

正确答案:D

25.Zookeeper的Scheme认证方式;不包括以下哪项?

A、auth

B>sasl

C、world

D、digest

正确答案:B

26.某银行规划的FusionlnsightHD集群有90个节点,如果控制节

点规划了3个,那集群中数据节点推荐规划()个。

A、87

B、85

C、90

D、86

正确答案:B

27.FusionInsightManager对服务的配置功能说法不正确的是?

A、服务级别的配置可对所有实例生效

B、实例级别的配置只针对本实例生效

C、实例级别的配置对其他实例也生效

D、配置保存好需要重启服务才能生效

正确答案:C

28.为了提高kafka的容错性,kafka支持partition的复制策略,

以下关于leaderpartition和Foilowerpartition的描述错误的是?

()

A、一个kafka集群各个节点间不可能互为leader和flower

B、如果loader失效,那么将会有其他Follower来接管(成为新的

leader)

C、由于leaderServer承载了全部的请求压力,因此从集群的整体

考虑,kafka会将leader均横的分散在每个实例上,来确保整体的

性能稳定

D、Kafka针对partition的复制需要选出一个leader,由该

leader负责partiticn的读写操作,其他的副本节点只是负责数据

的同步

正确答案:A

29.为了保障流应用的快照存储的可靠性,快照主要存储在哪里?

A、jobManager的内存中

B、本地文件系统中

C、可靠性高的单机数据库中

D、hdfs中

正确答案:D

30.当Zookeeper集群的节点数为5节点时,请问集群的容灾能力和

多少节点是等价的?

A、3

B、4

C、6

D、以上都不是

正确答案:C

31.FusionInsightHD使用HBase客户端批量写入10条数据,某个

RegionServer节点上包含该表的2个Region,分别A和B,10条数

据中有2条属于A,4条属于B,请问写入这10条数据需要向该

RegionServer发送几次RPC请求?

A、1

B、2

C、6

D、10

正确答案:A

32.FusionlnsightHD系统中如果修改了服务的配置项,不进行服务

重启,该服务的配置状态是什么状态?

A、SYNCHRONIZED

B、EXPIRED

C、CONFIGURING

D、UNKNOWN

正确答案:B

33.Hive不适用于一下哪个场景

A、实时的在线数据分析

B、非实时分析,例如日志分析,统计分析

C、数据挖掘,例如用户行为分析,兴趣分区,区域展示

D、数据汇总,例如每天,每周用户点击数,点击排行

正确答案:A

34.HBase的Region是有那个服务进程来管理的?

A、HRegionServer

B>HMaster

C、DataNode

D、ZooKeeper

正确答案:A

35.以下关于FusionlnsightCTBase的描述不正确的是?

A、CTBase的读写数据接口,统一封装了行定义的接口,自动进行

冷字段的合并和解析,不需要在应用程序中进行合并和解释

B、CTBase是基于HBase的聚簇表开发框架

C、CTBase提供了一套WcbUI进行元数据定义,提供了只管医用的

表设计工具,降低表设计的难度

D、CTBase的javaAPI提供一套HBase连接池管理的接口,内部进

行连接共享,减少客户端应用开发难度。

正确答案:B

36.以F哪些选项属于Hive的数据存储模型?

A、以上全都正确

B、表

C、桶

D、数据库

E、分区

正确答案:A

37.Hive中的哪些操作可以合并

A、UNTONALL

B、JOIN

C、SELECT

D、GROUPBY

正确答案:A

38.为了保证流应用的快照存储的可靠性,快照主要存储在?

A、HDFS中

B、jobManager的内存中

C、可靠性高的单机数据库中

D、本地文件系统中

正确答案:A

39.关于Hive与传统数据仓库的对比,以下描述错误的是?()

A、由于Hive的数据存储在HDFS中,所以可以保证数据的高容错、

高可靠。

B、由于Hive基于大数据平台,所以查询效率比传统数据仓库快

C、Hive基于HDFS存储,理论上存储量可以无限扩展,而传统的数

据仓库存储量会有上限

D.Hive元数据存储独立于数据存储之外,从而解耦合元数据和数

据,灵活性高,而传统数据仓库数据应用单一,灵活性低。

正确答案:B

40.Kafka集群中,Kafka服务端的角色是?

A、Broker

B>Consumer

C、ZooKeeper

D、Producer

正确答案:A

41.FusionlnsightHDHBase默认使用什么作为其底层文件存储系

统?()

A、Hadoop

B、MapReduce

C>Memory

D、HDFS

正确答案:D

二、多选题(共30题,每题1分,共30分)

1.MapReduce过程中,以下属于shuffle机制的是?()

A、combine

B、copy

C、partition

D、sort/merge

正确答案:BD

2.以下哪些是Kafka实际的应用场景?

A、资源管理

B、网站活性跟踪

C、日志收集

D、聚合统计系统运营数据(监控数据)

正确答案:BCD

3.以下关于Zookeeper的leader选举说法正确的是

A、当实例数n为奇数时,假定n=2x+l,则成为leader节点需要x

B、当实例数为8时,则成为leader节点需要5票,容灾能力为4

C、Zookeeper选举leader时,需要半数以上的票数

D、当实例数n为奇数时,假定n=2x+l,则成为leader节点需要

x+1票

正确答案:CD

4.Flink流式处理的数据源类型包括?

A^Collections

B、JDBC

C、Socketstreams

D、Files

正确答案:ABCD

5.Hadoop系统中YARN支持哪些资源类型的管理?

A、内存

B、CPU

C、网络

D、磁盘空间

正确答案:AB

6.FusionTnsightManager可以对哪些项目进行健康检查?

A、实例

B、服务

C、主机

D、角色

正确答案:ABCD

7.以下选项中,对华为FusionlnsightHD系统中备用NameNode的作

用描述准确的有?

A^主NameNode的热备

B、备NamoNodo对内存没有要求

C、帮助主NameNode合并编辑日志,减少主NameNode启动时间

D、备NameNode应与主NameNode部署到一个节点

正确答案:AC

8.HBase集群定时执行Compaction的目的是什么?(ACD)

A、减少同一■个Region同一■个ColumnFami1y下的文件数目

B、减少同一个Region的文件数目

C、提升数据读取性能

D、提升数据写入能力

正确答案:ACD

9.Plink流式处理的数据源类型包括?

A、Files

B、Collections

C、JDBC

D、Socketstreams

正确答案:ABD

10.下列关于HBase存储模型的描述正确的是

A、同一个Key值可以关联多个Value

B、KeyValue中拥有时间戳,类型等关键信息

C、即使是Key值相同,Qualifier也相同的多个KeyValue,也可能

有多个,此时使用时间戳来区分

每一个KeyValue都拥有一个Qualifier标识

正确答案:ABCD

11.下列关于Flink中Transformation的说法正确的是?

A、可以通过window设定时间窗口

B、Filtor操作是对每个元素执行boolean函数

C、flatMap可以对文本进行切分

D、keyBy是将源头数据按照key进行分组,以保证同一个key的元

数据分到同样的组中

正确答案:ABD

12.下列属于flume数据监控的指标是?()

A、Source接收数据量

B、Sink写入数据量

C、DataNode数量

D、Channel缓存数据量

正确答案:ABD

13.调用Zookeeper客户端命令中包含哪些信息?

A、用户名

B、IP地址

C、端口号

D、服务器名称

正确答案:BC

14.执行HBase数据读取业务时,需要读取哪儿部分数据?

A、HFile

B、HLog

C、MemStore

HMaster

正确答案:AC

15.Loader提供了哪些方式或接口实现作业管理?

A、WEBUT

B>Linux命令行

C、REST接口

D、JavaAPI

正确答案:ABCD

16.关于SparkSQL&Ilive区别与联系,下列说法正确的是?()

A、SparkSQL依赖Hive的元数据

B、SparkSQL兼容绝大部分Hive的语法和函数

C>SparkSQL不可以使用Hive的自定义函数

D^SparkSQL的执行引擎为Sparkcore,Hive默认执行引擎为

MapReduce

正确答案:ABD

17.Fusioninsight家族包含下列哪些子产品?

A、HD

B>Libra

C>Manager

Miner

E、Farmer

F、DWS

正确答案:ABCDE

18.HBase中包含的一些典型的Filter有哪些?

A、KeyOnlyFiIter

B、Fi1terList

C、RowFi1ter

D、SingleColumnValueFiIter

正确答案:ABCD

19.华为大数据产品FusionlnsightHD中的Streaming具有哪些关键

特性?

A、可伸缩性

B、容错能力

C、消息可靠性

D、灵活性

正确答案:ABCD

20.Fusioninsight家族包含下列哪些子产品?

A、FusionlnsightHD

B、GaussDB200

C>FusionlnsightMiner

D、FunsioninsightFarmer

正确答案:ABCD

21.以下关于Flink与其他组件交互说法正确的是?

A、Flink可以将接收的组件发送给Kafka

Flink的checkpoint的实现依赖于Zookeeper

C、Flink任务的运行依赖Yarn来进行资源的调度管理

D、Flink在HDFS文件系统中读写数据

正确答案:ABCD

22.HDFS不适用以下哪些场景()

A、大文件存储与访问

B、大量小文件存储

C、随机写入

D、流式数据访问

正确答案:BC

23.下列关于worker(工作进程)、Executor(线程)、task(任务)

说法正确的是?()

A、每个Executor(线程)可以运行不同组件(spout或bolt)的

task(任务)

B、每个Executor(线程)可以运行多个task(任务)

C、每个worker只能为一个拓扑运行Executor(线程)

D、每个worker可以运行多个Executor(线程)

正确答案:ABCD

24.以下属于hiveSQL中DDL(数据定义语言)的是?()

A、修改表

B、删除表

C、建表

D、数据导入

正确答案:ABC

25.Flink可以基于以下哪些窗口进行统计?

A、countWindow

B、滑动窗口

C、时间窗口

D、会话窗口

正确答案:ABCD

26.ZKFC进程部署在hdfs中的以下那个节点上?

A、activenamenode

B、standbynamenode

C>datanode

D、以上全部不对

正确答案:AB

27.以下哪些选项属于FusionlnsightSparkSQL的优点。

A、以上全都正确

B、稳定和高性能

C、SQL兼容性

D、长稳测试

E、支持数据插入,更新和删除

正确答案:ABCDE

28.大数据时代的到来,依赖于以下哪些技术的提升?

A、云计算

B、硬件设备制造

C、网络

D、人工智能

正确答案:ABCD

29.FusionTnsightHD系统中使用Streaming客户端Shell命令查看

拓扑或提交拓扑失败,以下哪些定位手段是正确的?

A、查看客户端异常堆栈,判断是否客户端使用问题

B、查看主Nimbus的运行日志,判断是否Nimbus服务端异常

C、查看Supervisor运行日志,判断是否Supervisor异常

D、查看Worker运行日志

正确答案:AB

30.基于Hadoop开源大数据平台主要提供了针对数据分布式计算和

存储能力,如下属于分布式存储组件的有?

A、MR

B、Spark

C、HDFS

D、HBase

正确答案:CD

三、判断题(共32题,每题1分,共32分)

l.Hivc中“UNI0NALL”操作符用于合并两个或多个SELECT语句的结

果集,结果集中,不允许有重第的值

A、正确

B、错误

正确答案:B

2.FusionTnsighttool是为技术支持工程师和维护工程师提供的一

套健康检测工具,能够检查集群相关节点、服务的健康状态,提前

发现集群中潜在的问题,并生成健康检查报告。方便技术支持工程

师各维护工程师快速了解系统的健康状况。()

A、正确

B、错误

正确答案:A

3.FusionlnsightHD产品中,zookccpcr服务不可用会导致kafka服

务不可用。

A、正确

B、错误

正确答案:A

4.FusionlnsightSparkSQL同社区SparkJDBCServer一样,只支持

单租户绑定到一个YARN资源队列多租户,并不支持多租户并行执行。

A、正确

B、错误

正确答案:B

5.Zookeeper所有节点都可以处理请求

A、正确

B、错误

正确答案:A

6.Zookeeper的增强特性包括在审计日志中添加ephemeralnode被

删除的审计日志。()

A、正确

B、错误

正确答案:A

7.华为FusionlnsightHD系统中,对存储副本为3个的数据块,当

有一个节点上该数据块丢失时,需要手动复制一个副本到该节点。

(B)

A、正确

B、错误

正确答案:B

8.SparkStreaming计算基于DStream,将流式计算分解成一系列短

小的批处理作业。

A、正确

B、错误

正确答案:A

9.FusionlnsightHD中Loader作业提交到Yarn后,作业不能手工

停止。

A、正确

B、错误

正确答案:B

10.用户权限管理基于角色的访问控制,提供可视化的多组件统一的

集中用户权限管理。

A、正确

B、错误

正确答案:A

11.HDFS的Client写入文件时,数据的第一副本写入位置是由

NameNode确定,其他副本的写入位置由DataNode确定。

A、正确

B、错误

正确答案:A

12.SparkonYarn-client适合用于生产环境是因为可以更快的看到

APP的输出。

A、正确

B、错误

正确答案:B

13.ResourecManager采用高可用方案,当ActiveResourceManager

发现故障时,只能通过内置的Zookeeper来启动Standby的

ResourceManager将其状态切换为Active。

A、正确

B、错误

正确答案:B

14.FusionlnsightManger对外支持REST接口、SNMP接口、SYSLOG

接口

A、正确

B、错误

正确答案:A

15.FusionTnsightHD的Streaming对于Zookeeper弱依赖,即使

Zookeeper故障Streaming可以正常提供服务。

A、正确

B、错误

正确答案:B

16.ZooKeeper所有节点都可以处理读请求。

A、正确

B、错误

正确答案:A

17.FusionlnsightHD中使用HBase进行数据读写服务时需要连接

HMaster0

A、正确

B、错误

正确答案:B

18.zookeeper的节点使用ACL控制访问策略,ACL可应用于集群中

的任意中任一znode节点上。()

A、正确

B、错误

正确答案:B

19.FusionlnsightHD系统中,集群中一个Loader节点异常,其他

服务没有异常的情况下,不会影响Loader服务功能的正常使用

A、正确

B、错误

正确答案:A

20.FusionlnsightHD系统中,可以通过多个Flume连接从其部署的

节点上采集数据

A、正确

B、错误

正确答案:A

21.SparkonYARN模式下,没有NodeManager的节点不能启动

executor执行task。

A、正确

B、错误

正确答案:A

22.Yarn-client和Yarn-cluster

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论