版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
大数据HCIA试题含答案一、单选题(共41题,每题1分,共41分)1.Spark应用在运行时,Stage划分的依据是什么?A、actionB、taskSetC、taskD、shuffle正确答案:D2.FusionInsightHD的HBase中的一张表包含以下几个Region[10,20),[20,30),[30,+∞],分别编号为①,②,③,那么,11,20,222分别属于哪个Region?A、①①③B、①②③C、①②②D、①①②正确答案:C3.FusionlnsightHD系统中,LDAP数据同步方式是哪个?A、单向同步B、双向同步C、隔离不同步D、数据交叉同步正确答案:A4.在FusionInsight产品中,关于kafka的topic,以下描述不正确的有?A、每条发布到kafka的消息都有一个类别,这个类别被称为topic,也可以理解为一个存储消息的队列B、每个topic只能分成一个partition(区)C、topic的partition的数量可以在创建时配置D、每个partition在存储层面对应一个log文件,log文件中记录了所有的消息数据。正确答案:B5.以下关于ZKFC的说法错误的是?A、ZKFC进程需在NameNode的节点和ZooKeeper的Leader节点中部署。B、ZKFC(ZKFailoverController)作为一个ZooKeeper集群的客户端,用来监控NameNode的状态信息C、StandbyNameNode通过ZooKeeper感知ActiveNameNode的状态。一旦ActiveNameNode宕机,StandbyNameNode就会执行升主操作。D、HDFSNameNode的ZKFC连接到ZooKeeper,把主机名等信息保存到ZooKeeper中正确答案:A6.华为FusionInsightHD系统中关于HDFS的DataNode说法正确的是?A、不会检查数据的有效性B、周期性地将本节点的Block发送给NameNodeC、不同的DataNode存储的Block一定是不同的D、一个DataNode上的Block可以是相同的正确答案:D7.以下哪个不属于Hadoop中MapReduce组件的特点?A、实时计算B、易于编程C、良好的拓展性D、高容错性正确答案:A8.FusionInsightHD中,如果需要查看当前登录HBase的用户和权限组,可以在HBaseshell中执行什么命令?A、use_permissionB、whoamiC、whoD、get_user正确答案:B9.关于Hive与Hadoop其他组件的关系。以下描述错误的是?A、Hive最终将数据存储在HDFS中B、Hive是Hadoop平台的数据仓库工具C、HQL可以通过MapReduce执行任务D、Hive对HBase有强依赖正确答案:D10.Hadoop的HBase不适合哪些数据类型的应用场景?A、大文件应用场景B、海量数据应用场景C、高吞吐率应用场景D、半结构化数据应用场景正确答案:A11.哪个不是Flume的channel类型A、MemoryChannelB、FileChannelC、JDBCChannelD、HDFSChannel正确答案:D12.HBase中数据存储的文件格式是什么?A、HFileB、SequenceFileC、LogD、TXTfile正确答案:A13.FusionInsightHD系统中如果修改了服务的配置项,不进行服务重启,该服务的配置状态是什么状态?A、SYNCHRONIZEDB、EXPIREDC、CONFIGURINGD、UNKNOWN正确答案:B14.传统数据处理的数据规模的单位是?A、TBB、EBC、PBD、GB正确答案:D15.FusionInsightHD使用HBase客户端批量写入10条数据,某个RegionServer节点上包含该表的2个Region,分别A和B,10条数据中有2条属于A,4条属于B,请问写入这10条数据需要向该RegionServer发送几次RPC请求?A、1B、2C、6D、10正确答案:A16.关于Kafka磁盘容量不足的告警,对于可能的原因以下分析不正确的是?A、用于存储Kafka数据的磁盘配置(如磁盘数目、大小等),无法满足当前业务数据流量,导致磁盘使用率达到上限B、数据保存时间配置过长,数据累积达到磁盘使用率上限C、业务规划不合理,导致数据分配不均匀,使部分磁盘达到使用率上限D、Broker节点故障导致正确答案:D17.在WebHCat架构中,用户能够通过安全的HTTPS协议执行以下哪些操作()A、执行HiveDDL操作B、运行MapReduce任务C、运行HiveHQL任务D、以上全部正确正确答案:D18.关于FusionlnsightHD中Loader作业描述正确的是?A、Loader将作业提交到Yam执行后,如果此时Loader服务异常,则此作业执行失败。B、Loader将作业提交到Yam执行后,如果某个Mapper任务执行失败,能够自动进行重试C、Loadet作业执行失败后将会产生垃坝数据,需要用户手动清除D、Loader将一个作业提交至Yam执行后,该作业执行完成前,不能再提交其他作业正确答案:B19.查看Kafka某Topic的Partition详细信息时,使用如下哪个命令?A、bin/kafka-topics.sh--createB、bin/kafka-topics.sh--describeC、bin/kafka-topics.sh–deleteD、bin/kafka-topics.sh--list正确答案:B20.以下关于HiveSQL基本操作描述正确的是()A、加载数据到Hive时源数据必须是HDFS的一个路径B、创建外部表必须要指定location信息C、创建表时可以指定列分隔符D、创建外部表使用external关键字。创建普通表需要指定internal关键字正确答案:C21.FusionInsightHDHBase默认使用什么作为其底层文件存储系统?()A、HadoopB、MapReduceC、MemoryD、HDFS正确答案:D22.在Fusionlnsight集群规划部署时,建议管理节点最好部署()个,控制节点最少需要部署()数据节点最少需要部署()个。A、1,3,2B、1,2,2C、2,3,3D、2,3,1正确答案:C23.下列选项中,关于Zookeeper可靠性含义说法正确的是?A、可靠性通过主备部署模式实现B、可靠性是指一条消息被一个server接收,它将被所有server接受C、可靠性是指无论哪个server,对外展示的均是同一个视图D、可靠性是指更新只能成功或者失败,没有中间状态正确答案:B24.Flume支持监控并传输目录下新增的文件,可实现数据传输,以上描述的是哪一类source?A、httpsourceB、syslogsourceC、spoolingdirectorysourceD、execsource正确答案:C25.FusionInsightHD系统中HBase的最小处理单元是Region,UserRegion和RegionServer之间的路由信息是保存在哪?A、ZooKeeperB、HDFSC、MasterD、meta表正确答案:D26.KafkaClusterMirroring工具可以实现以下哪项功能?A、Kafka跨集群数据同步方案B、Kafka单集群内数据备份C、Kafka单集群内数据恢复D、以上全不正确正确答案:A27.下列哪条HDFS命令可用于检测数据块的完整性?A、hdfsfsck/B、hdfsfsck–deleteC、hdfsdfsadmin–reportD、hdfsbalancer–threshold1正确答案:A28.FusionlnsightHD中Loader实例必须与哪个实例部署在一起?A、DataNodeB、RegionServerC、ResourceManagerD、Nodemanager正确答案:D29.HBase中如果发生一个Region的Split,将一个HFile文件真正分开到两个Region的过程发生在以下什么阶段?A、Split过程中B、Flush过程中C、Compaction过程中D、HFile分开过程中正确答案:C30.关于FusionInsightHDStreaming的Supervisor描述正确的是?A、Supervisor负责资源分配和任务调度B、Supervisor负责接受Nimbus分配的任务,启动和停止属于自己管理的worker进程C、Supervisor是运行具体处理逻辑的进程D、Supervisor是一个Topology中接收数据然后执行处理的组件正确答案:B31.FusionInsightHD系统中HDFS默认BlockSize是多少?A、32MB、64MC、128MD、256M正确答案:C32.FusionInsightHDHBase的管理进程是如何选择主节点的?A、随机选取B、由RegionServer进行裁决C、通过ZooKeeper进行裁决D、HMaster为双主模式,不需要进行裁决正确答案:C33.下列选项中,关于Zookeeper可靠性含义说法正确的是?A、可靠性是指更新只能成功或者失败,没有中间状态B、可靠性是指无论哪个server,对外展示的均是同一个视图C、可靠性通过主备部署模式实现D、可靠性是指一条消息被一个server接收,它将被所有server接受正确答案:A34.下列关于SparkStreaming和Streaming比较说法不正确的是?A、SparkStreaming事件处理时延比Streaming更高B、SparkStreaming的吞吐量大约是Streaming的2-5倍C、Streaming的执行逻辑是即时启动,运行完后再回收D、SparkStreaming是一个微批处理框架,事件需要积累到一定量时才进行处理正确答案:C35.HDFS的副本放置策略中,同一机架不同的服务器之间的距离是?()A、1B、3C、2D、4正确答案:C36.通过FusionInsightManager不能完成以下哪个操作?A、安装部署B、虚拟机分配C、性能监控D、权限管理正确答案:B37.HBase不适合哪些应用场景?()A、高吞吐率应用场景B、要求具有完全ACID特性的应用场景C、半结构化数据应用场景D、海量数据(TB、PB)应用场景正确答案:B38.对于容量调度器的任务选择,以下说法正确的是()A、最小队列层级优先B、资源利用量最低的队列优先C、资源回收请求队列优先D、最大队列层级优先正确答案:C39.在很多小文件场景下,Spark会起很多Task。当SQL逻辑中存在Shuffle操作时,会大大增加hash分桶数,严重影响性能。FusionInsight中,针对小文件的场景通常采用()算子,来对Table中的小文件生成的partition进行合并,减少partition数,从而避免再shuffle的时候,生成过多的hash分桶,提高性能。A、connectB、coalesceC、groupbyD、join正确答案:B40.Spark组件中哪个选项不属于transformation操作?A、joinB、distinctC、reduceByKeyD、reduce正确答案:D41.HBase中数据存储的文件格式是什么?A、HFileB、HLogC、TextFileD、SequenceFile正确答案:A二、多选题(共30题,每题1分,共30分)1.Spark有哪些特点?A、轻B、巧C、快D、灵正确答案:ABCD2.Kafka消息传输保障通常有以下哪几种?()A、仅有一次(ExactlyOnce)B、最多一次(AtMostOnce)C、最多三次(AtMostThreeTimes)D、最少一次(AtLeaseOnce)正确答案:ABD3.以下关于华为大数据解决方案说法正确的是()A、Farmer是数据服务框架B、GaussDB是一款开源数据库产品C、FusionInsightManager是一个分布式系统管理框架,管理员可以通过多接入点操控分布式集群D、FusionInsightHD是基于开源大数据软件Hadoop的增强版本正确答案:ABCD4.Loader提供了哪些方式或接口实现作业管理?A、WebUIB、Linux命令行C、Rest接口D、JavaAPI正确答案:ABCD5.kafka消息传输保障通常有以下哪几种?()A、最多三次(AtMostThreeTimes)B、仅有一次(ExactlyOnce)C、最少一次(AtLeaseonce)D、最多一次(AtMostonce)正确答案:BCD6.Loader可以实现以下哪些转换规则()A、拼接转换B、长整型时间转换C、空值转换D、增量转换正确答案:ABCD7.以下关于FusionInsightHBase可视化建模说法正确的有?()A、可视化建模帮助DBA进行建模设计,降低HBase的使用门槛B、QualifierHBase列:每一列代表业务数据某一属性C、实现人员分工:DBA关注数据表建模,开发人员关注用户表明和用到的列D、Column用户表列:每一列代表一个KeyValue正确答案:ABC8.FusionInsight家族包含下列哪些子产品?A、FusionInsightHDB、GaussDB200C、FusionInsightMinerD、FunsionInsightFarmer正确答案:ABCD9.FusionInsightHD系统中使用Streaming客户端shell命令提交了拓扑之后,使用StromUI查看发现该拓扑长时间没有处理数据,可能原因有?()A、Supervisor是在topology中接收数据然后执行处理的组件B、拓扑业务存在逻辑错误,提交之后无法正常运行C、拓扑过于复杂或者并发太大,导致worker启动时间太长,超过Supervisor的等待时间D、Supervisor的slots资源被耗尽,拓扑提交上去之后分不到slot去启东worker进程正确答案:BCD10.关于Flume,下列说话错误的是?()多选A、Source到Channel到Sink等进程内部有加密的必要B、Flume级联节点之间的数据传输支持加密C、Flume支持多级级联和多路复制D、Flume级联节点之间的数据传输不支持压缩正确答案:AD11.以下关于KafkaPartition说法正确的有A、Partition数量决定了每个consumergroup中并发消费者的最大数量B、每个Partition都是有序且不可变的消息队列C、引入Partition机制,保证了Kafka的高吞吐能力D、每个Partition在存储层面对应一个log文件正确答案:ABCD12.华为大数据解决方案中平台架构包括以下哪些组成部分?()A、Hadoop层B、GaussDB200C、Datafarm层D、FusioInghtManager正确答案:ACD13.对于容量调度器的任务选择,以下说法正确的是A、最大队列层级优先B、最小队列层级优先C、资源利用量最低的队列优先D、资源回收请求队列优先正确答案:BCD14.关于大数据的主要特征的理解和描述正确的有哪些?A、数据增长速度快,处理速度快B、数据量大,计算量大C、数据价值密度低,价值高D、数据来源多,格式多正确答案:ABCD15.Spark适用于以下哪些场景?()A、批处理B、图计算C、实时流处理D、交互式查询正确答案:ABCD16.在华为大数据解决方案中,Hadoop层包含以下哪些组件()A、FlinkB、MinerC、SparkD、Hive正确答案:ACD17.下列选项中,哪些是Spark的重要角色()A、DateNodeB、NodemanagerC、DriverD、ResourceManager正确答案:BCD18.MapReduce过程中,以下属于shuffle机制的是?()A、partitionB、combineC、copyD、sort/merge正确答案:CD19.HDFS不适用以下哪些场景()A、大文件存储与访问B、大量小文件存储C、随机写入D、流式数据访问正确答案:BC20.在Kafka中,如下关于Producer发送数据的说法错误的是()A、Proucer负责生产数据。Consumer负责消费数据。Producer和Consumer之间需要建立连接B、Proucer既可以发送数据到Broker上。又可以发送数据到ConsumerC、Proucer作为消息生产者。可以直接将数据写入ZookeeperD、Proucer连接任意一个正常的Broker实例就可以产生数据正确答案:ABC21.Hadoop集群规模很大时,数据的分布情况会非常关键,用户需要根据数据分布情况,决定集群是否扩容,数据是否需要做均衡等。以下关于FusionInsight资源分布监控说法正确的有()A、帮助用户迅速找到资源消耗最高的节点,采用适当的措施B、通过每个服务主页的资源分布查看界面,查看到关键的资源分布情况C、可以帮助用户快速聚集在最关键的资源消耗上D、通过DashBoard界面,可以查看到主机资源分布情况。例如内存占有率在50-75%的主机列表,并提供链接跳转正确答案:ABCD22.Zookeeper中的数据节点znode分为哪几种类型?A、persistentB、ephemeralC、temporaryD、semi-persistent正确答案:AB23.HBase中包含的一些典型的Filter有哪些?A、KeyOnlyFilterB、FilterListC、RowFilterD、SingleColumnValueFilter正确答案:ABCD24.HDFS的基本系统构架中包含下列哪些节点?()A、ResourceManagerB、NameNodeC、NodeManagerD、DataNode正确答案:BD25.下列关于Worker(工作进程)、Executor(线程)、TASK(任务)说法正确的是?A、每个Worker(工作进程)可以运行多个Executor(线程)B、每个Executor(线程)可以运行不同组件(Spout或Bolt)的TASK(任务)C、每个Executor(线程)可以运行多个TASK(任务)D、每个Worker只能为一个拓补运行Executor(线程)正确答案:ABC26.以下关于Flink与其他组件交互说法正确的是?A、Flink可以将接收的组件发送给KafkaB、Flink的checkpoint的实现依赖于ZookeeperC、Flink任务的运行依赖Yarn来进行资源的调度管理D、Flink在HDFS文件系统中读写数据正确答案:ABCD27.HDFS系统中对备用NameNode的作用的描述正确的有?A、主NameNode的热备B、备NameNode对内存没有要求C、帮助主NameNode合并编辑日志,减少主NameNode的启动时间D、备NameNode应与主NameNode部署到一个节点正确答案:AC28.Streaming消息可靠性级别包括以下哪些选项?A、至少一次B、精确一次C、完全处理D、最多一次正确答案:ABD29.HDFS联邦环境下,NameSpace(命名空间)包含以下哪些内容()A、目录B、文件C、块D、以上全不正确正确答案:ABC30.以下关于KafkaPartition副本的特性描述正确的是?A、主副本叫做Leader,从副本叫做FollowerB、消费者和生产者都是从Leader中读写数据,也可直接与Follower交互C、Follower通过拉取的方式从Leader中同步数据D、副本以分区为单位。每个分区都有各自的主副本的从副本正确答案:ACD三、判断题(共32题,每题1分,共32分)1.FusionInsightHD集群三层组网时,管理节点、控制节点、数据节点建议安装在不同的网段内,可以提高可靠性。A、正确B、错误正确答案:A2.KafkaProducer读数据总体流程是,Producer连接任意存活的Broker,请求指定Topic,Partition的Leader元数据信息,然后直接与对应的Broker直接连接,发布数据。A、正确B、错误正确答案:A3.Spark的中间数据放在内存中,对于迭代运算/批处理计算的效率更高,延迟更高。A、正确B、错误正确答案:B4.通常情况下,Hive以文本文件存储的表会以回车作为其行分隔符,在华为FusionInsightHive中,可以指定表数据的输入和输出格式处理类。A、正确B、错误正确答案:A5.FusionInsightManager支持多租户统一管理。()A、正确B、错误正确答案:A6.在ZooKeeper的服务模型中,Leader节点以主备模式存在,其他节点都属于Follower节点。()A、正确B、错误正确答案:B7.SparkonYARN模式下,没有NodeManager的节点不能启动executor执行task。A、正确B、错误正确答案:A8.HDFS联邦机制下,各NameNode间元数据是不共享的。A、正确B、错误正确答案:A9.FusionInisghtHD系统中,在创建Kafka的Topic时必须设置Partition个数和副本个数,设置多副本可以增强Kafka服务的容灾能力。A、正确B、错误正确答案:A10.在YARN的任务调度中,一旦ApplicationMaster申请到资源后,便与对应的ResourceManager通信,要求它启动任务A、正确B、错误正确答案:B11.Flume的perties配置文件可以配置多个channel来传输数据。A、正确B、错误正确答案:A12.Mapreduce过程中,默认情况下,一个分片就是一个块,也是一个mapTask.A、正确B、错误正确答案:A13.FusionInsightManager支持大规模集群的安装部署、监控、告警、用户管理、权限管理、审计、服务管理、健康检查、问题定位、升级和补丁。A、正确B、错误正确答案:A14.SparkStreaming计算基于DStream,将流式计算分解成一系列短小的批处理作业。()A、正确B、错误正确答案:A15.SparkonYarn-client适合用于生产环境是因为可以更快的看到APP的输出。A、正确B、错误正确答
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 四年级下册心理健康教案-学习很有趣 |北师大版
- 精神科医患沟通技巧与制度制定
- 物流配送客户投诉处理规范
- 三年级上册数学单元测试题汇编
- 义务教育一年级数学教案设计
- 多元文化环境下的教学策略
- 宪法知识竞赛
- 远程办公技术支持方案及规范
- 精准医疗中基因靶向药物研发前沿
- 生物发酵工程工艺技能培训资料
- 2025食品检验检测技能竞赛考试试题和答案
- 云南省烟草专卖局(公司)考试真题2025
- 隧道施工标准化工艺手册
- 建筑工程预算评审方案(3篇)
- 十年(2016-2025)高考生物真题分类汇编(全国通.用)专题07 有丝分裂和减数分裂(解析版)
- 知识产权基础知识考试题库及答案
- tpm提案管理办法
- 国道公路防汛演练方案(3篇)
- 民法典与企业合同管理
- 2025届北京市海淀区清华大附中八下英语期末达标检测试题含答案
- DB32/T 1087-2022高速公路沥青路面施工技术规范
评论
0/150
提交评论