版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
大数据HCIA模拟考试题及答案(附解析)一、单选题(共20题,每题1分,共20分)1.FusionInsightManager用户权限管理不支持哪个配置?A、给用户组配置角色B、给用户配置权限C、给用户配置角色D、给用户组配置权限正确答案:D2.FusionInsightHD中Loader实例必须与哪个实例部署在一起?A、DataNodeB、RegionServerC、ResourceManagerD、NodeManager正确答案:D3.Hadoop系统中YARN资源的抽象是用什么表示?A、内存B、CPUC、ContainerD、磁盘空间正确答案:C答案解析:YARN资源的抽象是用Container表示。Container是YARN中的资源抽象,它封装了某个节点上的多维度资源,如内存、CPU等,从而使得YARN能够以统一的方式管理和分配这些资源。4.安装FusionInsightHD的Streaming组件时,Nimbus角色要求安装几个节点?A、1B、2C、3D、4正确答案:B5.加载数据到Hive表,哪种方式不正确?A、直接将本地路径的文件load到Hive表中B、将HDFS上的额文件load到Hive表中C、Hive支持insertinto单条记录的方法,所以可以直接在命令行插入单条记录D、将其他表的结果集insertinto到Hive表中正确答案:C答案解析:Hive不支持insertinto单条记录的方法,在命令行直接插入单条记录是不正确的操作方式。其他选项,如将本地路径文件load到Hive表、将HDFS上的文件load到Hive表、将其他表的结果集insertinto到Hive表中都是可行的加载数据到Hive表的方式。6.硬件故障被认为是常态,为了解决这个问题,HDFS设计了副本机制。默认情况下,一份文件,HDFS会存()份?A、4B、3C、5D、2正确答案:B答案解析:HDFS默认情况下会将一份文件存储3份副本。这样设计是为了在硬件故障等情况下保证数据的可靠性和可用性。当部分副本所在的节点出现故障时,其他副本依然可以提供数据访问,从而提高了数据的容错能力。7.传统数据处理的数据规模单位是()A、TBB、GBC、PBD、EB正确答案:B答案解析:传统数据处理的数据规模单位通常在GB级别,而随着大数据时代的发展,数据规模逐渐增大,出现了TB、PB、EB等更大的单位。在传统数据处理阶段,GB是较为常见和主要的数据规模衡量单位。8.如果需要由数据生产者决定数据发送给目标Bolt的某一个确定的Task,应选择以下哪种消息发布策略A、局部字段分组B、广播分组C、直接分组D、全局分组正确答案:C答案解析:直接分组策略允许数据生产者指定将数据发送到目标Bolt的特定Task,符合题目要求。局部字段分组是根据字段值分组;广播分组是将数据发送到所有目标Task;全局分组是将所有数据发送到同一个Task,均不符合题意。9.在YARN的任务调度流程中,下列哪个是ApplicationMaster负责的任务?A、申请和领取资源B、为任务设置好运行环境C、分配ContainerD、启动Map或Reduce任务正确答案:A10.下列哪个不是HBase读取数据流程中涉及的角色或服务?()A、HDFSB、ZookeeperC、HMasterD、HRegionServer正确答案:C11.hbase的底层数据以()的形式存在的?A、keyvalueB、列存储C、行存储D、实时存储正确答案:A答案解析:HBase底层数据以KeyValue的形式存在。KeyValue是HBase数据存储的基本单元,它包含了行键、列族、列限定符、时间戳和值等信息,用于表示表中的一条数据记录。12.FusionInsightHD使用HBase客户端批量写入10条数据,某个RegionServer节点上包含该表的2个Region,分别A和B,10条数据中有2条属于A,4条属于B,请问写入这10条数据需要向该RegionServer发送几次RPC请求?A、1B、2C、6D、10正确答案:A13.Hive不适用于以下哪个场景A、非实时分析,例如日志分析,统计分析B、数据挖掘,例如用户行为分析,兴趣分析,区域展示C、数据汇总,例如每天,每用户点击数,点击排行D、实时在线数据分析正确答案:D答案解析:Hive主要用于离线批处理分析,对于实时在线数据分析场景,由于其处理机制和架构特点,难以满足低延迟、高并发的实时数据处理需求。而选项A非实时分析如日志分析、统计分析;选项B数据挖掘如用户行为分析、兴趣分析、区域展示;选项C数据汇总如每天、每用户点击数、点击排行等,这些场景Hive都能较好地适用。14.Zookeeper的Scheme认证方式不包括以下哪项?A、worldB、digestC、authD、sasl正确答案:D答案解析:Zookeeper的Scheme认证方式主要有world、digest、auth等。而sasl并不是Zookeeper的Scheme认证方式。15.FusionlnsightManager对服务的管理操作,下面说法错误的是?A、可对服务进行启停重启操作B、可以添加和卸载服务C、可设置不常用的服务隐藏或显示D、可查看服务的当前状态正确答案:C16.关于RDD,下列说法错误的是A、RDD只是一个只读的,可分区的分布式数据集B、RDD是Spark对基础数据的抽象C、RDD具有血统机制(Lineage)D、RDD默认存储在磁盘正确答案:D答案解析:RDD默认存储在内存中,而不是磁盘。RDD是Spark对基础数据的抽象,是一个只读的、可分区的分布式数据集,并且具有血统机制(Lineage)来支持容错等特性。17.以下关于HBase二级索引的描述哪一项是正确的()A、二级索引把要查找的列与rowkey关联成一个索引表B、此时列成新的rowkey,原rowkey成为valueC、二级索引查询了2次D、以上全都正确正确答案:D答案解析:选项A:二级索引确实是把要查找的列与rowkey关联成一个索引表,通过这个索引表可以加快查询速度。选项B:在二级索引中,列可以成为新的rowkey,原rowkey成为value,这种方式可以更高效地根据列值进行查找。选项C:使用二级索引通常会涉及两次查询,第一次通过索引表找到对应的rowkey,第二次根据rowkey查询实际的数据。所以以上选项全都正确。18.以下关于Kafka的描述错误的有?A、具有消息持久化,高吞吐,实时等特性B、用作活动流和运营数据处理管道的基础C、使用Scala,Java语言实现D、由ApacheHadoop开发,并于2011年开源正确答案:D答案解析:Kafka是由Apache软件基金会开发的一个开源流处理平台,由Scala和Java编写,具有消息持久化、高吞吐、实时等特性,常用作活动流和运营数据处理管道的基础,于2011年开源,并非由ApacheHadoop开发,所以选项D描述错误。19.HBase的某张表的RowKey划分SplitKey为9,E,a,z,请问该表有几个Region?A、3B、4C、5D、6正确答案:C20.FusionInsightHD系统中HDFS默认BlockSize是多少?A、32MB、64MC、128MD、256M正确答案:C答案解析:在FusionInsightHD系统中,HDFS默认BlockSize是128M。二、多选题(共10题,每题1分,共10分)1.以下哪些选项属于FusionInsight数据安全性。A、用户权限认证管理B、操作系统安全加固C、组件数据加密D、数据完整性校验正确答案:CD2.以下哪些是Spark服务的常驻进程?A、JobHistoryB、JDBCServerC、SparkResourceD、NodeManaaer正确答案:AB3.以下哪些数据源可以通过loader实现与FusionInsightHD的数据交换?()A、MySQLB、NoSQLC、FTPServerD、SFTPServer正确答案:ABCD答案解析:Loader可以实现与多种数据源进行数据交换,包括MySQL、NoSQL、FTPServer、SFTPServer等,所以ABCD选项均正确。4.Nimbus在Streaming架构中的功能包括?A、资源分配B、任务调度C、监控任务执行状态D、启动/关闭工作进程正确答案:ABC5.下面那些组件依赖ZooKeeper?A、StreamingB、HDFSC、YARND、HBase正确答案:ABCD6.FusionInsightManager会定时备份哪些数据?A、NameNodeB、LDAPC、OMsD、DBService正确答案:ABCD7.FusionInsightHDManager界面显示Hive服务状态为Bad时,可能的原因有哪些?A、DBServioe服务不可用B、HDFS服务不可用C、Metastore实例不可用D、HBase服务不可用正确答案:ABC答案解析:当FusionInsightHDManager界面显示Hive服务状态为Bad时,可能有多种原因。其中DBServioe服务不可用、HDFS服务不可用、Metastore实例不可用都可能导致Hive服务状态异常。而HBase服务不可用通常不会直接导致Hive服务状态显示为Bad。8.下面哪些是MapReduce的特点?A、易于编程B、良好的扩展性C、实时计算D、高容错性正确答案:ABD答案解析:MapReduce具有易于编程的特点,用户只需实现Map和Reduce两个函数即可完成复杂的计算任务;具有良好的扩展性,可以通过增加节点来扩展计算能力;具有高容错性,能够自动处理节点故障。而实时计算不是MapReduce的特点,它更侧重于离线批处理计算。9.FusionInsightHD平台中,哪些组件支持对表、列加密?()A、FlinkB、HBaseC、HiveD、HDFS正确答案:BC10.FusionInsightHD在安装集群成功后,有哪些项需要检查?A、Service组件健康状态B、系统是否有告警C、服务的配置状态是否为已同步D、主机健康状态正确答案:ABCD答案解析:安装集群成功后,需要检查Service组件健康状态,以确保各个服务组件正常运行;检查系统是否有告警,及时发现并解决潜在问题;检查服务的配置状态是否为已同步,保证配置的一致性;检查主机健康状态,确保所有主机正常工作。这些检查对于集群的稳定运行和正常使用至关重要。三、判断题(共40题,每题1分,共40分)1.用户权限管理基于角色的访问控制,提供可视化的多组件统一的集中用户权限管理。A、正确B、错误正确答案:A2.MapReduce过程中,默认情况下,一个分片就是一个块,也是一个MapTask。A、正确B、错误正确答案:A3.kafka是一个高吞吐、分布式、基于发布订阅的消息系统,利用kafka技术可在廉价PCServer上搭建起大规模消息系统。()A、正确B、错误正确答案:A4.使用配置规划工具对FusionInsightHDV100R002C50集群进行规划时,可以用V100R2002C60版本的配置规划工具来规划。A、正确B、错误正确答案:B5.Kafka所有消息都会被持久化到硬盘中,同时Kafka通过对TopicPartition设置Replication来保障数据可靠。A、正确B、错误正确答案:A6.Yarn-client和Yarn-cluster主要区别是ApplicationMaster进程的区别()A、正确B、错误正确答案:A7.KafkaConsumer写数据总体流程是,Consumer连接指定TopicPartition所在的LeaderBroker,用主动获取的方式从Kafka中获取消息?A、正确B、错误正确答案:A8.FusionInsightHD平台中,HBase暂不支持二级索引A、正确B、错误正确答案:B9.如果FusionInsightHD集群节点数不足以使数据节点单独部署的情况下,可以采用管理节点&控制节点&数据节点合一部署方案,但性能会受限制。A、正确B、错误正确答案:A10.Kafka中Partitionreplication之间同步数据,从Partition的Leader复制数据到Follower需要线程(ReplicaFetcherThread),实际上是复制Follower(一个Follower相当于consumer)主动从Leader批量拉取消息的,这极大提高了吞吐量。A、正确B、错误正确答案:A11.Flume的properties配置文件中可以配置多个channel来传输数据。A、正确B、错误正确答案:A12.FusionInsight中Hive包含2个角色,HiveServer和MetaStore。A、正确B、错误正确答案:B13.通常情况下,Hive以文本文件存储的表会以回车作为其行分隔符,在华为FusionInsightHive中,可以指定表数据的输入和输出格式处理类。()A、正确B、错误正确答案:A14.容量调度器在进行资源分配时,现有同级的2个列队Q1和Q2,它们的容量均为30,其中Q1已使用8,Q2已使用14,则会优先将资源分配给Q1。A、正确B、错误正确答案:A15.Hive中“UNIONALL”操作符用于合并两个过多个SELECT语句的结果集,结果集中,不允许有重复的值。()A、正确B、错误正确答案:B16.Flink采用checkpoint机制保障应用程序运行中的容错性。A、正确B、错误正确答案:A17.在YARN的任务调度中,一旦ApplicationMaster申请到资源后,便与对应的ResourceManager通信,要求它启动任务。A、正确B、错误正确答案:B18.ResourceManager采用高可用方案,当Activeresourcemanager发现故障时,只能通过内置的zookeeper来启动standby的resourcemanager,将其状态切换为active。A、正确B、错误正确答案:B19.Hadoop系统中,如果文件系统的备份因子是3,那么每次MapReduce任务运行的task所需要的文件都要从3个有副本的机器上传输需要处理的文件。A、正确B、错误正确答案:B20.HDFS联邦机制下,各NameNode间元数据是不共享的。A、正确B、错误正确答案:A21.HBase的BloomFilter是用来过滤数据的。()A、正确B、错误正确答案:B22.FusionInsightHD系统中,可以通过多个Flume连接从其部署的节点上采集数据A、正确B、错误正确答案:A23.FusionInsight集群组网设计中,二层组网指集群内二层交换,集群节点在一个子网里,适用节点小于200的集群场景。A、正确B、错误正确答案:A24.FusionInsightHD部署过程中,执行precheck检查每一个节点时必须调用checkNodes.Configd配置文件。A、正确B、错误正确答案:A25.FusionInsight集群组网设计中,二层组网指集群内二层交换,集群节点在一个子网里,适用节点数小于200的集群场景。A、正确B、错误正确答案:A26.FusionInsightHD中Loader作业提交到YARN后,作业不能手动停止。A、正确B、错误正确答案:B27.FusionInisghtHD集群安装成功后,不允许修改服务、角色和实例的配置。A、正确B、错误正确答案:B28.FusionInsightHD部署过程中,执行precheck检查每个节点时必须调用CheckNode.Config配置文件。A、正确B、错误正确答案:A29.FusionInsightManager支持多租户统一管理。
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 酱腌菜制作工岗前实操知识水平考核试卷含答案
- 电子元器件表面贴装工岗前技术创新考核试卷含答案
- 转底炉工安全实践考核试卷含答案
- 玻璃钢制品喷射工岗前深度考核试卷含答案
- 保温材料制造工复试知识考核试卷含答案
- 高压电器及元件装配工创新思维评优考核试卷含答案
- 风险管理师班组建设竞赛考核试卷含答案
- 活性炭酸洗工达标竞赛考核试卷含答案
- 地毯整修工班组安全竞赛考核试卷含答案
- 服务机器人应用技术员岗前冲突管理考核试卷含答案
- 新能源汽车充电设施的光储充一体化示范项目建设可行性研究报告
- erp沙盘模拟实训报告采购总监
- 横纹肌溶解症的护理
- 上海开放大学管理学基础(补)案例分析题
- 施工升降机联合验收表
- 《活法》心得体会
- 【MOOC】生活中的会计学-河南理工大学 中国大学慕课MOOC答案
- 肉牛养殖示范基地建设项目建议书
- 11135液压气动技术-国家开放大学2023年1月至7月期末考试真题及答案(共2套)
- 赣南师范大学《中国地理》2022-2023学年第一学期期末试卷
- 基于机器学习的房性心动过速射频消融预测模型
评论
0/150
提交评论