版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
大数据HCIA模拟考试题1、HBase中数据存储的文件格式是什么?A、HFileB、HLogC、TextFileD、SequenceFile答案:A2、创建loader作业中,可以在以下哪个步骤中设置过滤器类型?()A、基本信息B、转换C、输出D、输入设置答案:D3、FusionInsightHD中HBase的某张表的RowKey划分SplitKey为9,E,a,z,请问该表有几个Region?A、3B、4C、5D、6答案:C4、Hadoop平台中HBase的Region是由哪个服务进程来管理?A、HMasterB、DataNodeC、RegionServerD、ZooKeeper答案:C5、为了保证流应用的快照存储的可靠性,快照主要存储在?A、HDFS中B、可靠性高的单机数据库中C、jobManager的内存中D、本地文件系统中答案:A6、下列选项中无法通过大数据技术实现的是?A、运营分析B、商业模式发现C、商品推荐D、信用评估答案:B7、FusionInsightHD系统中,下面哪个方法不能查看到Loader作业执行的结果?A、通过Yarn任务管理查看B、通过LoaderUI界面查看C、通过Manager的告警查看D、通过NodeManager查看答案:D8、Hadoop中MapReduce组件擅长处理哪种场景的计算任务?A、迭代计算B、离线计算C、实时交互计算D、流式计算答案:B9、FusionInsightHD系统中HBase元数据Metaregion路由信息保存在哪?A、Root表B、ZooKeeperC、HMasterD、Meta表答案:B10、Flume支持监控并传输目录下新增的文件,可实现数据传输,以上描述的是哪一类source?A、spoolingdirectorysourceB、httpsourceC、execsourceD、syslogsource答案:A11、Hadoop平台中,要查看YARN服务中一个application的信息,通常需要使用什么命令?A、containerB、applicationattemptC、jarD、application答案:D12、FusionInsightHD系统中如果修改了服务的配置项,不进行服务重启,该服务的配置状态是什么状态?A、SYNCHRONIZEDB、EXPIREDC、CONFIGURINGD、UNKNOWN答案:B13、哪一项不属于FusionInsightHD中Hive的流控特性的描述?A、支持对已经建立的总连接数做阈值控制B、支持对每个用户已经建立的连接数做阈值控制C、支持对某个特定用户已经建立的连接数做阈值控制D、支持对单位时间内所建立的连接数做阈值控制答案:C14、以下关于Kafka的描述错误的有?A、具有消息持久化,高吞吐,实时等特性B、用作活动流和运营数据处理管道的基础C、由ApacheHadoop开发,并于2011年开源D、使用Scala,Java语言实现答案:C15、有关普通表和外部表的描述,下面哪句是错误的?A、删除普通表时会删除数据和元数据;B、外部表实际上是将HDFS中已有路径的文件与表联系起来;C、删除外部表时只删除数据,不删除元数据;D、缺省创建时为普通表;答案:C16、Hive是基于Hadoop的数据仓库软件,可以查询和管理PB级别的分布式数据。以下关于Hive特性的描述不正确的是?A、可直接访问HDFS文件以及HBaseB、灵活方便的ETL(extract/transform/load)C、仅支持MapReduce计算引擎D、易用易编程答案:C17、关于RDD,下列说法错误的是A、RDD只是一个只读的,可分区的分布式数据集B、RDD是Spark对基础数据的抽象C、RDD具有血统机制(Lineage)D、RDD默认存储在磁盘答案:D18、HBase的Region是有那个服务进程来管理的?A、HRegionServerB、HMasterC、DataNodeD、ZooKeeper答案:A19、Hadoop平台中启用Yam组件的日志聚集功能,需要配置哪个参数?A、yarn.nodemanager.local-dirsB、yarn.nodemanager.log-dirsC、yarn.acl.enableD、yarn.log-aggregation-enable答案:D20、下列关于Flinkbarrier描述错误的是?A、barrier是Flink快照的核心B、barrier周期性插入到数据流中,并作为数据流的一部分随之流动C、在插入barrier的时候,会暂时阻断数据流D、一个barrier将本周起快照的数据与下一个周期快照的数据分隔开来答案:C21、通过FusionInsightManager不能完成以下哪个操作?A、安装部署B、性能监控C、权限管理D、虚拟机分配答案:D22、以下关于Zookeeper的Leader节点在收到数据变更请求后的读写流程说法正确的是?A、同时写入磁盘和内存B、仅写入内存C、先写内存再写磁盘D、先写磁盘再写内存答案:D23、在规划FusionIsightHD集群时,如果客户用于功能测试,对性能没有要求,节约成本的情况下可以采用管理节点、控制节点、数据节点合一部署,最少需要多少节点?A、2B、3C、6D、8答案:B24、Kafka集群中,Kafka服务端的角色是?A、BrokerB、ProducerC、ConsumerD、ZooKeeper答案:A25、Flink中的()接口用于流数据处理,()接口用于批处理A、StreamAPI,BatchAPIB、DataStreamAPI,DataSetAPIC、DataBatchAPI,DataStreamAPID、BatchAPI,StreamAPI答案:B26、查看Kafka某Topic的Partition详细信息时,使用如下哪个命令?A、bin/kafka-topics.sh--describeB、bin/kafka-topics.sh–deleteC、bin/kafka-topics.sh--listD、bin/kafka-topics.sh--create答案:A27、在很多小文件场景下,Spark会起很多Task,当SQL逻辑中存在Shuffle操作时,会大大增加hash分桶数,严重影响性能。FusionInsight中,针对小文件的场景通常采用()算子,来对Table中的小文件生成的partition进行合并,减少partition数,从而避免在shuffle的时候,生成过多的hash分桶,提升性能?A、groupbyB、coalosceC、connectD、join答案:D28、华为FusionInsightHD是国内首家符合国家金融等级保护的大数据平台,其安全性现在以下哪些方面?A、系统安全B、权限认证C、数据安全D、以上全都正确答案:D29、FusionInsightManager用户权限管理不支持哪个配置?A、给用户配置角色B、给角色配置权限C、给用户组配置角色D、给用户组配置权限答案:D30、FusionInsightHD系统中HBase的最小处理单元是Region,UserRegion和RegionServer之间的路由信息是保存在哪?A、ZooKeeperB、HDFSC、MasterD、meta表答案:D31、FusionInsightHD系统中,以下选项哪一个不是HBase写数据流程涉及的角色或服务?A、ZooKeeperB、HDFSC、HMasterD、RegionServer答案:C32、FusionInsightHD的HBase中保存一张用户信息表meg_table,Rowkey为用户id,其中一列为用户昵称,现在按先后顺序往这列写入三个KeyValue:001:Li,001:Mary,001:Lily,请问scan’meg_table’,(VERSION=>2)会返回哪几条数据?()A、001:LilyB、001:LiC、001:Mary,001:LilyD、001:Li,001:Mary,001:Lily答案:A33、安装FusionInsightHD的Streaming组件时,Nimbus角色要求安装几个节点?A、1B、2C、3D、4答案:B34、关于Hive建表的基本操作,描述正确的是?A、创建外部表的时需要指定external关键字B、一旦表创建好,不可再修改表名C、一旦表创建好,不可再修改列名D、一旦表创建好,不可再增加新列答案:A35、部署FusionInsightHD时,同一集群内的FlumeServer节点建议至少部署几个?A、1B、2C、3D、4答案:B36、FusionInsightHD的Manager界面对Loader的操作不包括下列哪个?A、启动Loader实例B、查看Loader服务状态C、配置Loader参数D、查看Loader运行日志答案:D37、在YARN的任务调度流程中,下列哪个是ApplicationMaster负责的任务?A、申请和领取资源B、启动Map或Reduce任务C、为任务设置好运行环境D、分配Container答案:A38、FusionInsightHD系统中HDFS默认BlockSize是多少?A、32MBB、64MBC、128MBD、256MB答案:C39、可以通过以下哪个命令创建节点数据?A、Ls/nodeB、get/nodeC、set/nodedataD、Create/node答案:D40、HBase的某张表的RowKey划分SplitKey为9,E,a,z,请问该表有几个Region?A、3B、4C、5D、6答案:C41、以下关于FusionInsight多租户管理的描述正确的有?A、基于容器机制的租户资源隔离,为租户SLA保驾护航B、与企业组织结构相匹配的多级的租户模型,不同部门对应不同的租户,按需动态增删租户C、可视化的多级租户管理,与企业组织结构相匹配,简化系统资源分配与管理D、一站式管理租户资源,计算资源(CPU/内存/IO),存储资源(HDFS),服务资源(HBase...)答案:ABCD42、Loader可以实现以下哪些转换规则?()多选A、拼接转换B、空值转换C、增量转换D、长整形时间转换答案:ABD43、以下哪些是Spark服务的常驻进程?A、JDBCServerB、NodeManaaerC、SparkResourceD、JobHistory答案:AD44、StructuredStreamming在OutPut阶段可以定义不同的数据写入方式,包括下列哪些方式?A、CompleteModeB、UpdateModeC、GeneralModeD、AppendMode答案:ABD45、以下关于Zookeeper的leader选举说法正确的是A、当实例数n为奇数时,假定n=2x+1,则成为leader节点需要x票B、当实例数为8时,则成为leader节点需要5票,容灾能力为4C、Zookeeper选举leader时,需要半数以上的票数D、当实例数n为奇数时,假定n=2x+1,则成为leader节点需要x+1票答案:CD46、FusionInsightHD支持哪些日志下载方式?(多选)A、下载已安装的所有组件的日志B、下载单个组件某个模块的日志C、下载指定主机的日志D、下载指定时间段的日志答案:ABCD47、YARN容量调度器的主要特点有哪些()A、灵活性B、多重租赁C、动态更新配置文件D、容量保证答案:ABCD48、以下选项中,对华为FusionInsightHD系统中备用NameNode的作用描述准确的有?A、主NameNode的热备B、备NameNode对内存没有要求C、帮助主NameNode合并编辑日志,减少主NameNode启动时间D、备NameNode应与主NameNode部署到一个节点答案:AC49、FusionInsightHD系统中使用Streaming客户端Shell命令查看拓扑或提交拓扑失败,以下哪些定位手段是正确的?A、查看客户端异常堆栈,判断是否客户端使用问题B、查看主Nimbus的运行日志,判断是否Nimbus服务端异常C、查看Supervisor运行日志,判断是否Supervisor异常D、查看Worker运行日志答案:AB50、“Hive中的这条命令”“SELECTa.salary,b.addressFROMemployeeaJOIN(SELECTaddressFROMemployee_infowhereprovince='zhejiang')bON=;”“是一个什么类型的操作?”A、JOIN查询B、创建表C、导入数据D、子查询答案:AD51、在华为大数据解决方案中,hadoop底层包含以下那些组件?A、minerB、hiveC、sparkD、fink答案:BCD52、Flink可以基于以下哪些窗口进行统计?A、时间窗口B、滑动窗口C、会话窗口D、countWindow答案:ABCD53、下列关于Flink中TransFormation的说法正确的是?A、filter操作是对每个元素执行boolean函数B、keyBy是将源头数据按照key进行分组,以保证同一个key的源数据分到同样的组中C、可以通过windows设定时间窗口D、flatMap可以对文本进行切分答案:ABCD54、Zookeeper可以为FusionInsightHD中哪些组件提供分布式管理支持()A、HBaseB、LoaderC、HiveD、Spark答案:ABCD55、关于Flume,下列说话错误的是?()多选A、Source到Channel到Sink等进程内部有加密的必要B、Flume级联节点之间的数据传输支持加密C、Flume支持多级级联和多路复制D、Flume级联节点之间的数据传输不支持压缩答案:AD56、Flink支持的时间操作类型包括以下哪些选项?A、结束时间B、处理时间C、采集时间D、事件时间答案:BD57、Spark有哪些特点?A、快B、轻C、巧D、灵答案:ABCD58、根据数据流如何在两个Transformation之间传输数据,数据流可以分为哪些类型?A、一对一流B、distributing流C、一对多流D、redistributing流答案:AC59、以下关于KafkaLogs中segmentfile的说法正确的有?A、通过索引信息可以快速定位messageB、稀疏存储,即将原来的完整数据,只间隔的选择多条进行存储C、使index元数据全部映射到memory,可以避免segmentfile的index数据IO磁盘操作D、索引文件稀疏存储,可以大幅度降低index文件元数据占用空间大小答案:ABCD60、Zookeeper中的数据节点znode分为哪几种类型?A、temporaryB、persistentC、ephemeralD、semi-persistent答案:BC61、FusionInsightHD集群中包含多种服务,每种服务又由若干角色组成,下面哪些是服务的角色?A、HDFSB、NameNodeC、DataNodeD、HBase答案:BC62、MapReduce过程中,以下属于shuffle机制的是?()A、combineB、copyC、partitionD、sort/merge答案:BD63、传统数据处理的性能瓶颈有?A、流式数据处理性能不足B、批量数据处理缺失C、扩展能力有限D、数据存储成本高答案:ABCD64、以下关于Hadoop分布式文件系统HDFS联邦描述正确的有?A、一个Namespace使用一个blockpool管理数据块B、一个Namespace可使用多个blockpool管理数据块C、每个blockpool的磁盘空间是物理共享的,逻辑空间是隔离的D、支持NameNode/Namespace水平扩展答案:ACD65、YARN容量调度器的主要特点有哪些?A、容量保证B、灵活比C、多重租赁D、动态更新配置文件答案:ABCD66、下面哪些关键词是Kafka的特点()。A、消息持久化B、分布式C、支持消息随机读取D、高吞吐答案:ABD67、StructuredStreaming在OutPut阶段可以定义不同的数据写入方式,包括下列哪些方式?A、CompleteModeB、UpdateModeC、AppendModeD、GeneralMode答案:ABC68、HDFS的基本系统构架中包含下列哪些节点?()A、ResourceManagerB、NameNodeC、NodeManagerD、DataNode答案:BD69、FusionInsightHD系统中使用Streaming客户端Shell命令提交了拓扑之后,使用StormUI查看发现该拓扑长时间没有处理数据,可能原因有?A、拓扑结构过于复杂或者并发太大,导致worker启动时间过长,超过supervisor的等待时间B、Supervisor的slots资源被耗尽,拓扑提交上去后分不到slot去启动Worker进程C、拓扑业务存在逻辑错误,提交之后无法正常运行D、当数据量较大时,拓扑处理速度较慢答案:ABC70、Nimbus在Streaming架构中的功能包括?A、任务调度B、启动/关闭工作进程C、监控任务执行状态D、资源分配答案:AD71、FusionInsightHD平台中,HBase暂不支持二级索引。()A、正确B、错误答案:B72、Hive不支持超时重试机制。A、正确B、错误答案:B73、Spark任务的一个Executor同时可以运行多个taskA、正确B、错误答案:A74、大数据需要传统行业思维方式的转变,要把数据收集、分析作为业务流程的重要组成部分,数据驱动业务流程优化,实现智能化和自动化,并依托数据资产实现跨界拓展。A、正确B、错误答案:A75、二级索引为hbase提供了按照某些列的值进行索引的能力,二级索引先查索引表,再定位到数据表中的位置,不用全表扫描A、正确B、错误答案:A76、FusionInsightHD的Loader中,一个连接器只可以分配给一个作业使用A、正确B、错误答案:A77、华为在金融、公安、铁路、政务等多行业拥有丰富的大数据解决方案经验A、正确B、错误答案:A78、Zookeeper所有节点都可以处理请求A、正确B、错误答案:A79、kafkaProducer读数据总体流程是,Producer连接任意存活的Broker,请求指定topic、partition的leader元数据信息,然后直接与对应的Broker直接连接,发布数据。()A、正确B、错误答案:A80、Hive中的“Groupby”指的是通过一定规则将一个数据集划分成若干个小的数据集,然后针对若干个小的数据集进行数据分组处理。A、正确B、错误答案:A81、HDFS的Client写入文件时,数据的第一副本写入位置是由NameNode确定,其他副本的写入位置由DataNode确定。A、正确B、错误答案:A82、FusioninsightHD产品中,一个典型的kafka集群包含若干个producer若干个Consummer和一个zookeeper集群?A、正确B、错误答案:B83、kafka是一个高吞吐、分布式、基于发布订阅的消息系统,利用kafka技术可在廉价PCServer上搭建起大规模消息系统。()A、正确B、错误答案:A84、FusionInsight集群组网设计中,二层组网指集群内二层交换,集群节点在一个子网里,适用节点数小于200的集群场景。A、正确B、错误答案:A85、对高价值高聚合的信息和知识的批式处理是大数据行业主要商业诉求。A、正确B、错误答案:A86、FusionInisghtHD集群安装成功后,不允许修改服务、角色和实例的配置。A、正确B、错误答案:B87、SparkSOL表中,经常会存在很多小文件(大小远小于DFS块大小),在这种情况下,Spark会启动更多的Task来处理这些小文件,当SQL逻辑中存在Shuffle操作时,会大大增加hash分桶数,从而严重影响性能。()A、正确B、错误答案:A88、Spark是基于内存的计算,所有Spark程序运行过程中的数据只能存储在内存中。A、正确B、错误答案:B89、Kafka作为一个分布式消息系统,支持在线和离线消息处理,并提供了JAVAAPI以便其他组件对接使用。在F
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2026年学校新任管理团队快速融入指南
- 2026年银行贵宾客户维护与拓展
- 初三数学球赛题库及答案
- 湖北省恩施州普高联盟2025-2026学年高二上学期12月月考数学数学试题(解析版)
- 术后吻合口出血的危险因素与内镜处理
- 智能质控系统在医疗管理中的应用
- 智能技术应用
- 智能化随访系统与专科患者管理
- 第11章不等式与不等式组数学活动(教学课件)数学新教材人教版七年级下册
- 智慧病房医嘱执行闭环管理
- GB/Z 177.7-2026人工智能终端智能化分级第7部分:汽车座舱
- 成都湔江投资集团有限公司2026年春季第一批次招聘考试参考题库及答案解析
- 2026四川泸州金桂投资有限公司第一批次招聘26人备考题库附答案详解(完整版)
- 2026浙江宁波市北仑区残疾人联合会招聘编外用工1人笔试备考试题及答案详解
- 2026年高考物理终极冲刺:专题12 动量守恒定律及其应用(二大题型)原卷版
- 2026西藏中考语文查缺补漏专练含答案
- 学校出入境请假审批制度
- 2026年江苏省宿迁市中考物理一模试卷(含答案)
- 2025年纪委面试真题及参考答案
- √高考英语688高频词21天背诵计划-词义-音标-速记
- 99S203 消防水泵接合器安装图集
评论
0/150
提交评论