版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
大数据HCIA模拟练习题1、KafkaClusterMirroring工具可以实现以下哪项功能?A、Kafka跨集群数据同步方案B、Kafka单集群内数据备份C、Kafka单集群内数据恢复D、以上全不正确答案:A2、以下关于Kafka的描述错误的有()A、由ApacheHadoop开发,并于2011年开源B、用作活动流和运营数据处理管道的基础C、具有信息持久化、高吞吐、实时等特性D、使用Scala、Java语言实现答案:A3、下面关于zookeeper特性的描述错误的是()A、zookeeper节点数必须为奇数个B、客户端所发送的更新会按照他们被发送的顺序进行应用C、一条消息要被超过半数的Server接受,它将可以成功写入磁盘D、消息更新只能成功或者失败,没有中间状态答案:A4、下列哪个命令是删除文件的?()A、dfs-rmB、dfs-delC、dfs-lsD、dfs-clear答案:A5、YRAN的基于标签调度,是对下列选项中的哪个进行标签化?A、APPMasterB、ResourceManagerC、ContainerD、NodeManager答案:D6、以下关于Hbase中HregionServer的功能描述哪些是不正确的A、RegionServer一般与HDFS集群的NameNode部署在一起,实现数据的存储功能B、Hbase的数据处理和计算单元C、RegionServer是Hbase的数据服务进程,负责处理用户数据的读写请求D、管理所有的Region,Region可以在RegionServer之间迁移答案:B7、SoIrCloud模式是集群模式,在此模式下Solr服务器强依赖于以下哪个服务?A、HBaseB、HDFSC、ZooKeeperD、Yarn答案:C8、HDFS的副本存放策略中,同一机架不同服务器之间的距离是()A、2B、3C、1D、4答案:A9、以下关于Flink关键特性描述不正确的是?A、SparkStreaming与Flink相比,时延更低B、Flink流式处理引擎能够同时提供支持流处理和批处理应用的功能C、与FusionInghtHD中的Streaming相比,Flink具有更高的吞吐量D、checkpoint实现了Flink的容错答案:A10、在很多小文件场景下,Spark会起很多Task。当SQL逻辑中存在Shuffle操作时,会大大增加hash分桶数,严重影响性能。FusionInsight中,针对小文件的场景通常采用()算子,来对Table中的小文件生成的partition进行合并,减少partition数,从而避免再shuffle的时候,生成过多的hash分桶,提高性能。A、connectB、groupbyC、joinD、coalesce答案:D11、在YARN的任务调度流程中,下列哪个是ApplicationMaster负责的任务?A、申请和领取资源B、为任务设置好运行环境C、分配ContainerD、启动Map或Reduce任务答案:A12、Hadoop中哪个模块负责HDFS的数据存储?A、NameNodeB、DataNodeC、ZooKeeperD、JobTraoker答案:B13、FusionInsightHD的Loader在创建作业时,连接器(Connector)有什么作用?A、确定有哪些转换步骤B、提供优化参数,提高数据导入导出性能C、配置作业如何与外部数据源进行连接D、配置作业如何与内部数据源进行连接答案:C14、可以通过以下哪个命令创建节点数据?A、create/nodeB、ls/nodeC、set/nodedataD、get/node答案:A15、FusionlnsightHD系统中,LDAP数据同步方式是哪个?A、单向同步B、双向同步C、隔离不同步D、数据交叉同步答案:A16、Hive不适用于一下哪个场景A、实时的在线数据分析B、非实时分析,例如日志分析,统计分析C、数据汇总,例如每天,每周用户点击数,点击排行D、数据挖掘,例如用户行为分析,兴趣分区,区域展示答案:A17、在WebHCat架构中,用户能够通过安全的HTTPS协议执行以下哪些操作()A、执行HiveDDL操作B、运行MapReduce任务C、运行HiveHQL任务D、以上全部正确答案:D18、Zookeeper的Scheme认证方式不包括以下哪项?A、authB、worldC、digestD、sasl答案:D19、HBase中数据存储的文件格式是什么?A、HFileB、SequenceFileC、LogD、TXTfile答案:A20、Hadoop平台中HBase的Region是由哪个服务进程来管理?A、HMasterB、DatanodeC、RegionServerD、Zookeeper答案:C21、在Zookeeper和YARN的协同工作中,当ActiveResourceManager产生故障时,StandbyResourceManager会从以下哪个目录中获取Application相关信息()A、warchouseB、metastoreC、StatestoreD、Storage答案:C22、创建Loader作业时,可以在一下那个步骤中设置Map数?A、转换B、输出C、输入设置D、基本信息答案:B23、Hive中的哪些操作可以合并A、UNIONALLB、JOINC、SELECTD、GROUPBY答案:A24、kafka集群在运行期间,直接依赖于下面那些组件?()A、ZookeeperB、HDFSC、HBaseD、Spark答案:A25、fusioninsightmanager不能够管理哪个对象?A、HDFSB、主机OSC、yarnD、spark答案:B26、在FusionInsightManager界面中,对loader的操作不包括下列哪个选项?()A、切换Loader主备节点B、启动loader实例C、配置loader参数D、查看loader服务状态答案:A27、FusionInsightManager用户权限管理不支持哪个配置?A、给用户配置角色B、给角色配置权限C、给用户组配置角色D、给用户组配置权限答案:D28、Spark组件中哪个选项不属于transformation操作?A、reduceB、reduceByKeyC、distinctD、join答案:A29、FusionInsightManager用户权限管理不支持哪个配置?A、给用户配置角色B、给用户组配置权限C、给用户组配置角色D、给用户配置权限答案:B30、Flume数据采集过程中,下列选项中能对数据进行过滤和修饰的是()A、ChannelB、ChannelSelectorC、InterceptorD、Sink答案:C31、关于Hive与Hadoop其他组件的关系。以下描述错误的是?A、Hive最终将数据存储在HDFS中B、Hive是Hadoop平台的数据仓库工具C、HQL可以通过MapReduce执行任务D、Hive对HBase有强依赖答案:D32、FusionInsightHD系统审计日志不可用记录下面哪些操作?A、手动清除警告B、启停服务实例C、删除服务实例D、查询历史监控答案:D33、Spark是以下哪种编程语言实现的?A、ScalaB、JAVAC、CD、C++答案:A34、HBase中如果发生一个Region的Split,将一个HFile文件真正分开到两个Region的过程发生在以下什么阶段?A、Split过程中B、Flush过程中C、Compaction过程中D、HFile分开过程中答案:C35、FusionlnsightHD使用HBase客户端批量写入10条数据,某个RegionServer节点上包含该表的2个Region,分别A和B,10条数据中有两条属于A,4条属于B,请问写入这10条数据需要向该RegionServer发送几次RPC请求?A、1B、2C、3D、4答案:A36、在Flink的运行流程中,负责申请资源的角色是?A、ResourceManagerB、JobManagerC、ClientD、TaskManager答案:B37、下列哪条HDFS命令可用于检测数据块的完整性?A、hdfsfsck/B、hdfsfsck–deleteC、hdfsdfsadmin–reportD、hdfsbalancer–threshold1答案:A38、下列哪个不是HBase读取数据流程中涉及的角色或服务?()A、HDFSB、ZookeeperC、HMasterD、HRegionServer答案:C39、关于FusionInsightManager中的Controller和NodeAgent,说法正确的是?A、Controller每隔3秒向NodeAgent发送心跳B、NodeAgent接受Costroller下发的命令,执行具体的动作C、每个节点都必须部署ControllerD、NodeAgent是开源增强的答案:B40、关于FusionInsightHDStreaming的Supervisor描述正确的是?A、Supervisor负责资源分配和任务调度B、Supervisor负责接受Nimbus分配的任务,启动和停止属于自己管理的worker进程C、Supervisor是运行具体处理逻辑的进程D、Supervisor是一个Topology中接收数据然后执行处理的组件答案:B41、在Streaming的处理节点Bolt中,可以完成以下哪些操作()A、连接运算B、连接数据库C、过滤(filter)D、业务处理答案:ABCD42、在华为FusionInsightHD中,下面哪些组件是Flink强依赖的?A、ZooKeeperB、YARNC、KafkaD、HDFS答案:ABD43、在FusionInsightHD中,Flink主要与以下哪些组件进行交互?A、KafkaB、YARNC、ZookeeperD、HDFS答案:ABCD44、关于SparkSQL&Hive区别与联系,下列说法正确的是?A、SparkSQL的执行引擎为Sparkcore,Hive默认的执行引擎为MapReduceB、SparkSQL依赖Hive的元数据C、SparkSQL不可以使用Hive的自定义函数D、SparkSQL兼容绝大部分Hive的语法和函数答案:ABD45、在大数据时代,企业所面临的挑战有以下哪些?A、竞争对手的技术进步。B、企业各部门间数据分散,相同数据在各部门内部存储格式不一致。C、数据结构多样化。D、数据存在噪音、缺失、存储类型不规范等问题,需要进行大量的数据预处理工作。答案:ABCD46、HBase的数据文件HFile中一个KeyValue格式包含哪些信息?A、KeyB、ValueC、TimestampD、KeyType答案:ABCD47、Loader的shell脚本可以实现以下哪些功能?A、数据源查询B、查看作业状态C、停止作业D、启动作业答案:ABCD48、在FusionInsight产品中,关于创建Kafka的Topic,以下哪些描述是正确的?A、在创建Kafka的Topic时,必须设置Partiton个数B、在创建Kafka的Topic时,必须设置Partition副本个数C、设置多副本可以增强Kafka服务的容灾能力D、以上全都正确答案:ABCD49、下列属于flume数据监控的指标是?()A、Source接收数据量B、Sink写入数据量C、DataNode数量D、Channel缓存数据量答案:ABD50、HBase集群定时执行Compaction的目的是什么?A、减少同一Region,同一ColumnFamily下的文件数目B、提升数据读取性能C、减少同一ColumnFamily的文件数据D、减少同一Region的文件数目答案:ABD51、采用Flume传输数据过程中,为了防止因Flume进程重启而丢失数据,可以使用以下哪种Channel类型?A、MemoryChannelB、JDBCChannelC、FileChannelD、HDFSChannel答案:BC52、下列选项中,哪些是MapReduce一定会有的过程A、ReduceB、MapC、CombineD、Partition答案:AB53、FusionInsightHD系统中Hive支持的存储格式包括?A、HFileB、TextFileC、SequenceFileD、RCFile答案:BCD54、下面哪些场景不是Flink组件擅长的?()A、迭代计算B、批处理C、数据存储D、流处理答案:AC55、FusionInsightManager会定时备份哪些数据?A、NameNodeB、LDAPC、OMsD、DBService答案:ABCD56、FusionInsightHD平台中,哪些组件支持对表、列加密?A、HBaseB、HDFSC、HiveD、Flink答案:AC57、下列关于ZooKeeper的描述正确的是()A、ZookKeeper基于开源ApacheZookper主要用于解决分布式应用中经常遇到的一些数据管理问题B、ZooKeeper作为底层组件被其他组件依赖,而不依赖于其他组件C、华为FusionInsightHD中要求必须部署ZooKeeperD、ZooKeeper节点个数要求越多越好答案:AC58、大数据商业咨询服务方案在规划环节主要考虑以下哪些设计?A、商业场景全景规划B、场景分解和业务设计C、典型场景需求设计D、大数据商业模式设计答案:ABCD59、调用Zookeeper客户端命令中包含哪些信息?A、用户名B、端口号C、ip地址D、服务器名称答案:BC60、在Kafka中,如下关于Producer发送数据的说法错误的是()A、Proucer作为消息生产者。可以直接将数据写入ZookeeperB、Proucer负责生产数据。Consumer负责消费数据。Producer和Consumer之间需要建立连接C、Proucer既可以发送数据到Broker上。又可以发送数据到ConsumerD、Proucer连接任意一个正常的Broker实例就可以产生数据答案:ABC61、在华为大数据解决方案中,Hadoop层包含以下哪些组件()A、SparkB、MinerC、HiveD、Flink答案:ACD62、以下哪些是Kafka实际的应用场景?A、聚合统计系统运营数据(监控数据)B、资源管理C、网站活性跟踪D、日志收集答案:ACD63、FusionInsightHDManager界面显示Hive服务状态为Bad时,可能的原因有哪些?A、DBServioe服务不可用B、HDFS服务不可用C、Metastore实例不可用D、HBase服务不可用答案:ABC64、执行HBase数据读取业务时,需要读取哪几部分数据?A、HFileB、HLogC、MemStoreD、HMaster答案:AC65、FusionInsightHD系统中使用Streaming客户端shell命令提交了拓扑之后,使用StromUI查看发现该拓扑长时间没有处理数据,可能原因有?()A、Supervisor是在topology中接收数据然后执行处理的组件B、拓扑业务存在逻辑错误,提交之后无法正常运行C、拓扑过于复杂或者并发太大,导致worker启动时间太长,超过Supervisor的等待时间D、Supervisor的slots资源被耗尽,拓扑提交上去之后分不到slot去启东worker进程答案:BCD66、以下关于HBase中HMaster的功能描述哪些是正确的?A、负责建表/修改表/删除表B、负责RegionServer的负载均衡C、RegionServer失效后的Region迁移D、Region负载均衡,Region分裂以及分裂后的Region分配答案:ABCD67、以下关于Flink与其它组件交互说法正确的是?A、Flink任务的运行依赖Yarn来进行资源的调度管理B、Flink的checkpoint的实现依赖于ZookeeperC、Flink的可以将接收的组件发送给KafkaD、Flink在HDFS文件系统中读写数据答案:ABCD68、以下哪些属于FusionInsightHD的特点?A、开源B、易用C、安全D、可靠答案:ABCD69、FusionInsightManager可以对哪些项目进行健康检查?A、主机B、服务C、角色D、实例答案:ABCD70、Hadoop系统中YARN支持哪些资源类型的管理?A、内存B、CPUC、网络D、磁盘空间答案:AB71、Channel支持事务,提供较弱的顺序保证,可以连接任何数量的Source和Sink()A、正确B、错误答案:A72、SparkOnYARN模式下,没有部署NodeManager的节点不能启动executor执行TaskA、正确B、错误答案:A73、FusionInsightHD系统中HBase支持动态扩展列。A、正确B、错误答案:A74、如果某些Container的物理内存利用超过了配置的内存阈值,但所有Container的总内存利用率并没有超过设置的NodeManager内存阈值,那么内存使用过多的Container仍可以继续运行。()A、正确B、错误答案:A75、Flume传输数据的可靠性是指Flume在传输数据过程中,当下一跳的Flume节点故障或者数据接收异常时,可以自动切换到另外一路上继续传输。A、正确B、错误答案:A76、FusionInsightHD的Loader中,一个连接器(Connector)只可以分配给一个作业使用A、正确B、错误答案:B77、FusionInsightHD中使用HBase进行数据读取服务时需要连接HMasterA、正确B、错误答案:B78、在Streaming中,消息可靠性级别中的精确一次时通过ACK机制来实现的。A、正确B、错误答案:B79、Flink是一个批处理和流处理结合的计算框架,其核心是一个数据分类以及并行化计算的流数据处理引擎。()A、正确B、错误答案:A80、Kafka日志的清理方式有两种:delete和compact。默认值是delete。A、正确B、错误答案:A81、容量调度器在进行资源分配时,现有同级的2个列队Q1和Q2,它们的容量均为30,其中Q1已使用8,Q2已使用14,则会优先将资源分配给Q1。A、正确B、错误答案:A82、Mapreduce过程中,默认情况下,一个分片就是一个块,也是一个mapTask.A、正确B、错误答案:A83、Flink采用checkpoint机制保障应用程序中的容错性。A、正确B、错误答案:A84、ApplicationMaster采用轮询的方式通过RPC协议向ResourceManager申请和领取资源。A、正确B、错误答案:A85、在FusionInsightHD系统,Loader作业运行过程中,如果产生脏数据,Loader作业执行结果的状态一定是失败。A、正确B、错误答案:B86、Flink只能部署在Local和Cluster,暂不支持其他部署()A、正确B、错误答案:B87、Spark根据RDD的依赖关系来划分Stage,调度器从DAG图末端出发,逆向遍历整个依赖关系链,遇到窄依赖就断开,遇到宽依赖就将其加入当前Stage。A、正确B、错误答案:B88、HDFS机制中NameNode负责管理元数据,Client端每次读请求都需要从NameNode的元数据磁盘中读取元数据信息以此获取所读文件在DataNode的位置。A、正确B、错误答案
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 金东区海棠东路武义江大桥改造工程桥梁荷载试验检测招标文件
- 信阳市2026届高三第二次联考语文试卷含解析
- 教育研究方法基础(第4版)课件 第7-12章 教育统计与教育测验-教育研究成果表述
- 【海口市L大酒店餐饮部员工满意度的影响因素研究11000字(论文)】
- 【2026】软件资格考试信息处理技术员(基础知识、应用技术)合卷(初级)备考要点精析年
- GEO优化系统测评:2026年品牌提及率提升TOP3平台深度解析与选型指南
- 安全注射培训
- 银河微电深耕半导体分立器件积极拓展新兴市场
- 防暴反恐安全试题及答案
- 创业模拟试题7及答案
- 读后续写专题之巧用修辞手法课件高三英语二轮复习
- 网约车停运损失费起诉状模板
- 门面装修合同
- 临床疗效总评量表(CGI)
- 抑郁症临床路径(2012年版)
- 泵-容积泵的特点及应用
- 中西方沟通的差异课件
- 扫描电子显微镜(SEM)
- 【北师大版】四年级数学下册全册23套试卷(解析版)
- 2023年国家义务教育质量监测工作应急预案
- 高考语文思辨类作文总体写作指导-高考语文思辨类作文写作全面指导
评论
0/150
提交评论