华为HCIP认证大数据-H13-723培训考试复习题库(含答案)_第1页
华为HCIP认证大数据-H13-723培训考试复习题库(含答案)_第2页
华为HCIP认证大数据-H13-723培训考试复习题库(含答案)_第3页
华为HCIP认证大数据-H13-723培训考试复习题库(含答案)_第4页
华为HCIP认证大数据-H13-723培训考试复习题库(含答案)_第5页
已阅读5页,还剩332页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

华为HCIP认证大数据-H13-723培训考试复习题库(含答案)一、单选题1.对于GaussDB200的数据并行导入策略Normal,下列说法错误的是()?C、数据导入时,支持单行数据大小小于1GB.用下列哪个工具?3.智能数据湖运营平台指的是以下哪个选项?A、VASvideoAnalysisServiceA、HDFS文件块的大小在1.0版本时是64M,在2.0的时候是128MB、文件块(片)被存在哪个集群;谁有权限查看、修改这个文件等信息放在元5.以下关于公共安全行业专题分析与查询业务场最描述错误的选项是()。A、滚动升级/补丁B、修改配置滚动重启A、Spark顺序为0)?18.以下哪项不属于批量数据采集工具?()能?A、调整索引分片数C、压缩素引C、PCK通过min/max稀疏素引实现事实表快速过扫描44.以下关于EasticSearch缓存机制的理解不正确的是()A、FilterA、通过GaussDB200的数据分布规则数据会自动分布.那么对表的设计可以比较49.以下关于StreamExecution持续查询过程的描述哪项是正确的?LogicalPlan--计算完成mit--计算结果SinkB、offsets写入offsetLog--获取最新数据offsets--构造LogicalPlan--优化LogicalPlan--计算结果Sink--计算完成mitC、获取offsetsoffsetsoffsetLogLogicalPlanD、获取最新数据offsets--offsets写入offsetLog--优LogicaPlanLogicalPlan--计算结果Sink--计算完成mit55.以下哪个不是离线批处理的核心诉求?A、处理数据格式多样B、处理教据量巨大C、支持SQL美作业和自走义作业D、处理时间要求高56.在SparkSQL中,()使用了新的编码器,其编码器的作用是将VM的对象与表结构进行转换,允许操作序列化数据,可以提高内存利用率。57.列哪一个命令可以清空Reis实例下所有数据库的资料?A、ttlA、流式数据读取B、大文件存储与访问<imgsrc="https://up.zaixiankaoshi./5443384imagepng端计算Key归属的槽位以及对应serverB节点并连接一ServerB节点返回业务操C、ServerA节点返回集群拓扑一喜户端计算Key归属的槽位以及对应ServerB节点并连接户端选择集群任意一个ServerA节点连接-eerB节点返回业务操作结果对应ServerB节点并连接-ServerA节点返回集群拓扑-ServerB节点返回业务操C、高并发B、事件时间C、检查点存储在0中,并在随后由。调用执行。94.HDFS创建目录过程中,通过调用FileSystem实例的()方法查看该目录是99.Hive调优中,当连接一个较小和较大表的时候,把()的表直接放到内存中去,然后再对()的表进行map操作。A、小,小B、小,大C、大,小D、大,大A、FlinkA、HBase118.存储过程的调用有几种方式()119.以下哪种Hive的方法可以用来对数据求和?A、trimA、正排素引B、倒排素引mepersonnamemarkoapiqueryVertexvertexldgraphA、查询点123.StructuredStreaming中持续地查询最新计算结果至写出。这个过程叫做什么?124.ElasticSearchk可通过分片副本来优化性能,下列策略错误的是哪一项?A、分片数不超过节点数的3倍,用较少的分片获得更佳的性能B、副本数至少设置为3,保障数据的可靠性C、副本数建议设置为1,过多的副本需要更多存储空间D、分片最大容量不要超过ElasticSearch推荐的最大JVM堆空间32G率损D、运营商可以借助实时检索技术,查询某个A、admintableExiststableNameA、HDFS成的查询计划存储在0中,并在随后由。调用执行。A、数据可视化->数据源->数据落地-〉数据处理150.关于RDD,下列说法错误的是哪一项?A、RDD具有血统机制(Lineage)。B、RDD默认存储在磁盘。C、RDD是一个只读的,可分区的分布式数据集。D、RDD是Spark对基础数据的抽象。151.以下哪个框架可以同时满足实时分析、高线分析、实时检素的功能?152.HBase使用get方法读取数据时,下列哪个选项是需要的?A、Deletedelete=newDeleterowkeyC、byte[rowKeyBytestoBytesD、熟悉LinuxShelI命令B、创建列存表时压缩级别默认为HIGHA、序列化B、键值对C、二进制A、IntinfoindexisnotexistindexretuC、1天D、7天177.在GaussDB200的存储过程中语句nimfcer=0C、修改变量number的值为0据Metadata中。D、HDFS文件块的大小在1.0版本时是64,在2.0的时候是128M。dA、-cat191.关于GaussDB200的数据导入导出下列说法正确的是()?A、使用gsq1元命令和COPY命令在使用和用法上是一样的。B、GDS在数据导入时可以做预处理,比如非法字符替换、容错处理、数据聚合199.下列关于GaussDB200的Explain命令描述正确的是?()A、Explain命令主要显示SQL的执行计划,对SQL调优用处不大。C、通过设置GUC参数explainperfmode,可以显示不同格式的执行计划。D、Explain可以完成对SQL的优化,其D、高并发202.离线批处理常用的组件不包括哪个?204.现在有一亿条数据要插入HBase使用下列哪个方式最好?A、StaticlnterceptorA、TB213.关于GaussDB200的发展史,下列说法错误的是()?A、g.V().hasLabel("testquothasLabelquottestquotvaluesquotagequhasLabelquottestquotvalueMapquotStr217.某开发小组计划利用GraphBase实现一些功能,以下哪些功能可以实现?A、Spark223.关于Hive自定义UDF描述错误的是()A、普通的UDF,用于操作单个数据行,且产生225.HBase元数据MetaRegion路由信息保存的位置是下列一项?226.下面这条GaussDB200语句"calldbmsjob.broken(1.true)"的意思是()?A、停止任务TD为1的Job.227.GaussDB200数据并行导入Shared策略支持的数据格式是?A、CSy228.某大数据业务人员对某些数据创建Hive表结构,其中某个数据为时间类型yyyyMMdd,那么可以使用以下哪一项作为字段类型?A、varcahr229.在网络日志数据分析场最中,日志服务器通过1性4将数据传给(),()会对数据进行简单的处理过滤,然后将数据按照日期存储到。上。230.下列关于Hive自定义函数的描述中,正确的是哪一项?A、Hive中的min以及max属于UDAF的数。B、一般自行编写的函数都属于临时函数.每次使用都需要重新创建。C、一般自行编写的函数都属于永久函数.直接引用即可。D、如果创建的函数名与内置的函数名重复,在使用过程中以内置的函数231.下对GaussDB200双AZ集群描述不正确是?A、灾备集群不同步数据时,可以提供读写服务B、主集群不可用时,灾备集群提供正常服务C、主集群提供正常服务,文备集群只同步数据D、周期性数据同步232.有一张表name,其中一,字段名为chinesename,类型为char(4),另一,字lues(gaosi','GaussDB)'会发生什么?()B、过多的列10开销大235.下列哪段代码是用于判断ElasticSearch索引是否存在?publicbooleanisExistslndexStringindexNameIndicpublicbooleanisExistslndexStringindexNameIndicesExistsRepublicbooleanisExistslndexStringindexNameIndicesEA、netstat241.关于表连接算子的说法错误的是()?A、聚合操作如groupby会触发NergeJoinB、表连接算子主要有NestloopMergeJoin.Minorjoin.HashJoinC、算子的选择是SQL根据逻辑三行选择的.与人为无关。D、默认情况下.执行效率来说Hashjoin最高。242.离线批处理常用的组件不包括()。243.GES能够处理海量数据的原因是()A、基于HBase的分布式存储机制B、图机制特性C、基于Elasticsearch的素引机制D、基于Spark的分布式内存计算技术A、SQL语句通过SparkSQL模块解析为DAG,交给SparkCore执行。B、SparksSQL使用场景包括毫秒级实时查询。C、通过SparkSession提交SQL语句。任务像普通Spark应用一样提交到集群中分布式运行D、SparksQL是Spark用来处理结构化数据的一个模块,可以在Spark应用中直接使用SQL语句对数据进行操作。245.GaussDB200在创建表时,需要注意以下哪些事项()?A、创建列存表之后,后续可以修改为行存表。B、创建列存表时压缩级别默认为HIGHC、如果指定表空间为普通表空间,创建表时默认是行式存储D、创建一个行存表之后,后续可以修改为列存表。246.常用的数据收集工具不包括以下哪个选项?247.Kafka集群必须依赖于下列哪一个组件?248.Flune传输数据过程中,为了防止数据不丢失,使用的Channel类型是?249.创建分支语句如下,CREATEORREPLACEPROCEDUREproccase.branch(piresuWHENTHENpireturnWHENTWHENTHENpireturnELSEPireturnENDCAreturn;END:执行如下语句CALLproccasebranch(3.2)的返回结果是()。250.下列哪个选项可用于查询ElasticSearch的索引?251.以下哪项属于Flume的基本数据单位?254.Flink的窗口,按窗口行为划分不包含以下哪种?256.下面这段代码的作用是什么?<imgsrc="https://up.zaixiankaoshi./5443A、判断索引分片是否存在B、判断索引是否可用C、判断索引是否存在D、判断索引类型257.Elasticsearch采用的搜索方式是?A、倒排索引B、快速索引A、数据可视化操作A、Explain通过指定option选项参数FORMAT来指定输出格式,默认是text格实际开销(单位为毫秒)和行数信息,对于判断优化器的估算准确提供依据。B、配置副本策略通常为3份A、UDAFD、scan读取数据是一次性全部把数据从服务端读取到10.实时检索解决方案支持的数据采集有哪些?11.KafkaConsumer在跟踪消费记录时,需要以下哪几个选项的信息?12.随着大数据越来越被重视,数据采集的挑战也变的尤为突出,常见的挑战包括?B、数据源多种多样C、数据采集的可靠性保障13.Flink有哪些状态储存方式?A、存储特定用户所有历史信息B、限时的优惠活动信息C、限制网站访客访问频率D、网站积分排行榜B、本地文件系统16.Redis使用场景包含以下哪些特点?A、支持持久化B、丰富数据结构在取的?A、边写边读B、低性能28.对于GaussDB200而言,字段的设计应该注意以下哪些事项?33.以下哪些场最可以使用HBase作为存储系统?A、Row-Key查询43.下面关于GaussDB200的逻辑集群说法正确的是()?46.以下哪些选项是容易造成Hive数据倾斜的原因?D、对业务人员进行权限划分,避免非法或敏感操作,如删除等。A、表的增删改查B、用户数据读写54.在GaussDB200中,关于Schema和Database下面说法正确的是()A、二者都能实现资源隔离。B、Database之间无法直接访问,但通过权限授子可以访问数据。D、Schema和用户强相关的,通过权限控制语法可以实现不同用户对各Schema55.大数据计算框架Spark中除了RDD还有哪些数据类型?56.对GaussDB200集群管理模块(CM)描述不正确的是?B、采用Min/Max稀疏素弓1D、每条记录对应一个CU(60Krows)58.计算10分钟内的单词,每5分钟更新次,若程序在12:00开始运行,在12:65.在ApacheHadoop中,关于HDFS的69.HBase的可视化Web界面可以查询到077.以下哪些选项属于离线批处理的特点?A、处理时间相对较长B、数据不落地、存储量不大D、处理数据量相对较大78.数据仓库分层的优点包括以下哪些选项?A、减少重复开发量79.大数据计算框架Flink的支持以下哪些资源调度方式?80.实时检索解决方案的项目流程包括以下哪些选项?A、应用部署88.关于Loader特点描述正确的选项是()A、容量预留A、FailoverSinkProcessorA、filter96.所谓大数据技术融合主要4旨哪些方面?A、Binaryparator104.StructuredStreaming中OutPut定义的存储方式包含以下哪几种A、HBase108.某大数据运堆人员需要将部分数据导入Hive数据表取的?A、RDBA、最大支持512节点,10P级数据B、支持存储海量小文件C、rowkey实时查询延迟可达16ms116.StructuredStreaming不能提供以下哪几种类型的保证?117.Region分裂时,下列哪些选项会参与?D、以上全不正确118.Kafka每个Partition在物理上对应的文件夹下存储哪些文件?A、素引文件C、用户文件A、对于点查或者范围扫描等过滤本量数据的查询,如果使用SeqScan全表扫描121.ElasticSearch支持的gateway类型有?取的?B、改造SQL语句,在插入前添动加清空操作如truncate123.某开发团队要使用ElasticSearch做检索工具,下列哪些选项可以用ElasticSearch检索?A、关系型数据库数据C、T业A、HDFS138.以下选项对GraphBase概念描述正确的是?139.Hive特性包括哪些?140.以下对HDFS中提供文件读写的类描述正确的是()C、Explain通过指定option选项参数FORMAT来指定输出格式,默认是text格B、配置副本策略通常为3份C、管理HDFSBaREj(NameSpace)B、我们可以每30秒计算一次最近一分钟用户鉱买的商品总数,这个就是时间滑163.大数据其中一个最明显的特征是数据量巨大,那么所谓的数据量巨大主要指哪些级别的数据量?A、MB164.ElasticSearch的核心概念包含哪些?165.以下Hive数据仓库数据表分层的描述,准确的是?A、ADS层,为各种统计报表提供数据,做分析处

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论