数据工程师培训题库(一)_第1页
数据工程师培训题库(一)_第2页
数据工程师培训题库(一)_第3页
数据工程师培训题库(一)_第4页
数据工程师培训题库(一)_第5页
已阅读5页,还剩5页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、.【说明】a )客观问题30题、1题2分、合订60分b )主观问题4题,每题10分,合订40分c )满分100分。【不定项选择题(1题2分60分)】在HDFS服务中,保证Name Node的高可用性的角色不包括()数据节点b .日记节点约瑟夫佐ookeeperNamenode在启动时自动进入安全模式,在安全模式阶段错误的是()a .安全模式的目的是在启动系统时检查对数数据的有效性b .根据策略对封摇滾乐进行必要的复制或删除c .当封摇滾乐的提升数达到阈值时,保密工作定模式自动退出d .使用户能够读写文件系统3 .在集群中配置的HDFS的副本数为3,并且子摇滾乐大小设置为128M。 此时,上传6

2、4M的数据文件。 此数据文件将HDFS的空间大小设置为()A . 64M米乙级联赛三八四公尺德国足球甲级联赛4 .集群中YARN角色的角色说明正确的是()a .集群资源管理b .安排和管理集群塔斯克c .存储部HDFS上的数据标签摇滾乐d .以上是正确的Yarn服务不包括以下任何角色()a .资源管理器节点管理器c .应用程序主节点德国联邦航空公司TDH数据平台身份验证工程师问题名字,名字,名字,名字。6 .以下补正信息帧工作中不属于分散补正信息帧工作的是()a .地图马特拉夫c .星球特雷兹关于外表和管理表,正确的是()a .外观上的数据本地保存,管理表中的数据被保存在hdfs中b .删除管

3、理表仅删除Inceptor上的数据库元数据,不删除数据文件,也删除外观c .删除外观仅删除Inceptor上的数据库元数据,不删除数据文件,同时删除管理表d .删除托管表或外观将删除incepotr上的数据库元数据和数据文件8 .以下分桶表的记述正确的是()a .分桶表通过改变数据的记忆分布,对查询发挥一定的优化作用b、分桶牛鼻子不能列在表中c、分桶数为素数d .事物表必须制定分桶,分桶字段可以更新以下关于inceptor excutor资源配置的说法是正确的()a、Excutor资源配置固定和ratio两种模式b、Excutor核心数配置了每个Excutor使用的逻辑核心数c、Excutor

4、内核数和内存配置比率一般为1 core :2 g内存d,Excutor分发可以指定每个节点要执行的Excutor的数量或Excutor在群集上执行的总数,但不能指定要执行的节点10 .假设使用场景中有以下查询语句:SELECT Sex,Region,计数(id ),avg (销售)来自企业威尔部门=it按组合,区域按次序、区域;holodesk的cube和index手段,优化了这种过滤率和聚合率高的业务,下表正确()。a .创建表格企业TBL属性(cache=RAM,holo desk.index=部门,holodesk.dimension=Sex,区域中所述)b .创建表格企业TBL属性(c

5、ache=RAM,holo desk .索引=sex,区域holo desk.dimension=部门中所述)c .创建表格企业TBL属性(cache=部门,holo desk.index=部门,holodesk.dimension=Sex,区域中所述)d .创建表格企业TBL属性(cache=RAM,holo desk.index=部门,holodesk.dimension=Sex中所述)11.hyperbase全局目录索引的说明哪个是正确的? ()a .核心是倒置表b .全局目录索引的概念对应于“原始”目录索引“原始密钥”c .全球目录索引使用平衡的二叉树d .全局目录索引使用b树检索数据

6、12.hyperbase分布式存储的最小用户针织面料是()区域服务器b,区域c,存储文件d,存储关于Hyperbase,正确的是()a .数据类型丰富,支持String、Int、Char等类型b、密钥/值关系统字、密钥由行、列系列、列限制器组成c、Hyperbase表的rowkey顺序良好,按字典顺序降序排列d,以上说法都不正确14 .关于流SQL的以下概念描述正确的是()A. Stream是一个数据流B. Streamjob是修正一个或多个stream并将结果写入一个流的塔斯克c .应用程序是一个或多个流作业的集合d上述说法都不正确15、某交通部门用流监测全市过去24小时的各卡口数据,要求每

7、一分钟更新,原始流是org_stream,以下实现是正确的()。a .创建流视窗流程选择*从原始流程1 as (长度1小时滑块24 h our )。b .创建流式幻灯片*从原始流式窗口1 as (长度1小时幻灯片24 h our )。c .创建流程图选择*从原始流程图窗口1 as (长度24 h或滑动1小时)。从原始流开始创建流,长度为24次命令1 minute。请参见.16、Zookeeper以外的功能是()a .配置管理b .集群管理c .分布式摇滾乐d .存储大量数据17 .以下服务需要与zookeeper通讯()阿. h主人b .活动名称c .培训员SQLd .活动资源管理器18 .以

8、下是flume和sqoop对比的描述,不正确的是()A . flume主要用于计程仪收集,而sqoop主要用于数据迁移B . flume主要用于收集流式传输数据,而sqoop主要用于迁移标准化数据C . flume和sqoop都是分布处理塔斯克D . flume主要用于收集多数据源中的小数据,而sqoop则用于迁移单数据源中的数据19 .关于使用sq OOP抽取数据的原理的记述不正确的是()A . sqoop在提取数据时可以指定map的数目,而map的数目确定了要在hdfs中生成的数据文件的数目b .因为sq OOP提取数据是多节点并行提取的过程,所以map的个数设定越多性能越好C . sqo

9、op塔斯克的划分取决于split字段的数目(最大值和最小值)/mapd .当D . sqoop撷取资料时,您必须确保目前的使用者拥有执行适当操作的权限20、sqoop在提取数据时必须做一些数据转换工作,但以下说法不正确的是()a.-fields-terminated-by01用于设置由hdfs生成的文件的分隔符B .-hive-drop-import-delims用于将hdfs生成的文件的存储格式设置为列存储格式c.- -空字符串n用于将所有字符串类型的空值转换为hive的空值d.- -空非字符串n用于将非字符串类型的空值转换为hive的空值21 .以下关于flume的描述不正确的是()A .

10、 flume是Apache的子项目工程B . flume主要是计程仪采集、传输系统C . flume和sqoop功能相似,因此可以相互替代D . flume可以收集集群内部和集群外部的计程仪数据22 .在以下sink中,flume不通讯端口的sink ()是哪一个?安德烈辛克卡夫卡辛克c .记忆体宿舍文件角色宿23、ElasticSearch的记述不正确的是()a .电子搜索是一个分布式全文检索引擎b .电子搜索群集中的主节点和数据节点c .电子搜索数据存储在HDFS中D. ElasticSearch数据可以分布在每个Shard的不同节点上24、不属于kafka应用程序场景的是()a .一般性

11、消息收集b .网站活动跟踪c .计程仪收集d .关系数据库和大型数据平台之间的数据迁移25、TDH提供了什么样的身份验证模式? ()a .使用所有服务简单身份验证模式的所有服务都可以相互网站数据库而无需身份验证b .所有服务都启用Kerberos身份验证,用户提供Kerberos principal和口令(或keytab )以网站数据库到单独的服务c .在所有服务上启用Kerberos,在探测器上启用LDAP身份验证d .在所有服务上启用LDAP身份验证26 .每个组件的运输维页面描述不正确的是()从Name Node的第50070页监视HDFS在资源管理器8180上监视在YARN上运行的塔斯

12、克用HMaster的60010监视HBase从Hue Server的第8888页计程仪入Hue27 .如果无法启动inceptor server服务,该如何查看计程仪()查看TDH manager所在的节点/var/log/inceptorsql*/目录查询下的hive-server2.log计程仪查看Inceptor server所在的节点/var/log/inceptorsql*/目录查询下的hive-server2.log计程仪检查资源管理器所在的节点/var/log/Yarn*/目录查询的yarn-yarn -资源管理器- POC-node1. log计程仪d .查看任何节点/var/

13、log/inceptorsql*/目录查询的hive-server2.log计程仪28 .以下Hadoop组件的场景应用描述正确()A. Hive主要用于建构大规模的数据存储,主要进行批量处理、统一修正分析型业务B. Hbase主要用于OLTP服务以获取查询c .电子搜索主要用于全文检索的牛鼻子词查询业务D. Spark Streaming主要用于实时数据的业务场景29、不属于以下管理职责的是()a .名称节点b.h主人c .资源管理器节点管理器30、以下哪些工作不属于集群预安装工作()a .安装集群中每个节点的执行操作系统b .选择一个节点作为管理节点,然后修改/etc/hosts文件传输管理器管理界面的安装d .集群保密工作定模式的配置【客观简单解答(每题10分,合订40分)】1 .集群有8个节点,每个节点有8个硬盘(差动奥尔特的3个拷贝)。 在一个节点上

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论