版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1.Hive查询语言和SQL的一个不同之处在于()操作A、单机(本地)模式4.写入数据到HDFS的Sink组件是()。5.在Hadoop配置文件中,以下属于core-site.xml文件主要内容的是()A、JobTrackerC、数据处理系统D、数据存储系统8.关于Flume的三大组件以下说法正确的是()。B、channel只能链接单一的source和sink。D、sink从channel消费数据并将其传递给目标地,目标地只能是hdfs。A、run11.HDFS默认备份数量是多少?()A、0B、113.HDFS退出安全模式使用的命令是?D、不确定A、缺失值处理D、D.重复数据记录处理A、5+4<=2jobhistory-daemon.shstophistoryserverA、Zookeeper25.HDFS默认的当前工作目录是/user/$USER,的值需要在哪个配置文件内说明26.以下情况除哪项发生时balancer便会自动退出()A、集群平衡或者没有数据块可以移动B、在连续三次迭代中没有块移动D、另一个balancer在运行 Singer("陈奕迅","香港")print("歌手:%s\t地区:%s"%(,singer1.area))singer2=Singer("张杰”,"中国")print("歌手:%s\t地B、歌手:陈奕迅地区:香港歌手:张杰地区:中国C、歌手:张杰地区:中国歌手:陈奕迅地区:香港D、歌手:陈奕迅地区:香港歌手:张杰地区:中国28.在Linux中,以下代码哪个可以获取arr={1,2,3,4}数组的长度:A、arr_length=^(#arr[*30.克隆虚拟机之后需要修改()文件。①/etc/udev/rules.d/70-persistent-net.rules、②/ete/sysconfig/network-31.Shufile阶段中哪一步是可选的?()32.在驱动类中,()设置输入数据的格式。A、使用方法setOutputFormatB、使用方法set0utputKeyValueC、使用方法setInputFormatD、使用方法setJarByClass34.如没有配置hadoop.tmp.dir参数,此时系统默认的临时目录为()A、Private40.分片默认()MA、127A、list()43.在Python中,下列不属于FlaA、form46.下列哪一种命令格式是不正确的()A、get表行健列族B、scan表时间戳起始行健结束行健D、put表行键列族:列值47.HBase架构的四大组件中,包含访问HBase的接口。A、Zookeeper的输出格式一样,那么可以省略下列()设置。B、job.setMapOutputKeyClass()D、以上都不能省略A、JobConf.setMaplnputKeyClC、随作业一起提交的mapper-specification.xml文件50.启动ZooKeeper服务的命令是什么?A、80容B、将基础设施(计算资源和存储)作为服务出租型58.下列关于Hadoop和Spark说法错误的是()。59.下面对Shuffle过程Combiner描述正确的是()A、FIF0Scheduler63.在Linux中,添加新用户账号的命令是()A、useraddWhichlnputFormat应该为以下的()D、Client-Server初始通信时限66.在确认客户需求,进行确认需求调研的时候,以下说法正确的是()。67.shuffle环形内存缓冲区达到()溢写68.当讨论hdfs通信的时候,通信发生在以下服务之间,下列说法正确的是。B、Client-DataNode之间,其中DataNode是客户端69.以下选项哪个命令可以生成公钥() add_(self,obj):returnself.age+obj.agea1=abc(18)a2=abc(print(a1+a2)阅读代码,选择执行结果:A、38D、Reducee与Reduce之间加载时间C、它对内存没有要求73.哪个目录存放用户密码信息:74.下列选项中那些是Hadoop2.x版本独有的进程()A、JobTrackerC、可以用来执行插入语句多台主机的集群是()模式。77.下列数据换算正确的一项为()。78.在Linux下安装NTP服务的命令是()。82.yarn-site.xml中参数和解释不能对应的是()B、yarn.nodemanager.local-dirs:多条存储路径可以提高磁盘的读写速度D、yarn.nodemanager.aux-services:需要设置的MapReduce的应用程序服务B、ReduceJoin的join操作是在MapReduce程序中的reducer阶段完成的86.在Java中,一个线程如果调用了sleep()A、notify()88.下列关于zookeeper描述正确的是:D、如果客户端连接到Zookeeper集连接到集群其他机器89.以下对定时调度器描述正确的是()90.HBase虚拟分布式模式需要()个节点?A、1D、最少3个91.大数据存储是指用存储器,以()的形式,存储采集到数据的过程。D、信息系统92.大数据平台Hadoop的组件中,提供分布式协作服务的组件是()93.在MapReduce程序中,Reducer类中包括的函数有()。A、startup、reduce、end95.关于HDFS的文件写入,正确的是()。96.在Mapper类的setup函数里,下列()方式可以用来获取参数值。A、Context.get("argNamC、context.getConfiguration.geD、context.getConfigurA、用于定义系统级别的参数,如HDFSURL、Hadoop的临时目录等。A、ObserverB、10模块C、file模块101.大数据的分布式计算使用下面哪项技术?()103.调用Zookeeper对象创建的节点,不包括()。A、0B、1A、ResourceManagerA、单机(本地)模式D、可靠性109.在Java中,阅读下列文件定入的Java代码,共有()处错误 importjava.io.*; publicclassTest10{ publicstaticvoidmain(String[]args){ Stringstr="文件写入练习"; FileWriterfw=nuFileWriter("c:\mytext.txt");//2 fw.writerToEnd(str);//#x000D;}catch(I0Exceptionex){ ex.printSt#x00OD;}OD;} 、0B、1110.下列哪些不是ZooKeeper的特点()A、顺序一致性B、原子性112.默认端口50070的作用是()。D、不确定113.在Linux中,列出所有分区信息的命令是()A、echoA、systemctllist-unit-filD、systemctlenablefA、fg119.关于ZooKeeper临时节点的说法正确的是?B、客户端程序设置的mapTask的个数C、FilelnputFormat.getSplits(JobContextjob)计算出的逻辑切片的数量二、多选题A、superD、运行在Linux平台上3.下面说法选项错误的是()6.下列选项中,属于Hive数据模式的是()。D、外部表8.Hadoop集群的整体性能主要受到什么因素影响?9.下列关于RawComparatorClass描述正确的有()比较也是在排序阶段完成的,hadoop提供了原生的比较器接口RawC用于序列化字节间的比较。用一张Hash表记录Key=Class,value=WritableComprator的注册信息。A、worker:每个worker进程都属于一个特定的TopologyB、executor:executor是产生于worker进程内部的线程C、基于实时数据流的数据处理:通常时间跨度在数十秒到数分钟之间D、基于实时数据流的数据处理:通常时间跨度在数百毫秒到数秒之间制检查点参数有两个,分别是()和()。【选两项】A、fs.checkpoint.per15.Linux系统的优势有()【选两项】A、0关系型数据库的特点描述正确的是()。A、容易理解21.Cloudera提供哪几种安装CDH的方法22.在Python中,使用Flask搭建Web项目的方式有哪些?()【选两项】A、Scala的优势是提供了REPL(Read-Eval-PrintLoop,交互式解释器),提高A、catB、抽象工厂模式D、代理模式D、可靠性:能可靠地处理流数据B、Executor中有一个BlockManager存储模块,有效减少10开销33.()是大数据运用的基础A、isA、**B、大数据存储D、多租户A、尽量保证越短越好B、可以使用汉字C、可以使用字符串41.Linux中重启系统的命令有()【选两项】42.下列对应解释正确的有()B、FloatWritable:浮点数D、Writable接口是一个序列化对象的接口,能够将数据写入流或者从流中读出。44.客户端上传文件的时候哪项是正确的?()45.对reducer基类描述正确的是()C、处理group中的所有Value,相同Key的VaValue唯一,<key,value>序46.以下说法不正确的是()【选三项】B、网络带宽不断增加D、数据量不断增大48.对mapper基类描述正确的是()49.HDFS架构是由哪些组件组成?A、命名空间的限制51.以下选项中属于数据的作用是()些特点()【选三项】53.GFS中主服务器节点存储的元数据包含这些信息()B、命名空间D、Chunk副本的位置信息B、可以使用汉字C、可以使用字符串57.客户端上传文件的时候哪项是正确的?()()配置文件需要进行修改?()()61.下列关于数据模型的描述,哪些是正确的?B、每个HBase表都由若干行组成,每个行由行键(rowkey)来标识C、列族里的数据通过列限定符(或列)来定位63.下面对Combiner描述正确的是()A、Client67.下列选项中,哪些命令可以用于查看文件内容?()A、hadoopfs-ls/hello.txtC、hadoopfs-cat/hello.D、hadoopfs-taiC、文件整理困难70.关于mapreduce自定义数据类型正确的是()C、write()序列化属性顺序和readFields()方法反序列化属性顺序必须一致。C、可以减少代码错误73.下面哪些概念是Hbase框架中使用的()75.数据化最早的根基是什么()B、数字化A、rename()D、执行器通常的任务一定会包含Map和Reduce操作三、判断题1.Slaves由主机的列表组成,每台1行,用于说明数据节点()5.Sqoop是hadoop生态圈上的数据传输工具12.每个map槽就是一个线程。()14.可以使用Partitioner定义输出的文件名()。15.数据的完整性包括数据传输的完整性和数据存储的完整性。19.Hive相比于关系型数据库,有较低的延迟。()20.Slave节点要存储数据,所以它的磁盘越大越好。()21.Map任务和Reduce任务都具有数据本地化的特性。或则会写入metadata信息并反馈clie29.Ganglia不仅可以进行监控
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 企业信息管理形成性考核册答案本科
- 会计再教育题库答案
- 企业雇佣合同
- 广西崇左市达标名校2026届中考英语考前最后一卷含答案
- 2026年企业安全生产与防灾减灾专项工作方案
- 2026届吉林省长春市第104中学中考语文对点突破模拟试卷含解析
- 江苏省南通市八校联考2026届中考历史模拟预测题含解析
- 电机与电气控制期末试卷及答案
- 2026 小儿自闭症家校共育课件
- 夫妻婚前财产协议书15篇
- 派安普利单抗注射液-临床用药解读
- 2025重庆机场集团有限公司社会招聘150人(第二次)笔试参考题库附带答案详解
- 药企消防安全培训课件
- 村镇建设科培训课件
- 元明对新疆的治理
- 室内概念方案汇报
- 东方航空合同管理制度
- T/CHES 89-2022河湖生态流量保障实施方案编制技术导则
- 腹针完整版本
- 部编人教版小学四年级下册道德与法治一课一练(含答案全一册)
- 医疗器械效期管理制度
评论
0/150
提交评论