2025年《hadoop基础练习》通关必做强化训练试题库500题及答案_第1页
2025年《hadoop基础练习》通关必做强化训练试题库500题及答案_第2页
2025年《hadoop基础练习》通关必做强化训练试题库500题及答案_第3页
2025年《hadoop基础练习》通关必做强化训练试题库500题及答案_第4页
2025年《hadoop基础练习》通关必做强化训练试题库500题及答案_第5页
已阅读5页,还剩147页未读 继续免费阅读

付费下载

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

PAGEPAGE1一、单选题1.下列关于zookeeper描述正确的是:A、无论客户端连接的是哪个Zookeeper服务器,其看到的服务端数据模型都是一致的B、从同一个客户端发起的事务请求,最终将会严格按照其发起顺序被应用到zookeeper中C、在一个5个节点组成的Zookeeper集群中,如果同时有3台机器宕机,服务不受影响D、如果客户端连接到Zookeeper集群中的那台机器突然宕机,客户端会自动切换连接到集群其他机器答案:A2.MapReduce编程模型,键值对<key,value>的key必须实现哪个接口?A、ComparableB、WritableComparableC、WritableD、LongWritable答案:B3.Shufile阶段中哪一步是可选的?()A、排序B、分区C、分组D、规约答案:D4.以下选项哪个命令可以查看主机信息(A)A、nmclidevB、nmcliconshC、ifupteam0D、teamdctlteam0st答案:A5.以下哪种不是Hive支持的数据类型?A、StructB、IntC、MapD、Long答案:D6.在Hadoop项目结构中,MapReduce指的是什么?A、分布式并行编程模型B、流计算框架C、Hadoop上的工作流管理系统D、提供分布式协调一致性服务答案:A7.下列选项哪个不是ZooKeeper的应用场景?A、Master选举B、分布式锁C、分布式协调/通知D、存储非关系型数据答案:D8.以下哪个不是Hive的用户接口模块:A、PMIB、HWI(HiveWebInterface)C、JDBC/ODBCD、ThriftServer答案:A9.在Python中,关于Python声明变量的规则错误的是A、不能用数字开头B、不能是python的关键字C、让变量名尽量有意义些D、不能带有下划线等特殊符号答案:D10.在本次项目实施中,需求调研前的准备不包括()。A、充分了解客户的要求,客户的业务,客户的关注重点。B、接到调研任务,将计划写好,立即就开始和用户沟通。C、编制确定客户需求调研计划和调研提纲。D、和客户负责人沟通,确定客户需求小组成员。答案:B11.下列不属于分布式数据库系统的是()。A、HBaseB、BigTableC、NoSQLD、SQLServer答案:D12.关于NameNode和SecondaryNameNode的说法错误的是()A、NameNode上实现的NamenodeProtocol用于二者命令通信B、数据的通信使用的是ftp协议(http协议)C、数据通信使用的是http协议D、协议的容器是jetty答案:B13.在Java中,哪个方法是实现Runnable接口必须实现的A、wait()B、run()C、stop()D、update()答案:B14.在Python中,关于CSV文件特征说法错误的是A、纯文本B、由记录组成C、每条记录被分隔符分隔为字段D、是一种使用{}和[]组成的文件格式答案:D15.下列哪种类型的文件不是HDFS集群的元数据存储格式?A、fsimageB、editsC、blk_000003425D、edits_inprogress答案:C16.下列关于HDFS的说法中,描述错误的是()。A、HDFS是Hadoop的基石B、HDFS是高容错的文件系统C、不适合部署在廉价的机器上D、能够提供高吞吐量的数据访问答案:C17.请问以下哪个命令组成是错误的?A、sbin/stop-dfs.shB、bin/hadoopfs-cat/hadoopdata/my.txtC、bin/hadoopnamenode-formatD、sbin/hdfsdfsadmin-report答案:D18.大数据的数据量现在已经达到了哪个级别?A、GBB、TBC、PBD、ZB答案:C19.下列选项中,关于HBase和BigTable的底层技术对应关系,哪个是错误的?A、GFS与HDFS相对应B、GFS与Zookeeper相对应C、MapReduce与HadoopMapReduce相对应D、Chubby与Zookeeper相对应答案:B20.下面描述正确的是()A、rwxr-x的数字表示是750。B、rw-r-x的数字表示是530。C、rw-rw-r--的数字表示是655。D、rwxr的数字表示是740。答案:D21.属于Hadoop各组件之间通信协议()A、ServerProtocolB、DatanodeProtocolC、NameProtocolD、SecondaryProtocol答案:B22.Clinet在HDFS上进行文件写入时,namenode根据文大小和配置情况,返回部分DataNode信息,谁负责将文件划分为多个block,根据DataNode的地址信息按顺序写入到每一个DataNode块A、ClinteB、NameNodeC、DataNodeD、Secondarynamenode答案:A23.下列关于MapReduce参数设置和组件的说法错误的是()。A、MapReduce中maper,combiner,reducer缺一不可B、在JobConf中InputFormat参数可以不设C、在JobConf中MapperClass参数可以不设D、在JobConf中OutputKeyComparator参数可以不设答案:A24.配置机架感知的下面哪项正确?A、都正确B、MapReduce会根据机架获取离自己比较近的网络数据C、写入数据的时候会写到不同机架的DataNodeD、如果一个机架出问题,不会影响数据读写答案:A25.在Python中,关于import引用,以下选项中描述错误的是A、import保留字用于导入模块或者模块中的对象B、使用importturtle引入turtle库C、使用importturtleast引入turtle库,取别名为tD、可以使用fromturtleimportsetup引入turtle库答案:D26.在Java中,若要创建一个新的含有父目录的目录,应该使用下列哪一个类的实例A、FileWriterB、FileOutputStreamC、FileD、以上都对答案:C27.关于hadoop集群描述正确的是()A、hadoop集群组件之间通过RPC通信协议B、hadoop集群NameNode节点越多越好C、hadoop集群使用Namenode存储元数据D、以上都正确答案:A28.Namenode在启动时自动进入安全模式,在安全模式阶段,说法错误的是?A、安全模式目的是在系统启动时检查各个DataNode上数据块的有效性B、文件系统允许有修改C、根据策略对数据块进行必要的复制或删除D、当数据块最小百分比数满足的最小副本数条件时,会自动退出安全模式答案:B29.下列说法错误的是?A、HadoopMapReduce是MapReduce的开源实现,后者比前者使用门槛低很多B、MapReduce采用非共享式架构,容错性好C、MapReduce主要用于批处理、实时、计算密集型应用D、MapReduce采用“分而治之”策略答案:C30.在Python中Excel解析,读写操作分别需要安装的模块是A、读使用xlwt模块,写使用xlrd模块B、写使用xlwt模块,读使用xlrd模块C、读使用read模块,写使用write模块D、读使用write模块,写使用read模块答案:B31.Hadoop序列化的特点有()。A、紧凑、快速、互扩展、互操作B、紧凑、快速C、互扩展D、互操作答案:A32.启动HDFS的命令是()A、start-dfs.shB、Start-yarn.shC、start-hdfs.shD、dfs-start.sh答案:A33.MapReduce的Shuffle过程以下中哪个操作是最后做的?A、合并B、排序C、分区D、溢写答案:A34.Sqoop是Hadoop和关系数据库服务器之间传送数据的工具,下列哪种数据库是不支持使用Sqoop直接进行数据传送()A、PostgresB、OracleC、MySQLD、Redis答案:D35.日志消息的级别中那个是不会影响系统但值得注意()A、ALEKKTB、CRITC、NOTICED、DEBUG答案:C36.5)大数据一词是在哪一年由美国著名未来学家阿尔文·托夫勒在《第三次浪潮》中将大数据称为“第三次浪潮的华彩篇章”()A、1978B、1980C、1983D、1990答案:B37.在Java中,设计模式的两大主题是A、系统的维护与开发B、对象组合与类的继承C、系统架构与系统开发D、系统复用与系统扩展答案:D38.下列关于MapReduce计算原理叙述不正确的一项是________。A、将大数据集划分为小数据集,小数据集划分为更小数据集B、将最终划分的小数据分发布到集群节点上C、以串行的方式完成计算处理D、将计算结果递归融汇,得到最后的结果答案:C39.在Kafka中使用()命令来创建生产者。A、kafka-console-producer.shB、kafka-console-consumer.shC、kafka-topics.shD、kafka-producer-console.sh答案:A40.在Storm的软件架构中,______运行在工作节点(称为node)上的控制程序,监听本地机器的状态,接受Nimbus指令管理本地的Worker进程。A、主控程序NimbusB、集群调度器ZookeeperC、工作节点控制程序SupervisorD、工作进程Worker答案:C41.在Java中,关于Xml描述错误的是A、Xml是可扩展标记语言B、Xml主要用于提供数据表述格式C、Xml的可扩展性不强D、Xml主要用于不同应用程序间的数据交换答案:C42.下面与HDFS类似的框架是?A、NTFSB、FAT32C、GFSD、EXT3答案:C43.以下选项哪个命令可以生成公钥()A、ssh-keygenB、ifupteam0C、nmclidevD、nmcliconsh答案:A44.下面哪个目录保存了Hadoop集群的命令(比如启动Hadoop)?A、binB、sbinC、etcD、share答案:B45.关于文档数据库的说法,下列哪一项是错误的?A、数据是规则的B、性能好(高并发)C、缺乏统一的查询语法D、复杂性低题答案:A46.下列()不是非关系型数据库。A、HBaseB、RedisC、HiveD、MongoDB答案:C47.相比依赖于小数据和精确性的时代,大数据因为更强调数据的(),帮助我们进一步接近事实的真相。A、安全性B、完整性C、混杂性D、完整性和混杂性答案:D48.在Linux中,以下代码哪个可以删除arr={1,2,3,4}数组的下标为1的元素:A、deletearr[1]B、droparr[1]C、unsetarr[1]D、truncatearr[1]答案:C49.下列描述中,哪项不属于Sqoop的缺点()A、无法控制任务的并发度B、格式紧耦合C、安全机制不够完善D、connector必须符合JDBC模型答案:A50.在Java中,线程调用了sleep()方法后,该线程将进入()状态A、可运行状态B、运行状态C、阻塞状态D、终止状态答案:C51.HBase与下列哪个选项属于同一种类型的数据库()A、MongoDBB、MariaDBC、MySQLD、Oracle答案:A52.HDFS是基于流数据模式访问和处理超大文件的需求而开发的,默认的最基本的存储单位是64M,具有高容错、高可靠性、高扩展性、高吞吐率等特征,适合的读写任务是A、一次写入,少次读写B、多次写入,少次读写C、一次写入,多次读写D、多次写入,多次读写答案:C53.HDFS有一个LZO(withindex)文件大小75MB,客户端设置Block大小为64MB。当运行mapreduce任务读取该文件时inputsplit大小为?A、一个map读取64MB,另外一个map读取11MBB、64MBC、75MBD、128MB答案:A54.在Python中,面向对象中的特殊成员以及应用场景描述正确的是:A、__del__析构方法,对应着一个对象的删除之后执行的内容B、__del__析构方法,对应着一个对象的删除之前执行的内容C、__repr__:和repr()%r不相关,但在没有__str__方法时,__repr__可以完全取代__str__。D、__repr__:和repr()%r都是息息相关的,在没有__str__方法时,__repr__不可以完全取代__str__。答案:B55.关于HDFS的文件写入,正确的是_________。A、支持多用户对同一文件的写操作B、用户可以在文件任意位置进行修改C、默认将文件复制成三份存放D、复制的文件块默认存在同一机架上答案:C56.HBase依赖()提供消息通信机制A、ZookeeperB、ChubbyC、RPCD、Socket答案:A57.MapReduce自定义排序规则需要重写下列那项方法A、readFields()B、compareTo()C、map()D、reduce()答案:B58.Zookeeper启动时会最多监听几个端口()A、1B、2C、3D、4答案:B59.HDFS集群中的DataNode的主要职责是?A、负责保存客户端上传的数据B、维护HDFS集群的目录树结构C、维护HDFS集群的所有数据块的分布、副本数和负载均衡D、响应客户端的所有读写数据请求答案:A60.关于基于Hadoop的MapReduce编程的环境配置,下面哪一步是不必要的()A、安装linux或者在Windows下安装CgywinB、安装javaC、安装MapReduceD、配置Hadoop参数答案:C61.MapReduce框架提供了一种序列化机制,支持这种序列化的类能够在Map和Reduce过程中充当键或值,以下说法错误的是?A、实现Writable接口的类是值B、实现WritableComparable<T>接口的类可以是值或键C、键和值的数据类型可以超出Hadoop自身支持的基本类型D、Hadoop的基本类型Text并不实现WritableComparable<T>接口答案:D62.在Python程序中,关于异常捕捉说法正确的是A、except后面必须带异常类型B、except后面可以不带任何异常类型C、except后面带异常类型才能捕捉所有异常D、except后面不带任何异常类型也可以识别出具体的异常信息答案:B63.在Python函数中,用于获取用户输入的是A、input()B、print()C、eval()D、get()答案:A64.在Java中,程序如果要按行输入/输出文件中的字符,最合理的方法是采用A、ObjectInputStream和ObjectOutputStream类B、InputStream和OutputStream类C、FileReader和FileWriter类D、FileInputStream和FileInputStream类答案:C65.Hadoop中节点之间的进程通信是通过什么协议来实现的()A、HTTPB、SMTPC、SSHD、RPC答案:D66.在Java中,使用Dom4j为Xml文档的节点添加内容,正确的是A、节点.setText("内容");B、节点.addText("内容");C、节点.addContent("内容");D、节点.setContent("内容");答案:A67.关于shuffle阶段中描述错误的是()A、shuffle可以分为mapshuffle和reduceshuffle。B、Shuffle中可以排序C、Shuffle中有可能有combiner、partition过程。D、Shuffle中一定不会有压缩过程。答案:D68.下列关于MPI叙述不正确的一项是________。A、MPI是一个信息传递应用程序的接口B、MPI程序经常在共享内存的机器上使用C、MPI并行计算增加高层并行编程模型D、MPI缺少统一的计算框架支持答案:C69.典型的NoSQL数据库是(C)A、HiveB、MySQLC、HbaseD、Oracle答案:C70.下列选项描述错误的是?A、HadoopHA即集群中包含SecondaryNameNode作为备份节点存在。B、ResourceManager负责的是整个Yarn集群资源的监控、分配和管理工作C、NodeManager负责定时的向ResourceManager汇报所在节点的资源使用情况以及接收并处理来自ApplicationMaster的启动停止容器(Container)的各种请求。D、初次启动HadoopHA集群时,需要将格式化文件系统后的目录拷贝至另外一台NameNode节点上。答案:A71.关干HiveSQL运行原理,描述不正确的选项有?(A)A、所有HQL都会转化为MapReduce任务执行B、DDL语句不提交任务到MapReduce,而是直接操作元数据C、对于selectcount(*)fromtable操作,一定会启reduce任务D、对于select*fromtable语句不会启MapReduce答案:A72.客户端从Zookeeper获取Region的存储位置信息后,直接在_______上读写数据。A、ZookeeperB、HMasterC、RegionServerD、HLog答案:C73.大数据应用需依托的新技术有A、大规模存储与计算B、B.数据分析处理C、C.智能化D、D.三个选项都是答案:D74.Combiner不适合哪一种操作?()A、最大值B、求和C、平均值D、计数答案:C75.从节点程序__________。A、NameNodeB、DataNodeC、SecondaryNameNodeD、Jobtracker答案:B76.Client端上传文件的时候下列哪项正确?A、数据经过NameNode传递给DataNodeB、Client只上传数据到一台DataNode,然后由NameNode负责Block复制工作C、Client端将文件切分为Block,依次上传D、以上都不正确答案:C77.默认端口50070的作用是()。A、查看HDFS监控B、查看YARN监控C、查看日志监控D、不确定答案:A78.下列关于Hadoop数据校验说法错误的是()。A、“校验和”本身也是数据,也有可能出现损坏B、DataBlockScanner是作为DataNode的后台线程工作的C、对pipeline的中的第一个DataNode检查校验和D、数据完整性包括数据传输的完整性和数据存储的完整性答案:C79.在Python中,网络框架Flask是()A、支持快速建站的框架B、企业级开发框架C、高并发处理框架D、以上全都不是答案:A80.以下哪个不是HDFS的进程()A、SecondaryNodeB、NameNodeC、ResourceManagerD、DataNode答案:C81.以下描述错误的是?A、TextInputFormat的key是指该记录在文件中的行号B、SequenceFile可以用来作为小文件的合并存储容器C、TextInputFormat的key是LongWritable类型的D、CombineFileInputFormat是抽象类答案:A82.下列关于Storm设计思想,描述有误的是?A、Storm将Streams的状态转换过程抽象为SpoutB、Storm认为每个Stream都有一个源头,并把这个源头抽象为SpoutC、Storm将Spouts和Bolts组成的网络抽象成TopologyD、Topology里面的每个处理组件(Spout或Bolt)都包含处理逻辑,而组件之间的连接则表示数据流动的方向答案:A83.在Python中,Python中类的定义正确的是A、classPhone:name=""call(self,name)print(name,"打电话")B、classPhone:name=""call(self,name)print(name,"打电话")C、classPhone:name=""defcall(self,name):print(name,"打电话")D、classPhonename=""defcall(self,name):print(name,"打电话")答案:C84.在Python中,阅读代码,选择结果:classPerson:"人的类"name=""age=0defeat(self):print(,"正在吃饭")classStudent():"学生类"defstudy(self):print(,"正在学习")per1=Person()="张三"per1.eat()A、张三正在吃饭小明正在学习B、张三正在吃饭C、无语法错误,但不能输出结果D、代码非法,不能解释答案:B85.OSI网络模型有几层结构?A、六层B、七层C、八层D、九层答案:B86.SequenceFile用于合并HDFS中的大量小文件,下列关于SequenceFile的描述错误的是()。A、在SequenceFile中,每一对被看作一条RecordB、记录压缩是对每条记录进行压缩C、SequenceFile主要是由一个Header和多个Record组成D、Header中包含存储压缩算法答案:A87.下面与HDFS类似的框架是?A、NTFSB、FAT32C、GFSD、EXT3答案:C88.下列关于列族数据库的描述,哪一项是错误的?A、查找速度慢,可扩展性差B、功能较少,大都不支持强事务一致性C、容易进行分布式扩展D、复杂性低答案:A89.下列关于MapReduce的基本思想叙述不正确的一项是_________。A、对相互间具有计算机以来关系的大数据进行分而治之。B、用Map和Reduce两个函数提供了高层并行编程抽象模型。C、提供了同一框架D、为程序员隐藏系统细节答案:A90.哪个不是Hive适用的场景?()A、实时的在线数据分析B、数据挖掘(用户行为分析,兴趣分区,区域展示)C、数据汇总(每天/每周用户点击数,点击排行)D、非实时分析(日志分析,统计分析)答案:A91.以下关于新旧MapReduceAPI的描述错误的是?A、新API倾向于使用接口方式,而旧API倾向于使用抽象类B、新API放在org.apache.hadoop.mapreduce包中,而旧API则是放在org.apache.hadoop.mapred中C、新API使用Configuration,而旧API使用JobConf来传递配置信息D、新API可以使用Job对象来提交作业答案:A92.Yarn资源管理器是由哪些组件所组成?A、ResourceManagerB、SchedulerC、MapreduceD、HDFS答案:A93.以下哪一项不属于Hadoop可以运行的模式()A、单机模式B、伪分布式模式C、互联模式D、分布式模式答案:C94.在Linux中,查看已启动的服务列表的命令是A、systemctllist-unit-files|grepenabledB、systemctlis-enabledfirewalldC、systemctldisablefirewalldD、systemctlenablefirewalld答案:A95.对DBInputFormat描述不正确的是?A、DBInputFormat类能够读取数据库表中数据B、Hadoop访问关系型数据库主要通过DBInputFormat对象实现C、使用DBInputFormat之前,必须要jdbc驱动包拷贝到Hadoop目录下的share/hadoop/common/libD、DBInputFormat接口仅仅适合读取大数量的数据答案:D96.下列_______通常与NameNode在一个节点启动。A、SecondaryNameNodeB、DataNodeC、TaskTrackerD、Jobtracker答案:D97.在Java中,下列关于线程的说法正确的是A、线程就是进程B、线程是进程中最小的执行单元C、一个线程可以同时执行多个任务D、在单处理器和多处理器上多个线程不可以并发执行答案:B98.对于GFS架构,下面哪个说法是错误的?A、GFSMaster节点管理所有的文件系统所有数据块。B、GFS存储的文件都被分割成固定大小的块,每个块都会被复制到多个块服务器上(可靠性)。块的冗余度默认为3。C、CFSMaster还管理着系统范围内的活动,比如块服务器之间的数据迁移等D、GFSMaster与每个块服务器通信(发送心跳包),发送指令,获取状态答案:A99.在Java中,如果要完成一个视频文件的拷贝,应该使用哪一组流对象进行配合A、FileInputStream和FileOutputStreamB、FileReader和FileWriterC、BufferedReader和BufferedWriterD、ObjectInputStream和ObjectOutputStream答案:A100.下列选项中,哪一个命令用于删除文件?A、hadoopB、hadoopC、hadoopD、hadoop答案:B101.非关系型数据库不包括()。A、HBaseB、MapreduceC、Neo4jD、MongoDB答案:B102.在Java中,java.io包的File类是A、字符流类B、字节流类C、对象流类D、非流类答案:D103.把公钥追加到授权文件的命令是?A、ssh-copy-idB、ssh-addC、ssh-addD、ssh-keygen答案:A104.大数据的价值是通过数据共享、()后获取最大的数据价值A、算法共享B、B.共享应用C、C.数据交换D、D.交叉复用答案:C105.在MapReduce中,________阶段,Mapper执行maptask,将输出结果写入中间文件。A、ShuffleB、MapC、ReduceD、Sort答案:B106.在Java中,假如电脑上E盘没有xxx目录,则下面程序功能描述正确是
Filefile1=newFile("e:\\xxx\\yyy");file1.mkdir()A、在当前目录下生成子目录:\xxx\yyyB、在E盘自动创建xxx/yyy目录C、在当前目录下生成文件xxx.yyyD、代码执行后E盘不会产生任何目录答案:D107.关于SecondaryNameNode哪项是正确的?A、它对目的是帮助NameNode合并编辑日志,减少NameNode的负担和冷启动时的加载时间B、它是NameNode的热备C、它对内存没有要求D、SecondaryNameNode应与NameNode部署到一个节点答案:A108.分片默认()MA、127B、128C、129D、130答案:B109.在Python中,文件读取必须先使用Python内置的什么函数打开一个文件,创建一个file对象A、read()B、write()C、make()D、open()答案:D110.下列关于MapReduce的特性叙述正确的一项是_________。A、自动实现分布式串行计算B、自动实现分页式并行计算C、容错,提供状态监控工具D、不容错,提供状态监控工具答案:C111.在执行一个job时,如果这个job的输出路径已经存在,那么程序会()。A、覆盖这个输出路径B、抛出警告,但是能够继续执行C、抛出一个异常,然后退出D、创建一个新的输出路径答案:C112.在Kafka中使用()命令来创建生产者。A、kafka-console-producer.shB、kafka-console-consumer.shC、kafka-topics.shD、kafka-producer-console.sh答案:A113.在Python中,关于Python语言的特点,以下选项描述正确的是A、Python语言是解释型语言B、Python语言不支持面向对象C、Python语言是编译型语言D、Python语言是非跨平台语言答案:A114.下列哪个不属于Hadoop的特性?A、成本高B、高可靠性C、高容错性D、运行在Linux平台上答案:A115.在MapReduce计算架构中,_________组件属于hadoop的软件模块。A、ClientB、JobTrackerC、TaskTrackerD、Task答案:A116.关于Hive与Pig的比较正确的一项为________。A、Pig更适合于数据呈现的工作B、Pig能对中小规模的数据进行迭代处理C、Hive更适合做数据准备阶段的工作D、Hive会按照用户所需要的形式呈现答案:D117.DataNode默认存放目录为()A、/opt/hadoop-record/softB、/home/hadoop-record/dataC、/home/hadoop-record/softD、/opt/hadoop-record/data答案:D118.在Java中,下面关于线程优先级的说法中,正确的是A、线程的优先级是不能改变的B、优先级高的线程只是在执行时优先的概率比较大,不是一定的C、优先级越高的线程运行速度比优先级低的执行更快,占用资源更少D、优先级高的线程一定是优先执行的答案:B119.在shuffle过程中,圆形缓冲区的内存达到一定数值将执行溢写操作,这个数值的大小是()A、100B、90C、80D、60答案:C120.关于HBase的三层结构中各层次的名称和作用的说法,哪个是错误的?A、Zookeeper文件记录了用户数据表的Region位置信息B、-ROOT-表记录了.META.表的Region位置信息C、META.表保存了HBase中所有用户数据表的Region位置信息D、Zookeeper文件记录了-ROOT-表的位置信息答案:A121.下列哪个不属于物联网的应用?A、智能物流B、智能安防C、环保监测D、数据清洗答案:D122.ResourceManager对web服务提供地址,用户可通过Ip地址:()在浏览器中查看集群各类信息A、8088B、8033C、8080D、8032答案:A123./etc/shadow文件中存放:A、用户账号基本信息B、B.用户口令的加密信息C、C.用户组信息D、D.文件系统信息答案:B124.在Python中,以下选项中可访问字符串s从右侧向左第三个字符的是A、s[3]B、s[:-3]C、s[-3]D、s[0:-3]答案:C125.HDFS默认备份数量?()A、0B、1C、2D、3答案:D126.下列哪项通常是集群的最主要的性能瓶颈A、CPUB、网络C、磁盘D、内存答案:C127.将关系型数据库中的数据导入到Hadoop平台的工具是()。A、importB、exportC、overwriteD、drop答案:A128.下列关于MapReduce说法不正确的是()A、MapReduce是一种计算框架B、MapReduce来源于Google的学术论文C、MapReduce程序只能用Java语言编写D、MapReduce隐藏了并行计算的细节,方便使用答案:C129.Zookeeper启动时会最多监听几个端口()A、1B、2C、3D、4答案:B130.下列哪个属性是hdfs-site.xml中的配置A、fs.defaultFSB、dfs.replicationC、D、yarn.resourcemanager.address答案:B131.Hive查询语言和SQL的一个不同之处在于()操作A、GroupbyB、JoinC、PartitionD、Union答案:C132.下列哪个程序通常与NameNode在一个节点启动?()A、SecondaryNameNodeB、DataNodeC、TaskTrackerD、Jobtracker答案:D133.MapReduce中哪一种文件输入格式可以自动切割并合并小文件?()A、NLinelmputFormatB、TextInputFormatC、CombineFileInputFormatD、KeyValueTextInputFormat答案:C134.在MapReduce程序中,Mapper模块中的自定义类MyMapper继承自()父类。A、MapperB、ReducerC、CombinerD、Partitioner、答案:A135.下面哪项是Hadoop的作者?A、MartinFowlerB、DougcuttingC、MarkElliotZuckerbergD、KentBeck答案:B136.下面哪一项不属于计算机集群中的节点?A、主节点(MasterNode)B、源节点(SourceNode)C、名称结点(NameNode)D、从节点(SlaveNode)答案:B137.下列选项中不是大数据计算体系的基本层次的一项为______。A、数据应用系统B、数据开发系统C、数据处理系统D、数据存储系统答案:B138.针对每行数据内容为”TimestampUrl”的数据文件,在用JobConf对象conf设置conf.setInputFormat(WhichInputFormat.class)来读取这个文件时,WhichInputFormat应该为以下的A、TextInputFormatB、KeyValueTextInputFormatC、SequenceFileInputFormatD、NLineInputFormat答案:B解析:四项主要的InputFormat类。KeyValueTextInputFormat以每行第一个分隔符为界,分隔符前为key,之后为value,默认制表符为\t139.哪个不是mapreduce运行的时候分的部分?()A、input,outputB、map,reduceC、shuffleD、hdfs答案:D140.关于ZooKeeper的说法错误的是?A、ZooKeeper是一个高可用的分布式数据管理和协调框架B、能够很好的保证分布式环境中数据的一致性C、越来越多的分布式系统(Hadoop、HBase、Kafka)中使用ZooKeeperD、Hadoop的高可用不需要用到ZooKeeper答案:D141.在Java中,哪个关键字可以实现线程同步A、transientB、synchronizedC、serializeD、static答案:B142.HBase架构的四大组件中,_______包含访问HBase的接口。A、ZookeeperB、MasterC、RegionServerD、Client答案:D143.在分布式并行计算体系中,________采用一个指令流处理单个数据流。A、SISDB、SIMDC、MISDD、MIMD答案:A144.在Java中,简单工厂模式描述错误的是A、简单工厂模式由于使用了静态工厂方法,造成工厂角色无法形成基于继承的等级结构。B、违反了开闭原则,一旦新增产品必须修改原有代码。C、引入新的工厂,会减少系统的复杂性和理解难度。D、实现了创建对象和使用对象的分离。答案:C145.ZooKeeper的特点不包括()A、顺序一致性B、原子性C、可靠性D、复合系统映像答案:D146.一个gzip文件大小75MB,客户端设置block大小为64MB,请问其占用几个block()A、1B、2C、3D、4答案:B147.在Java中,以下什么情况适合使用单例模式A、确保某个对象在程序运行过程中有且仅有一个时B、隐藏对象的创建细节时C、对象创建过程极其复杂时D、类中所有方法都是静态方法时答案:A148.下列选项中,哪一个不属于Zookeeper应用?()A、数据发布和订阅B、负载均衡C、配置管理D、数据仓库答案:D149.关于ZooKeeper的说法错误的是?A、ZooKeeper不存在单点故障的情况B、ZooKeeper服务端有两种重要的角色是Leader和FollowerC、ZooKeeperLeader挂掉之后会自动在其他机器选出新的LeaderD、客户端可以连接到ZooKeeper集群中任一台机器答案:A150.在Linux中,以下哪种不是shell脚本的执行方式?A、作为可执行程序B、使用start命令启动C、作为解释器参数D、使用source命名执行答案:B151.关于FsShell的说法,下面哪一项是正确的()A、FsShell和UNIX系统中的shell一样功能强大B、FsShell实际上是一个Java应用程序C、可以在FsShell中执行HDFS文件系统中的可执行文件D、FsShell实际上是调用UNIX的shell命令来实现复制操作答案:B152.关于SecondaryNameNode哪项是正确?A、它是NameNode的热备B、它对内存没有要求C、它的目的是帮助NameNode合并编辑日志,减少NameNode启动时间D、SecondaryNameNode应与NameNode部署到一个节点答案:C153.下列哪一个不属于HDFS1.0中存在的问题A、无法水平扩展B、单点故障问题C、单一命名空间D、系统整体性能受限于单个名称节点的吞吐量答案:A154.下列选项中不是hadoop特点的是_____。A、可靠性B、扩容能力C、高效率D、成本高答案:D155.关于Shuffle过程描述正确的是()A、一个MapTask任务可以对应多个环形缓冲区B、一个MapTask任务只能对应一个个环形缓冲区C、Shuffle过程环形缓存默认大小值为20MBD、Shuffle过程只有MapTask阶段操作答案:B156.MapReduce将整个并行计算过程抽象到那两个函数()A、mapsreduceB、mapreduceC、mapreducesD、mapsreduces答案:B157.()是检查系统对非法侵入的防范能力。A、功能测试B、性能测试C、安全测试D、验收测试答案:D158.在Python中,OS模块返回指定目录下的所有文件和目录名的函数是A、os.remove()B、os.listdir()C、os.path.isfile()D、os.getcwd()答案:B159.在Linux系统中新增一个新组group2,同时指定新组的组标识号是101,命令是()A、groupadd-r101group2B、groupadd-o101group2C、groupadd-g101group2D、groupadd-p101group2答案:C160.下列关于数据处理流程,说法有误的是?A、在传统的数据处理流程中,存储的数据是旧的B、在传统的数据处理流程中,需要用户主动发出查询来获取结果C、传统的数据处理流程,需要先采集数据并存储在关系数据库等数据管理系统中D、流计算的处理流程一般包含三个阶段:数据实时采集、数据批量计算、实时查询服务答案:D161.shuffle的意思是()A、沙发B、洗牌C、拆分D、散乱答案:B162.在Java中,Xml的全称是A、UnifiedModelingLanguageB、HypertextMarkupLanguageC、ExtensibleMarkupLanguageD、ExperimentalMarkupLanguage答案:C163.大数据的4V特征是指?A、数据量大(Volume)、类型繁多(Variety)、价值密度低(Value)、处理速度快(Velocity)B、数据量大(Volume)、类型繁多(Variety)、价值密度低(Value)、技术发展速度快(Velocity)C、数据量大(Volume)、类型繁多(Variety)、价值密度高(Value)、数据产生速度快(Velocity)D、数据量大(Volume)、类型繁多(Variety)、价值密度低(Value)、数据变化速度快(Velocity)答案:A164.面关于MapReduce模型中Map函数与Reduce函数的描述正确的是()A、一个Map函数就是对一部分原始数据进行指定的操作B、一个Map操作就是对每个ReD.uce所产生的一部分中间结果进行合并操作C、Map与Map之间不是相互独立的D、Reducee与Reduce之间不是相互独立的答案:A165.在Java中,某个资源读取非常消耗时间,为了减少重复读取资源造成的性能低下,可以采用下列A、简单工厂模式B、普通工厂模式C、单例模式D、静态工厂模式答案:C166.配置Hadoop环境变量修改()文件A、vi/etc/profileB、vi/etc/profilesC、vi/etc/hostsD、vi~/input/data答案:A167.HFile数据格式中的Data字段用于()。A、存储实际的KeyValue数据B、存储数据的起点C、指定字段的长度D、存储数据块的起点答案:A168.在Java中,下面不是单例模式要点的是A、单例类只能一个人使用。B、单例类必须自行创建唯一的实例。C、单例类的构造方法可以是public的。D、单例模式会阻止其他对象实例化其自己的单例对象的副本。答案:D169.配置Hadoop时,JAVA_HOME包含在哪一个配置文件中?A、hadoop-default.xmlB、hadoop-env.shC、hadoop-site.xmlD、configuration.xml答案:B170.下列关于Map和Reduce函数的描述,哪个是错误的?A、Map将小数据集进一步解析成一批<key,value>对,输入Map函数中进行处理B、Map每一个输入的<k1,v1>会输出一批<k2,v2>。<k2,v2>是计算的中间结果C、Reduce输入的中间结果<k2,List(v2)>中的List(v2)表示是一批属于不同k2的valueD、Reduce输入的中间结果<k2,List(v2)>中的List(v2)表示是一批属于同一个k2的value答案:C171.在流计算系统模型中,分布式系统常用____________来表征计算流程或计算模型。A、无项循环图B、有向循环图C、无向非循环图D、有向非循环图答案:D172.启动所有的Hadoop守护进程。包括NameNode、SecondaryNameNode、DataNode、ResourceManager、NodeManager的命令是()A、start-yarn.shB、start-all.shC、start-dfs.shD、hadoop-daemons.sh答案:B173.使用root用户解压Flume安装包到“/usr/local/src”路径,以下哪条是正确的命令()。A、[root@master~]#tarzxvf/opt/software/apache-flume-1.6.0-bin.tar.gz/usr/local/srcB、[hadoop@master~]#tarzxvf/opt/software/apache-flume-1.6.0-bin.tar.gz-C/usr/local/srcC、[root@master~]#tarzxvf/opt/software/apache-flume-1.6.0-bin.tar.gz-C/usr/local/srcD、[root@master~]#unzip/opt/software/apache-flume-1.6.0-bin.tar.gz-C/usr/local/src答案:C174.在Python中,用来判断当前Python语句在分支结构中的是A、引号B、冒号C、大括号D、缩进答案:D175.在Hadoop官方的示例程序包hadoop-maprecduceexamples-2.6.4.jar中,封装了一些常用的测试模块。可以获得文件中单词长度的中位数的模块是(C)。A、wordcountB、wordmeanC、wordmedianD、wordstandarddeviation答案:C176.在确认客户需求,进行确认需求调研的时候,以下说法正确的是()。A、.按计划有步骤的确定客户需求调研。B、先了解细节需求,再了解宏观需求C、将客户的想法记录下来,就能解决客户的实际问题D、确定客户需求调研的过程中,不可避免的会出现客户提出一些现有条件下根本无法实现或者即使实现也非常困难的要求,我们要无条件去满足客户的需求。答案:A177.在HBase数据模型中,列必须用______来定义。A、键B、族C、单元格D、时间戳答案:B178.以下()文件中主要用来配置ResourceManager,NodeManager的通信端口,web监控端口等。A、core-site.xmlB、mapred-site.xmlC、hdfs-site.xmlD、yarn-site.xml答案:D179.在Java中,下列不属于线程生命周期状态的是A、新建状态B、可运行状态C、运行状态D、解锁状态答案:D180.MapReduce流程有______各阶段。A、三B、二C、四D、五答案:A181.在Python中,可以采用“模块”的方式来组织代码,以下描述正确的是:A、使用模块可能导致函数名和变量名冲突。B、相同名字的函数和变量完全可以分别存在不同的模块中。C、相同名字的函数和变量完全可以存在相同同的模块中。D、不同名字的函数和变量必须分别存在不同的模块中。答案:B182.在Java中,使用客户端套接字Sockt创建对象时,需要指定A、服务器主机名和端口B、服务器端口和文件C、服务器名和文件D、服务器地址和文件答案:A183.在命令模式中,以下那个命令不会进入输入模式?A、qB、oC、iD、a答案:A184.启动集群的顺序为()。①start-dfs.sh、②start-yarn.sh、③mr-jobhistory-daemon.shstarthistoryserverA、①②③B、②①③C、③②①D、③①②答案:A185.Hadoop2.x版本中的数据块大小默认是多少?()A、64MB、128MC、256MD、512M答案:B186.以下哪个组件可以指定对key进行Reduce分发的策略?A、RecordReaderB、CombinerC、PartitionerD、FileInputFormat答案:C187.关于HiveSQL基本操作描述正确的是?(A)A、创建外部表时需要指定external关键字B、一旦表创建好,不可再修改表名C、一旦表创建好,不可再修改列名D、一旦表创建好,不可再增加新列答案:A188.HadoopStreaming支持脚本语言编写简单MapReduce程序,以下是一个例子:Bin/hadoopjarcontrib/streaming/hadoop-0.20-streaming.jar-inputinput/filename-outputoutput-mapper‘dosth.py5’-filedosth.py-Dmapred.reduce.tasks=1以下说法不正确的是A、HadoopStreaming使用Unix中的流与程序交互B、HadoopStreaming允许我们使用任何可执行脚本语言处理数据流C、采用脚本语言时必须遵从UNIX的标准输入STDIN,并输出到STDOUTD、Reduce没有设定,上述命令运行会出现问题答案:D189.Kafka的设计初衷不包括()A、处理海量日志B、用户行为统计C、网站运营统计D、数据转换答案:D190.key与value之间的分隔符,默认的情况是()A、/rB、/tC、/fD、空格答案:B191.在MapReduce任务中,下列哪一项会由hadoop自动排序?A、keysofmapper'soutputB、valuesofmapper'soutputC、keysofreducer'soutputD、valuesofreducer'soutput答案:A192.下列哪些操作可以设置一个监听器Watcher()A、getDataB、getChildrenC、existsD、setData答案:D193.大数据平台Hadoop的组件中,提供分布式协作服务的组件是()A、HBaseB、ZooKeeperC、SqoopD、Hive答案:B194.对于Hive中的分区(partition)概念,如下描述错误的是?()A、分区字段要在创建表时定义B、分区字段只能有一个,不可以创建多级分区C、使用分区,可以减少某些查询的数据扫描范围,进而提高查询效率D、分区字段可以作为where字句的条件答案:B解析:多选题(共13题,10.4分)195.LSM的读操作和写操作是独立的?A、是。B、否。C、LSM并不区分读和写D、LSM中读写是同一种操作答案:A196.下列关于HBase数据模型叙述不正确的一项是_______。A、表有单元格组成B、一个表可以包含若干个列族C、一个列族内可用列限定符来标志不同的列D、存于表中单元的数据尚需打上时间戳答案:A197.HDFS中的文件块默认保存()份。A、1B、2C、3D、不确定答案:C198.下面哪个目录保存了Hadoop集群的命令(比如启动Hadoop)?A、binB、sbinC、/etcD、share答案:B199.Linux下启动HDFS的命令是(C)A、HdfsB、startdfsC、start-dfs.shD、start-dfs.cmd答案:C200.通过浏览器界面监控Hive的状态,以下是查看的端口()A、http://master:8088B、:50070C、http://master:16010D、http://master:9999答案:D201.以下选项哪个可以修改文件或目录的访问权限()A、passwdB、suC、chmodD、useradd答案:C202.在HDFS中,默认一个块多大?A、64MBB、32KBC、128KBD、16KB答案:A203.端口50070默认是Hadoop哪个服务的端口?A、NameNodeB、DataNodeC、SecondaryNameNodeD、Yarn答案:A204.hadoop集群之间的机器是用过()协议来进行通信和协调工作的。A、HTTPB、HTTPSC、SSHD、ClientProtocol答案:C205.下列哪项通常是集群的最主要瓶颈()。A、CPUB、网络C、磁盘IOD、内存答案:C206.在Storm的软件架构中,______运行在主节点上,是整个流计算集群的控制核心,总体负责topology的提交、运行状态监控、负载均衡及任务重新分配等。A、主控程序NimbusB、集群调度器ZookeeperC、工作节点控制程序SupervisorD、工作进程Worker答案:A207.HDFS有一个LZO(withindex)文件大小75MB,客户端设置Block大小为64MB。当运行mapreduce任务读取该文件时inputsplit大小为?A、64MBB、75MBC、一个map读取64MB,另外一个map读取11MBD、没有读取到答案:C208.运行WordCount命令()A、$hadoopjarhadoop-examples-25.0jarwordcount/data/input/data/outputB、$hadoopfs-hadoop-examples-25.0jarwordcount/data/input/dataloutputC、$hadoopfs-hadoop-examples-25.0/jarwordcount/data/input/data/outputD、$hadoopjarhadoop-examples-2.5.0/jarwordcount/data/input/dataloutput答案:A209.下列哪个不属于NoSQL数据库的特点?A、灵活的可扩展性B、灵活的数据模型C、与云计算紧密融合D、数据存储规模有限答案:D210.MapReduce1.0的体系结构中,JobTracker是主要任务是什么?A、负责资源监控和作业调度,监控所有TaskTracker与Job的健康状况B、使用“slot”等量划分本节点上的资源量(CPU、内存等)C、会周期性地通过“心跳”将本节点上资源的使用情况和任务的运行进度汇报给TaskTrackerD、会跟踪任务的执行进度、资源使用量等信息,并将这些信息告诉任务(Task)答案:A211.下列关于hadoop系统架构叙述不正确的一项为________。A、由一台Intelx86处理器的服务器或PC机组成。B、部署在低成本Intel/linux硬件平台上。C、通过高速局域网构成一个计算集群。D、各个节点上运行Linux操作系统。答案:A212.在HDFS的数据读取过程中,DistributedFileSystem获取这些信息后,生成一个__________对象实例返回给客户端。A、DistributedFileSystemB、FSDataInputSystemC、FSDataOutputSystemD、InputSystem答案:B213.关于Hadoop下列说法错误的是()A、HDFS采用了Master/Slave的架构模型B、Namenode负责维护文件系统的命名空间C、Datanode执行比如打开、关闭、重命名文件操作D、HDFS暴露了文件系统的命名空间,允许用户以文件的形式在上面存储数据答案:C214.在Linux中,Apache和Tomcat都是服务器,他们之间的相同点有()A、两者都是Apache组织开发的B、两者都有HTTP服务的功能C、两者都是免费的D、以上全是答案:D215.HDFS的错误检测不包括_________。A、NameNode检测B、DataNode检测C、数据错误检测D、冗余检测答案:D216.LSM含义是?A、日志结构合并树B、二叉树C、平衡二叉树D、基于日志结构的合并树答案:A217.在Python中,关于in操作符,描述不正确的是A、in操作符用来在指定的序列中找到某一个值,如果找到返回True,否则返回FalseB、in操作符所应用的序列可以是列表、元组或者字典C、判断指定序列中找不到某一个值,则使用notin,它刚好和in相反D、如果在序列中查找不到这个值,会将这个值加入到当前序列中答案:D218.为销售报表展示开发一个MapReduce作业,Mapper输入数据的Key是年份(IntWritable),Value表示商品标识(Text)。下列哪一项决定该Mapper的数据类型?A、JobConf.setMapInputKeyClass与JobConf.setMapInputValuesClassB、HADOOP_MAP_DATATYPES环境变量C、随作业一起提交的mapper-specification.xml文件D、InputFormat格式类答案:D219.在Python中使用注释时,下列描述错误的是A、Python语言有两种注释方式:单行注释和多行注释B、Python语言的单行注释以#开头C、Python语言的多行注释以'''(三个单引号)开头和结尾D、Python语言的单行注释以单引号‘开头答案:D220.下面关于NoSQL和关系数据库的简单比较,哪个是错误的?A、RDBMS有关系代数理论作为基础,NoSQL没有统一的理论基础B、NoSQL很难实现横向扩展,RDBMS可以很容易通过添加更多设备来支持更大规模的数据C、RDBMS需要定义数据库模式,严格遵守数据定义,NoSQL一般不存在数据库模式,可以自由灵活定义并存储各种不同类型的数据D、RDBMS借助于索引机制可以实现快速查询,很多NoSQL数据库没有面向复杂查询的索引答案:B221.HadoopJavaAPI创建文件夹的方法是()。A、listStatus(Pathf)B、delete(Pathf)C、mkdirs(Pathf)D、open(Pathf)答案:C222.在Linux中,终止一个前台进程可能用到的命令和操作是?A、killB、ctrl+CC、shutdownD、halt答案:B223.哪些不是引起Hive数据倾斜的原因?()A、数据在节点存储上分布不均B、运算中Key值分布不均C、业务数据本身存在分布不均D、Hive中表数量的多少答案:D224.在Java中,一下哪个方法可以获取Xml文档的根节点A、getRoot()B、getRootElements()C、getRootElement()D、getFirstElement()答案:C225.下面与HDFS类似的框架是()A、NTFSB、FAT32C、GFSD、EXT3答案:C226.安装Hadoop时,发现50070对应的页面无法打开,可以通过下面哪个命令查看某个端口(TCP或UDP)是否在监听?A、psB、netstatC、pingD、ifconfig答案:B227.在Java中,HTTP服务的常用端口号是A、80B、21C、23D、120答案:A228.在Linux下安装NTP服务的命令是()。A、yuminstallntpB、yumremoventpC、yumupdatentpD、yumlist答案:A229.在Java中,File类中哪个方法可以判断文件是否存在?A、exists()B、isFile()C、isDirectory()D、isHidden()答案:A230.HDFS中的block默认保存几个备份。A、2份B、3份C、1份D、不确定答案:B231.设计分布式数据仓库hive的数据表时,为取样更高效,一般可以对表中的连续字段进行()操作。A、分桶B、分区C、索引D、分表答案:A232.下面哪个程序负责HDFS数据存储()A、DatanodeB、NameNodeC、JobtrackerD、secondaryNameNode答案:A233.在Java中,下列()方法和resume()方法相互搭配,使线程停止执行,然后调用resume()方法恢复线程。A、interrupt()B、stop()C、suspend()D、yield()答案:C234.在Python中,看代码,说结果:
classSinger:
name=""
area=""

def__init__(self,name,area):
=name
self.area=area

singer1=Singer("陈奕迅","香港")
print("歌手:%s\t地区:%s"%(,singer1.area))
singer2=Singer("张杰","中国")
print("歌手:%s\t地区:%s"%(,singer2.area))A、不能运行B、歌手:陈奕迅地区:香港歌手:张杰地区:中国C、歌手:张杰地区:中国歌手:陈奕迅地区:香港D、歌手:陈奕迅地区:香港歌手:张杰地区:中国答案:D235.在Python中,关于try-finally语句说法正确的是A、触发异常时执行finally中的代码B、无论是否异常都会执行finally中的代码C、触发异常时不执行finally中的代码D、必须使用finally语句处理异常答案:B236.下列关于Hive的说法中,描述错误的是()。A、是基于Hadoop的一个数据仓库工具B、可以将非结构化数据文件映射成一张表C、提供了简单的SQL查询功能D、可以将SQL语句装换成MapReduce作业运行答案:B237.下列哪一项不属于HDFS采用抽象的块概念带来的好处?A、简化系统设计B、支持大规模文件存储C、强大的跨平台兼容性D、适合数据备份答案:C238.在Java中,File类提供的方法中,哪个方法可以获取一个目录下所有子文件对象A、list()B、getChildren()C、getFiles()D、listFiles()答案:D239.关于安全模式下面哪个是正确的?A、它是namenode的维护状态B、在安全模式下,集群处于只读状态C、在安全模式下,不允许对文件系统做任何修改D、其他都对答案:D240.在Java中,Java网络编程中,描述错误的是A、服务端用于接收客户端的Socket类请求B、accept()是一个阻塞方法C、设置开启的端口号必须要小于1024D、设置开启的端口要尽量大一些,避开常用软件端口号答案:C241.以下哪个命令可以终止一个用户的所有进程:A、skillallB、B.skillC、C.killD、D.killall答案:D242.下面哪个选项不属于Hadoop1.0的问题?A、单一名称节点,存在单点失效问题B、单一命名空间,无法实现资源隔离C、资源管理效率低D、很难上手答案:D243.下面关于MapReduce模型中Map函数与Reduce函数的描述正确的是A、一个Map函数就是对一部分原始数据进行指定的操作。B、一个Map操作就是对每个Reduce所产生的一部分中间结果进行合并操作。C、Map与Map之间不是相互独立的。D、Reducee与Reduce之间不是相互独立的。答案:A244.在Python中,下列不属于Tornado特点的是?A、完备的Web框架B、图片自动识别技术C、提供高效HTTPClientD、提供高效的内部HTTP服务器答案:B245.在Java中,下列哪个一个操作不能使线程从等待阻塞状态进入对象阻塞状态A、等待阴塞状态下的线程被notify()唤醒B、等待阻塞状态下的纯种被interrput()中断C、等待时间到D、等待阻塞状态下的线程调用wait()方法答案:D246.Hive数据倾斜的表现?()A、Hive建表后数据无法导入B、Hive无法启动C、Hivesql语句运行异常直接退出D、Hive运算任务为报错单长期卡在99%答案:D247.HDFS有一个LZO(withindex)文件大小75MB,客户端设置Block大小为64MB。当运行mapreduce任务读取该文件时inputsplit大小为?A、64MBB、75MBC、128MBD、一个map读取64MB,另外一个map读取11MB答案:D248.若不针对MapReduce编程模型中的key和value值进行特别设置,下列哪一项是MapReduce不适宜的运算。A、MaxB、AverageC、MinD、Count答案:B249.大数据是指不用随机分析法这样的捷径,而采用()的方法A、所有数据B、绝大部分数据C、适量数据D、少量数据答案:A250.Hadoop-2.x集群中的HDFS的默认的副本块的个数是?A、2B、3C、1D、4答案:B251.下面哪个负责HDFS数据存储()。A、NameNodeB、ResourceManagerC、DataNodeD、NodeManager答案:C252.在Java中,关于同步方法描述错误的是A、同步方法比同步代码块更容易控制同步范围B、非静态同步方法的锁对象就是this当前对象本身C、静态同步方法的锁对象是所属类的类类型(字节码文件)D、同步方法和同步代码块使相同的关键字来修饰答案:A253.一个gzip文件大小75MB,客户端设置Block大小为64MB,请我其占用几个Block?A、1B、2C、3D、4答案:B254.下列哪项通常是集群的最主要瓶颈()A、CPUB、网络C、磁盘IOD、内存答案:C255.使用下面那个命令可以将HDFS目录中所有文件合并到一起A、putmergeB、getmergeC、remergeD、mergeALL答案:B256.hadoop能可靠地存储和处理_____字节数据。A、TBB、PBC、YBD、ZB答案:B257.当客户端从HDFS文件系统上读取数据时,以下哪个说法正确?A、从namenode上得到数据块位置B、从namenode上得到数据C、从namenode上得到数据和数据块位置D、

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论