【必做】《hadoop基础练习》历年考试真题库及答案（高频500题）

上传人：r*** IP属地：山东上传时间：2025-11-28 格式：DOCX 页数：151 大小：144.94KB 积分：18 举报 版权申诉

已阅读5页，还剩146页未读，继续免费阅读

版权说明：本文档由用户提供并上传，收益归属内容提供方，若内容存在侵权，请进行举报或认领

文档简介

PAGEPAGE1一、单选题1.下列选项中那些是Hadoop2.x版本独有的进程（）A、JobTrackerB、TaskTrackerC、NodeManagerD、NameNode答案：C2.在Linux中，vim中可以查找字符，那么”/“代表什么意思？A、这个符号没有作用B、查找所有字符C、当前位置查找上一个D、当前位置查找下一个答案：D3.当我们使用命令卸载jdk时直到出现什么提示才算卸载完成（）A、SUCCEESSEDB、ectC、CompleteD、End答案：C4.Hadoop伪分布式是（）A、一个操作系统B、一台机器C、一个软件D、一种概念答案：B5.HadoopStreaming支持脚本语言编写简单MapReduce程序，以下是一个例子：Bin/hadoopjarcontrib/streaming/hadoop-0.20-streaming.jar-inputinput/filename-outputoutput-mapper‘dosth.py5’-filedosth.py-Dmapred.reduce.tasks=1以下说法不正确的是A、HadoopStreaming使用Unix中的流与程序交互B、HadoopStreaming允许我们使用任何可执行脚本语言处理数据流C、采用脚本语言时必须遵从UNIX的标准输入STDIN，并输出到STDOUTD、Reduce没有设定，上述命令运行会出现问题答案：D6.____________提供了各行业各领域的大数据应用技术解决方案。A、数据应用系统B、数据开发系统C、数据处理系统D、数据存储系统答案：A7.MapReduce编程模型，键值对＜key,value>的key必须实现哪个接口？A、WritableComparableB、ComparableC、WritableD、LongWritable答案：A8.在Java中，现有一条XPath匹配规则如下“//user[@id=’1003’]/pwd”,对于这条匹配规则的说法正确的是A、可以查询到所有user标签的pwd标签B、可以查询到所有具备id属性的user标签下的pwd标签C、可以查询到所有id=‘1003’的user标签的pwd标签D、语法错误答案：C9.MapReduce框架的核心步骤主要是（）A、MapB、ShuffleC、ReduceD、Map和Reduce答案：D10.端口50070默认是Hadoop哪个服务的端口？A、NameNodeB、DataNodeC、SecondaryNameNodeD、Yarn答案：A11.关于Flume的三大组件以下说法正确的是（）。A、channel可以和任意数量的source和sink链接。B、channel只能链接单一的source和sink。C、sink在三大组件之间起着桥梁的作用。D、sink从channel消费数据并将其传递给目标地,目标地只能是hdfs。答案：A12.在Java中提供以下哪个类来进行有关IP地址的操作A、SocketB、ServerSocketC、DatagramSocketD、InetAddress答案：D13.在HDFS的数据写入过程中，客户端写完所有数据块后，调用___________的close（）方法结束这次文件写入操作。A、DistributedFileSystemB、FSDataInputSystemC、FSDataOutputSystemD、InputSystem答案：B14.在导入开始之前,Sqoop检索出表中所有的列以及列的SQL数据类型,这些SQL类型被映射什么类型（）A、CB、C++C、JavaD、Python答案：C15.在Python中，下列是Flask的Request对象的args属性的作用的是（）A、记录请求的数据，并转换为字符串B、记录请求中的表单数据C、记录请求中的查询参数D、记录请求中的cookie信息答案：C16.Sqoop将导入或导出命令翻译成什么程序来实现导入导出（）A、SparkB、StormC、MapReduceD、Tez答案：C17.安装Hadoop集群时，在哪个文件指定从机是哪些机器?A、datanodeB、slavesC、yarn-site.xmlD、core-site.xml答案：B18.在Linux中，”./”在Linux系统中是什么意思？A、在当前目录中找B、在环境变量中找C、在PATH中找D、没有任何意义答案：A19.下面生成中间键值对的是（）A、ReducerB、MapperC、CombinerD、Partitioner答案：B20.下列关于键值数据库的描述，哪一项是错误的？A、扩展性好，灵活性好B、大量写操作时性能高C、无法存储结构化信息D、条件查询效率高答案：D21.有关MapReduce的输入输出，说法错误的是（）A、链接多个MapReduce作业时，序列文件是首选格式B、FileInputFormat中实现的getSplits（）可以把输入数据划分为分片，分片数目和大小任意定义C、想完全禁止输出，可以使用NullOutputFormatD、每个reduce需将它的输出写入自己的文件中，输出无需分片答案：B22.Hadoop的储存框架叫什么（）A、LustreB、MooseFSC、MogileFSD、HDFS答案：D23.在分布式并行计算体系中，________采用一个指令流处理单个数据流。A、SISDB、SIMDC、MISDD、MIMD答案：A24.与Hadoop1.x相比，Hadoop2.x采用全新的架构，最明显的变化就是增加了哪个组件？A、MapReduceB、PigC、HBaseD、Yarn答案：D25.下列哪些不是HBase的特点（）A、高可靠性B、高性能C、面向列D、紧密性答案：D26.在Java中，关于线程的运行，说法错误的是A、线程之间是独立运行的B、线程的执行是抢占式的C、线程一旦运行就不可能停止，直到自己的运行代码执行完毕D、对于某些应用程序，开启多个线程能提高执行效率答案：C27.下面描述错误的是：A、Hive的功能十分强大，可以支持采用SQL方式查询Hadoop平台上的数据B、在实际应用中，Hive也暴露出不稳定的问题，在极少数情况下，甚至会出现端口不响应或者进程丢失的问题C、在HiveHA中，在Hadoop集群上构建的数据仓库是由单个Hive实例进行管理的D、在HiveHA中，客户端的查询请求首先访问HAProxy，由HAProxy对访问请求进行转发答案：C28.关于Linux操作系统的组成和结构，下面叙述中错误的是（）A、某个应用程序在Linux操作系统环境下运行时，它就成为一个用户进程B、Linux提供的GLIBC是可移植的标准C库函数实现，提供标准I/O和标准流的一系列接口。C、Linux内核包含进程管理、内存管理、文件管理、网络接口和进程间通信等模块D、Linux是参照Minix开发的，采用与Minix相同的微内核结构答案：D解析：A）面向对象模型B）编程模型C）MVC模型D）面向切面模型正确答案B29.以下四个Hadoop预定义的Mapper实现类的描述错误的是（）A、IdentityMapper＜K,V>实现Mapper＜K,V,K,V>，将输入直接映射到输出B、InverseMapper＜K,V>实现Mapper＜K,V,K,V>，反转键/值对C、RegexMapper＜K>实现Mapper＜K,Text,Text,LongWritable>，为每个常规表达式的匹配项生成一个（match,1）对D、TokenCountMapper＜K>实现Mapper＜K,Text,Text,LongWritable>，当输入的值为分词时，生成（taken,1）对答案：B30.在配置好Hadoop集群之后，通过浏览器登录查看Hadoop状态，以下是查看的URL（）A、http://master:8088B、:50070C、http://master:16010D、http://master:9999答案：B31.关于HDFS的文件写入，正确的是（）。A、支持多用户对同一文件的写操作B、用户可以在文件任意位置进行修改C、默认将文件块复制成三份存放D、复制的文件块默认都存在同一机架上答案：C32.下面与Zookeeper类似的框架是？A、ProtobufB、JavaC、KafkaD、Chubby答案：D33.下面哪个可以优化扩展性？A、MapReduceB、DrillC、OozieD、Hive答案：D34.下列关于Scala特性的描述，错误的是哪一项？A、Scala语法复杂，但是能提供优雅的API计算B、Scala具备强大的并发性，支持函数式编程，可以更好地支持分布式系统C、Scala兼容Java，运行速度快，且能融合到Hadoop生态圈中D、Scala是Spark的主要编程语言答案：A35.在Linux中，查看已启动的服务列表的命令是A、systemctllist-unit-files|grepenabledB、systemctlis-enabledfirewalldC、systemctldisablefirewalldD、systemctlenablefirewalld答案：A36.在MapReduce中，下面哪个选项是并行进行的？A、Shuffle和MapB、Shuffle和SortC、Reduce和SortD、Map和sort答案：B37.下列哪个属性是hdfs-site.xml中的配置A、fs.defaultFSB、dfs.replicationC、D、yarn.resourcemanager.address答案：B38.关于分布式锁的实现，下列说法正确的是。A、在网络中，网络是可靠的，所以分布式协调调用很轻松。B、为每一个分布式应用程序开发一个独立的协调程序是必要的，不会造成浪费。C、在分布式协调系统中协调程序开销较大，反而会提高原程序的性能。D、为了防止分布式系统中的多个进程之间相互干扰，需要一种分布式协调技术来对这些进程进行调度。答案：D39.Hadoop配置文件中，hadoop-site.xml显示覆盖hadoop-default.xml里的内容。在版本0.20中，hadoop-site.xml被分离成三个XML文件，不包括A、conf-site.xmlB、mapred-site.xmlC、core-site.xmlD、hdfs-site.xml答案：A40.以下（）文件中主要用来配置ResourceManager，NodeManager的通信端口，web监控端口等。A、core-site.xmlB、mapred-site.xmlC、hdfs-site.xmlD、yarn-site.xml答案：D41.在HDFS文件系统根目录下创建一个名为mydir的文件夹的命令是（）。A、hdfs.create（newPath（“hdfs:/mydir”））B、hdfs.open（newPath（“hdfs:/mydir”））C、hdfs.mkdirs（“hdfs:/mydir”）D、hdfs.mkdirs（newPath（“hdfs:/mydir”））答案：D42.在Java中，关于协议下面说法正确的是A、TCP/IP协议由TCP协议和IP协议组成B、TCP和UDP都是TCP/IP协议传输层的子协议C、Socket是TCP/IP协议的一部分D、DatagramSocket是TCP/IP的一部分答案：B43.完全分布式，不需要修改的配置文件为_______。A、core-site.xmlB、hdfs-site.xmlC、hadoop-env.shD、mapred-site.xml答案：C44.在数据仓库的数据架构中，（）具有按业务场景组织数据的能力。A、结构化数据B、列式数据C、文档数据D、非结构化数据答案：B45.MapReduce是一种（）模型A、面向对象模型B、编程模型C、MVC模型D、面向切面模型答案：B46.在Linux中，usermod命令无法实现的操作是（）A、账户重命名B、删除指定的账户和对应的主目录C、锁定和解锁用户账户D、对用户密码进行锁定或解锁答案：B47.在Python中，Flask内部自带的WSGI服务器的默认端口是？（）A、80B、21C、8000D、5000答案：D48.下面哪个不可能是Hive的执行引擎：A、MapReduceB、TezC、StormD、Spark答案：C49.在Linux中，以下关于shell变量规则中，说法正确的是：A、首个字符能以数字开头B、标点符号不能使用太多，只能一点点C、中间不能有空格，可以使用下划线（_）D、变量名和等号之间可以有空格答案：C50.创建一个HDFS客户端对象时,Configuration实例会自动加载HDFS的配置文件（,从中获取Hadoop集群的配置信息。A、hadoop-default.xmlB、hadoop-env.shC、hadoop-site.xmD、core-site.xml答案：D51.下面属于Hadoop特点的是（）A、低价值密度B、低吞吐量C、高容错D、高成本答案：C52.在Java中，关于字符流的说法正确的是A、字符流是双字节流，因此使用字节流读取两次与与字符流读取一次的效果完全一致。B、字符流会涉及字符编码的转换。C、通过字符流可以复制图片D、通过字符流将文本写入文件，则文件中的编码一定是双字节编码。答案：B53.大数据平台Hadoop的组件中，提供分布式协作服务的组件是（）A、HBaseB、ZooKeeperC、SqoopD、Hive答案：B54.key与value之间的分隔符，默认的情况是（）A、/rB、/tC、/fD、空格答案：B55.在Java中，使用客户端套接字Sockt创建对象时，需要指定A、服务器主机名和端口B、服务器端口和文件C、服务器名和文件D、服务器地址和文件答案：A56.在Java中，ServerSocket的监听方法accept（）的返回值类型是A、voidB、ObjectC、SocketD、DatagramSocket答案：C57.MapReduce能处理的海量数据大于______。A、1TBB、10GBC、10TBD、1PB答案：A58.关干HiveSQL运行原理，描述不正确的选项有?（A）A、所有HQL都会转化为MapReduce任务执行B、DDL语句不提交任务到MapReduce，而是直接操作元数据C、对于selectcount（*）fromtable操作，一定会启reduce任务D、对于select*fromtable语句不会启MapReduce答案：A59.在MapReduce的Shuffle过程中，哪个操作是最后做的？A、溢写B、分区C、排序D、合并答案：D60.下列哪项通常是集群的最主要的瓶颈（）A、CPUB、网络C、磁盘IOD、内存答案：C61.在Java中，使用Dom4j为Xml文档的节点添加内容，正确的是A、节点.setText（"内容"）;B、节点.addText（"内容"）;C、节点.addContent（"内容"）;D、节点.setContent（"内容"）;答案：A62.下列关于MapReduce的特性叙述正确的一项是_________。A、自动实现分布式串行计算B、自动实现分页式并行计算C、容错，提供状态监控工具D、不容错，提供状态监控工具答案：C63.下面哪个程序负责HDFS数据存储。（）A、NameNodeB、JobtrackerC、DatanodeD、secondaryNameNode答案：C64.下列哪一个不属于Hadoop的大数据层的功能？A、数据挖掘B、离线分析C、实时计算D、BI分析答案：C65.在Java中，简单工厂模式的核心是A、抽象产品B、具体产品C、工厂D、消费者答案：C66.在hadoop配置中yarn-site.xml作用是（）A、用于定义系统级别的参数B、用于名称节点和数据节点的存放位置C、用于配置JobHistoryServer和应用程序参数D、配置ResourceManager，NodeManager的通信端口答案：D67.下列哪些操作可以设置一个监听器WatcherA、getDataB、getChildrenC、existsD、setData答案：D68.在File类中，哪个方法是创建目录且允许创建多级目录A、mkdir（）B、mkdirs（）C、delete（）D、renameTo（）答案：B69.下列哪一种命令格式是不正确的（）A、get表行健列族B、scan表时间戳起始行健结束行健C、alter表列族D、put表行键列族:列值答案：B70.下列哪一项不属于数据库事务具有ACID四性？A、间断性B、原子性C、一致性D、持久性答案：A71.MapReduce自定义排序规则需要重写下列那项方法A、readFields（）B、compareTo（）C、map（）D、reduce（）答案：B72.在HDFS的数据读取过程中，客户端读取完所有数据块后，调用___________的close（）接口关闭这个文件。A、DistributedFileSystemB、FSDataInputSystemC、FSDataOutputSystemD、InputSystem答案：B73.一个MapReduce程序中的MapTask的个数由（）决定的。A、输入的总文件数B、客户端程序设置的mapTask的个数C、FileInputFormat.getSplits（JobContextjob）计算出的逻辑切片的数量D、输入的总文件大小/数据块大小答案：C74.在Java中，下面关于线程状态的说法正确的是A、线程被启动后，将处于运行状态，即run（）方法正在执行中B、线程结束阻塞状态将进入就绪状态。C、当cpu空闲时，可以直接调用阻塞状态的线程来运行。D、运行状态的线程就不再可能直接进入就绪状态答案：B75.在Java中，Thead类中能运行线程任务代码的方法是A、start（）B、begin（）C、init（）D、run（）答案：D76.下面关于MongoDB说法，哪一项是正确的？A、具有较差的水平可扩展性B、设置个别属性的索引来实现更快的排序C、提供了一个面向文档存储，操作复杂D、可以实现替换完成的文档（数据）或者一些指定的数据字段答案：D77.在Java中，下列哪一个包给出了Runnable接口的定义？A、java.utilB、java.ioC、java.langD、java.sql答案：C78.ZooKeep中大多shell命令的行为，可以通过命令命令推测，下列说法正确的是。A、ls：显示所有节点。B、create：创建一张表。C、get：获取一个节点。D、set：设置一个节点。答案：A79.针对每行数据内容为”TimestampUrl”的数据文件，在用JobConf对象conf设置conf.setInputFormat（WhichInputFormat.class）来读取这个文件时，WhichInputFormat应该为以下的（）A、TextInputFormatB、KeyValueTextInputFormatC、SequenceFileInputFormatD、NLineInputFormat答案：B80.下面关于Shuffle过程描述正确的是（）A、Job作业必须要实现Combiner过程。B、分组操作发生在溢写过程C、分组的目的是提高Job执行效率。D、压缩目的是提高效率。答案：D81.互联网的发展分为______个阶段。A、一B、三C、二D、四答案：B82.在Java中，如果在关闭socket时发生一个I/O错误，会抛出A、IOExceptionB、UnknownHostExceptionC、SocketExceptionD、MalformedURLException答案：A83.map中环形缓冲区的大小是由下列哪个属性决定的（）A、io.sort.spill.percentB、io.sort.factorC、io.sort.mbD、mapred.reduce.parallel.copies答案：C84.在Python中，（）语句隐藏了一个包含了关闭的逻辑，类似try…catchA、whereB、withC、yieldD、contextlib答案：B85.关于SecondaryNameNode哪项是正确？A、它是NameNode的热备B、它对内存没有要求C、它的目的是帮助NameNode合并编辑日志，减少NameNode启动时间D、SecondaryNameNode应与NameNode部署到一个节点答案：C86.________模式：Hadoop安装运行在多台主机上，构成一个真实的hadoop集群，在所有的节点上都安装JDK和hadoop，相互通过高速局域网连接。A、联机B、单机C、虚拟分布D、完全分布答案：D87.下面哪项是Hadoop的作者？A、MartinFowlerB、DougcuttingC、MarkElliotZuckerbergD、KentBeck答案：B88.Client端上传文件时,下列哪项说法正确？A、数据经过NameNode传递给DataNodeB、Client端将文件切分为Block，依次上传C、Client只上传数据到一台DataNode，然后由NameNode负责Block复制工作D、以上都不正确答案：B89.结构化的数据，先有________,再有_________.A、数据结构B、结构数据C、内容结构D、结构内容答案：B90.在Python中，pymysql中数据库连接对象进行数据提交的方法是什么？A、commit（）B、cursor（）C、close（）D、connect（）答案：A91.Hive查询语言和SQL的一个不同之处在于（）操作A、GroupbyB、JoinC、PartitionD、Union答案：C92.MapReduce处理流程中Reduce如何获取Map端结果（）A、Map端发送B、Reduce端获取C、Map端发送到中间管理节点，Reduce统一获取D、随机发送答案：B93.使用下面那个命令可以将HDFS目录中所有文件合并到一起A、putmergeB、getmergeC、remergeD、mergeALL答案：B94.以下描述错误的是？A、TextInputFormat的key是指该记录在文件中的行号B、SequenceFile可以用来作为小文件的合并存储容器C、TextInputFormat的key是LongWritable类型的D、CombineFileInputFormat是抽象类答案：A95.以下对Flume描述错误的是（）A、高可用的B、高可靠的C、负责海量日志采集D、负责处理数据答案：D96.下列关于使用MapReduce编程模型实现SQL中的join操作错误的是？A、ReduceJoin可以实现内链接，也能实现各种外连接B、ReduceJoin的join操作是在MapReduce程序中的reducer阶段完成的C、MapJoin不会产生数据倾斜D、MapJoin也适合各种join场景，也能实现内连接和各种外链接答案：D97.下列不属于HBase基本元素的一项是________。A、表B、记录C、行键D、单元格答案：B98.在进行Hive组件配置时，JAR包冲突导致异常，出现以下错误信息（）A、FailedtosetsetXIncludeAware（true）forparserB、mkdir:`input’:NosuchfileordirectoryC、E45:‘readonly’optionisset（add!tooverride）D、ERRORtool.ImportTool:ImportedFailed:Character8216isanout-of-rangedelimiter答案：A99.在Java中，下列哪个方法可以使线程从运行状态进入阻塞状态A、sleepB、stopC、yieldD、start答案：A100.Hbase的主要作用是（）A、是一个分布式的、面向列的开源数据库B、是一种编程模型，用于大规模数据集（大于1TB）的并行运算C、是Hadoop集群当中的资源管理系统模块D、将要储存的文件分散在不同的硬盘上，并记录他们的位置答案：A101.格式化NameNode命令为（）A、hdfsnamenode-formattingB、Namenode-formatC、nameNodefomattingD、hdfsnamenode-format答案：D102.Hadoop的作者是下面哪一位_____。A、MartinFowlerB、DougcuttingC、KentBeckD、GraceHopper答案：B103.在Java中，HTTP服务的常用端口号是A、80B、21C、23D、120答案：A104.关于基于Hadoop的MapReduce编程的环境配置，下面哪一步是不必要的（）A、安装linux或者在Windows下安装CgywinB、安装javaC、安装MapReduceD、配置Hadoop参数答案：C105.下面哪一项不属于计算机集群中的节点？A、主节点（MasterNode）B、源节点（SourceNode）C、名称结点（NameNode）D、从节点（SlaveNode）答案：B106.用什么命令可以将ZooKeeper文件远程拷贝到其他机器？A、spcB、scpC、sendD、post答案：B107.下列关于数据存储系统叙述不正确的一项为_____。A、数据采集层B、数据清洗、抽取与建模C、数据仓库与数据服务D、无统一数据接口答案：D108.在整个mapreduce运行阶段数据是以（）键值对的形式存在的A、key-valueB、字符串C、IntD、链式答案：A109.下列语句描述错误的是（）A、可以通过CLI方式、JavaAPI方式调用SqoopB、Sqoop底层会将Sqoop命令转换为MapReduce任务，并通过Sqoop连接器进行数据的导入导出操作。C、Sqoop是独立的数据迁移工具，可以在任何系统上执行。D、如果在Hadoop分布式集群环境下，连接MySQL服务器参数不能是localhost或。答案：C110.在Python中，关于CSV文件特征说法错误的是A、纯文本B、由记录组成C、每条记录被分隔符分隔为字段D、是一种使用{}和[]组成的文件格式答案：D111.把本地文件放到集群里,可以使用下面哪个hadoopshell的命令?A、hadoopfs-put/B、hadoopfs-putC、hadoopfs-push/D、hadoop-push/答案：C112.下面哪个命令用于进入hdfs安全模式？A、hadoopdfsadmin-safemodegetB、bin/dfsadmin-safemodegetC、hadoopdfsadmin-safemodeenterD、其他都不是答案：C113.下面哪个不属于YARN的架构的组成部分？A、JobTrackerB、ResourceManagerC、NodeManagerD、ApplicationMaster答案：A114.下面哪个命令是用来定义shell的全局变量：A、exportfsB、B.aliasC、C.exportsD、D.export答案：D115.下列哪个不属于物联网的应用？A、智能物流B、智能安防C、环保监测D、数据清洗答案：D116.YARN端口是___A、3306B、8080C、3535D、6389答案：B117.在Python中，网络框架Flask是（）A、支持快速建站的框架B、企业级开发框架C、高并发处理框架D、以上全都不是答案：A118.在Java中，File类中哪个方法可以判断文件是否存在？A、exists（）B、isFile（）C、isDirectory（）D、isHidden（）答案：A119.在Python中，以下选项中可访问字符串s从右侧向左第三个字符的是A、s[3]B、s[:-3]C、s[-3]D、s[0:-3]答案：C120.以下选项哪个是MapReduce正确的运行模型（）A、Reduce-Map-ShuffleB、Shuffle-Map-ReduceC、Map-Shuffle-ReduceD、Map-Reduce-Shuffle答案：C121.在Java中，以下不是产生死锁的必要条件的是A、开启了多个线程B、线程间存在多个共享资源C、使用了线程同步D、继承了Thread类答案：D122.下面哪个可以为hadoop生态系统提供流式处理？A、HiveB、SolrC、TezD、Spark答案：D123.下列描述说法错误的是?（）A、SecureCRT是一款支持SSH的终端仿真程序,它能够在Windows操作系统上远程连接Linux服务器执行操作。B、Hadoop是一个用于处理大数据的分布式集群架构,支持在GNU/Linux系统以及Windows系统上进行安装使用。C、VMwareWorkstation是一款虚拟计算机的软件,用户可以在单一的桌面上同时操作不同的操作系统。D、SSH是一个软件,专为远程登录会话和其他网络服务提供安全性功能的软件。答案：D124.在MapReduce程序中，必须包含的模块有（）。A、Mapper、Combiner、ReducerB、setup、Mapper、ReducerC、Mapper、ReducerD、Mapper、Reducer.、cleanup答案：C125.hadoop______中将海量数据分割于多个节点，由每个节点并行计算，将得到的结果归并到输出。A、应用场景B、分布式计算C、分阶段计算D、高效处理答案：B126.下列不属于大数据项目实施工作流程的是（）。A、项目规划阶段B、数据治理阶段C、项目设计阶段D、系统运维阶段答案：D127.下面关于MapReduce的描述中正确的是？A、MapReduce程序必须包含Mapper和ReducerB、MapReduce程序的MapTask可以任意指定C、MapReduce程序的默认数据读取组件是TextInputFormatD、MapReduce程序的ReduceTask可以任意指定答案：C128.下列选项中不是hadoop特点的是_____。A、可靠性B、扩容能力C、高效率D、成本高答案：D129.下列哪个不属于YARN体系结构中ApplicationMaster的功能？A、任务调度、监控与容错B、为应用程序申请资源C、将申请的资源分配给内部任务D、处理来自ResourceManger的命令答案：D130.在Python中，os.exit（）函数的作用是A、结束当前进程B、结束所有进程C、退出程序D、创建新的进程答案：A131.在Linux中，vim默认采用大小写敏感的查找，为了方便常常将其配置为大小写不敏感？A、:setbigB、:seticC、:setgetD、:setnone答案：B132.下列哪项通常是集群的最主要瓶颈A、磁盘B、CPUC、网络D、内存答案：A133.在Java中，以下不属于Xml解析库的是A、JDOMB、SAX解析C、DOM4JD、xPath答案：D134.启动集群的顺序为（）。①start-dfs.sh、②start-yarn.sh、③mr-jobhistory-daemon.shstarthistoryserverA、①②③B、②①③C、③②①D、③①②答案：A135.NameNode节点主要工作是（）A、存储大量的数据B、元数据的管理C、NameNode节点和DataNode节点主要负责的工作一样D、以上都正确答案：C136.在Python中，如果x=1那么x*=3+5**2运算之后x的结果是多少A、29B、28C、13D、14答案：B137.狭义的Hadoop是一个适合大数据分布式存储和分布式计算的平台，不包括下面哪个组件？A、HDFSB、MapReduceC、YarnD、HBase答案：D138.ZooKeeper的特点不包括（）A、顺序一致性B、原子性C、可靠性D、复合系统映像答案：D139.相比依赖于小数据和精确性的时代，大数据因为更强调数据的（），帮助我们进一步接近事实的真相。A、安全性B、完整性C、混杂性D、完整性和混杂性答案：D140.针对每行数据内容为”TimestampUrl”的数据文件，在用JobConf对象conf设置conf.setInputFormat（WhichInputFormat.class）来读取这个文件时，WhichInputFormat应该为以下的BA、TextInputFormatB、KeyValueTextInputFormatC、SequenceFileInputFormatD、NLineInputFormat答案：B141.配置Hadoop时，JAVA_HOME包含在哪一个配置文件中A、hadoop-default.xmlB、hadoop-env.shC、hadoop-site.xmlD、Configuration.xsl答案：B142.在Kafka中使用（）命令来创建生产者。A、kafka-console-producer.shB、kafka-console-consumer.shC、kafka-topics.shD、kafka-producer-console.sh答案：A143.如没有配置hadoop.tmp.dir参数，此时系统默认的临时目录为（）A、/tmp/hadoop-hadoopB、/usr/hadoop-hadoopC、/usr/local/hadoop-hadoopD、/usr/local/src/hadoop-hadoop答案：A144.Hadoop安装在一台计算机上，需修改相应的配置文件，用一台计算机模拟多台主机的集群是（）模式。A、全分布模式B、伪分布模式C、单机模式D、全分布HA模式答案：B145.以下哪个技术与大数据无关A、云技术B、B.分布式处理技术C、C.存储技术D、D.物联网技术答案：D146.大数据至少为以下哪种存储量级?A、PBB、EBC、TBD、ZB答案：A147.下面哪个YARN的描述不正确的是？A、YARN指YetAnotherResourceNegotiator，是另一种资源协调者B、YARN只支持MapReduce一种分布式计算模式C、YARN最初是为了改善MapReduce的实现D、YARN的引入为集群在利用率、资源统一管理和数据共享等方面带来了巨大好处答案：B148.在hadoop配置中core-site.xml的配置是（）参数。A、集群全局参数B、HDFS参数C、Mapreduce参数D、集群资源管理系统参数答案：A149.运行WordCount命令（）A、$hadoopjarhadoop-examples-25.0jarwordcount/data/input/data/outputB、$hadoopfs-hadoop-examples-25.0jarwordcount/data/input/dataloutputC、$hadoopfs-hadoop-examples-25.0/jarwordcount/data/input/data/outputD、$hadoopjarhadoop-examples-2.5.0/jarwordcount/data/input/dataloutput答案：A150.下列关于HDFS为存储MapReduce并行切分和处理的数据做的设计，错误的是（）A、FSDataInputStream扩展了DataInputStream以支持随机读B、为实现细粒度并行，输入分片（InputSplit）应该越小越好C、一台机器可能被指派从输入文件的任意位置开始处理一个分片D、输入分片是一种记录的逻辑划分，而HDFS数据块是对输入数据的物理分割答案：B151.在Python中使用注释时，下列描述错误的是A、Python语言有两种注释方式:单行注释和多行注释B、Python语言的单行注释以#开头C、Python语言的多行注释以'''（三个单引号）开头和结尾D、Python语言的单行注释以单引号‘开头答案：D152.在Hadoop项目结构中，MapReduce指的是什么？A、分布式并行编程模型B、流计算框架C、Hadoop上的工作流管理系统D、提供分布式协调一致性服务答案：A153.以下哪个不是HDFS的进程（）A、SecondaryNodeB、NameNodeC、ResourceManagerD、DataNode答案：C154.在Linux中，文件测试运算符用于检测Linux文件的各种属性，以下那个是检测文件是否是普通文件A、[-bfile]B、[-ffile]C、[-cfile]D、[-dfile]答案：B155.在Python中，Python的XML的解析方式中速度快、消耗内存少，像轻量级的DOM的是A、SAXB、DOMC、AjaxD、ElementTree答案：D156.下面哪些不是引起Spark负载不均的原因？（）A、Spark读入的数据源是倾斜的B、Shuffle阶段Key值过于集中C、在数据过滤阶段需要处理的数据量差异D、Spark的运行方式差异答案：D157.在Linux中，用户可以对vim进行设置，如何对vim文件进行修改？A、vim/etc/vim.initB、vim/etc/sysconfig/vimrcC、vim/etc/profile.d/vimrcD、vim/etc/vimrc答案：D158.下列关于MPI叙述不正确的一项是________。A、MPI是一个信息传递应用程序的接口B、MPI程序经常在共享内存的机器上使用C、MPI并行计算增加高层并行编程模型D、MPI缺少统一的计算框架支持答案：C159.下列哪一项不属于HDFS采用抽象的块概念带来的好处？A、简化系统设计B、支持大规模文件存储C、强大的跨平台兼容性D、适合数据备份答案：C160.一个MapReduce程序中的MapTask的个数由什么决定？A、输入的总文件数B、客户端程序设置的mapTask的个数C、输入的总文件大小/数据块大小D、FileInputFormat.getSplits（JobContextjob）计算出的逻辑切片的数量答案：D161.进入到MapReduce目录命令为（）A、hadoopjarhadoop-mapreduce-examples-2.7.3.jarwordcount/hello/outB、hadoophadoop-mapreduce-examples-2.7.3.jarwordcount/helloC、hadoophadoop-mapreduce-examples-2.7.3.jarwordcount/hello/outD、hadoopjarhadoop-mapreduce-examples-2.7.3.jarwordcount/hello/home答案：A162.HadoopJavaAPI创建文件夹的方法是（）。A、listStatus（Pathf）B、delete（Pathf）C、mkdirs（Pathf）D、open（Pathf）答案：C163.大数据计算体系结构有_____个基本层次。A、二B、四C、三D、五答案：C164.在Python中，CSV文件典型的分隔符不包括A、逗号B、分号C、制表符D、换行答案：D165.Zookeeper启动时会最多监听几个端口（）A、1B、2C、3D、4答案：B166.下面有关NameNode安全模式（safemode）说法错误的是（）A、namespace处于安全模式时只能被读取B、NameNode启动时自动进入安全模式C、调用setSafeMode（）函数能够打开或关闭安全模式D、安全模式下不能够复制或删除文件中的数据块答案：B167.MapReduce的＜key,value>存储模型能够存储什么数据？A、文件数据B、二进制C、字符串D、任意格式答案：D168.idea中查看类的结构的快捷键是（）。A、ctrl+0B、Shift+EnterC、Ctrl+DD、Shift+Enter答案：A169.在HDFS的数据写入过程中，客服端首先调用________的实例的create（）方法打开一个文件。A、DistributedFileSystemB、FileSystemC、FSDataOutputSystemD、OutputSystem答案：C170.下列关于MapReduce1.0的描述，错误的是？A、JobTracker“大包大揽”导致任务过重B、不存在单点故障C、容易出现内存溢出（分配资源只考虑MapReduce任务数，不考虑CPU、内存）D、资源划分不合理（强制划分为slot，包括Mapslot和Reduceslot）答案：B171.当__时，HDFS启动balancer（）A、threshold=＜ratio（Datanode）-ratio（Rack）B、threshold=＜ratio（Datanode）-ratio（Rack）C、threshold＜ratio（Rack）-ratio（Datanode）D、threshold>=|ratio（Datanode）-ratio（Rack）答案：C172.Hadoop官方真正支持的操作系统是（）A、UNIXB、WindowsC、DOSD、Linux答案：D173.下列对HIve理解正确的选项是（）A、一个高可用、高可靠、分布式的海量日志采集、聚合和传输的系统B、能够支撑数据的汇合和临时查询的数据仓库基础框架C、一个可扩展的机器学习和数据挖掘库D、一个快速通用的数据引擎答案：B174.下列选项哪个不是ZooKeeper的应用场景？A、Master选举B、分布式锁C、分布式协调/通知D、存储非关系型数据答案：D175.yarn-site.xml文件的作用是（）A、配置MapReduce框架B、配置hadoop的HDFS系统的命名C、配置YARN框架D、保存子节点信息答案：C176.以下对Combiner描述错误的是（）A、Combiner的作用提高程序执行效率B、Combiner的作用减少对本地磁盘的访问次数。C、Combiner过程设置则执行，否则不执行D、Combiner过程对job意义。答案：D177.下面关于MapReduce的描述中正确的是（）。A、MapReduce程序必须包含Mapper和ReducerB、MapReduce程序的MapTask可以任意指定C、MapReduce程序的ReduceTask可以任意指定D、MapReduce程序的默认数据读取组件是TextInputFormat答案：D178.在Java中，关于Xpath描述错误的是A、Xpath即Xml路径语言B、Xpath可以快速定位、获取所需要的节点C、可以使用selectNodes（"表达式"）方法查找相应节点D、在使用Xpath时，不需要导入相应的jar包答案：D179.以下哪个方法不是mapper类中的重写方法A、map（）方法B、run（）f方法C、setup方法D、clean（）方法答案：D180.在Python中，下面关键字中，不属于分支结构的是A、elifB、elseifC、ifD、else答案：B181.大数据的起源是A、金融B、B.电信C、C.互联网D、D.管理答案：C182.下列（）命令可以显示出HDFS目录/user/root中的内容。A、hdfsdfs-dir/user/root/B、hdfsdfs-report/user/root/C、hdfsdfs-ls/user/root/D、hdfsdfs-display/user/root/答案：C183.客户端连接Zookeeper集群的命令是（）。A、get/zkB、delete/zkC、zkCli.shD、ls/答案：C184.大数据是_____的应用。A、人工智能B、云计算C、物联网D、互联网答案：B185.下面关于Shuffle过程对Job的压缩描述正确的是（）A、Job作业必须实现。B、在执行溢写过程之前，先压缩数据。C、使用任何一种压缩算法都可以提高Job执行效率。D、使用压缩算法要考虑其压缩后数据量大小、压缩速度、解压速度等。答案：D186.关于集群的特点下列叙述正确的一项是_________。A、系统吞吐量小B、可靠性高C、扩展性弱D、性价比低答案：B187.在Java中，一下哪个方法可以获取Xml文档的根节点A、getRoot（）B、getRootElements（）C、getRootElement（）D、getFirstElement（）答案：C188.HDFS的NameNode负责管理文件系统的命名空间，将所有的文件和文件夹的元数据保存在一个文件系统树中，这些信息也会在硬盘上保存成以下文件：A、日志B、命名空间镜像C、两者都是D、以上说法都不正确答案：C189.在Python中，网络框架Django是（）A、支持快速建站的框架B、企业级开发框架C、高并发处理框架D、以上全都不是答案：B190.关于HDFS的文件写入，正确的是A、支持多用户对同一文件的写操作B、用户可以在文件任意位置进行修改C、默认将文件块复制成三份存放D、复制的文件块默认都存在同一机架答案：C191.下列哪些不是ZooKeeper的特点（）A、顺序一致性B、原子性C、多样系统映像D、可靠性答案：C192.在Java中，对于Xml文档元素描述错误的是A、Xml文档中可以有多个顶层元素B、Xml文档中的元素可以嵌套C、Xml文档元素由开始标记、属性、元素内容和结束标记这几个部分组成D、Xml的元素可以自己命名，但要遵照一定的规则答案：A193.在Java中，Java网络编程中，描述错误的是A、服务端用于接收客户端的Socket类请求B、accept（）是一个阻塞方法C、设置开启的端口号必须要小于1024D、设置开启的端口要尽量大一些，避开常用软件端口号答案：C194.配置机架感知的下面哪项正确？A、MapReduce会根据机架获取离自己比较近的网络数据B、写入数据的时候会写到不同机架的DataNodeC、都正确D、如果一个机架出问题，不会影响数据读写答案：C195.MapReduce默认的输出格式是（）A、SequenceFileOutputFormatB、TextOutputFormatC、NullOutputFormatD、MapFileOutputFormat答案：B196.在Linux系统中，如果要列出一个目录下的所有文件包括隐藏文件，需要使用命令（）A、ls-lB、lsC、ls-aD、ls-d答案：C197.在Python中，contextlib可以加强with语句，关于contextlib说法正确的是A、它是通过Generator装饰器实现的B、它是通过__enter__（）实现的C、它是通过__exit__（）实现的D、contextlib中的contextmanager作为装饰器来提供一种针对对象级别的上下文管理机制。答案：A198.在Java中，线程调用了sleep（）方法后，该线程将进入（）状态A、可运行状态B、运行状态C、阻塞状态D、终止状态答案：C199.关于HDFSFederation的设计的描述，哪个是错误的？A、属于不同命名空间的块可以构成同一个“块池”B、HDFSFederation中，所有名称节点会共享底层的数据节点存储资源，数据节点向所有名称节点汇报C、设计了多个相互独立的名称节点D、HDFS的命名服务能够水平扩展答案：A200.在Python中，利用DOM方式解析XML文档,说法正确的是A、DOM方式将XML数据在内存中解析成为字符串B、DOM方式将XML数据在内存中解析成一棵树，通过对树的操作来操作XML。C、DOM方式将XML数据在内存中解析成为对象D、DOM方式将XML数据在内存中解析成为二进制数据答案：B201.在Python中，pymysql中获取游标对象的方法是哪个？A、begin（）B、commit（）C、execute（）D、cursor（）答案：D202.在HDFS文件系统根目录下创建一个名为mydir的文件夹的命令是（）。A、hdfs.create（newPath（“hdfs:/mydir”））B、hdfs.open（newPath（“hdfs:/mydir”））C、hdfs.mkdirs（“hdfs:/mydir”）D、hdfs.mkdirs（newPath（“hdfs:/mydir”））答案：D203.DougCutting所创立的项目的名称都受到其家人的启发，以下项目不是由他创立的项目是A、HadoopB、NutchC、LuceneD、Solr答案：D204.下列关于OSI网络模型说法正确的是：A、物理层这一层主要传输一些十进制数据。B、链路层主要用于网络传输。C、网络层定义网络协议，通信规则。D、会话层管理用户的会话，控制用户间逻辑的建立和中断。答案：D205.MapReduce的Shuffle过程中哪个操作是最后做的？A、溢写B、合并C、分区D、排序答案：B206.下列哪个程序通常与NameNode在一个节点启动？（）A、SecondaryNameNodeB、DataNodeC、TaskTrackerD、Jobtracker答案：D207.下列不属于Python中Flask框架特点的是？A、内置开发服务器和调试器B、与Python单元测试功能无缝衔接C、使用Jinja2模板D、端口号固定为5000，且无法修改答案：D208.在高阶数据处理中，往往无法把整个流程写在单个MapReduce作业中，下列关于链接MapReduce作业的说法，不正确的是（）A、Job和JobControl类可以管理非线性作业之间的依赖B、ChainMapper和ChainReducer类可以用来简化数据预处理和后处理的构成C、使用ChainReducer时，每个mapper和reducer对象都有一个本地JobConf对象D、ChainReducer.addMapper（）方法中，一般对键/值对发送设置成值传递，性能好且安全性高答案：D209.下列关于HDFS为存储MapReduce并行切分和处理的数据做的设计，错误的是？A、FSDataInputStream扩展了DataInputStream以支持随机读B、一台机器可能被指派从输入文件的任意位置开始处理一个分片C、为实现细粒度并行，输入分片（InputSplit）应该越小越好D、输入分片是一种记录的逻辑划分，而数据块是对输入数据的物理分割答案：C210.在Java中，java.io包的File类是A、字符流类B、字节流类C、对象流类D、非流类答案：D211.在Linux系统中，以下哪两个命令可以显示系统中运行的进程状态？A、ls和dfB、ps和topC、ps和dfD、df和top答案：B212.下列关于Combiner的描述，正确的是（）。A、在MapReduce作业流程中可随意添加CombinerB、添加了Combiner意味着MapReduce程序的运行效率得到了优化C、Combiner可以代替ReducerD、应谨慎使用Combiner答案：D213.HFile数据格式中的KeyValue数据格式中Value部分是（）。A、拥有复杂结构的字符串B、字符串C、二进制数据D、压缩数据答案：C214.在启动hadoop集群以后，查看jps进程有几个？A、3个B、4个C、5个D、6个答案：D215.Client端上传文件的时候下列哪项正确？A、数据经过NameNode传递给DataNodeB、Client端将文件切分为Block，依次上传C、Client只上传数据到一台DataNode，然后由NameNode负责Block复制工作D、以上都不正确答案：B216.以下哪个命令，不是Linux命令（）A、pwdB、cdC、mkdirD、ipconfig答案：D217.哪一个方法不在FileInputFormat类中（）,不用考虑方法参数。A、addInputPath（）B、getPathStrings（）C、getSplits（）D、List（）答案：D218.在项目实施人员中，适时与客户沟通，确立项目目标，建立组织机构，编制计划，负责项目全面管理的角色是（）。A、实施工程师B、项目经理C、产品经理D、财务人员答案：B219.在Job类中对输出键值对格式进行设置时，如果Mapper的输出格式与Reducer的输出格式一样，那么可以省略下列（）设置。A、job.setOutputKeyClass（）与job.setOutputValueClass（）B、job.setMapOutputKeyClass（）与job.setMapOutputValueClass（）C、job.setReduceOutputKeyClass（）与job.setReduceOutputValueClass（）D、以上都不能省略答案：B220.下列哪些操作可以设置一个监听器Watcher（）A、getDataB、getChildrenC、existsD、setData答案：D221.要在HDFS的根目录中建立一个叫hadoo的目录，下面哪一条命令是正确的（）A、mkdirhadooB、mkdir/hadooC、hadoopmkdirhadooD、hadoopfs-mkdir/hadoo答案：D222.下面关于Reducer类说法错误的是哪个A、Reducerreduces是一组中间值B、Reducer有3个主要阶段：1.shuffle，2.sort，3.ReduceC、在使用时，通常子类重写多个reduce（）方法即可D、在reduce方法中，KEYIN为Map的VALUEOUT集合答案：C223.在vi编辑器里，命令dd用来删除当前的A、行B、B.变量C、C.字D、D.字符答案：A224.大数据时代，数据使用的关键是A、数据收集B、B.数据存储C、C.数据分析D、D.数据再利用答案：D225.在HDFS分布式文件系统中，一般采用冗余存储，冗余因子通常设置为（）A、1B、2C、3D、4答案：C226._______模式，用于非Java客户端访问元数据库，在服务器端启动一个MetaStoreServer，客户端利用Thrift协议通过MetaStoreServer访问元数据库。A、单用户模式B、多用户模式C、多用户远程模式D、单用户远程模式答案：C227.下列关于HDFS的描述正确的是?A、DataNode通过长连接与NameNode保持通信B、NameNode磁盘元数据不保存Block的位置信息C、HDFS集群支持数据的随机读写D、如果NameNode宕机,SecondaryNameNode会接替它使集群继续工作答案：B228.下面哪个程序负责HDFS数据存储。A、NameNodeB、JobtrackerC、DatanodeD、secondaryNameNode答案：C229.在MapReduce程序中，Reducer类中包括的函数有（）。A、startup、reduce、endB、setup、reduce、cleanupC、start、run、reduce、endD、startup、run、end答案：B230.若不针对MapReduce编程模型中的key和value值进行特别设置，下列哪一项是MapReduce不适宜的运算。A、MaxB、AverageC、MinD、Count答案：B231.关于SecondaryNameNode哪项是正确的?A、它是NameNode的热备B、它对内存没有要求C、它的目的是帮助NameNode合并编辑日志，减少NameNode启动时间D、SecondaryNameNode应与NameNode部署到一个节点答案：C232.在Hadoop2.x版本下,HDFS中的文件总是按照默认大小（）被切分成不同的块,且备份3份。A、256MB、128MC、512MD、1024M答案：B233.编写MapReduce必须继承（）类A、ConfiguredB、DonfiguredC、AonfiguredD、Writable答案：A234.下面对FsImage的描述，哪个是错误的？A、FsImage文件没有记录每个块存储在哪个数据节点B、FsImage文件包含文件系统中所有目录和文件inode的序列化形式C、FsImage用于维护文件系统树以及文件树中所有的文件和文件夹的元数据D、FsImage文件记录了每个块具体被存储在哪个数据节点答案：D235.在Python中，关于execute（）说法正确的是A、只能用来执行删、改语句B、不能用来一次插入多条记录C、可以用来执行插入语句D、只能用来执行增、改语句答案：C236.在Python中，python面向对象中super的作用描述不正确的是：A、super在面向对象继承类中代指父类，书写方法super（类名,self）.属性或者方法或super（）.属性或者方法B、super机制里可以保证子类仅被执行一次，执行的顺序遵循MRO，广度优先查询方法C、super方法在类的多继承时可以简化代码，避免代码冗余D、super方法可以增加类之间调用的灵活性，当父类名发生变化时不必修改答案：B237.下列关于流计算的说法，哪项是错误的？A、实时获取来自不同数据源的海量数据，经过实时分析处理，获得有价值的信息B、流计算秉承一个基本理念，即数据的价值随着时间的流逝而降低C、对于一个流计算系统来说，它应该支持TB级甚至是PB级的数据规模D、流计算只需要保证较低的延迟时间，即只达到秒级别即可处理一切问题答案：D238.Container封装节点上多维度资源不包括（）A、内存B、CPUC、磁盘D、机架答案：D239.在编写rpc接口时需要继承什么接口类？A、VersionControlB、VersionedProtocolC、VersionControllerD、ControllerVersion答案：B240.以下关于MapReduce说话错误的是？A、Map和reduce是他们的主要思想B、用于大规模数据集的串行运算C、极大的方便了编程人员不会分布式编程D、都是从函数式和矢量编程语言借来的特性答案：B241.HDFS默认的当前工作目录是/user/$USER,的值需要在哪个配置文件内说明A、mapred-site.xmlB、core-site.xmlC、hdfs-site.xmlD、以上均不是答案：B242.下面哪个选项不是我们需要Hadoop的主要原因（）A、我们需要处理PB级别的数据B、为每个应用建立一个可靠的系统是很昂贵的C、几乎每天都有结点坏掉D、把一个任务分割成多个子任务的方式是不好的答案：D243.启动HDFS的命令是（）A、start-dfs.shB、Start-yarn.shC、start-hdfs.shD、dfs-start.sh答案：A244.在Python中，面向对象中的特殊成员以及应用场景描述不正确的是：A、__hash__:判断hash值是否相等的时候依赖__hash__方法B、set的去重机制其实就是根据__hash__和__eq__方法实现的C、__str__：和str（）print（）%s都是息息相关的，返回值一定是字符串类型D、__str__：和str（）print（）%s都是息息相关的，返回值不一定是字符串类型答案：D245.Sqoop是Hadoop和关系数据库服务器之间传送数据的工具，下列哪种数据库是不支持使用Sqoop直接进行数据传送（）A、PostgresB、OracleC、MySQLD、Redis答案：D246.在Centos7中,如果想要查看本机的主机名可以使用下面哪个命令?A、rebootB、pwdC、tailD、hostname答案：D247.在Java中，InetAddress类中哪个方法可以获取主机IP地址A、isReachable（）B、getHostAddress（）C、getHostName（）D、getByName（）答案：B248.下列哪项通常是集群的最主要瓶颈A、CPUB、网络C、磁盘IOD、内存答案：C249.目前，Hadoop的最高版本是哪个？A、Hadoop1.xB、Hadoop4.xC、Hadoop2.xD、Hadoop3.x答案：D250.在Java中，下列说法中错误的一项是A、一个线程是一个Thread类的实例B、新建的线程调用start（）方法会进入就绪状态C、线程执行的任务代码可以来自Runnable实例D、新建的线程调用start（）方法就能立即进入运行状态答案：D251.SequenceFile用于合并HDFS中的大量小文件，下列关于SequenceFile的描述错误的是（）。A、在SequenceFile中，每一对被看作一条RecordB、记录压缩是对每条记录进行压缩C、SequenceFile主要是由一个Header和多个Record组成D、Header中包含存储压缩算法答案：A252.关于MapReduce中的键值对，下面陈述正确的是（）A、Key类必须实现WritableB、Key类必须实现WritableComparableC、Value类必须实现WritableComparableD、Value类必须继承WritableComparable答案：B253.以下哪个组件可以指定对key进行Reduce分发的策略？A、RecordReaderB、CombinerC、PartitionerD、FileInputFormat答案：C254.下列说法错误的是（）A、MapReduce中maperconbinerreducer缺一不可B、在JobConf中InputFormat参数可以不设C、在JobConf中MapperClass参数可以不设D、在JobConf中OutputKeyComparator参数可以不设答案：A255.在Java的File类中，getParentFile作用是下列A、获取文件的父文件B、获取指定文件或者文件夹的父目录，如果没有则返回nullC、获取指定文件或者文件夹的父目录，如果没有则返回当前盘符根路径D、或者当前文件名答案：B256.在Java中，若要创建一个新的含有父目录的目录，应该使用下列哪一个类的实例A、FileWriterB、FileOutputStreamC、FileD、以上都对答案：C257.配置Hadoop时，JAVA_HOME包含在哪一个配置文件中A、hadoop-default.xmlB、hadoop-env.shC、hadoop-site.xmlD、configuration.xs答案：B258.在Python中，阅读代码，选择结果：＆#x000D;classPerson:＆#x000D;"人的类"＆#x000D;name=""＆#x000D;age=0＆#x000D;defeat（self）:＆#x000D;print（,"正在吃饭"）＆#x000D;＆#x000D;classStudent（）:＆#x000D;"学生类"＆#x000D;defstudy（self）:＆#x000D;print（,"正在学习"）＆#x000D;per1=Person（）＆#x000D;="张三"＆#x000D;per1.eat（）A、张三正在吃饭小明正在学习B、张三正在吃饭C、无语法错误，但不能输出结果D、代码非法，不能解释答案：B259.在Linux中，假设变量a为10，变量b为20，以下表达式返回为false的是：A、[$$a-ne$$b]B、[$$a-le$$b]C、[!false]D、[$$a-gt$$b]答案：D260.加载数据到Hive

人人文库> 全部分类> 教育资料 > 考试试卷

温馨提示

1. 本站所有资源如无特殊说明，都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2. 本站的文档不包含任何第三方提供的附件图纸等，如果需要附件，请联系上传者。文件的所有权益归上传用户所有。
3. 本站RAR压缩包中若带图纸，网页内容里面会有图纸预览，若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 人人文库网仅提供信息存储空间，仅对用户上传内容的表现方式做保护处理，对用户上传分享的文档内容本身不做任何修改或编辑，并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容，请与我们联系，我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

【必做】《hadoop基础练习》历年考试真题库及答案（高频500题）

文档简介

温馨提示

最新文档

评论

【必做】《hadoop基础练习》历年考试真题库及答案（高频500题）

文档简介

温馨提示

最新文档

评论

相关文档