《Hadoop大数据框架》参考试题库（含答案）

上传人：缘*** IP属地：河北上传时间：2025-12-08 格式：PDF 页数：126 大小：22.80MB 积分：12 举报 版权申诉

已阅读5页，还剩121页未读，继续免费阅读

版权说明：本文档由用户提供并上传，收益归属内容提供方，若内容存在侵权，请进行举报或认领

文档简介

《Hadoop大数据框架》参考试题库(含答案)

一、单选题

1.用户提交的每个应用程序均包含一个()，负责程序内部各阶段的资源申请和监

督执行情况。

A、NodeManager

B、AppIicationMaster

C、ResourceManager

D\Container

答案：B

解析：ApplicationMaster是用户提交的每个应用程序中包含的角色，负责程序

内部各阶段的资源申请，监督程序的执行情况，所以答案选B。

2.WordCount案例中，Map阶段的核心是什么？

A、对输入数据进行排序

B、对输入数据进行过滤

C、把输入的数据经过切割，全部标记1

D、合并相同的key

答案：C

解析：CWordCount案例中，Map阶段的核心是把输入的数据经过切割，全部标记

1,因此

3.在Hive中创建数据库的语法格式中，用于指定数据库名称的是()。

A、CREATE

B、DATABASE

C、database_name

D、COMMENT

答案:C

解析：CREATE用于创建操作，DATABASE用于限定创建数据库，COMMENT用于添

加数据库注释，而database_name才是表示创建数据库的名称，在CREATE(DATA

BASE|SCHEMA)[IFNOTEXISTS]database_name语法中明确了其作用。

4.HDFS的副本机制中，副本数由哪个参数控制？

A、dfs.repIication

Bxdfs.copy

C、dfs.backup

D、fs.dupIicate

答案：A

解析：副本数由参数dfs.replication控制，默认值是3。

5.YARN中的从角色，负责管理本机器上计算资源的是()。

A、NodeManager

B、AppIicationMaster

C、ResourceManager

D、Container

答案:A

解析：NodeManager是YARN中的从角色，一台机器上一个，负责管理本机器上

的计算资源，所以答案选A。

6.Hive中使用ALTERTABLE语句修改表名时，()。

A、会同时修改表的元数据和数据存储路径

B、只修改表的元数据，数据存储路径不变

C、只修改数据存储路径，元数据不变

D、会删除原表重新创建新表

答案：B

解析：ALTERTABLE语句修改表名仅修改表的元数据，数据存储路径不会改变，

不会删除原表重新创建，也不是只修改数据存储路径而元数据不变。

7.在Driver类中，哪个方法用于设置作业不使用Reducer?

AxsetNumReduceTasks(0)

B、setReducerClass(nulI)

CxdisabIeReduce()

D、unsetReducer()

答案：A

解析：setNumReduceTasks(0)方法用于设置作业不使用Reducer,即作业只有M

ap阶段。

8.在Hive中使用LOADDATA语句加载数据时，以下哪种情况可能导致加载性能较

低0。

A、加载的数据文件在本地文件系统，且与Hive服务在同一节点

B、加载的数据文件已经在HDFS上，且与目标表在同一目录结构下

C、加载的数据文件较大，且没有进行任何预处理(如压缩)

D、加载的数据文件格式与目标表定义的格式完全匹配

答案：C

解析：加载较大且未预处理的数据文件时，由于数据量大且未优化（如压缩可减

少传输和存储开销），可能导致加载性能较低;数据文件在本地且与Hive服务在

同一节点或在HDFS上且与目标表目录结构合理以及格式匹配都有利于提高加载

性能。#数据查询效率对比

9.Hive中修改表结构时，使用（）关键字添加列。

A、DDCOLUMN

B、INSERTCOLUMN

C、UPDATECOLUMN

D、CHANGECOLUMN

答案：A

解析：在Hive中使用ADDCOLUMN关键字来添加列到表结构中，INSERTCOLUMN.U

PDATECOLUMN不是正确的修改表结构添加列的关键字，CHANGECOLUMN主要用于修

改列名等操作。

10.Hive中，对于外部表的数据文件，（）。

A、Hive完全管理其存储和生命周期

B、Hive只管理元数据，不管理数据文件本身

C、Hive可以随意修改数据文件内容

D、Hive在删除表时会自动删除数据文件

答案：B

解析：对于外部表，Hive只管理元数据，数据文件的存储位置等信息记录在元

数据中，但Hive不管理数据文件本身的存储和生命周期，不会随意修改其内容，

在删除外部表时也不会自动删除数据文件（与内部表不同）。

11.以下哪个命令用于向hdfs上的文件追加内容？

A、hadoopfs-appendToFiIe

B、hadoopfs-mkdir

C、hadoopfs-touchz

D、hadoopfs-rm

答案：A

解析：hadoopfs-appendToFiIe向hdfs上的文件追加内容。

12.以下哪个命令用于复制文件到本地文件系统？

Axhadoopfs-get

B、hadoopfs-put

C、hadoopfs-rm

D、hadoopfs-du

答案：A

解析：hadoopfs-get复制文件到本地文件系统。

13.下列关于HDFS的说法正确的是（）。

A、NameNode负责HDFS中的数据存储

B、DataNode负责HDFS中的数据存储

C、SecondaryNameNode通常与NameNode在一个节点启动

D、元数据指的是文件实际的数据

答案：B

14.yarn-site,xml文件的作用是0。

A、设置了Hadoop基本运行环境的配置

B、设置了YARN框架运行环境的配置

C、设置了YARN框架的相关配置

D、设置了MapReduce框架的相关配置

答案：C

15.在MapReduce的Partition分区中，默认分区是根据什么对ReduceTasks个

数取模得到的？

Axkey的hashCode

B、vaIue的hashCode

Cxkey和vaIue的hashCode之和

D、key和vaIue的hashCode之差

答案：A

解析：默认分区是根据key的hashCode对ReduceTasks个数取模得到的。

16.以下哪个命令用于创建目录？

A、hadoopfs-rm

B、hadoopfs-rmdir

C、hadoopfs-touchz

D、hadoopfs-mkdir

答案：D

解析：hadoopfs-mkdir接受路径指定的uri作为参数,创建这些目录。

17.在Driver类中,哪个方法用于设置Mapper类?

A、setMapperClass()

B、setReducerCIass0

CxsetPartitionerCIass()

D、setCombinerCIassI)

答案：A

解析：setMapperClass()方法用于指定Map阶段使用的Mapper类。

18.SecondaryNameNode的主要作用是什么？

A、替代NameNode

B、帮助主角色进行元数据文件的合并动作

C、存储实际数据

D、管理DataNode的网络连接

答案：B

解析：SecondaryNameNode主要是帮助NameNode进行元数据文件的合并动作。

19.以下哪个方法不是Mapper类中的方法？

A、setup0

B、map()

C、Ieanup()

D、reduce()

答案：D

解析：Mapper类中通常包含setup。、map()和cleanup()方法，但不包含redu

ce()方法，reduce()方法是Reducer类的一部分。

20.某电信公司使用Hive存储用户通话记录数据，数据包含通话时间、通话时长、

主叫号码、被叫号码等字段。如果要统计每个用户每月的通话总时长，应该按照

以下哪种方式建表更合适0。

A、创建一个普通表，将所有数据存储在一起，在查询时通过函数计算每月通话

时长

B、创建一个分区表，以用户号码为分区字段，在查询时统计每个分区内的数据

C、创建一个分区表，以通话时间的年份和月份为分区字段，在查询时统计每个

分区内的数据

D、创建一个桶表，根据用户号码进行分桶，在查询时统计每个桶内的数据

答案：C

解析：按通话时间的年份和月份为分区字段创建分区表，能方便地在查询时直接

定位到特定月份的数据，快速统计每个用户每月的通话总时长;普通表查询时计

算效率低;仅以用户号码分区不利于按月份统计;桶表主要用于提高特定类型查

询效率，在此场景不如分区表合适。#优化策略选择

21.Hive是一款建立在0之上的开源数据仓库系统。

A、Hadoop

B、Spark

C、MySQL

D、HBase

答案:A

解析：ApacheHive是建立在Hadoop之上的开源数据仓库系统，可将Hadoop文

件中的数据文件映射为数据库表，并基于表提供类似SQL的查询模型。

22.假设你是一家电商公司的数据分析师，公司想要了解用户在不同时间段（上午、

下午、晚上）的购买偏好，以便进行精准营销。你决定使用Hive数据仓库来处理

数据，你首先会进行以下哪项操作？

A、在Hive中创建一个分区表，以时间（上午、下午、晚上）作为分区字段，用于

存储用户购买数据

B、直接使用Hive的内置函数对原始数据进行分析，无需创建特殊表结构

C、将所有用户购买数据加载到一个普通的Hive表中，然后在查询时通过筛选条

件来区分不同时间段的数据

D、先将数据导出到本地数据库，再使用本地数据库的功能进行时间维度的分析

答案：A

解析：创建分区表可以根据分区字段（如时间）将数据进行分类存储，在查询时能

够快速定位到特定时间段的数据，提高查询效率，更适合用于分析不同时间段的

购买偏好;直接使用内置函数在原始数据上分析效率较低且不便于管理不同时间

段数据；将所有数据放在普通表中通过筛选条件查询效率不如分区表；将数据导

出到本地数据库再分析增加了操作复杂性且失去了Hive处理大数据集的优势。#

对比分析型

23.在Hadoop中,使用（）命令格式化NameNodeo

A、hdfsnamenode-format

B、start-format.sh

C、start-mapred.sh

D、hadoopjob-historyoutdir

答案:A

24.配置Hadoop时，下列配置文件中包含JAVA_H0ME变量的是0。

Axhadoop-defauIt.xml

B、hadoop-env.sh

Cxhadoop-site.xml

D、configuration.xs

答案：B

25.Hive与传统数据库相比，在执行延迟方面0。

A、更低

B、更高

C、相同

D、无法比较

答案：B

解析：Hive由于其底层执行机制（如基于MapReduce等），相比传统数据库执行

延迟更高，传统数据库在执行简单查询等操作时通常能更快返回结果。

26.在MapReduce编程中，哪个类负责设置MapReduce作业，并在Hadoop中运行?

A、Mapper类

B、Reducer类

C、Driver类

D、WordCount类

答案：C

解析：Driver类负责设置MapReduce作业，并在Hadoop中运行。

27.随着数据量和业务需求的增长，Hive数据仓库架构可能需要演变。以下哪个

方向不太可能是其演变方向0。

A、更加紧密地集成机器学习算法，直接在Hive中进行复杂的机器学习任务

B、逐渐脱离Hadoop生态系统，独立发展成为一个通用的数据处理平台

C、进一步优化查询执行引擎，提高查询性能和处理大规模数据的能力

D、增强数据治理功能，如数据血缘分析、数据质量监控等

答案：B

解析：Hive基于Hadoop构建，其优势依赖于Hadoop生态系统，如HDFS存储和

MapReduce计算框架等，脱离该生态系统独立发展不太现实;集成机器学习算法、

优化查询引擎和增强数据治理功能都是符合数据仓库发展趋势和需求的演变方

向。#数据安全与隐私保护

28.Hive中，如果要查询一个表中的前10条数据，使用。关键字。

A、T0P10

B、LIMIT10

C、FIRST10

D、HEAD10

答案：B

解析：在Hive查询中使用LIMIT10可以获取表中的前10条数据，T0P10.FIRS

T10、HEAD10不是Hive中用于此目的的正确关键字。

29.在MapReduce中,哪个类负责设置MapReduce作业，并在Hadoop中运行？

A、Mapper类

B、Reducer类

C、Driver类

D\Combiner类

答案：C

解析：Driver类负责设置MapReduce作业,并在Hadoop中运行。

30.数据仓库的数据来源通常是()。

A、单一外部系统

B、多个外部系统

C、内部生成

D、随机生成

答案：B

解析：数据仓库的数据来源于不同外部系统，这些数据被集成到数据仓库中用于

分析等目的，而不是单一外部系统、内部生成或随机生成。

31.以下哪个命令用于移动文件？

Axhadoopfs-mv

B、hadoopfs-mkdir

C、hadoopfs-touchz

D、hadoopfs-rm

答案：A

解析：hadoopfs-mv将文件从源路径移动到目标路径。

32.以下不属于Hadoop配置文件的是()。

A、hadoop-site.xml

B、hdfs-site.xml

C、mapred-site.xml

Dxcore-site.xml

答案：A

33.已知Hive的数据存储在HDFS上，其执行查询时会将HiveQL转换为MapRedu

ce任务执行。当执行一个复杂的多表关联查询时，如果希望提高查询效率，以

下哪种方法不太合理？

A、合理设计表结构，如对经常关联的字段建立合适的索弓1（如果支持）

B、根据数据特点和查询需求，对表进行分区或分桶操作

C、直接在Hive中编写复杂的HiveQL语句，不做任何优化，依赖Hive自动优化

执行计划

D、调整MapReduce任务的相关参数，如增加Reduce任务的数量（在合理范围内）

答案：C

解析：虽然Hive会自动优化执行计划，但对于复杂的多表关联查询，仅依赖自

动优化往往不能达到最佳效率;合理设计表结构建立索弓1（若支持）可以加速数据

检索;分区和分桶操作有助于快速定位和处理数据;调整MapReduce任务参数如R

educe数量在合理范围内也可能提高效率。#实际案例型（根据案例场景选择最佳

方案）

34.在Hive数据仓库中，关于数据生命周期管理，以下说法正确的是0。

A、数据一旦加载到Hive表中，就会一直存储，直到手动删除

B、可以根据数据的重要性和使用频率，设置数据的过期时间，自动清理过期数

据

C、Hive会自动根据数据的访问时间，定期删除长时间未访问的数据

D、数据生命周期管理只与数据存储容量有关，与数据的业务价值无关

答案：B

解析：在Hive中可以根据业务需求，依据数据重要性和使用频率等设置数据过

期时间，自动清理过期数据，实现数据生命周期管理;数据不是加载后就一直存

储，Hive不会自动根据访问时间删除未访问数据，数据生命周期管理与业务价

值密切相关，不仅仅是存储容量问题。#集群资源分配与管理

35.在Hive中，对一个大表（数据量达到数十亿行）进行查询操作，如果要提高查

询性能，以下哪种操作对性能提升最不明显？

A、对查询涉及的字段建立合适的索弓1（如果支持）

B、根据查询条件对大表进行分区，查询时只扫描相关分区的数据

C、增加集群中DataNode的数量，但不调整其他用关配置

D、优化查询语句，避免使用复杂的嵌套子查询和全表扫描操作

答案：C

解析：增加DataNode数量本身并不一定会直接提升查询性能，还需要考虑数据

分布、网络带宽、任务调度等诸多因素，且如果不调整其他相关配置，可能无法

充分利用新增节点资源;建立索引、分区表和优化查询语句都是针对查询性能优

化的常见有效方法，对提升大表查询性能有明显作用。

36.MapReduce的核心原理由哪两个阶殴组成？

A、Map和Reduce

B、Split和Merge

C、Load和Store

D、Input和Output

答案：A

解析：MapReduce的核心原理由Map（映射）和Reduce（规约）两个阶段组成。

37.DataNode在HDFS中承担什么角色？

A、负责维护文件系统的namespace名称空间

B、负责具体的数据块存储

C、管理元数据

D、处理客户端的请求

答案:B

解析：DataNode是HadoopHDFS中的从角色，负责具体的数据块存储。

38.在FilelnputFormat切片机制中，切片大小默认等于什么？

A、minSize

BxmaxSize

CxBlocksize

D、SpIitsize

答案：C

解析:在FilelnputFormat切片机制中，切片大小默认等于BIocksize。

39.在Hive数据仓库中，元数据存储系统不可以使用0。

A、MySQL

B、Derby

C、Oracle

D、HDFS

答案：D

解析：Hive通常将元数据存储在MySQL、Derby等数据库中，HDFS是用于存储数

据文件的，不是元数据存储系统，Oracle虽然也可以作为数据库存储元数据，

但在常见的Hive配置中使用相对较少。

40.KeyVaIueTextInputFormat的默认分隔符是什么？

A、空格

B\逗号

G制表符(\t)

D、换行符

答案：C

解析:KeyVaIueTextInputFormat的每一行均为一条记录，被分隔符分割为key,

value。默认分隔符是制表符(\t)°

41.某互联网公司有海量的用户行为日志数据存储在Hadoop文件系统中，每天的

数据量达到数TB级别。现在需要对这些数据进行分析，统计每个用户每天的操

作次数，并按照操作次数进行排序，找出操作最频繁的前100名用户。以下哪种

Hive操作方案最适合？

A、每天将新的用户行为日志数据加载到一个普通的Hive表中，然后在查询时使

用复杂的嵌套子查询来计算每个用户每天的操作次数并排序

B、创建一个外部表指向用户行为日志数据，使用分区表按日期进行分区，然后

编写HiveQL查询，先按用户和日期分组计算操作次数，再排序取前100名

C、将所有用户行为日志数据一次性加载到一个内部表中，然后使用Hive的窗口

函数计算每个用户每天的操作次数，最后排序取前100名

D、先使用其他工具对数据进行预处理，将每天每个用户的操作次数计算好并存

储为新文件，再将这些文件加载到Hive表中进行排序查询

答案：B

解析：创建外部表并按日期分区，可以方便管理和快速定位每天的数据，先分组

计算操作次数再排序取前100名是合理的分析流程;每天加载到普通表并使用复

杂嵌套子查询效率低且不便于管理大量数据;一次性加载所有数据到内部表对于

海量数据可能存在性能问题且窗口函数对于这种大规模计算也可能效率不高;使

用其他工具预处理增加了系统复杂性且失去了Hive直接处理大数据集的优势。#

代码理解型（分析代码片段功能）

42.以下不属于YARN三大组件的是（）。

A、ResourceManager

B、NodeManager

C、ApplicationMaster

D、HDFS

答案：D

解析：YARN三大组件包括ResourceManager、NodeManagervAppIicationMaste

r,HDFS不属于YARN组件，所以答案选D。

43.Hive中删除表的语法是（）。

A、DROPTABLE[IFEXISTS]tabIe_name

B、DELETETABLEtabIe_name

C、REMOVETABLEtabIe_name

D、ERASETABLEtabIename

答案：A

解析：Hive中使用DROPTABLE[IFEXISTS]tabie_name语法来删除表，DELETEFRO

M用于删除表中的数据，而REMOVETABLE和ERASETABLE不是Hive中删除表的正

确语法。

44.随着大数据技术的不断发展，Hive在数据仓库领域的应用越来越广泛。以下

关于Hive未来发展趋势的预测中，不太可能的是：

A、Hive将不断优化其执行引擎，提高查询性能，减少与传统关系型数据库在执

行效率上的差距

B、Hive会逐渐放弃对Hadoop生态系统的依赖，独立发展成为一个全新的数据

处理平台

C、Hive将增加更多与机器学习、人工智能相关的功能，以满足数据分析领域不

断增长的需求

D、Hive在数据安全和隐私保护方面会不断加强，提供更完善的安全机制

答案：B

解析：Hive是基于Hadoop构建的数据仓库系统，其优势很大程度上依赖于Had

oop生态系统，如HDFS存储和MapReduce计算框架等，它不太可能放弃这种依

赖而独立发展;不断优化执行引擎提高性能、增加与机器学习等相关功能以及加

强数据安全都是符合大数据技术发展需求和趋势的。#架构理解型(根据架构特点

选择操作)

45.Hive的数据模型中不包括以下哪种()。

A、数据库

B、视图

C、队列

D、表

答案：C

解析：Hive的数据模型主要包括数据库、表(内部表、外部表、带分区的表、桶

表)和视图，不包括队列。

46.在MapReduce的Map阶段，数据切片默认大小与哪个参数相等？

A、BIocksize

B、FiIesize

C、Memorybuffersize

D、SpIitsize

答案：A

解析：默认Splitsize二Blocksize(128M),每一个切片由一个MapTask处理。

47.如何设置Map输出键的类型？

AvsetMapOutputKeyCass()

B、setOutputKeyCIass()

C、setKeyCIass0

D、setOutputVaIueCIass()

答案：A

解析：setMapOutputKeyClass()方法用于设置Map阶段输出键值对中键的类型。

48.MapReduce框架中，哪个类负责定义数据如何分区？

A、Mapper类

B、Reducer类

C、Partitioner类

D、Combiner类

答案：C

解析：Partitioner类定义了MapReduce中数据的分区规则，决定了数据如何分

配到不同的Reducer任务。

49.在Hive中执行一个复杂的多表连接查询，发现查询速度很慢。以下哪种优化

策略最有可能提高查询速度()。

A、增加集群中节点的内存容量

B、对连接的表提前进行排序

C、将连接操作转换为子查询

D、合理设置MapReduce任务的参数，如调整Map和Reduce任务的数量

答案：D

解析：合理设置MapReduce任务参数，根据数据量和节点资源情况调整Map和R

educe任务数量，可以优化任务执行效率，提高查询速度;增加内存容量不一定

能直接解决查询慢的问题，且可能成本较高;提前排序不一定能有效优化多表连

接查询;将连接操作转换为子查询可能会使查询更复杂，不一定提高速度。#数据

一致性判断

50.Hive在()模式下，只允许一个会话连接。

A、内嵌模式

B、直连数据库模式

C、远程模式

D、本地模式

答案：A

解析：内嵌模式使用内嵌的Derby数据库存储元数据，在此模式下只允许一个会

话连接，若尝试多个会话则连接时将报错；直连数据库模式和远程模式可实现多

节点访问元数据信息的共享。

51.MapReduce程序最后输出的结果通常都是按键值对进行排序的，那么排序工

作发生在()阶段。

A、Map

B、ShuffIe

C、Reduce

D、Combiner

答案:B

52.在MapReduce框架中，在Mapper和Reducer之间的ShuffIe的作用是()。

A、对Map的输出结果排序

B、对Map的输出结果再次进行映射

C、对中间结果进行混洗，将相同键的键值对数据进行汇集

D、对中间输出结果进行压缩

答案：C

53.Hive的查询语言是()°

A、SQL

B、HQL

C、Python

DxJava

答案：B

解析：Hive基于表提供了一种类似SQL的查询模型，称为Hive查询语言(HQL),

用于访问和分析存储在Hadoop文件中的大型数据集。

54.以下哪个命令用于删除指定的文件(只删除非空目录和文件)?

A、hadoopfs-rm

B、hadoopfs-rmdir

C、hadoopfs-touchz

D、hadoopfs-mkdir

答案：A

解析：hadoopfs-rm删除指定的文件(只删除非空目录和文件)。

55.在MapReduce的Reduce阶段，ReduceTask会主动从哪里复制拉取属于自己

需要处理的数据？

A、DataNode

B\Namenode

C、MapTask

D、CIient

答案：C

解析：ReduceTask会主动从MapTask复制拉取属于需要自己处理的数据。

56.Hive中，要将查询结果插入到一个新表中，新表()。

A、必须已存在

B、可以不存在，会自动创建

C、不能与原表结构相同

D、必须与原表在同一数据库中

答案：B

解析：在Hive中使用INSERTINTO或INSERTOVERWRITE将查询结果插入新表时,

新表可以不存在，Hive会根据查询结果的结构自动创建新表;新表可以与原表结

构相同，也不一定必须与原表在同一数据库中。

57.在HDFS上创建了一个错误的目录/Tipdm/Spark,现需要删除这个目录，可以

使用的命令是0。

A、hdfsdfs-rm/Tipdm/Spark

B、hdfsdfs-deIete/Tipdm/Spark

C、hdfsdfs-drop/Tipdm/Spark

D、hdfsdfs-rmdir/Tipdm/Spark

答案：D

58.Hive中创建桶表时，CLUSTEREDBY子句指定的列用于()。

A、确定桶的数量

B、对数据进行排序

C、计算桶的存储位置

D、选择桶的存储格式

答案：C

解析：CLUSTEREDBY子句指定的列用于对列值进行哈希计算后，除以桶的个数求

余，最终决定该条记录存放在哪个桶当中，即计算桶的存储位置;确定桶的数量

用INTOnum_bucketsBUCKETS;排序用SORTEDBY;存储格式用STOREDAS指定。

59.MapReduce的执行流程中，哪个阶段负责“合并”?

A、Map阶段

B、Reduce阶段

C、Shuffle阶段

D、Sort阶段

答案：B

解析：Reduce阶段负责“合并”，即对Map阶段的结果进行全局汇总。

60.以下哪个方法不是Reducer类中的方法？

Avsetup0

B、reduce()

C\Ieanup()

D、map()

答案：D

解析：Reducer类中通常包含setup。、reduce()和cleanup。方法,但不包含m

ap()方法，map()方法是Mapper类的一部分。

61.数据仓库的数据具有以下哪个特征0。

A、易失性

B、面向事务

C、非集成性

D、时变性

答案：D

解析：数据仓库的数据具有时变性，包含各种粒度的历史数据，且数据需要随着

时间更新以适应决策需要;数据仓库是非易失性的，数据稳定且不会轻易改变;

数据仓库是面向主题的，而非面向事务;数据仓库具有集成性，会对分布在多个

系统中的数据进行统一与综合。

62.以下哪个命令用于将文件从本地目录上传到分布式文件系统指定目录中。

Axhadoopfs-get

B、hadoopfs-put

C、hadoopfs-rm

D、hadoopfs-du

答案:B

解析：hadoopfs-put将文件从本地目录上传到分布式文件系统指定目录中。

63.在Linux虚拟机下安装Java时，使用的JDK安装包格式为()。

A、exe

B、tar.gz

C、msi

D、rpm

答案：D

解析：文档中详细描述了在Linux虚拟机下安装Java的过程，上传的JDK安装

包为jdk-8u281-linux-x64.rpm,因此使用的是.rpm格式的安装包。.exe格式

通常用于Windows系统的安装程序，.tar.gz格式一般是压缩包，需要解压后再

进行安装配置，.msi格式也是Windows系统下的安装包格式，均不符合在Linu

x系统下安装Java的要求。

64.Driver类中用于创建Job对象的方法是？

A、Job.getInstance0

B、Job.create()

C、Job.newlnstance0

D、Job.buiId()

答案：A

解析：在Driver类中，Job.getInstance()方法用于创建一个新的Job对象,这

是设置作业属性和提交作业的前提。

65.Hive中默认的执行引擎是0。

A、MapReduce

B、Tez

C、Spark

D、自身执行引擎

答案：A

解析：Hive底层执行引擎使用的是Hadoop的MapReduce框架，虽然也可以使用

Tez、Spark等执行引擎，但默认是MapReduce。

66.MapReduce框架中，哪个类负责设置作业并提交任务？

A、Mapper类

B、Reducer类

C、Driver类

D、Combiner类

答案：C

解析：Driver类负责设置MapReduce作业，并在Hadoop中运行，包括设置Map

per和Reducer类以及作业名，并提交任务。

67.在Hive中，如果一个表中的某列数据类型为DECIMAL(10,2),以下关于该列

数据的说法正确的是()。

A、该列可以存储最多10位整数和2位小数的数值，超出范围会自动四舍五入

B、该列可以存储任意精度的数值，10和2只是表示一种格式约定

C、该列只能存储整数，小数部分会被截断

D、该列存储的数值总长度不能超过10位(包括小数点)

答案：A

解析：DECIMAL(10,2)表示该列可以存储最多10位整数和2位小数的数值，超出

范围会根据规则(如四舍五入等)进行处理;不能存储任意精度数值，有精度限制;

不是只能存储整数;数值总长度是包括整数位、小数点和小数位共10位，而不是

不超过10位(包括小数点)。#数据加载性能影响

68.下列关于Hadoop的说法错误的是()。

A、Hadoop集群能够部署在不同的机器上

B、Hadoop集群搭建完成后，不能删减和增加节点

C、Hadoop能够在所有节点并行地处理数据，具有高效性

D、Hadoop上的应用程序可以用C++语言编写

答案：B

69.Hive中创建外部表时，使用的关键字是()。

A、EXTERNAL

B、PARTITIONED

C、LUSTERED

D、SORTED

答案：A

解析：EXTERNAL关键字用于创建外部表，在建表时指定一个指向实际数据的路

径,不对数据位置做改变;PARTITIONED用于创建分区表，CLUSTERED用于将表组

织成桶，SORTED用于对列排序。

70.在MapReduce程序中，Reducer模块中的自定义MaxReducer类继承（）父类。

A、Map

B、Reducer

C、Reduce

D、Partitioner

答案：B

71.MapReduce的执行流程中，哪个阶段负责“拆分”？

AxMap阶段

B、Reduce阶段

C、Shuffle阶段

D、Sort阶段

答案：A

解析：Map阶段负责“拆分”，即把复杂任务分解为若干个简单的子任务来并行

处理。

72.在Hive数据仓库中，为了保证数据质量，以下哪种做法不太有效0。

A、在数据加载到Hive表之前，进行数据清洗和睑证，去除无效或错误数据

B、定期对数据进行一致性检查，如检查不同表之间相关数据的一致性

C、只依赖Hive的内置函数进行数据处理，不进行额外的数据质量监控

D、建立数据质量监控指标体系，实时监测数据质量状况

答案：C

解析：只依赖内置函数而不进行额外的数据质量监控无法全面保障数据质量，数

据加载前清洗验证、定期一致性检查和建立监控指标体系都是有效的数据质量保

障措施。#数据可视化集成

73.以下哪个命令用于将hdfs上的多个文件合并到本地文件？

A、hadoopfs-getmerge

B、hadoopfs-mkdir

C、hadoopfs-touchz

D、hadoopfs-rm

答案：A

解析：hadoopfs-getmerge接受一个源目录和一个目标文件作为输入，并且将源

目录中所有的文件连接成本地目标文件。

74.在MapReduce的Driver类中，哪个对象用于存储作业配置？

A、Job

B、Configuration

C、JobConf

D、Context

答案：B

解析：在Driver类中，Configuration对象用于存储和处理作业的配置信息。

75.下列可以下载HDFS上的/user/root/1ive.txt文件至Linux本地的/opt目录

下的命令是()。

A、hdfsdfs-get/user/root/1ive.txt/opt/

B、hdfsdfs-downIoad/user/root/1ive.txt/opt/

C、hdfsdfs-put/user/root/1ive.txt/opt/

Dxhdfsdfs-move/user/root/1ive.txt/opt/

答案：A

76.以下哪种调度器是HadoopLx中JobTracker原有的调度器实现，在YARN中

保留下来的？()

AxFIFOScheduIer

B、CapacityScheduIer

C\FairScheduIer

D、以上都不是

答案：A

解析：FlFOScheduIer是Hadoopl.x中JobTracker原有的调度器实现，在YARN

中保留了下来，所以答案选A。

77.Hive中，关于分区表和桶表的描述，正确的是0。

A、分区表和桶表不能同时使用

B、分区表是更细粒度的划分，桶表是粗粒度划分

C、分区表按列值划分，桶表按文件夹划分

D、分区表和桶表都可以提高查询性能

答案：D

解析：分区表和桶表都可以通过一定方式提高查询性能，分区表按分区字段的值

对表进行划分，桶表是对数据进行更细粒度的哈希划分;它们可以同时使用，分

区表不是更细粒度划分（相比桶表而言），桶表也不是按文件夹划分（分区表才是

按文件夹形式存在分区）。

78.在MapReduce中，Driver类的主要作用不包括以下哪项？

Ax指定Mapper和Reducer类

B、设置作业名

C、提交MapReduce作业

D、处理输入输出数据

答案:D

解析：Driver类的主要作用是指定Mapper和Reducer类、设置作业名和提交M

apReduce作业，而不直接处理输入输出数据。

79.在Hive中，视图是（）。

A、可更新的

B、只读的

C、可删除的

D、可插入数据的

答案:B

解析：Hive的视图是只读的，依赖的基本表数据增加不会影响视图呈现，但如

果删除基本表会出现问题，视图本身不可更新、插入数据（虽然可以通过特殊方

式间接更新，但本质上视图设计为只读），也不是专门用于删除操作的。

80.当MapReduce处理数据时，下列执行流程正确的是0。

A、Map——ShuffIe——Sort——Reduce

B、ShuffIe——Map——Sort—Reduce

C、Map-Reduce-ShuffIe-Sort

D、Map-Sort一ShuffIe一Reduce

答案：A

81.在Hive数据仓库和传统关系型数据库（如MySQL）中，关于数据更新操作，以

下说法正确的是：

A、Hive和传统关系型数据库都支持高效的行级数据更新操作

B、Hive支持高效的行级数据更新操作，传统关系型数据库不支持

C、传统关系型数据库支持高效的行级数据更新操作，Hive默认不支持，需要额

外配置且效率相对较低

D、Hive和传统关系型数据库都不支持数据更新操作

答案：C

解析：传统关系型数据库如MySQL支持高效的行级数据更新操作，这是其常见功

能之一;而Hive默认未开启支持单条更新操作，若要使用更新操作需要在配置文

件中添加配置，且相比传统数据库其更新操作效率较低，因为Hive主要用于大

数据集的批量处理和分析。#操作步骤型（错误步骤分析）

82.下列不能将Linux本地的/opt/a.txt文件上传至HDFS的/user/root目录下

的命令是（）。

A、hdfsdfs-copyFromLocaI/opt/a.txt/user/root/

B、hdfsdfs-moveFromLocal/opt/a.txt/user/root/

C、hdfsdfs-put/opt/a.txt/user/root/

D、hdfsdfs-copyToLocal/opt/a.txt/user/root/

答案：D

83.在Hive中有两个表，表A有100万行数据，表B有10万行数据，且两个表

都有一个共同的字段用于连接。如果要执行一个连接查询，以下哪种连接方式可

能效率最高()。

A、先对表A和表B分别进行全表扫描，然后在内存中进行连接操作

B、使用Map端连接(Map-sidejoin),将小表B加载到内存中与大表A进行连接

C、使用Reduce端连接(Reduce-sidejoin),通过网络传输数据进行连接

D、先将表A和表B按照连接字段进行排序，然后再进行连接

答案:B

解析：当一个表较小(如这里的表B)时，使用Map端连接将小表加载到内存中与

大表连接，可以减少网络传输和Reduce阶段的计算量，提高查询效率;全表扫描

然后内存连接对于大数据量表效率低；Reduce端连接网络传输开销大;排序后连

接不一定比Map端连接效率高，且排序本身也有开销。#数据仓库架构演变

84.仅查看集群在线节点的基本信息可以使用()命令。

A、hdfsdfsadmin-report

B、hdfsdfsadmin-report-Iive

C、hdfsdfsadmin-report-dead

D、hdfsdfsadmin-report-decommissioning

答案：B

85.在Hive中,下列关于桶表的描述错误的是()。

A、桶表可以提高查询处理效率

B、桶表是针对某一列进行组织的

C、桶表的分区是以文件夹的形式存在

D、桶表可以使取样更高效

答案：C

解析：桶表是更为细粒度的数据范围划分，针对某一列进行桶的组织，能获得更

高的查询处理效率且使取样更高效;而分区表的分区是以文件夹的形式存在，C

选项描述的是分区表的特征，不是桶表。

87.MapReduce中的Driver类通常包含哪个方法？

A、map()

B、reduce()

C、main()

D、partition()

答案：C

解析：Driver类通常包含main。方法，这是MapReduce程序的入口点，用于初

始化设置并提交作业。

88.Hive采用客户端/服务器（Client/Server,C/S）模式，其元数据存储在数据

库中（如MySQL或Derby）。在一个多用户的环境中，如果要确保元数据的一致性

和高效访问，以下哪种做法是正确的？

A、所有用户都使用内嵌模式（使用内嵌的Derby数据库），这样每个用户都有独

立的元数据存储，互不干扰

B、使用直连数据库模式（如连接到MySQL）,但不对元数据进行任何管理和优化，

依赖Hive自动处理并发访问

C、选择远程模式，将元数据服务作为单独的服务启动，确保所有用户通过统一

的元数据服务访问元数据，并对元数据服务进行适当的配置和优化

D、随机选择一种模式，因为Hive的三种模式在多用户环境下对元数据的处理没

有太大区别

答案：C

解析：远程模式将元数据服务独立启动，便于统一管理和优化，能确保多用户环

境下元数据的一致性和高效访问；内嵌模式只允许一个会话连接，不适合多用户

环境；直连数据库模式虽然可共享元数据，但不进行管理和优化可能导致并发访

问问题;三种模式在多用户环境下对元数据处理有明显区别，不能随机选择.#

性能影响型（分析操作对性能的影响）

89.在Hive中，当创建一个分区表并加载数据后,数据在HDFS上的存储布局是（）。

A、所有数据存储在一个文件中，分区信息存储在元数据中

B、每个分区对应一个文件夹，数据文件存储在相应分区文件夹下

C、数据随机分布在HDFS上，分区信息通过索引指向数据位置

D、数据按照行存储在不同的文件中，分区字段作为文件名的一部分

答案：B

解析：Hive分区表在HDFS上的存储布局是每个分区对应一个文件夹，数据文件

存储在相应分区文件夹下，这样便于根据分区快速定位和管理数据;不是所有数

据在一个文件，也不是随机分布或按行存储且分区字段作文件名一部分。#数据

类型特性应用

90.在一个多用户使用Hive的Hadoop集群环境中，为了保证每个用户任务的公

平执行，以下哪种资源分配策略较好()。

A、为每个用户固定分配相同数量的CPU和内存资源，不考虑任务需求

B、根据用户的优先级，为高优先级用户分配更多资源，低优先级用户分配较少

资源

C、采用动态资源分配策略，根据任务的实际需求动态分配CPU和内存资源

D、随机分配资源，让用户任务竞争资源

答案：C

解析：动态资源分配策略可以根据任务实际需求动态调整资源分配，既能保证公

平性，又能提高资源利用率;固定分配相同资源不灵活，可能导致资源浪费或任

务饥饿;仅根据优先级分配可能忽视任务实际需求;随机分配不利于任务公平执

行和资源有效利用。#数据质量保障

91.在Hive中，创建数据库时若不指定LOCATION,默认存储在()路径下。

Av/user/hive/warehouse/db_name.db/

B、/hive/database/

G/tmp/hive/

D、/user/hive/data/

答案：A

解析：默认情况下，Hive创建的数据库存储在/user/hive/warehouse/db_name.

db/路径下，其他选项不是默认存储路径。

92.在Hive中有两张表，用户表(user_table)包含用户ID(user_id)、用户名(u

ser_name)等字段，订单表(ordejtabIe)包含订单ID(orderid)\用户IDfuse

r_id)、订单金额(ordejamount)等字段。要查询每个用户的总订单金额，以下

哪种HiveQL语句是正确的？

AxSELECTuser_name,SUM(order_amount)FROMuser_tableJOINorder_tabIeONus

er_tabIe.user_id=order_tabIe.user_idGROUPBYuser_name

B、SELECTuser_id,SUM(order_amount)FROMuser_tableJOINorder_tabIeGROUPB

Yuser_id

C\SELECTuser_name,order_amountFROMuser_tabIeJOINorder_tabIeONuser_ta

bIe.user_id=order_tabIe.user_id

D、SELECTuser_id,MAX(orderamount)FROMuser_tableJOINordertabIeONuser

_tabIe.user_id=order_table.user_idGROUPBYuser_id

答案：A

解析：要查询每个用户的总订单金额，需要通过用户ID将用户表和订单表进行

关联(使用JOINON条件)，然后根据用户名进行分组(GROUPBYuserjame),并计

算每个用户的订单金额总和(SUM(order_amount));B选项没有正确关联条件且

分组字段不准确;C选项没有计算总金额;D选项计算的是每个用户的最大订单金

额，而不是总金额。#原理应用型（基于Hive原理选择操作）

93.上传一个大小为500MB的文件dattxt到Hadoop集群上，这个文件会占用HD

FS数据块的个数是。。

Ax1个

B、3个

C、4个

D、5个

答案：C

94.以下哪个不是FilelnputFormat的接口实现类？

A、TextInputFormat

B、KeyVaIueTextInputFormat

C、NLineInputFormat

D、CustomInputFormat

答案：D

解析:CustomlnputFormat不是FilelnputFormat的接口实现类，而是用户可以

自定义的InputFormat类。

95.OutputFormat主要用于描述什么？

A、输入数据的格式

B、输出数据的格式

C、计算逻辑的格式

D、文件系统的格式

答案：B

解析：OutputFormat主要用于描述输出数据的格式，它能够将用户提供的

96.设置虚拟机固定IP时，需要将网络配置文件ifcfg-ens33中的BOOTPROTO

的值修改为()。

A、dhcp

B、none

C、bootp

D、static

答案:D

解析：当要为虚拟机设置固定IP时，应将BOOTPROTO的值修改为static,这样

才能手动配置IP地址、子网掩码等网络信息。而dhcp是通过动态主机配置协议

获取地址，none表示不使用任何协议，bootp是使用引导程序协议获取地址，均

不符合固定IP设置的要求。

97.GenericOptionsParser的作用是什么？

A、解析命令行参数

B、设置Mapper类

C、设置作业名称

D、设置输入榆出路径

答案：A

解析：GenericOptionsParser用于解析命令行参数，它可以帮助Driver类解析

出Hadoop的通用选项和作业特定的参数。

98.在Hive数据仓库运行过程中，为了监控其性能，以下哪个指标不太重要()。

A、Hive查询的执行时间

B、Hive表的数据存储容量

C、MapReduce任务的资源利用率（如CPU、内存使用情况）

D、数据加载到Hive表的速度

答案：B

解析：Hive查询执行时间、MapReduce任务资源利用率和数据加载速度都直接反

映了Hive数据仓库的性能表现，而表的数据存储容量本身并不直接体现性能状

况（虽然可能间接影响性能，但相对其他指标不是关键性能监控指标）。

99.在Hive数据仓库中，为了保护用户隐私，以下哪种方法不太合适（）。

A、对敏感数据列进行加密存储

B、限制用户对敏感数据的访问权限，通过授权机制实现

C、在查询结果中直接显示用户的敏感信息（如身份证号码），但告知用户注意保

密

D、定期备份数据，防上数据丢失导致隐私泄露

答案：C

解析：在查询结果中直接显示敏感信息是违反隐私保护原则的，即使告知用户注

意保密也不能有效保护隐私;加密存储敏感数据列、限制访问权限和定期备份数

据都是保护隐私和数据安全的合理方法。#数据生命周期管理

100.Reducer类在MapReduce中的作用是什么？

A、读取输入数据

B、处理Mapper输出的中间数据

C、合并最终结果

D、设置MapReduce作业

答案：B

解析：Reducer类负责处理Mapper输出的中间数据，并生成最终输出结果，然

后存储到HDFS中。

101.以下哪个命令用于在HDFS上创建一个0字节的文件？

Axhadoopfs-touchz

B、hadoopfs-mkdir

C、hadoopfs-cat

D、hadoopfs-ls

答案：A

解析：hadoopfs-touchz用于在指定目录创建大小为0的新文件。

102.数据仓库的目的是构建面向()的集成化数据环境，分析结果为企业提供决策

支持。

A、操作

B、分析

C、存储

D、传输

答案：B

解析：数据仓库的目的是构建面向分析的集成化数据环境，用于存储、分析、报

告数据，其分析结果为企业提供决策支持，而不是面向操作、存储或传输。

103.在驱动类中，需要使用0方法设置输出数据的格式。

A、setJarByCIass()

B、setOutputKeyVaIueCIass()

C、setInputFormatCIass()

D、setOutputFormatCass()

答案:D

104.Hive中查询语句中，用于指定查询条件的是0。

A、FROM

B、WHERE

C、GROUPBY

D、ORDERBY

答案：B

解析：WHERE关键字在查询语句中用于指定查询条件，FROM指定查询的表，GRO

UPBY用于分组，ORDERBY用于排序。

105.在MapReduce程序中，Mapper类中的方法有()。

Axstartup()vmap()\end()

B、startup()xrun()send()

C、setup0vend。、nap0

D、setup()vmap()、cIeanup()

答案：D

106.使用Hadoop官方的示例程序包hadoop-mapreduce-exIes-3.1.4.jar中的w

ordcount模块，对HDFS上的/opt/data.txt文件进行单词计数，将结果保存至

HDFS的/Tipdm/Hadoop目录下，下列命令正确的是()。

A、hadoopjar\$HADOOP_HOME/share/hadoop/mapreduce/hadoop-mapreduce-exI

es-3.1.4.jarWordcount/opt/data.txt/Tipdm/Hadoop/

B、hadoopdfs\$HADOOP_HOME/share/hadoop/mapreduce/hadoop-mapreduce-exI

es-3.1.4.jarWordcount/opt/data.txt/Tipdm/Hadoop/

C、hdfs-jar\$HADOOP_HOME/share/hadoop/mapreduce/hadoop-mapreduce-exIe

s-3.1.4.jarWordcount/opt/data.txt/Tipdm/Hadoop/

D、hdfsdfs\$HADOOP_HOME/share/hadoop/mapreduce/hadoop-mapreduce-exIes

-3.1.4.jarWordcount/opt/data.txt/Tipdm/Hadoop/

答案：A

107.以下哪个命令用于查看文件内容？

Axhadoopfs-cat

B、hadoopfs-mkdir

C、hadoopfs-touchz

D、hadoopfs-rm

答案：A

解析：hadoopfs-cat查看文件内容。

108.在Hive中，关于分区表的描述正确的是0。

A、分区表的分区是以文件的形式存在

B、分区表的分区字段存放实际的数据内容

C、分区表可以提高查询效率

D、分区表不可以进行嵌套分区

答案：C

解析：分区表是按照属性在目录层面给文件更好的管理，对应一个在HDFS上的

独立文件夹，通过分区可以加快数据分片的查询速度；分区表的分区是以字段的

形式在表结构中存在，该字段不存放实际数据内容;分区表可以进行单分区和多

分区(嵌套分区)。

109.在CentOS7.8的Linux系统中，使用()命令可以查看某个虚拟机的IP地址。

Axservicenetworkrestart

B、ipaddr

C、servicenetworkstart

D、Ip

答案：B

110.Hive中复制表的语法中，LIKE关键字的作用是()。

A、复制表结构和数据

B、仅复制表结构

C、复制表数据

D、复制表结构并修改数据

答案:B

解析：LIKE关键字在Hive复制表语法中用以声明用户复制现有的表结构，但不

复制数据，如CREATE[TEMPRORARY][EXTERNAL]TABLE[IFNOTEXISTS][db_name.]t

abIe_nameLIKEexisting_tabIe_or_view_name[LOCATIONhdfs_path]o

111.Apache版本YARN默认使用的调度器是()。

A、FIFOScheduler

B、CapacityScheduIer

C、FairScheduIer

D、以上都不是

答案：B

解析：Apache版本YARN默认使用CapacityScheduler,所以答案选B。

112.在Hive中，使用0命令可以查看表的详细结构信息。

A、SHOWTABLES

B、DESCTABLE

C、DESCRIBEEXTENDEDTABLE

D、SHOWSTRUCTURETABLE

答案：C

解析：DESCRIBEEXTENDEDTABLE可以查看表的详细结构信息，包括列信息、分区

信息等;SHOWTABLES用于查看数据库中的表列表;DESCTABLE(或DESCRIBETABLE)

只能查看基本列信息，没有EXTENDED详细;SHOWSTRUCTURETABLE不是Hive中的

正确命令。

113.在MapReduce中,Combiner的作用是什么？

A、精简压缩传给Reduce的数据

B、增加Map输出的数据量

C、减少Map阶段的计算

D、提高Reduce阶段的计算复杂度

答案:A

解析：Combiner的作月是当Map生成的数据过大时，可以精简压缩传给Reduce

的数据。

114.以下哪个命令用于获取源文件，并且以文本格式输出该文件？

Axhadoopfs-text

B、hadoopfs-mkdir

Cxhadoopfs-touchz

D、hadoopfs-rm

答案：A

解析：hadoopfs-text获取源文件，并且以文本格式输出该文件。

115.如何设置作业的输出路径？

A、setOutputPath()

B、addOutputPath()

C、FiIeOutputFormat.setOutputPath()

DxsetOutputFormat0

答案：C

解析：FiIeOutputFormat.setOutputPath。方法用于设置作业的输出路径，这是

指定Reduce阶段输出结果存放位置的方法。

116.如果输入参数不足，Driver类会执行什么操作？

A、继续执行

B、输出错误信息并退出

C、抛出异常

D、忽略参数不足的问题

答案：B

解析：如果输入参数不足，Driver类会输出错误信息到System,err并调用Sys

tem.exit(2)退出程序。

117.Hive中，下列哪种数据类型不能用于创建表的列()。

A、INT

B、STRING

C、ARRAY

D、OBJECT

答案:D

解析：Hive支持INT、STRING、ARRAY等数据类型用于创建表的列,但OBJECT

不是Hive中用于表列定义的常见数据类型。

118.使用()命令可以在HDFS上创建一个/Tipdm/Hadoop目录。

Axhdfsdfs-mkdir/Tipdm/Hadoop

B、hdfsdfsmkdir-C/Tipdm/Hadoop

C、hdfsdfs-mkdir-p/Tipdm/Hadoop

D、hdfsdfsmkdir/Tipdm/Hadoop

答案:C

119.Hadoop3.x的HDFS的监控服务,默认是通过NameNode的0端口访问的。

A、9000

B、8088

C、8020

D、9870

答案：D

120.在Hive中，查询语句中使用DISTINCT关键字的作用是0。

A、对查询结果进行排序

B、去除查询结果中的重复行

C、选择特定列进行查询

D、限制查询结果数量

答案：B

解析：DISTINCT关键字用于去除查询结果中的重复行，而不是排序、选择特定

列（选择特定列用列名指定）或限制查询结果数量:限制数量用LIMIT关键字）。

121.以下哪个类不是WritabieComparable接口的实现类？

A、IntWritabIe

B、Text

C、NulIWritable

D、SeriaIizabIe

答案：D

解析：WritabIeComparable接口的实现类包括IntWritabIe、Text、NulIWrita

ble等，不包括SerializabIe。

122.Hive中加载数据到表时,若使用OVERWRITE关键字，（）

人人文库> 全部分类> 教育资料 > 辅导培训

温馨提示

1. 本站所有资源如无特殊说明，都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2. 本站的文档不包含任何第三方提供的附件图纸等，如果需要附件，请联系上传者。文件的所有权益归上传用户所有。
3. 本站RAR压缩包中若带图纸，网页内容里面会有图纸预览，若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 人人文库网仅提供信息存储空间，仅对用户上传内容的表现方式做保护处理，对用户上传分享的文档内容本身不做任何修改或编辑，并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容，请与我们联系，我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

《Hadoop大数据框架》参考试题库（含答案）

文档简介

温馨提示

最新文档

评论

《Hadoop大数据框架》参考试题库（含答案）

文档简介

温馨提示

最新文档

评论

相关文档