雨课堂学堂在线学堂云大数据技术原理与应用湖北科技学院单元测试考核答案

上传人：z*** IP属地：贵州上传时间：2025-12-05 格式：DOCX 页数：20 大小：74.23KB 积分：12 举报 版权申诉

已阅读5页，还剩15页未读，继续免费阅读

版权说明：本文档由用户提供并上传，收益归属内容提供方，若内容存在侵权，请进行举报或认领

文档简介

注：不含主观题第1题万维网之父是（）。A彼得·德鲁克B舍恩伯格C蒂姆·伯纳斯－李D斯科特·布朗第2题下列关于大数据的分析理念的说法中，错误的是（）。A在数据基础上倾向于全体数据而不是抽样数据B在分析方法上更注重相关分析而不是因果分析C在分析效果上更追究效率而不是绝对精确D在数据规模上强调相对数据而不是绝对数据第3题下列国家的大数据发展行动中，集中体现“重视基础、首都先行”的国家是（

）。A美国B日本C中国D韩国第4题大数据的最显著特征是（

）。A数据规模大B数据类型多样C数据处理速度快D数据价值密度高第5题下列关于聚类挖掘技术的说法中，错误的是（

）。A不预先设定数据归类类目，完全根据数据本身性质将数据聚合成不同类别B要求同类数据的内容相似度尽可能小C要求不同类数据的内容相似度尽可能小第6题下列关于计算机存储容量单位的说法中，错误的是（

）。A1KB＜1MB＜1GBB基本单位是字节（Byte）C一个汉字需要一个字节的存储空间D一个字节能够容纳一个英文字符，第7题下列关于网络用户行为的说法中，错误的是（）。

A网络公司能够捕捉到用户在其网站上的所有行为B用户离散的交互痕迹能够为企业提升服务质量提供参考C数字轨迹用完即自动删除D用户的隐私安全很难得以规范保护第8题在数据生命周期管理实践中，（）是A数据存储和备份规范B数据管理和维护C数据价值发觉和利用D数据应用开发和管理第9题

美国海军军官莫里通过对前人航海日志的分析，绘制了新的航海路线图，标明了大风与洋流可能发生的地点。这体现了大数据分析理念中的（

）。A在数据基础上倾向于全体数据而不是抽样数据B在分析方法上更注重相关分析而不是因果分析C在分析效果上更追究效率而不是绝对精确D在数据规模上强调相对数据而不是绝对数据第10题当前社会中，最为突出的大数据环境是（）A互联网B物联网C综合国力D自然资源第11题下列关于舍恩伯格对大数据特点的说法中，错误的是（）。A数据规模大B数据类型多样C数据处理速度快D数据价值密度高第12题大数据的最显著特征是（）。A数据规模大B数据类型多样C数据处理速度快D数据价值密度高第13题智慧城市的构建，不包含（）。A数字城市B物联网C联网监控D云计算第14题下列关于数据重组的说法中，错误的是（）A数据重组是数据的重新生产和重新采集B数据重组能够使数据焕发新的光芒C数据重组实现的关键在于多源数据融合和数据集成D数据重组有利于实现新颖的数据模式创新第15题智能健康手环的应用开发，体现了（）的数据采集技术的应用。

A统计报表B网络爬虫CAPI接口D传感器第16题（）反映数据的精细化程度，越细化的数据，价值越高。A规模B活性C关联度D颗粒度第17题数据清洗的方法不包括（）。A缺失值处理B噪声数据清除C一致性检查D重复数据记录处理第18题根据不同的业务需求来建立数据模型，抽取最有意义的向量，决定选取哪种方法的数据分析角色人员是A数据管理人员B数据分析员C研究科学家D软件开发工程师第19题大数据的起源是A金融B电信C互联网D公共管理第20题当前大数据技术的基础是由（）首先提出的。A微软B百度C谷歌D阿里巴巴章节测验第1题以下哪一项不属于Hadoop可以运行的模式A单机（本地）模式B伪分布式模式C互联模式D分布式模式第2题

Hadoop的作者是下面哪一位AMartinFowlerBDougcutting

CKentBeck

DGraceHopper

第3题下列哪个程序通常与NameNode在同一个节点启动ATaskTrackerBDataNode

CSecondaryNameNode

DJobtracker第4题下列哪项通常是集群的最主要瓶颈A

CPUB网络C磁盘IO

D内存第5题DougCutting所创立的项目的名称都受到其家人的启发，以下项目不是由他创立的项目是

HadoopBNutchC

Lucene

DSolr

第6题配置Hadoop时，JAVA_HOME包含在哪一个配置文件中A

hadoop-default.xml

hadoop-env.shChadoop-site.xmlD

configuration.xsl

第7题

Hadoop配置文件中，hadoop-site.xml显示覆盖hadoop-default.xml里的内容。在版本0.20中，hadoop-site.xml被分离成三个XML文件，不包括

Aconf-site.xml

Bmapred-site.xml

Ccore-site.xml

hdfs-site.xml

第8题关于Hadoop单机模式和伪分布式模式的说法，正确的是A两者都起守护进程，且守护进程运行在一台机器上B单机模式不使用HDFS，但加载守护进程

C两者都不与守护进程交互，避免复杂性D后者比前者增加了HDFS输入输出以及可检查内存使用情况

第9题下列关于HadoopAPI的说法错误的是AHadoop的文件API不是通用的，只用于HDFS文件系统

BConfiguration类的默认实例化方法是以HDFS系统的资源配置为基础的

CFileStatus对象存储文件和目录的元数据

第10题Hadoopfs中的-get和-put命令操作对象是A文件

B目录C两者都是第11题以下说法不正确的是

HadoopStreaming使用Unix中的流与程序交互

BHadoopStreaming允许我们使用任何可执行脚本语言处理数据流

C采用脚本语言时必须遵从UNIX的标准输入STDIN，并输出到STDOUT

DReduce没有设定，上述命令运行会出现问题

第12题Hadoop作者AMartinFowlerBKentBeckCDougcutting第13题下列哪项可以作为集群的管理？APuppet

BPdsh

CClouderaManagerDZookeeper正确答案：DAB第14题配置机架感知的下面哪项正确：A如果一个机架出问题，不会影响数据读写B写入数据的时候会写到不同机架的DataNode中CMapReduce会根据机架获取离自己比较近的网络数据正确答案：CBA第15题下列哪个是Hadoop运行的模式A单机版B伪分布式C分布式正确答案：ABC第16题Ganglia不仅可以进行监控，也可以进行告警第17题BlockSize是不可以修改的。第18题Nagios不可以监控Hadoop集群，因为它不提供Hadoop支持。第19题如果

NameNode意外终止，SecondaryNameNode会接替它使集群继续工作。第20题ClouderaCDH是需要付费使用的。第21题Hadoop是Java开发的，所以MapReduce只支持Java语言编写。第22题

Hadoop支持数据的随机读写第23题Hadoop自身具有严格的权限管理和安全措施保障集群正常运行第24题hadoopdfsadmin–report命令用于检测HDFS损坏块。第25题10.Hadoop默认调度器策略为FIFO第26题集群内每个节点都应该配RAID，这样避免单磁盘损坏，影响整个节点运行。第27题

Hadoop环境变量中的HADOOP_HEAPSIZE用于设置所有Hadoop守护线程的内存。它默认是200GB。章节测试第1题关于SecndaryNameNode哪项是正确的？A它是NameNode的热备份B它对内存没有要求C它的目的是帮助NameNode合并编辑日志，减少NameNode启动时间DSecndaryNameNde应与NameNde部署到一个节点一致性第2题下列哪项通常是集群的最主要瓶颈（）ACPUB网络C磁盘IOD内存第3题下面哪个角色负责HDFS数据存储（）ANameNodeBDataNodeCSecndaryNameNodeD

tasktracker第4题

HDFS中的block默认保存几份？（）A3份B2份C1份D不确定第5题

HDFS默认BlockSize是（）A32MBB64MB（2.7.2版本，本地模式）C128MB（2.7.2版本，分布式模式）D不定第6题

Client端上传文件的时候下列哪项正确？（

）A数据经过NameNode传递DataNodeBClient端将文件切分为Block，依次上传C

Client只上传数据到一台DataNode，然后由NameNode负责Block复制工作DBC都正确第7题下列哪个程序通常与NameNode在一个节点启动？（）A

SecondaryNameNodeB

DataNodeCTaskTrackerD

JobTracker第8题配置机架感知的下面哪项正确(

)A如果一个机架出问题，不会影响数据读写B写入数据的时候会写到不同机架的DataNode中

CMapReduce会根据机架获取离自己比较近的网络数据D都正确第9题下列哪项可以不可作为集群的管理（）APuppetBPdshCClouderaManagerDZookeeper

第10题hadoop一键闭全部包括hdfs和yarn集群的脚本命令是什么?（

）Astart-all.shBstart-yarn.shCstop-all.shDstop-yarn.sh第11题BlockSize是不可以修改的。第12题如果NameNode意外终止，SecondaryNameNode会接替它使集群继续工作。第13题

NameNode负责管理metadata，client端每次读写请求，它都会从磁盘中读取或则会写入metadata信息并反馈client端。第14题

NameNode本地磁盘保存了Block的位置信息。第15题

DataNode通过长连接与NameNode保持通信。第16题Slave节点要存储数据，所以它的磁盘越大越好。第17题hadoopdfsadmin–report命令用于检测HDFS损坏块第18题

因为HDFS有多个副本，所以NameNode是不存在单点问题的。第19题NameNode的WebUI端口是50030，它通过jetty启动的Web服务第20题HDFS分布式文件系统集群的角色主要有NameNode、DataNode、SecondaryNameNode。章节测试第1题HDFS默认BlockSize的大小是A32MBB64MBC128MBD256M第2题下列哪项通常是集群的最主要瓶颈___ACPUB网络C磁盘IOD内存

第3题HDFS文件系统中一个gzip文件大小75MB，客户端设置Block的大小为默认,请问此文件占用几个Block___A1

D4第4题HDFS是基于流数据模式访问和处理超大文件的需求而开发的，具有高容错、高可靠性、高可扩展性、高吞吐率等特征，适合的读写任务是__A一次写入，少次读B多次写入，少次读C多次写入，多次读D一次写入，多次读第5题

HBase依靠______存储底层数据。AHDFS

BHadoop

CMemoryDMapReduce第6题HBase依赖______提供强大的计算能力。AZookeeper

BChubby

RPCDMapReduce第7题HBase依赖______提供消息通信机制A

Zookeeper

BChubbyCRPC

DSocket第8题下面与HDFS类似的框架是___ANTFS

BFAT32CGFSDEXT3第9题关于SecondaryNameNode下面哪项是正确的___A它是NameNode的热备B它对内存没有要求C它的目的是帮助NameNode合并编辑日志，减少NameNode启动时间D

SecondaryNameNode应与NameNode部署到一个节点第10题大数据的特点不包括下面哪一项___A巨大的数据量B多结构化数据C增长速度快D价值密度高第11题第12题

HBase依靠HDFS存储底层数据（

）第13题下面哪些选项正确描述了HBase的特性？A高可靠性B高性能C面向列D

可伸缩正确答案：DCBA第14题下面哪些概念是HBase框架中使用的？AHDFSBGridFSCZookeeperDEXT3正确答案：CA第15题下面对LSM结构描述正确的是？A顺序存储B直接写硬盘C需要将数据Flush到磁盘D是一种搜索平衡树正确答案：CA章节测试第1题Hadoop框架是用Java语言实现的，因此，MapReduce应用程序则一定也要用Java来编写。（

）第2题1.

MapReduce编程模型的其中一个设计理念，就是“计算向数据靠拢”，而不是“数据向计算靠拢”。（

）第3题1.

MapReduce适宜计算密集型应用。（）第4题1.

Mapreduce的input split就是一个block。（）第5题1.

每个map槽就是一个线程。（

）第6题1.

不同的Map任务之间不会进行通信。（

）第7题不同的Reduce任务之间，则可能会发生信息交换。（）第8题1.

InputSplit是MapReduce对文件进行处理和运算的输入单位，需要对文件进行物理切分。（

）第9题有关MapReduce，下面哪个说法是正确的（）

A它提供了资源管理能力

B它是开源数据仓库系统，用于查询和分析存储在Hadoop中的大型数据集C它是Hadoop数据处理层

第10题在MapReduce中，如果将reducer数设置为0会发生怎样的情形（

）

A仅有Reduce作业发生B仅有Map作业发生CReduce输出会成为最终输出第11题在MapReduce中，下面哪个会将输入键值对处理成中间键值对（

）

AMapperBReducerCMapper和Reducer第12题在MapReduce中，Map数取决于（

）的总量

A任务数B输入数据C输出数据第13题在Hadoop的分区阶段，默认的Partitioner是（

）

AHashParB

PartitionerC

HashPartitioner第14题下面哪个是一种编程模型，它将大规模的数据处理工作拆分成互相独立的任务然后并行处理（

）

AMapReduceBHDFSCPig第15题在Hadoop中，下面哪个是默认的InputFormat类型，它将每行内容作为新值，而将字节偏移量作为key（

）AFileInputFormatBTextInputFormatC

KeyValueTextInputFormat第16题在MapReduce中，对于map输出的中间结果，负责按key进行分区的是（

）

RecordReaderBCombinerC

Partitioner第17题在MapReduce中，下面哪个阶段是并行进行的（

）

AShuffle和MapBShuffle和SortCReduce和Sort第18题

关于MapReduce中的键值对，下面陈述正确的是（

）

AKey类必须实现WritableBKey类必须实现WritableComparableCValue类必须实现WritableComparableDValue类必须继承WritableComparable第19题在HDFS中，put命令用于（

）

A将文件或从本地文件系统拷贝到HDFS

B将文件或者目录从本地文件系统拷贝到HDFS

C将文件从HDFS拷贝到本地文件系统D将文件或者目录从HDFS拷贝到本地文件系统第20题在Hadoop中，下面哪一个是默认的OutputFormat（

）

ASquenceFileOutputFormatBLazyOutputFormatCDBOutputFormat

DTextOutputFormat第21题

下面哪个不是Hadoop的输入格式（

）

AByteInputFormatBTextInputFormatCSquenceFileInputFormatDKeyValueInputFormat第22题在MapReduce中，下面哪个数据流的顺序是正确的（）Aabcdfe

Babcedf

Cacdefb

abcdef第23题下面哪个不属于Reducer阶段（

）

AShuffle

BSortCMapDReduce第24题下面关于MapReduce模型中Map函数与Reduce函数的描述正确的是（

）A一个Map函数就是对一部分原始数据进行指定的操作。B一个Map操作就是对每个Reduce所产生的一部分中间结果进行合并操作。CMap与Map之间不是相互独立的。DReduce与Reduce之间不是相互独立的。第25题如何禁用reduce阶段（

）

A设置conf.setNumreduceTasks(0)B设置job.setNumreduceTasks(0)C设置job.setNumreduceTasks()=0第26题

shuffle和sort输出的key实现了下面哪个接口（

）

AWritableBWritableComparableC

ConfigurableD

ComparableWritable第27题在MapReduce编程时，如下阶段的顺序是（

）AMapperPartitionerShuffle/SortCombinerBMapperPartitionerCombinerShuffle/SortCMapperShuffle/SortCombinerPartitioner

DMapperCombinerPartitionerShuffle/Sort第28题下面生成中间键值对的是（

）

AReducer

BMapperC

CombinerDPartitioner第29题第30题第31题第32题第33题第34题章节测试第1题关于数据及软件架构的CAP理论不包括下面哪些A可用性B一致性C分区容忍性D分布性第2题下列关于spark中的RDD描述正确的有ARDD（ResilientDistributedDataset）叫做弹性分布式数据集，是spark中最基本的数据抽象BResilient：表示弹性的，弹性表示CDestributed：分布式，可以并行在集群计算DDataset：就是一个集合，用于存放数据的正确答案：DCBA第3题下列哪些是面向对象技术的特征A封装B继承C多态D分布性正确答案：CBA第4题下列描述正确的是A进程(Process)是程序的一次执行过程B线程(Thread)是比进程更小的执行单位C

线程不可共享相同的内存单元D在同一个应用程序中可以有多个线程同时执行正确答案：DBA第5题

下面哪些是spark比Mapreduce计算快的原因A基于内存的计算B基于DAG的调度框架C基于Lineage的容错机制D基于分布式计算的框架正确答案：CBA第6题下面哪个操作是窄依赖？Ajoin

Bfilter

Cgroup

Dsort

第7题.下面哪个操作肯定是宽依赖

map

BflatMap

CreduceByKey

sample第8题最早是Cloudera提供的日志收集系统，目前是Apache下的一个孵化项目，支持在日志系统中定制各类数据发送方，用于收集数据的工具是AFlumeBZookeeperCStormDSparkstreaming第9题一个分布式应用程序协调服务，分布式应用程序可以基于它实现同步服务，配置维护和命名服务等的工具有AFlumeBZookeeperCStormDSparkstreaming第10题作为分布式消息队列，既有非常优秀的吞吐量，又有较高的可靠性和扩展性，同时接受Sp

人人文库> 全部分类> 教育资料 > 考试试卷

温馨提示

1. 本站所有资源如无特殊说明，都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2. 本站的文档不包含任何第三方提供的附件图纸等，如果需要附件，请联系上传者。文件的所有权益归上传用户所有。
3. 本站RAR压缩包中若带图纸，网页内容里面会有图纸预览，若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 人人文库网仅提供信息存储空间，仅对用户上传内容的表现方式做保护处理，对用户上传分享的文档内容本身不做任何修改或编辑，并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容，请与我们联系，我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

雨课堂学堂在线学堂云大数据技术原理与应用湖北科技学院单元测试考核答案

文档简介

温馨提示

最新文档

评论

雨课堂学堂在线学堂云大数据技术原理与应用湖北科技学院单元测试考核答案

文档简介

温馨提示

最新文档

评论

相关文档