Hadoop大数据技术基础智慧树知到答案2024年河北软件职业技术学院_第1页
Hadoop大数据技术基础智慧树知到答案2024年河北软件职业技术学院_第2页
Hadoop大数据技术基础智慧树知到答案2024年河北软件职业技术学院_第3页
Hadoop大数据技术基础智慧树知到答案2024年河北软件职业技术学院_第4页
Hadoop大数据技术基础智慧树知到答案2024年河北软件职业技术学院_第5页
已阅读5页,还剩9页未读 继续免费阅读

付费下载

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

Hadoop大数据技术基础河北软件职业技术学院智慧树知到答案2024年第一章测试

HDFS有高容错性的特点,并且设计用来部署在低廉的(low-cost)硬件上。()

A:对B:错

答案:AHadoop既适合超大数据集存储,也适合小数据集的存储。()

A:错B:对

答案:AHDFS为海量的数据提供了存储,而MapReduce为海量的数据提供了计算。()

A:错B:对

答案:BHadoop起始于以下哪个阶段?()

A:2003年,Google发布了GFS论文。B:2004年,Nutch的开发者开发了NDFS。C:2004年,Google发表了关于MapReduce的论文。D:2002年,Apach项目的Nutch。

答案:DHadoop集群具有以下哪个优点?()

A:高可靠性B:高成本性C:高扩展性D:高容错性

答案:ACD

第二章测试

在本次课程里,Linux发行版本我们选择()。

A:ubuntuB:RedHatC:Centos7D:Centos8

答案:C从哪一个Hadoop历史版本引入了yarn()。

A:1.x版本系列B:3.x版本系列C:4.x版本系列D:2.x版本系列

答案:BHadoop部署方式分三种()。

A:伪集群模式B:伪分布式模式C:单机模式D:分布式模式

答案:BCD商业版Hadoop是指由第三方商业公司在社区版Hadoop基础上进行了一些修改、整合以及各个服务组件兼容性测试而发行的版本。()

A:对B:错

答案:AHadoop一般是安装在Windows服务器上的。()

A:错B:对

答案:A

第三章测试

Hadoop的安装部署的模式属于伪分布模式()。

A:Hadoop守护进程运行在由多台主机搭建的集群上,是真正的生产环境。B:默认的模式,无需运行任何守护进程(daemon),所有程序都在单个JVM上执行。C:全分布式模式的一个特例,Hadoop的守护进程运行在一个节点上。D:伪分布不需要启动任何服务,一般用于调试MapReduce。

答案:CHadoop的核心组件不包括()。

A:HDFSB:YARNC:CommonD:MapReduce

答案:C下列操作不能实现关闭Linux系统的命令是()。

A:poweroffB:rebootC:halt-pD:shutdown–hnow

答案:B下列关于克隆虚拟机描述正确的是()。

A:克隆虚拟机和原始虚拟机的操作彼此影响B:克隆操作结束后,克隆的虚拟机就可以脱离原始虚拟机独立存在C:克隆是复制原始虚拟机的部分状态D:克隆可以在虚拟机运行状态进行

答案:BVMwareWorkstation的虚拟网络类型有()。

A:桥接模式B:NAT模式C:IP模式D:Host-only模式

答案:ABDHadoop系统三种部署方式是()。

A:伪分布式模式B:全分布式C:主从模式D:单机模式

答案:ABD下列关于HadoopHA模式的描述是正确的()。

A:HA模式当工作中的机器宕机后,会自动处理这个异常,并将工作转移到其他备用机器B:HadoopHA模式分为NameNode高可用和YARN高可用C:HA是HighAvailability的简写,即高可用D:实现高可用最关键的策略是消除单点故障。

答案:ABCD下列属于用户与组操作的命令是()。

A:fdisk-lB:passwdhadoopC:df-hD:useraddhadoop

答案:BDLinux文件权限-rwxr-----解释正确的是()。

A:234位表示文件所有者对文件或目录的权限B:r表示只读权限,w表示写入权限,x表示执行权限C:–表示普通文件D:文件所有者用o表示

答案:ABCNAT模式可以在专用网络内连接虚拟机。()

A:对B:错

答案:BNETMASK表示虚拟机子网掩码。()

A:错B:对

答案:B通过克隆虚拟机可以快速搭建Hadoop集群。()

A:错B:对

答案:Bxshell是一款支持SSH的终端仿真程序。()

A:对B:错

答案:ANAT模式中,虚拟机IP地址不一定VMware虚拟网络IP地址范围内。()

A:错B:对

答案:A

第四章测试

下列关于SSH免密操作描述错误的是()。

A:实现SSH登录需要openssh和rsync两个服务。B:SSH的配置文件是/etc/ssh/sshd_config。C:存储节点公钥的文件是id_rsa。D:NameNode是通过SSH来启动和停止各个DataNode上的守护进程的。

答案:C关闭防火墙的命令是()。

A:systemctlrestartfirewalld。B:systemctlstatusfirewalld。C:systemctlstopfirewalld。D:systemctldisablefirewalld。

答案:C下列关于NTP服务描述的错误的是()。

A:NTP服务的配置文件是/etc/ntp.conf。B:NTP服务是来使计算机时间同步的一种协议。C:启动NTP服务的命令是systemctlstartntpd。D:NTP服务状态查询命令是ntpdate。

答案:D下列不属于JAVA环境安装的步骤是()。

A:在配置文件~/.bashrc中添加JAVA相关环境变量。B:执行配置文件的命令是source/etc/profile。C:检查JAVA版本的命令是javaversion。D:解压JDK安装包到安装目录。

答案:C下列哪个文件可以配置HDFS副本数量()。

A:hadoop-env.sh。B:core-site.xml。C:yarn-site.xml。D:hdfs-site.xml。

答案:D下列关于Hadoop完全分布式模式描述正确的是()。

A:Hadoop完全分布式模式应部署在“主从”结构的服务器集群B:Hadoop1.X之前存在单点故障问题,因为只有一个NameNodeC:Hadoop完全分布式是Hadoop默认安装模式D:Hadoop2.X引入了HA机制

答案:ABD需要配置的JDK环境变量是()。

A:ZOOKEEPER_HOMEB:JAVA_HOMEC:PATHD:HADOOP_HOME

答案:BCHadoop默认配置文件包括()。

A:core-site.xmlB:mapred-site.xmlC:yarn-site.xmlD:hdfs-site.xml

答案:AD存放Hadoop相关服务操作脚本的目录是()。

A:libB:etcC:binD:sbin

答案:CDstart-dfs.sh命令启动的HDFS进程包括()。

A:DataNodeB:ResourceManagerC:NameNodeD:SecondaryNameNode

答案:ACD伪分布式模式是Hadoop的默认模式。()

A:对B:错

答案:BHadoop是Apache软件基金会的开源产品。()

A:错B:对

答案:Byarn-site.xml是Hadoop2.0新增的配置文件。()

A:错B:对

答案:B查看hadoop版本的命令是hadoop-version。()

A:对B:错

答案:B伪分布式是把集群主节点和从节点合二为一。()

A:错B:对

答案:B

第五章测试

HDFS默认的数据块复制数量是()。

A:3。B:2。C:4。D:1。

答案:A下列操作不属于测试Hadoop的是()。

A:在浏览器地址栏输入http://master:50070。B:在浏览器地址栏输入http://master:9000。C:执行jps命令查看节点信息D:执行hadoop系统自带测试jar包

答案:B下列哪个命令能启动Hadoop相关进程()。

A:start-dfs.shB:start-yarn.shC:hadoop-daemon.shstartnamenodeD:zkServer.shstart

答案:ABC下列哪些配置参数属于core-site.xml()。

A:hadoop.tmp.dirB:dfs.replicationC:io.file.buffer.sizeD:fs.defaultFS

答案:ACD下列关于hadoop集群配置文件描述正确的是()。

A:core-site.xml文件是hadoop集群的核心全局文件B:yarn-site.xml文件配置YARN运行所需要的环境变量C:hdfs-site.xml文件配置HDFSD:hadoop-env.sh配置hadoop运行所需要的环境变量

答案:ACD下列关于hadoop集群安装步骤描述正确的是()。

A:NameNode的格式化只需进行一次即可B:修改环境变量需要编辑文件/etc/profileC:slaves文件中需要配置slave1、slave2节点IP地址D:Jps命令是显示所有Java进程的pid命令

答案:ABC下列关于hadoop集群描述正确的是()。

A:实验环境下一般采用4个节点设置Hadoop集群B:生产环境中需要考虑整体容错性,Hadoop集群多采用多master架构C:Hadoop平台集群采用Master/Slave架构D:实验环境下Hadoop集群网络只需考虑节点间的连通性

答案:BC配置hadoop-env.sh文件,主要是设置Hadoop系统的JDK安装目录。()

A:错B:对

答案:Bhadoop.tmp.dir临时目录系统会自动创建。()

A:错B:对

答案:AMapReduce存在JobTracker单点故障的问题。()

A:错B:对

答案:BHadoop的HA模式只有一种:YARN的HA模式。()

A:错B:对

答案:AHDFS副本的放置策略称为机架感知策略。()

A:对B:错

答案:A

第六章测试

下列关于HDFS描述错误的是()。

A:HDFS是一种通过网络实现文件在多台主机上进行分布式存储的文件系统。B:在安全模式,各个DataNode将心跳报告和块列表信息发送到NameNode。C:Hadoop的脚本命令和UNIX系统一样都是命令体加命令参数。D:HDFS数据块默认大小为64M。

答案:A下列关于HDFSshell描述正确的是()。

A:把本地文件复制到HDFS根目录下的命令是cp。B:HDFSshell和Linuxshell完全相同。C:在使用shell命令操作HDFS前应先启动Hadoop。D:HDFSshell的命令格式是hdfs-cmd。

答案:C下列关于HDFS读写操作描述错误的是()。

A:Client完成数据的写入后,会调用数据流的close()方法,关闭数据流。B:在写入数据时,如果DataNode发生错误,将没有被确认的数据放到数据队列末尾。C:Clinet通过调用FileSystem对象的get()方法打开需要读取的数据。D:NameNode向Client返回一个包含数据信息的地址。

答案:B下列关于HDFS数据存储和读取描述错误的是()。

A:对于大文件的存储,HDFS采用分割的方式。B:对于少量数据的随机读取,HDFS采用按序读取。C:对于大量数据的读取,HDFS采用集中式。D:对于普通文件的读取,HDFS采用普通的编码和压缩方式。

答案:D下列关于HDFS数据损坏的处理过程描述错误是()。

A:DataNode读取block时,会计算校验和。B:数据损坏发生后,NameNode读取其他DataNode上的Block。C:如果校验和与Block创建时值不一样,则说明Block已损坏。D:NameNode负责标记损坏Block。

答案:B下列关于HDFSJavaAPI描述正确的是()。

A:Hadoop默认文件操作类是FileSystemB:Hadoop文件操作类在org.apache.hadoop包中C:API是预先定义的函数D:Java程序通过Hadoop文件操作类可以进行读写、上传HDFS文件

答案:ACD下列关于Hadoop序列化描述正确的是()。

A:Hadoop的序列化是通过Writable类实现的B:Java序列化的缺点是计算时开销大C:序列化试讲对象转化为子节流以方便数据在网络间传输的过程D:Hadoop实现进程间通信依靠RPC

答案:BCD下列关于Hadoop小文件处理描述正确的是()。

A:小文件是指小于HDFS中的一个块大小的文件B:Hadoop处理小文件的方法是压缩小文件C:创建序列文件主要是指创建SequenceFile文件D:Hadoop在小文件处理上效率低

答案:AD下列关于通信机制RPC描述正确的是()。

A:RPC采用客户机/服务器模式B:Hadoop中节点的进程间通信是通过RPC实现的C:RPC是一种通过网络从远程计算机程序上请求服务的协议D:RPC服务器指一种提供服务的服务器

答案:ABC下列关于Hadoop压缩描述正确的是()。

A:Hadoop文件压缩的目的是减少存储空间占用,降低网络负载B:Hadoop中的压缩编码器是通过一些接口来实现的C:Hadoop常用压缩格式有Bzip2、Gzip、LZO、LZ4等D:Hadoop中压缩占比最高的Bzip2

答案:ACHadoop序列化是通过Writable接口实现的。()

A:对B:错

答案:AMaven是一种Java开发项目。()

A:错B:对

答案:AJava序列化的优点是计算时开销小,序列化结果占用存储空间小。()

A:错B:对

答案:AText类和String类的编码方式不同,String类采用UTF-8编码,而Text类采用UTF-16编码。()

A:对B:错

答案:BAPI本质上是一些预定义的函数。()

A:对B:错

答案:A

第七章测试

有关MapReduce,下面哪个说法是正确的()。

A:它提供了资源管理能力(yarn)B:它是Hadoop数据处理层C:它是开源数据仓库系统,用于查询和分析存储在Hadoop中的大型数据集(Hive)

答案:BMapReduce擅长处理哪种应用场景()。

A:流式计算B:实时交互计算C:离线计算D:迭代计算

答案:CMapReduce的Shuffle过程中哪个操作是最后做的?()。

A:合并B:分区C:排序D:溢写

答案:AMapReduce编程模型中Reducer组件哪个是最后执行的。()

A:错B:对

答案:B在MapReduce中,下面哪个会将输入键值对处理成中间键值对()。

A:MapperB:Mapper和ReducerC:Reducer

答案:A

第八章测试

下面哪个YARN的描述不正确()。

A:YARN最初是为了改善MapReduce的实现B:YARN只支持MapReduce一种分布计算模式C:YARN的引入为集群在利用率、资源统一管理和数据共享等方面带来了巨大好处D:YARN指的是YetAnotherResourceNegotiator,是另一种资源协调者

答案:B下面不属于YARN架构的组成部分的是()。

A:ApplicationMasterB:JobTracerC:NodeManagerD:ResourceManager

答案:BYARN中任务进度监控是向哪个组件汇报的?()。

A:ResourceManagerB:ApplicationMasterC:ContainerD:NodeManager

答案:BYARN架构的组成包括()。

A:ResourceManagerB:ContainerC:ApplicationMasterD:NodeManager

答案:ABCD在YARN上可以部署Spark()。

A:错B:对

答案:B

第九章测试

HBbase中表格在物理存储上它们是按列族进行存储的,可以随时将新的列祖修饰符添加到现有的列族。()

A:错B:对

答案:BHBase中的列由一个列族和一个列限定符组成,它们由:(冒号)字符分隔。()

A:对B:错

答案:AHBase中所有的数据从底层来说一般是保存在MapReduce中,用户通过一系列HRegionServer获取这些数据。()

A:对B:错

答案:BHBase安装时配置的文件有()

A:hbase-env.shB:hadoop-site.xmlC:hbase-site.xmlD:hadoop-env.sh

答案:ACYARN主要包含的模块有以下哪些?(

A:NodeManagerB:ResourceManagerC:ApplicationMasterD:QuorumJournalManager

答案:ABC

第十章测试

哪个组件不属于fusioninsight架构的hadoop层()。

A:MinerB:HiveC:HBaseD:HDFS

答案:AHive表的索引创建在HBase表中,能大大提升查询性能()。

A:错B:对

答案:B实时在线数据分析是Hive适用的场景。()

A:对B:错

答案:BHive适合处理结构化的数据()

A:对B

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论