大数据平台部署与运维练习试卷附答案

上传人：喝*** IP属地：广西上传时间：2025-03-10 格式：DOC 页数：14 大小：35.71KB 积分：25 举报 版权申诉

已阅读5页，还剩9页未读，继续免费阅读

版权说明：本文档由用户提供并上传，收益归属内容提供方，若内容存在侵权，请进行举报或认领

文档简介

第页大数据平台部署与运维练习试卷附答案1.假设已经配置好环境变量，启动Hadoop和关闭Hadoop的命令分别是：()A、start-hdfs.sh，stop-hdfs.shB、start-dfs.sh，stop-hdfs.shC、start-hdfs.sh，stop-dfs.shD、start-dfs.sh，stop-dfs.sh【正确答案】：D2.以下哪个不是Hadoop的特性：()A、成本高B、支持多种编程语言C、高容错性D、高可靠性【正确答案】：A3.以下名词解释不正确的是：()A、HDFS：分布式文件系统，是Hadoop项目的两大核心之一，是谷歌GFS的开源实现B、Zookeeper：针对谷歌Chubby的一个开源实现，是高效可靠的协同工作系统C、Hive：一个基于Hadoop的数据仓库工具，用于对Hadoop文件中的数据集进行数据整理、特殊查询和分析存储D、HBase：提供高可靠性、高性能、分布式的行式数据库，是谷歌BigTable的开源实现【正确答案】：D4.配置Hadoop文件参数时，配置项“dfs.replication”应该配置在哪个文件？()A、core-site.xmlB、hdfs-site.xmlC、mapred-site.xmlD、yarn-site.xml【正确答案】：B解析：

二、多项选择题5.使配置的环境变量生效的命令是：()A、vi~/.bashrcB、source~/bashrcC、cat~/.bashrcD、source~/.bashrc【正确答案】：D6.端口50070默认是HDFS哪个服务的端口?()A、NameNodeB、DataNodeC、SecondaryNameNodeD、GFS【正确答案】：A解析：

二、多项选择题7.下述关于hadoop的阐述，正确的是()A、是一个分布式存储系统与分布式数据库B、是一个分布式数据库与并行计算系统C、是一个分布式存储与分布式并行运算系统D、是一个集中式存储与分布式并行运算系统【正确答案】：C8.启动hadoop所有进程的命令是：()A、start-all.shB、start-hadoop.shC、start-dfs.shD、start-hdfs.sh【正确答案】：A9.某文件的组外成员的权限为只读；所有者有全部权限；组内的权限为读与写，则该文件的权限为()。A、467B、674C、476D、764【正确答案】：D10.下列说法错误的是()。A、Hadoop框架是用Java实现的，MapReduce应用程序则一定要用Java来写B、不同的Map任务之间不能互相通信C、Map函数将输入的元素转换成<key,value>形式的键值对D、MapReduce框架采用了Master/Slave架构，包括一个Master和若干个Slave【正确答案】：A11.使用mkdir命令创建目录时，若其父目录不存在，则使用选项()，将先创建父目录，再创建子目录。A、-mB、-dC、-fD、-p【正确答案】：D12.在HBase中，创建一张名为“user_c”的表，该表有一个名为“User”的列族，其相应Shell命令应该是()。A、create‘user_c’,{NAME=‘User’};B、create‘user_c’,{NAME=>‘User’};C、create{‘user_c’=>‘User’};D、create‘user_c’,{name=>‘User’};【正确答案】：B解析：

二、多项选择题13.以下对Hadoop的说法错误的是：()A、Hadoop是基于Java语言开发的，只支持Java语言编程B、Hadoop2.0增加了NameNodeHA和Wire-compatibility两个重大特性C、HadoopMapReduce是针对谷歌MapReduce的开源实现，通常用于大规模数据集的并行计算D、Hadoop的核心是HDFS和MapReduce【正确答案】：A14.下列对HBase数据模型的描述错误的是()A、HBase列族支持动态扩展，可以很轻松地添加一个列族或列B、HBase是一个稀疏、多维度、排序的映射表，这张表的索引是行键、列族、列限定符和时间戳C、HBase中执行更新操作时，会删除数据旧的版本，并生成一个新的版本D、每个HBase表都由若干行组成，每个行由行键（rowkey）来标识【正确答案】：C15.以下关于云计算、大数据和物联网之间的关系，论述错误的是：()A、物联网可以借助于云计算实现海量数据的存储B、物联网可以借助于大数据实现海量数据的分析C、云计算、大数据和物联网三者紧密相关，相辅相成D、云计算侧重于数据分析【正确答案】：D16.RDD是含义是()A、弹性分布式数据集B、弹性运算数据集C、可重复操作数据D、远端数据定义【正确答案】：A17.在HBase表中，要定位某一单元格并获取其中的值，则需要提供以下信息()。A、行键、列族、列、时间戳B、行键、列族、列C、行键D、行键、列【正确答案】：A18.为了将当前目录下的压缩归档文件myftp.tar.gz解压缩，可以使用()。A、tar-xvzfmyftp.tar.gzB、tar-xvzmyftp.tar.gzC、tar-vzfmyftp.tar.gzD、tar-xzmyftp.tar.gz【正确答案】：A19.采用多副本冗余存储的优势不包含：()A、容易检查数据错误B、节约存储空间C、保证数据可靠性D、加快数据传输速度【正确答案】：B20.Hive加载数据文件到数据表中的关键语法是？()A、LOADDATA[LOCAL]INPATHfilepath[OVERWRITE]INTOTABLEtablenameB、INSERTDATA[LOCAL]INPATHfilepath[OVERWRITE]INTOTABLEtablenameC、LOADDATAINFILEd:\car.csvAPPENDINTOTABLEt_car_tempFIELDSTERMINATEDBY‘’【正确答案】：A解析：

二、多项选择题21.如果执行命令#chmod746file.txt，那么该文件的权限是()。A、rwxr--rw-B、rw-r--r--C、--xr--rwxD、rwxr--r--【正确答案】：C22.下列说法错误的是()A、在选择SparkStreaming和Storm时，对实时性要求高（比如要求毫秒级响应）的企业更倾向于选择流计算框架StormB、Spark支持三种类型的部署方式：Standalone，SparkonMesos，SparkonYARNC、RDD提供的转换接口既适用filter等粗粒度的转换，也适合某一数据项的细粒度转换D、RDD采用惰性调用，遇到“转换(Transformation)”类型的操作时，只会记录RDD生成的轨迹，只有遇到“动作(Action)”类型的操作时才会触发真正的计算【正确答案】：C23.当启动一个SparkShell时，SparkShell已经预先创建好一个SparkContext对

象，其变量名为()A、scB、ccC、snD、nc【正确答案】：A24.以下哪个不是Spark中WorkerNode的作用()A、通过注册机制向ClusterMaster汇报自身的cpu和memory等资源B、Master的指示下创建启动Executor，Executor是执行真正计算的苦力C、将资源和任务进一步分配给ExecutorD、同步资源信息、Executor状态信息给Driver【正确答案】：D25.下面关于分布式文件系统HDFS的描述正确的是：()A、分布式文件系统HDFS是谷歌分布式文件系统GFS的一种开源实现B、分布式文件系统HDFS是GoogleBigtable的一种开源实现C、分布式文件系统HDFS比较适合存储大量零碎的小文件D、分布式文件系统HDFS是一种关系型数据库【正确答案】：A26.RDD操作分为转换（Transformation）和动作（Action）两种类型，下列属于动作（Action）类型的操作的是()A、groupByB、countC、filterD、map【正确答案】：B27.用ls-al命令列出下面的文件列表，是符号链接文件的是()A、-rw-rw-rw-2user56Sep0911:05hello1B、-rwxrwxrwx2user56Sep0911:05hello2C、drwxr--r--1user56Sep0911:05hello3D、lrwxr--r--1user56Sep0911:05hello4【正确答案】：D28.某文件的组外成员的权限为只读；所有者有全部权限；组内的权限为读与写，则该文件的权限为()。A、467B、674C、476D、764【正确答案】：A29.改变文件所有者的命令为()。A、chmodB、touchC、chownD、cat【正确答案】：C30.对于文本行“hellohadoophelloworld”，经过WordCount的Reduce函数处理的结果是()。A、<"hello",2><"hadoop",1><"world",1>B、<"hello",<1,1>><"hadoop",1><"world",1>C、<"hello",1><"hello",1><"hadoop",1><"world",1>D、<"hello",1,1><"hadoop",1><"world",1>【正确答案】：A解析：

二、多项选择题31.分布式文件系统HDFS采用了主从结构模型，由计算机集群中的多个节点构成的，这些节点分为两类，一类存储元数据叫______，另一类存储具体数据叫______：()A、名称节点，主节点B、数据节点，名称节点C、名称节点，数据节点D、从节点，主节点【正确答案】：C32.HDFS中的block默认保存()份。A、3份B、2份C、1份D、不确定【正确答案】：A33.关于SecondaryNameNode哪项是正确的?()A、它是NameNode的热备B、它的目的是帮助NameNode合并编辑日志，减少NameNode启动时间C、它对内存没有要求D、SecondaryNameNode应与NameNode部署到一个节点【正确答案】：B34.MapReduce是()计算框架。A、非分布式并发B、分布式并行C、非分布式并行D、分布式并发【正确答案】：B35.下列说法正确的是()A、如果不启动Hadoop，则HBase完全无法使用B、如果通过HBaseShell插入表数据，可以插入一行数据或一个单元格数据。C、HBase的实现包括的主要功能组件是库函数，一个Master主服务器和一个Region服务器D、Zookeeper是一个集群管理工具，常用于分布式计算，提供配置维护、域名服务、分布式同步等。【正确答案】：D36.1PB数据是多少TB？()A、1000B、2048C、1024*1024D、1024【正确答案】：D37.SparkSQL目前暂时不支持下列哪种语言()A、PythonB、JavaC、ScalaD、Matlab【正确答案】：D38.在使用MapReduce程序WordCount进行词频统计时，对于文本行“hellohadoophelloworld”，经过WordCount程序的Map函数处理后直接输出的中间结果，应该是下面哪种形式：()A、<"hello",1>、<"hello",1>、<"hadoop",1>和<"world",1>B、<"hello",<1,1>>、<"hadoop",1>和<"world",1>C、<"hello",2>、<"hadoop",1>和<"world",1>D、<"hello",1,1>、<"hadoop",1>和<"world",1>【正确答案】：A39.以下对窄依赖描述正确的是()A、可以表现为一个父RDD的分区对应于一个子RDD的分区，对输入进行协同划分B、可以表现为多个父RDD的分区对应于一个子RDD的分区，对输入进行非协同划分C、表现为存在一个父RDD的一个分区对应一个子RDD的多个分区，对输入进行非协同划分D、表现为存在一个父RDD的一个分区对应一个子RDD的多个分区，对输入进行协同划分【正确答案】：A解析：

二、多项选择题40.下列关于常见的动作（Action）和转换（Transformation）操作的API解释错误的是()A、take(n)：返回数据集中的第n个元素B、filter(func)：筛选出满足函数func的元素，并返回一个新的数据集C、count()：返回数据集中的元素个数D、map(func)：将每个元素传递到函数func中，并将结果返回为一个新的数据集【正确答案】：A1.大数据的特性包括：()A、数据量大B、数据类型繁多C、处理速度快D、价值密度低【正确答案】：ABCD2.Hadoop集群的三大核心组件是()A、HDFSB、MapReduceC、ZookeeperD、YARN【正确答案】：ABD3.大数据运维工程师的工作职责有()。A、负责Hadoop、Spark、Storm等大数据平台的规划、部署、监控、系统优化等工作，确保系统持续稳定、高效运行。B、负责大数据平台系统运营规范，及运营工具系统的设计与开发实现。C、负责原型验证，在客户业务场景下验证大数据产品的功能与性能。D、与客户沟通了解需求，在客户业务场景下根据客户的需求进行大数据项目实施，安装部署大数据平台软件。E、深入理解系统平台，为其持续优化提供建设性意见。【正确答案】：ABCD4.Hive的访问方式有哪些?()A、shellB、JDBCC、WebUID、ssh【正确答案】：ABC5.下列关于Scala的说法正确的是()A、Scala具备强大的并发性，支持函数式编程B、Scala运行于Java平台，兼容现有的Java程序C、Scala是Spark的主要编程语言，但Spark还支持Java、Python、R作为编程语言D、Scala是一种多范式编程语言【正确答案】：ABCD6.Hadoop集群的三大核心组件是：()A、HDFSB、MapReduceC、ZookeeperD、YARN【正确答案】：ABD7.Hadoop具有以下哪个几个方面的特点()A、支持多种编程语言B、高可扩展性C、高效性D、高可靠性【正确答案】：ABCD8.关于RDD论述正确的是()。A、RDD提供一种高度受限的共享内存模型，是一个弹性分布式数据集B、RDD读取的数据都存储在一台机器上C、RDD是只读存储D、RDD支持各种粗粒度和细粒度的操作【正确答案】：AC9.大数据中的非结构化数据包括()。A、文本B、视频C、语音D、图像【正确答案】：ABCD10.下列哪个是Hadoop运行的模式：()A、单机版B、伪分布式C、分布式D、Zookeeper【正确答案】：ABC11.Hive的主要特点:()A、可伸缩B、高容错C、类SQL语言D、批处理【正确答案】：ABCD12.Spark包含哪几种模式()A、本地模式（local）B、Standalone模式C、SparkonYarn模式D、SparkonMesos模式【正确答案】：ABCD13.Spark的运行架构包括()A、集群资源管理器ClusterManagerB、运行作业任务的工作节点WorkerNodeC、每个工作节点上负责具体任务的执行进程ExecutorD、每个应用的任务控制节点Driver【正确答案】：ABCD14.Spark的主要特点包括()A、运行速度快B、运行模式多样C、容易使用D、通用性好【正确答案】：ABCD15.以下哪些组件是Hadoop的生态系统的组件：()A、OracleB、HDFSC、MapReduceD、HBase【正确答案】：BCD16.以下对名称节点理解正确的是：()A、名称节点的数据保存在内存中B、名称节点通常用来保存元数据C、名称节点作为中心服务器，负责管理文件系统的命名空间及客户端对文件的访问D、名称节点用来负责具体用户数据的存

人人文库> 全部分类> 教育资料 > 考试试卷

温馨提示

1. 本站所有资源如无特殊说明，都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2. 本站的文档不包含任何第三方提供的附件图纸等，如果需要附件，请联系上传者。文件的所有权益归上传用户所有。
3. 本站RAR压缩包中若带图纸，网页内容里面会有图纸预览，若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 人人文库网仅提供信息存储空间，仅对用户上传内容的表现方式做保护处理，对用户上传分享的文档内容本身不做任何修改或编辑，并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容，请与我们联系，我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

大数据平台部署与运维练习试卷附答案

文档简介

温馨提示

最新文档

评论

大数据平台部署与运维练习试卷附答案

文档简介

温馨提示

最新文档

评论

相关文档