spark编程基础python版期末考试题库_第1页
spark编程基础python版期末考试题库_第2页
spark编程基础python版期末考试题库_第3页
spark编程基础python版期末考试题库_第4页
spark编程基础python版期末考试题库_第5页
已阅读5页,还剩3页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

spark编程基础python版期末考试题库

选择判断

1.下面哪个不是RDD的特点0

A.可分区B.可序列化C.可修改D.可持久化

2.关于累加器,下面哪个是错误的()

A.支持加法

B.支持数值类型

C.可并行

D.不支持自定义类型

3.Scala语言中,以下说法正确的是()

A.常量和变量都可以不用赋初始值

B.常量需要赋初始值,变量可以不用斌初始值

C.常量和变量都需要赋初始值

D.常量不需要赋初始值,变量必须赋初始值

4.下面对MapReduce描述错误的是()

A.适合离线批处理

B.具有很好的容错性和扩展性

C.启动开销小、可以使用很少的磁盘到时效率提高

D.Shuffle连接Map和Reduce

6.下列哪一项是yarn的一级调度管理()

A.计算资源管理

B.Schedule的周期管理

C.application内部计算模型管理

D.多样化计算模型管理

7.Scala里,final修饰符的描述止确的是()

A.类的声明上添加final修饰符确保成员不被子类重载

B.类的声明上添加final修饰符把整个类声明为final,这个

类不能被继承

C.类的声明上添加final修饰符确保成员只能被子类重载一次

D.以上说法都是错误的

8.调用函数时指定(),参数顺序可以跟函数定义时的顺序不

A.参数名

B.参数值

C.默认值

D.变量值

9.scala中,类和它的伴生对象说法错误的是()

A.类和它的伴生对象定义在同一个文件中。

B.类和它的伴生对象可以有不同的名称。

C.类和它的伴生对象可以互相访问私有特性。

D.类和它的伴生对象可以实现既有实例方法又有静态方法。

10.以下()可以实现类似java中的break跳出方式

A.使用一个Boolean类型的控制变量,合适的时候return

B.使用嵌套函数一从函数当中return

C.使用Breaks对象中的break方法

D.使用continue

ABC

11.Spark可以实现哪些形式的分布式计算()

A.内存式运算

B.机器学习

C.交互式查询

D.流式计算

ABCD

12.Spark的算子类型()

A.转换算子

B.迭代算子

C.动作算子

D.核心算子

AC

13.下列哪些是spark的特点()

A.运行快

B.基于内存

C.底层是mr运算

D.速度快

ABD

14.spark的存储级别包含()

A.MEMORY_ONLY

B.MEMORY_ONLY_SER

C.MEMORY

D.MEMORYANDDISKSER

ABD

15.以下是Spark中executor的作用是()

A.保存计算的RDD分区数据

B.向Driver反向注册

C.接受Driver端发送来的任务Task,作用在RDD上进行执行

D.做资源调度任务

ABC

16.关于累加器,下面哪个是正确的()

A.支持加法

B.支持数值类型

C.可并行

D.不支持自定义类型

ABC

17.关于广播变量,下面哪个是正确的()

A.任何函数调用

B.是只读的

C.存储在各个节点

D.存储在磁盘或HDFS

ABC

18.spark的特点有哪些()

A.快速性

B.通用性

C.兼容性

D.持续性

ABC

19.下列选项有哪些是spark优化()

A.复用同一个rdd

B.创建重复的rdd

C.尽量使用shuffle算子

D.使用map-side预聚合的shuffle操作

AD

20.关于累加器,下面哪个是正确的的()

A.支持加法

B.支持数值类型

C.不可并行

D.不支持自定义类型

AB

21.spark的特点包括()

A.快速

B.通用

C.可延伸

D.兼容性

ABD

22.容错的级别有()

A.最多一次

B.至少一次

C.一次仅一次

D.只能一次

ABC

23.关于广播变量,下面哪个是错误的()

A.任何函数调用B.是只读的

C.存储在各个节点D.存储在磁盘或HDFS

ABC

24.Spark的数据本地性有哪几种()

A.PROCESS_LOCAL是指读取缓存在本地节点的数据

B.NODE_LOCAL是指读取木地节点硬盘数据

C.ANY是指读取非本地节点数据

D.B和C对

ABC

25.关于master的作用,下面正确的是()

A.接受driver端注册请求

B.启动任务的容器Executor

C.任务资源的调度

D.监控集群

ACD

26.如何解决数据倾斜()

A.增大分区

B.增加前缀或后缀

C.减少分区

D.根据需要找Key

ABD

27.Spark的资源分配方式包括()

A.尽量集中

B.尽量打散

C.全部集中

D.全部打散

AB

28.下面哪些端口是spark自带服务的端口()

A.8080B.4040C.8090D.18080

ABD

29.下面属于H3FS设计目标的是

A.自动快速检测应对硬件错误

B.流式访问数据

C.移动计算比移动数据本身更划算

D.简单一致性模型

ABCD

30.下面描述止确的是。

A.HDFS将数量众多的廉价机器使得硬件错

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论