下载本文档
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、Spark培训试卷模块1:不定项选题 (100分,每题5分)1.关于数据及软件架构的CAP理论不包括下面哪些( D )A.可用性B.一致性C.分区容忍性D.分布性2下列关于spark中的RDD描述正确的有 ( ABCD )A.RDD(Resilient Distributed Dataset)叫做弹性分布式数据集,是spark中最基本的数据抽象B.Resilient:表示弹性的,弹性表示C.Destributed:分布式,可以并行在集群计算D.Dataset:就是一个集合,用于存放数据的3. 下列哪些是面向对象技术的特征( ABC )A封装B继承C多态D分布性4. 下列描述正确的是( ABD
2、)A进程(Process)是程序的一次执行过程B线程(Thread) 是比进程更小的执行单位C 线程不可共享相同的内存单元D在同一个应用程序中可以有多个线程同时执行5. 下面哪些是spark比Mapreduce计算快的原因( ABC )A.基于内存的计算B.基于DAG的调度框架C.基于Lineage的容错机制D.基于分布式计算的框架6.下面哪个操作是窄依赖?( B )A.join B.filter C.group D.sort 7.下面哪个操作肯定是宽依赖 ( C )A. map B. flatMap C. reduceByKey D. sample8.最早是Cloudera提供的日志收集系统
3、,目前是Apache下的一个孵化项目,支持在日志系统中定制各类数据发送方,用于收集数据的工具是( A )A.FlumeB.ZookeeperC.StormD.Sparkstreaming9.一个分布式应用程序协调服务,分布式应用程序可以基于它实现同步服务,配置维护和命名服务等的工具有 ( B )A.FlumeB.ZookeeperC.StormD.Sparkstreaming10.作为分布式消息队列,既有非常优秀的吞吐量,又有较高的可靠性和扩展性,同时接受Spark Streaming的请求,将流量日志按序发送给Spark Streaming集群是 ( C )A.FlumeB.Zookeepe
4、rC.KafkaD.Sparkstreaming11. Hadoop框架的缺陷有( ABC )AMR编程框架的限制B过多的磁盘操作,缺乏对分布式内存的支持C无法高效低支持迭代式计算D海量的数据存储12. Hadoop组件的核心功能包括( AD )A、分布式数据存储 B、分析 C、挖掘 D、分布式计算 13. DataFrame 和 RDD 最大的区别 ( B )A.科学统计支持B.多了 schema C.存储方式不一样 D.外部数据源支持14. spark中默认的存储级别 ( A )A. MEMORY_ONLY B. MEMORY_ONLY_SERC. MEMORY_AND_DISK D. M
5、EMORY_AND_DISK_SER15. Spark组成部件包括( BC )A.Resource ManagerB.ExecutorC.DriverD.RDD16. Spark RDD的依赖机制包括( AD )A. 宽依赖B. 深度依赖C.广度依赖D.窄依赖17.RDD有哪些缺陷? ADA.不支持细粒度的写和更新操作(如网络爬虫)B.基于内存的计算C.拥有schema信息D.不支持增量迭代计算18.Spark应用的计算逻辑会被解析成DAG,这个解析操作由以下哪个功能模块完成( CD )A.ClientB.ApplicationMasterC.ExecutorD.Driver 19.spark的部署模式有? ABCDA.本地模式B.standalone 模式C.spark on yarn 模式D.mesos模式20.下面不是Spark 的四大组件的有( BD )A. Spark Streaming B. pyspark 为了用Spark支持Python,Apache Spark社区发布了一个工具PySparkC. Graphx D. Spark RSparkR是一个R语言包,它提供了轻量级的方式使得可以在R语言中使用Apache SparkSpark 的四大组件有:Spark SQL、Spark Streaming、MLl
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 虚拟空间交互优化-洞察与解读
- 环保设备环境影响评价案例分析考试试题及答案
- 控制焦虑情绪的有效方法-心理学家
- 艾滋病原理介绍
- 创意设计手工首饰
- 河南省公务员考试真题及答案2025年
- 结构件加工方法
- 给客户介绍公司
- 2025年零售药店员工培训计划试题(附答案)
- 2025年初级养老护理员职业鉴定考试题库(含答案)
- 2025江苏南通市通州区石港镇招聘便民服务中心人员2人笔试考试参考题库及答案解析
- 2025入党积极分子预备党员考试题库及答案(5份)
- 2025四川成都空港兴城投资集团有限公司下属企业招聘一线岗位104人考试参考题库及答案解析
- 学堂在线 高技术与现代局部战争 章节测试答案
- 年产10万吨甲醇蛋白项目可行性研究报告
- 中国地质大学地球科学概论教学课程pptpart5公开课获奖课件
- 糖尿病与肥胖
- GA 1016-2012枪支(弹药)库室风险等级划分与安全防范要求
- 2023年上海技术交易所有限公司招聘笔试模拟试题及答案解析
- 英语学习水循环课件
- 《第三方物流(第4版)》教学大纲
评论
0/150
提交评论