



下载本文档
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、Spark培训试卷模块1:不定项选题 (100分,每题5分)1.关于数据及软件架构的CAP理论不包括下面哪些( D )A.可用性B.一致性C.分区容忍性D.分布性2下列关于spark中的RDD描述正确的有 ( ABCD )A.RDD(Resilient Distributed Dataset)叫做弹性分布式数据集,是spark中最基本的数据抽象B.Resilient:表示弹性的,弹性表示C.Destributed:分布式,可以并行在集群计算D.Dataset:就是一个集合,用于存放数据的3. 下列哪些是面向对象技术的特征( ABC )A封装B继承C多态D分布性4. 下列描述正确的是( ABD
2、)A进程(Process)是程序的一次执行过程B线程(Thread) 是比进程更小的执行单位C 线程不可共享相同的内存单元D在同一个应用程序中可以有多个线程同时执行5. 下面哪些是spark比Mapreduce计算快的原因( ABC )A.基于内存的计算B.基于DAG的调度框架C.基于Lineage的容错机制D.基于分布式计算的框架6.下面哪个操作是窄依赖?( B )A.join B.filter C.group D.sort 7.下面哪个操作肯定是宽依赖 ( C )A. map B. flatMap C. reduceByKey D. sample8.最早是Cloudera提供的日志收集系统
3、,目前是Apache下的一个孵化项目,支持在日志系统中定制各类数据发送方,用于收集数据的工具是( A )A.FlumeB.ZookeeperC.StormD.Sparkstreaming9.一个分布式应用程序协调服务,分布式应用程序可以基于它实现同步服务,配置维护和命名服务等的工具有 ( B )A.FlumeB.ZookeeperC.StormD.Sparkstreaming10.作为分布式消息队列,既有非常优秀的吞吐量,又有较高的可靠性和扩展性,同时接受Spark Streaming的请求,将流量日志按序发送给Spark Streaming集群是 ( C )A.FlumeB.Zookeepe
4、rC.KafkaD.Sparkstreaming11. Hadoop框架的缺陷有( ABC )AMR编程框架的限制B过多的磁盘操作,缺乏对分布式内存的支持C无法高效低支持迭代式计算D海量的数据存储12. Hadoop组件的核心功能包括( AD )A、分布式数据存储 B、分析 C、挖掘 D、分布式计算 13. DataFrame 和 RDD 最大的区别 ( B )A.科学统计支持B.多了 schema C.存储方式不一样 D.外部数据源支持14. spark中默认的存储级别 ( A )A. MEMORY_ONLY B. MEMORY_ONLY_SERC. MEMORY_AND_DISK D. M
5、EMORY_AND_DISK_SER15. Spark组成部件包括( BC )A.Resource ManagerB.ExecutorC.DriverD.RDD16. Spark RDD的依赖机制包括( AD )A. 宽依赖B. 深度依赖C.广度依赖D.窄依赖17.RDD有哪些缺陷? ADA.不支持细粒度的写和更新操作(如网络爬虫)B.基于内存的计算C.拥有schema信息D.不支持增量迭代计算18.Spark应用的计算逻辑会被解析成DAG,这个解析操作由以下哪个功能模块完成( CD )A.ClientB.ApplicationMasterC.ExecutorD.Driver 19.spark的部署模式有? ABCDA.本地模式B.standalone 模式C.spark on yarn 模式D.mesos模式20.下面不是Spark 的四大组件的有( BD )A. Spark Streaming B. pyspark 为了用Spark支持Python,Apache Spark社区发布了一个工具PySparkC. Graphx D. Spark RSparkR是一个R语言包,它提供了轻量级的方式使得可以在R语言中使用Apache SparkSpark 的四大组件有:Spark SQL、Spark Streaming、MLl
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 初中物理教学全套
- 湖南省岳阳市一中下学期2025年高三二诊模拟考试英语试卷含解析
- 北京市北方交通大学附属中学2025届高三第一次模拟考试英语试卷含解析
- 电修工考试题
- 2025届陕西省汉中市汉台区县高三第三次测评英语试卷含答案
- 天津市红桥区2024-2025学年高二下学期4月期中考试 化学试题(原卷版+解析版)
- 白酒营销策划与执行考核试卷
- 篷布在农业温室建设的材料研发与性能优化方法研究进展考核试卷
- 城市配送中的物流配送路径再优化考核试卷
- 空调器节能认证流程考核试卷
- 《MRI图像伪影》课件
- 固体废弃物处理和资源化利用项目可行性研究报告申请建议书案例一
- DeepSeek零基础到精通手册(保姆级教程)
- 2025年度红木家具出口退税申报代理合同
- 2025-2030全球氢燃料电池膜电极组件行业调研及趋势分析报告
- 中国轻客行业市场调研分析及投资战略规划报告
- 2024年度医疗设备运营维护合作框架协议2篇
- 人教版小学五年级数学下册《第八单元 数学广角-找次品》大单元整体教学设计2022课标
- 中国百日咳诊疗与预防指南(2024版)
- GB/T 44947-2024机器状态监测与诊断性能诊断方法
- 统编版二年级上册语文《坐井观天》 课件完整版
评论
0/150
提交评论