2024年大数据智能办公系统知识历年考试高频考点试题附带答案_第1页
2024年大数据智能办公系统知识历年考试高频考点试题附带答案_第2页
2024年大数据智能办公系统知识历年考试高频考点试题附带答案_第3页
2024年大数据智能办公系统知识历年考试高频考点试题附带答案_第4页
2024年大数据智能办公系统知识历年考试高频考点试题附带答案_第5页
已阅读5页,还剩8页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

2024年大数据智能办公系统知识历年考试高频考点试题附带答案(图片大小可自由调整)第1卷一.参考题库(共25题)1.DAG调度器会将结果以什么样的形式传给Task调度器()A、TaskSetB、TaskC、DAGD、Job2.flume中数据以Dstream的形式进行传输3.Spark也可以不依赖于第三方的资源管理和调度器,它实现了()作为其内置的资源管理和调度框架A、StandaloneB、YARNC、MesosD、redis4.类默认是()级别的A、publicB、privateC、protectedD、以上都不是5.以下使用scala语言,定义一个List,其中语法不正确的是?()A、vallist=List(1,2,3)B、vallist=List[Int](1,2,3)C、vallist=List[String](‘a’,’b’,’c’)D、vallist=List[String]()6.rdd是由一系列的什么组成的()A、jobB、driverC、partitionD、worker7.以下选项组合后能够执行spark程序的是,换句话说spark程序计算结果必须包含哪几个算子?()A、转换算子,action算子B、转换算子,控制算子C、转换算子,tracform算子D、转换算子8.以下选项中可以在spark中编写sql的框架是()A、sparkcoreB、sparkstreamingC、mlbaseD、sparksql9.以下对于这些列表操作正确的是vart=List(1,2,3)vart2=t.:+("test")()A、返回结果为List("test",1,2,3)B、返回结果为List(1,2,3,"test")C、不同类型的元素不能进行列表相加D、以上说法都不对10.flume中channel组件有什么作用()A、计算数据B、缓存数据C、输出数据D、清理数据11.通过如下程序块可以知道其输出结果为varlist=List(1,2,99,4,100)varjs=list.reduceRight(_min_)println(js)()A、100B、1C、206D、以上答案都不对12.在linux中新增用户的指令是哪个()A、useraddB、adduserC、usergroupD、groupadd13.flume中的基本存储单元是?()A、agentB、eventC、sourceD、channel14.Spark生态系统已经发展成为一个包含多个子项目的集合,其中包含SparkSQL、SparkStreaming、GraphX、MLlib等子项目15.以下属于消息中间件的是哪些()A、ActiveMQB、RabbitMQC、KafkaD、Mysql16.在linux中文件权限有哪些字母构成()A、xB、wC、rD、o17.flume中的agent包含四大组件分别为source、task、channel、sink18.最开始Flume组件是哪个公司开发的()A、ClouderaB、阿里巴巴C、京东D、google19.spark架构中的persist算子在源码中最多有()备份A、2B、3C、4D、120.spark基于客户端模式运行时,driver会随机启动21.flume的组件包括如下几种?()A、sourceB、ChannelC、GridFSD、Sink22.以下语句的运行结果为varj=2;vari=0;while(i<5){i+=2;j*=2};println(j)()A、4B、8C、16D、3223.下面输出与其他不一致的是?()A、valw="World";println(s"Hello$w")B、valw="World";println("Hello$w")C、println("HelloWorld")D、valw="World";println("Hello"+w)24.一个application就是一个spark程序25.下面有关元组的说明那些正确?()A、元组是不同类型元素的集合B、元组中的下标是从1开始C、元组中的下标是从0开始D、通过productArity可以知道元组的个数productElement(下标)获取元组的值第2卷一.参考题库(共25题)1.SparkSQL的应运而生,它是将SparkSQL转换成RDD,然后提交到集群执行,执行效率非常快2.spark中cache算子和persist算子的关系()A、_useDiskB、_useMemoryC、_useOffHeapD、_useDes3.以下单词不可当做变量名的是()A、varB、valC、forD、hello4.下面有关迭代器说法错误的是?()A、迭代器it的两个基本操作是next和hasNextB、调用迭代器next()会返回迭代器的下一个元素,并且更新迭代器的状态C、ScalaIterator(迭代器)不是一个集合,它是一种用于访问集合的方法D、ScalaIterator(迭代器)是一个集合5.以下算子属于执行算子的是()A、mapB、foreachC、flatmapD、join6.以下哪些属于动作算子()A、foreachB、reduceC、countD、map7.跟在类名后面的是主构造器8.关于元组Tuple,哪种说法是错误的()A、元组的可以包含不同类型的元素B、元组是不可变的C、访问元组第一个元素的方式为?pair._1D、元组最多只有2个元素9.下面那些属于转化算子?()A、unionB、distinctC、groupByKeyD、count10.分区是kafka消息队列的最小单位11.interSection算子对源RDD和参数RDD求交集后返回一个新的RDD12.如果想正常启动flume,需要给flume进行哪些配置()A、配置sourceB、配置sinkC、配置channelD、将source、channel、sink连接起来13.flume中的sink组件是专门用来收集数据的14.sparkSql可以读取json格式的数据15.以下选项中正确的是varlbiao=List(1,2,3,4,5)varjs=lbiao.foldRight(100)(_-_);println(js)()A、foldRight第一个参数为种子的初始值,计算过程会从右往左拿第一个数减去种子数得到的数据,拿第二个数再减去刚才的合计值,依次类推B、foldRight与fold没有区别C、foldRight表示数据从右往左进行迭代按括号内的逻辑进行操作D、fold表示数据从左往右进行迭代按括号内的逻辑进行操作,与foldRight是一个相反的过程16.mesos是一个()平台A、资源调度平台B、任务调度平台C、发送系统D、以上都不是17.storm和?spark?streaming?最大的区别?()A、科学统计支持B、是否具有schemaC、是否是真正的实时计算框架D、不同公司的产品18.count算子返回RDD的元素个数19.SparkSQL是Spark用来处理结构化数据的一个模块,它提供了一个编程抽象叫做DataFrame并且作为分布式SQL查询引擎的作用20.RDD中的所有转换都是通过转化算子延迟加载的,也就是说,它们并不会直接计算结果21.java中的continue的作用是跳出当前循环22.spark中可以整合机器学习库,并可以对外提供接口的框架是()A、sparkcoreB、sparkstreamingC、mlbaseD、sparksql23.下面选项中哪个是scala中所有类的父类()A、AnyB、AnyIntC、AnyRefD、AnyVal24.在大数据系统中的日志收集系统flume现在使用的版本是()A、OGB、NGC、MGD、BG25.scala中String类没有插值器的概念第3卷一.参考题库(共25题)1.SparkSQL有如下优点()A、最基本也是最常用的单元B、都是通过new出来的C、其实例保存在spring容器中D、在spring技术中是基于组件的2.driver的特性的说法,哪些是正确的()A、driver只有一个创建连接的功能B、driver可以分发task任务C、driver可以对task任务的执行情况进行检测D、driver可以回收task运行的结果3.spark生态圈不能进行实时计算4.下列关于kafka在进行消费数据消费时候的叙述正确的是()A、消费者主动拉取数据消费B、kafka推送数据到消费者进行消费C、kafka在进行消费数据的时候是延时的D、以上说法都不对5.flume在大数据架构中的作用是()A、监测收集数据B、处理数据C、计算数据D、存储数据6.scala中,关于类和函数,以下说法错误是()A、scala中,可以在类中定义类。B、scala中,可以在函数中定义函数。C、scala中,不可以在类中定义objectD、scala中,可以在函数中定义类7.使用scala语言编写的源程序时的文件扩展名是:(.scala)8.下列关于for循环的语句,正确的是()A、for(i<-1.to(10)){println(i)}B、for(i<-1to10){println(i)}C、for(i<-1until10){println(i)}D、for(i<-1unit10){println(i)}9.scala和java一样,在for循环中都可以使用continue关键字10.安装Hbase的压缩包,使用的Linux命令是()A、tar?-zxvfB、tar?-zxC、tar?-sD、tar?-nf11.内存计算下,Spark?比?Hadoop?快10倍12.spark内部集成的standalone功能为()A、任务调度框架B、任务模式C、资源调度框架D、任务整合13.saveAsSequenceFile动作算子将数据集中的元素以Hadoopsequencefile的格式保存到指定的目录下,可以使HDFS或者其他Hadoop支持的文件系统14.scala中,类成员的缺省访问级别是()A、publicB、privateC、protectD、以上都不是15.storm系统和spark?streaming系统最大的区别是哪个?(?)()A、科学统计支持B、是否具有schemaC、是否是真正的实时计算框架D、不同公司的产品16.高阶函数是指?()A、在程序中应该首先被定义的函数。B、将函数作为参数,并返回结果为函数的函数。C、函数参数为函数或返回结果为函数的函数。D、执行时间长的函数。17.spark架构中的的cache算子想要正常使用,必须使用action算子触发执行18.yarn是一个资源调度平台19.SortedMap为Map的子类,其中有排序的特点20.以下关于特征的说法正确的是()A、类可以实现任意数量的特质B、特质可以要求实现它们的类具备特定的字段、方法或超类C、与Java接口(Interface)相同,Scala特质也可以提供方法和字段的实现D、当将多个特质叠加在一起时,顺序很重要——其方法先被执行的特质排在更后面21.下列语句中能够输出1-30之内所有奇数的是()A、vari=1;while(i<=30){if(i%2==1){println(i)}}B、vari=1;while(i<=30){if(i/2==1){println(i)}}C、for(i<-1to30){if(i%2==1)println(i)}D、for(i<-1to30){if(i/2==1)println(i)}22.当我们在scala语言中书写for循环块用到的关键字to与until说法正确的是()A、to:左闭右闭循环体中包括左边与右边的数值B、until:左闭右开循环体中包括左边的数值,不包括右边的数值C、until和to的不同之处在于不包括最后一个元素。D、to与until用法一致,包括循环次数也一样23.Linux中重启系统的指令有哪些()A、rebootB、haltC、shutdown-rD、shutdown-h24.提供一个列表,要对其所有元素全部加2得到一个新的列表,下面那些选项正确vart=List(1,8,3,5,5)()A、t.map(x=>{x+2})B、t.map(_+2)C、其中A选项是通过一个匿名函数进行操作,B选项是通过更加简写的通配符+2表示所有元素进行加2处理,所以都正确D、以上做法都不对25.什么是日志收集系统flume的基本存储单元?()A、agentB、eventC、sourceD、channel第1卷参考答案一.参考题库1.参考答案:A2.参考答案:错误3.参考答案:A4.参考答案:A5.参考答案:C6.参考答案:C7.参考答案:A8.参考答案:D9.参考答案:B10.参考答案:B11.参考答案:B12.参考答案:A,B13.参考答案:B14.参考答案:正确15.参考答案:A,B,C16.参考答案:A,B,C17.参考答案:错误18.参考答案

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论