《Spark高效数据分析与应用开发》考试复习题库（含答案）

上传人：r*** IP属地：山东上传时间：2023-09-01 格式：DOCX 页数：48 大小：51.60KB 积分：9.6 举报 版权申诉

已阅读5页，还剩43页未读，继续免费阅读

版权说明：本文档由用户提供并上传，收益归属内容提供方，若内容存在侵权，请进行举报或认领

文档简介

PAGEPAGE1《Spark高效数据分析与应用开发》考试复习题库（含答案）一、单选题1.在Spark中，map（）函数的参数类型是什么？A、RDDB、函数C、类D、对象答案：B2.在Spark中，以下对集合的描述有误的是？A、Set是一组没有先后次序的值B、Map是一组(键，值)对偶C、每个Scala集合特质或类都有一个带有apply方法的伴生对象，可以用此方法来构建该集合中的实例D、为了顾及安全性问题，Scala仅支持不可变集合而不支持可变集合答案：D3.在Spark中，如何区分转换操作和行动操作？A、看参数类型B、看返回的数据类型C、看对RDD的影响D、以上都不是答案：B4.在Spark中，reduce方法有什么样的功能？A、减少计算开销B、减少计算时间C、返回第一元素D、聚集所有元素答案：D5.在Spark中，下面输出与其他不一致的是？A、println("HelloWorld")B、print("HelloWorld\n")C、printf("Hello%s","World\n")D、valw="World";println("Hello$w")答案：D6.在Scala中，以下选项中哪一个是创建指定区间内的数组A、defofDim[T](n1:Int)B、defofDim[T](n1:Int,n2:Int)C、defofDim[T](n1:Int,n2:Int,n3:Int)D、defrange(start:Int,end:Int)答案：D7.在Scala中，使用什么关键词声明变量A、objectB、varC、StringD、varchar答案：B8.在Spark中，makeRDD的函数的作用是什么？A、创建RDDB、转换RDDC、调用RDDD、固定RDD答案：A9.在Scala中，方法的返回值类型是否可以不写A、必须写B、不写C、可以写，也可以不写D、所有答案都不正确答案：C10.在Spark中，Scala中，下面的代码执行正确的是?A、vallist=1::2::3B、vallist=1.::(2).::(3).::(Nil)C、vallist=1::“s”::“b”::NilD、varlist=1:::2:::3:::Nil答案：C11.在Spark中，Scala是一门什么语言?A、多范式的编程语言B、超文本标记语言C、面向过程编程语言D、不是语言答案：A12.在读取文件中，如果读取文件夹，被看成RDD的是什么？A、每一个文件B、子文件夹C、整个文件夹D、看情况而定答案：C13.在Spark中，scala中，关于包的引用错误的是？A、包和其成员可以用importB、可以引用某个文件夹下的特定文件C、可以引用某个文件夹下的所有文件D、包引用只能在编译单元的开始处答案：D14.在Spark中，能缓存RDD的方法有？A、map()B、filter()C、persist()D、push()答案：C15.在Spark中，scala中，下面的哪个类定义是不正确的？A、classCounter{defcounter=“counter”}B、classCounter{valcounter=“counter”}C、classCounter{varcounter:String}D、classCounter{defcounter(){}}答案：C16.在Spark中，valsite:List[String]=List("Runoob","Google","Baidu")其中site是什么类型的列表？A、字符串列表B、整型列表C、空列表D、二维列表答案：A17.在Spark中，ScalaSet的常用方法中，以下选项中哪一个是为集合添加新元素，并创建一个新的集合，除非元素已存在A、def&(that:Set[A])B、def&~(that:Set[A])C、def+(elem:A)D、def-(elem:A)答案：C18.在Spark中，关于主构造器，以下说法错误的是？A、主构造器在每个类都可以定义多个B、主构造器的参数可以直接放在类名后C、主构造器的会执行类定义中的所有语句D、主构造器中可以使用默认参数答案：A19.在Spark中，Mesos模式是否由Spark客户端直接连接Mesos，是否需要额外构建Spark集群A、是，是B、是，否C、否，是D、否，否答案：B20.在Scala中，以下选项中哪一个是返回长度为0的数组A、defapply(x:T,xs:T*)B、defconcat[T](xss:Array[T]*)C、defcopy(src:AnyRef,srcPos:Int,dest:AnyRef,destPos:Int,length:Int)D、defempty[T]答案：D21.在Scala中，创建元组的格式是什么？A、valtuple=(元素,元素…)B、valtuple={元素,元素…}C、valtuple=[元素,元素…]D、无法创建答案：A22.在Scala中，以下选项中哪一个是返回二数组，长度为第一个参数指定，同时每个元素使用第二个参数进行填充A、defiterate[T](start:T,len:Int)(f:(T)=>T)B、deffill[T](n:Int)(elem:=>T)C、deffill[T](n1:Int,n2:Int)(elem:=>T)D、defempty[T]答案：C23.在Spark中，以下哪种不属于scala的特性？A、命令式编程B、函数式编程C、静态类型D、不可扩展性答案：D24.在Scala中，以下选项中哪一个是返回指定长度数组，每个数组元素为指定函数的返回值A、defiterate[T](start:T,len:Int)(f:(T)=>T)B、deffill[T](n:Int)(elem:=>T)C、deffill[T](n1:Int,n2:Int)(elem:=>T)D、defempty[T]答案：A25.在Spark中，对于Scala中混入了特质的对象，关于其在构造时构造器执行顺序的描述错误的是A、首先调用超类的构造器B、特质构造器在超类构造器之后、类构造器之前执行。所有特质构造完毕，子类被构造C、特质由右到左被构造。如果多个特质共有一个父特质，而那个父特质已经被构造，则不会再次构造。D、每个特质中，父特质先被构造答案：C26.在Spark中，类和单例对象间的差别是？A、单例对象不可以定义方法，而类可以B、单例对象不可以带参数，而类可以C、单例对象不可以定义私有属性，而类可以D、单例对象不可以继承，而类可以答案：B27.在Spark中，关于和Scala进行交互的基本方式REPL说法错误的是?A、R读取（read）B、E求值（evaluate）C、P解析（Parse）D、L循环（Loop）答案：C28.在读取文件过程变成RDD过程中，元素是指文件的什么？A、整个文件内容B、文件的一行C、文件的一段D、文件中特定符号答案：B29.在Spark中，"Hello".take(1)起什么作用？A、获取首字符B、获取尾字符C、获取第2个字符D、以上都不是答案：A30.在Spark中，ScalaMap的常用方法中，以下选项中哪一个是返回所有的KeyA、defisEmptyB、defkeysC、defremoveD、defsum答案：B31.在Spark中，如果需要使用scala库中的sqrt函数,如sqrt(6)，下列引用包的方式错误的是?A、importscala.math._B、importsqrtC、importmath._D、importmath.sqrt答案：B32.在Spark中，spark-submit参数中，以下选项中哪一个是是否发布你的驱动到Worker节点或者作为一个本地客户端A、#REF!B、#REF!C、#REF!D、application-jar答案：B33.在ScalaList的常用方法中，哪个是在列表开头添加指定列表的元素A、def+:(elem:A)B、def::(x:A)C、def:::(prefix:List[A])D、def:+(elem:A)答案：C34.在Spark中，ScalaSet的常用方法中，以下选项中哪一个是返回两个集合的交集A、def&(that:Set[A])B、def&~(that:Set[A])C、def+(elem:A)D、def-(elem:A)答案：A35.在Scala中，使用什么关键词定义方法A、defB、varC、functionD、String答案：A36.在Spark中，以下Scala变量的定义不正确的是哪项？A、valwords:String=“HelloWorld”B、valnumber=12C、varnumber:String=NoneD、varapple:Double=2答案：C37.在Spark中，RDD转换操作的最终结果是？A、返回新的RDDB、转换成新的数据类型C、将某数据类型转换成RDDD、以上都不是答案：A38.在Spark中，下面关于override修饰符的描述错误的是？A、Scala里所有重载了父类具体成员的成员都需要这样的修饰符B、Scala里如果子类成员实现的是同名的抽象成员则这个修饰符是可选的C、Scala里如果子类中并未重载或实现什么基类里的成员则禁用这个修饰符D、Scala里如果子类是抽象类则子类的同名成员不可以使用这个修饰符答案：D39.在Spark中，当缓存丢失时，RDD如何处理？A、全部数据重头计算B、从不计算丢失数据C、计算一部分丢失数据D、计算全部丢失数据答案：D40.在Spark中，RDD被缓存时所在的JVM的内存区域为？A、堆B、栈C、常量池D、数据池答案：A41.在Scala中，List集合中是否可以存放重复对象A、可以B、不可以C、没有List集合D、所有答案都不正确答案：A42.在Scala中如何获取字符串“Hello”的首字符和尾字符？A、"Hello"(0)，"Hello"(5)B、"Hello".take(1)，"Hello".reverse(0)C、"Hello"(1)，"Hello"(5)D、"Hello".take(0)，"Hello".takeRight(1)答案：B43.在RDD缓存级别中哪个级别CPU时间使用最低?A、MEMORY_ONLYB、MEMORY_ONLY_SERC、MEMORY_ONLY_DISKD、MEMEORY_ONLY_DISK_SER答案：A44.在Spark中，下面哪一个是Spark的最基本的数据抽象？A、PDDB、PDFC、RDDD、RDF答案：C45.在Spark中，Scala属于哪种编程语言？A、函数式编程语言B、汇编语言C、机器语言D、多范式编程语言答案：D46.在Spark中，scala中，类和它的伴生对象说法错误的是？A、类和它的伴生对象定义在同一个文件中B、类和它的伴生对象可以有不同的名称C、类和它的伴生对象可以互相访问私有特性D、类和它的伴生对象可以实现既有实例方法又有静态方法答案：B47.在Spark中，first（）方法属于什么操作？A、转换操作B、行动操作C、集合操作D、以上都不是答案：B48.在Spark中，Spark基于什么计算的方式，提高了在大数据环境下数据处理的实时性，同时保证了高容错性和高可伸缩性。A、内存B、显存C、mapD、reduce答案：A49.在Spark中，ScalaSet的常用方法中，以下选项中哪一个是计算满足指定条件的集合元素个数A、defcount(p:(A)=>Boolean)B、defexists(p:(A)=>Boolean)C、deffilter(p:(A)=>Boolean)D、deffind(p:(A)=>Boolean)答案：A50.在Spark中，collect方法的返回值类型是？A、ArrayB、MapC、SetD、List答案：A51.在Spark中，对于表达式"NewYork".partition(_.isUpper)返回结果正确的是？A、("New","York")B、("NY","ework")C、("erork","NY")D、("NewYork","NY")答案：B52.在Spark迭代中处理效率高的原因在于？A、执行代码较少B、编程语言不同C、高并发处理D、读写操作基于内存答案：D53.在Spark中，"Hello".reverse(0)起什么作用？A、获取首字符B、获取尾字符C、获取第2个字符D、以上都不是答案：B54.在Spark中，ScalaMap的常用方法中，以下选项中哪一个是返回一个新的Map，新的Map由xs组成A、def++(xs:Map[(A,B)])B、def--(xs:GTO[A])C、defget(key:A)D、defapply(key:A)答案：A55.在Spark中，ScalaMap的常用方法中，以下选项中哪一个是检测Map是否为空A、defisEmptyB、defkeysC、defremoveD、defsum答案：A56.在Spark中，countByKey方法的返回值类型是？A、ArrayB、MapC、SetD、List答案：B57.在Spark中，下列数组定义与其他不一致的是？A、vala=Array[Int](0,0)B、vala=Array(0,0)C、vala=newArray[Int](2)D、vala=Array[Int](1,1)答案：D58.在Spark中，对于函数defgetGoodsPrice(goods:String)={valprices=Map(“book”->5,“pen”->2,“sticker”->1)prices.getOrElse(goods,0)}结果说法错误的是？A、getGoodsPrice("book")//等于5B、getGoodsPrice("pen")//等于2C、getGoodsPrice("sticker")//等于1D、getGoodsPrice("sock")//等于“sock”答案：D59.在Scala中，以下选项中哪一个是创建指定对象T的数组A、defapply(x:T,xs:T*)B、defconcat[T](xss:Array[T]*)C、defcopy(src:AnyRef,srcPos:Int,dest:AnyRef,destPos:Int,length:Int)D、defempty[T]答案：A60.在Spark中，"crazy"*3的结果是？A、crazy3B、crazycrazycrazyC、crazycrazyD、以上都不是答案：B61.在Scala中，以下选项中哪一个是返回数组，长度为第一个参数指定，同时每个元素使用第二个参数进行填充A、defiterate[T](start:T,len:Int)(f:(T)=>T)B、deffill[T](n:Int)(elem:=>T)C、deffill[T](n1:Int,n2:Int)(elem:=>T)D、defempty[T]答案：B62.在Spark中，函数defswap[S,T](tup:(S,T))={tupmatch{case(a,b)=>(b,a)}}的作用是？A、完成2个数的交换B、完成2个数的相加C、完成2个数的相乘D、以上都不是答案：A63.在Spark中，Yarn模式是否由Spark客户端直接连接Yarn，是否需要额外构建Spark集群。A、是，是B、是，否C、否，是D、否，否答案：B64.在Spark中，列表的head操作起什么作用？A、返回列表第一个元素B、返回一个列表，包含除了第一元素之外的其他元素C、在列表为空时返回trueD、以上都不是答案：A65.在Spark中，类定义如下abstractclassElement{defcontents:Array[String]}，描述不正确的是？A、Element是一个抽象类B、Element不能实例化C、Contents成员定义错误，没有初始化D、contents方法是类Element的抽象成员答案：C66.在Scala中，什么元组的最简单形式A、对偶B、集合C、数组D、枚举答案：A67.在Spark中，Scala关于变量定义、赋值，错误的是？A、vala=3B、vala:String=3C、varb:Int=3;b=6D、varb="HelloWorld!";b="123"答案：B68.在Spark中，ScalaSet的常用方法中，以下选项中哪一个是比较是否相等A、def++(elems:A)B、defapply(elem:A)C、defdiff(that:Set[A])D、defequals(that:Any):答案：D69.在Spark中，以下关于特质的说法错误的是？A、类可以实现任意数量的特质B、特质可以要求实现它们的类具备特定的字段、方法或超类C、与Java接口(Interface)相同，Scala特质也可以提供方法和字段的实现D、当将多个特质叠加在一起时，顺序很重要——其方法先被执行的特质排在更后面答案：C70.在Spark中，filter（）方法属于什么操作？A、转换操作B、行动操作C、集合操作D、以上都不是答案：A71.在Spark中，scala中，以下说法错误是？A、scala中，可以在类中定义类B、scala中，可以在函数中定义函数C、scala中，不可以在类中定义objectD、scala中，可以在函数中定义类答案：C72.在Spark中，使用collectAsMap（）时如果key对应多个value，会如何处理？A、保留第一个valueB、保留最后一个valueC、保留所有value的值D、保留所有value的值构成的集合答案：B73.在Spark中，flatMap函数与map函数的区别是？A、前者参数较多B、后者参数较少C、前者可以将一个元素映射为多个D、后者可以将一个元素映射为多个答案：C74.在Spark中，可以正确匹配"12340"的正则表达式是？A、"\s+[0-9]+\s+".rB、""\s+[0-4]+\s+".rC、"""\s+\d+\s+""".rD、以上均不正确答案：C75.在Scala中，以下选项中哪一个是制一个数组到另一个数组上A、defapply(x:T,xs:T*)B、defconcat[T](xss:Array[T]*)C、defcopy(src:AnyRef,srcPos:Int,dest:AnyRef,destPos:Int,length:Int)D、defempty[T]答案：C76.在ScalaList的常用方法中，哪个是在列表开头添加元素A、def+:(elem:A)B、def::(x:A)C、def:::(prefix:List[A])D、def:+(elem:A)答案：B77.在Scala中，定义Set的格式是什么A、valset=(元素,元素…)B、valset=[元素,元素…]C、valset={元素,元素…}D、valset=Set(元素,元素…)答案：D78.在Spark中，sortByKey的作用是什么？A、通过值排序返回原RDDB、通过值排序返回新RDDC、通过键排序返回原RDDD、通过键排序返回新RDD答案：D79.在Spark中，下列哪一个方法有折叠的功能？A、foldB、takeOrderedC、takeSampleD、take答案：A80.在Spark中，以下关于闭包描述错误的是？A、闭包是一个函数，其返回值依赖于声明在函数包部的一个或多个变量B、通常来讲，可以将闭包看作是可以访问一个函数里面局部变量的另一个函数C、对于defmulBy(factor:Double)=(x:Double)=>factor*x;valtriple=mulBy(3);,函数triple是一个闭包D、对于defmulBy(factor:Double)=(x:Double)=>3*x;valtriple=mulBy(3);,函数triple是一个闭包答案：D81.在Spark中，spark-submit参数中，以下选项中哪一个是打包好的应用jar，包含依赖A、#REF!B、#REF!C、#REF!D、application-jar答案：D82.在Spark中，关于辅助构造器，以下说法不正确的是？A、辅助构造器的名称为thisB、辅助构造器的定义要调用已定义的辅助构造器或主构造器C、辅助构造器可以有任意多个D、辅助构造器必须要带参数答案：D83.在Spark中，sc.makeRDD(1to10,2).collect（）.foreach(println)的作用是？A、打印十次2B、打印1到9两遍C、打印1到9D、打印1到10答案：D84.在Spark中，定义类ClassPerson（privatevalname:String）{},以下说法正确是？A、name是对象私有字段B、name是类私有字段，有私有的getter方法C、name是类公有字段，有公有的getter和setter方法D、name是类私有字段，可以在类内部被改变答案：B85.在Spark中，Spark是用来代替Hadoop中哪个组件的？A、HDFSB、YARNC、MapReduceD、以上都不是答案：C86.在Spark中，ScalaSet的常用方法中，以下选项中哪一个是比较两个集合的差集A、def++(elems:A)B、defapply(elem:A)C、defdiff(that:Set[A])D、defequals(that:Any):答案：C87.在Spark中，如果Job的某个Stage阶段计算失败，重新计算的默认次数是？A、1B、2C、3D、4答案：D88.在Spark中，ScalaSet的常用方法中，以下选项中哪一个是返回两个集合的差集A、def&(that:Set[A])B、def&~(that:Set[A])C、def+(elem:A)D、def-(elem:A)答案：B89.在Spark中，以下哪种说法是正确的？A、数组可以包括不同类型的元素B、数组是不可变的C、数组最多不可以超过50个元素D、数组最多不可以超过22个元素答案：A90.在Spark中，Spark在向内存中写入数据时，如果内存放不下了，会如何操作？A、删掉剩余部分B、停止操作直到有多的内存C、写入磁盘D、以上都不是答案：C91.在Spark中，以下单例对象，定义错误的是？A、objectA{varstr=“”}B、objectA(str:String){}C、objectA{defstr=“”}D、objectA{valstr=“”}答案：B92.在ScalaList的常用方法中，哪个是为列表预添加元素A、def+:(elem:A)B、def::(x:A)C、def:::(prefix:List[A])D、def:+(elem:A)答案：A93.在Spark中，scala如果没有指定访问修饰符，默认使用哪个修饰符？A、publicB、protectedC、defaultD、private答案：A94.在Spark中，scala中defmul(x:Int)(y:Int)=x*y称作A、柯里化函数B、匿名函数C、高阶函数D、偏应用函数答案：A95.在Spark中，高阶函数是指？A、在程序中应该首先被定义的函数B、将函数作为参数，并返回结果为函数的函数C、函数参数为函数或返回结果为函数的函数D、执行时间长的函数答案：C96.在Spark中，对集(Set)进行操作"Set(2,0,1)+1+1-1"之后的结果为？A、Set(2,0,1,1)B、Set(2,0,1)C、Set(2,0)D、已上均不正确答案：C97.在Spark中，如下代码执行结果是？defsomeCurring(y:Int):(Int)=>Int={defs(y:Int)=2*ys}valresult=someCurring(4)(3)A、6B、4C、8D、9答案：A98.在Spark中，spark-submit参数中，以下选项中哪一个是应用程序的启动类A、#REF!B、#REF!C、#REF!D、application-jar答案：A99.在Spark中，spark-submit参数中，以下选项中哪一个是任意的Spark配置属性A、#REF!B、#REF!C、#REF!D、application-jar答案：C100.在Spark中，Spark项目采用什么语言编写？A、JavaB、htmlC、C#D、Scala答案：D101.在Spark中，ScalaSet的常用方法中，以下选项中哪一个是检测集合中是否包含指定元素A、def++(elems:A)B、defapply(elem:A)C、defdiff(that:Set[A])D、defequals(that:Any):答案：B102.在Spark中，Scala语言是运行在什么平台上,所以也是跨平台的语言A、hadoopB、jvmC、javaD、python答案：B103.在Spark中，varmyVar:String="Foo"其中myVar是什么类型？A、字符序列B、LongC、IntD、Short答案：A104.在Spark中，Java：for(inti=10;i>=0;i–)System.out.println(i)在scala中怎么表示？A、for(i<-1to10reverse)print(i)B、for(i<-0to10reverse)print(i)C、for(i<-1to10)print(i)D、for(i<-1to11reverse)print(i)答案：B105.在Spark中，以下哪种可以正确计算数组k的长度？A、count()B、take(1)C、tail()D、length()答案：D106.在Spark中，定义一个类，定义正确的是？A、classHouse（name）{defgetname=“beijing”}B、classhouse{name=“nanjing”}C、classHouse{publicvarcounter:String=“shanghai”}D、classhouse(varname:String){privatedefgetName=name}答案：D107.在Spark中，不属于Scala7种数值类型的是?A、CharB、IntC、FloatD、LongLong答案：D108.在Spark中，count（）方法属于什么操作？A、转换操作B、行动操作C、集合操作D、以上都不是答案：B109.在Spark中，parallelize函数的作用是什么？A、创建RDDB、转换RDDC、调用RDDD、固定RDD答案：A110.在Scala中，以下选项中哪一个是合并数组A、defapply(x:T,xs:T*)B、defconcat[T](xss:Array[T]*)C、defcopy(src:AnyRef,srcPos:Int,dest:AnyRef,destPos:Int,length:Int)D、defempty[T]答案：B111.在Spark中，ScalaSet的常用方法中，以下选项中哪一个是合并两个集合A、def++(elems:A)B、defapply(elem:A)C、defdiff(that:Set[A])D、defequals(that:Any):答案：A112.在Scala中，以下选项中哪一个是创建指定长度的一维数组A、defofDim[T](n1:Int)B、defofDim[T](n1:Int,n2:Int)C、defofDim[T](n1:Int,n2:Int,n3:Int)D、defrange(start:Int,end:Int)答案：A113.在Spark中，下列哪一个方法在保存文件时会将RDD序列化成对象？A、saveAsTextFileB、saveAsSequenceFileC、saveAsObjectFileD、以上都不是答案：C114.在Spark中，关于数组的常用算法，下列说法错误的是？A、Array(1,7,2,9).sum//等于19B、Array(1,7,2,9).sorted//等于Array(9,7,2,1)C、Array("one","two","three").max//等于"two"D、Array("one","two","three").mkString("-")//等于"one-two-three"答案：B115.在Spark中，BigInt(2).pow(1024)起什么作用？A、计算2的1024次方B、计算1024的2次方C、计算1024＊2D、以上都不是答案：A116.在Spark中，RDD执行任务执行失败时，重新计算的默认次数是？A、1B、2C、3D、4答案：D117.在Spark中，ScalaSet的常用方法中，以下选项中哪一个是移除集合中的元素，并创建一个新的集合A、def&(that:Set[A])B、def&~(that:Set[A])C、def+(elem:A)D、def-(elem:A)答案：D118.在Spark中，关于元组Tuple说法错误的是？A、元组的可以包含不同类型的元素B、元组是不可变的C、访问元组第一个元素的方式为pair._1D、元组最多只有2个元素答案：D119.在Spark中，SparkLocal模式是运行在几台计算机上的模式？A、1B、2C、3D、4答案：A120.在RDD缓存级别中哪个不是在内存中?A、MEMORY_ONLYB、MEMORY_ONLY_SERC、MEMORY_ONLY_DISKD、DISK_ONLY答案：D121.在ScalaList的常用方法中，哪个是在末尾添加元素A、def+:(elem:A)B、def::(x:A)C、def:::(prefix:List[A])D、def:+(elem:A)答案：D多选题1.在Spark中，Standalone模式是由哪两部分构成的Spark集群【选两项】A、MasterB、WorkerC、SlaveD、leader答案：AC2.在Spark中，如果需要使用scala库中的sqrt函数,如sqrt(2)，下列引用包的方式正确的是?【选三项】A、importscala.math._B、importsqrtC、importmath._D、importmath.sqrt答案：ACD3.在Spark中，Spark支持的计算模型有【选三项】A、批处理B、实时计算C、机器学习模型D、交互式删除答案：ABC4.在Spark中，创建RDD的方式大概有哪些？【选三项】A、通过集合创建RDDB、通过RDD类创建RDDC、通过外部存储创建RDDD、通过其他RDD创建新RDD答案：ACD5.在Spark中，关于函数defsumSquare(args:Int*)={varr=0for(arg<-args){r+=arg*arg}r}的结果正确的有哪些？【选三项】A、sumSquare(1,2,3)=14B、sumSquare(2,4)=16C、sumSquare(6)=36D、sumSquare(1,1,2,3)=15答案：ACD6.在Spark中，以下哪些选项是Spark的优点。【选三项】A、与Hadoop的MapReduce相比，Spark基于内存的运算要快100倍以上，基于硬盘的运算也要快10倍以上B、Spark不支持Java、Python和Scala的API。C、Spark提供了统一的大数据解决方案，减少开发和维护的人力成本和部署平台的物力成本D、Spark可以非常方便地与其他的开源产品进行融合答案：ACD7.在Spark中，RDD可以包含哪些编程语言的类型对象？【选三项】A、JavaB、CC、ScalaD、Python答案：ACD8.在Spark中，下面的函数中有哪些是转换操作？【选三项】A、cartesianB、countC、reduceByKeyD、groupByKey答案：ACD9.在Spark中，Spark运行模式中的Local模式可以通过哪三种集中方式设置【选三项】A、localB、local[K]C、local[*]D、local[$]答案：ABC10.在Spark中，下列属于转换操作的函数有哪些？【选三项】A、sampleB、distinctC、partitionByD、close答案：ABC11.在Spark中，以下选项哪些是Spark的运行模式？【选三项】A、Local模式B、Standalone模式C、Master模式D、Mesos模式答案：ABD12.在Spark中，下列选项中有哪些函数属于行动操作？【选三项】A、collectB、joinC、firstD、take答案：ACD13.在Spark中，驱动器主要责任有哪些?【选三项】A、把用户程序转为作业（Job）B、跟踪Executor的运行状况C、为执行器节点进行IO操作D、UI展示应用运行状况答案：ABD14.在Scala中，以下选项中哪一个是创建二维数组A、defofDim[T](n1:Int)B、defofDim[T](n1:Int,n2:Int)C、defofDim[T](n1:Int,n2:Int,n3:Int)D、defrange(start:Int,end:Int)答案：B15.在Spark中，以下哪几项是SparkCore的基本功能模块？【选三项】A、任务调度B、I/O处理C、错误恢复D、存储系统交互答案：ACD16.在Spark中，scala语言中一个函数可以定义在？【选三项】A、构造函数里B、class内C、object内D、object外答案：ABC17.在Spark中，RDD的特点有哪些？【选三项】A、闭合的B、不可变的C、可分区的D、可并行的答案：BCD18.在Spark中，以下函数中不是行动操作的函数有哪些？【选三项】A、sortByB、unionC、subtractD、以上都是答案：ABC19.在RDD缓存级别中哪些有部分需要磁盘上？【选两项】A、MEMORY_ONLYB、MEMORY_ONLY_SERC、MEMORY_ONLY_DISKD、MEMEORY_ONLY_DISK_SER答案：CD20.在Spark中，对数据的操作包含哪些？【选三项】A、创建RDDB、转换已有RDDC、调用RDDD、固定RDD答案：ABC21.在Spark中，Spark能读写的文件有哪些类型？【选三项】A、JSONB、CSVC、SequenceD、以上都不对答案：ABC22.在Scala中，以下选项中哪一个是创建三维数组A、defofDim[T](n1:Int)B、defofDim[T](n1:Int,n2:Int)C、defofDim[T](n1:Int,n2:Int,n3:Int)D、defrange(start:Int,end:Int)答案：C23.在Spark中，scala使用哪些修饰符？【选两项】A、publicB、scalaC、privateD、bool答案：AC24.在Spark中，关于函数defgetPageNum(file:String)={varbookMap=Map("Chinese"->164,"Math"->180,"English"->150,"Geography"->120)bookMap.getOrElse(file,0)}，执行错误的是？【选两项】A、getPageNum(“Math”)=180B、getPageNum(“Math”)=164C、getPageNum(“Physics”)=164D、ge

人人文库> 全部分类> 教育资料 > 考试试卷

温馨提示

1. 本站所有资源如无特殊说明，都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2. 本站的文档不包含任何第三方提供的附件图纸等，如果需要附件，请联系上传者。文件的所有权益归上传用户所有。
3. 本站RAR压缩包中若带图纸，网页内容里面会有图纸预览，若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 人人文库网仅提供信息存储空间，仅对用户上传内容的表现方式做保护处理，对用户上传分享的文档内容本身不做任何修改或编辑，并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容，请与我们联系，我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

《Spark高效数据分析与应用开发》考试复习题库（含答案）

文档简介

温馨提示

最新文档

评论

《Spark高效数据分析与应用开发》考试复习题库（含答案）

文档简介

温馨提示

最新文档

评论

相关文档