南开大学23春“物联网工程”《大数据开发技术(二)》考试高频考点参考题库带答案_第1页
南开大学23春“物联网工程”《大数据开发技术(二)》考试高频考点参考题库带答案_第2页
南开大学23春“物联网工程”《大数据开发技术(二)》考试高频考点参考题库带答案_第3页
南开大学23春“物联网工程”《大数据开发技术(二)》考试高频考点参考题库带答案_第4页
南开大学23春“物联网工程”《大数据开发技术(二)》考试高频考点参考题库带答案_第5页
已阅读5页,还剩1页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

长风破浪会有时,直挂云帆济沧海。南开大学23春“物联网工程”《大数据开发技术(二)》考试高频考点参考题库带答案(图片大小可自由调整)第I卷一.综合考核(共15题)1.Scala中可以用()方法来连接两个或多个列表A.::B.#:::C.List.::()D.List.concat()2.SparkGraphX中类Graph的mask方法可以()A.反转图中所有边的方向B.按照设定条件取出子图C.取两个图的公共顶点和边作为新图,并保持前一个图顶点与边的属性D.合并边相同的属性3.Spark对只有未曾设置存储级别的RDD才能设置存储级别,设置了存储级别的RDD不能修改其存储级别。()A.正确B.错误4.Spark中的RDD的说法正确的是()。A.弹性分布式数据集B.是Spark中最基本的数据抽象C.代表一个可变的集合D.代表的集合里面的元素可并行计算5.PairRDD的()方法,可以把两个RDD中键相同的元素组合在一起,合并为一个RDD。A.joinB.unionC.substractD.intersection6.Spark中的每个RDD一般情况下是由()个分区组成的。A.0B.1C.多D.无数7.Dstream输出操作中()方法在Driver中打印出DStream中数据的前12个元素。A.printB.saveAsTextFilesC.saveAsObjectFilesD.saveAsHadoopFiles8.Spark中DataFrame的()方法是进行分组查询A.orderbyB.groupbyC.selectbyD.sortby9.Scala函数组合器可以通过一个函数重新计算列表中所有元素,没有返回值。()T.对F.错10.SparkDataFrame中()方法可以返回一个ListA.collectB.takeC.takeAsListD.collectAsList11.SparkSQL可被视为一个分布式的SQL查询引擎,并且提供了一个叫做DataFrame的可编程抽象数据模型。()A.正确B.错误12.Mllib中metrics.recallByThreshold表示()指标A.准确度B.召回率C.F值D.ROC曲线13.Scala集合分为可变的和不可变的集合。()A.正确B.错误14.Scala函数组合器中filter过滤移除使得传入的函数的返回值为true的元素。()A.正确B.错误15.Dstream输出操作中()方法将DStream中的内容按对象序列化并且以SequenceFile的格式保存A.printB.saveAsTextFilesC.saveAsObjectFilesD.saveAsHadoopFiles第II卷一.综合考核(共15题)1.图(Graph)是一种复杂的非线性结构。()A.正确B.错误2.Spark持久化RDD后,在再一次需要计算该RDD时将需要重新计算。()A.正确B.错误3.Scala列表方法中输出符号指定条件的所有元素的方法是()A.dropB.headC.filterD.init4.SparkStreaming能够处理来自()的数据。A.KafkaB.FlumeC.TwitterD.ZeroMQ5.SparkGraphX中类Graph的reverse方法可以()A.反转图中所有边的方向B.按照设定条件取出子图C.取两个图的公共顶点和边作为新图,并保持前一个图顶点与边的属性D.合并边相同的属性6.以下哪个函数可以求两个RDD差集()A.unionB.substractC.intersectionD.cartesian7.以下哪个方法可以从外部存储中创建RDD()A.parallelizeB.makeRDDC.textFileD.loadFile8.Scala是一种纯面向对象的语言,每个值都是对象。()T.对F.错9.spark-submit配置项中()表示启动的executor数量A.-num-executorsNUMB.-executor-memoryMEMC.-total-executor-coresNUMD.-executor-couresNUM10.Dstream输出操作中()方法将DStream中的内容按对象序列化并且以SequenceFile的格式保存。A.printB.saveAsTextFilesC.saveAsObjectFilesD.saveAsHadoopFiles11.()是Spark的核心,提供底层框架及核心支持A.SparkCoreB.SparkSQLC.SparkStreamingD.Mllib12.Scala列表方法中通过给定的方法将所有元素重新计算的方法是()。A.filterB.foreachC.mapD.mkString13.RDD的union函数会将两个RDD元素合并成一个并且去处重复元素。()A.正确B.错误14.Scala中使用()方法来连接两个集合。A.appendB.++C.concatD.Set.++()15.Scala列表方法中返回所有元素,除了最后一个的方法是()A.dropB.headC.filterD.init第I卷参考答案一.综合考核1.参考答案:BCD2.参考答案:C3.参考答案:A4.参考答案:ABD5.参考答案:A6.参考答案:C7.参考答案:C8.参考答案:B9.参考答案:F10.参考答案:CD11.参考答案:A12.参考答案:B13.参考答案:A14.参考答案:B15.参考答案:D第II卷参考答案一.综合考核

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论