南开大学23春“物联网工程”《大数据开发技术(二)》考试高频考点参考题库带答案_第1页
南开大学23春“物联网工程”《大数据开发技术(二)》考试高频考点参考题库带答案_第2页
南开大学23春“物联网工程”《大数据开发技术(二)》考试高频考点参考题库带答案_第3页
南开大学23春“物联网工程”《大数据开发技术(二)》考试高频考点参考题库带答案_第4页
南开大学23春“物联网工程”《大数据开发技术(二)》考试高频考点参考题库带答案_第5页
已阅读5页,还剩4页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

长风破浪会有时,直挂云帆济沧海。南开大学23春“物联网工程”《大数据开发技术(二)》考试高频考点参考题库带答案(图片大小可自由调整)第I卷一.综合考核(共15题)1.Scala中高阶函数经常将只需要执行多次的函数定义为匿名函数作为参数。()T.对F.错2.spark-submit配置项中()表示Driver程序使用的内存大小A.--driver-memoryMEMB.--executor-memoryMEMC.--total-executor-coresNUMD.--executor-couresNUM3.Spark可以通过哪些外部存储创建RDD()A.文本文件B.目录C.压缩文件D.通配符匹配的文件4.SparkDataFrame中()方法可以返回一个Array对象A.collectB.takeC.takeAsListD.collectAsList5.Spark支持使用()语言编写应用A.ScalaB.PythonC.JavaD.R6.Spark可以从()分布式文件系统中读取数据A.HDFSB.HbaseC.HiveD.Tachyon7.Scala是一种纯面向对象的语言,每个值都是对象。()T.对F.错8.GraphX中()方法可以查询度数A.degreesB.degreeC.verticesD.edges9.Dstream提供了sort方法。()A.正确B.错误10.RDD的行动操作是用于触发转换操作的操作,这个时候才会真正开始进行计算。()A.正确B.错误11.Spark中的RDD的说法正确的是()A.弹性分布式数据集B.是Spark中最基本的数据抽象C.代表一个可变的集合D.代表的集合里面的元素可并行计算12.以下哪个方法可以创建RDD()A.parallelizeB.makeRDDC.textFileD.loadFile13.RDD的flatMap操作是将函数应用于RDD之中的每一个元素,将返回的迭代器(数组、列表等)中的所有元素构成新的RDD。()A.正确B.错误14.Spark创建DataFrame对象方式有()A.结构化数据文件B.外部数据库C.RDDD.Hive中的表15.Scala函数组合器可以接收一个可以处理嵌套列表的函数,然后把返回结果连接起来的方法是()A.mapB.foreachC.flattenD.flatmap第II卷一.综合考核(共15题)1.vara=10;for(aA.10B.11C.20D.192.()是AMPLab发布的一个R开发包,使得R摆脱单机运行的命运,可以作为Spark的Job运行在集群上A.SparkRB.BlinkDBC.GraphXD.Mllib3.Scala通过()来定义变量A.valB.valC.defineD.def4.RDD的行动操作通过某种函数将一个RDD转换为一个新的RDD,但是转换操作是懒操作,不会立刻执行计算。()A.正确B.错误5.Scala列表中last返回列表最后一个元素。()A.正确B.错误6.RDD的sortBy函数包含参数numPartitions,该参数决定排序后的RDD的分区个数,默认排序后的分区个数和排序之前的个数相等,即为this.partitions.size。()T.对F.错7.Dstream输出操作中()方法将DStream中的内容按对象序列化并且以SequenceFile的格式保存。A.printB.saveAsTextFilesC.saveAsObjectFilesD.saveAsHadoopFiles8.Scala函数组合器可以过滤移除使得传入的函数的返回值为false的元素的方法是()A.filterB.flattenC.groubyD.flatmap9.Dstream窗口操作中()方法基于滑动窗口对源DStream中的元素进行聚合操作,得到一个新的DstreamA.windowB.countByWindowC.reduceByWindowD.reduceByKeyAndWindow10.Scala函数支持()A.递归函数B.高阶函数C.柯里化D.匿名函数11.GraphX中Edge边对象存有()字段A.srcIdB.dstIdC.attrD.val12.RDD的subtract用于用于将前一个RDD中在后一个RDD出现的元素删除。()T.对F.错13.SparkGraphX中类Graph的joinVertices方法可以()。A.收集邻居顶点的顶点Id和顶点属性B.收集邻居顶点的顶点IdC.向指定顶点发送信息并聚合信息D.将顶点信息更新到图中14.SparkStreming中()函数当被调用类型分别为(K,V)和(K,W)键值对的2个DStream时,返回类型为(K,(V,W))键值对的一个新DStream。A.unionB.reduceC.joinD.cogroup15.SparkStreaming能够处理来自()的数据。A.KafkaB.FlumeC.TwitterD.ZeroMQ第III卷一.综合考核(共15题)1.Scala列表与数组非常相似,列表的所有元素可具有不同的类型。()A.正确B.错误2.MLlib中用于线性回归算法的包主要有()A.LinearRegressionWithSGDB.RidgeRegressionWithSGDC.LassoWithSGDD.LeftRegression3.RDD的filter过滤会将返回值为true的过滤掉。()A.正确B.错误4.SparkR(名词解释)5.用户可以在HadoopYARN上运行Spark。()A.正确B.错误6.请问RDD的()操作是根据键对两个RDD进行内连接A.joinB.zipC.combineByKeyD.collect7.Spark中DataFrame的()方法是进行分组查询A.orderbyB.groupbyC.selectbyD.sortby8.RDD的cartesian函数是笛卡尔积,也就是将两个集合的元素两两组合成一组。()A.正确B.错误9.GraphX中graph.triplets可以得到()A.顶点视图B.边视图C.顶点与边的三元组整体视图D.有向图10.MLlib中Normalizer是一个转换器,它可以将多行向量输入转化为统一的形式。()A.正确B.错误11.Scala列表方法中返回所有元素,除了最后一个的方法是()A.dropB.headC.filterD.init12.Mllib中metrics.recallByThreshold表示()指标A.准确度B.召回率C.F值D.ROC曲线13.Spark中DataFrame的()方法是查询指定字段的数据信息A.selectB.selectExprC.colD.apply14.Scala中创建一个方法时经常用void表示该方法无返回值A.正确B.错误15.Mllib中线性会馆算法中的参数intercept表示()A.要运行的迭代次数B.梯度下降的步长C.是否给数据加干扰特征或者偏差特征D.Lasso和ridge的正规化参数第I卷参考答案一.综合考核1.参考答案:F2.参考答案:A3.参考答案:ABCD4.参考答案:AB5.参考答案:ABCD6.参考答案:ABCD7.参考答案:T8.参考答案:A9.参考答案:B10.参考答案:A11.参考答案:ABD12.参考答案:ABC13.参考答案:A14.参考答案:ABCD15.参考答案:D第II卷参考答案一.综合考核1.参考答案:D2.参考答案:A3.参考答案:A4.参考答案:B5.参考答案:A6.参考答案:T7.参考答案:D8.参考答案:A9.参考答案:C10.参考答案:ABCD11.参考答案:ABC12.参考答案:T13.参考答案:D14.参考答案:D15.参考答案:ABCD第III卷参考答案一.综合考核1.参考答案

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论