版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
南开《大数据开发技术(二)》在线作业满分答案1在MLlib中,逻辑回归算法的输入值为()类型ADoubleBLabledPointCPointDSGB答案:B2Scala列表方法中获取列表的第一个元素的方法是()AdropBheadCfilterDinit答案:B3spark-submit配置项中()表示每个executor使用的内核数A--num-executorsNUMB--executor-memoryMEMC--total-executor-coresNUMD--executor-couresNUM答案:D4SparkStreming中()函数当被调用的两个DStream分别含有(K,V)和的W)键值对时,返回一个(K,Seq[V],$04皿])类型的新的DStream。AunionBreduceCjoinDcogroup答案:C5PairRDD可以通过()获得仅包含键的RDDAkeyBkeysCvalueDvalues答案:B6GraphX中()是完整提供边的各种操作类ARDD[Edge]BEdgeRDDCRDD[(VertexId,VD)]DVertexRDD答案:B7一般情况下,对于迭代次数较多的应用程序,Spark程序在内存中的运行速度是HadoopMapReduce运行速度的()多倍A2B10C100D1000答案:C8MLlib中可以调用mllib.tree.DecisionTree类中的静态方法()训练分类树AtrainClassifierBtrainRegressorCLogisticRegressionModelDLabeledPoint答案:A9Scala中()方法返回Map所有的valueAkeyBkeysCvalueDvalues答案:D10SparkStreming中DStream的每个RDD都是由()分割开来的数据集A分区B一小段时间C数据量D随机答案:B11Dstream窗口操作中()方法基于滑动窗口对(K,V)键值对类型的DStream中的值按K使用聚合函数func进行聚合操作,得到一个新的DstreamAwindowBcountByWindowCreduceByWindowDreduceByKeyAndWindow答案:D12Scala列表方法中输出符号指定条件的所有元素的方法是()AdropBheadCfilterDinit答案:C13以下哪个不是Scala的数据类型()AIntBShortIntCLongDAny答案:B14当需要将一个普通的RDD转化为一个PairRDD时可以使用()函数来进行操作AtransferBchangeCmapDbuild答案:C15Dstream窗口操作中O方法返回一个基于源DStream的窗口批次计算后得到新的DStream。AwindowBcountByWindowCreduceByWindowDreduceByKeyAndWindow答案:A16Dstream窗口操作中()方法基于滑动窗口对源DStream中的元素进行聚合操作,得到一个新的DstreamAwindowBcountByWindowCreduceByWindowDreduceByKeyAndWindow答案:C17Dstream输出操作中()方法在Driver中打印出DStream中数据的前12个元素。AprintBsaveAsTextFilesCsaveAsObjectFilesDsaveAsHadoopFiles答案:C18如果numPartitions是分区个数,那么Spark每个RDD的分区ID范围是()A[0,numPartitions]B[0,numPartitions-1]C[1,numPartitions-1]D[1,numPartitions]答案:B19GraphX中graph.edges可以得到()A顶点视图B边视图C顶点与边的三元组整体视图D有向图答案:B20GraphX中()是存放着存放顶点的RDDARDD[Edge]BEdgeRDDCRDD[(VertexId,VD)]DVertexRDD答案:C21Scala中()方法返回一个列表,包含除了第一个元素之外的其他元素AheadBinitCtailDlast答案:C22请问RDD的()操作把RDD所有元素转换成数组并返回到Driver端AjoinBzipCcombineByKeyDcollect答案:D23SparkGraphX中类Graph的mapReduceTriplets方法可以()A收集邻居顶点的顶点Id和顶点属性B收集邻居顶点的顶点IdC向指定顶点发送信息并聚合信息D将顶点信息更新到图中答案:C24Scala列表方法中通过给定的方法将所有元素重新计算的方法是()AfilterBforeachCmapDmkString答案:C25Scala列表方法中返回所有元素,除了最后一个的方法是()AdropBheadCfilterDinit答案:D1Scala中可以用()方法来连接两个或多个列表A::B#:::CList.:::()DList.concat()答案:ABCD2SparkDataFrame中()方法可以返回一个Array对象AcollectBtakeCtakeAsListDcollectAsList答案:AB3Scala系统支持()作为对象成员A通用类B内部类C抽象类D复合类答案:ABCD4Mllib实现了一些常见的机器学习算法和应用程序,包括()A分类B聚类C降维D回归答案:ABCD5SparkStreaming能够和()无缝集成AHadoopBSparkSQLCMllibDGraphX答案:BCD6以下算法中属于分类算法的是()AKNN算法B逻辑回归C随机森林DKmeans答案:ABC7SparkCore包含的功能有()A任务调度B内存管理CSQL查询D容错机制答案:ABD8Scala中构造列表的两个基本单位是()ANilBNillC::DList答案:AC9SparkDataFrame中()方法可以返回一个ListAcollectBtakeCtakeAsListDcollectAsList答案:ABCD10MLlib中用于线性回归算法的包主要有()ALinearRegressionWithSGDBRidgeRegressionWithSGDCLassoWithSGDDLeftRegression答案:ABC1RDD的map操作不会改变RDD的分区数目A对B错答案:A2也就是每一维特征,将特征标准化为单位标MLlib中StandardScaler处理的对象是每一列,也就是每一维特征,将特征标准化为单位标准差或是0均值,或是0均值单位标准差。A对B错答案:A3Scala中高阶函数经常将只需要执行多次的函数定义为匿名函数作为参数A对B错答案:B4SparkSQL仅仅包括基本的SQL语法A对B错答案:B5聚类是一种无监督学习的方法,用于将高度相似的数据分到一类中A对B错答案:A6MLlib由一些通用的学习算法和工具组成,包括分类、回归、聚类、协同过滤、降维等,同时还包括底层的优化原语和高层的管道API。A对B错答案:A7SparkGraphX课通过mapVertices[VD2:ClassTag](map:(VertexId,VD)=>VD2)实现对顶点属性经过变换生成新的图A对B错答案:A8SparkStreming中对DStream的任何操作都会转化成对底层RDDs的操作A对B错答案:A9Scala中默认情况下使用的是可变的MapA对B错答案:B10mllib.feature中存在一些常见的特征转化方法,主要包括创建特征向量和标准化数据A对B错答案:A11Scala中允许集成多个父类A对B错答案:B12RDD中combineByKey不允许返回类型与输入数据类型不同的返回值A对B错答案:B13SparkSQL可被视为一个分布式的SQL查询引擎,并且提供了一个叫做DataFrame的可编程抽
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 医疗机构病历书写规范及管理办法
- 客服投诉处理实战技巧培训
- 2026年专升本MySQL数据库事务处理卷附答案解析与ACID特性
- 2025年化学试卷中考模板及答案
- 山东省泰安市宁阳县2025-2026学年九年级(上)期中化学试卷(含答案)
- 陕西省汉中实验中学2025-2026学年上学期期中测试八年级数学试卷(含答案)
- 2026年中小学英语五年级上册期末一般过去时专项卷附答案解析与规则不规则
- 搪瓷厨房水槽过滤网与漏网创新创业项目商业计划书
- 医院实验室专用空调创新创业项目商业计划书
- 床品快速打样服务创新创业项目商业计划书
- 2025年医疗卫生法律法规知识考核试题及答案
- 2025政务服务效能提升主题演讲稿
- 金融赋能:为新质生产力注入动能
- 期中模拟测试卷-2025-2026学年语文五年级上册统编版
- 2025年母婴护理员试题及答案
- 大学生职业生涯规划
- 2025版脑膜炎临床表现及护理方法
- 2025长治文化艺术学校招聘(13人)考试参考试题及答案解析
- 2025大唐电商技术有限公司天津分公司招聘12人考试参考题库及答案解析
- 2025年人工智能赋能下的新能源行业产业链协同创新报告
- 森林可持续经营服务方案投标文件(技术方案)
评论
0/150
提交评论