




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、21春南开大学大数据开发技术(一)在线作业-2参考答案Map Task和Reduce Task均由()启动。A.ClientB.Job TrackerC.TaskD.Task TrackerMongoDB将数据存储为一个()A.关系B.属性C.字段D.文档MapReduce中最优的Reduce任务个数取决于集群中可用的()的数目。A.SplitB.SlotC.MapD.ShuffleHbase中()文件记录了-ROOT-表的位置A.MasterB.RegionC.ZookeeperD.ChubbyBigTable采用()作为底层数据存储A.HDFSB.GFSC.HbaseD.传统文件系统Had
2、oop启动所有进程的命令为()。A.all-start.shB.all-start.exeC.start-all.shD.start-all.exeMapReduce处理关系的()运算时,Map过程需要记录元组的信息及该元组来源。A.投影B.差C.交D.并Hbase中()是最核心的模块,负责维护分配给自己的Region,并响应用户的读写请求A.MasterB.SlaverC.Region服务器D.客户端关于Strom中Bolt说法错误的是()。A.Bolt可以执行过滤、函数操作、Join、操作数据库等任何操作B.Bolt是一个被动的角色,Spout是一个主动的角色C.Bolt不仅可以处理Tup
3、le还可以创建新的TupleD.Bolt是Streams的状态转换过程的抽象含义MapReduce设计的一个理念就是(),因为移动数据需要大量的网络传输开销。A.数据向计算靠拢B.计算向数据靠拢C.计算向网络靠拢D.计算与数据并行在Storm的工作流程中,对于Supervisor说法错误的是()。A.Supervisor会去Zookeeper集群上认领自己的TaskB.Supervisor节点首先将提交的Topology进行分片,分成一个个Task,分配给相应的NimbusC.Supervisor会将Task和相关的信息提交到Zookeeper集群上D.Supervisor会通知自己的Work
4、er进程进行Task的处理Google Fusion Tables是哪种可视化工具()A.信息图表B.地图工具C.时间线工具D.分析工具批处理系统关注(),流处理系统关注()。A.吞吐率,延时B.延时,吞吐率C.延时,速度D.速度,吞吐率使用Amazon云环境部署Hadoop的说法中错误的是()。A.Hadoop不仅可以运行在企业内部的集群中,也可以运行在云计算环境中B.Hadoop自带有一套脚本,用于在EC2上面运行HadoopC.在EC2上运行Hadoop尤其适用于一些工作流D.Amazon EC2为Hadoop提供了存储服务关于分布式并行编程,以下说法错误的是()。A.“摩尔定律”,CP
5、U性能大约每隔12个月翻一番B.“摩尔定律”逐渐失效后,人们开始借助于分布式并行编程来提高程序性能C.分布式程序运行在大规模计算机集群上,可以并行执行大规模数据处理任务,从而获得海量的计算能力D.谷歌公司最先提出了分布式并行编程模型MapReduce静态数据采取()计算模式A.批量B.实时C.大数据D.动态优点是性能好(高并发),灵活性高,复杂性低,数据结构灵活 提供嵌入式文档功能的数据库是()A.列族数据库B.键值数据库C.图数据库D.文档数据库关于MapReduce中Shuffle过程,说法错误的是()。A.Shuffle过程中为每个Map任务分配一个缓存B.Shuffle过程中分区默认采
6、用哈希函数C.Shulle过程的合并会改变最终结果D.Shuffle过程在Reduce端首先从Map端领取结果,然后执行归并操作,最后输送给Reduce任务进行处理Storm中如果要随机分发Stream中的Tuple,保证每个Bolt的Task接收Tuple数量大致一致,应该采用哪种Stream Groupings()。A.ShuffleGroupingB.AllGroupingC.GlobalGroupingD.FiedlsGroupingSQL Azure体系结构层中哪层将用户的请求转化为Azure内部的TDS格式流()A.Client LayerB.Services LayerC.Pla
7、tform. LayerD.Infrastructure Layer优点是查找速度快,可扩展性强,容易进行分布式扩展,复杂性低的数据库是()A.列族数据库B.键值数据库C.图数据库D.文档数据库应用于专门用于处理具有高度相互关联关系的数据,比较适合于社交网络的数据库是哪种()A.列族数据库B.键值数据库C.图数据库D.文档数据库Storm中如果要保证相同字段的Tuple分配到同一个Task中,应该采用哪种Stream Groupings()。A.ShuffleGroupingB.AllGroupingC.GlobalGroupingD.FiedlsGrouping应用于分布式数据存储与管理数据
8、在地理上分布于多个数据中心的应用程序的数据库是哪种()A.列族数据库B.键值数据库C.图数据库D.文档数据库1秒定律体现了大数据的哪个特征()。A.数据量大B.数据产生速度快C.数据存储快D.数据计算快SQL Azure体系结构层中哪层是存储节点集群,相当于普通Web系统的数据库层()A.Client LayerB.Services LayerC.Platform. LayerD.Infrastructure LayerGephi是哪种可视化工具()A.信息图表B.地图工具C.时间线工具D.分析工具以下亚马逊的产品中哪个是分布式内存缓存()A.ElastiCacheB.RDSC.DynamoD
9、BD.RedshiftHadoop中执行MapReduce任务不含哪种方式()。A.MahoutB.Hadoop jarC.Shell脚本D.Python以下说法不正确的是()。A.MapReduce的核心思想就是“分面治之”B.HDFS是对GFS的开源实现C.MapReduce是一种分布式计算模型D.HDFS采用HBase作为其底层数据存储关系数据库与NoSQL数据库相比有哪些优势()A.支持事务ACID四性B.可以支持超大规模数据存储C.以完善的关系代数理论作为基础D.具有强大的横向扩展能力MapReduce可以解决哪些计算问题()。A.矩阵乘法B.关系代数运算C.聚合运算D.关系投影运算
10、关系数据库与NoSQL数据库相比适用于哪些领域()A.电信B.银行C.互联网企业大数据处理D.传统企业的数据分析HDFS的命名空间包含()A.节点B.目录C.文件D.块MapReduce的main函数中设置输出类型的方法有()。A.setOutputKeyClassB.setOutputClassC.setOutputValueClassD.setKeyValueClassHadoop在配置伪分布式时需要修改哪几个配置文件()。A.hbase-site.xmlB.hdfs-site.xmlC.core-site.xmlD.map-site.xmlE.mapr-site.xml哪些属于数据可视化
11、的重要作用()A.分析数据B.采集数据C.辅助理解数据D.观测跟踪数据以下哪些是数据可视化时间线工具()A.EchartsB.TimetoastC.XtimelineD.R流计算是针对流数据的实时计算,可以应用在()场景中A.广告投放B.气候模拟预测C.机器翻译D.推荐系统传统的数据处理流程的前提是()。A.存储的数据是旧的B.存储的数据是实时的C.需要用户主动发出查询D.不需要用户主动发出查询Pig是Hadoop项目中一种数据仓库工具。()A.正确B.错误阿里云RDS中一个实例可以创建多个数据库,在实例内数据库命名唯一,所有数据库都会共享该实例下的资源,如CPU、内存、磁盘容量等。()A.正
12、确B.错误HDFS中的NameNode的EditLog用于维护文件系统树以及文件树中所有的文件和文件夹的元数据。()A.正确B.错误Storm框架是实时计算系统,所以不能使用数据库。()A.正确B.错误关系数据库的关键特性包括完善的事务机制和高效的查询机制。()A.正确B.错误大数据计算处理方法主要分为两种方法,即批处理方法和流处理方法。()A.正确B.错误大数据决策逐渐成为一种新的决策方式,大数据应用有力促进了信息技术与各行业的深度融合,大数据开发大大推动了新技术和新应用的不断涌现。()A.正确B.错误Hbase中缓存刷新,每次刷写都生成一个新的StoreFile文件,因此,每个Store包含多个StoreFile文件。()A.正确B.错误在HBase中,更新操作会用最新的当前值去替换记录中原来的旧值,旧值被覆盖后就不会存在。()A.正确B.错误HDFS在设计上采取了多种机制保证在硬件出错的环境中实现数据的完整性。()A.正确B.错误 参考答案:D参考答案:D参考答案:B参考答案:C参考答案:B参考答案:C参考答案:B参考答案:C参考答案:C参考答案:B参考答案:B参考答案:B参考答案:A参考答案:D参考答案:A参考答案:A参考答案:D参考答案:C参考答案:A
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年闭式冷却塔合作协议书
- 2025年力与变形检测仪合作协议书
- 2025年离子风棒合作协议书
- 2025年静脉注射丙种球蛋白合作协议书
- 2025年氯氟氰菊酯项目合作计划书
- 2025年粉体无筛分离设备合作协议书
- 电商物流领域工作背景证明(7篇)
- 2025年新乡危险品考试模拟试题
- 商业合作补充条款协议
- 月度收入及年终奖金详细证明(8篇)
- 硫酸应急预案-硫酸泄漏应急预案演练总结
- 2025年中考英语复习1600词背诵单-按字母排序
- 线路安规培训
- 比亚迪秦EV新能源汽车电机驱动系统
- 大风天气下的物流运输安全措施
- 老旧小区加装电梯使用公约协议
- 新生儿护理安全用药
- 2025年湖北省新华书店集团有限公司招聘笔试参考题库含答案解析
- 西医骨科发展简史
- 医疗护理医学培训 临时起搏器的使用及参数调整课件
- 《中国妇女妊娠期体重监测与评价》(T-CNSS 009-2021)
评论
0/150
提交评论