版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
注:不含主观题第1题多选题(3分)下列哪些应用属于大数据技术的应用()。A电商网站上对注册用户浏览信息记录.分析.挖掘,为用户推送感兴趣的商品。B音视频网站上通过分析注册用户的浏览习惯,为用户推送感兴趣的音视频。C政务领域中的智慧城市建设,如智慧交通.智慧医疗.智慧教育等。D手机银行或网上银行在用户画像基础上,对用户群进行定位,挖掘潜在金融服务需求。正确答案:ABCD第2题判断题(2分)日常我们用到的云服务器.钉钉办公软件.百度网盘等应用都是云计算服务厂商提供的云计算服务。()云计算简述作业第1题多选题(3分)云计算的服务模式包括()。A基础设施即服务B平台即服务C系统即服务D软件即服务正确答案:ABD第2题多选题(3分)云计算的劣势有()。A信息技术产业进一步合理分工B严重依赖网络C数据泄密的环节增多D风险被集中正确答案:BCD第3题多选题(3分)云计算部署模型有()。A公有云B私有云C混合云DPaaS云正确答案:ABC第4题判断题(2分)云计算是把有形的产品(网络设备、服务器、存储设备、各种软件等)转化为服务产品(IaaS,PaaS,SaaS),并通过网络让人们远程在线使用。()第5题判断题(2分)云计算是一种计算模式,能够提供随时随地、便捷的、随需应变的网络接入,访问可配置的计算资源共享池。()云计算关键技术单元作业第1题单选题(2分)虚拟化技术主要用于云计算物理资源的池化,物理资源不包括()。A服务器B网络C存储D操作系统第2题多选题(3分)虚拟技术特性有()。A分区B隔离C封装D相对于硬件独立正确答案:ABCD第3题多选题(3分)虚拟化的益处包括()。A实现资源最优利用B实现动态负载均衡C通过系统自愈功能提升可靠性D实现节能减排正确答案:ABCD第4题多选题(3分)个人PC上使用比较多的虚拟化工具有()。AVMwareWorkstationBVirtualBoxCXenDKVM正确答案:AB第5题判断题(2分)虚拟化是一项技术,而云是一种环境或服务。()第6题判断题(2分)虚拟化的主要功能是把单个资源抽象成多个给用户使用,而云计算则是帮助不同部门或公司访问一个自动置备的资源池。()存储虚拟化单元作业第1题多选题(3分)开放系统的存储类型分为内置存储和外挂存储,其中外挂存储可分为()。A直连式存储(DAS)B网络接入存储(NAS)C存储区域网络(SAN)D移动存储正确答案:ABC第2题多选题(3分)根据实现方式,可将存储虚拟化分为()。A带内虚拟化B带外虚拟化C文件虚拟化D块虚拟化正确答案:AB第3题多选题(3分)根据存储虚拟化实现的位置,可将存储虚拟化分为()。A基于主机的虚拟化B基于存储设备的虚拟化C基于网络的虚拟化D磁带或磁带库虚拟化正确答案:ABC第4题判断题(2分)Ceph计算模式是一种完全无中心架构()第5题判断题(2分)存储虚拟化是指将存储资源集中到一个大容量的资源池并实行单点统一管理,无需中断应用即可改变存储系统和数据迁移。()网络虚拟化单元作业第1题多选题(3分)软件定义网络(SDN)特点。A控制转发分离。B控制平面集中化。C转发平面通用化。D控制器软件可编程正确答案:ABCD第2题多选题(3分)OpenFlow组件包括()。AOpenFlow控制器BOpenFlow交换机C数据转发平面D控制平面正确答案:AB第3题多选题(3分)根据OverLay的载体不同,VXLAN的OverLay分为()3种。A主机OverLayB网络OverLayC混合OverLayD虚实OverLay正确答案:ABC第4题判断题(2分)软件定义网络()将网络管理与底层网络基础设施分离开来,允许管理员动态调整整个网络的流量,以满足不断变化的需求。()第5题判断题(2分)网络虚拟化是一种网络技术,可以在物理拓扑上创建虚拟网络。基于SDN的网络架构可以更容易地实现网络虚拟化。()云计算服务实践作业第1题多选题(3分)虚拟化平台软件有哪些()。AHyper-VBEsxiCxenServerDKVM正确答案:ABCD第2题多选题(3分)下列描述中正确的有A集群是指一组桌面计算机或服务器通过局域网连接在一起,运转方式类似于一个更大型的计算机。B集群中每个节点都运行自己的操作系统,节点之间使用网络协议进行通信。C最大规模的集群称为仓库级计算机(WSC),它们的设计方式使数万个服务器像一个服务器一样运行。D仓库级计算机(WSC)是指大型机。正确答案:ABC第3题多选题(3分)以下属于PaaS管理工具的有()。A红帽公司的OpenShiftBCloudFoundry社区的CloudFoundryCHyper-VDKVM正确答案:AB第4题判断题(2分)IaaS云计算解决方案中,虚拟化平台(硬件资源.虚拟软件)主要解决如何运行虚拟机的问题。()第5题判断题(2分)SaaS云管理工具与业务关联性大,目前没有统一的标准版产品。()第6题判断题(2分)一般地,SaaS云管理软件包含两大部分:一是SaaS业务门户,二是SaaS管理门户。()大数据基础作业第1题多选题(3分)大数据4V特点是()。AVolume(体量大)BVelocity(处理速度快)CVariety(数据类型多)DValue(价值密度低)正确答案:ABCD第2题多选题(3分)大数据的定义是()。A指无法在可承受的时间范围内用常规软件工具进行捕捉.管理和处理的数据集合B任何超过了一台计算机处理能力的数据量C具有很大价值的数据D超过个人PC机或笔记本硬盘存储容量的数据正确答案:AB第3题单选题(2分)在大数据时代,我们需要设立一个不一样的隐私保护模式,这个模式应该着重于()为其行为承担责任。A数据分析者B个人许可C数据提供者D数据使用者第4题多选题(3分)大数据的处理流程涉及()。A数据采集B数据导入/预处理C统计/分析D数据挖掘与预测正确答案:ABCD第5题多选题(3分)大数据的科学价值和社会价值正是体现在()。A对大数据的掌握程度可以转化为经济价值来源B大数据已经撼动了世界的方方面面,从商业科技到医疗.政府.教育.经济.人文以及社会的其他各个领域C大数据的价值不再单纯来源于它的基本用途,而更多源于它的二次利用D大数据时代,很多数据在收集的时候并无意用作其他用途,而最终却产生了很多创新性的用途。正确答案:AB第6题判断题(2分)通用的大数据分析系统的核心设计理念包括并行化.规模经济.虚拟化。()第7题判断题(2分)大数据框架技术中消息系统技术有:Kafka.StormMQ.ZeroMQ.RabbitMQ。()第8题判断题(2分)HadoopMapReduce.Spark属于离线计算框架技术。()大数据核心技术作业第1题多选题(3分)Hadoop1.0和Hadoop2.0区别包括()。AHadoop2.0新增了HDFSHA机制BHadoop2.0新增了HDFSfederationCHadoop2.0新增了YARN框架DHadoop2.0的MapReduce本地优化,性能提升了30%正确答案:ABC第2题多选题(3分)Hadoop2.0和Hadoop3.0区别包括()。AHadoop3.0的Java运行环境升级为1.8BHadoop3.0支持多于2个以上的NameNodesCHadoop3.0新增了YARN框架DHadoop3.0的HDFS支持纠删码正确答案:ABD第3题判断题(2分)Hadoop2.0版本加入了通用YARN资源管理器,用以协调各个组件对系统资源的利用,合理分配集群CPU、内存资源。第4题判断题(2分)Hadoop2.0版本中,MapReduce2.0只是一个计算框架,具体资源调度全部交给Yarn框架。()第5题判断题(2分)Hadoop3.0版本中HDFS支持纠删码,纠删码相比于副本机制节省了一半以上的存储空间,普通副本机制需要3倍存储空间而这种机制只需1.4倍即可。大数据技术HDFS作业第1题多选题(3分)以下说法正确的是()。AHDFS源自于Google的GFS论文BHDFS是一易于扩展的分布式文件系统CHDFS运行在大量普通廉价机器上,提供容错机制DHDFS为大量用户提供性能不错的文件存取服务正确答案:ABCD第2题多选题(3分)HDFS不适合的场景()。A存储小文件。B对延迟要求较高的场景。C支持多用户写入。D进行文件随机修改。正确答案:ABCD第3题判断题(2分)传统的NFS不是一种典型的分布式系统,虽然它的文件的确放在远端(单一)的服务器上面。()第4题判断题(2分)HDFS文件被切分成固定大小的数据块,为实现高吞吐率,默认数据块大小为128MB。()第5题判断题(2分)HDFS文件不仅支持追加,还支持文件任意offset的修改。()第6题判断题(2分)HDFS不支持多用户写入,也无法进行文件随机修改。仅支持以append的方式,即通过追加的方式添加到文件结尾处。()大数据技术Yarn作业第1题多选题(3分)下列关于YARN框架描述正确的有()。AResourceManager负责整个集群的资源管理和分配。BNodeManager是每个节点上的资源和任务管理器。CNodeManager定时向ResourceManager汇报本节点资源的使用情况和Container的运行状态。DApplicationMaster负责与RM调度器协商以获取资源。正确答案:ABCD第2题多选题(3分)下列关于YARN描述正确的有()。AYARN是一个通用资源管理系统和调度平台。BYARN为上层应用提供统一的资源管理和调度。CYARN与运行的用户程序完全解耦。DYARN只提供运算资源的调度。正确答案:ABCD第3题多选题(3分)字节跳动公司产品对YARN的定制应用描述正确是()。A实现YARN支持单集群使用。BYARN主要承载着字节跳动公司内的离线作.流式作业.模型训练三大场景。C公司的抖音.今日头条等产品重度依赖推荐,团队对调度器进行了深度定制。D将HDFS做成强依赖。正确答案:BC第4题判断题(2分)MapReduce.Storm.Spark.Tez等计算框架都可以整合在YARN上运行,只要他们各自的框架中有符合YARN规范的资源请求机制即可。()第5题判断题(2分)YARN基于ZooKeeper实现HA,主提供服务,备同步主的信息。主挂掉,备立即做切换接替主进行服务。()第6题判断题(2分)Mesos是一个开源的资源管理系统,可以对集群中的资源做弹性管理,目前Twitter、Apple等公司在大量使用Mesos管理集群资源。()第7题判断题(2分)YARN采用双层调度框架,ResourceManager将资源分配给AppMaster,AppMaster将资源进一步分配给各个Task。()第8题判断题(2分)Mesos组件中FrameworkScheduler组件是实现单个应用程序的管理和资源二次调度。()第9题判断题(2分)Spark是一种包含流处理能力的下一代批处理框架。主要应用在广告、报表、推荐系统等业务上。()第10题判断题(2分)YARN天生是为批处理而设计的,很多地方与流式或模型训练场景并不匹配,为了给批处理、流式、模型训练三大场景更好的体验,字节跳动对YARN做一些定制工作。()数据采集与迁移工具作业第1题多选题(3分)常用大数据采集途径有()。A数据服务机构。B互联网数据采集。CAPP移动端数据采集。D智能感知设备。正确答案:ABCD第2题多选题(3分)下列关于Flume架构描述正确的有()。ASource是数据的收集端,负责将数据捕获后进行特殊的格式化。BSource将数据封装到事件(event)里,然后将事件推入Channel中。CChannel是连接Source和Sink的组件,它将保存事件直到Sink处理完该事件。DSink负责持久化日志或者把事件推向另一个Source。正确答案:ABCD第3题多选题(3分)下列关于数据迁移工具Sqoop描述正确的有()。ASqoop是一款用于在Hadoop和关系数据库服务器之间传输数据的工具。BSqoop工作机制是将导入或导出命令翻译成MapReduce程序来实现。CSqoop工具本质就是迁移数据。DSqoop工具只能用于非关系型数据库之间迁移。正确答案:ABC第4题多选题(3分)下列关于Kafka描述正确的有()。AKafka是一个分布式.分区的.多副本的.多订阅者日志系统。BKafka是一基于zookeeper协调的分布式日志系统。CKafka可以用于web/nginx日志.访问日志采集,也可用于消息服务等等。DKafka可以用于迁移数据。正确答案:ABC第5题判断题(2分)各行业海量的数据中,大约20%左右属于结构化的数据,80%的数据属于广泛存在于社交网络.物联网.电子商务等领域的非结构化数据。()第6题判断题(2分)大数据的处理流程的第一步就是大数据的采集与预处理。()第7题判断题(2分)发布-订阅消息传递模式是将消息持久化到一个topic中。消费者可以订阅一个或多个topic,消费者可以消费该topic中所有的数据,同一条数据可以被多个消费者消费。()MapReduce单元作业第1题单选题(2分)下列适合MapReduce应用场景的是()。A实时计算。B流式计算。CDAG计算。D离线批处理。第2题多选题(3分)下列关于MapReduce2.0架构描述正确的有()。AMapReduce2.0将JobTracker两个主要的功能资源管理和任务调度/监控分离成单独的组件。BMapReduce2.0架构包括ResourceManager、NodeManager、ApplicationMaster、Container组件。CMapReduce2.0架构中的ResourceManager是基于应用程序对资源的需求进行调度的资源调度器。DMapReduce2.0架构中的NodeManager是执行应用程序的容器,监控应用程序的资源使用情况并且向调度器汇报。正确答案:ABCD第3题判断题(2分)Hadoop2.0版本中,MapReduce2.0只是一个计算框架,具体资源调度全部交给Yarn框架。()第4题判断题(2分)如果任务运行在它将处理的数据所在的节点,则称该任务具有“数据本地性”。()第5题判断题(1分)MapReduce计算框架具有数据本地性特性,本地性可避免跨节点或机架数据传输,提高运行效率。()Spark计算框架单元作业第1题多选题(3分)下列关于Spark使用场景描述正确的有()。A复杂的海量数据批量处理,时间在数十分钟到数小时之间。B基于历史数据的交互式查询,时间在数十秒到数十分钟之间。C基于实时数据流的数据处理,时间在数百毫秒到数秒之间。D将数据缓存在内存中,中间的计算结果写入到磁盘的离线数据计算框架。正确答案:ABC第2题多选题(3分)下列关于SparkGraphX图计算描述正确的有()。A图上的计算任务分成图并行计算和数据并行计算两种。B图并行计算任务是指那些迭代计算任务,如PageRank。C数据并行计算任务是指图上代数运算,如构建一个图.合并两个图.跨越多个图等。D将SparkSQL转换成RDD,然后提交到集群执行。正确答案:ABC第3题多选题(3分)Spark运行架构包括()。A集群资源管理器(ClusterManager)。B运行作业任务的工作节点(WorkerNode)。C每个应用的任务控制节点(Driver)。D每个工作节点上负责具体任务的执行进程(Executor)。正确答案:ABCD第4题判断题(2分)Spark可运行于独立的集群模式中,或者运行于Hadoop中,也可运行于AmazonEC2等云环境中,并且可以访问HDFS.Cassandra.HBase.Hive等多种数据源。()第5题判断题(2分)Spark支持使用Scala.Java.Python和R语言进行编程。()第6题判断题(2分)Spark运行在YARN上要比运行在Mesos上更加灵活和自然,Spark官方推荐采用这种模式。()第7题判断题(2分)在RDD的计算过程中,不需立刻去存储计算出的数据本身,只要记录每个RDD是经过哪些转化操作得来的。()Storm计算框架单元作业第1题多选题(3分)下列对Storm集群结构描述正确的是()。ANimbus负责在集群范围内分发代码.为Worker分配任务和监测故障。BZookeeper负责Nimbus和多个Supervisor之间的所有协调工作。CWorker节点运行名为“Supervisor”的后台程序负责监听分配给它所在机器的工作。DSupervisor负责接受Nimbus分配的任务,管理属于自己的Worker进程。正确答案:ABCD第2题多选题(3分)下列Storm工作流程描述正确的是()。AClient节点提交Topology任务。BNimbus节点将提交的Topology进行分片,分成一个个Task,分配给相应的Supervisor。CNimbus节点将Task和Supervisor相关的信息提交到Zookeeper集群上。DSupervisor去Zookeeper集群上认领自己的Task,通知自己的Worker进程进行Task的处理。正确答案:ABCD第3题判断题(2分)Storm是Twitter开源的分布式实时大数据处理框架,被业界称为实时版Hadoop。()第4题判断题(2分)Storm使用ZooKeeper来协调集群内的各种配置使得Storm的集群可以很容易的扩展。()第5题判断题(2分)Storm将Spouts和Bolts组成的网络抽象成topology(类似Job),它可以被提交到Storm集群执行。()NoSQL数据库单元作业第1题多选题(3分)下列关于Hbase描述正确的是()。AHBase是一个开源的非关系型分布式数据库。B运行于HDFS文件系统之上。C是Google的BigTable的开源实现。D主要用来存储非结构化和半结构化的松散数据。正确答案:ABCD第2题多选题(3分)下列哪些数据库产品是NoSQL数据库()。ARedis。BMongoDB。CMySQL。DCassandra。正确答案:ABD第3题判断题(2分)若要在HBase上使用SQL,则需要联合使用ApachePhonenix,或者联合使用Hive和HBase。第4题判断题(2分)HBase存储模式是基于列存储的,每个columnfamily存储在HDFS上的一个单独文件中。()第5题判断题(2分)在当今云计算.大数据盛行的时代,关系型数据库性能遇到瓶颈,瓶颈的源头一般是在磁盘的I/O上。()第6题判断题(2分)NoSQL数据库同时具备了高性能.可扩展性强.高可用等优点。()Hive数据仓库单元作业第1题多选题(3分)下列关于数据仓库工具Hive描述正确的是()。AHive是一个构建在Hadoop上的数据仓库框架。BHive可以将结构化的数据映射为一张数据库表,并提供HQL(HiveSQL)查询功能。CHive是Google的BigTable的开源实现,所有的数据都存储在HDFS中。DHive的本质是将SQL语句转换为MapReduce任务运行。正确答案:ABD第2题多选题(3分)下列关于数据仓库
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 简约大气学术风医学临床试验研究报告模板
- 企业安全管理要义讲解
- 理发师课件制定
- 班级颁奖会课件
- 国考面试教育专项
- 豆荚营销话术
- 2025年虚拟同步机在智能电网电力系统优化创新应用研究报告
- 医患关系的重要性解读
- 校园宿舍消防安全直播
- 浙江省杭州地区(含周边)重点中学期中考试2025-2026学年高二上学期11月期中英语试题
- 2026年动物检疫检验员考试试题题库及答案
- 中国淋巴瘤治疗指南(2025年版)
- 2025年云南省人民检察院聘用制书记员招聘(22人)考试笔试模拟试题及答案解析
- 疗伤旅馆商业计划书
- 桥下空间施工方案
- 2025年广西公需科目答案6卷
- 2020海湾DH-GSTN5208测温式电气火灾监控探测器安装使用说明书
- 音乐与健康智慧树知到期末考试答案2024年
- 国开电大《人文英语4》一平台机考总题库珍藏版
- 人教部编版语文七年级上册1-5单元测试卷含答案
- 风电机安装安全管理规定
评论
0/150
提交评论