



全文预览已结束
下载本文档
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
虚拟化与云计算模拟试卷姓名: 学号: 院系: 第一部分:选择题(共40分,每题4分)1) Reducer的三个阶段是()A. ShuffleSortReduceB. ShuffleReduceSortC.ReduceShuffleSortD.SortShuffleReduce2) 下列关于mapreduce的key/value对的说法正确的是()A. 输入键值对不需要和输出键值对类型一致B. 输入的key类型必须和输出的key类型一致C. 输入的value类型必须和输出的value类型一致D. 输入键值对只能映射成一个输出键值对3) 下面哪一个选项是mapreduce真正的引擎()A. NamenodeB. DatanodeC. Job Tracker and Task TrackerD. HDFS4) 下列选项中哪个不是GFS中“Masters”的主要功能()A.维护所有文件系统的元数据B.周期性地与chunkservers联系来发送指令和检查状态C.对于读与写,客户端通过与Master联系来获得chunk的位置,然后直接与chunkservers连接D. 返回最终的答案给客户端5) 下列哪个选项不是我们需要Hive的主要原因()A.我们需要一个容量为PB级别的数据仓库。B.文件是不充分的数据抽象。C.Hadoop在处理作业方面是不够的。D.我们需要一个开发的数据格式。6) 下面那个不是云计算的特征()A.虚拟化B.动态可扩展C.管理多设备D.个体自治7) Hadoop用来确保数据准确性的方法不包括下面的哪一个()A.使用校验和来验证数据B.客户端每512字节计算一次校验和,数据节点存储这些校验和C.客户端从数据节点中检索数据,如果验证失败,客户尝试别的副本D.数据节点中的数据被加密以防止可能的攻击8) 关于分布式文件系统的说法,不正确的是()A .分布式文件系统整个集群中有多个namespaceB .文件被分为大的块,通常为128MC.可以通过Java、C或者命令行访问D.非常适合对大文件的流式读取9) 以下错误不是Hadoop能很好解决的()A.任务失败B.任务追踪失败C.连接失败D.作业追踪失败10) 下列哪个选项能正确地在Hive中返回 “查询年龄在18到25岁之间的用户返回的前5页”的结果()A.SELECT p.url, COUNT(1) as clicksFROM users u JOIN page_views p ON ( = p.user)WHERE u.age = 18 AND u.age = 18 AND u.age = 18 AND u.age = 25GROUP BY p.urlORDER BY clicks;第二部分:简答题(共60分,第一大题10分,第二大题20分,第三大题30分)一、简述MapReduce的主要思想和工作原理(可借助下面的例子),并根据例子画出数据流图(例子:使用MapReduce解决求商品价格最小问题,输入为商品名称、商品价格、商品网站,输出为商品名称、最小价格、商品网站。输入样例:Cloud computing 38.4 Cloud computing 40.5 Virtualization and cloud computing 35.7 Virtualization and cloud computing 30.8 Virtualization and cloud computing 36.6 360Cloud computing 35.1 输出样例:Cloud computing 35.1 Virtualization and cloud computing 30.8 )二、当数据量非常大超过单个机器的存储能力时需要将数据存储在不同的机器上,这时就需要分布式文件系统来管理这些数据,请回答关于分布式文件系统的下列问题:(1).在设计分布式文件系统时需要注意哪些方面?(2).原先存储超大文件的分布式文件系统现用来存储大规模小文件,如何对文件系统进行调整使其针对现在文件的特点发挥更好的性能?(3).分布式文件系统保证数据不被丢失通常存在多个副本并存储在不同的机器上,当用户对数据进行修改时系统存在两种方案:完成一个副本的修改并给用户响应,之后待系统空闲时完成其它副本的修改;完成所有副本的修改之后给用户响应。请说明两种方案的优劣,并做出你的选择并说明选择原因(或者你有更好的方案?)。三、在社会计算和移动计算迅猛发展的潮流下涌现了许多著名的互联网公司,假设你和你的朋友也准备加入创业大潮中,建立自己的企业。现假设你们公司的主要业务是移动设备的互联网信息搜索和挖掘,如使用手机拍下某图书封面就可以得到各个图书网站关于该书的价格及其对图书的评价,拍下某个人的头像可以得到这个人在社交网站的主页以及微博等相关信息,当然你们已经设计了比较好的图形匹配算法及搜索算法,并计划使用云计算来进行处理,根据以上背景回答下面问题:(1).你们公司需要构建数据中心现在由你来负责,根据新一代数据中心的需求请说说你在构建数据中心的时候需要注意哪些?(2).在数据中心中使用虚拟化技术是必须的,请说说如何部署、管理虚拟化解决方案?你又如何使用商业公司的现有虚拟化产品?(3).受经济危机的影响以及公司盈利能力的不确定性,风险投资公司决定减少对你们公司的投资。现在构建数据中心已经不可能了,你需要将业务创建在云计算平台上,a). 与建立自己的数据中心相比,使用商业公司的云计算平台有什么优点和缺点?b). 云构架的基本层次有哪些?并给出给出各
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 单体电压技师考试试题及答案
- 九大员考试试题及答案
- 成都吊车实操考试试题及答案
- 2025年塑料挂钩项目评估报告
- 2025-2030年中国调速螺旋行业深度研究分析报告
- 中国超细氢氧化铝市场动态分析及需求量调查报告2025年
- 广告拍摄群众演员聘请合同
- 智能农业虫情测报灯租赁与维护服务协议
- 物联网公司CTO平台架构设计与优化协议
- 购物中心餐饮区国际美食经营授权协议
- GB/T 12444-2006金属材料磨损试验方法试环-试块滑动磨损试验
- 第五章曲霉病课件
- 《广东省幼儿园(班)设备设施配备标准(试行)》
- 名著导读围城阅读练习及答案
- 修辞手法-完整版PPT
- 吞咽障碍功能训练课件
- GB∕T 37665-2019 古陶瓷化学组成无损检测PIXE分析技术规范
- 毕业论文答辩课件
- 多杆合一工程设计说明
- 曲阜师范大学毕业论文答辩通用ppt模板
- 一年级家长进课堂电的知识课件(40页PPT)
评论
0/150
提交评论