



全文预览已结束
下载本文档
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
精选文库第一章1、在信息产业的发展历程中,计算和数据作为两个重要的内在动力在不同时期起着重要作用。5、吉姆格雷(Jim Gray)提出了第四范式,被誉为“大数据之父”。6、MapReduce的思想来源是Lisp编程语言。7、按照资源封装层次,云计算可分为基础设施既服务、平台既服务、软件既服务三种类型。8、与传统的资源提供方式相比,与计算具有什么特点?云计算技术是资源与用户需求之间是一种弹性化的关系,资源的实用这之需对资源的使用按需付费,从而敏捷地响应客户不断变化的需求,从而降低了资源使用者的成本,提高了走远利用的效率。10、 简述主要的大数据的处理系统。(1) 数据查询分析计算系统:对大规模莫数据进行事时或准时查询(2) 批处理系统:典型代表有MapReduce计算模式的Hadoop与Spark(3) 流式计算系统:具有很强的实时系统,需要对应用源源不断产生的数据实时进行处理,使数据不积压、不丢失,常用于处理电信、电力等行业应用与互联网恒业的访问日志等。(4) 迭代计算系统:iMapReduce、Twister、Spark、Hadoop等。(5) 图计算系统:图数据需要专门的系统进行存储和计算。常用的计算系统有:Giraph、Pregel、Trinity、GraphX等(6) 内存计算系统:Dremel、HANA、Spark等11、 简述大数据处理的基本流程。(1) 数据抽取与集成:从数据中取出关系与实体,经过关联和聚合等操作,按照统一的格式进行存储。(2) 数据分析:是大数据处理流程的核心步骤,通过数据抽取和集成环节获得原始数据后用户可以根据自己的需求对这些数据进行分析处理。(3) 数据解释:可视化和人机交互是书记解释的主要技术。第二章1、 简述一致性哈希算法的基本原理。一致性哈希算法的设计目标是解决节点频发变化时的任务分配问题。一致性哈希算法将整个哈希空间组织成一个哈希环。比如将ip作为关键字哈希,确定每个结点在哈希环上的位置,将key用函数映射到哈希空间上的某个值,沿该值向后,将遇到的第一个节点作为处理节点。节点数不多时可以引入虚拟节点解决负载不均衡的问题。Key值在哈希环中找到大于它的最小节点作为路由值。2、 科学研究的四个范式是经验、理论、实验、海量数据。3、 物联网的产业链可以分为标识、感知、处理和信息传递4个环节。4、 非关系型数据库可以分为Column-Oriented、Key-Value、Document-Value。第三章2、虚拟化技术从计算体系层次结构上可以分为以下5种类型:指令集架构级虚拟化、硬件抽象层虚拟化、操作系统层虚拟化、编程语言层上的虚拟化、库函数层的虚拟化。4、系统虚拟化具有硬件无关性、隔离性、多实例、特权功能等优点。5、系统虚拟化可分为一虚多、多虚一、多虚多。6、服务器虚拟化按照其虚拟化部件可分为CPU虚拟化、内存虚拟化、I/O虚拟化。7、什么是广义虚拟化技术?逻辑简化技术,实现物理层想逻辑层的变化。8、 虚拟化技术有哪些优势与劣势?优势:提高资源利用率;提供相互隔离的、高效的运行环境;简化资源和资源管理;实现软件和硬件的分离。劣势:肯呢个回事物理计算机负载过重;升级和维护的安全问题;物理计算机的影响。第四章3、 传统的集群系统可以分为高可用性集群系统、负载均衡集群系统、高性能集群系统、虚拟化集群系统4类。4、 简述Beowulf系统的主要特点。用廉价系统实现高性能的能力。(1) 由一个管理节点和多个计算节点构成。(2) 同城由最城建的硬件系统构成。(3) 通常采用廉价且广范传播的软件。5、 Lustre存储系统的组成有元数据服务器、元数据存储节点、对象存储服务器、对象存储节点、客户端。6、 简述面向对象的分布式系统、混合型分布试系统、面向数据的分布式系统的实现机制,分析三种系统的区别。三种系统的实现机制分别为:计算拆分、数据拆分、数据拆分区别:混合式系统具有面向计算和面向数据的特征以集中式的存储和数据想计算迁移的方式实现计算和数据位置的一致性。面向数据的分布式系统往往有对应的文件系统支持,从文件存储实现数据块的划分。计算和数据协作机制为核心问题。面向计算的分布试系统具有灵活和功能强大的计算能力能完成大多数问题的计算任务,面向数据的分布试系统能较好地解决海量数据的自动分布式分布式处理问题。第五章1、 什么是MPI?MPI是一种消息传递编程模型并成为这种编程模型的代表和事实上的标准。3、 简述MPICH并行环境建立的主要步骤。(1) 配置NFS实现所有节点指定文件夹的共享。(2) 配置好节点间的互信,实现集群内部各节点间的无密码访问。(3) 编译安装配置MPICH。第六章2、 简述GFS的工作过程。(1)客户端使用固定大小的块将应用程序指定的文件名和字节偏移转换成文件的一个块索引,向master发送包含文件名和块索引的请求。(2)Master收到客户端发来的请求后向服务器发出指示,同时时刻监控众多chunkserver的状态。(3)Master通过和chunkserver的交互向客户端发送chunk-handle和副本位置。期中文件被分成若干个块。(4)客户端向其中一个副本发出请求,请求指定了chunk-handle和块内的一个字节区间。(5)客户端从chunkserver获得数据。3、 简述HDFS的分块策略。通常HDFS在存储一个文件会将文件切为64M大小的块来进行存储,数据块会被分别存储在不同的Datanode节点上同时数据块被分块存储后在数据读写时能实现对数据的并发读写。4、 简述搭建Hadoop开发环境的流程。首先安装jdk,下载解压Hadoop,配置Hadoop环境变量,然后修改Hadoop配置文件。第七章1、 简述HPCC的主要特点。面向数据的高性能计算平台,平台基于键值进行索引,用来解决海量数据的处理与分析。4、 HPCC从总体物理上可以看作在同一个集群上部署了Thor、Roxie两套集群计算系统。5、 HPCC的系统服务包含ECL服务器、Dail服务器、Sasha服务器、DFU服务器、ESP服务器。6、 简述HPCC平台数据检索任务的执行过程。(1)加载原始数据(2)切分、分发待处理的数据(3)分发后原始数据的ETL处理(4)向Roxie集群发布。第八章1、 Storm三进程包括Nimbus、Supervisor、Zookeeper。2、 在Storm中每实现一个任务,用户需要构造包含Spout、Bolt组件的拓扑。第九章1、 数据中心的发展经历了巨型机时代、微型计算机/PC时代、互联网时代、云计算、大数据时代四个阶段。2、 数据中心的选址主要考虑地质环境、气候条件、电力供给、网络带宽等因素。3、 数据中心的主要组成部分有基础设施、硬件设施、基础软件、管理支撑软件。4、 PUE的定义为数据中心整体能耗/IT设备能耗。5、 DCIE的定义为IT设备能耗/数据中心整体能耗。第十章1、 GirdSim和CloudSim的区别有哪些?GirdSim没有将云计
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年新能源汽车挂靠运营合作协议模板
- 2025年通信基站电气设备安装与优化升级协议
- 2025二手车二手车经销商培训服务合同范本
- 2025年度地磅称重系统销售与售后技术支持协议
- 2025处理离婚财产争议协议范本:夫妻共同财产处理流程详解
- 2025版砂石行业供销合同模板与解析
- 2025年二手家居用品转让定金合同模板参考
- 2025装配式建筑部品部件标准化设计在装配式建筑装配式阳台预制构件施工中的应用报告
- 2025年新型智能电脑及配件研发购销合同
- 2025第一节智能制造产业链协同创新合作协议书编号:XX027
- 人教版数学四年级上册全册课本练习题精心整理可编辑可打印
- 退费账户确认书
- 郑州市第四中学新初一分班(摸底)语文模拟试题(5套带答案)
- 2-第二章-各向异性材料的应力-应变关系
- 医院防爆反恐应急预案
- 云南省安全员C证考试题库及答案
- 死亡待遇申请表
- 集中供热管网系统一次网的调节方法
- 无线充电技术在汽车上的应用
- 马工程《刑法学(下册)》教学课件 第17章 危害国家安全罪
- 11科室临床路径、单病种管理目录
评论
0/150
提交评论