版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、大数据技术原理和应用操作试卷A卷一、单选题(每题2分,共计20分)下列选项中,用于获取Zookeeper所包含的信息的Shell命令是()。 TOC o 1-5 h z A、lsB、ls2C、rD、getMapReduce处理数据的工作流程大致分为()步。入、两B、三C、四D、五下列选项中,关于HDFS的架构说法正确的是()。A、HDFS采用的是主备架构B、HDFS采用的是主从架构C、HDFS采用的是从备架构D、以上说法均错误下列选项中,若是哪个节点关闭了,就无法访问Hadoop集群()。A、namenodeB、datanodeC、secondary namenodeD、yarn下列选项中,H
2、adoop2.x版本独有的进程是()。A、JobTrackerB、TaskTrackerC、NodeManagerD、NameNode下列选项中,存放Hadoop配置文件的目录是()。A、includeB、binC、libexecD、etc下列选项中,最早提出“大数据”这一概念的是()。A、贝恩B、麦肯锡C、吉拉德D、杰弗逊HDFS中的Block默认保存()份。 TOC o 1-5 h z A、3份B、2份C、1份D、不确定下列选项中,主要用于决定整个MapReduce程序性能高低的阶段是()。A、MapTaskB、ReduceTaskC、分片、格式化数据源D、Shuffle10在配置Linu
3、x网络参数时,固定IP地址是将路由协议配置为()。A、staticB、dynamicC、immutableD、variable二、多选题(每题2分,共计20分)下列选项中,属于Hadoop优势的有()。A、扩容能力强B、可靠性C、低效率D、高容错性 下列哪项可以作为集群的管理?A、PuppetB、PdshC、Cloudera ManagerD、Zookeeper下列选项中,属于Hadoop版本系列的有()。A、Hadoop4B、Hadoop2C、Hadoop1D、Hadoop3Hadoop提供的自定义配置时编辑的配置文件中,包含()。A、core-site.xmlB、hdfs-site.xml
4、C、mapred-site.xmlD、yarn-site.xml下列说法中,关于crontab表达式说法正确的是()。A、通过执行crontab表达式可以执行定时任务B、crontab表达式是由6个参数决定C、Crontab表达式是由5个参数决定D、以上说法均正确在Zookeeper选举过程中,一共有四种状态,分别是()。A、竞选状态B、随从状态C、观察状态D、领导者状态下列选项中,属于Sqoop指令的参数有()。A、importB、outputC、inputD、export下列选项中,关于Hadoop集群说法正确的是()。A、Hadoop集群包含Worker节点B、Hadoop集群包含Mas
5、ter节点C、Hadoop集群包含Slave节点D、Hadoop集群包含HMaster节点下列选项中,属于Google提出的处理大数据的技术手段有()。A、MapReduceB、MySQLC、BigTableD、GFSHive数据表插入数据时,insert ( )table ,括号中可使哪些关键字?A、intoB、appendC、overwrite三、判断题(对的打“ /”,错的打“X”;每题1分,共10分)由于Hadoop是使用Java语言编写的,因此可以使用Java API操作Hadoop文件系 统。()大数据提供的是一些描述性的信息,而创新还是需要人类自己实现。()带有倒排索引的文件我们
6、称为倒排索引文件,简称倒排文件。()Hadoop集群执行完MapReduce程序后,会输出_SUCCESS和part-r-00000结果文件。 ()传统文件系统存储数据时,若文件太大,会导致上传和下载非常耗时。()通过使用虚拟机软件(如VMware Workstation),可以在同一台电脑上构建多个Linux 虚拟机环境。()Zookeeper的选举机制,实际上是采用算法FastLeaderElection,投票数大于半数则 胜出的机制。()在Hadoop的解压目录下的bin目录,存放的是Hadoop的配置文件。()Hadoop HA是集群中启动两台或两台以上机器充当NameNode,避免一
7、台NameNode节 点发生故障导致整个集群不可用的情况。()在安装配置windows平台hadoop,配置后直接运行是没有问题的。()四、填空题(每题2分,共计20分)Flume的核心是把数据从数据源通过数据采集器(Source)收集过来,再将收集的数 据通过【】汇集到指定的接收器(Sink)。2.Sqoop连接器,它用于实现与各种关系型数据库的连接,从而实现数据的【】和导出 操作。Hive的安装模式分为【】、本地模式、远程模式三种形式。VMware提供了两种类型的克隆,分别是完整克隆和【】。Hadoop支持在【】系统和Windows系统上进行安装使用。Hadoop的解压目录下【】目录存放的
8、是Hadoop管理脚本,包含HDFS和YARN中各类 服务的启动/关闭脚本。一般关于日志文件产生都是根据【】而决定。在部署Sqoop时,需要在sqoop-env.sh配置文件中添加【】环境。当出现【】时,说明Hadoop集群已经被格式化成功。Flume分为两个版本,分别是Flume-og、【】。六、简答题(每题6分,共计30分)启动Hive方式有哪些?简述大数据在零售行业应用的具体表现。简述event。简述单点故障的产生。简述如何检查Namenode是否正常运行。参考答案单选题(每题2分,共计20分) TOC o 1-5 h z DDBACDBADA多选题(每题2分,共计20分)A,B,DA,
9、B,DB,C,DA,B,C,DA,BA,B,C,DA,DB,CA,C,DA,C判断题(每题1分,共计10分)对对对对对对对错对错填空题(每题2分,共计20分)【缓冲通道(Channel)】【导入】【嵌入模式】【链接克隆】【Linux】【sbin】【业务】【Hadoop】successfully formatted【Flume-ng】简答题(每题6分,共计30分)正确答案:1.bin/hive、2.bin/hiveserver2正确答案:大数据在零售行业的具体表现有三个,分别是精准定位零售行业市场、支 撑行业收益管理以及挖掘零售业新需求。正确答案:它是Flume内部数据传输的基本单元。一个完整的event包含
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 长春健康职业学院《麻醉学》2025-2026学年期末试卷
- 中国矿业大学徐海学院《社会研究方法》2025-2026学年期末试卷
- 长春数字科技职业学院《中国对外贸易》2025-2026学年期末试卷
- 长春健康职业学院《国际私法》2025-2026学年期末试卷
- 运城师范高等专科学校《工程项目管理》2025-2026学年期末试卷
- 运城师范高等专科学校《大学生心理健康教育》2025-2026学年期末试卷
- 长春信息技术职业学院《细菌学检验》2025-2026学年期末试卷
- 疾控人员职业规划书
- 幼儿保育面试展示技巧
- 2023年军队文职人员招聘之军队文职教育学考试题库
- 企业一般固废管理制度
- 2026山东青岛海关缉私局警务辅助人员招聘10人考试参考题库及答案解析
- 2026年北京市丰台区高三一模英语试卷(含答案)
- 材料力学试题库(含答案)
- 山西晋城市2026届高三下学期一模历史试题(含答案)
- 2021 年四川‘五类人员’选拔笔试题目及解析
- 工程监理现场巡视检查规程
- 2025年扫地机器人美国市场年度研报-
- 血管炎患者的皮肤护理
- 脑卒中急救绿色通道建设
- 2025年河南应用技术职业学院单招职业适应性测试题库附答案解析
评论
0/150
提交评论