版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1.mapreduce过程做压缩处理的作用是()A、减少网络耗时A、5B、数据批量采集4.请问在Hadoop体系结构中,按照由下到上顺序,排列正确的是()PigHive5.在整个maprduce运行阶段,数据是以()形式存在的A、key/value6.下面有关NameNode和DataNode之间的Hearbeat说法错误的是()B、HeatBeat包含DataNode状态相关信息7.()使用目录节点树的方式(类似文件系统)存储数据,主要用途是维护和监听A、ZookeeperA、JobTracker10.关于hadoop集群描述正确的是()12.关于Shuffle过程环形缓冲区描述正确的是()13.加载数据到Hive表,哪种方式不正确?()(“.”);System.out.printIn(filB、ReduceJoin的join操作是在MapReduce程序中的reducer阶段完成的C、MapJoin不会产生数据倾斜18.端口50070默认是Hadoop哪个服务的端口?()A、Ctrl+D21.在Java中,线程通过()方法可以休眠一段时间,然后恢复运行。A、runA、分号23.处于安全模式的时候,集群处于.状态。A、只读25.HFile数据格式中的Magic字段用于()。A、存储随机数,防止数据损坏D、指定字段的长度26.下列哪一种命令格式是不正确的()B、scan表时间戳起始行健结束行健C、alter表列族D、put表行键列族:列值28.下列()命令可以显示出HDFS文件系统中在线的数据节点。A、hdfsdfsadmin-report-l31.大数据处理中数据处理层不包括()A、数据清洗D、数据分析B、将基础设施(计算资源和存储)作为服务出租34.大数据的核心就是()A、缺失值处理B、B.噪声数据清除D、D.重复数据记录处理38.yarn-site.xml文件的作用是()A、ObserverD、原子性41.在()配置文件里可以修改文件块的副本数。42.在Python中,python面向对象中super的作用描述不正确的是:方法或super().属性或者方法现的功能()45.在Python中,面向对象中的特殊成员以及应用场景描述正确的是:B、_del析构方法,对应着一个对象的删除之前执行的内容C、repr:和repr()完全取代str。 46.在Job类中对输出键值对格式进行设置时,如果Mapper的输出格式与Reducer的输出格式一样,那么可以省略下列()设置。47.以下哪个不是数据仓库的特性:D、反映历史变化的48.下列哪一种命令格式是不正确的()A、get表行健列族B、scan表时间戳起始行健结束行健C、alter表列族D、put表行键列族:列值D、Python语言是非跨平台语言51.如没有配置hadoop.tmp.dir参数,此时系统默认的临时目录为()53.在Python中,下列表达式的值为True的是54.配置Hadoop文件参数时,配置项“dfs.replication”应该配置在哪答案:BC、ApplicationMaster调度Reducer读取Mapper的中间输出文件,执行Reduce任务。58.在Linux中,彻底终止进程123456,输入的命令是59.Hadoop序列化的特点有()。A、Configured63.在Java中,以下对于join方法描述正66.对于Hive中的分区(partition)概念,如下描述错误的是?()解析:多选题(共13题,10.4分)68.下列命令中(在zookeeper安装文件夹的bin目录下执行),哪项是停止ZooKeeper的正确命令()D、价值密度高HBase测试题D、以上均不是A、3.0(),'手机’)],对于这条匹配规则的说法正确的是"" area="" =name self.area=area singer1=Singer("陈奕迅","香港")OD;print("歌手:%s\t杰”,"中国")OD;print("歌手:%s\t地区:%s"%(singer2.name,B、歌手:陈奕迅地区:香港歌手:张杰地区:中国C、歌手:张杰地区:中国歌手:陈奕迅地区:香港D、歌手:陈奕迅地区:香港歌手:张杰地区:中国A、A:mkdir75.下列关于Hive的说法中,描述错误的是()。76.在Java中,可以使用()方法设置线程的优先级A、viC、适合其他异构系统在线访问HBase表数据A、psA、ShuffleA、threshold=<ratio(Datanode)-ratio(Rack)B、threshold=<ratio(DaC、threshold<ratio(Rack)D、threshold>=|ratio(Da89.对NodeManager服务描述不正确的是()91.2003年,Google公司发表了主要讲解海量数据的可靠存储方法的论文是?A、“TheGoogleFileSystem”B、“MapReduce:SimplifiedDataProcessingonLargeClusters”C、“Bigtable:ADistributedStorageSystemforStructuredData”D、“TheHadoopFileSystem”D、MapReduce应用程序只能用Java来写A、A:安装vsftpdB、B.启动vsftpd95.在Python中,pymysql连接数据A、Unknowndatabase'test'A、ResourceManager98.Zookeeper启动时会最多监听几A、1限效102.Container封装节点上多维度资源不包括()104.Linux是一种()105.下列哪项通常是集群的最主要瓶颈()。C、磁盘10106.在执行一个job时,如果这个job的输出路径已经存在,那么程序会()。B、抛出警告,但是能够继续执行A、for109.下列说法错误的是()A、Partitioner负责控制map输出结果key的分割C、OutputCollector收集Mapper或Reducer输出数据A、在Region分裂或合并后,负责重新调整Region的分布B、对发生故障失效的Region服务器上的Region进行迁移库114.在Linux中,FTP传输中使用哪两个端口()?C、Topology:定义了串行计算的逻辑模型(或者称抽象模型),也即从功能和架解析:156-128=28,128两个B、原子性D、持久性A、单机(本地)模式122.Iinux系统中生成密钥的命令是()1000)),阅读代码以下描述不正确的是:B、缺少导入random模块的代码oA、TaskTrackerA、killA、1C、可以使用等号"="来给变量赋值136.禁用ipv6需要修改的是哪个配置文件()A、/etc/sysctl.confA、useradd138.格式化NameNode命令为()143.HDFS默认的当前工作目录是/user/$USER,f配置文件内说明146.在Java中,&It;?version="1.0"encoding=“UTF-8”>这行声明该文A、hadoopdfsadmin-safemo153.下列选项描述错误的是?()及接收并处理来自ApplicationMaster155.以下哪个命令,不是Linux命令()156.对于mapper类中的setup方法不正确的是?157.在进行Hive组件配置时,JAR包冲突导致异常,出现以下错误信息()A、FailedtosetsetXIncludeAware(true)forparserD、ERRORtool.ImportTool:ImportedFailedA、云技术D、D.物联网技术159.下列哪些不是ZooKeeper的特点()A、顺序一致性D、可靠性A、s[3]163.在Java中,线程是Java的()机制A、检查164.在Python中,在使用Flask框架的静态路由时,可以使用()方法,注册不A、hdfs.create(newPath(“hdfs:/mydir”))B、hdfs.open(newPath(“hdfSQL类型被映射什么类型()170.下列关于Combiner的描述,正确的是()。B、Linux和Unix之间不存在关联A、FileReader是不支持使用Sqoop直接进行数据传送()174.关于Linux操作系统的组成和结构,下面叙述中错误的是()块解析:A)面向对象模型B)编程模型C)MVC模型D)面向切面模型正确答案B175.Centos中修改文件或目录的访问权限()命令A、持久性D、原子性Bin/hadoopjarcontrib/streaming/hadoop-0.20-streaming.input/filename-outputoutput-mapper'dosth.py5’-filedo179.大数据平台项目实施计划不包括()A、RecordReaderA、hadoopfs-Is/hello.txtC、hadoopfs-cat/heD、hadoopfs-taiD、工作进程WorkerD、处理来自ApplicationMaster的命令A、ZookeeperB、SequenceFile格式化进行网络传输和文件存储()A、Int191.关于HDFS的文件写入,正确的是()。A、1A、数据结构B、结构数据C、内容结构D、结构内容D、奇数台(且大于1)且备份3份。201.在Python中,下列是Flask的Request对象的data属性的作用的是()A、{["name":"json","age":10],["name":"html","agB、[{"name":"json";"age":10};{"C、[{"name":"json","age":10},{"name":"html","ageD、{["name":"json";"age":10];["203.MapReduce编程模型,键值对<key,value>的key必须实现哪个接口?A、JobTrackerC、vim/etc/profiC、一次写入,多次读写D、多次写入,多次读写208.下面生成中间键值对的是()209.大数据是指不用随机分析法这样的捷径,而采用()的方法210.下列_通常与NameNode在一个节点启动。一个节点宕机,主节点namenode需要多长时间才能感知到?<name>erval</namname>erval</name>A、26秒B、30秒214.客户端连接Zookeeper集群的命令是()。A、Pythonjobhistory-daemon.shstophistoryserverA、IdentityMapper<K,V>实现Mapper<K,V,K,V>,将输入直接映射到输出C、RegexMapper<K>实现Mapper<K,Text,Text,LongWritable>,为每个常规表达式的匹配项生成一个(match,1)对222.Hadoop最初是由谁创建的?绩”,例如“Alice89.5”,那么通过()选用输出键值对格式。A、job.setOutputKeyClass(Text.class);job.seB、job.setOutputKeyClass(IntWritable.class)job.setOutputValueClassC、job.setOutputKeyClass(Text.class);job.setD、job.setOutputKeyClass(Text.class);jo226.在Python中,关于关键字yield说法错误的是A、importA、viA、DistributedFileSys237.对Client/Server系统而言,的吞吐率是指对单个客户而言服务器在单位时间内完成的该客户提交的任务数目。A、服务器端C、系统端续字段进行()操作。A、分桶239.关于shuffle阶段中描述错误的是()A、shuffle可以分为mapshuffle和reduceshuffle。C、Shuffle中有可能有combine241.下面对Shuffle过程描述的过程正确的是()243.下面对Shuffle过程Combiner描述正确的是()245.关于Flume的三大组件以下说法正确的是()。B、channel只能链接单一的source和sink。246.在海量数据中,Dynamo的存储是按照什么策略来进行的?D、异步复制247.下列对Zookeeper基本操作描述错误的是()。C、setData操作用于获取znode保存的数据253.下列描述说法错误的是?()Bin/hadoopjarcontrib/streaming/hadoop-0.20-input/filename-outputoutput-mapper'dosth.py5’-filedosth.py-Dmapred.reduce.tasks=1以下说法不正确的是()A、Namenode,Datanode,TaskTrackerB、Namenode,DatanodeC、Namenode,JobTracker,secA、从namenode上得到数据块位置D、从datanode上得到数据块位置261.Flume中最小的独立运行单位是()。A、Source262.日志消息的级别中那个是不会影响系统但值得注意()A、80B、为了保证数据的安全性(准确),可以引入同步代码块C、同步代码块符合“加锁修改释放锁”的逻辑D、互联网269.设置MapReduce参数传递的正确方式是()。B、通过get)和set()方法传递C、通过conf.set("argName",args[n])传递A、自定义数据类型必须继承Writable接口C、自定义MapReduce的value需要继271.下面对分区描述的过程正确的是()272.下列关于zookeeper描述正确的是:()C、RegexMapper<K>实现Mapper<K,Text,Text,LongWritable>,为每个常规表达式的匹配项生成一个(match,1)对的值为分词时,生成(taken,1)对B、publicThread(Runnabl275.HBase分布式模式最好需要()个节点?D、信息表279.克隆虚拟机之后需要修改()文件。①/etc/udev/rules.d/70-persistent-net.rules、②/ete/sysconfig/network-A、gzip号则表示安装成功()283.在Python中,指一个事务一旦提交,它对数据库中数据的改变就应该是永久性的。接下来的其他操作或故障不应该对其有任何影响说的是事务的哪个特性?A、持久性D、原子性A、Client287.shuffle环形内存缓冲区达到()溢写A、1289.关于SecondaryNameNode哪项是正确的()B、尽量使用驼峰命名法294.对mapreduce描述正确的时()D、在性能方面比Spark更好295.在Java中,针对设计模式中的单例模式,为了实现“单例”,必须要做到296.在Python中,关于cursor.fetchmany(3)语句说法正确的是A、随机获取3行数据297.在MapReduce中,下面哪个数据流的顺序是正确的()a.InputFormatb.Mapperc.Combinerd.Reducere.Partitionerf299.在Python中,关于execute()说法正确的是B、异常是Python对象,表示一个错误B、“//”表示相对路径,可以从任意位置开始304.Linux操作系统vm.swappiness参数值被设置为10,它的含义是()A、内存使用量达到系统内存的90%时,操作系统会相当频繁地使用磁盘上的交换文件是C、可以通过创建类implementsThread实现多线程A、Socket307.大数据的分布式计算使用下面哪项技术?()象309.下列哪项通常是集群的最主要的瓶颈()A、3C、1313.Hadoop的作者是下面哪一位()A、Martin315.在启动hadoop集群以后,查看jps进程有几个?A、3个316.在HadoopMapReduce框架中,任何值类型******。A、需要实现Writable接口D、不需要实现任何接口317.下列关于大数据中计算机存储容量单位的说法中,错误的是()318.在项目实施人员中,适时与客户沟通,确立项目目计划,负责项目全面管理的角色是()。C、产品经理A、hadoopfs-rmr/hello.txtC、hadoopfs-cat/hello.D、hadoopfs-mkdir/321.配置主机名和IP地址映射的文件位置是()A、一定死锁B、不一定死锁C、不会死锁D、以上说法都不对A、安全模式目的是在系统启动时检查各个DataNode上数据块的有效性A、JobtrackerA、8088326.在Python中,()语句隐藏了一个包含了关闭的逻辑,类似try…catch327.在Hadoop配置文件中,以下属于core-site.xml文件主要内容的是()330.显示当前所在目录的命令是()331.下面关于Shuffle过程描述正确的是()332.分片默认()MB、可以通过重载isSplitable()方法来避免文件分片336.MySQL数据库驱动文件放置于hive哪个目录下()A、jarB、多结构化数据D、价值密度高A、input()D、基于历史数据的数据挖掘350.在Hadoop配置文件中,以下属于core-site.xml文件主要内容的是()age=0defeat(self):print(,"正在吃饭")classStudent()"学生类"defstudy(self):print( A、张三正在吃饭小明正在学习B、张三正在吃饭355.在Python中,下面代码的输出结果是foriinrange(1,10,2):printA、4A、/usr357.HBase中需要根据某些因素来确定一个单元格,这些因素可以视为一个“四维坐标”,下面哪个不属于“四维坐标”?D、时间戳358.关于SecondaryNameNode的说法错误的是()(应该是run方法完成)__B、分布式锁363.yarn-site.xml中参数和解释不能对应的是()B、yarn.nodemanager.local-dirs:多条存储路径可以提高磁盘的读写速度D、yarn.nodemanager.aux-services:需要设置的MapReduce的应用程序服务二、多选题D、数据分析A、Configuationconf=newCB、Jobjob=newJoC、job.setMaperClassD、硬件故障的检测B、域名服务A、RecordReaderA、数据的“大量化”B、数据的“快速化”C、数据的“多样化”D、数据的“价值密度比较低”10.hadoop创建多级目录(如:/a/b/c)的命令为()【选两项】12.下面对Partioner分区描述正确的是()13.下列选项参数是Sqoop指令的是?()A、importB、端口号B、没有固定结构B、磁盘10开销大20.下列选项中,属于Hive数据模式的是()。些特点()【选三项】D、可控性,hadooprpc实现了自定义的rpc框架。的sql正确的是?【选两项】28.以下属于机器学习的是()D、DirectGrouping:随机分组,随机分发Stream中的Tuple,保证每个Bolt的Task接收Tuple数量大致一致色,在集群中文件的存储主要一下那两个角色()【选两项】31.对mapper基类描述正确的是()32.Shuffle过程中的merge的三种形式分别是()息)A、顺序存储B、容易使用39.GFS中主服务器节点存储的元数据包含这些信息()B、命名空间D、当某个DataNode失败,客户端会继续传给其它DataNodeResourceManager会以容器的形式为ApplicationMaster分配资源B、把获得的资源进一步分配给内部的各个任务(Map任务或Reduce任务),实现资源的“二次分配”43.Hadoop集群的整体性能主要受到什么因素影响?45.下面关于网桥的说法,正确的是()A、网桥工作在数据链路层,对网络进行分段,并将2个物52.hive支持以下哪一个数据操作()A、hiveC、面向列A、hadoopfs-rmA、161.关于mapreduce自定义数据类型实现write()方法描述正确的是()A、write()方法实现反序列化B、write()方法实现序列化C、write()序列化Text类型属性时可以用out.writeUTB、SparkonMesos(和Spark有血缘关系,更好支持Mesos)64.下列对应解释正确的有()D、IntWritable:整型数65.对reducer基类描述正确的是()69.在Python中,定义一个People类,其中要有类的初始化函数(带参数name)D、thrift实现的Python、PC、yarn.resourcemana73.配置Hadoop集群时,下列哪个D、"^“按位取反运算符C、配置管理B、用户查询模块D、元数据存储模块80.关于数据创新包含()B、重组数组A、0B、单机模式IP数A、Shuffle85.下面哪个是Hadoop2.0的组件?A、ResourceManager87.在Linux中,以下FTP说法正确的是()【选两项】88.在Python中,使用Flask框架模板有哪些好处?()【选三项】90.以下选项中属于数据的作用是()D、大数据C、Hadoop生态系统其它组件的不断丰富95.()是大数据运用的基础B、大数据存储D、大数据分析挖掘C、数据出错D、Store是Region服务器的核心99.下面说法选项错误的是()D、Writable接口是一个序列化对象的接口,能够将数据写入流或者从流中读出。103.关关于ZooKeeper的配置参数A、TezA、rename()106.下列对计数器类说法正确的是()A、org.apache.hadoop.mapreduce.CounB、Counterct=context.getCounter(groupName,counterName);这句代码是107.关于mapreduce自定义数据类型正确的是()C、write()序列化属性顺序和readFields()方法反序列化属性顺序必须一致。110.下列描述正确的有()A、NulIWritable:当<key,value>中的key或value为空时使用D、数据大小112.以下说法不正确的是()【选三项】A、减少代码量三、判断题规则。()该控制器用于监控NameNode的健康状态。()9./etc/profile这个文件,主要是用来配置环境变量。让hadoop命令可以在任意A、正确A、正确组合。()A、正确13.Hive的元数据存储在关系数据库中。()A、正确22.查看Linuxip的命令是ifconfig24.BlockSize是不可以修改的。元数据信息并反馈给客户端。()A、正确A、正确A、正确A、正确A、正确34.hive最终都会转化为mapreduce的job来运行理模式。()和每个集群节点一个slaveTaskTracker共同组成。master负责调度构成一个作业的所有任务,这些的slave上,master监控它们的执行,重新执行已经失败的任务。而slave仅负责执行由maste指派的任务。版权声明:本文为CSDN博主「fenghuo9527」的原创文章,遵循CC4.0BY-SA版权协议,转载请附上原文出处链接及本声明。原文链接:/fenghuo9527/arti53.Ganglia不仅可以进行监控,也可以进行告警。()60.Java序列化机制对Hadoop来说是适合的。63.write()是把输入流字节反序列化。()67.在流计算的处理模式中NativeStreamProcessingSystem基于数据读入顺序逐条进行处理,每一条数据达到即可得到及时处理。69.put命令和copyToLocal命令可用于上传文件。78.Mapreduce的inputsplit就是一个Block。80.在internet网络中,t
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 员工培训效果评估模板能力提升指南
- 成本节约和效率提升承诺书范文7篇
- 智能汽车系统架构设计与技术手册
- 技术支持IT服务流程优化手册
- 2023年太阳能热水器安装服务合同三篇
- 企业重要文件丢失数据恢复策略手册
- 家庭教育指导师塑造良好亲子关系指导书
- 电商客户服务标准流程指南
- 产品问题修复及应对方案承诺书5篇
- 家庭信用保障承诺书(3篇)
- 2026年交管12123驾照学法减分完整版通关练习题及参考答案详解(模拟题)
- 甘肃省公安交警辅警考试题库
- 工会财务会计制度规范
- (2026版)贪污贿赂司法解释(二)培训纲要课件
- 温州市2026事业单位联考-综合应用能力A类综合管理模拟卷(含答案)
- 2026年湖南省新高考教学教研联盟(长郡二十校联盟)高三语文4月第二次联考(含参考答案)
- 2026年三年级道德与法治下册全册期末考试知识点材料
- 2026中信证券分支机构校园招聘笔试历年难易错考点试卷带答案解析
- 2025版建筑工程建筑面积计算规范
- 亲子阅读陪伴成长PPT
- 《电工技术基础与技能》教学教案
评论
0/150
提交评论