版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
的大小是()从机slave01的opt下,以下使用的命令正确的是()A、scp/opt/jdkslaveB、整数C、二进制串7.启动集群的顺序为()。①start-dfs.sh、②start-yarn.sh、③mr-jobhistory-daemon.shstarthistoryserverC、系统端12.Combiner不适合哪一种操作?()A、最大值C、平均值答案:CB、hive支持数据删除和修改D、hive默认仓库路径为/user/hive/warehouse/15.Centos中修改文件或目录的访问权限()命令16.在Java中,可以使用()方法设置线程的优先级17.在Python中,下列是Flask的Request对象的data属性的作用的是()18.在Java中,下面关于线程的说法哪些是正确的题C、Thread类属于java.util程序包D、以上说法无一正确D、DatagramSocket是TCP/IP的一部分20.shuffle环形内存缓冲区达到()溢写#x000D;print(,"正在吃饭") classStudent(): "学生类" defstudy(self): print(,"正在学习") per1=Person() ="张三"&A、张三正在吃饭小明正在学习B、张三正在吃饭23.关于Hadoop下列说法错误的是()25.Hadoop和新架构不包括()不支持使用Sqoop直接进行数据传送()B、节点.addAttribute("属性名","属性值");C、节点.addAttributes("属性名","属性值");32.禁止记录访问时间戳需要修改什么参数()A、Socket36.目前,Hadoop的最高版本是哪个?38.调用Zookeeper对象创建的节点,不包括()。A、808841.大数据(BigData)的定义正确42.Hadoop-2.6.5集群中的HDFS的默认的数据块的大小是?A、hdfsdfsadmin-report-l号则表示安装成功()46.下面那个不属于全球首次划分的大数据阶段()A、6448.在Python中,阅读代码,选择结果:claage=0defeat(self):print(,"正在吃饭")classStudent():"学生类"defstudy(self):print(,"正在学习")per1=Person A、张三正在吃饭小明正在学习B、张三正在吃饭49.mapred-site.xml配置文件中参数和解释不能对应的是()A、:执行框架C、Mapreduce.task.io.sort.mb:设置数据进行排序的内存大小A、IdentityMapper<K,V>实现Mapper<K,V,K,V>,将输入直接映射到输出C、RegexMapper<K>实现Mapper<K,Text,Text,LongWritable>,为每个常规表达式的匹配项生成一个(match,1)对B、如果一个类继承另外一个类,则需要在类定义的第一行中类名的后面加小括号,小括号中传入父类的类名。54.使配置的环境变量生效的命令是()55.在Java中,下列()类或接口定义了线程通信的wait和notify方法。A、ThreadC、两者都不与守护进程交互,避免复杂性58.在Python中,使用Flask创建模板是,要保证项目下有()文件夹A、sources级结构。C、一次写入,多次读写D、多次写入,多次读写A、StructA、缺失值处理B、B.噪声数据清除B、数据的通信使用的是ftp协议(http协议)D、协议的容器是jetty73.在本次项目实施中,需求调研前的准备不包括()。B、接到调研任务,将计划写好,立即就开始和用户沟通。74.大数据的核心就是()75.下列描述说法错误的是?()程连接Linux服务器执行操作。77.下列有关MapReduce中,说法是正确的是()。B、systemctlenableA、gzip81.在Linux中,列出所有分区信息的命令是()82.哪个不是mapreduce运行的时候分的部分?()C、C.检查系统是否已安装vsftpdA、import85.下面属于Hadoop特点的是()D、高成本86.关于MapReduce的描述错误的是()B、先进先出调度器C、公平调度器88.下列不属于分布式数据库系统的是()。89.云计算发展对产业的影响对一般企业和机构来说主要是()。了一些常用的测试模块。可以获得文件中单词长度的中位数的模块是(C)。95.在Python中,关于cursor.fetchmany(3)语句说法A、随机获取3行数据97.下面哪项是Hadoop的作者?()A、1100.格式化NameNode命令为()A、信息104.使用jar操作运行Hadoop中A、cd-jarhadoop/share/hadoop/maC、cdjar/hadoop/share/hadoop/mapreduce/D、cd/hadoop/share/hadoop/mapreduce/105.在Kafka中使用()命令来创建生产者。A、kafka-console-producer.设置conf.setlnputFormat(WhichA、viA、binD、运行在Linux平台上115.在Kafka中使用()命令来创建生产者。A、kafka-console-producer.116.关于SecondaryNameNode哪项是正确?()来120.通过浏览器界面监控Hive的状态,以下是查看的端口()D、流式读取B、是分块的总数目一半业中reduce的任务数目A、DistributedFileSys125.关于Shuffle过程环形缓冲区描述正确的是()然后并行处理()127.下列关于Storm的描述,有误的是?128.Hadoop序列化的特点有()。B、网络134.在MapReduce任务中,下列哪一项会由hadoop自动排序?A、keys137.多用户的情况下,哪个YARN调度器可以最大化集群的吞吐和利用率?138.Hbase依赖()提供强大的计算能力A、ZookeeperA、JobTrackerA、setup哪项是正确的?()C、它对内存没有要求143.大数据平台Hadoop的组件中,提供分布式协作服务的组件是()A、1s145.下面哪个程序负责HDFS数据存储。()Bin/hadoopjarcontrib/streaming/hadoop-0.20- input/filename-outputoutput-mapper'dosth.py5’-filedosmapred.reduce.tasks=1以下说法不正确的是()147.在Java中,实现线程的创建有()方法148.HFile数据格式中的Metalndex字段用于()。C、znode的是有版本的,每个znode的中存储的数据可以有多个版本,也就是一个访问路径中可以存储多份数据。A、record155.在文件属性中,文件的权限用第()列字符表示。156.HDfS中的block默认保存几份?答案A默认3分A、创建外部表时需要指定external关键字D、可靠性162.如何禁用reduce阶段()A、读使用xIwt模块,写使用xlrd模块B、写使用xIwt模块,读使用xlrd模块C、读使用read模块,写使用write模块D、读使用write模块,写使用read模块A、Shuffle--Sort--RedC、数据处理系统A、Client171.关于Linux操作系统的组成和结构,下面叙述中错误的是()块172.Hadoop集群的关闭命令是?()173.ZooKeeper的特点不包括()A、顺序一致性B、原子性C、可靠性177.在Python中,网络框架Django是()A、支持快速建站的框架178.在Java中,以下哪个最准确描述sy个文件64K,127MB,256MB,那么hadoop框架会将输入划分成多少份?()D、原子性187.Container封装节点上多维度资源不包括()188.()使用目录节点树的方式(类似文件系统)存储数据,主要用途是维护和监A、Zookeeper189.配置Hadoop环境变量修改()文件190.下列()不是非关系型数据库。B、可以通过重载isSplitable()方法来避免文件分片194.Hadoop的作者是哪一位()196.按粒度大小的顺序,Hive数据被分为:数据库、数据表、()、桶?B、栏A、io.sort.spill.perc据类型?D、InputFormat格式类199.在Linux系统中新增一个新组group2,同时指定新组的组标识号是101,命令200.下列不属于数据存储技术的是()。A、host.conf1000)),阅读代码以下描述不正确的是:D、生成的随机数的范围是(0,1000)A、从namenode上得到数据块位置C、从namenode上得到数据和数据块位置D、从datanode上得到数据块位置204.HBase依靠()存储底层数据B、任意可以在WindowsServer2008上的应用程序206.下列选项中那些是Hadoop2.x版本独有的进程()A、JobTrackerA、Ctrl+D209.Linux操作系统vm.swappiness参数值被设置为10,它的含义是()211.下面有关NameNode安全模式(safemode)说法错误的是()C、调用setSafeMode()函数能够打开或关闭安全模式A、duA、FIF0SchedulerA、A:mkdir216.狭义的Hadoop是一个适合大数据分布式存储和分布式计算的平台,不包括下面哪个组件?218.端口50070默认是Hadoop哪个服务的端口?()220.模式,多个Hive用户通过网络连接到数据库。B、多用户模式221.下列大数据特点中错误的是()。机器重启之后而找不到机器的情况,那么IP地址配置需要修改那个文件()224.在Java中,阅读下列文件定入的Java代码,共有()处错误 importjava.io.*; publicclassTest10{ publicstaticvoidmain(String[]args){ Stringstr="文件写入练习"; FileWriterfw=nuFileWriter("c:\mytext.txt");//2 #x000D;}catch(10Exceptionex){ ex.printStackTrace(); } } 、0B、1225.关于Flume的三大组件以下说法正确的是()。A、channel可以和任意数量的B、channel只能链接单一的source和sink。A、1229.在Java中,线程中的sleep(lonA、cursor.callproc(pC、cursor.callproc('pA、Master机器上的IP和50070(“.”);System.out.printIn(filA、一定死锁D、以上说法都不对D、修改hdfs-site.xml配置文件240.在驱动类中,()设置输入数据的格式。A、使用方法set0utputFormatB、使用方法set0utputKeyValueC、使用方法setInputFormat242.Shufile阶段中哪一步是可选的?()A、threshold=<ratio(Datanode)-ratio(Rack)B、threshold=<ratio(DaC、threshold<ratio(Rack)-rD、threshold>=|ratio(Datanode)-raC、它的目的是帮助NameNode合并编辑日志,减少247.在Java中,File类中哪个方法可以判断文件是否存在?A、exists()248.以下对定时调度器描述正确的是()249.下列关于Hive描述正确的是()。D、Hive支持迭代计算250.在执行一个job时,如果这个job的输出路径已经存在,那么程序会()。B、抛出警告,但是能够继续执行D、数据存储规模有限A、$hadoopjarhadoop-examples-25.0jarwoB、$hadoopfs-hadoop-examples-25.0jarwordcountD、$hadoopjarhadoop-examples-2.5.0/jarwordc255.啤酒和尿布的关系是大数据在()行业的典型应用。256.大数据的分布式计算使用下面哪项技术?()257.在Java中,字符输出流类都是()抽象类的子类A、FilterWriter是Thread类的实例的260.Hbase的主要作用是()B、是一种编程模型,用于大规模数据集(大于1TB)的并行运算D、将要储存的文件分散在不同的硬盘上,并记录他们的位置A、hdfsdfs-dir/user/roA、DistributedFileSysB、尽量使用驼峰命名法266.在Linux下安装NTP服务的命令是()。A、sleep(1)269.对于Hive中的分区(partition)概念,如下描述错误D、分区字段可以作为where字句的条件解析:多选题(共13题,10.4分)270.在整个maprduce运行阶段,数据是以()形式存在的A、key/value271.HBase依赖()提供强大的计算能力A、Zookeeper272.Shuffle中的Partitioner发生在哪个过程()A、start()A、hadoopfs-ls/hello.txtC、hadoopfs-cat/hello.D、hadoopfs-taiA、elifC、if下存储200个每个200M的文本文件,请问最终会在集群中产生多少个数据块(包括副本)?A、200C、使用ChainReducer时,每个mapper和reducer对象都有一个本地JobConf对象280.下面关于Region的说法,哪个是错误的?A、10Exception283.在Java中,当()方法终止时,能使线程进入死亡状态。A、run284.在Java中,一个Socket由()唯一确定B、一台机器288.Hive定义一个自定义函数类时,需要继承以下哪个类?()289.yarn-site.xml中参数和解释不能对应的是()B、yarn.nodemanager.local-dirs:多条存储路径可以提高磁盘的读写速度290.关于ApplicationMaster组件描述错误的是()。292.下列不属于HBase基本元素的一项是0A、只读C、可读可写A、Mapper、Combiner、ReducerA、Observer299.Hive表的数据默认存储与数据仓库目录()中。A、/user/hive/warehoB、用来删除一个文件A、Double-Number302.下列关于Combiner的描述,正确的是()。D、应谨慎使用Combiner303.下面对分区描述的过程正确的是()305.下列关于HadoopAPI说法错误的是()B、Configuration类的默认实例化方法是以HDFS系统的资源配置为C、FileStatus对象存储文件和目录的元数据D、FSDatalnputStream是java.io.DatalnputStream的子类306.在MapReduce中,下面哪个阶段是并行进行的()A、ResourceManagerNodeManagerApplicationMasterContainerB、SchedulerResourceManagerAppliC、MapreduceNodeManagerAppliD、HDFSResourceManagerNod容C、对于selectcount(*)fromtable操作,一定会启reduce任务316.以下选项哪个命令可以生成公钥()317.关于MapReduce1和YARN的对比错误的是?318.下列哪项通常是集群的最主要的瓶SparkContext对象,其变量名为()A、scA、JobtrackerA、psWhichlnputFormat应该为以下的()A、数据发布和订阅328.用于检查节点自身的健康状态的进程是()A、ResourceManager329.大数据平台操作演示不包括()332.下面给Job任务添加缓存文件的方式正确的是()答案:A333.如果一个split文件中有3行内容,则MapReduce框架将为其分配一个任务进335.互联网的发展分为个阶段。337.在启动hadoop集群以后,查看jps进程有几个?A、3个338.HDFS适合的读写任务是()。339.在Java中,假如电脑上E盘没有xxx目录,则下面程序功能描述正确是 Filefile1=newFiC、Python程序也有继承的关系,只要满足is-a的关系都可以用继承来表示。D、Python程序也有继承的关系,只要满足have-a的关系都可以用继承来表示。342.Hadoop最初是由谁创建的?344.下列对Zookeeper基本操作描述错误的是()。C、setData操作用于获取znoC、大括号C、bin/hadoopnamenodeD、sbin/hdfsdf349.上传Hadoop压缩文件到soft目录下的命令为()A、tar-zxvfsoft/hadoop.2.7.3.tar.gzB、tar-zcvfsoft/hadoop.2.7.3.tar.gzC、tar-zvf/soft/hadoop.2D、tar-zxvf/soft/hadoop.2.7350.下面关于Shuffle过程描述正确的是()351.查看Hadoop版本信息的命令是()D、远端数据定义A、2C、1356.下面描述正确的是()A、rwxr-x---的数字表示是750。B、rw-r-x---的数字表示是530。C、rw-rw-r--的数字表示是655。D、rwxr-----的数字表示是740。是不可行的?a.InputFormatb.Mapperc.Combinerd.Reducere.PartitionerB、新建的线程调用start()方法会进入就绪状态A、0B、1A、3C、1A、{["name":"json","age":10],[C、[{"name":"json","age":10},{"name"D、{["name":"json";"age":10];["二、多选题1.下列哪些是对reduce阶段任务正确理解()A、对多个map任务的输出,按照不同的分区,通过网络copy到不同的reduce节2.下列理解不恰当的是()4.下列选项中,属于Hadoop的优势的是()。息)C、HDFS采用主从结构模型7.HBase的三层结构中,三层指的是哪三层?8.下面那些选项正确描述了Hbase特性()D、面向列B、数据来源众多,格式复杂C、注重数据的整体价值,不过分关注个别数据10.下列对计数器类说法正确的是()B、Counterct=context.getCounter(groupName,counterName);这句代码是些特点()【选三项】13.在Linux中,以下FTP说法正确的是()【选两项】14.MapReduce与HBase的关系,哪些描述是正确的?16.下面对Partioner分区描述正确的是()18.在Python中,使用Flask框架模板有哪些好处?()【选三项】D、代码结构清晰,耦合度高D、数据维护20.在Linux系统中,用户组操作的常用命令有()【选三项】A、Configuationconf=newCC、job.setMaperClass(27.对MapReduce框架描述正确的是()C、yarn.resourcemanaA、isA、Pig35.HBase访问接口类型包括哪些?36.关于mapreduce自定义数据类型实现readFields()方法描述错误的是()38.MapReduce的具体应用包括哪些?42.下列正确的有()list(K2,V2)Reduce:(K2,list(V2))context)throwsI0Exception,InterruptedExceptionvalues,Contextcontext)thr主要包括以下哪几个方面?B、资源浪费(Map和Reduce分两阶段执行)48.负责将系统中的资源分配给各个正在运行的程序的组件是()。B、全局应用程序管理器C、应用程序管理器50.下列说法正确的是()B、单机模式52.关于数据创新包含()B、重组数组B、容易检查数据错误C、保证数据可靠性B、使用”from模块名import函数名1”方式导入模块中的函数。D、容易造成资源浪费61.在下列压缩格式中,可以进行分割的有()。A、gzipD、大数据分析挖掘A、正常启动C、安全启动B、域名服务C、数据对比,即join。A、折线图A、ResourceManagerC、大数据集A、0C、易于维护A、资源管理器ResourceManagerD、Writable接口是一个序列化对象的接口,能够将数据写入流或者从流中读出。关系型数据库的特点描述正确的是()。81.关关于ZooKeeper的配置参数,下列说明正确的是()【选两项】D、dataDir:hadoop的数据目录。82.MapReduce集群中的节点硬件有那些?【选三项】A、光驱84.以下属于机器学习的是()85.下列哪一句没有错误()D、Shuffle过程对mapreduce几乎没有用处。86.对reducetask理解正确的是()A、从map端远程读取数据D、将分组数据传递给用户编写的reduce()A、PuppetA、Scala的优势是提供了REPL(Read-Eval-PrintLoop,交互式解释器),提高D、Scala可以更好地支持分布式系统89.关系数据库引以为傲的两个关键特性(完善的事务机制和高效的查询机制),A、Web2.0网站系统通常不要求严格的数据库事务B、HBase系统为每个Region服务器配置了一个HLog文件C、Zookeeper会实时监测每个Region服务器的状态92.以下关于HDFS的设计理念描述正确的有()。C、简单的一致性模型他节点进行通信),分离的系统也能够正常运行B、任务调度D、数据即服务96.Shuffle过程中的merge的三种形式分别是()97.以下选项中属于数据的作用是()A、沟通D、多租户100.下列理解正确的是()102.每次格式化Hadoop的文件系统都会删除哪两个文件中的数据()【选两项】A、.dir104.以下关于MapReduce缺点描述错误的有()。108.下列对应解释正确的有()B、FloatWritable:浮点数C、DoubleWritable:双字节数值D、IntWritable:整型数109.Linux中重启系统的命令有()【选两项】110.Linux系统的优势有()【选两项】111.对reducer基类描述正确的是()A、读取输入文件内容,解析成key、value对。对输入文件的每一行,解析成key、value对。每一个键值对调用一次map函数。B、平台即服务(PaaS)三、判断题A、正确A、正确A、正确A、正确A、正确A、正确A、正确A、正确21.hadoopdfsadmin-report命令用于检测HDFS损坏块。23.在整个数据传输的过程中,Flume将流动的数据封装到一个event(事件)中,26.Hive基于Hadoop,安装Hive之前先安装好Hadoop。()30.RPC协议称为远程过程调用协议()31.hadoop1的主要结构是由HDFS和mapreduce组成的34.Hadoop的核心配置通过两个xml文件来完成:1,hadoop-default.xml;2,服务端(Server)。来排序。()38.MapTask阶段环形缓冲区默认大小值为80MB()A、正确41.Hadoop支持数据的随机写。()A、正确43.在Yarn上只能运行在一定时间内完成并正常退出的程序。()问题。()理模式。()A、正确A、正确A、正确或则会写入metadata信息并反馈client端。A、正确率低的一个重要原因。shuflle中的执行顺序是先分区,然后在溢写之前进行排序,最后溢出的多个磁盘文件会进行合并成一个大文件。76.启动Hadoop集群服务之前需要格式化文件系统(第一次)规则。()97.hadoopdfsadmin-report命令用于检测HDFS损坏块A、正确101.lucene是支持随机读写的A、正确102.Map映射:对一个列表的元素进行合并。()A、正确A、正确入元数据信息并反馈给客户端。()113.溢出因子(Spillfactor)是临时文件中储存文件的大小A、正确A、正确A、正确A、正确A、正确A、正确124.Kafka适用于实时性要求不高的场景。()A、正确A、正确五、简答题答案:1)、reducesidejoinreducesidejoin行join(笛卡尔乘积)。即:
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2026年手术室医疗废物分类与处理流程
- 2026年钢结构工程代建管理流程与吊装方案
- 2026年大学生士兵体能训练方法
- 脑脊液动力学与放疗反应预测
- 上海科技大学《安装工程计量与计价》2025-2026学年第一学期期末试卷(B卷)
- 上海科技大学《安全经济原理与实践》2025-2026学年第一学期期末试卷(A卷)
- 2026年勘察设计文件编制深度规定
- 北方工业大学《药理学》2025-2026学年第一学期期末试卷(A卷)
- 智能模型运行隐患智能筛查实施方略
- 北方工业大学《船舶柴油机构造与原理》2025-2026学年第一学期期末试卷(A卷)
- 20- 降低施工用电安全隐患率-烟建集团有限公司
- 精神分裂症的早期症状及识别方法
- 银行职工教育经费使用情况自查报告
- 论文写作初阶学习通超星期末考试答案章节答案2024年
- 论教养课件省公开课一等奖新名师课比赛一等奖课件
- 2024年广西企业人力资源管理师(三级)高频核心题库300题(含答案详解)
- 南京2024年江苏南京溧水区招聘编外人员社保员15人笔试历年典型考题及考点附答案解析
- 七年级下道法期末专题训练-材料分析题(解析版)
- 国家职业技术技能标准 4-14-02-05 老年人能力评估师 人社厅发202332号
- 模型12 脚拉脚模型(教师版)
- 高温防汛安全专项施工方案
评论
0/150
提交评论