版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
PAGEPAGE1一、单选题1.对于Hive中的分区(partition)概念,如下描述错误的是?()A、分区字段要在创建表时定义B、分区字段只能有一个,不可以创建多级分区C、使用分区,可以减少某些查询的数据扫描范围,进而提高查询效率D、分区字段可以作为where字句的条件答案:B解析:多选题(共13题,10.4分)2.在Python中,Python的XML的解析方式中速度快、消耗内存少,像轻量级的DOM的是A、SAXB、DOMC、AjaxD、ElementTree答案:D3.以下哪个不是HDFS的进程()A、SecondaryNodeB、NameNodeC、ResourceManagerD、DataNode答案:C4.Client端上传文件的时候下列哪项正确?A、数据经过NameNode传递给DataNodeB、Client端将文件切分为Block,依次上传C、Client只上传数据到一台DataNode,然后由NameNode负责Block复制工作D、以上都不正确答案:B5.在Hadoop项目结构中,HDFS指的是什么?A、分布式文件系统B、分布式并行编程模型C、资源管理和调度器D、Hadoop上的数据仓库答案:A6.________模式:Hadoop安装运行在多台主机上,构成一个真实的hadoop集群,在所有的节点上都安装JDK和hadoop,相互通过高速局域网连接。A、联机B、单机C、虚拟分布D、完全分布答案:D7.下列关于HDFS为存储MapReduce并行切分和处理的数据做的设计,错误的是?A、FSDataInputStream扩展了DataInputStream以支持随机读B、一台机器可能被指派从输入文件的任意位置开始处理一个分片C、为实现细粒度并行,输入分片(InputSplit)应该越小越好D、输入分片是一种记录的逻辑划分,而数据块是对输入数据的物理分割答案:C8.在Java中,单例模式属于对象创建型模式,它保证一个类仅有A、一个属性B、一个操作C、一个实例D、一个对象成员答案:C9.下面关于MapReduce模型中Map函数与Reduce函数的描述正确的是()A、一个Map函数就是对一部分原始数据进行指定的操作。B、一个Map操作就是对每个Reduce所产生的一部分中间结果进行合并操作。C、Map与Map之间不是相互独立的。D、Reducee与Reduce之间不是相互独立的。答案:A10.在Python中,下面代码的输出结果是foriinrange(1,10,2):print(i,end=",")A、4B、,1.4C、7答案:C11.下面哪个YARN的描述不正确的是?A、YARN指YetAnotherResourceNegotiator,是另一种资源协调者B、YARN只支持MapReduce一种分布式计算模式C、YARN最初是为了改善MapReduce的实现D、YARN的引入为集群在利用率、资源统一管理和数据共享等方面带来了巨大好处答案:B12.Linux系统中,将用户Tom的口令删除的命令是()A、passwd-kTomB、password-kTomC、passwd-dTomD、password-dTom答案:C13.在Python中,下列不属于事务特性的是?A、原子性B、隔离性C、操作性D、持久性答案:C14.一个文件大小156MB,在Hadoop2.0中默认情况下请问其占用几个Block()?A、1B、2C、3D、4答案:B解析:156-128=28,128两个15.下列选项哪个不是ZooKeeper的应用场景?A、Master选举B、分布式锁C、分布式协调/通知D、存储非关系型数据答案:D16.在Java中,一个Socket由()唯一确定A、一个IP地址和一个端口号B、一个IP地址和一个主机名C、一个主机号和一个端口号D、一个IP地址答案:A17.在Java中,简单工厂模式描述错误的是A、简单工厂模式由于使用了静态工厂方法,造成工厂角色无法形成基于继承的等级结构。B、违反了开闭原则,一旦新增产品必须修改原有代码。C、引入新的工厂,会减少系统的复杂性和理解难度。D、实现了创建对象和使用对象的分离。答案:C18.CombineFileInputFormat的作用()A、用于排序B、用于将多个文件合并成一个单独的splitC、用于切文件D、用于输出结果答案:B19.在Java中,下面哪个类使用了缓冲技术A、BufferedOutputStreamB、FileInputStreamC、ObjectOutputStreamD、FileReader答案:A20.大数据技术不包括()。A、数据计算B、数据存储C、数据冗余D、数据采集答案:C21.关于集群的特点下列叙述正确的一项是_________。A、系统吞吐量小B、可靠性高C、扩展性弱D、性价比低答案:B22.在hadoop配置中yarn-site.xml作用是()A、用于定义系统级别的参数B、用于名称节点和数据节点的存放位置C、用于配置JobHistoryServer和应用程序参数D、配置ResourceManager,NodeManager的通信端口答案:D23.在Java中,下列关于读写文件的描述错误的是A、Reader类的read()方法用来从源中读取一个字符的数据B、Reader类的read(intn)方法用来从源中读取一个字符的数据C、Writer类的write(intn)方法用来向输出流写入单个字符D、Writer类的write(Stringstr)方法用来向输出流写入一个字符串答案:B24.NameNode在启动时自动进入安全模式,在安全模式阶段,说法错误的是A、安全模式目的是在系统启动时检查各个DataNode上数据块的有效性B、根据策略对数据块进行必要的复制或删除C、当数据块最小百分比数满足最小副本数条件时,会自动退出安全模式D、文件系统允许有修改答案:D25.在搭建中ZooKeeper运行环境时,首先需要安装什么运行环境?A、PythonB、CC、JavaD、Linux答案:C26.HDFS的Block默认保存几份?A、3B、2C、1D、不确定答案:A27.在Java中,java.io包的File类是A、字符流类B、字节流类C、对象流类D、非流类答案:D28.下列不属于数据存储技术的是()。A、MySQLB、StormC、HDFSD、HBase答案:B29.下列传统并行计算框架,说法错误的是哪一项?A、刀片服务器、高速网、SAN,价格贵,扩展性差上B、共享式(共享内存/共享存储),容错性好C、编程难度高D、实时、细粒度计算、计算密集型答案:B30.在MapReduce中,________阶段,Reducer执行reducetask,将最后结果写入HDFS。A、ShuffleB、MapC、ReduceD、Sort答案:C31.在Linux系统中,使用数字设置权限的方向让所有用户都只能读的文件权限是()A、777B、444C、666D、642答案:B32.ZooKeep中大多shell命令的行为,可以通过命令命令推测,下列说法正确的是。A、ls:显示所有节点。B、create:创建一张表。C、get:获取一个节点。D、set:设置一个节点。答案:A33.下面哪个程序负责HDFS数据存储()A、DatanodeB、NameNodeC、JobtrackerD、secondaryNameNode答案:A34.以下选项中,哪种类型间的转换是被Hive查询语言所支持的()A、Double-NumberB、BigInt-DoubleC、Int-BigIntD、String--Double答案:D35.Sqoop是Hadoop和关系数据库服务器之间传送数据的工具,下列哪种数据库是不支持使用Sqoop直接进行数据传送()A、PostgresB、OracleC、MySQLD、Redis答案:D36.在Java中,哪个关键字可以实现线程同步A、transientB、synchronizedC、serializeD、static答案:B37.________模式:hadoop安装时的默认模式,不对配置文件进行修改。A、联机B、单机C、虚拟分布D、完全分布答案:B38.在Java中,下列对线程的描述错误的是A、在调用sleep后会暂停指定时间,到时间后继续执行B、运行中的线程可以被暂停C、调用run方法可以启动一个线程D、run方法执行完毕,该线程生命周期结束答案:C39.在Java中,使用Dom4j为Xml文档的节点添加内容,正确的是A、节点.setText("内容");B、节点.addText("内容");C、节点.addContent("内容");D、节点.setContent("内容");答案:A40.在Java中,下面关于线程优先级的说法中,正确的是A、线程的优先级是不能改变的B、优先级高的线程只是在执行时优先的概率比较大,不是一定的C、优先级越高的线程运行速度比优先级低的执行更快,占用资源更少D、优先级高的线程一定是优先执行的答案:B41.企业使用大数据平台基于()做分析报表。A、MongoDBB、BIC、HiveD、SQL答案:C42.Hive适合()环境A、Hive适合用于联机(online)事务处理B、提供实时查询功能C、适合应用在大量不可变数据的批处理作业D、Hive适合关系型数据环境答案:C43.日志消息的级别中那个是不会影响系统但值得注意()A、ALEKKTB、CRITC、NOTICED、DEBUG答案:C44.在Python中,os.mkdir("test")函数的作用是A、复制test目录B、查询test目录C、删除test目录D、创建test目录答案:D45.下列关于使用MapReduce编程模型实现SQL中的join操作错误的是?A、ReduceJoin可以实现内链接,也能实现各种外连接B、ReduceJoin的join操作是在MapReduce程序中的reducer阶段完成的C、MapJoin不会产生数据倾斜D、MapJoin也适合各种join场景,也能实现内连接和各种外链接答案:D46.MapReduce框架提供了一种序列化键/值对的方法,支持这种序列化的类能够在Map和Reduce过程中充当键或值,以下说法错误的是CA、实现Writable接口的类是值B、实现WritableComparable<T>接口的类可以是值或键C、Hadoop的基本类型Text并不实现WritableComparable<T>接口D、键和值的数据类型可以超出Hadoop自身支持的基本类型答案:C47.下列关于Hadoop和Spark说法错误的是()。A、二者都支持流式计算B、二者都支持批量计算C、二者都支持机器学习D、二者都支持SQL语句查询答案:A48.在Python中,下面代码的输出结果是x=12.34print(type(x))A、<class'float'>B、<class'complex'>C、<class'bool'>D、<class'int'>答案:A49.写入数据到HDFS的Sink组件是()。A、HiveSinkB、HBaseSinkC、HDFSSinkD、HadoopSink答案:C50.在Python语言中语句块的标记是A、分号B、逗号C、缩进D、/答案:C51.现在在hadoop集群当中的配置文件中有这么两个配置,请问假如集群当中有一个节点宕机,主节点namenode需要多长时间才能感知到?<name>erval</name><value>3</value><name>erval</name><value>2000</value>A、26秒B、30秒C、34秒D、20秒答案:C52.下面对Shuffle过程描述正确的是()A、Shuffle过程是从map输入到Reduce输出过程B、Shuffle过程可以简单分为Map-Shuffle过程和Reduce-Shuffle过程C、Shuffle过程是不包括Reduce阶段D、以上都不正确答案:B53.禁用ipv6需要修改的是哪个配置文件()A、/etc/sysctl.confB、/etc/profileC、~/.bashrcD、/etc/networks答案:A54.以下对Flume描述错误的是()A、高可用的B、高可靠的C、负责海量日志采集D、负责处理数据答案:D55.MapReduce的Shuffle过程以下中哪个操作是最后做的?A、排序B、合并C、分区D、溢写答案:B56.HBase依靠()存储底层数据A、HDFSB、HadoopC、MemoryD、MapReduce答案:A57.下面哪个协议用于Datanode和Namenode之间的通信()A、DatanodeProtocolB、NamenodeProcotolC、ClientProtocolD、ClientDatanodeProtocol答案:A58.HMaster的主要作用是()A、用于启动任务管理多个HRegionServerB、负责响应用户I/O请求,向HDFS文件系统读写数据C、负责协调集群中的分布式组件D、最终保存HBase数据行的文件答案:A59.配置机架感知的下面哪项正确?A、都正确B、MapReduce会根据机架获取离自己比较近的网络数据C、写入数据的时候会写到不同机架的DataNodeD、如果一个机架出问题,不会影响数据读写答案:A60.在Python中,传入jinja2中的变量值不能是下列()A、字符串B、字典C、列表D、方法答案:D61.大数据的起源是A、金融B、B.电信C、C.互联网D、D.管理答案:C62.hadoop集群不可以在_____________进行。A、联机模式B、单机模式C、虚拟分布模式D、完全分布模式答案:A63.下列关于Spark的描述,错误的是哪一项?A、使用DAG执行引擎以支持循环数据流与内存计算析B、可运行于独立的集群模式中,可运行于Hadoop中,也可运行于AmazonEC2等云环境中C、支持使用Scala、Java、Python和R语言进行编程,但是不可以通过SparkShell进行交互式编程D、可运行于独立的集群模式中,可运行于Hadoop中,也可运行于AmazonEC2等云环境中答案:C64.在Linux中,在输入模式下,按下什么键退回到编辑模式?A、TABB、PrtScC、ESCD、F1答案:C65.___________是指跨多台计算或服务器的文件或文件夹,数据存储在多台机器而不是单台机器上。A、分布式存储B、分页式存储C、链式存储D、顺序存储答案:A66.在大数据的计算模式中,流计算解决的是什么问题?A、针对大规模数据的批量处理B、针对大规模图结构数据的处理C、大规模数据的存储管理和查询分析D、针对流数据的实时计算答案:D67.在Java中,如下代码创建一个新线程并启动线程:Runnabletarget=newMyRunnable();ThreadmyThread=newThread(target);问:以下哪个类可以创建target对象,并能编译正确?A、publicclassMyRunnableextendsRunnable{publicvoidrun(){}}B、publicclassMyRunnableextendsObject{publicvoidrun(){}}C、publicclassMyRunnableimplementsRunnable{publicvoidrun(){}}D、publicclassMyRunnableimplementsRunnable{voidrun(){}}答案:C68.在Java中,以下哪个不是Xml文档的节点类型A、ElementB、BlankC、AttributeD、Text答案:B69.在驱动类中,()设置输入数据的格式。A、使用方法setOutputFormatB、使用方法setOutputKeyValueC、使用方法setInputFormatD、使用方法setJarByClass答案:C70.将关系型数据库中的数据导入到Hadoop平台的工具是()。A、importB、exportC、overwriteD、drop答案:A71.在Python函数中,用于获取用户输入的是A、input()B、print()C、eval()D、get()答案:A72.加载数据到Hive表,哪种方式不正确?()A、直接将本地路径的文件load到Hive表中B、将HDFS上的文件load到Hive表中C、Hive支持insertinto单条记录的方法,所以可以直接在命令行插入单条记录D、将其他表的结果集insertinto到Hive表答案:C73.Hadoop实现了什么样的系统A、操作系统B、数据管理系统C、数据整合系统D、分布式文件系统答案:D74.在Java中,假如电脑上E盘没有xxx目录,则下面程序功能描述正确是
Filefile1=newFile("e:\\xxx\\yyy");file1.mkdir()A、在当前目录下生成子目录:\xxx\yyyB、在E盘自动创建xxx/yyy目录C、在当前目录下生成文件xxx.yyyD、代码执行后E盘不会产生任何目录答案:D75.下列关于数据模型中行的叙述不正确的一项为_______。A、表按照行键“逐字节排序”顺序对行进行有序化的处理B、表内数据非常“紧密”C、不用行的列的数目完全可以大不相同D、可以只对一行上“锁”答案:B76.Flume数据传输的基本单元是()A、EventB、ClientC、ChannelD、Sink答案:A77.在Python程序中,使用什么语句来捕捉异常A、try/exceptB、try/catchC、try/watchD、try/get答案:A78.一个gzip文件大小75MB,客户端设置block大小为64MB,请问其占用几个block()A、1B、2C、3D、4答案:B79.在Linux中,下面()不是出现在Tomcat安装目录conf下A、web.xmlB、server.xmLC、tomcat-users.xmlD、tomcat-user.xml答案:D80.在Linux中,以下代码哪个可以删除arr={1,2,3,4}数组的下标为1的元素:A、deletearr[1]B、droparr[1]C、unsetarr[1]D、truncatearr[1]答案:C81.下列对Zookeeper基本操作描述错误的是()。A、getACL操作用于获取znode的ACLB、exists操作用于检测znode是否存在C、setData操作用于获取znode保存的数据D、sync操作用于将客户端的znode试图与zookeeper同步答案:C82.在下列分区中,Linux默认的分区是:A、FAT32B、B.ext3C、C.FATD、D.NTFS答案:B83.调用Zookeeper对象创建的节点,不包括()。A、持久节点B、临时节点C、持久顺序节点D、DataNode节点答案:D84.在Java中用于创建文件对象的类是A、FileB、ObjectC、ThreadD、Frame答案:A85.在Python中,下列数据中属于元组的是A、-198B、("",3306,"root","root123")C、{198,"Python",18.5,-5.6}D、[198,"Python",18.5,-5.6]答案:B86.下列哪些不是HBase的特点()A、高可靠性B、高性能C、面向列D、紧密性答案:D87.Sqoop是Hadoop和关系数据库服务器之间传送数据的工具,下列哪种数据库是不支持使用Sqoop直接进行数据传送()A、PostgresB、OracleC、MySQLD、Redis答案:D88.在linux文件系统权限中rwx,只读权限对应的数值为()A、4B、2C、1D、以上都正确答案:A89.Flume中最小的独立运行单位是()。A、SourceB、AgentC、ChannelD、Sink答案:B90.在Java中,现有一条XPath匹配规则如下“//productName[contains(text(),’手机’)],对于这条匹配规则的说法正确的是A、可以查找所有内容等于‘手机’的productName标签B、可以查找所有内容以‘手机’开头的productName标签C、可以查找所有内容包含‘手机’的productName标签D、可以查找所有内容以‘手机’结尾的productName标签答案:C91.Linux和Unix之间的关系是A、Linux是一种类Unix系统,Linux是由Unix衍生来的B、Linux和Unix之间不存在关联C、Linux是Unix的前生,Unix包含Linux的功能D、相比于Linux,Unix最大的创新点是开源免费答案:A92.在Linux系统中,对组的操作上实际上是对哪个目录文件的更新()A、/etc/groupB、/etc/passwordC、/etc/user/groupD、以上都是答案:A93.在Java中,下列关于Thread类的线程控制方法的说法中错误的一项是A、线程可以通过执行sleep()方法可以释放CPU执行权B、线程可以通过执行yield()方法可以让出CPU执行权,重新与其他线程竞争C、线程sleep()方法执行结束后,该线程进入运行状态D、若没有任何线程处于可运行状态,线程执行yield方法时,当前线程将继续执行答案:C94.有关MapReduce的输入输出,说法错误的是()A、链接多个MapReduce作业时,序列文件是首选格式B、FileInputFormat中实现的getSplits()可以把输入数据划分为分片,分片数目和大小任意定义C、想完全禁止输出,可以使用NullOutputFormatD、每个reduce需将它的输出写入自己的文件中,输出无需分片答案:B95.下面哪个协议用于SecondaryNamenode和Namenode之间的通信()A、DatanodeProtocolB、NamenodeProcotolC、ClientProtocolD、ClientDatanodeProtocol答案:B96.HDFS中的block默认保存____份。A、3B、2C、1D、不确定答案:A97.在Linux中,用户可以对vim进行设置,如何对vim文件进行修改?A、vim/etc/vim.initB、vim/etc/sysconfig/vimrcC、vim/etc/profile.d/vimrcD、vim/etc/vimrc答案:D98.在Storm的软件架构中,______运行在工作节点(称为node)上的控制程序,监听本地机器的状态,接受Nimbus指令管理本地的Worker进程。A、主控程序NimbusB、集群调度器ZookeeperC、工作节点控制程序SupervisorD、工作进程Worker答案:C99.HDFS默认BlockSizeA、32MBB、64MBC、128MBD、240MB答案:B100.以MapReduce统计学员的平均成绩,如果输出结果的格式为“学生姓名平均成绩”,例如“Alice89.5”,那么通过()选用输出键值对格式。A、job.setOutputKeyClass(Text.class);job.setOutputValueClass(Text.class);B、job.setOutputKeyClass(IntWritable.class)job.setOutputValueClass(Text.class);C、job.setOutputKeyClass(Text.class);job.setOutputValueClass(longWritable.class);D、job.setOutputKeyClass(Text.class);job.setOutputValueClass(DoubleWritable.class);答案:D101.HBase与下列哪个选项属于同一种类型的数据库()A、MongoDBB、MariaDBC、MySQLD、Oracle答案:A102.下列关于MapReduce说法不正确的是________。A、MapReduce是一种计算框架B、MapReduce的核心思想是“分而治之”C、MapReduce是一个串行的编程模型D、MapReduce来源于Google的学术论文答案:C103.下列命令中(在zookeeper安装文件夹的bin目录下执行),哪项是停止ZooKeeper的正确命令()A、start-all.shB、start-stop.shC、zkServer.shstopD、zkServer.shstart答案:C104.在启动hadoop集群以后,查看jps进程有几个?A、3个B、4个C、5个D、6个答案:D105.在Java中,InetAddress类中哪个方法可以获取主机IP地址A、isReachable()B、getHostAddress()C、getHostName()D、getByName()答案:B106.下面哪一个不是数据集成组件?A、ApacheB、FlumeC、SqoopD、Hbase答案:D107.关于大数据的价值密度描述正确的是以下哪个?A、大数据由于其数据量大,所以其价值也大。B、大数据由于其数据量大,所以其价值密度低。C、大数据的价值密度是指其数据类型多且复杂。D、大数据由于其数据量大,所以其价值密度高。答案:B108.在HBase的组件中,哪一个负责日志记录()A、HRegionB、HFileC、MemStoreD、WAL答案:D109.下列说法错误的是?A、RDD(ResillientDistributedDataset)是运行在工作节点(WorkerNode)的一个进程,负责运行TaskB、Application是用户编写的Spark应用程序C、一个Job包含多个RDD及作用于相应RDD上的各种操作D、DirectedAcyclicGraph反映RDD之间的依赖关系答案:A110.在Java中,运行下列程序,会产生什么结果publicclassXextendsThreadimplementsRunable{//1publicvoidrun(){//2System.out.println("thisisrun()");//3}publicstaticvoidmain(Stringargs[])//4{Threadt=newThread(newX());//5t.start();//6}}A、第一行会产生编译错误B、第六行会产生编译错误C、第六行会产生运行错误D、程序会运行和启动答案:D111.HBase依靠___存储底层数据。A、HDFSB、HadoopC、MemoryD、MapReduce答案:A112.HDFS默认的当前工作目录是/user/$USER,的值需要在哪个配置文件内说明A、mapred-site.xmlB、core-site.xmlC、hdfs-site.xmlD、以上均不是答案:B113.在java中使用dom4j创建添加元素节点的方法是A、createElement()B、addElement()C、addAttribute()D、setText()答案:B114.配置Hadoopha文件参数时,JAVA_HOME包含在哪一个配置文件中()A、hadoop-default.xmlB、hadoop-env.shC、hadoop-site.xmlD、configuration.xsl答案:B115.ZooKeeper集群的机器数量一般有什么要求?A、一般为单数台机器B、一般为双数台机器C、一般没有要求D、有要求,但要求不高答案:A116.在Java中,为了从文本文件中逐行读取内容,应该使用哪个处理流对象?A、BufferedReaderB、BufferedWriterC、BufferedlnputstreamD、Bufferedoutputstream答案:A117.在Python中,可以采用“模块”的方式来组织代码,以下描述正确的是:A、使用模块可能导致函数名和变量名冲突。B、相同名字的函数和变量完全可以分别存在不同的模块中。C、相同名字的函数和变量完全可以存在相同同的模块中。D、不同名字的函数和变量必须分别存在不同的模块中。答案:B118.当客户端从HDFS文件系统上读取数据时,以下哪个说法正确?A、从namenode上得到数据块位置B、从namenode上得到数据C、从namenode上得到数据和数据块位置D、从datanode上得到数据块位置答案:A119.MapReduce默认的输出格式是()A、SequenceFileOutputFormatB、TextOutputFormatC、NullOutputFormatD、MapFileOutputFormat答案:B120.hadoop中,下面关于向文件系统中添加一个文件的过程,错误的是()A、需要创建路径的父目录B、需要创建一个新的INode文件C、将新的INode文件加入到namespace中去D、将所有操作记录到EditLog中去答案:D121.在Storm的软件架构中,______由Hadoop平台提供,是整个集群状态同步协调的核心组件。A、主控程序NimbusB、集群调度器ZookeeperC、工作节点控制程序SupervisorD、工作进程Worker答案:B122.启动ZooKeeper服务的命令是什么?A、zk.shB、zkServer-all.shC、zkServer.shD、zkServer.shstart答案:D123.在Java中,下列()方法和resume()方法相互搭配,使线程停止执行,然后调用resume()方法恢复线程。A、interrupt()B、stop()C、suspend()D、yield()答案:C124.关于Hadoop单机模式和伪分布式的说法正确的是()A、两者都启动守护进程,且守护进程运行在一台机器上B、单机模式不使用HDFS,但加载守护进程C、两者都不与守护进程交互,避免复杂性D、后者比前者增加了HDFS输入输出以及可检查内存使用情况答案:D125.在MapReduce程序中,Mapper模块中的自定义类MyMapper继承自()父类。A、MapperB、ReducerC、CombinerD、Partitioner、答案:A126.关于MapReduce1.0的体系结构的描述,下列说法错误的是?A、Task分为MapTask和ReduceTask两种,分别由JobTracker和TaskTracker启动B、slot分为Mapslot和Reduceslot两种,分别供MapTask和ReduceTask使用C、TaskTracker使用“slot”等量划分本节点上的资源量(CPU、内存等)D、TaskTracker会周期性接收JobTracker发送过来的命令并执行相应的操作(如启动新任务、杀死任务等)答案:A127.使用jar操作运行Hadoop中自带的jar进行单词的统计()A、cd-jarhadoop/share/hadoop/mapreduce/B、cdhadoop/share/hadoop/mapreduce/C、cdjar/hadoop/share/hadoop/mapreduce/D、cd/hadoop/share/hadoop/mapreduce/答案:B128.使用put操作将“hello”文件上传到HDFS的根目录命令为()A、hadoop-puthello/helloB、hadoopfs-puthello/helloC、hodoopfs-put/helloD、Hadoop-put/hello答案:B129.MapReduce框架的核心步骤主要是()A、MapB、ShuffleC、ReduceD、Map和Reduce答案:D130.在Python中,pymysql连接数据库获取数据库连接时,端口号错误的堆栈信息是?A、Unknowndatabase'test'B、Accessdeniedforuser'root'@'localhost'(usingpassword:YES)C、NoneType'objecthasnoattribute'encoding'D、Can'tconnecttoMySQLserveron'localhost'([WinError10061]答案:D131.哪个不是Hive适用的场景?()A、实时的在线数据分析B、数据挖掘(用户行为分析,兴趣分区,区域展示)C、数据汇总(每天/每周用户点击数,点击排行)D、非实时分析(日志分析,统计分析)答案:A132.以下选项哪个命令可以生成公钥()A、ssh-keygenB、ifupteam0C、nmclidevD、nmcliconsh答案:A133.在Java中,关于OutputStream描述正确的是A、字节输出流B、字节输入流C、字符输出流D、字符输入流答案:A134.在Python程序中,关于异常捕捉说法正确的是A、except后面必须带异常类型B、except后面可以不带任何异常类型C、except后面带异常类型才能捕捉所有异常D、except后面不带任何异常类型也可以识别出具体的异常信息答案:B135.在ZooKeeper中有三种角色,下列选项中不属于ZooKeeper中的角色()A、ObserverB、LeaderC、ObeyerD、Follower答案:C136.一个gzip文件大小75MB,客户端设置Block大小为64MB,请我其占用几个Block?A、1B、2C、3D、4答案:B137.Hadoop是一个用()语言实现的框架A、C语言B、PythonC、JavaD、R语言答案:C138.配置Hadoop时,JAVA_HOME包含在哪一个配置文件中A、hadoop-default.xmlB、hadoop-env.shC、hadoop-site.xmlD、Configuration.xsl答案:B139.map中环形缓冲区的大小是由下列哪个属性决定的()A、io.sort.spill.percentB、io.sort.factorC、io.sort.mbD、mapred.reduce.parallel.copies答案:C140.Hadoop的作者是下面哪一位()A、MartinB、DougC、KentD、Grace答案:B141.相比依赖于小数据和精确性的时代,大数据因为更强调数据的(),帮助我们进一步接近事实的真相。A、安全性B、完整性C、混杂性D、完整性和混杂性答案:D142.数据建模中,__________模型,给出更多的数据试题细节,包括主键、外键等形式来描述。A、概念B、数据C、逻辑D、物理答案:C143.下面与HDFS类似的框架是()A、NTFSB、FAT32C、GFSD、EXT3答案:C144.下面哪个不是Hadoop的输出数据格式()A、文本输出B、二进制输出C、单一输出D、多输出答案:C145.关于YARN的说法错误的是?A、YARN可以支持除了MapReduce之外的其他计算框架B、YARN是YetAnotherResourceNegotiator的缩写C、YARN可以为上层应用提供统一的资源管理和调度D、YARN不是通用的资源管理器答案:D146.在Java中,File类提供的方法中,哪个方法可以获取一个目录下所有子文件对象A、list()B、getChildren()C、getFiles()D、listFiles()答案:D147.显示磁盘使用率,以人类可读的形式的命令是:A、duB、B.dfC、C.df-hD、D.cd答案:C148.在Java中,以下不是产生死锁的必要条件的是A、开启了多个线程B、线程间存在多个共享资源C、使用了线程同步D、继承了Thread类答案:D149.下面关于Shuffle过程的分区描述正确的是()A、可以通过继承Partitioner类实现自定义分区B、默认情况,MapReduce没有使用分区C、分区和不分区都一样。D、只能通过继承Partitioner类实现将数据输出到多个文件答案:A150.在MapReduce中,下面哪个阶段是并行进行的()A、Shuffle和MapB、Shuffle和SortC、Reduce和SortD、Map和Sort答案:B151.下面对SecondaryNameNode第二名称节点的描述,哪个是错误的?A、SecondaryNameNode一般是并行运行在多台机器上B、它是用来保存名称节点中对HDFS元数据信息的备份,并减少名称节点重启的时间C、SecondaryNameNode通过HTTPGET方式从NameNode上获取到FsImage和EditLog文件,并下载到本地的相应目录下D、SecondaryNameNode是HDFS架构中的一个组成部分答案:A152.大数据不是要教机器像人一样思考。相反,它是()A、把数学算法运用到海量的数据上来预测事情发生的可能性B、被视为人工智能的一部分C、被视为一种机器学习D、预测与惩罚答案:A153.配置Hadoop时,JAVA_HOME包含在哪一个配置文件中A、hadoop-default.xmlB、hadoop-env.shC、hadoop-site.xmlD、configuration.xs答案:B154.Hadoopfs中的-get和-put命令操作对象是A、文件B、目录C、两者都是D、以上都不对答案:C155.()可以为远程客户端提供执行Hive查询服务。A、MetastoreServerB、HiveServer2C、BeelineCLID、MySQL答案:B156.下列关于Hive的说法中,描述错误的是()。A、是基于Hadoop的一个数据仓库工具B、可以将非结构化数据文件映射成一张表C、提供了简单的SQL查询功能D、可以将SQL语句装换成MapReduce作业运行答案:B157.下列描述说法错误的是?()A、SecureCRT是一款支持SSH的终端仿真程序,它能够在Windows操作系统上远程连接Linux服务器执行操作。B、Hadoop是一个用于处理大数据的分布式集群架构,支持在GNU/Linux系统以及Windows系统上进行安装使用。C、VMwareWorkstation是一款虚拟计算机的软件,用户可以在单一的桌面上同时操作不同的操作系统。D、SSH是一个软件,专为远程登录会话和其他网络服务提供安全性功能的软件。答案:D158.下列关于Spark的描述,错误的是哪一项?A、Spark最初由美国加州伯克利大学(UCBerkeley)的AMP实验室于2009年开发B、Spark在2014年打破了Hadoop保持的基准排序纪录.C、Spark用十分之一的计算资源,获得了比Hadoop快3倍的速度D、Spark运行模式单一答案:D159.()是Hadoop系统核心组件之一,主要解决海量数据的计算。A、HDFSB、MapReduceC、SparkD、HBase答案:B160.Hadoop起始于以下哪个阶段?A、2004年,Nutch的开发者开发了NDFS。B、2004年,Google发表了关于MapReduce的论文。C、2002年,Apach项目的Nutch。D、2003年,Google发布了GFS论文。答案:C161.在Java中,下面哪个选项会直接引起线程停止执行?A、从一个同步语句块中退出来B、调用一个对象的wait方法C、调用一个输入流对象的read方法D、调用一个线程对象的setPriority方法答案:B162.在Python中,面向对象中的特殊成员以及应用场景描述正确的是:A、__del__析构方法,对应着一个对象的删除之后执行的内容B、__del__析构方法,对应着一个对象的删除之前执行的内容C、__repr__:和repr()%r不相关,但在没有__str__方法时,__repr__可以完全取代__str__。D、__repr__:和repr()%r都是息息相关的,在没有__str__方法时,__repr__不可以完全取代__str__。答案:B163.在MapReduce中,哪个组件是用户不指定也不会有默认的?A、OutputFormatB、CombinerC、PartitionerD、InputFormat答案:B164.以下哪一项不属于Hadoop可以运行的模式()A、单机模式B、伪分布式模式C、互联模式D、分布式模式答案:C165.在mapreduce任务中,下列哪一项会由hadoop系统自动排序()A、keysofmapper'soutputB、valuesofmapper'soutputC、keysofreducer'soutputD、valuesofreducer'soutput答案:A166.下面那个类型实现了Writable接口,以便用这些类型定义的数据可以被序列化进行网络传输和文件存储()A、IntB、DoubleC、LongD、Text答案:D167.Hadoop完全分布模式配置免密登录是要?A、实现主节点到其他节点免密登录B、实现从节点到主节点的免密登录C、主节点和从节点任意两个节点之间免密登录D、以上都不是答案:C168.HDFS是基于流数据模式访问和处理超大文件的需求而开发的,默认的最基本的存储单位是64M,具有高容错、高可靠性、高扩展性、高吞吐率等特征,适合的读写任务是A、一次写入,少次读写B、多次写入,少次读写C、一次写入,多次读写D、多次写入,多次读写答案:C169.在确认客户需求,进行确认需求调研的时候,以下说法正确的是()。A、.按计划有步骤的确定客户需求调研。B、先了解细节需求,再了解宏观需求C、将客户的想法记录下来,就能解决客户的实际问题D、确定客户需求调研的过程中,不可避免的会出现客户提出一些现有条件下根本无法实现或者即使实现也非常困难的要求,我们要无条件去满足客户的需求。答案:A170.在流计算系统模型中,分布式系统常用____________来表征计算流程或计算模型。A、无项循环图B、有向循环图C、无向非循环图D、有向非循环图答案:D171.在Linux中,按照文件名查找文件,需要使用的命令是A、findB、fileC、catD、echo答案:A172.Hive查询语言和SQL的一个不同之处在于哪一个操作?A、GroupB、JoinC、PartitionD、Union答案:C173.下列不属于分布式数据库系统的是()。A、HBaseB、BigTableC、NoSQLD、SQLServer答案:D174.在Linux中,想得到文件的类型,需要输入的命令是A、catB、fileC、echoD、find答案:B175.在Linux系统中新增一个新组group2,同时指定新组的组标识号是101,命令是()A、groupadd-r101group2B、groupadd-o101group2C、groupadd-g101group2D、groupadd-p101group2答案:C176.要在HDFS的根目录中建立一个叫hadoo的目录,下面哪一条命令是正确的()A、mkdirhadooB、mkdir/hadooC、hadoopmkdirhadooD、hadoopfs-mkdir/hadoo答案:D177.HDFS有一个gzip文件大小75MB,客户端设置Block大小为64MB。当运行mapreduce任务读取该文件时inputsplit大小为?A、一个map读取64MB,另外一个map读取11MBB、128MBC、64MBD、75MB答案:D178.在Python中,构造方法是类的一个特殊方法,Python中它的名称为:A、与类同名B、_constructC、__init__D、init答案:C179.下列关于split叙述正确的一项是________。A、当单个StoreFile大小小于一定的阙值后触发B、把当前的Region分裂成2个子RegionC、子Region会被Master分配到不同的RegionServer上D、是HBase提供的超载机制答案:B180.关于Storm流计算叙述不正确的一项为________。A、Storm是一种NativeStreamProcessingSystem,即对流数据的处理是基于每条数据进行B、Storm其并行计算是基于有Spout和Bolt组成的有向拓扑图ToPology来实现C、Topology:定义了串行计算的逻辑模型(或者称抽象模型),也即从功能和架构的角度设计了计算的步骤和流程。D、Topology里的Spout和Bolt的功能是靠worker节点上的Task来实现答案:C181.shuffle的意思是()A、沙发B、洗牌C、拆分D、散乱答案:B182.在HBase物理存储结构中,region按大小分割的,每个表一开始有________region。A、一个B、两个C、三个D、不确定答案:A183.关于基于Hadoop的MapReduce编程的环境配置,下面哪一步是不必要的()A、安装linux或者在Windows下安装CgywinB、安装javaC、安装MapReduceD、配置Hadoop参数答案:C184.以下哪个技术与大数据无关A、云技术B、B.分布式处理技术C、C.存储技术D、D.物联网技术答案:D185.下列命令中(在zookeeper安装文件夹的bin目录下执行),哪项是停止ZooKeeper的正确命令()A、start-all.shB、start-stop.shC、zkServer.shstopD、zkServer.shstart答案:C186.第一次信息化浪潮主要解决什么问题?A、信息传输B、信息处理C、信息爆炸D、信息转换答案:B187.在HDFS中,NameNode的主要功能是什么?A、维护了blockid到datanode本地文件的映射关系B、存储文件内容C、文件内存保存在磁盘中D、存储元数据答案:D188.下面关于主服务器Master主要负责表和Region的管理工作的描述,哪个是错误的?A、在Region分裂或合并后,负责重新调整Region的分布B、对发生故障失效的Region服务器上的Region进行迁移C、管理用户对表的增加、删除、修改、查询等操作D、不支持不同Region服务器之间的负载均衡答案:D189.MapReduce的Shuffle过程以下中哪个操作是最后做的?A、合并B、排序C、分区D、溢写答案:A190.MapReduce程序最后输出的结果通常都是按键值进行排序的,那么排序工作发生在MapReducer执行过程中的(B)阶段。A、MapB、ShuffleC、ReduceD、Combiner答案:B191.下列哪个关于StreamGroupings的描述,有误的是?A、FieldsGrouping:广播发送,每一个Task都会收到所有的TupleB、GlobalGrouping:全局分组,所有的Tuple都发送到同一个Task中C、NonGrouping:不分组,和ShuffleGrouping类似,当前Task的执行会和它的被订阅者在同一个线程中执行D、DirectGrouping:直接分组,直接指定由某个Task来执行Tuple的处理答案:A192.在Java中,一个java程序至少包含()条线程A、1B、2C、3D、4答案:B193.下列哪些不是ZooKeeper的特点()A、顺序一致性B、原子性C、多样系统映像D、可靠性答案:C194.在Java中,若要创建一个新的含有父目录的目录,应该使用下列哪一个类的实例A、FileWriterB、FileOutputStreamC、FileD、以上都对答案:C195.YARN的调度器不包括以下哪种?A、FIFOSchedulerB、FairSchedulerC、CapacitySchedulerD、StackScheduler答案:D196.Namenode在启动时自动进入安全模式,在安全模式阶段,说法错误的是?A、安全模式目的是在系统启动时检查各个DataNode上数据块的有效性B、文件系统允许有修改C、根据策略对数据块进行必要的复制或删除D、当数据块最小百分比数满足的最小副本数条件时,会自动退出安全模式答案:B197.在CentoOS中,系统默认的对整个系统拥有完全控制权的用户是:A、rootB、B.guestC、C.administratorD、D.supervisor答案:A198.默认端口50070的作用是()。A、查看HDFS监控B、查看YARN监控C、查看日志监控D、不确定答案:A199.下列关于Map/Reduce并行计算模型叙述正确的一项为________。A、Map/Reduce把待处理的数据集分割成许多大的数据块B、大数据块经Map()函数并行处理后输出新的中间结果C、reduce()函数把多任务处理后的中间结果进行汇总D、reduce阶段的作用接受来自输出列表的迭代器答案:C200.以下对Flume架构描述不正确的是()A、Flume的核心就是AgentB、Sink负责将数据发送到外部指定的目的地C、Source接收到数据之后,将数据发送给SinkD、Channel作为一个数据缓冲区会临时存放一些数据答案:C201.当提交某个MapReduce任务后,在任务列表中显示该任务的状态(state)值为“ACCEPTED"这表示()A、正在接受中B、正在执行中C、等待执行中D、任务恢复中答案:C202.在Centos7中,如果想要查看本机的主机名可以使用下面哪个命令?A、rebootB、hostnameC、pwdD、tail答案:B203.关于MapReduce中的键值对,下面陈述正确的是()A、Key类必须实现WritableB、Key类必须实现WritableComparableC、Value类必须实现WritableComparableD、Value类必须继承WritableComparable答案:B204.客户端从Zookeeper获取Region的存储位置信息后,直接在_______上读写数据。A、ZookeeperB、HMasterC、RegionServerD、HLog答案:C205.下列选项中,不属于Zookeeper提供的功能的是()。A、配置维护B、命名服务C、分布式同步D、日志采集答案:D206.Hadoop2.x版本中的数据块大小默认是多少?()A、64MB、128MC、256MD、512M答案:B207.下列关于Storm设计思想,描述有误的是?A、Storm将Streams的状态转换过程抽象为SpoutB、Storm认为每个Stream都有一个源头,并把这个源头抽象为SpoutC、Storm将Spouts和Bolts组成的网络抽象成TopologyD、Topology里面的每个处理组件(Spout或Bolt)都包含处理逻辑,而组件之间的连接则表示数据流动的方向答案:A208.结构化的数据,先有________,再有_________.A、数据结构B、结构数据C、内容结构D、结构内容答案:B209.下列选项描述错误的是?()A、HadoopHA即集群中包含SecondaryNameNode作为备份节点存在。B、ResourceManager负责的是整个Yarn集群资源的监控、分配和管理工作C、NodeManager负责定时的向ResourceManager汇报所在节点的资源使用情况以及接收并处理来自ApplicationMaster的启动停止容器(Container)的各种请求。D、初次启动HadoopHA集群时,需要将格式化文件系统后的目录拷贝至另外一台NameNode节点上。答案:A210.请问在Hadoop体系结构中,按照由下到上顺序,排列正确的是()PigHiveCrunch都是运行在MapReduce,Spark,或者Tez之上的处理框架Avro是一个克服了Writable部分不足的序列化系统A、CommonHiveHDFSB、CommonMapReducePigC、HDFSMapReduceHBaseD、HDFSAvroHBase答案:B211.如果想要修改集群的备份数量,可以修改下面哪个配置文件?A、hdfs-site.xmlB、core-site.xmlC、mapred-site.xmlD、hadoop-env.sh答案:A212._______模式,多个Hive用户通过网络连接到数据库。A、单用户模式B、多用户模式C、多用户远程模式D、单用户远程模式答案:B213.以下情况除哪项发生时balancer便会自动退出()A、集群平衡或者没有数据块可以移动B、在连续三次迭代中没有块移动C、与namenode传输时发生异常D、另一个balancer在运行答案:A214.在海量数据中,Dynamo的存储是按照什么策略来进行的?A、消息代理B、传统的存储放置策略C、一致性哈希算法D、异步复制答案:C215.大数据的分布式计算使用下面哪项技术?()A、HDFSB、MapReduceC、NutchD、Hive答案:B216.Mapper类的四个参数,下列那个有错()A、LongWritable,Text,Text,TextB、LongWritable,Text,Text,IntWritableC、Text,Text,Text,TextD、LongWritable,Text,Text,NullWritable答案:C217.HDFS有一个LZO(withindex)文件大小75MB,客户端设置Block大小为64MB。当运行mapreduce任务读取该文件时inputsplit大小为?A、64MBB、75MBC、一个map读取64MB,另外一个map读取11MBD、没有读取到答案:C218.在Java中,关于Xml的文档结构描述错误的是A、一个基本的Xml文档通常由序言和文档元素两部分组成B、Xml文档中的序言可以包括Xml声明、处理指令和注释C、Xml文档中的元素以树形结构排列D、Xml文档的声明必须要写答案:D219.下面哪些不是引起Spark负载不均的原因?()A、Spark读入的数据源是倾斜的B、Shuffle阶段Key值过于集中C、在数据过滤阶段需要处理的数据量差异D、Spark的运行方式差异答案:D220.在Java中,下列关于Thread类提供的线程控制方法的说法中,错误的一项是A、在线程A中执行线程B的join()方法,则线程A等待直到B执行完成B、线程A通过调用interrupt()方法来中断其阻塞状态C、可以通过创建类implementsThread实现多线程D、currentThread()方法返回当前线程的引用答案:C221.在Python中,()语句隐藏了一个包含了关闭的逻辑,类似try…catchA、whereB、withC、yieldD、contextlib答案:B222.大数据的4V特征是指?A、数据量大(Volume)、类型繁多(Variety)、价值密度低(Value)、技术发展速度快(Velocity)B、数据量大(Volume)、类型繁多(Variety)、价值密度低(Value)、处理速度快(Velocity)C、数据量大(Volume)、类型繁多(Variety)、价值密度高(Value)、数据产生速度快(Velocity)D、数据量大(Volume)、类型繁多(Variety)、价值密度低(Value)、数据变化速度快(Velocity)答案:B223.下面哪个进程负责MapReduce任务调度。A、NameNodeB、JobtrackerC、TaskTrackerD、secondaryNameNode答案:B224.在Java中,运行下列程序,会产生的结果是publicclassXimplementsRunnable{//1publicvoidrun(){//2System.out.println(“thisisrun()”);//3}publicstaticvoidmain(String[]args)//5{Xt=newX();//6t.start();//7}}A、第一行会发生编译错误B、第七行会发生编译错误C、第七行会发生运行错误D、程序会运行和启动答案:B225.Client端上传文件到HDFS上的时候下列正确的是()A、数据经过NameNode传递给DataNodeB、数据副本将以管道的方式依次传递C、Client将数据写到一台DataNode上,并由Client负责完成Block复制工作D、当某个DataNode失败,客户端不会继续传给其它的DataNode答案:B226.设计分布式数据仓库hive的数据表时,为取样更高效,一般可以对表中的连续字段进行什么操作。A、分区B、索引C、分表D、分桶答案:D227.下列关于HDFS的描述,哪个不正确?A、HDFS还采用了相应的数据存放、数据读取和数据复制策略,来提升系统整体读写响应性能B、HDFS采用了主从(Master/Slave)结构模型C、HDFS采用了冗余数据存储,增强了数据可靠性D、HDFS采用块的概念,使得系统的设计变得更加复杂答案:D228.Spark生态系统组件SparkStreaming的应用场景是?A、基于历史数据的数据挖掘B、图结构数据的处理C、基于历史数据的交互式查询D、基于实时数据流的数据处理答案:D229.非关系型数据库不包括()。A、HBaseB、MapreduceC、Neo4jD、MongoDB答案:B230.在分布式并行计算体系中,________采用多个指令流同时处理多个数据流。A、SISDB、SIMDC、MISDD、MIMD答案:D231.下列哪项通常是集群的最主要的瓶颈()A、CPUB、网格C、磁盘IOD、内存答案:C232.在Linux中,需要统计test.txt文件的行数,使用的命令是A、wc-ltest.txtB、who>test.txtC、echo“helloworld”>test.txtD、echo“hello:world”>>test.txt答案:A233.在Python中,pymysql.connect()方法不包含的参数是A、method=‘get’B、host='<数据库IP地址>'C、user='<用户名>'D、passwd='<密码>'答案:A234.在Linux中,usermod命令无法实现的操作是()A、账户重命名B、删除指定的账户和对应的主目录C、锁定和解锁用户账户D、对用户密码进行锁定或解锁答案:B235.Hadoop的哪个包的功能是表示层,将各种数据编码/解码,方便在网络上传输()A、fsB、ipcC、ioD、net答案:C236.在Java中,关于Xml描述错误的是A、Xml是可扩展标记语言B、Xml主要用于提供数据表述格式C、Xml的可扩展性不强D、Xml主要用于不同应用程序间的数据交换答案:C237.HBase是分布式列式存储系统,记录按什么集中存放。A、列B、列族C、行D、不确定答案:B238.大数据平台操作演示不包括()A、在大数据平台操作演示前需要做好准备工作B、分析本次演示的目的和听众群体C、实现呈现技巧提升D、准备好演示环境答案:C239.下列描述中,哪项不属于Sqoop的缺点()A、无法控制任务的并发度B、格式紧耦合C、安全机制不够完善D、connector必须符合JDBC模型答案:A240.在Python中,关于try-finally语句说法正确的是A、触发异常时执行finally中的代码B、无论是否异常都会执行finally中的代码C、触发异常时不执行finally中的代码D、必须使用finally语句处理异常答案:B241.当讨论hdfs通信的时候,通信发生在以下服务之间,下列说法正确的是。A、Client-NameNode之间,其中NameNode是客户端B、Client-DataNode之间,其中DataNode是客户端C、DataNode-NameNode之间,其中NameNode是服务端D、DataNode-DataNode之间,其中DataNode都是客户端答案:C242.哪种调度器是YARN中默认的资源调度器?A、FIFOSchedulerB、CapacitySchedulerC、FairSchedulerD、以上都不是答案:B243.下列哪项通常是集群的最主要瓶颈()A、CPUB、网络C、磁盘IOD、内存答案:C244.在一个Hadoop集群中有多少个JobTrackerdaemon?A、一个B、两个C、每个slave节点一个D、每个slave节点两个答案:A245.下面描述正确的是()A、rwxr-x的数字表示是750。B、rw-r-x的数字表示是530。C、rw-rw-r--的数字表示是655。D、rwxr的数字表示是740。答案:D246.2004年,Google公司发表了主要讲解海量数据的高效计算方法的论文是?A、“TheGoogleFileSystem”B、“MapReduce:SimplifiedDataProcessingonLargeClusters”C、“Bigtable:ADistributedStorageSystemforStructuredData”D、“TheHadoopFileSystem”答案:B247.面关于MapReduce模型中Map函数与Reduce函数的描述正确的是()A、一个Map函数就是对一部分原始数据进行指定的操作B、一个Map操作就是对每个ReD.uce所产生的一部分中间结果进行合并操作C、Map与Map之间不是相互独立的D、Reducee与Reduce之间不是相互独立的答案:A248.下列关于Hive描述正确的是()。A、hive学习成本低,支持标准的SQL语法B、hive运行效率高,延迟低C、HQL有较好的表达能力D、Hive支持迭代计算答案:A249.配置Hadoop文件参数时,配置项“dfs.replication”应该配置在哪个文件?()A、core-site.xmlB、hdfs-site.xmlC、mapred-site.xmlD、yarn-site.xml答案:B250.在Python中,pymysql连接数据库获取数据库连接时,密码错误的堆栈信息是?A、Unknowndatabase'test'B、Accessdeniedforuser'root'@'localhost'(usingpassword:YES)C、NoneType'objecthasnoattribute'encoding'D、Can'tconnecttoMySQLserveron'localhost'([WinError10061]答案:B251.MapReduce编程模型中,以下组件哪个是最后执行的?A、MapperB、PartitionerC、ReducerD、RecordReader答案:C252.在Python中,关于Python声明变量的规则错误的是A、不能用数字开头B、不能是python的关键字C、让变量名尽量有意义些D、不能带有下划线等特殊符号答案:D253.下列哪个不属于NoSQL数据库的特点?A、灵活的可扩展性B、灵活的数据模型C、与云计算紧密融合D、数据存储规模有限答案:D254.在高阶数据处理中,往往无法把整个流程写在单个MapReduce作业中,下列关于链接MapReduce作业的说法,不正确
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2026年儿科常见疾病诊疗培训题库综合试卷及参考答案详解(能力提升)
- 北京2025年北京第五实验学校公开招聘笔试历年参考题库附带答案详解(5卷)
- 2026年高职老年照护技术考前冲刺测试卷带答案详解(培优)
- 2026年西方经济学精要本第三版贵州财经大学期末能力检测试卷含答案详解【模拟题】
- 2026年电网理论与技术题库综合试卷必考附答案详解
- 2026青海海北州祁连城市建设投资发展有限公司下属公司招聘9人笔试历年参考题库附带答案详解
- 2026广西南宁上林县振林投资发展集团有限责任公司招聘2人笔试历年参考题库附带答案详解
- 2026山东佛士特环保处置有限公司(国有控股企业)招聘13人笔试历年参考题库附带答案详解
- 2025陕西西安建工绿色建筑集团有限公司3月招聘笔试历年参考题库附带答案详解
- 2025贵州遵义市仁怀市国有教育医疗投资经营有限公司招聘2人笔试历年参考题库附带答案详解
- 装配式混凝土箱梁桥设计与施工技术规范DB41-T 1847-2019
- 规范信访基础业务培训
- 分汽缸安装施工方案
- 悬索桥毕业设计(小跨吊桥设计)
- DL∕T 1928-2018 火力发电厂氢气系统安全运行技术导则
- 2024年贵州六盘水市公安局合同制留置看护人员招聘笔试参考题库附带答案详解
- 银行资产配置方案
- 安捷伦GC仪器操作步骤
- GFM阀控密封铅酸蓄电池安装维护手册
- 牙体代型制备与修整(口腔固定修复工艺课件)
- 美学第六讲日常生活美
评论
0/150
提交评论