Hadoop大数据技术与项目实战智慧树知到答案章节测试2023年山西职业技术学院_第1页
Hadoop大数据技术与项目实战智慧树知到答案章节测试2023年山西职业技术学院_第2页
Hadoop大数据技术与项目实战智慧树知到答案章节测试2023年山西职业技术学院_第3页
Hadoop大数据技术与项目实战智慧树知到答案章节测试2023年山西职业技术学院_第4页
免费预览已结束,剩余6页可下载查看

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

绪论单元测试下列对大数据的特点描述不正确的是()

A:速度要求快

B:数据类型多样

C:数据体量巨大

D:价值密度高

答案:D第一章测试云主机和物理机的寿命都是永久性的。()

A:对

B:错

答案:B对于实时性要求高的应用,需要应用实时处理架构。()

A:对

B:错

答案:A数据仓库是用来存储数据的而不是分析数据的。()

A:错

B:对

答案:A在DWS层中,用户行为日志数据分为公共字段和事件字段。()

A:错

B:对

答案:B项目实施流程中没有哪一步()

A:数据仓库设计开发

B:数据导出

C:下载数据

D:数据访问

答案:C数据分析在企业中的作用()

A:帮助企业经营者平衡企业的收益

B:直接的获取经营的利润

C:干预经营者的决策

D:帮助企业经营者减少投入

答案:B数据结构中哪项不是页面入口的来源()

A:push

B:应用首页

C:登录页

D:详情页

答案:CHadoop的三大发行版本是()

A:HDP

B:Java

C:CDH

D:Apache

答案:ACD流量分析常见指标有哪些方面()

A:转化路径分析

B:来源分析

C:访客分析

D:受访分析

答案:ABCD网站流量数据分析的意义有哪些()

A:帮助提高网站流量

B:帮助网站运营人员获取网站流量信息

C:提升网站用户体验

D:从多方面提供网站分析的数据依据

答案:ABCD第二章测试Hadoop是一种分布式系统基础架构,主要解决海量数据存储和海量数据计算两大问题。()

A:对

B:错

答案:A在HDFS配置文件中,主要配置的就是hdfs-site.xml配置文件。()

A:对

B:错

答案:A在Hadoop分布式集群中,不需要对集群中的每一个节点都进行ip规划。()

A:错

B:对

答案:A利用HDFS操作命令可以将数据文件从本地上传到HDFS上,也可以将数据文件从HDFS下载到本地。()

A:对

B:错

答案:A在HDFSAPI操作中,closeFileSystem方法的功能是释放文件系统对象的资源。()

A:对

B:错

答案:AMapReduce词频统计案例中,执行map任务的最后阶段,会将缓冲区的数据全部写入到磁盘。()

A:对

B:错

答案:AFlume是Cloudera公司提供的一款高可用、高可靠、分布式的系统,可用于海量日志采集、聚合和传输。()

A:对

B:错

答案:A能在网络中安全传输文件的软件是()。

A:Xftp

B:Xshell

C:VMware

D:IDEA

答案:A创建了bigdata用户的命令是()。

A:bigdataALL

B:useraddbigdata

C:Sudoers

D:subigdata

答案:B论文(),主要论证的核心是如何采用分布式的架构对海量数据进行分布式计算。

A:HDFS

B:MapReduce

C:BigTable

D:GFS

答案:B假如我们设定HDFS块的大小是128M,那么,一个大小为500M的数据文件,将会被拆分成()个分片

A:2

B:5

C:4

D:3

答案:C在Linux命令行中,使用()命令格式化hive元数据库

A:del

B:clear

C:format

D:schematool

答案:D在Hive中给表添加数据,使用()方式给表添加数据效率更高。

A:append

B:Add

C:insertinto

D:Load

答案:D关系型数据库与HDFS之间相互数据迁移的工具是()。

A:fastcopy

B:sqoop

C:fsck

D:distcp

答案:BNotepad++功能有()。

A:编写计算机程序代码

B:可以连接虚拟机,对虚拟机中的文件进行编辑。

C:制作一般的纯文字说明文件

D:语法高亮度显示、语法折叠功能、支持宏、扩充基本功能的外挂模组

答案:ABCDHadoop主要包含()三大功能组件。

A:HDFS

B:Hadoop

C:MapReduce

D:YARN

答案:ACDHadoop具有()优势。

A:高容错性

B:高效性

C:高扩展性

D:高可靠性

答案:ABCD下面说法正确的是()。

A:Java编程的核心就是JVM,JVM是JRE的一部分,它是一个虚拟出来的计算机。

B:JDK包含JRE和JVM

C:JRE是java运行时的类库

D:JDK是Java语言的开发环境

答案:ABCD在分布式文件系统HDFS当中提供了两种操作命令,是()。

A:hdfsdfs

B:Hadoopdfs

C:hdfsfs

D:hadoopfs

答案:ADHive是基于Hadoop技术的数据仓库工具,用来对数据进行()。

A:提取

B:转化

C:加载

D:分析

答案:ABCD使用beeline客户端远程访问Hive之前,需要启动的两个服务是()。

A:hive–servicemetastore

B:hive–servicehiveserver

C:hive–servermetastore

D:hive–servicehiveserver2

答案:CDHive的复杂数据类型有()三种

A:STRUCT

B:ARRAY

C:Char

D:MAP

答案:ABD成功安装Zookeeper集群后,查看各节点的角色信息时,会看到1个、多个()。

A:zookeeper

B:leader

C:follower

D:zkServer

答案:BCKafka是一种高吞吐量的分布式发布订阅消息系统,是Apache基金会开源的消息队列,该框架由()编写而成。

A:Java

B:C++

C:Scala

D:Python

答案:AC第三章测试业务字段指的是每个移动端固定的、共有的字段;公共字段代表的是用户在app中执行过的所有操作。()

A:对

B:错

答案:B在Flume过程中,Flume对接本地磁盘文件,通过tailDir类型实时监控当前数据文件中数据内容的变化。()

A:错

B:对

答案:BETL拦截器主要用于过滤时间戳不合法和json数据不完整的日志。()

A:对

B:错

答案:AFlume分流标记拦截器主要是用于区分启动日志和事件日志。()

A:对

B:错

答案:A以下关于Flume的说法正确的是____。()

A:Sink是Flume数据传输的基本单元

B:Source是Flume数据传输的基本单元

C:Channel是Flume数据传输的基本单元

D:Event是Flume数据传输的基本单元

答案:DFlume通过内部的采集数据传输机制进行快速的数据传输,传输完之后会将数据就存储到____中。()

A:Source

B:Channel

C:Kafka

D:HDFS

答案:C可以使用____命令,启动Kafka的一个消费者。()。

A:kafka-console-consumer.sh

B:kafka-topics.sh

C:kafka-console-producer.sh

D:kafka-server-start.sh

答案:A在Flume消费的整体流程中,第一部分是别名配置,在别名配置的过程当中,配置了两个数据流用来处理()。

A:启动日志数据和事件日志数据

B:Flume环境变量

C:Flume数据消费脚本

D:ETL和分流标记拦截器

答案:A在Flume数据传输的过程中,当source将数据传递给channel时,数据会先后经过()两个拦截器。

A:Flume分流标记拦截器

B:时间戳拦截器

C:UUID拦截器

D:ETL拦截器

答案:ADFlume的安装与部署可以分为下列哪三个步骤()。

A:将Flume安装包上传至Linux操作系统

B:解压到指定目录,进行环境变量的配置

C:在Flume的配置文件中修改指定配置

D:启动Flume数据消费脚本

答案:ABC第四章测试在数据仓库中,ODS层的作用是保持数据原貌,不做任何修改,起到备份数据的作用()

A:对

B:错

答案:A在数据仓库中,DWD层的作用是对数据进行清洗()

A:对

B:错

答案:A在ADS层中,通过在启动日志中统计不同设备ID出现的次数来分析用户活跃?()

A:错

B:对

答案:B在ADS层中,按照设备ID对日活表分组,登录次数为1,且在一周前登录的这种分析方式,分析沉默用户?()

A:错

B:对

答案:BDWS层统计各个主题对象的当天行为,服务于DWT层的主题宽表。DWS层的宽表字段,是站在不同维度的角度去看事实表,重点关注事实表的度量值,通过与之关联的事实表,获得不同的事实表的度量值()

A:对

B:错

答案:A在数据仓库项目中,我们在DWD层使用()手段清洗数据

A:Python

B:Kettle

C:SQL

D:RDD

答案:C在数据仓库中,用于数据清洗的是哪个层()

A:DWS

B:DWD

C:DWT

D:ODS

答案:B数据仓库一般分为()

A:DWD

B:DWS

C:DWT

D:ODS

E:ADS

答案:ABCDE在数据仓库DWD层中,需要清洗哪些数据()

A:将用户行为宽表和业务表进行数据一致处理

B:创建分区表

C:空值的去除

D:过滤核心字段

答案:ACD在数据仓库中,ODS层做了什么业务()

A:创建分区表

B:保持数据原貌

C:空去除

D:采用LZO压缩

答案:ABD第五章测试MySQL中,用于创建数据库的命令是()。

A:createtable数据库名;

B:createdatabase数据库名;

C:use数据库名;

D:dropdatabase数据库名;

答案:B使用sqoop进行从Hive到MySQL数据库的数据迁移时,其命令为()。

A:sqoopjob

B:sqoopimport

C:sqoopexport

D:sqoopmerge

答案:Cpyecharts中,柱状图类是()。

A:Line

B:Bar

C:Pie

D:Liquid

答案:Bpyecharts中,饼图类是()。

A:Bar

B:Line

C:Liquid

D:Pie

答案:D全局配置项可通过()方法设置。

A:set_series_opts

B:add_yaxis

C:set_global_opts

D:reversal_axis

答案:C使用pyecharts工具绘图时,可直接进行图表的绘制,无需在程序中导入对应的图表类。()

A:对

B:错

答案:B使用pyecharts工具绘图时,可以通过设置初始化配置项中

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论