下载本文档
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
绪论单元测试下列对大数据的特点描述不正确的是()
A:速度要求快
B:数据类型多样
C:数据体量巨大
D:价值密度高
答案:D第一章测试云主机和物理机的寿命都是永久性的。()
A:对
B:错
答案:B对于实时性要求高的应用,需要应用实时处理架构。()
A:对
B:错
答案:A数据仓库是用来存储数据的而不是分析数据的。()
A:错
B:对
答案:A在DWS层中,用户行为日志数据分为公共字段和事件字段。()
A:错
B:对
答案:B项目实施流程中没有哪一步()
A:数据仓库设计开发
B:数据导出
C:下载数据
D:数据访问
答案:C数据分析在企业中的作用()
A:帮助企业经营者平衡企业的收益
B:直接的获取经营的利润
C:干预经营者的决策
D:帮助企业经营者减少投入
答案:B数据结构中哪项不是页面入口的来源()
A:push
B:应用首页
C:登录页
D:详情页
答案:CHadoop的三大发行版本是()
A:HDP
B:Java
C:CDH
D:Apache
答案:ACD流量分析常见指标有哪些方面()
A:转化路径分析
B:来源分析
C:访客分析
D:受访分析
答案:ABCD网站流量数据分析的意义有哪些()
A:帮助提高网站流量
B:帮助网站运营人员获取网站流量信息
C:提升网站用户体验
D:从多方面提供网站分析的数据依据
答案:ABCD第二章测试Hadoop是一种分布式系统基础架构,主要解决海量数据存储和海量数据计算两大问题。()
A:对
B:错
答案:A在HDFS配置文件中,主要配置的就是hdfs-site.xml配置文件。()
A:对
B:错
答案:A在Hadoop分布式集群中,不需要对集群中的每一个节点都进行ip规划。()
A:错
B:对
答案:A利用HDFS操作命令可以将数据文件从本地上传到HDFS上,也可以将数据文件从HDFS下载到本地。()
A:对
B:错
答案:A在HDFSAPI操作中,closeFileSystem方法的功能是释放文件系统对象的资源。()
A:对
B:错
答案:AMapReduce词频统计案例中,执行map任务的最后阶段,会将缓冲区的数据全部写入到磁盘。()
A:对
B:错
答案:AFlume是Cloudera公司提供的一款高可用、高可靠、分布式的系统,可用于海量日志采集、聚合和传输。()
A:对
B:错
答案:A能在网络中安全传输文件的软件是()。
A:Xftp
B:Xshell
C:VMware
D:IDEA
答案:A创建了bigdata用户的命令是()。
A:bigdataALL
B:useraddbigdata
C:Sudoers
D:subigdata
答案:B论文(),主要论证的核心是如何采用分布式的架构对海量数据进行分布式计算。
A:HDFS
B:MapReduce
C:BigTable
D:GFS
答案:B假如我们设定HDFS块的大小是128M,那么,一个大小为500M的数据文件,将会被拆分成()个分片
A:2
B:5
C:4
D:3
答案:C在Linux命令行中,使用()命令格式化hive元数据库
A:del
B:clear
C:format
D:schematool
答案:D在Hive中给表添加数据,使用()方式给表添加数据效率更高。
A:append
B:Add
C:insertinto
D:Load
答案:D关系型数据库与HDFS之间相互数据迁移的工具是()。
A:fastcopy
B:sqoop
C:fsck
D:distcp
答案:BNotepad++功能有()。
A:编写计算机程序代码
B:可以连接虚拟机,对虚拟机中的文件进行编辑。
C:制作一般的纯文字说明文件
D:语法高亮度显示、语法折叠功能、支持宏、扩充基本功能的外挂模组
答案:ABCDHadoop主要包含()三大功能组件。
A:HDFS
B:Hadoop
C:MapReduce
D:YARN
答案:ACDHadoop具有()优势。
A:高容错性
B:高效性
C:高扩展性
D:高可靠性
答案:ABCD下面说法正确的是()。
A:Java编程的核心就是JVM,JVM是JRE的一部分,它是一个虚拟出来的计算机。
B:JDK包含JRE和JVM
C:JRE是java运行时的类库
D:JDK是Java语言的开发环境
答案:ABCD在分布式文件系统HDFS当中提供了两种操作命令,是()。
A:hdfsdfs
B:Hadoopdfs
C:hdfsfs
D:hadoopfs
答案:ADHive是基于Hadoop技术的数据仓库工具,用来对数据进行()。
A:提取
B:转化
C:加载
D:分析
答案:ABCD使用beeline客户端远程访问Hive之前,需要启动的两个服务是()。
A:hive–servicemetastore
B:hive–servicehiveserver
C:hive–servermetastore
D:hive–servicehiveserver2
答案:CDHive的复杂数据类型有()三种
A:STRUCT
B:ARRAY
C:Char
D:MAP
答案:ABD成功安装Zookeeper集群后,查看各节点的角色信息时,会看到1个、多个()。
A:zookeeper
B:leader
C:follower
D:zkServer
答案:BCKafka是一种高吞吐量的分布式发布订阅消息系统,是Apache基金会开源的消息队列,该框架由()编写而成。
A:Java
B:C++
C:Scala
D:Python
答案:AC第三章测试业务字段指的是每个移动端固定的、共有的字段;公共字段代表的是用户在app中执行过的所有操作。()
A:对
B:错
答案:B在Flume过程中,Flume对接本地磁盘文件,通过tailDir类型实时监控当前数据文件中数据内容的变化。()
A:错
B:对
答案:BETL拦截器主要用于过滤时间戳不合法和json数据不完整的日志。()
A:对
B:错
答案:AFlume分流标记拦截器主要是用于区分启动日志和事件日志。()
A:对
B:错
答案:A以下关于Flume的说法正确的是____。()
A:Sink是Flume数据传输的基本单元
B:Source是Flume数据传输的基本单元
C:Channel是Flume数据传输的基本单元
D:Event是Flume数据传输的基本单元
答案:DFlume通过内部的采集数据传输机制进行快速的数据传输,传输完之后会将数据就存储到____中。()
A:Source
B:Channel
C:Kafka
D:HDFS
答案:C可以使用____命令,启动Kafka的一个消费者。()。
A:kafka-console-consumer.sh
B:kafka-topics.sh
C:kafka-console-producer.sh
D:kafka-server-start.sh
答案:A在Flume消费的整体流程中,第一部分是别名配置,在别名配置的过程当中,配置了两个数据流用来处理()。
A:启动日志数据和事件日志数据
B:Flume环境变量
C:Flume数据消费脚本
D:ETL和分流标记拦截器
答案:A在Flume数据传输的过程中,当source将数据传递给channel时,数据会先后经过()两个拦截器。
A:Flume分流标记拦截器
B:时间戳拦截器
C:UUID拦截器
D:ETL拦截器
答案:ADFlume的安装与部署可以分为下列哪三个步骤()。
A:将Flume安装包上传至Linux操作系统
B:解压到指定目录,进行环境变量的配置
C:在Flume的配置文件中修改指定配置
D:启动Flume数据消费脚本
答案:ABC第四章测试在数据仓库中,ODS层的作用是保持数据原貌,不做任何修改,起到备份数据的作用()
A:对
B:错
答案:A在数据仓库中,DWD层的作用是对数据进行清洗()
A:对
B:错
答案:A在ADS层中,通过在启动日志中统计不同设备ID出现的次数来分析用户活跃?()
A:错
B:对
答案:B在ADS层中,按照设备ID对日活表分组,登录次数为1,且在一周前登录的这种分析方式,分析沉默用户?()
A:错
B:对
答案:BDWS层统计各个主题对象的当天行为,服务于DWT层的主题宽表。DWS层的宽表字段,是站在不同维度的角度去看事实表,重点关注事实表的度量值,通过与之关联的事实表,获得不同的事实表的度量值()
A:对
B:错
答案:A在数据仓库项目中,我们在DWD层使用()手段清洗数据
A:Python
B:Kettle
C:SQL
D:RDD
答案:C在数据仓库中,用于数据清洗的是哪个层()
A:DWS
B:DWD
C:DWT
D:ODS
答案:B数据仓库一般分为()
A:DWD
B:DWS
C:DWT
D:ODS
E:ADS
答案:ABCDE在数据仓库DWD层中,需要清洗哪些数据()
A:将用户行为宽表和业务表进行数据一致处理
B:创建分区表
C:空值的去除
D:过滤核心字段
答案:ACD在数据仓库中,ODS层做了什么业务()
A:创建分区表
B:保持数据原貌
C:空去除
D:采用LZO压缩
答案:ABD第五章测试MySQL中,用于创建数据库的命令是()。
A:createtable数据库名;
B:createdatabase数据库名;
C:use数据库名;
D:dropdatabase数据库名;
答案:B使用sqoop进行从Hive到MySQL数据库的数据迁移时,其命令为()。
A:sqoopjob
B:sqoopimport
C:sqoopexport
D:sqoopmerge
答案:Cpyecharts中,柱状图类是()。
A:Line
B:Bar
C:Pie
D:Liquid
答案:Bpyecharts中,饼图类是()。
A:Bar
B:Line
C:Liquid
D:Pie
答案:D全局配置项可通过()方法设置。
A:set_series_opts
B:add_yaxis
C:set_global_opts
D:reversal_axis
答案:C使用pyecharts工具绘图时,可直接进行图表的绘制,无需在程序中导入对应的图表类。()
A:对
B:错
答案:B使用pyecharts工具绘图时,可以通过设置初始化配置项中
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 土石方挖掘机司机岗前管理综合考核试卷含答案
- 鉴定估价师变革管理模拟考核试卷含答案
- 2025年三峡电力职业学院辅导员考试笔试真题汇编附答案
- 浆丝机操作工操作技能水平考核试卷含答案
- 罐头封装工安全检查水平考核试卷含答案
- 羽绒羽毛加工处理工诚信测试考核试卷含答案
- 松香蒸馏工岗前纪律考核试卷含答案
- 2025年上海纺织工业职工大学辅导员招聘备考题库附答案
- 2024年湖州学院马克思主义基本原理概论期末考试题附答案
- 2025年互助县事业单位联考招聘考试真题汇编附答案
- 电工承包简单合同(2篇)
- 新能源电站单位千瓦造价标准值(2024版)
- 军队院校招生文化科目统一考试模拟试卷
- 03课题三-建筑运行大数据安全与数据质量-20180703
- 工业区物业服务手册
- 2024新能源集控中心储能电站接入技术方案
- 河南省信阳市2023-2024学年高二上学期期末教学质量检测数学试题(含答案解析)
- 零售行业的店面管理培训资料
- 培训课件电气接地保护培训课件
- 污水管网工程监理月报
- 安徽涵丰科技有限公司年产6000吨磷酸酯阻燃剂DOPO、4800吨磷酸酯阻燃剂DOPO衍生品、12000吨副产品盐酸、38000吨聚合氯化铝、20000吨固化剂项目环境影响报告书
评论
0/150
提交评论