版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第一单元测试题
1.(填空)大数据的发展历程总体上可以划分为4个重要阶段。它们分别是?
答案:萌芽期、突破期、成熟期和大规模应用期
2.(填空)按数据结构的不同,数据分为?
答案:结构化数据、非结构化数据、半结构化数据
3.(填空)按照数据开发应用深入程度不同,可将大数据应用分为?
答案:描述性分析应用、预测性分析应用和指导性分析应用
4.(填空)决策的5大特性包括?
答案:目的性、选择性、满意性、过程性、动
5.(填空)决策过程的4个阶段为?
答案:情报、设计、选择、执行
6.(判断)按决策影响范围和重要程度不同,管理决策分为战略决策、战术决策
和业务决策
A.V
R.X
答案:A
7.(判断)常见的定性决策方法有:头脑风暴法、专家会议法、后悔值决策法、
波士顿矩阵
A.J
B.X
答案:B
8.(判断)大数据对决策思维的影响主要体现在:全样而非抽样、精确而非高效,
因果性而非相关性。
A7
B.X
答案:B
9.(判断)大数据应用已成熟,目前多应用于决簧指导性分析。
A.J
B.X
答案:B
10.(判断)从业务角度出发,大数据的核心价值主要有:数据辅助决策、数据驱
动业务、数据对外变现。
A.V
B.X
答案:A
11.(多选)根据大数据从来源到应用的流程,下列属于大数据技术架构的是:
A.数据采集层
B.数据抽取层
C.数据分析层
D.数据应用层
答案:ACD
12.(多选)大数据时代,现代企业的管理和发展面临哪些挑战?
A.更多的数据被收集
B.数据更加复杂
C.决策自动化
D.实时决策需求突出
答案:ABCD
13.(多选)下列属于大数据“5V”特征的是:
A.数据容量大
B.数据类型多样
C.数据价值密度高
D.数据流转速度快
答案:ABD
14.(多选)按照载体大同,下列不属于文本数据的是:
A.txt文本
B.照片
C.excel电子表格
D.录像
答案:BD
15.(多选)下列关于数据、信息、知识的描述正确的是:
A.信息是有意义、有用途的数据
B.数据源于信息,是信息的表现形式和载体
C.知识是更加系统化、理论化的信息
D.从信息到数据再到知识,是螺旋式上升的过程
答案:AC
16.(判断)决策的基本流程包含发现并界定问题、确定决策目标、拟定备选方案、
评价备选方案、选择方案和回馈评估方案六大步。
A.V
B.X
答案:A
17.(多选)以下哪些方法属于定性决策方法?
A.头脑风暴法
B.专家会议法
C.乐观决策法
D.波士顿矩阵法
答案:ABD
18.(填空)大数据的五大特征包括?
答案:1.数据容量大;2.数据类型多样;3.数据价值密度低;4.数据流转速度快;
5.对数据真实性要求高
第二单元测试题
1.(单选)数据采集与处理工作不包括
A.数据治理
B数据获取
C数据预处理
D数据存储
答案:A
2.(单选)以下哪项不属于大数据分析的范畴
A.描述性分析
B诊断分析
C预测分析
D聚类分析
答案:D
3.(单选)大数据建模的步骤为
A.模型建立-模型评估-模型训练-模型应用
B模型建立•模型优化-模型训练■模型应用
C模型建立-模型训练-模型评估-模型应用
D模型建立-模型训练-模型优化-模型应用
答案:C
4.(单选)决策数据可视化技术不包括
A.海量数据可视化
B文本数据可视化
C网络可视化
D多维数据可视化
答案:A
5.(单选)大数据处理的核心环节是
A.数据分析与挖掘
B数据采集与处理
C结果展示
D数据应用
答案:A
6.(判断)大数据决策是以信息技术、云计算技术、大数据技术等为支撑,以海
量数据为主要驱动,通过大数据分析提出问题、确立目标、设计和选择方案的过
程。
A.V
B.X
答案:A
7.(判断)在数据状态上,大数据分析多使用存量数据,而大数据挖掘多使用动
态增量数据或存量数据。
AZ
B.X
8.(判断)常见的决策数据采集技术包括网络数据采集、系统日志采集、感知设
备采集、数据库采集四种。
A.V
B.X
答案:A
9.(判断)针对结构化和非结构化混合数据一般采用数据库集群的方式进行存储
A.V
B.X
答案:B
10.(判断)Hadoop是一个分布式的、容错的实时计算系统,能够对实时动态的
多源异构数据进行实时计算,获得有价值的信息。
A.V
B.X
答案:B
11.(判断)数据分析与挖掘是大数据处理的核心环节,指通过数据标签服务、文
本处理和影像组学分析等应用支撑,进行大数据的探索分析、模型拟合、模型训
练及评估。
A.V
B.X
答案:A
第三单元测试题
1.(多选)M叩Reduce体系结构主要由哪几个部分组成
A.ClientB.JobTrackerC.TaskTrackerD.Task
答案:ABCD
2.(单选)以下名词解释不正确的是
A.HBase:提供高可靠性、高性能、分布式的行式数据库,是谷歌BigTable的升
源实现
B.HDFS:分布式文件系统,是Hadoop项目的两大核心之一,是谷歌GFS的开
源实现
C.Zookeeper:针对谷歌Chubby的一个开源实现,是高效可靠的协同工作系统
D.Hive:一个基于Hadoop的数据仓库工具,用于对Hadoop文件中的数据集进
行数据整理、特殊查询和分析存储
答案:A
3.(单选)HDFSFederation设计不能解决“单名称节点”存在的哪个问题
A.单点故隙问题
B.良好的隔离性
C.性能更高效
D.HDFS集群扩展性
答案:A
4.(单选)下列说法正确的是
A.第二名称节点无法解决单点故障问题
B.HDFSHA提供高可用性,可以实现可扩展性、系统性能和隔离性
C.第二名称节点是热备份
D.HDFSHA可用性不好
答案:A
5.(多选)对新一代资源管理调度框架YARN的理解正确的是
A.YARN的体系结构包含三个组件:ResourceManager,NodeManager,
ApplicationMasterB.YARN可以实现“一个集群多个框架”,即在一个集群上部
署一个统一的资源调度管理框架
C.MapReduce2.0是运行在YARN之上的计算框架,由YARN来为MapReduce
提供资源管理调度服务
D.YARN既是资源管理调度框架,也是一个计算框架
答案:ABC
6.(判断)Hadoop支持数据的随机写。
A.V
B.X
答案:B
7.(判断)Hadoop是Java开发的,所以Hadoop只支持Java语言编写。
A.J
B.X
答案:B
8.(判断)Hadoop1.()和2.()都具有完善的HDFSHA策略。
A.J
B.X
答案:B
9.(判断)因为Hadoop有多个副本,所以NameNode不存在单点问题。
A.V
B.X
答案:B
10.(判断)PIG是脚本语言,它与M叩Reduce无关。
A.J
B.X
答案:B
11.(单选)关于SecondaryNameNode哪项是正确的?
A.它的目的是帮助NameNode合并编辑日志,减少NameNode的启动时间
B.它是NameNode的热备份
C.它对内存没有要求
D.SecondaryNameNode应与NameNode部署到一个节点
答案:A
12.(填空)YARN的体系结构包括哪些组件?
答案:ResourceManager、ApplicationMaster^NodeManager
13.(单选)下面哪个程序负责HDFS数据存储。
A.Datanode
B.NameNode
C.Jobtracker
D.SecondaryNameNode
答案:A
14.(单选)HBase是分布式列式存储系统,记录按什么集中存放。
A.列族
B.歹U
C.行
D.不确定
答案:A
15.(填空)哪个进程负责M叩Reduce任务调度.
答案:Jubliackci
第四单元测试题
1.(单选)分布式文件系统HDFS采用了主从结构模型,由计算机集群中的多个
节点构成的,这些节点分为两类,一类存储元数据叫(),另一类存储具体数据
叫()
A.数据节点,名称节点
B.名称节点,主节点
C.从节点,主节点
D.名称节点,数据节点
答案:D
2.(单选)下列Amazon的云数据库属于关系数据库的是()
A.AmazonDynamoDB
B.AmazonRedshift
C.AmazonRDS
0.AmazonSimplcDB
答案:C
3.(单选)下列关于NoSQL数据库和关系型数据库的比较,不正确的是(;
A.NoSQL数据库缺乏统一的查询语言,而关系型数据库有标准化查询语言
B.NoSQL数据库很容易实现数据完整性,关系型数据库很难实现数据完整性
C.NoSQL数据库的可扩展性比传统的关系型数据库更好
D.NoSQL数据库具有弱一致性,关系型数据库具有强一致性
答案:B
4.(多选)下列对HBase的理解正确的是()
A.HBase是一个行式分布式数据库,是Hadoop生态系统中的一个组件
B.HBase是针对谷歌BigTable的开源实现
C.HBase是一种关系型数据库,现成功应用于互联网服务领域
D.HBase多用于存储非结构化和半结构化的松散数据
答案:BD
5.(单选)HBase是一种()数据库
A.行式数据库
B.关系数据库
C.文档数据库
D.列式数据库
答案:D
6.(单选)下列数据库属于文档数据库的是
A.HBase
B.MongoDB
C.MySQL
D.MongoDB
答案:D
7.(单选)NoSQL数据库的三大理论基石不包括
A.CAP
B.最终一致性
C.BASE
D.ACID
答案:D
8.(多选)HDFS只设置唯一一个名称节点带来的局限性包括。
A.命名空间的限制
B.集群的可用性
C.隔离问题
D.性能的瓶颈
答案:ABCD
9.(判断)目前,NoSQL的含义是“NolonlySQL”,而不是“NoSQL”。
A.J
B.X
答案:B
10.(判断)一个数据库事务具有ACID是指:原子性,一致性,持久性,隔离性。
A.J
B.X
答案:A
第五单元测试题
1.(单选)下列哪些不是数据来源()
A.商业教据
B.互联网教据
C.物联网教据
D.人工收集教据
答案:D
2.(单选)下列不是数据采集的主要渠道是()
A.传统信息系统
B.大数据系统
C.物联网系统
D.Web系统
答案:B
3.(单选)下列数据质量的评估标准,不正确的是()
A.完整性
B.可替代性
C.一致性
D.及时性
答案:B
4.(多选)下列关于数据质量的影响因素理解正确的是()
A.信息因素
B.人为因素
C.信息因素
D.流程因素
答案:ABD
5.(单选)下列不是大数据采集方法的是0
A.系统日志采集
B.网络数据采集
C.数据库采集
D.手动聚集
答案:D
6.(多选)下列属于大数据预处理的方法的是()
A.数据清洗
B.数据集成
C.数据变换
D.数据归约
答案:ABCD
7.(多选)处理噪声数据的方法包括0
A.分箱
B.平滑处理
C.聚类
D.清洗
答案:ABC
8.(判断)忽略元组的方法可以使用该元组的剩余属性值
A.V
B.X
答案:B
9.(判断)大数据预处理技术就是对己接收数据的辨析抽取和清洗
A7
B.X
答案:A
10.(判断)大数据的数据采集是指通过传感器、摄像头、RFID射频数据以及互
联网等方式获取的各种结构化、半结构化和非结构化的数据。
A.V
B.X
答案:A
第六单元测试题
一、单选
1.(单选)MapReduce的基本架构不包括下列哪个部分()
AClient
BJobTracker
CTaskTracker
DSparkCore
答案:D
2.(单选)大型主机的特点不包括下列哪个()
A高可靠性
B高可用性
C高服务性
D高激活性
答案:D
3.(单选)下列哪项不是Storm的主要特点()
A可伸缩性高
B容错性不好
C语言无关性
D适用场景广泛
答案:B
4.(单选)下列哪项不是SAPHANA的特点()
A充分并行编程
B把数据全部放入内存中存储
C图模型系统优化
D最小化数据传输
答案:C
二、多选
1.(多选)MapReduce的主要特点有()
A易于编程
B良好的扩展性
C高容错性
D适合PB级以上海量数据的离线处理
答案:ABCD
2.(多选)Spark的主要特点有()
A快速高效
B快速高效
C全栈式数据处理
D兼容性高
答案:ABCD
3.(多选)超级计算机可应用的领域有()
A气象预报领域
B医药领域
C交通领域
D防震减灾领域
答案:ABCD
4.(多选)图计算主要分为以下哪三类()
A基于分布式环境的大规模图计算系统
B基丁软件加速器的大规模图计算系统
C基于单机的大规模图计算系统
D基于硬件加速器的大规模图计算系统
答案:ACD
5.(多选)流式计算系统的特征主要包括以下哪几个方面()
A有序性
B实时性
C突发性
D易失性
答案:BCD
三、判断
1.(判断)M叩Reduce集群中使用了大量的低端服务器,因此,节点硬件失效和
软件出错是常态。
A.V
B.X
答案:A
2.(判断)大型主机虽然在性能和稳定性方面表现卓越,但并不代表其永远不会
出故障。
A.V
B.X
3.(判断)分布式架构中的计算机有明显的主/从之分,所有计算机节点都是不对
等的。
A.V
B.X
答案:B
4.(判断)集中式架构设计,天然就有多个节点,很容易通过主备、冗余、哈希
(Hash)等手段实现计算和存储冗余备份,从而实现高可用。
A.J
B.X
答案:B
5.(判断)批处理系统自动化程度比较高,系统吞吐量大,资源利用率高,系统
开销小,但各作业周转时间长,不提供用户与系统的交互手段,适合大的成熟的
作业。
A.J
B.X
答案:B
四、填空
1.(填空)大数据处理从海量的原始数据中抽取出有价值的信息,将数据转换成
信息,其中—是基础、—是支撑、是核心、―是根本。
答案:数据资源处理平台分析算法应用效益
2.(填空)M叩Reduce框架把计算节点和存储节点放在一起运行,将复杂的、运
行于大规模集群上的并行计算过程高度地抽象到两个函数:和,从而减
少了节点间的数据移动开销。
答案:MappingReducing
3.(填空)Spark生态系统主要包含
了、、、
_>和等组件。
答案:SparkCore>SparkSQL>SparkStreaming>MLlib、GraphX
4.(填空)分布式架构设计的核心理念是“",即按照一定维度将系
统进行拆分,系统各部分松耦合并行运行,并建立起较为完善的横向扩展与容错
恢复机制。
答案;并行拆分与横向扩展
5.(填空)Prcgel是一种基于—模型实现的并行图处理系统,搭建了一套可扩
展的、有容错机制的平台,提供了一套非常灵活的—,可以描述各种各样的图
计算,主要用于—、—、—等。
答案:BSPAPI图遍历最短路径PageRank计算
第七单元测试题
1.(单选)大数据时代下企业管理的特点是()
A.企业用于分析的数据量十分庞大
B.数据的精确性要求有所降低提高
C.建立事物之间的相关性
D.处理能力提升
答案:A
2.(单选)下列不属于大数据在企业管理中的作月及价值是()
A.大数据帮助企业优化资源配置
B.大数据帮助企业推动产品创新
C.大数据帮助企业实现精准营销
D.大数据帮助企业改善外部管理
答案:D
3.(单选)下列属于大数据分析流程有0
A.跨行'业数据挖掘标准流程CRISP-DM
B.业务理解
C.模型部署
D.数据取样
答案:A
4.(单选)SEMMA是由SAS公司提出的一套行之有效的数据挖掘方法论,下列
不属于数据挖掘的核心过程有()
A.抽样
B.探索
C.评估
D.部署
答案:D
5.(多选)大数据分析关键技术有()
A.可视化分析
B.数据挖掘算法
C.预测性分析
D.数据降噪
答案:ABC
6.(多选)大数据分析是利用数据获得洞察力,帮助人们更好地做决策的学科集
合,下列属于大数据分析有。
A.可视化分析
B基本数据分析
C.诊断型数据分析
D.描述型数据分析
答案:CD
7.(判断)模型评估指从业务角度和统计角度进行模型结论的评估,评估决定了
当前模型的命运,没通过评估只能面临返工。
A.J
B.X
答案:A
8.(判断)数据分析方法主要对机器学习算法进行分类介绍,机器学习算法包括
监督式学习和非监督式学习
A7
B.X
答案:A
9.(填空)跨行业数据挖掘标准流程CRISP-DM(cross-industrystandardprocessfor
datamining)是一种业界认可的用于指导数据挖掘工作的方法,为数据库知识发现
工程(KnowledgeDiscoveryinDatabase,KDD)或数据挖掘项目提供了一个完整
的过程描述。CRISP-DM把这个过程划分为六个阶段,分别
是、、、、和O
答案:业务理解、数据理解、数据准备、建立模型、模型评估、模型部署
10.(判断)特征工程是机器学习应用的基础,指的是利用领域知识从原始数据
中提取用于后续机器学习及数据挖掘应用的特征(向量)的过程。整个过程并
不涉及诸如特征表示、特征提取、属性约减、特征选择等内容。
A.V
B.X
答案:B
第八单元测试题
1.(单选)可视化基本类型不包括以下哪一项?
A.图形可视化
B.科学可视化
C.信息可视化
D.可视分析学
答案:A
2.(单选)科学可视化主要关注的是()
A.三维现象的可视化
B.二维现象的可视化
C.多维现象的可视化
D.图形的可视化
答案:A
3.(单选)GoogleChartAPI属于那种可视化工具?
A.信息图表工具
B.入门级工具
C.地图工具
D.时间线工具
答案:A
4.(单选)下面那一项不属于可视化工具中的高级分析工具
A.R语言
B.TimelineJS
C.Weka
D.Gephi
答案:B
5.(单选)下面哪一项不属于视觉通道的内容
A.饱和度
B.色调
C.色彩
D.面积
答案:c
6.(单选)以下不属于时间线工具的是
A.TimelineJS
B.Timetoast
C.Xtimeline
DR语言
答案:D
7.(多选)以下属于地图工具的有
A.Leaflet
B.ModestMaps
C.GoogleFusionTables
D.excel
答案:ABC
8.(多选)可视化评估可以分为哪两种类型
A.定性评估
B.定量评估
C.半定性评估
D.半定量评估
答案:AB
9.(判断)数据中的离•群点,即不同于数据集中其他大部分数据对象特征的数
据对象。
A.V
B.X
答案:A
10.(判断)内部数据收集的具体目的包括:获取竞品的数据、获取官方机构官
网公布的一些行业数据等。
A.V
B.X
答案:B
IL(填空)整群抽样又称O0是将总体中各单位归并成若干个互不交叉、互
不重复的集合,称之为群;然后以群为取样单位抽取样本的一种抽样方式。
答案:聚类抽样
12.(填空)典型的访谈包括()、()和半结构型访谈等
答案:开放型访谈、结构型访谈
13.(判断)数据可视化的工具,主要有入门级工具、信息图表工具、地图工
具、时间线工具、高级分析工具。
A.V
B.X
答案:A
14.(判断)开始创建一个可视化项目时,第一步是收集数据
A.V
B.X
答案:B
15.(多选)以下属于主观评估方法的有
A.专家评估
B.启发式评估
C.抽样问卷调查
D.焦点小组访谈
答案:ABCD
第九单元测试题
1.(多选)制约大数据治理的主要因素有:()
A.制度与规范缺失
B.数据防护意识薄弱
C.成本效益比较低
D.技术不成熟
答案:ABCD
2.(多选)下列属于大数据治理的实施路径的是:()
A.产生数据
B.数据资产梳理
C.构建机构内部大数据治理体系
D.大数据治理评估与审计
答案:ABCD
3.(填空)数据资产包括:
答案:企业内部数据、企业外部数据、企业购买数据
4.(填空)大数据治理的五个核心要素包括:
答案:明确数据治理责任,建立数据治理组织、管理出成效,制度是保障、确
保数据规范、数据治理要理论结合实践、数据治理软件
第十单元测试题
1.(多选)大数据技术的应用为组织财务管理注入了新鲜血液的方式有()
A.拓宽筹资渠道
B.增强财务控制能力
C.提高投资回报率
D.数据资源整合共享
答案:ABCD
2.(单选)大数据平台可为物流管理提供()
A.海量数据的收集
B.储存数据
C.分析数据
D.整合数据
答案:A
3.(多选)大数据在零售决策中的应用()
A.利用大数据分析关联购买行为
B.智能推荐系统
C.大范围营销
D.主持产品定价
答案:AB
4.(单选)下列不属于大数据在政府决策中的应月()
A.智慧政府
B.社会治理
C.公共服务
D.调整组织结构
答案:D
5.(多选)大数据在研发设计中的应用()
A.产品协同设计
B.设计仿真
C.替代工艺流程
D.优化工艺流程
答案:ABD
6.(多选)下列不属于大数据在供应链中的应用()
A.供应链管理战略决策
B.供应链管理风险预测
C.供应链管理敏捷性
D.供应链协同管理
答案:ABCD
7.(判断)大数据与智能制造之间的关系包括将制造中存在的问题转换为定
性、定量的数据内容,然后从中找到相应的解决方法。
AZ
B.X
答案:A
8.(判断)大数据技术在供应链管理方面的应用集中在供应链管理战略决策、
风险预测、提升供应链管理敏捷性及协同管理方面。
A.V
B.X
答案:A
9.(填空)大数据技术在生产制造环节的应用有助于更快、更好地推进智能制
造,其主要应用包括、—和—制等
答案:智能生产、生产流程优化、个性化定制
10.(填空)大数据在医疗卫生管理与临床服务中的应用包
括:、、、
答案:医疗质量管理、医疗绩效管理、医疗设备管理、医保管理
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2018、2019年四川省公务员录用考试《行测》真题及答案解析(下半年)
- 2011、2012年北京公务员考试《行测》真题及答案解析
- 2025年下半年上海市商务教育培训中心工作人员招考易考易错模拟试题(共500题)试卷后附参考答案
- 2025平顶山事业单位招考易考易错模拟试题(共500题)试卷后附参考答案
- 2025山西焦煤集团人力资源限公司面向社会招聘237人易考易错模拟试题(共500题)试卷后附参考答案
- 2025山西太原煤气化集团公司招聘66人易考易错模拟试题(共500题)试卷后附参考答案
- 自愈系统优化-洞察与解读
- 2025山东菏泽事业单位招聘易考易错模拟试题(共500题)试卷后附参考答案
- 2025山东淄博沂源事业单位招聘C类(教育类)人员易考易错模拟试题(共500题)试卷后附参考答案
- 2025山东枣庄市卫生系统急需紧缺人才需求255人易考易错模拟试题(共500题)试卷后附参考答案
- 2025年郑州登封市公共交通运营有限公司社会招聘工作人员35人笔试考试参考题库及答案解析
- 2024年公务员国考行测真题(含答案)
- 灵活就业人员劳动合同范本及说明
- 退休人员返聘合同
- 智能物流设备维护操作指南
- 外墙涂料工程施工方案
- 建设银行考试题真题及答案
- 女企业家协会发言稿
- 2025年学习两会精神应知应会知识测试题附含答案
- 水性涂料项目建设工程方案
- 新教科版小学1-6年级科学需做实验目录
评论
0/150
提交评论