《大数据基础》项目单元测试题及答案汇总 项目1-6 在线测试_第1页
《大数据基础》项目单元测试题及答案汇总 项目1-6 在线测试_第2页
《大数据基础》项目单元测试题及答案汇总 项目1-6 在线测试_第3页
《大数据基础》项目单元测试题及答案汇总 项目1-6 在线测试_第4页
《大数据基础》项目单元测试题及答案汇总 项目1-6 在线测试_第5页
已阅读5页,还剩38页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

在线测试:认识大数据1.单选题(分值:3分)一般认为,多大级别的数据就是大数据了(B)A、GBB、TBC、EB、D、MB2.单选题(分值:3分)大数据的大仅体现在量大,与增长速度无关(B)。A、正确B、错误3.单选题(分值:3分)下列哪一个数据是非结构化数据?(D)。A.财务系统数据B.HR数据库数据 C.ERP数据 D.医疗影像系统数据4.单选题(分值:3分)下列对传统意义上的数据、信息、知识的描述哪一项说错误的?(D)A、信息是有意义和有背景的数据B、数据是信息的载体C、知识是经过人类的归纳和整理,最终呈现规律的信息D、“我国大学本科毕业的平均年龄是22岁”,这描述的是信息。5.单选题(分值:3分)以下哪一项属于半结构化数据?(C)A、图片B、音频C、HTML文件D、word文档6.单选题(分值:3分)以下哪一项不是大数据的特征?(D)A、数据规模大B、数据类型多样C、数据处理速度快D、数据价值密度高7.单选题(分值:3分)大数据的真正意义在于(D)。A.大体量 B.大容量C.大增长 D.大价值8.单选题(分值:3分)“卫生保健数据大致有药理学科研数据,临床数据,个人行为和情感数据,就诊/索赔记录和开销数据四类。”这体现了大数据的什么特征?(A)A、多样性B、价值密度低C、真实性D、高速9.单选题(分值:3分)第一个提出大数据概念的公司是(B)?A、脸谱公司B、麦肯锡公司C、谷歌公司D、微软公司10.多选题(分值:3分)大数据的价值密度低表示的是(ABD)A.有价值的数据所占比例很小 B.价值密度却远远低于传统关系数据库中已有的数据C.大数据价值不大D.数据中存在很多不相关的各种类型数据在线测试:认识大数据与新一代信息技术关系1.单选题(分值:3分)按运营模式分类,下列哪一项不是云计算的形态(D)。A.公有云 B.混合云C.私有云 D.大众云2.单选题(分值:3分)相当于在裸机基础上再加上操作系统和数据库软件的云计算服务模式是哪一种?。(C)。A、SaaSB、IaaSC、PaaSD、GaaS3.单选题(分值:3分)(B)是由具有全面感知能力的物品和人组成的。A.云计算B.物联网C.大数据D.人工智能4.单选题(分值:3分)(D)是一种机器表现的行为,这种行为能以与人类智能相似的方式对环境做出反应并尽可能提高自己达成目的的概率。A.云计算B.物联网C.大数据D.人工智能5.单选题(分值:3分)云计算典型的服务模式不包括?(A)A、硬件即服务B、软件即服务C、平台即服务D、基础设施即服务6.单选题(分值:3分)以下关于“云计算”和“大数据”的说法,错误的是(C)A、云计算与大数据都是为数据存储和处理服务的,都需要占用大量的存储和计算资源B、数据根植于云计算C、最终目的都是通过充分挖掘海量数据以发现数据中的价值D、云计算可以节省IT部署成本7.单选题(分值:3分)大数据和云计算的关系是相辅相成的,云计算就是服务可租用、服务可计量以及(B)的总和A、高智能性B、高性价比C、高时效性D、高实践性8.多选题(分值:3分)下列是公有云的应用示例有(ABCD)。A.华为云B.阿里云C.腾讯云D.百度云9.多选题(分值:3分)人工智能包括的关键技术有(ABCD)。A.机器学习B.知识图谱C.人机交互D.计算机视觉10.多选题(分值:3分)以下哪些是云计算的特征(ABC)A、广泛的网络访问B、按需自助式服务C、快速弹性使用D、租用方式单一在线测试:洞悉大数据的思维方式和工作流程1.单选题(分值:3分)大数据与“小数据”的根本区别在于大数据采用(B)方式,小数据强调抽样。A.定向思维B.全样思维C.相关思维D.实验思维2.单选题(分值:3分)(B)的核心思想可以概括成确定性(或者可预测性)和因果关系。。A、实验思维B、机械思维C、大数据思维D、相关思维3.单选题(分值:3分)互联网和大数据的发展,是一个从信息找人,到人找信息的过程。(B)A、正确B、错误4.单选题(分值:3分)大数据时代,事物各组成要素之间的关系将是简单的线性因果关系。(B)A、正确B、错误5.单选题(分值:3分)大数据分析中一定要考虑所有数据的准确性(B)。A、正确B、错误6.单选题(分值:3分)啤酒与尿布的经典案例,充分体现了实验思维在大数据分析理念中的重要性(B)。A、正确B、错误7.单选题(分值:3分)相比依赖于小数据和精确性的时代,大数据因为更强调数据的(D),帮助我们进一步接近事实的真相。A)安全性B)完整性C)混杂性D)完整性和混杂性8.多选题(分值:3分)下列属于大数据思维的核心原理的有(ABCD)。A.数据核心原理B.数据价值原理C.全样本原理D.关注效率原理9.多选题(分值:3分)下列哪些是大数据的思维方式?(BD)。A.因果关系思维 B.容错性思维 C.准确性思维 D.相关性思维10多选题(分值:3分)大数据研究专家舍恩伯格指出,大数据时代,人们对待数据的思维方式会发生如下三个变化(ABC)。A.从样本思维转向总体思维B.从精确思维转向容错思维C.从因果思维转向相关思维D.从预测思维转向推测思维在线测试:探究大数据的影响1.单选题(分值:3分)(B)大数据的应用主要是多培养一些大数据专业人才,其它专业人才培养不需改变什么。A、正确B、错误2.单选题(分值:3分)政府部门可以把大数据技术融入“舆情分析”,这是大数据对决策方式的影响。(A)A、正确B、错误3.单选题(分值:3分)在大数据环境下,一切将以数据为中心,从数据中发现问题,解决问题,真正体现数据的价值。(A)A、正确B、错误4单选题(分值:3分)在没有大数据的条件下,人才的发现与选拔都很难做到“全信息”,大数据能够帮助人们解决这个问题。(A)A、正确B、错误5.单选题(分值:3分)对于企业来说,给用户进行各种促销或者实施运营策略的时机也比较重要,而且对不同兴趣偏好的用户最好集中处理。(B)A、正确B、错误6.单选题(分值:53分)大数据应用于智慧旅游主要集中于智慧服务、智慧营销、智慧管理这三个层次。(A)A、正确B、错误7.多选题(分值:3分)大数据将对社会发展产生深远的影响,具体体现在以下几个方面(ABCD)A.大数据决策成为一种新的决策方式B.大数据成为提升国家治理能力的新途径C.大数据应用促进信息技术与各行业的深度融合D.大数据开发推动新技术和新应用的不断涌现8.多选题(分值:3分)图灵奖获得者,著名数据库专家JimGray博士认为,人类自古以来在科学研究上先后经历了哪几种范式(ABCD)。A.实验B.理论C.计算D.数据9.多选题(分值:3分)大数据对就业市场的影响主要体现在以下哪些方面?(BCD)。A.大数据应用会整体为社会增加更多就业岗位。B.大数据应用将从数据采集、传输、存储、分析和应用这个产业链带来新岗位。C.大数据的兴起使得数据分析师、数字管理师、数字营销师等成为热门职业。D.大数据技术应用为大学生精准就业带来了新机遇,指明了大学生的就业方向,为就业指导提供了科学依据。10.多选题(分值:3分)下列大数据对人才培养的影响说法正确的是(ABD)A.大数据时代对大数据的专门人才需求会越来越多。B.大数据时代要求各专业人才都具有一定的数字能力和数字素养。C.对于文科类专业来说,数字能力没有太多关系。D.大数据将对高校信息技术相关专业的现有教学和科研带来影响。在线测试:数据采集1.单选题(分值:3分)在确定需要采集的数据之前必须先确定通过数据拟解决的问题(A)。A、正确B、错误2.单选题(分值:3分)企业业务系统数据都是使用传统的关系型数据库来存储的(B)。A、正确B、错误3.单选题(分值:3分)网络爬虫是利用数据挖掘技术将非结构化数据从网页中抽取出来,按照一定的规则和排列格式将数据进行分类处理,并存储成一系列具有统一格式的结构化数据文件(A)。A、正确B、错误4.单选题(分值:3分)使用网络爬虫爬取数据时,只受技术限制,只要技术达到了,任何数据都可爬取(B)。A、正确B、错误5.单选题(分值:3分)通过第三方统计平台采集某网站的数据只能是前端数据(B)。A、正确B、错误6.单选题(分值:3分)智能健康手环的应用开发,体现了(A)的数据采集技术的应用。A、传感器 B、网络爬虫 C、API接口 D、统计报表7.单选题(分值:3分)下列数据来源不属于一手数据的是(D)。A.调查收集B.科学实验C.业务系统直接生成D.从国家统计部门获取8.多选题(分值:3分)大数据采集的主要数据来源(ABCD)A、互联网数据B、日志文件C、企业业务系统数据。D、传感器数据。9.多选题(分值:3分)下列关于互联网数据特点的描述正确的有(ABC)。A.表现为杂乱特点 B.数据类型多C.互联网各平台后台一般都具有数据统计功能D.互联网数据没有多少价值10.多选题(分值:3分)使用八爪鱼采集器采集数据具有以下特点(ABCD)A.可以对指定元素进行采集 B.采集过程可以观察网页和预览数据变化来验证采集设置是否正确C.可以对采集中的流程步骤进行修改D.采集过程不需要编写任何代码在线测试:数据质量评估1单选题(分值:3分)数据采集阶段引起数据质量问题的因素主要有两点:数据来源和采集方法(A)。A、正确B、错误2单选题(分值:3分)原始数据的数据质量不一,但是有一些因素会影响数据的质量,比如信息因素、技术因素、流程因素以及实践因素。(B)A、正确B、错误3单选题(分值:3分)某位员工在储存数据时,将邮箱字段的值记录为179864378@126,这违反了数据质量的(B)A、完整性 B、一致性 C、准确性 D、及时性4单选题(分值:3分)(C)是数据质量最为基础的一项评估标准。A、数据一致性B、数据准确性C、数据完整性D、数据及时性5单选题(分值:3分)相比依赖于小数据和精确性的时代,大数据因为更强调数据的(),帮助我们进一步接近事实的真相。(D)A、安全性B、完整性C、混杂性D、完整性和混杂性6.多选题(分值:3分)下列描述中表示会产生冗余数据的是(AB)。A.某数据集的变量名称为“用户编码”而在另一个数据集中为“ID”B.数据集中某两个变量之间存在相关或推导关系C.某数据集中的商品价格以“元”为单位,另一个数据集中却为“万元”D.某数据集的规范是“3位”,而另一个数据集中的要求位“5位”7.多选题(分值:3分)数据质量是保证数据应用的基础,数据质量评估标准主要有(ABCD)。A.数据准确性 B.数据完整性C.数据一致性 D.数据及时性8.多选题(分值:3分)数据的可信性由以下因素决定(ABC)。A.数据来源的权威性B.数据的规范性C.数据产生的时间D.数据没有缺失或异常数据9.多选题(分值:3分)数据预处理的主要任务主要包括(ABCD)。A.数据清洗B.数据集成C.数据变换D.数据归约10.多选题(分值:3分)最常见的数据准确性错误有(ABCD)。A.异常的大或小的数据。B.乱码数据。C.偏离期望值的孤立点数据D.数量级数据错误。在线测试:数据清洗1.单选题(分值:3分)数据库表中有一个属性值相同的记录就被认为是重复的记录(B)A、正确B、错误2.单选题(分值:3分)在Excel中可以使用哪一快捷键来定位空值?(C)A、Ctrl+VB、Ctrl+EnterC、Ctrl+GD、Ctrl+F3.单选题(分值:3分)数据清洗的方法不包括(D)A、处理残缺数据 B、处理噪声数据C、处理冗余数据 D、一致性检查4.单选题(分值:3分)下列哪一种方法可以用来处理缺失数据?(C)A、数据变换B、数据集成C、数据清洗D、数据排序5.多选题(分值:3分)如果缺失字段的重要性较高,为了保证数据的准确性,往往会将数据进行补全,补全缺失值的方法有(ABC)。A、以同一指标的样本统计量数据(均值、中位数、众数等)填充B、以业务知识或经验推测填充C、以不同指标的计算结果填充D、以简单填充的方式将数据补全6.多选题(分值:3分)在数据清洗的开始阶段我们一般需要做以下准备工作(ABC)。A.将数据导入处理工具。B.查看元数据,包括字段解释、数据来源、代码表等一切描述数据的信息。 C.抽取一部分数据,使用人工查看方式,对数据本身有一个直观的了解,并且初步发现一些问题。D.先删除一部分数据。7.多选题(分值:3分)数据缺失值常常表示为(ABD)。A.空值B.NaNC.NoneD.错误的标识符(#VALUE!)8.多选题(分值:3分)Excel数据重复值的清洗方法通常有(ABCD)。A.通过“数据”菜单删除重复数据B.用VLOOKUP函数快速查询删除重复值C.用COUNTIF函数简单查询删除重复值D.用条件格式快速核对删除重复值9.多选题(分值:3分)Excel数据操作中发现异常值的几种方法(ABD)。A.通过筛选法发现数据异常值B.通过常识统计分析方法发现数据异常值C.通过“数据”菜单中异常值按钮发现异常D.通过箱线图检测异常值10.多选题(分值:3分)在缺失数据清洗过程中,如果缺失字段的重要性高,缺失率高,采用的策略有(ABC)。A.尝试从其他渠道取数补全B.去除记录,并在结果中标明C.使用其它字段通过计算获取D.不做处理或简单填充在线测试:数据集成、变换和归约1.单选题(分值:3分)数据集成核心任务是将互相关联的分布式异构数据源集成到一起,减少结果数据集中冗余和不一致问题,提高后面数据挖掘过程的准确性和速度。(A)A、正确B、错误2.单选题(分值:3分)在数据变换中,聚集法和聚类法都是对数据进行汇总和集中(B)A、正确B、错误3.单选题(分值:3分)数据归约技术可以用来得到数据集的归约表示,一般归约后的数据集比原数据集大得多。(B)。A、正确B、错误4.单选题(分值:3分)以下哪一种属于数据概化(D)A、根据半径属性计算出圆的周长及面积属性B、根据产品评估得分划分产品品质C、将“××年××月××日”的日期转换为“××/××/××”,D、根据出生日期的属性抽象为为80后、90后、00后等5.单选题(分值:3分)经过一系列处理,在基本保持原始数据完整性的基础上,减少数据规模的是(C)?A、数据清洗B、数据融合C、数据规约D、数据挖掘6.单选题(分值:3分)数据归约中属性子集选择的目标是找出最小属性集,使数据类的概率分布尽可能地接近使用所有属性的原分布。(A)A、正确B、错误7.多选题(分值:3分)数据规范化的主要作用(AC)A、去掉量纲,使指标之间具有可比性B、使数据整齐排列C、将数据限制到一定区间,使运算更为便捷D、使数据统一到某一单位8.多选题(分值:3分)数据归约的策略包括以下几种(ABCD)。A.数据立方体聚集B.属性子集选择 C.数据压缩 D.数值归约9.多选题(分值:3分)数据变换的平滑策略是去掉数据中的噪声,将连续的数据离散化、增加粒度,平滑方法包括(ABD)。A.分箱法B.聚类法C.关联法D.回归法10.多选题(分值:3分)下列哪些是数据集成过程中需要处理的问题(ABD)。A.实体识别问题B.冗余问题C.数据错误的纠正D.数值冲突的检测与处理在线测试:认知数据存储1.单选题(分值:3分)计算机存储信息的最小单位被称为位(B)A、ByteB、bitC、KBD、MB2.单选题(分值:3分)数据存储反映系统中静止的数据,表现出静态数据的特征。(A)。A、正确B、错误3.单选题(分值:3分)下列哪一个数据表示的是1TB大小(D)。A.210字节B.220字节 C.230字节 4.单选题(分值:3分)下列对于机械硬盘与固态硬盘的描述哪一种说法是错误的?(D)A、机械硬盘不抗摔,通电不能移动,否则易损坏B、机械硬盘相对固态硬盘读写速度更慢C、机械硬盘相对于固态硬盘成本更低。D、机械硬盘相对于固态硬盘噪音更小。5.单选题(分值:3分)下列哪一类光盘只允许一次刻录,不能重写(B)。A.DVD-RW B.CD-RC.CD-RW D.DVD+RW6.单选题(分值:3分)下列哪一种存储方式允许任何服务器连接到任何存储阵列,这样不管数据放在哪里,服务器都可以直接存取所需的数据?(B)A.DAS B.SANC.RAMD.NAS7.单选题(分值:3分)大数据的一个重要特征就是数据量大。ZB和TB之间的换算关系是以下哪一个?(C)A、1ZB=210TBB、1ZB=220TBC、1ZB=230TBD、8.多选题(分值:3分)存储介质选用原则(ABCD)A.耐久性 B.容量恰当C.低费用D.广泛的可接受性9.多选题(分值:3分)DAS直接附加存储就是将存储设备通过SCSI接口直接连接到一台服务器上使用,它的优点主要体现在(ABC)A.购置成本低,配置简单 B.使用方法与使用本机硬盘并无太大差别C.比较适合中小企业使用D.便于集中管理、分析和使用10.多选题(分值:3分)下列哪些是常用数据存储方式?(ABD)。A.DAS B.SANC.RAMD.NAS在线测试:传统数据存储管理1.单选题(分值:3分)在关系数据库的某一数据表中,如果存在关键字,则数据表中不可能存在重复的记录(A)。A、正确B、错误2.单选题(分值:3分)数据仓库是不可更新的,数据仓库主要是为决策分析提供数据,涉及的操作主要是数据的查询(A)。A、正确B、错误3.单选题(分值:3分)下列关于文件系统的描述不正确的是(D)。A.在文件系统上编写应用程序的效率不高 B.文件系统不支持对文件的并发访问C.文件系统通常不可避免数据冗余 D.文件系统容易有效保证数据安全性和保密性4.单选题(分值:3分)下列关于关系数据库的描述错误的是。(D)。A、一个数据库中可以有很多张二维表B、一个关系表中的一列为一个属性或者字段C、关键字可以用来确定表中记录的唯一性D、同一数据库中可以出现两个相同名字的表5.单选题(分值:3分)数据仓库的最终目的是?(D)A、收集业务需求B、建立数据仓库逻辑模型C、开发数据仓库的应用分析D、为用户和业务部门提供决策支持6.单选题(分值:3分)关系数据表中的关键字由(D)个字段组成A、一个B、两个C、多个D、一个或多个7.多选题(分值:3分)下列哪些是关系数据库(ABD)。A.Oracle B.MySQL C.HBase D.MicrosoftSQLServer8.多选题(分值:3分)一个典型的数据仓库系统通常包含(ABCD)。A.数据源B.数据存储和管理C.OLAP服务器D.前端工具和应用9.多选题(分值:3分)下列关于数据仓库的描述正确的是(ABD)。A.数据仓库是不可更新的B.数据仓库主要是为决策分析提供数据,涉及的操作主要是数据的查询C.数据仓库是面向事物设计的D.数据仓库存储的一般是历史数据10.多选题(分值:3分)下列关于并行数据库的描述正确的有(ABCD)。A.并行数据库是指那些在无共享的体系结构中进行数据操作的数据库系统。B.并行数据库是通过多个节点并行执行数据库任务,以提高整个数据库系统的性能。C.并行数据库的系统的容错性较差,如果在查询过程中节点发生故障,那么整个查询都要从头开始重新执行。D.并行数据库系统没有较好的弹性,进行扩展和收缩比较麻烦。在线测试:大数据的存储管理1.单选题(分值:3分)分布式文件系统把大量数据分散到不同的节点上存储,数据丢失的风险增加了(B)A、正确B、错误2.单选题(分值:3分)HBase是一种NoSQL模型,它是一个疏松的、分布式的、已排序的多维度持久化的列族数据库(A)A、正确B、错误3.单选题(分值:3分)一般而言,分布式数据库是指物理上分散在不同地点,但在逻辑上是统一的数据库。因此分布式数据库具有物理上的独立性、逻辑上的一体性、性能上的可扩展性等特点。(A)A、正确B、错误4.单选题(分值:3分)列族数据库需要在每行中都有固定的模式和固定数量的列(B)。A、正确B、错误5.单选题(分值:3分)非关系型数据库和分布式文件系统使得数据的存储可以发展到数以千计的节点上,具有更高的可用性和可扩展性(A)。A、正确B、错误6.单选题(分值:3分)根据云存储的单位不同,云存储可以分为?(A)A、对象存储、块存储和文件存储B、对象存储、块存储和软件存储C、文件存储、块存储和硬件存储D、软件存储、块存储和硬件存储7.多选题(分值:3分)大数据存储和传统数据的存储主要在以下方面不同(ABC)。A、大数据需要存储设备容量更大B、大数据存储需要高性能、高吞吐率的设备C、大数据存储非结构化数据占据主要比重D、大数据存储结构化数据占据主要比重8.多选题(分值:3分)典型的NoSQL数据库有哪些形式?(ABCD)。A.列族数据库B.键位数据库 C.文档数据库 D.图形数据库9.多选题(分值:3分)大数据的存储方式主要包括哪几种?(ABCD)。A.分布式存储B.NoSQL数据库C.NewSQL数据库D.云存储10.多选题(分值:3分)下列关于分布式存储的描述正确的是(ACD)。A.分布式文件系统中的每个节点可以分布在不同的地理位置B.使用分布式文件系统时,需要关心数据存储在哪个节点上,分别进行存储与管理C.分布式文件系统具有冗余性,部分节点的故障并不影响整体的正常运行D.分布式文件系统通过网络将大量零散的计算机连接在一起,形成一个巨大的计算机集群,使各主机均可以发挥其价值在线测试:初识数据分析1.单选题(分值:3分)按照复杂性由低到高排序,下列哪项正确?(D)A、诊断性分析、描述性分析、预测性分析、规范性分析B、描述性分析、诊断性分析、规范性分析、预测性分析C、诊断性分析、描述性分析、规范性分析、预测性分析D、描述性分析、诊断性分析、预测性分析、规范性分析2.单选题(分值:3分)下列哪种数据分析是最常见也最普遍的形式(A)。A、描述性分析B、诊断性分析C、预测性分析D、规范性分析3单选题(分值:3分)2022年8月份销售额与2022年7月销售额对比称为同比。(B)A、正确B、错误4单选题(分值:3分)建立指标体系可以按因果结构划分进行指标分解,也可按照业务职能结构划分映射更多维度。(A)A、正确B、错误5单选题(分值:3分)下列哪一项是描述性分析?(B) A、为什么来自东部地区的求助电话比来自西部地区的要多?B、过去12个月的销售量如何?C、为什么最近三个月内病人再入院的比率有所提升?D、何时才是抛售一只股票的最佳时机?6.单选题(分值:3分)下列哪项操作是从细粒度的数据向高层的聚合(B)A.钻取(Drill-down) B.上卷(Roll-up)C. 切片(Slice)D. 切块(Dice)7.多选题(分值:3分)在数据分析的对比分析中,下列分析维度中属于纵比的是(BE)A、实际完成值与目标进行对比B、选择不同时期的指标数值作为对比标准C、与同级部门、单位、地区进行对比D、与行业中的标杆企业、竞争对手或行业的平均水平进行对比E、对某项营销活动开展前后进行对比8.多选题(分值:3分)下列哪些情况适合使用平均分析法(AB)。A.同类现象在不同地区、不同行业、不同类型单位等之间的差异程度B.某些现象在不同历史时期的变化C.今年二季度与去年二季度销售情况的对比D.分析今年一季度各类产品销售情况9.多选题(分值:3分)下列数据思维模式属于定量思维模式的是(CD)。A、结构性思维B、假说演绎思维C、指标化思维D、维度分析思维10.多选题(分值:3分)下列说法正确的是(AB)。A.结构化思维就是把复杂问题分解成多种单一因素,并使之条理化、纲领化 B.假说演绎思维是以假设作为思考的起点,先提出问题,然后用MECE原则梳理关联因素间的结构关系。C.指标化思维就是在数据分析时都按照统一指标来进行分析。D.在维度思维分析中,维度越多越好。在线测试:运用大数据分析1.单选题(分值:3分)下列关于大数据的分析理念的说法中,错误的是(C)。A、在数据基础上倾向于全体数据而不是抽样数据B、在分析方法上更注重相关分析而不是因果分析C、在数据规模上强调相对数据而不是绝对数据D、在分析效果上更追求效率而不是绝对精准2.单选题(分值:3分)在某些情况下,如果数据工作的目标是关注异常值,这些异常值将成为数据工作的焦点。(A)。A、正确B、错误3.单选题(分值:3分)大数据分析,是对数据全集的分析,要保证数据没有一点噪音,同时也要考虑数据的分布状态。(B)。A、正确B、错误4.单选题(分值:3分)大数据时代数据规模大,数据分析算法需要进行调整,需要解决算法的效率问题。(A)。A、正确B、错误5.单选题(分值:3分)时间序列是一种用于研究数据随时间变化的算法,是一种常用的回归预测方法。(A)。A、正确B、错误6.单选题(分值:3分)公司销量预测属于哪一种大数据分析方法?(D)A.聚类B.分类C.关联D.回归7.单选题(分值:3分)假设要对产品用户画像进行分析,适合选用哪种大数据分析模型进行分析(A)A、属性分析模型B、分布分析模型C、用户分群分析模型D、用户行为路径分析模型8.单选题(分值:3分)某公司为了更好维护客户关系,做到不同客户差别化处理,适合选用哪种大数据分析模型进行分析(C)A、属性分析模型B、分布分析模型C、用户分群分析模型D、用户行为路径分析模型9.单选题(分值:3分)某游戏商想找到游戏用户流失原因,应选用哪种大数据分析模型进行分析(C)A、行为事件分析模型B、漏斗分析模型C、留存分析模型D、点击分析模型10.多选题(分值:3分)在降维分析方法中,目前主要有两种降维方法(AC)A、基于特征选择的降维B、基于数据清洗的降维C、基于维度变换的降维D、基于数据集成的降维在线测试:探究数据挖掘1.单选题(分值:3分)数据挖掘的数据源,必须满足那个条件?(C)A、纯粹性,没有噪声B、结构化,有条理C、真实性,切合实际D、普适性,放之四海皆准2.单选题(分值:3分)聚类分析中的聚类必须要有目标(B)。A、正确B、错误3.单选题(分值:3分)下列关于聚类挖掘技术的说法中,错误的是(D)A、不预先设定数据归类类目,完全根据数据本身性质将数据聚合成不同类别B、要求不同类数据的内容相似度尽可能小C、与分类挖掘技术相似的是,都是要对数据进行分类处理D、要求同类数据的内容相似度尽可能小4.单选题(分值:3分)下列哪一种方法属于常用的聚类分析?(B)A、决策树B、K-MeansC、叶斯网络D、KNN算法5.单选题(分值:3分)(B)是将复杂问题简单化之后,再进行分析和处理的一种数据分析方法。A、关联分析B、分类与预测C、异常分析D、聚类分析6.单选题(分值:3分)数据挖掘是数据库知识发现中的一个重要步骤,数据挖掘的过程是指对所得到的经过转换的数据进行挖掘,其一般流程为?(A)A、建模→评估→部署B、部署→评估→建模C、评估→部署→建模D、建模→部署→评估7.单选题(分值:3分)Apriori算法是(A)的一种最常用的算法A、关联分析B、异常分析C、聚类分析D、分类与预测8.单选题(分值:3分)下列关于聚类挖掘技术的说法中,错误的是(B)。A、不预先设定数据归类类目,完全根据数据本身性质将数据聚合成不同类别;B、要求同类数据的内容相似度尽可能小;C、要求不同类数据的内容相似度尽可能小;D、与分类挖掘技术相似的是,都是要对数据进行分类处理9.单选题(分值:3分)沃尔玛的啤酒尿布的故事体现了(C)算法?A.聚类B.分类C.关联D.回归10.单选题(分值:3分)关于数据挖掘,以下说法正确的是(A)A、数据挖掘就是从大量的、不完全的、有噪声的、模糊的、随机的实际应用数据中,提取隐藏在其中但又潜在有价值的信息和知识的过程B、数据挖掘的原始数据必须是结构化数据或半结构化数据,不可以使用非结构化数据C、聚类分析与分类分析相似,都需要依赖预先定义的类,即训练集D、数据挖掘涉及多个学科方向,主要包括:数据库、统计学和人工学习等在线测试:认识数据可视化1.单选题(分值:3分)导航地图提供的实时查询交通路况信息实际上就是数据可视化的应用(A)A、正确B、错误2.单选题(分值:3分)短视频与交互图表都属于可视化图表类型(A)。A、正确B、错误3.单选题(分值:3分)人们手机上浏览的信息长图不属于可视化技术应用的体现(B)A、正确B、错误4.单选题(分值:3分)下列哪一个数据可视化工具是需要编程的可视化工具(C)。A.FineBIB.Tableau C.Python D.GoogleChart5单选题(分值:3分)在进行数据可视化设计前,首先一定要明确数据可视化的需求是什么(A)A、正确B、错误6.单选题(分值:3分)同样一份数据,可以选择使用不同类型的图表实现相同目标,所以可以根据表现形式的美观来决定选择哪种图表(A)。A、正确B、错误7.单选题(分值:3分)关于数据可视化的内容,以下哪一个说法是错误的(C)A、可视化流程主要包括数据采集、数据处理和变换、可视化映射和用户感知四个模块B、可视化研究的问题是社会自然现象和过程,而非数据本身C、数据降维是为了从数据信号中去除不需要的部分D、数据聚类和剖分的方法可以将数据中有相似特征的区域和相邻区域分开8.多选题(分值:3分)数据可视化可以通过(BCD)等手段直观、生动、形象展示数据的形式。A.数字 B.图表C.动画 D.图形9.多选题(分值:3分)在进行数据可视化设计时,需要为内容而设计,并优化展现形式,需要做到以下几点(ABCD)A.视觉一致性 B.逻辑结构清晰C.具有愉悦性D.遵循品牌内部的设计语言10.多选题(分值:3分)数据可视化作用主要有(ABCD)。A.传递更多信息,便于理解数据 B.辅助分析数据 C.有效观测、跟踪动态数据 D.能增强数据吸引力在线测试:选择可视化图表1.单选题(分值:3分)当用于对比的项目很多的情况下,适合使用柱状图(B)A、正确B、错误2.单选题(分值:3分)下列哪一种图表可以展示多个维度下某一维度不同数值的部分和整体情况(C)。A.饼图 B.玫瑰图C.堆积图 D.环形图3.单选题(分值:3分)旭日图中每个级别的数据通过1个圆环表示,越往内,级别越低,且分类越细(B)。A、正确B、错误4.单选题(分值:3分)要通过可视化图表表现本月收入在上月收入的基础上变化的原因,最适合的图表是(D)。A.柱状图 B.旭日图C.折线图 D.瀑布图5.单选题(分值:3分)处理双变量数据集时主要关心两个变量之间是否存在某种关系及这种关系的具体形式。以下哪项是双变量数据图表(C)A、雷达图B、直方图C、散点图D、柱状图6.单选题(分值:3分)与柱形图相比,折线图更适合展现增幅、增长值,但不适合展现绝对值(A)。A、正确B、错误7.多选题(分值:3分)下列哪几种图表可以描述数据相关性,识别变量之间的相互关系(BC)。A.直方图 B.散点图C.气泡图 D.雷达图8.多选题(分值:3分)下列哪些图表可以用来反映事物的分布、占比情况(ABC)。A.散点图 B.气泡图C.词云图D.折线图9.多选题(分值:3分)下列哪些图表可以用来反映事物的发展趋势(BCD)。A.雷达图 B.柱形图 C.折线图 D.面积图10.多选题(分值:3分)下列哪些图表可以用于项目与项目之间的对比,来发现不同事物间的差异和差距(ABCD)。A.条形图 B.雷达图C.词云图 D.热力图在线测试:使用BI可视化工具1.单选题(分值:3分)BI可视化工具,一般都可以让用户轻松连接导入不同类型的数据源,如MicrosoftExcel数据集、SQL数据集等(A)。A、正确B、错误2.单选题(分值:3分)在BI仪表板使用中,内容创建者可以使用筛选器和操作之类的交互式元素,在单个屏幕中组合图表、图形和报告,从而提供快照概览(A)。A、正确B、错误3.单选题(分值:3分)使用FineBI导入数据源的时候,智能导入MicrosoftExcel数据集(B)。A、正确B、错误4.单选题(分值:3分)在FineBI中当基础表不能直接用于分析时,可以利用「自助数据集」对基础表进行处理,从而得到一张或者几张已处理的新表(A)。A、正确B、错误5.单选题(分值:3分)FineBI自助数据集可以实现数据的过滤、分组汇总、新增列、数据修改、排序等操作(B)A、正确B、错误6.单选题(分值:3分)在FineBI中自助数据集可以选取你想要的数据,并对原进行改造,例如数据的过滤、分组汇总、新增列、字段设置、排序、数据合并等(A)A、正确B、错误7.多选题(分值:3分)下列哪些设置可以在FineBI【图形属性】中实现?(ACD)A.图形标签 B.图例C.图形颜色 D.图形大小8.多选题(分值:3分)在大数据时代,BI数据可视化工具必须具有下列哪些特性(ABCD)。A.实时性 B.操作简单C.丰富的展现方式 D.多种数据集成支持方式9.多选题(分值:3分)下列哪些是目前常用的自助式商业智能可视化工具(ABCD)。A.PowerBI B.SmartBIC.Tableau D.FineBI10.多选题(分值:3分)在大数据时代,数据可视化技术在广泛应用的同时,也面临诸多新的挑战,包括(ABCD)。A.数据规模B.数据融合C.图表绘制效率D.图表表达能力在线测试:认识大数据安全1.单选题(分值:5分)数据安全是要保障数据的收集、使用、存储、传输、披露、跨境转移、销毁等全生命周期的安全(A)A.正确B.错误2.单选题(分值:5分)在大数据时代,数据流动与否不影响数据的价值。(B)A.正确B.错误3.单选题(分值:5分)(A)是用某种特殊的算法改变原有的信息数据使其不可读或无意义,使未授权用户获得加密后的信息,因不知解密的方法而仍无法了解信息的内容。A.数据加密技术B.身份认证技术C.访问控制技术D.安全审计技术4.单选题(分值:5分)(C)是指防止对任何资源进行未授权的访问,从而使计算机系统在合法的范围内使用。A.数据加密技术B.身份认证技术C.访问控制技术D.安全审计技术5.单选题(分值:5分)(D)是指对敏感数据通过脱敏规则进行变形从而实现对敏感数据保护的过程。A.数据加密技术B.恢复与销毁技术C.访问控制技术D.数据脱敏技术6.多选题(分值:5分)数据安全有对立的两方面的含义,是指(AD)A.数据本身的安全B.数据备份的安全C.数据使用的安全D.数据防护的安全7.多选题(分值:5分)传统的数据安全,重点关注的是以下几个方面的静态安全(ABD)A.保密性B.可用性C.身份识别D.完整性8.多选题(分值:5分)下列哪些体现了大数据安全的特征(ABCD)A.安全屏障一旦被攻破,攻击者就能一次性获得较大收益。B.个人信息权利被动削弱,用户的隐私安全受到威胁C.大数据技术被应用到攻击手段中,攻击目的由原来的单纯窃取数据变为操纵分析结果D.大数据成为高级可持续攻击的载体9.多选题(分值:5分)当企业发生数据泄露时,会对企业造成哪些影响(ABCD)A.公众会对企业产生不信用感B.对企业竞争力产生威胁C.影响企业的声誉D.有可能直接影响企业的生存10.多选题(分值:5分)中国信息通信研究院将大数据安全技术体系分为哪3个层次(ABC)A.大数据安全平台B.数据管理安全C.隐私保护安全D.财产保护安全在线测试:关注个人信息与隐私安全1.单选题(分值:5分)下列不属于个人信息安全问题的是(D)。A.个人信用B.个人健康C.位置信息D.军事数据2.单选题(分值:5分)隐私不必表现为记载性的信息,也可以是私人的生活方式。(A)。A、正确B、错误3.单选题(分值:5分)在网上参加的活动,发表及阅读

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论