版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
大数据导论智慧树知到期末考试答案2024年大数据导论下列哪一项不属于NoSQL的类型()。
A:文档数据库B:时间戳数据库C:列族数据库D:图数据库答案:时间戳数据库大数据技术中的哪个特征指的是数据量超大规模和增长,尤其是非结构化数据比结构化数据增长快10倍到50倍,是传统数据仓库的10倍到50倍()。
A:低价值密度B:多样性C:高速D:大量性答案:多样性大数据和云计算的关系是相辅相成的,云计算就是服务可租用、服务可计量和下列哪项的总和()。
A:高智能性B:高时效性C:高实践性D:高性价比答案:高性价比当前世界产生的数据总量的单位是()。
A:GBB:TBC:KBD:ZB答案:ZB就数据的量级而言,1PB数据换算成TB数据为()。
A:1024B:2048C:1000D:512答案:1024Web内容挖掘实现技术不包括以下哪项()。
A:文本展示B:文本聚类C:关联规则D:文本分类答案:文本展示下面哪一个不属于大数据伦理问题()。
A:隐私泄露问题B:数据安全问题C:数字鸿沟问题D:数据冗余问题答案:数据冗余问题下面关于推荐系统的描述错误的是()。
A:推荐系统可以发现用户的兴趣点,帮助用户发掘潜在的需求B:推荐系统是一种只能通过专家进行人工推荐的系统C:推荐系统是自动联系用户和物品的一种工具D:推荐系统通过研究用户的兴趣偏好,进行个性化计算答案:推荐系统是一种只能通过专家进行人工推荐的系统K-means算法属于下列哪种类型的算法()。
A:分类B:决策树C:聚类D:归纳答案:聚类下列哪一项是云计算的核心支撑技术,是将各种计算及存储资源整合和高效利用的关键技术()。
A:数据管理技术B:虚拟化技术C:并行运算技术D:数据存储技术答案:虚拟化技术电商网站上的“猜你喜欢”实际上是基于下列哪个原理()。
A:数据仓库B:推荐系统C:物联网D:网络爬虫答案:推荐系统HDFS中的block默认保存几个备份()。
A:3份B:不确定C:1份D:2份答案:3份大数据的核心就是()。
A:预测B:匿名化C:规模化D:告知与许可答案:匿名化数据清洗的方法不包括()。
A:噪声数据清除B:重复数据记录处理C:缺失值处理D:一致性检查答案:重复数据记录处理下列关于Hadoop的描述错误的是()。
A:Hadoop采用分布式存储和分布式处理两大核心技术B:Hadoop可以高效稳定地运行在廉价的计算机集群上,可以扩展到数以千计的计算机节点上C:Hadoop是一个能够对大量数据进行分布式处理的软件框架D:Hadoop只支持Java编程语言答案:Hadoop只支持Java编程语言Spark的组件中,用于做查询分析的是()。
A:SparkCoreB:SparkMLibC:SparkSQLD:SparkStreaming答案:SparkSQLHadoop是下列哪个公司旗下的分布式计算平台()。
A:GoogleB:IBMC:ApacheD:Amazon答案:Apache下列哪一项属于非结构化数据()。
A:企业ERP数据B:财务系统数据C:日志数据D:视频监控数据答案:视频监控数据新兴技术日新月异,被称为新一代信息技术“四驾马车”的是()。
A:人工智能、云计算、大数据和移动互联网B:物联网、云计算、大数据和工业4.0C:物联网、云计算、大数据和人工智能D:物联网、云计算、大数据和移动互联网答案:物联网、云计算、大数据和移动互联网物联网连接的是物理世界和()。
A:现实世界B:虚拟世界C:人类世界D:信息世界答案:信息世界假设12个销售价格记录已经排序,如下所示:5,10,11,13,15,35,50,55,72,92,204,215。使用等深划分为深度为3的4个箱子里,15在第几个箱子里()。
A:第三个B:第一个C:第四个D:第二个答案:第二个下面哪一项是将复杂问题简单化之后,再进行分析和处理的一种数据分析方法()。
A:异常分析B:关联分析C:聚类分析D:分类与预测答案:分类与预测以下哪个不是典型的分类方法()。
A:人工神经网络B:朴素贝叶斯C:决策树D:K-Means答案:K-Means噪声数据处理的主要方法不包括()。
A:分箱B:聚类C:回归D:关联分析答案:关联分析以下哪项不属于传统的数据存储和管理技术()。
A:关系数据库B:NoSQL数据库C:文件系统D:数据仓库答案:NoSQL数据库HDFS存储的特点中,错误的是()。
A:提供了统一的访问接口B:实现了数据的冗余存储C:分块存储增强了数据访问的并行性D:只能有一个NameNode答案:只能有一个NameNode可以用来处理缺失数据的方法为()。
A:数据集成B:数据变换C:数据清洗D:数据排序答案:数据清洗下面关于Hive,说法错误的是()。
A:Hive底层采用的计算引擎是MapReduceB:Hive提供的HQL语法,与传统SQL很类似C:HiveServer可采用MySQL存储元数据信息D:Hive支持所有标准SQL语法答案:Hive支持所有标准SQL语法散点图矩阵是通过几维坐标系中一组点来展示变量之间的关系()。
A:二维B:一维C:三维D:多维答案:二维卫生保健数据大致由药理学科研数据、临床数据、个人行为和情感数据,就诊记录和开销数据等,这体现了大数据的哪一个特征()。
A:高速B:价值密度低C:真实性D:多样性答案:多样性下列选项不属于Hadoop特性的是()。
A:高容错性B:高可靠性C:运行在Linux平台上D:成本高答案:成本高从大量数据中提取知识的过程通常称为()。
A:数据清洗B:数据挖掘C:人工智能D:数据仓库答案:数据挖掘以下关于大数据关键问题的说法,不正确的是()。
A:传统的统计理论与技术能很好地实现大数据知识发现B:非结构化与半结构化数据的处理是一项重要的课题C:大数据处理问题复杂多样,难以用一种单一的计算模式涵盖D:大数据复杂性,不确定性特征描述的方法及大数据的系统建模是实现大数据知识发现的前提与关键答案:传统的统计理论与技术能很好地实现大数据知识发现“啤酒与尿布“的故事,体现了哪种大数据思维方式()。
A:相关而非因果B:我为人人,人人为我C:全样而非抽样D:效率而非精确答案:相关而非因果一切皆可连,任何数据之间逻辑上都有可能存在联系,这体现了大数据思维中的()。
A:实验思维B:相关思维C:定量思维D:因果思维答案:相关思维以下不属于大数据技术特征的是()。
A:随机抽样B:关注数据的相关性C:重视数据的复杂性D:全面分析数据答案:随机抽样以下哪个不是数据可视化方法和技术()。
A:多维数据可视化技术B:混合建模技术C:文本数据可视化技术D:时空数据可视化技术答案:混合建模技术数据质量最为基础的一项评估标准()。
A:数据一致性B:数据准确性C:数据完整性D:数据及时性答案:数据完整性数据的不确定性的产生原因不包括()。
A:缺失值处理B:数据特征描述C:数据精度转换D:数据采集与传输答案:数据特征描述大数据有哪些数据类型()。
A:结构化数据B:传统结构数据C:半结构化数据D:非结构化数据答案:半结构化数据###结构化数据###非结构化数据大数据安全表现出与传统数据安全不同的特征,具体来说包括()。
A:大数据成为高级可持续攻击的载体B:大数据技术被应用到攻击手段中C:大数据成为网络攻击的显著目标D:大数据加大隐私泄露风险答案:大数据加大隐私泄露风险###大数据成为网络攻击的显著目标###大数据成为高级可持续攻击的载体###大数据技术被应用到攻击手段中云计算的特点包括以下哪些方面()。
A:服务可计算B:低使用度C:高性价比D:服务可租用答案:服务可租用###服务可计算###高性价比以下关于大数据与人工智能的联系,描述正确的是()。
A:大数据为人工智能提供了海量的数据,使得人工智能技术有了长足的发展B:人工智能需要数据来建立其智能,特别是机器学习C:大数据技术为人工智能提供了强大的存储能力和计算能力D:人工智能应用的数据越多,其获得的结果就越准确答案:人工智能应用的数据越多,其获得的结果就越准确###人工智能需要数据来建立其智能,特别是机器学习###大数据为人工智能提供了海量的数据,使得人工智能技术有了长足的发展###大数据技术为人工智能提供了强大的存储能力和计算能力Apache软件基金会最重要的三大分布式计算系统开源项目包括()。
A:StormB:HDFSC:HadoopD:Spark答案:Hadoop###Spark###Storm以下属于云计算的特点的有()。
A:以人为中心B:高可靠和安全性C:资源池弹性可扩张D:虚拟化答案:资源池弹性可扩张;虚拟化;高可靠和安全性下列关于数据生命周期管理的核心认识中,正确的是()。
A:在不同的数据存在阶段,数据的价值是不同的B:数据生命周期管理最终关注的是社会效益C:数据从产生到被删除销毁的过程中,具有多个不同的数据存在阶段D:根据数据价值的不同应该对数据采取不同的管理策略答案:数据生命周期管理最终关注的是社会效益下列哪些选项属于大数据在城市管理中的应用()。
A:城市规划B:比赛预测C:智能交通D:环保监测答案:智能交通###城市规划###环保监测关于大数据的内涵,以下理解正确的是()。
A:大数据是指海量的数据B:大数据在不同领域,又有不同的状况C:大数据是一种思维方式和新的管理、治理路径D:大数据里面蕴藏着大知识、大智慧、大价值和大发展答案:大数据是一种思维方式和新的管理、治理路径###大数据里面蕴藏着大知识、大智慧、大价值大数据区别于传统数据的特征有()。
A:表现形式多样化B:具有极高的信息价值C:海量数据存储D:数据增长迅速答案:具有极高的信息价值###数据增长迅速###海量数据存储###表现形式多样化HBase的系统架构包括哪几个组成部分()。
A:Master主服务器B:客户端C:Region服务器D:Zookeeper服务器答案:Region服务器###Master主服务器###客户端###Zookeeper服务器根据云存储的单位不同,云存储可以分为()。
A:块存储B:文件存储C:对象存储D:硬件存储答案:对象存储###文件存储###块存储可以从哪些维度评价数据价值()。
A:数据品种B:数据样本量C:数据完整性D:数据实时性答案:数据品种###数据完整性###数据实时性###数据样本量Hadoop的框架最核心的设计是()。
A:HDFSB:GFSC:MapReduceD:Spark答案:HDFS###MapReduce下列关于脏数据的说法中,正确的是()。
A:编码不统一B:数据不完整C:数据格式不规范D:数据与实际业务关系不大答案:格式不规范;编码不统一;与实际业务关系不大;数据不完整数据脱敏的主要原则包括()。
A:多次脱敏之间的数据一致性B:保持数据之间的一致性C:保持原有数据特征D:保持业务规则的关联性答案:保持业务规则的关联性###保持原有数据特征###保持数据之间的一致性###多次脱敏之间的数据一致性科学可视化的类型包含下列哪些选项()。
A:向量场可视化B:信息场可视化C:标量场可视化D:张量场可视化答案:张量场可视化###标量场可视化###向量场可视化Spark的特点主要包括()。
A:运行速度快B:容易使用C:通用性D:运行模式单一答案:容易使用###运行速度快###通用性Hive的系统架构主要包括哪几个模块()。
A:探查模块B:元数据存储模块C:用户接口模块D:驱动模块答案:驱动模块###元数据存储模块###用户接口模块为了保证大数据安全,在数据应用上,按照“一数一源,一源一用“的原则,实现大数据管理的集中化、标准化、安全化。()
A:错B:对答案:错对于大数据而言,最基本、最重要的要求就是减少错误、保证质量。因此,大数据收集的信息要尽量精确。()
A:错B:对答案:错数据的处理和变换可以认为是可视化的前期处理。一方面原始数据不可避免含有噪声和误差;另一方面,数据的模式和特征往往被隐藏。()
A:错B:对答案:对数据化就是数字化,是相互等同的关系。()
A:错B:对答案:错HDFS为海量的数据提供了计算,而MapReduce为海量的数据提供了存储。()
A:对B:错答案:错利用大数据分析技术可以为客户定制个性化的消费体验。()
A:错B:对答案:对信息可视化处理的对象是抽象的、结构化的数据集合。()
A:错B:对答案:错数据清洗是将重复、多余的数据筛选清除,将缺失的数据补充完整,将错误的数据纠正或删除,最后将其整理成进一步加工、使用的数据。()
A:对B:错答案:对数据失真技术就是要对数据进行扰动,即“掺沙子”,让敏感的数据不容易被识别出来,“沙子”掺的越多,数据越安全。()
A:对B:错答案:错传统的关系数据库和NoSQL数据库各有所长,不存在一方完全取代另一方的问题,在很长的一段时期内,二者都会存在,满足不同应用的差异化需求。()
A:对B:错答案:对Hadoop支持数据的随机读写。()
A:错B:对答案:错采样分析的精确性随着采样随机性的增加而大幅提高,但与样本数量的增加关系不大。()
A:错B:对答案:对电子表格、视频、网页HTML均属于结构化数据。()
A:对B:错答案:错协同过滤是最早、最知名的推荐算法,可分为基于用户的协同过滤和基于物品的协同过滤。()
A:对B:错答案:对分布式文件系统改变了数据存储和管理方式,
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 植物学实习报告总结
- 2024静脉注射白蛋白的国际输血医学协作指南
- 2025中国肾脏移植受者远期系统并发症临床诊疗指南课件
- 西南交通大学《力学》课件-第1章静力学的基本概念和受力分析
- 2026年碳刷行业分析报告及未来发展趋势报告
- 2026年洗发护发行业分析报告及未来发展趋势报告
- 2026年运动防护用具行业分析报告及未来发展趋势报告
- 2026年高考语文写作押题作文(10篇)
- 初中数学专题《阿波罗尼斯圆》含答案
- 2026年孕妇羊奶粉行业分析报告及未来发展趋势报告
- 北师大版八年级数学下册数学活动:体脂率的计算与分析课件
- 2026新疆天宜养老有限责任公司招聘6人备考题库含答案详解(培优b卷)
- 电气控制与PLC应用技术 (S7-1200)-教案 模块3 S7-1200 PLC的基本指令及其应用
- 【2026年春新教材】部编版小学二年级下册道德与法治全册教案
- 胰腺癌化疗后骨髓抑制姑息处理方案
- 关节损伤康复培训课件
- 上海上海申康医疗卫生建设工程公共服务中心招聘笔试历年参考题库附带答案详解
- 纪委书记岗位面试题集
- DB32∕T 5172-2025 工程渣土资源化利用技术规程
- 2025年北京联合大学招聘真题(行政管理岗)
- 安全环保法律法规培训
评论
0/150
提交评论