第五章练习附有答案_第1页
第五章练习附有答案_第2页
第五章练习附有答案_第3页
第五章练习附有答案_第4页
第五章练习附有答案_第5页
已阅读5页,还剩17页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第五章练习[复制]基本信息:[矩阵文本题]*姓名:________________________班级:________________________学号:________________________一、选择题1、从互联网产生大数据的角度来看,大数据具有的特征是()[单选题]*A、“4V”特征:大量(Volume)、多样(Variety)、低价值密度(Value)、高速(Velocity)、(正确答案)B、样本渐趋于总体,精确让位于模糊,相关性重于因果C、分布式存储,分布式并行计算D、没有特征答案解析:大数据具有“4V”特征:大量(Volume)、多样(Variety)、低价值密度(Value)、高速(Velocity)。2、下列关于大数据的特征,说法正确的是()。[单选题]*A、数据价值密度高B、数据类型少C、数据基本无变化D、数据体量巨大(正确答案)答案解析:大数据具有“4V”特征:大量(Volume)、多样(Variety)、低价值密度(Value)、高速(Velocity)。3、大数据的最显著特征是( )。[单选题]*A、数据规模大(正确答案)B、数据类型多样C、数据处理速度快D、数据价值密度高答案解析:大数据最显著的特征是大量(Volume),也就是数据规模大4、当前社会中,最为突出的大数据环境是( )。[单选题]*A、互联网(正确答案)B、物联网C、综合国力D、自然资源答案解析:大数据的起源是互联网,所以目前最为突出的大数据环境仍是互联网。5、大数据在我们的生活中,无处不在,下列说法正确的是()[单选题]*A、大数据带给我们的全部都是正面的影响。B、大数据给我们的生活带来便捷的同时也会产生负面影响。(正确答案)C、大数据可能会带来个人信息泄露,我们应该全盘否定D、大数据只会给我们带来信息伤害与诈骗。答案解析:大数据给我们的生活带来方便支付、方便出行、方便购物和方便就医都正面的作用,同时也带来了个人信息泄露、信息伤害与诈骗等负面影响。6、下列论据中,能够支撑“大数据无所不能”的观点的是( )。[单选题]*A、互联网金融打破了传统的观念和行为(正确答案)B、大数据存在泡沫C、大数据具有非常高的成本D、个人隐私泄露与信息安全担忧答案解析:大数据的起源是互联网。7、当前大数据技术的基础是由( )首先提出的。[单选题]*A、微软B、百度C、谷歌(正确答案)D、阿里巴巴答案解析:大数据技术的观点首先由谷歌(Google)提出8、下列国家的大数据发展行动中,集中体现“重视基础、首都先行”的国家是( )。[单选题]*A、美国B、日本C、中国D、韩国(正确答案)答案解析:韩国提出了“重视基础、首都先行”。9、大数据时代,数据使用的关键是()。[单选题]*A、数据收集B、数据存储C、数据分析D、数据再利用(正确答案)答案解析:大数据时代,数据使用的关键是数据再利用。10、支撑大数据业务的基础是( )。[单选题]*A、数据科学B、数据应用(正确答案)C、数据硬件D、数据人才答案解析:数据应用是支撑大数据业务的基础11、大数据时代,数据使用的关键是( )。[单选题]*A、数据收集B、数据存储C、数据分析D、数据再利用(正确答案)答案解析:大数据时代,数据使用的关键是数据再利用。12、智能健康手环的应用开发,体现了( )的数据采集技术的应用。[单选题]*A、统计报表B、网络爬虫C、API接口D、传感器(正确答案)答案解析:智能健康手环可以通过传感器采集人的血压、心跳、步数等数据采。13、数据采集的基本方法包括()、网络数据采集法和其他数据采集法。[单选题]*A、数据库采集法B、访问记录采集法C、数据目录采集法D、系统日志采集法(正确答案)答案解析:数据采集的基本方法包括系统日志采集法、网络数据采集法和其他数据采集法。14、网络数据采集法,主要通过网络爬虫或网站公开API的方式获取,网络爬虫从网页的()开始获取。[单选题]*A、HTMLB、WWWC、URL(正确答案)D、XML答案解析:网络爬虫从网页的URL开始获取,采集类型支持图片、音频、视频等文件或附件的采集,附件与正文可以自动关联。15、下列()不属于Python网络数据采集程序使用的扩展库。[单选题]*A、System(正确答案)B、SciPyC、PandasD、Matplotlib答案解析:Python网络数据采集程序使用的扩展库主要有:NumPy、SciPy、Pandas、Matplotlib。16、在Python模块库中有大量模块可供使用,要想使用这些文件,就需要用()语句把指定模块导入当前程序中。[单选题]*A、moveB、inC、import(正确答案)D、print答案解析:在Python模块库中有大量模块可供使用,要想使用这些文件,就需要用import语句把指定模块导入当前程序中,格式:importmodule。17、下列()不是数据保护的有效方法。[单选题]*A、剪切(正确答案)B、复制C、拷贝D、镜像答案解析:数据保护的有效方法:拷贝、备份、复制、镜像、持续备份。18、下列( )数据安全保护技术可以进行远距离使用。[单选题]*A、拷贝B、备份C、复制(正确答案)D、镜像答案解析:复制、持续备份远近皆可,拷贝、备份、镜像主要是进行近距离备份19、下列()不属于隐私保护的手段。[单选题]*A、数据收集时进行数据精度处理B、数据共享时进行访问控制C、不使用任何智能化设备(正确答案)D、数据发布时进行人工加扰答案解析:常用的隐私保护有数据收集时进行数据精度处理、数据共享时进行访问控制、数据发布时进行人工加扰、数据分析时进行数据匿名处理。20、我们一般说的cookies是( )。[单选题]*A、数据收集程序

B、数据应用程序C、数据存储程序(正确答案)D、数据处理程序答案解析:Cookies是指用户浏览网页时,网络服务器以文本格式存储在用户电脑硬盘上的少量数据。21、下列可以用于分析数据趋势的是()。[单选题]*A、饼图B、折线图(正确答案)C、动态热力图D、词云图答案解析:折线图可以显示随时间(根据常用比例设置)而变化的连续数据,因此非常适用于显示在相等时间间隔下数据的趋势。22、数据分析的方法不包括()。[单选题]*A、线性分析(正确答案)B、关联分析C、聚类分析D、数据分类答案解析:数据分析一般包括特征探索、关联分析、聚类与分类、建立模型和模型评价等。23、数据特征探索的主要任务是对数据进行预处理,以下不属于该过程的是()。[单选题]*A、数据清洗B、异常数据处理C、数据缺失处理D、数据分类处理(正确答案)答案解析:数据特征探索的主要任务是对数据进行预处理,发现和处理缺失值、异常数据,绘制直方图,观察分析数据的分布特征,求最大值、最小值、极差等描述性统计量。24、海军军官通过对前人航海日志的分析,绘制了新的航海路线图,标明了大风与洋流可能发生的地点。这体现了大数据分析理念中的()[单选题]*A、在数据基础上倾向于全体数据而不是抽样数据B、在分析方法上更注重相关分析而不是因果分析(正确答案)C、在分析效果上更追究效率而不是绝对精确D、在数据规模上强调相对数据而不是绝对数据答案解析:关联分析就是分析并发现存在于大量数据之间的关联性或相关性,从而描述一个事物中某些属性同时出现的规律和模式。25、某超市曾经研究销售数据,发现买商品A的人购买商品B的概率很大,这种属于数据的()。[单选题]*A聚类分析B关联分析(正确答案)C分类分析D、回归分析答案解析:购买商品A的人也喜欢购买商品B,两个商品的销售就产生了一定的关联性,所以属于关联分析。26、下列关于聚类分析的说法,错误的是()。[单选题]*A、可以从数据点集合中随机选择K个点作为初始的聚集中心B、对其他的每个数据点,以此判断其与K个中心点的距离,距离最近的表明它属于这项聚类C、聚类分析,必须先设定分类的标准,否则无法准确分类(正确答案)D、重新计算新的聚簇集合的平均值既中心点答案解析:聚类分析是一种探索性的分析,在分类的过程中,人们不必事先给出一个分类的标准。数据分类才是基于样本数据先训练构建分类函数或者分类模型。27、K-平均算法属于()分析方法。[单选题]*A、聚类(正确答案)B、关联C、分类D、回归答案解析:K-平均算法的基本思想就是在空间N个点中,初始选择K个点作为中心聚类点,然后将N个点分别与K个点计算距离,选择自己最近的点作为自己的中心点,再不断更新中心聚集点,以达到“物以类聚,人以群分”的效果。28、按照涉及自变量的多少,下列()属于回归分析。[单选题]*A、线性回归分析B、非线性回归分析C、一元回归分析(正确答案)D、综合回归分析答案解析:按照涉及自变量的多少,回归分析分为:一元回归分析和多元回归分析。29、根据不同的业务需求来建立数据模型,抽取最有意义的向量,决定选取哪种方法的数据分析角色人员是( )。[单选题]*A、数据管理人员B、数据分析员C、研究科学家(正确答案)D、软件开发工程师答案解析:研究科学家根据不同的业务需求来建立数据模型,抽取最有意义的向量,决定选取哪种方法的数据分析。30、下列关于网络用户行为的说法中,错误的是( )。[单选题]*A、网络公司能够捕捉到用户在其网站上的所有行为B、用户离散的交互痕迹能够为企业提升服务质量提供参考C、数字轨迹用完即自动删除(正确答案)

D、用户的隐私安全很难得以规范保护答案解析:数字轨迹用完不会自动删除,需要人工手动删除。31、下列属于反映比例关系的可视化图表的是()。[单选题]*A、旭日图(正确答案)B、散点图C、热力图D、气泡图答案解析:旭日图能表达清晰的层级和归属关系,以父子层次结构来显示数据构成情况,可以更细分溯源分析数据,真正了解数据的具体构成。32、图表进行修改,我们可以在选取对象后,()操作进行修改。[单选题]*A、单击鼠标B、双击鼠标C、右击鼠标(正确答案)D、左击鼠标答案解析:图表进行修改,我们可以在选取对象后,右击鼠标选择属性进行修改。33、下列属于数据收集内部渠道的是()。①客户调查②专家与客户访谈③专业调研机构④内部数据库[单选题]*①、②、④B、①、③、④①、②、③D、全部(正确答案)答案解析:客户调查、专家与客户访谈、内部数据库属于数据收集内部渠道,专业调研机构属于数据收集外部渠道。34、作为电商企业,以下()图可以有效地提供不同商品的销售和趋势情况。[单选题]*A、饼图B、分组直方图C、气泡图D、条形图和折线图的组合图(正确答案)答案解析:条形图可以反应商品销售的情况,折线图可以反应商品未来的销售趋势。35、下列属于基本图表的是()。[单选题]*A、瀑布图B、滑珠图C、漏斗图D、折线图(正确答案)答案解析:数据可视化表达的图表常见的有饼图、直方图(条形图)、折线图、散点图、雷达图、词云图、热力图等。36、显示一段时间内数据的大小变化或显示各项之间的比较情况,我们往往选择哪类图表()。[单选题]*A、旭日图B、柱形图(正确答案)C、热力图D、气泡图答案解析:柱形图:是一种以长方形的长度为变量的统计图表,用来比较两个或以上的价值(不同时间或者不同条件)。37、为了形象、直观地表示数值大小及变化趋势时,往往选择()。[单选题]*A、数字B、文字C、表格D、图表(正确答案)答案解析:图表能够直观地表示数值大小及变化趋势。39、下列不属于数据可视化工具的是()。[单选题]*A、TableauB、ExcelC、PowerPoint(正确答案)D、Power BI答案解析:Tableau、Excel、Power BI属于数据可视化工具,PowerPoint是多媒体制作工具。40、散点图是对成组的(   )数值进行比较,气泡图是对(   )数值进行比较。[单选题]*A、两个;两个B、两个;三个(正确答案)C、三个;两个D、四个;三个答案解析:散点图是对成组的两个数值进行比较,气泡图是对三个数值进行比较。二、判断题(正确填T,错误填F)1、当前,大数据产业发展的特点是规模较小并且增速缓慢。[填空题]*_________________________________(答案:F)答案解析:大数据产业发展的特点是规模较大、增速很快与多产业交叉融合。2、传统营销模式比基于大数据的营销模式针对性更强。[填空题]*_________________________________(答案:F)答案解析:大数据成为企业和社会关注的重要战略资源,企业必须要提前制定大数据营销战略计划,抢占市场先机。3、打通多源跨域数据属于传统数据密集型行业积极探索和布局大数据应用的表现。[填空题]*_________________________________(答案:T)答案解析:数据生态系统复合化程度加强。大数据的世界不只是一个单一的、巨大的计算机网络,而是一个由大量活动构件与多元参与者元素所构成的生态系统,终端设备提供商、基础设施提供商、网络服务提供商、网络接入服务提供商、数据服务使能者、数据服务提供商、触点服务、数据服务零售商等等一系列的参与者共同构建的生态系统。4、大数据人才整体上需要具备数学与统计知识、计算机相关知识、特定业务领域的知识等核心知识。[填空题]*_________________________________(答案:T)答案解析:数据科学和数据联盟的成立。各大高校将设立专门的数据科学类专业,也会催生一批与之相关的新的就业岗位。。5、大数据的本质是洞察。[填空题]*_________________________________(答案:T)答案解析:大数据(bigdata)是指无法在一定时间范围内用常规软件工具进行捕捉、管理和处理的数据集合,是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产。6、要完成数据的采集工作,首先需要明确数据需求选定项目主题。[填空题]*_________________________________(答案:T)答案解析:数据采集的基本步骤:明确数据需求选定项目主题;制订数据采集清单内容大纲;适当的方法和工具进行采集。7、网络数据采集法:在目标主机上安装一个小程序,将目标主机的文本、应用程序、数据库等日志信息有选择地定向推送来进行管理。[填空题]*_________________________________(答案:F)答案解析:网络数据采集法:指通过网络爬虫或网站公开API(ApplicationProgrammingInterface,应用程序接口)等方式从网站上获取数据信息。系统日志采集法:在目标主机上安装一个小程序,将目标主机的文本、应用程序、数据库等日志信息有选择地定向推送到日志服务器进行存储、监控和管理。8、只要删除掉上网的浏览记录就可以避免信息泄露。[填空题]*_________________________________(答案:F)答案解析:信息泄露的途径非常多,在上网访问的同时我们的信息已经被收集记录,所以通过清除访问记录,并不能避免信息泄露,正确的做法是不要将敏感信息在不安全的网络环境下传播发送。9、我们可以把数据放在第三方公共或公有的“云端”存储。[填空题]*_________________________________(答案:F)答案解析:我们可以把数据放在第三方公共或私有的“云端”存储,是私有的云存储,不是公有。10、数据的存储的方式:采用分布式文件存储或NoSQL数据库存储。[填空题]*_________________________________(答案:T)答案解析:数据的存储的方式:采用分布式文件存储或NoSQL数据库存储11、数据特征探索的主要任务是对数据进行预处理,发现和处理缺失值、异常数据,绘制直方图,观察分析数据的分布特征,求最大值、最小值、极差等描述性统计量。[填空题]*_________________________________(答案:T)答案解析:数据特征探索的主要任务是对数据进行预处理,发现和处理缺失值、异常数据,绘制直方图,观察分析数据的分布特征,求最大值、最小值、极差等描述性统计量。12、聚类分析不需要预先设定数据归类的类目,完全根据数据本身性质将数据聚合成不同类别。[填空题]*_________________________________(答案:T)答案解析:聚类分析能够从样本数据出发,自动进行分类13、大数据的分析理念在数据规模上强调相对数据而不是绝对数据。[填空题]*_________________________________(答案:F)答案解析:相对数据是从数量上反映两个相互联系的现象之间的对比关系。绝对数据是反映客观现象总体在一定时间、地点条件下的总规模、总水平的数据。大数据的分析理念在数据规模上强调绝对数据而不是相对数据。14、聚类分析的基本算法从数据点集合中固定选择K个点作为初始的聚集中心,每个中心点代表着每个聚集中心的平均值。[填空题]*_________________________________(答案:F)答案解析:聚类分析的基本算法采用的是随机选择K个点作为初始的聚集中心,不是采用固定选择。15、数据异常值处理中,我们可以利用画饼图发现异常值部分。[填空题]*_________________________________(答案:F)答案解析:数据异常值处理中,我们可以利用画散点图发现异常值部分,不是饼图

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论