大数据可视化技术试题及答案_第1页
大数据可视化技术试题及答案_第2页
大数据可视化技术试题及答案_第3页
大数据可视化技术试题及答案_第4页
大数据可视化技术试题及答案_第5页
已阅读5页,还剩5页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

选择题(每题5分,不定项选择,多选不得分,少选得3分)1、以下不属于可视化的作用的是()A:传播交流B:信息记录C:数据采集D:数据分析答案:C2、.可视分析学涉及到的学科包括()A:计算机图形学B:数据挖掘C:人机交互D:统计分析正确答案:ABCD3、.以下哪种图可以用于比例数据可视化()A:矩形树图B:茎叶图C:词云图D:主题河流图正确答案:A4、以下哪些个不是文本数据()A.小明发的微博B.某路口车流量C.某门课程的题库D.报纸上的新闻正确答案:B5、可视化可以将难以理解的原始数据变换成用户可以理解的模式和特征,并显示出来。依据可视化流程概念图,在原始数据和可视化中间这一步骤是()A.用户感知B.数据分析C.数据采集D.数据处理和变换正确答案:D6、可视化和其他数据分析处理方法最大的不同是用户起到了关键作用,可视化映射后的结果只有通过()才能转换成知识和灵感A.可视化映射B.数据处理与变换C.用户感知D.以上答案均不正确正确答案:C问答题(每题5分)对于原始数据,如何初步判断关联性?答案:首先可以绘制散点图进行初步判断,同时考察多个变量之间的相关性时可以绘制散点图矩阵。对于三个变量,可以根据其实际意义来绘制气泡图来更直观判断关联性。2、 什么是高维多元数据??答案:连续型时间数据在任意两个时间点之间可以细分出无限多个数值,它是连续不断变化现象的记录。离散型时间数据又称不连续性时间数据,这类数据在任何两个时间点之间的个数是有限的。在离散型时间数据中,数据来自于某个具体的时间点或者时段,可能的数值也是有限的。上机题(每题30分)使用Python或R生成一组随机数,画出柱状图。搜索到Echarts的在线编辑工具,使用上一题的一组数据,画出折线图。

选择题(每题5分,不定项选择,多选不得分,少选得3分)1、以下不属于可视化的作用的是()A:传播交流B:信息记录C:数据采集D:数据分析答案:C2、数据可视化可分为哪三类()A:科学可视化B:信息可视化C:视分析学D:统计分析正确答案:ABC3、.以下哪种图可以用于数据可视化()A:饼图B:茎叶图C:词云图D:柱状图正确答案:A4、1854年伦敦霍乱病情可视化分布图找到传染源,这表明()A.公共数据集疫情数据可视化可以用来公共安全决策支持B.公共数据集不是大数据研究领域C.疫情统计很难找到传播源D.公共安全需要找到某一点数据而不是区域性数据正确答案:A5、颜色的视觉通道包括A.饱和度B.色相/色调C.透明度D.美观度正确答案:ABC6、可视化可以()A.增强人类的认知能力B.作为大量工作记忆的外界辅助C.协助人类进行思考D.让人们使用感知代替认知正确答案:ABCD问答题(每题5分)什么是数据?什么是数据可视化?答案:数据是指对客观事件进行记录并可以鉴别的符号,主要记载客观事物的性质、状态以及相互关系。它是可识别的、抽象的符号。数据可视化就是数据中信息的可视化。它主要借助图形化的手段,达到有效传达与沟通信息的目的。经过可视化的数据,可以让人更直观、清晰的了解到数据中蕴含的信息,从而最大化数据的价值。2、 连续型时间数据和离散型时间数据有何区别?答案:高维多元数据指每个数据对象有两个或两个以上独立或者相关属性的数据。高维(Multidimensional)指数据具有多个独立属性,多元(Multivariate)指数据具有多个相关属性。若要科学、准确地描述高维多元数据,则需要数据同时具备独立性和相关性。在很多情况,数据的独立性很难判断,所以一般简单的称之为多元数据。上机题(每题30分)搜索未来一周气温数据,使用Echarts画出折线图。将1中数据导入Excel,绘制折线图。

第一章1、数据是指对客观事件进行记录并可以鉴别的符号,主要记载客观事物的性质、状态以及相互关系。它是可识别的、抽象的符号。数据可视化就是数据中信息的可视化。它主要借助图形化的手段,达到有效传达与沟通信息的目的。经过可视化的数据,可以让人更直观、清晰的了解到数据中蕴含的信息,从而最大化数据的价值。2、中国古代星象图、“伦敦鬼图”、拿破仑进军莫斯科流图3、现在的屏幕媒体中大多融入了各种交互、动画和图像渲染技术,并加入了实时的数据反馈,可以创建出沉浸式(immersive)的数据交流和实用环境。除了商业机构、科研部门和政府外,普罗大众每天也要在自己的屏幕上接触大量的经过可视化的数据,可以说可视化已经渗透到了互联网上每个人的生活。廉价的硬件传感器和自己动手创建系统的框架降低了收集与处理数据的成本。出现了数不胜数的应用、软件工具和底层代码库,帮助人们收集、组织、操作、可视化和理解各种来源的数据。新型的浏览器显示技术,例如canvas和SVG(有时统称HTML5技术)将动态的可视化界面扩展到移动设备上。4、(1)数据规模大,已超越单机、外存模型甚至小型计算集群处理能力的极限,而当前软件和工具运行效率不高,需探索全新思路解决该问题。(2)在数据获取与分析处理过程中,易产生数据质量问题,需特别关注数据的不确定性。(3)数据快速动态变化,常以流式数据形式存在,需要寻找流数据的实时分析与可视化方法。(4)面临复杂高维数据,当前的软件系统以统计和基本分析为主,分析能力不足。(5)多来源数据的类型和结构各异,已有方法难以满足非结构化、异构数据方面的处理需求。第二章1、每天的身高、体重数据每分钟心率数据每年的人口数量数据2、连续型时间数据在任意两个时间点之间可以细分出无限多个数值,它是连续不断变化现象的记录。离散型时间数据又称不连续性时间数据,这类数据在任何两个时间点之间的个数是有限的。在离散型时间数据中,数据来自于某个具体的时间点或者时段,可能的数值也是有限的。3、热图和螺旋图有机结合来显示一年的气温变化。第四章1、饼图变体如下:分离式饼图。优点:各部分更加清楚整洁;缺点:视觉感受到的各部分比例可能会变小优点:将占比小的几个地区统一归为其他,再将其他部分单独做一个饼图,使得每一部分标签都很清楚,整体变得很整洁。缺点:如果不标注数据,很难将小饼图中的占比和大饼图中占比比较。言之有理即可,最好可以结合设计原则。2、Excel树状图工具或者可以在线导入并绘制数据的网站等。3、矩形树图中的面积与相应数值成比例关系,用以代表相应数值。第五章1、首先可以绘制散点图进行初步判断,同时考察多个变量之间的相关性时可以绘制散点图矩阵。对于三个变量,可以根据其实际意义来绘制气泡图来更直观判断关联性。2、直方图的面积(柱形宽度×柱形高度)代表对应组数据出现的频率。3、例如正态分布的密度图与正态分布函数之间的关系第6章1、网络爬虫(WebCrawler)是指一类能够自动化访问网络并抓取某些信息的程序,有时候也被称为“网络机器人”。它爬虫可以按一定逻辑大批量采集目标页面内容,并对数据做进一步的处理,人们借此能够更好更快的获得并使用他们感兴趣的信息,从而方便地完成很多有价值的工作。2、Python、R语言、各种在线绘制工具3、TF=词语在目标文本出现的次数/目标文本总词数IDF=log(目标文档集合的文档总数/包含该词的文档总数+1)该公式有多种改良形式,此处为最基础版本第7章1、高维多元数据指每个数据对象有两个或两个以上独

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论