数据可视化的基本概述以及几个工具的推荐_第1页
数据可视化的基本概述以及几个工具的推荐_第2页
数据可视化的基本概述以及几个工具的推荐_第3页
数据可视化的基本概述以及几个工具的推荐_第4页
数据可视化的基本概述以及几个工具的推荐_第5页
已阅读5页,还剩6页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

据可视化的基本概述以及几个工具的推荐科学可视化(ScientificVisualization)、信息可视化(InformationVisualization)和可视分析学(VisualAnalytics)三个学科方向通常被看成可视化的三个主要分支。而将这三个分支整合在一起形成的新学科“数据可视化”,这是可视化研究领域的新起点。一—《数据可视化》广义的数据可视化涉及信息技术、自然科学、统计分析、图形学、交互、地理信息等多种学科。自然科学信息技术 统计分析地理信息数据可视牝图形学数据可视牝图形学感知与认知

科学交互感知与认知

科学敎据管理和知识表达科学可视化科学可视化(ScientificVisualization)是科学之中的一个跨学科研究与应用领域,主要关注三维现象的可视化,如建筑学、气象学、医学或生物学方面的各种系统,重点在于对体、面以及光源等等的逼真渲染。科学可视化是计算机图形学的一个子集,是计算机科学的一

个分支。科学可视化的目的是以图形方式说明科学数据,使科学家能够从数据中了解、说明和收集规律。信息可视化ZCISNhb-25ZCISNM&-&O信息可视化ZCISNhb-25ZCISNM&-&O信息可视化(InformationVisualization)是研究抽象数据的交互式视觉表示以加强人类认知。抽象数据包括数字和非数字数据,如地理信息与文本。信息可视化与科学可视化有所不同:科学可视化处理的数据具有天然几何结构(如磁感线、流体分布等),信息可视化处理的数据具有抽象数据结构。柱状图、趋势图、流程图、树状图等,都属于信息可视化,这些图形的设计都将抽象的概念转化成为可视化

◎AT-n可视化分析可视分析学(VisualAnalytics)是随着科学可视化和信息可视化发展而形成的新领域,重点是通过交互式视觉界面进行分析推理。2.a.gteek 电troman t兰g|L±J科学可视化、信息可视化与可视分析学三者有一些重叠的目标和技术,这些领域之间的边界尚未有明确共识,初略来说有以下区分:•科学可视化处理具有自然几何结构(磁场、MRI数据、洋流)的数据。•信息可视化处理抽象数据结构,如树或图形。•可视分析学将交互式视觉表示与基础分析过程(统计过程、数据

挖掘技术)结合,能有效执行高级别、复杂的活动(推理、决策)。为什么需要数据可视化人类利用视觉获取的信息量,远远超出其他器官人类的眼睛是一对高带宽巨量视觉信号输入的并行处理器,拥有超强模式识别能力,配合超过50%功能用于视觉感知相关处理的大脑,使得人类通过视觉获取数据比任何其他形式的获取方式更好,大量视觉信息在潜意识阶段就被处理完成,人类对图像的处理速度比文本快6万倍。数据可视化正是利用人类天生技能来增强数据处理和组织效率。可视化可以帮助我们处理更加复杂的信息并增强记忆大多数人对统计数据了解甚少,基本统计方法(平均值、中位数、范围等)并不符合人类的认知天性。最著名的一个例子是Anscombe的四重奏,根据统计方法看数据很难看出规律,但一可视化出来,规律就非常清楚。XVXyXyXy108.04109.14107.4686+5886.9588J486.77857613138741312.7487.7198.8198.77988.84118.33119.26117.8188,47149.96148.10148.8487,0467.2466.1366.08852544,2643,1045.39191251210.84129.13128.1585.5674.8277.2676.4287.9155,68547455,7386,89II ill IVaII ill IVb •可视化还可以有效增强人的记忆力,我们经常说的一图胜千言就是可视化对生活的影响。如何实现数据可视化

可视化实现流程在技术上,数据可视化最简单的理解,就是数据空间到图形空间的映射。数据空间到图形空间的映射关拄駛据数据空间到图形空间的映射关拄駛据—个经典的可视化实现流程,是先对数据进行加工过滤,转变成视觉可表达的形式(VisualForm),然后再渲染成用户可见的视图(View)。DataVisualFormHltemgrenderingLayoiMUlConlwb可视化技术栈AtreiractData8一DataVisualFormHltemgrenderingLayoiMUlConlwb可视化技术栈AtreiractData8一user具备专业素养的数据可视化工程师一般来说需要掌握以下技术栈:•基础数学:三角函数、线性代数、几何算法•图形相关:canvas、svg、webgl、计算图形学、图论•工程算法:基础算法、统计算法、常用的布局算法•数据分析:数据清洗、统计学、数据建模•设计美学:设计原则、美学评判、颜色、交互、认知•可视化基础:可视化编码、可视分析、图形交互

可视化解决方案:图表的正确使用、常见的业务的可视化场景常用的数据可视化工具在学术界与工程界,数据可视化工具都非常之多,学术界用得比较多的是R语言,ggplot2,Python可视化库等,普通用户喜闻乐见的是Excel,商业上的产品是Tableau,DOMO,PowerBI等等,是个精彩纷呈的世界。这里有常用的25个数据可视化工具对比,没有完美的可视化工具,每个工具都有各自的优缺点。下面是一张工具选择推荐图,根据目的分类,左上是简单快捷,左下是故事导向,右上是为了分享分析,右侧是创新型图表,右下是分析型工具。VEGACHARTSFORANALYSISYOUSHOULDPUBLISHLTRA03W&E6DXPROCESSWC;GGVISTABLEAUBOKEHSEABORN”GGPL0T2MATPLOTLIBGOOGLESHEETSEXCELVEGACHARTSFORANALYSISYOUSHOULDPUBLISHLTRA03W&E6DXPROCESSWC;GGVISTABLEAUBOKEHSEABORN”GGPL0T2MATPLOTLIBGOOGLESHEETSEXCEL吧1茫、 ILLUSTRATOHcomvSVEGA-LITEchartsEASYCHARTPLOTLYHIGHGHAHTS时茁rtlGHCHMfiTSCLOUDINNVCVATIVEOUT$IDt-OF-THE*B0KCHAATSQUADR1GRAMCHARTSASPARTOFSTORYTELLING我们常常听说的数据可视化数据可视化(DataVisualization)和信息可视化(InformationVisualization)是两个相近的专业领域名词。狭义上的数据可视化指的是将数据用统计图表方式呈现,而信息可视化则是将非数字的信息进行可视化。前者用于传递信息,后者用于表现抽象或复杂的概念、技术和信息。而广义上的数据可视化则是数据可视化、信息可视化以及科学可视化等等多个领域的统称。一一《数据可视化之美》我们常常听说的数据可视化大多指狭义的数据可视化以及部分信息可视化。根据数据类型和性质的差异,经常分为以下几种类型:统计数据可视化:用于对统计数据进行展示、分析。统计数据一般都是以数据库表的形式提供,常见的统计可视化类库有HighCharts、ECharts、G2、Chart.js等等,都是用于展示、分析统计数据。关系数据可视化:主要表现为节点和边的关系,比如流程图、网络图、UML图、力导图等。常见的关系可视化类库有mxGraph、JointJS、GoJS、G6等。地理空间数据可视化:地理空间通常特指真实的人类生活空间,地理空间数据描述了一个对象在空间中的位置。在移动互联网时代,移动设备和传感器的广泛使用使得每时每刻都产生着海量的地理空间数据。常见类库如Leaflet、Turf、Polymaps等等,最近Uber开源的deck.gl也属于此类。还有时间序列数据可视化(如timeline)、文本数据可视化(如worldcloud)等等。基于Web的可视化技术在讲各种流行类库框架前,我们先了解下Web图形的底层技术规范。底层技术规范SVG:可缩放矢量图形(ScalableVectorGraphics),是基于可扩展标记语言(标准通用标记语言的子集)用于描述二维矢量图形的一种图形格式。Canvas2D:Canvas通过JavaScript来绘制2D图形,通过逐像素来进行渲染。Canvas3DWebGL:WebGL(WebGraphicLibrary)是—个JavaScriptAPI,用于在任何兼容的Web浏览器中渲染3D图形。WebGL程序由用JavaScript编写的控制代码和用OpenGL着色语言(GLSL)编写的着色器代码构成,这种语言类似于C或C++,可在GPU上执行。比较流行的基础绘图库,基于SVG的有snap.svg、rapheal.js等,基于Canvas2D的有zrender、g等,基于WebGL的有three.js、SeeneJS、PhiloGL等,这些基础绘图库可以让上层封装更简单容易。我们重点回到基于Web技术的数据可视化类库。D3D3.js是一个基于数据操作文档的JavaScript库。D3可以将强大的可视化组件和数据驱动的DOM操作方法完美结合。D3的优劣:•强大的SVG操作能力,可以非常容易的将数据映射为SVG属性•集成了大量数据处理、布局算法和计算图形的工具方法•强大的社区和丰富的demoAPI太底层,复用性低,学习与使用成本高D3没有提供封装好的组件,在复用性、易用性方面不佳,社区里有很多基于D3的可视化组件库:.nvd3.js:基于D3封装了常见的折线图、散点图、饼图,功能比较简单de.js:除了提供了常见的图表外还提供了一些数据处理能力e3.js:—个轻量级的基于状态管理的图表库D3有着Stanford的血脉渊源,在学术界享有很高声誉,灵活强大使得它成为目前领域内使用最广泛的可视化类库,但偏底层的API和数据驱动模式,使得上手D3存在一定门槛,基于D3的工程实现上需要自己考虑和处理更多内容,如动画、交互、统一样式等,研发成本较高。HighChartsHighCharts是一个用纯JavaScript编写的图表库,能够简单便捷的在Web应用上添加交互性图表。这是在Web上使用最广泛的图表,企业使用需要购买商业授权。HighCharts的优劣:•使用门槛极低,兼容性好•使用广泛,非常成熟•样式比较陈旧、图表难以扩展•商业上使用需要购买版权这是图表界的jQuery,在世界范围内是使用最多最广的一个可视化类库,但整体图表设计比较陈旧难以扩展,同时商业公司使用需要按照使用人数购买版权,比较昂贵,阿里有购买过,目前已不推荐使用。EChartsECharts缩写自EnterpriseCharts,企业级图表,开源来自百度数据可视化团队,是一个纯Javascript的图表库,可以流畅的运行在PC和移动设备上,兼容当前绝大部分浏览器,底层依赖另一个也是该团队自主研发的轻量级的Canvas类库ZRender,提供直观,生动,可交互,可高度个性化定制的数据可视化图表。ECharts是目前国内唯一一个入选GitHub全球可视化榜单的开源项目,2w+star全球排名第三,社区活跃,覆盖主流前端框架和8种编程语言的扩展,目前国内市场占有率处于绝对领先地位。ECharts的优劣:•丰富的图表类型,覆盖主流常规的统计图表•配置项驱动,三级个性化图表样式管理•移动端优化,交互和布局适配,按需打包•深度的交互式数据探索•地理特效(百度迁徙,百度人气,公交轨迹等效果)•灵活性上不如Vega等基于图形语法的类库•复杂关系型图表比较难定制ECharts能很好满足传统图表需求,但在高度灵活多样化的可视需求面前,需要另寻出路。LeafletLeaflet是面向移动设备的交互式地图的JavaScript库。测量的JS只有大约38KB,它具有大多数开发人员需要的所有映射功能。Leaflet的优劣:•专门针对地图应用•mobile兼容性良好•API简洁、支持插件机制•功能比较简单,需要具备二次开发能力地图专用,其他领域使用不上。目前Google地图、高德地图、百度地图都拥有自研的JS库。deck.gldeck.gl是Uber可视化团队基于WebGL开发的面向大数据分析的可视化类库。deck.gl的优劣:•主要以3D地图可视化为主,内置了地理信

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论