大数据与数据可视化_第1页
大数据与数据可视化_第2页
大数据与数据可视化_第3页
大数据与数据可视化_第4页
大数据与数据可视化_第5页
免费预览已结束,剩余1页可下载查看

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、大数据与数据可视化( 1)胡经国本文根据有关文献和资料编写而成,供读者参考。本文在篇章结构、内容 和文字上对原文献作了一些修改和补充,并且添加了一些小标题,特此说明。一、数据可视化技术指南随着大数据之而来的是数据可视化技术的持续发展。它用来展现和阐释大 数据。但是,数据可视化技术并非千篇一律。数据可视化是展现数据的最强大机制之一。在技术上的优势也为其创造了 独特的实现方法。随着交互式的、独特的数据可视化方法逐渐走向最前沿,那 些绘制简单饼状图的日子将一去不复返。下面,我们将介绍数据可视化的重要性,不同的数据展现方式以及业界常 用的数据可视化工具。你也将会了解赢得数据可视化技术的关键概念和你需要

2、 避免的错误。本文将介绍:数据可视化的概念;数据可视化重要性;数据可视化方法; 数据可视化技巧的核心理念;数据可视化需要避免的错误。1、数据可视化的概念数据可视化是研究如何将数据以图片或图形的方式展现的科学。它主要专 注于展现,即以连贯和简短的形式把大量的信息展现出来。尽管数据可视化也 能处理书面信息,但是它的重点还是用图片和图像的形式向观众传递信息。数据可视化技术在数据的用法上并不狭窄。它能够可视化各种信息;你可 以向其他人传递你的理念和假设。如今,甚至可以对数据可视化添加技术,甚 至也可以选择交互式的可视化方法。信息的视觉表达是一种古老的思维和经验的分享方式。例如,图表和地图 就是一些早期

3、数据可视化技术的重要例证。2、数据可视化的重要性人类使用数据可视化技术已经很久了。图像和图表已被证明是一种用于交 流和学习新信息的有效方法。研究表明, 80%的人能记住他们看到的。数据可 视化甚至可以将思想和事件向后代延续和传承。技术的发展进一步加强了数据 可视化带给人们的机会。数据可视化最重要的好处是它能够帮助人们更快地掌握数据。你可以把一 大堆数据浓缩到一张图表里,人们也能更快地抓住其中关键点。如果用书面形 式,那么可能需要几小时来分析所有的数据和建立数据之间的联系。此外,这种能展现大量数据的能力是数据可视化的另一个巨大优势。一张图表可能会突出显示多个方面,人们就能对数据形成不同的观点。这

4、自然能为 企业开辟新的商业之路。人们或许能从数据中发现一些意想不到的东西。数据可视化可以提高解释信息的能力。要从大量的数据和信息中寻找关联 不容易。但是,图和图表可以在几秒钟内提供信息。一眼就能辨识出所需要的 信息。综上所述,数据可视化能够加强人们在工作和学习上的沟通和有效性。数 据可视化是一种简单而有效的概括数据的方法。因此,它可以提高人们分享信 息和学习的能力。3、数据可视化的方法、数据可视化分类技术的发展导致数据的爆炸;反过来又增加了数据被展现的方式。通常, 数据可视化主要分为探索(Exploration)和解释(Explanation)两种不同的类 型。探索类型可以帮助人们发现数据背后

5、的故事;而解释类型则把数据简单明 了地解释给观众。、最常见的数据可视化方法有不同的方法可用于创建上述两种类型的数据可视化。最常见的数据可视 化方法包括: 、2D Area (地理空间数据可视化)这种方法使用地理空间数据可视化技术;往往与事件在某个特定区域的位 置相关。 2D Area 数据可视化的一个例子可以是点分布图。该图可以显示某个 区域中的犯罪等信息。 、Temporal (时间数据可视化) 时间数据可视化是以线性方式展现数据的。时间数据可视化的关键是有一个开始和一个结束的时间点。时间可视化的例子可以是一个连接的散点图。它 可以展现诸如某一区域的温度等信息。 、Multidimensio

6、nal (多维数据可视化)可以通过多维数据可视化,将数据在两个或多个维度上展现。这是最常用 的数据可视化方法之一。多维数据可视化的一个例子是饼图。它可以展示如政 府支出之类的信息。 、 Hierarchical (层次化数据可视化) 层次化数据可视化,被用于呈现多组数据。这些数据的可视化,通常在大群体内嵌套小的群体。层次化数据可视化的例子可以是一个树图。它可以展示 如语言组团等的信息。 、Network (网络数据可视化)数据也能以相互关联的网络形式来展现。这是另一种展现大量数据的常见 方法。网络数据可视化的一个例子可以是冲积关系图。它可以展示如医疗行业的变化等信息。、最常用的数据可视化工具还

7、有很多数据可视化的工具。它们可以很容易地收集数据,也可以流线化 数据的使用方式。一些最常用的数据可视化工具包括: 、 Google Charts谷歌图表,是一个容易上手的数据可视化工具,特别适用于初次使用数据 可视化工具的用户。 、 Datawrapper这是一个在线工具。它可以帮助你创建交互式数据可视化。、 RAWRAW 的好处包括:它拥有大量现成的类型,让你可以清晰、便捷地展现信 息。该平台是开源的。所以,你可以提供自定义布局,或者使用其它的设计。、 InfogramInfogram 是另一款适合新手的数据可视化工具。它允许用户创建不同的图 表和Infographs (数据信息图表),系统

8、的使用也方便。可用的数据可视化工具远不止这些。你还能找到大量免费和付费的软件。 最好多了解一些信息,以确保你所使用的软件与被可视化的数据最为搭配。、赢取数据可视化技术的关键概念见过数据可视化成果的人都知道,数据可视化设计有好坏之分。如果信息 不是以正确的、恰当的方式呈现,那么数据可视化的好处就很容易被抵消。具 体的项目需要定制的方法。不管你的信息是什么,在做数据可视化时,有一些概念你需要牢记。以下 是赢取数据可视化技术的关键概念的集合。 、了解听众在展现数据之前,你需要做的第一件事就是要了解谁将会看这些数据。了 解你的听众是至关重要的,以便用正确的方法来展现数据。虽然数据可视化通常是一种简化数

9、据的方法,但是观众对有关主题的知识层次是千差万别的,需要好好做准备。如果你是针对一群专业的听众,那么可 以使用更多的专业方法和专业术语来解释数据。然而,对于相同的数据,普通 听众可能需要更为通俗的方法来解释。同样,知道听众对你的数据有何期望也非常重要。你需要知道他们想要从 数据中获得什么关键点,以及你展示数据的主要目的是什么。此外,还需要记 住你展现数据的目的是什么。 、充分理解数据除了掌握目标受众以外,你还需要对数据了如指掌。若是没有正确地理解 数据,则很有可能不能把信息有效地传达给听众。然而,你也无法顾及数据所包含的所有信息。所以,要能够提取关键的信 息,并且条理清晰地展现它们。你还需要确

10、保从数据中得到的关联信息是正确 而不是虚构的,决不能用错误的数据做可视化。若你正确地理解了数据及其关联,则可以从信息中得到独特而有趣的数据 关联。 、讲述一个故事数据可视化还应该描绘出一个故事。你一定不希望这些数据只是以一组信 息的方式来展现;而是能传递出数据使用背后的信息。这可以是不同的描述性 介绍,或是为观众呈现一幅特定的图像。讲述一个故事,往往意味着观众从数据中获得更多的洞察力。它可以帮助 观众了解新的关联和更深入的信息。事实上,数据可视化技术是一个出色的讲故事工具。“一图胜千言”这句 话一点都不错。你应该发挥它的这项优势。通过数据来讲故事并不困难,因为 你可以把颜色、字体和演示文稿都作

11、为讲故事手法的一部分。为了使数据可视化成功地融入故事,上述提到的充分理解数据则是至关重 要的一点。 、保持简洁近年来,数据可视化的发展很快。涌现出很多工具和系统供人们使用。能 接触不同的独特方法,并不意味着都要用到它们。而且,大量的数据也不意味 着所有的信息都是必不可少的。总之,要保持你的数据可视化方法简单明了。不必刻意地使用过多的数据 或使用过多的技巧。如果从讲故事的角度来看,那么必须明白你所展现的每一个元素都是故事 必不可少的一部分。如果数据或元素,如某些事物的图片,对故事的情节无关 紧要,那么就不应该把它加入进来。数据展示中包含太多的元素,实际上会破坏最终的成品,与数据脱节。要 记住,数

12、据可视化的核心之处,就是能在一瞬间呈现大量的数据。如果可视化 显得很费劲,那么你就要回头看看是否使用了错误的数据演示或包含了太多的 信息。 、合理区分展现平台最后,赢取数据可视化技术也要了解技术方面。人们现在通过各种不同的 平台查看和访问信息,这一点必须牢记。就像需要知道目标受众一样,你也需 要考虑人们查看数据可视化的方式。你的可视化结果要能轻松适应多种平台,如移动设备,平板电脑或计算 机。如果你的用户只通过手机浏览数据,那么适用于移动端的展现方法自然会 对你更有帮助,而不是针对笔记本的方法。除了考虑平台的界面选项以外,还需要考虑可访问性( Accessibility )问 题。如果数据可视化

13、允许视觉欠佳的人进行适当的放大和缩小,可以大大提高 用户体验。你也可以考虑为色盲人群提供不同颜色选项。可访问性旨在提高用 户体验,确保数据可视化可对所有人都适用。、数据可视化需要避免的错误尽管以上关键方法能帮你生成赢取数据可视化的策略,但是还有一些常见 误区需要时刻警惕。 、错误信息数据错误是观众最厌恶的东西。你必须确保那些正在看你的数据的人获取 到的是正确数据。确保人们可以直接使用你图表里的数据,而不必再次确认数 据的正确性。这是你的职责。 、不完整信息除了保证信息正确之外,还要呈现完整数据。人们必须能在其中找到相关 信息,不能使用数据可视化来欺骗听众或展现不完整信息。数据可视化能够而且应该

14、讲述一个故事;但是故事需要包含完整和正确的 信息,而不是只展示你认为合适的数据。 、过于简化数据尽管要确保数据是以简单的方式展现,但是这并不意味着你应该简化它。 首先,你需要记住观众是谁。对专业人士不要使用通俗和过于简化的语言。而 如果是普通观众,那么就不要用专业术语来填充文字。除此之外,若是你未能清晰地展现数据,则也就不能期望听众能清楚地了 解它们之间的关系。不能因为对你来说链接似乎很明显了,就省略部分信息。 记住观众只能看到你所展示的这部分数据,而不是你所使用的完整数据集。 、不恰当的可视化在展现数据时,你需要仔细思考数据展现的方式。如字体,颜色和图像之 类的属性,这很重要。例如,如果展示由特定疾病而导致死亡的信息,那么使 用鲜艳的色彩和令人愉快的图像似乎不协调。不适当的可视化,也包括使用的技术使得数据难以查看和理解。例如,你 可能用泡泡来代表部门内不同的消费水平,但是如果泡泡的尺寸差异不合适, 会导致误判和不准确。 、遗漏标注过度简化也可能导致缺乏标注。当你提供数据时,很容易假设观众已经知 道图像的每一个方面代表什么。但是添加简单的注释,可以提高用户体验,并 且能确保观众明白数据中的所有数据点。举一个例子,你可能用一个图表来展示企业在过去 10 年自行车的销量。如 果数据图表中有一个

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论