手把手教你Tableau高级数据分析功能附数据集_第1页
手把手教你Tableau高级数据分析功能附数据集_第2页
手把手教你Tableau高级数据分析功能附数据集_第3页
手把手教你Tableau高级数据分析功能附数据集_第4页
手把手教你Tableau高级数据分析功能附数据集_第5页
已阅读5页,还剩8页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、手把手教你Tableau高级数据分析功能(附数据集)原文标题:A Step-by-Step Guide to learn AdvancedTableau - for Data Science and Business Intelligence Professionals作者:Pavleen Kaur翻译:清扬校对:卢苗苗 本文共4000字,建议阅读8分钟。本文借助高级图表创建计算深入研究数据以提取对数据的 分析,并了解R如何与Tableau相互集成和使用。简介“查看数据。显示图表。讲故事。吸引观众。”Tableau是当今数据科学和商业智能专业人员使用的最流行 的数据可视化工具之一。它使您能够以

2、交互和多彩的方式 创建具有洞察力和影响力的可视化效果图。它的用途不仅 仅是创建传统的图表和图表。您可以使用它来挖掘可操作 的数据解析,这要归功于它提供的大量功能和自定义。以 其易用性和简单的功能而闻名,制作如下所示的富有洞察力 的仪表盘只需点击几下鼠标:在本文中,我们将看到一些超 越拖放功能的高级图表。我们将创建计算以深入研究数据 以提取对数据的分析。我们还将看看R如何与Tableau相互 集成和使用。本文假定您掌握丰富的使用Tableau的知识, 例如基本图表形成,计算,参数等。如果您不这样做,我会 建议先参考以下文章,然后再返回此处:贞脚.Tableau for Beginners -简化

3、数据可视化 https:/.analyticsvidhya./blog/2017/07/data-visualisation-made-e asy/中级Tableau指南适用于数据科学和商业智能专业人 员 https:/.analyticsvidhya./blog/2018/01/tableau-for-intermediate- data-science/目录1.高级图形可视化超越“显示我”运 动图凹凸图甜甜圈图表瀑布图帕累托图2.在Tableau中引入 R编程1.高级图形可视化超越-Show Me*几乎所有的 Tableau用户都知道各种基本图形,例如介绍仪表板中显示的 那些图形。这些图表

4、可以使用Tableau的“Show Me”功能 轻松完成。但由于这是一篇面向高级用户的文章,因此我 们将超越“Show Me”并探索需要额外计算的图表。首先, 让我们快速浏览一下我们将在接下来的几节中做什么。以 下是我们超市的销售额和利润的一些基本分析。简单的图 表可以达到与主板中的相同的目的,但我认为您会对这些图 表的宏伟感到兴奋和激动。(https:/github./pavleenkaur/TableauTutorial-On-AnalyticsVidhy a/blob/master/Sample-Superstore.xls/)l动态图表 在开始之 前,先看看Hans Rosling的世

5、界经济图表展示 (https:/.gapminde 匚 o rg/tools/#_chart-type=bubbles) o 点击播放 键,看到魔法在你面前展开。有兴趣自己做一个类似的图 表展示吗?不要担心如何做这些动画!你所看到的被称为贞脚. 动态图表。使用此功能,您可以实时查看数据中的变化。因 此,我们首先下载可在此处找到的Superstore数据集 (https:/github./pavleenkaur/TableauTutorial-On-AnalyticsVidhy a/blob/master/Sample-Superstore.xls)o 现在让趋势线如下图 所示对你来说应该很容易

6、:但是本节我们首先要学习的是如 何使下而的趋势线运动(gif动图):https:/s3-ap-south-1 .amazonaws./av-blog-media/wp-content/upl oads/2017/08/23131759/2.gif所以让我们开始吧!导入您的数据集,并创建上述趋势图。我们的X轴是订单 日期(月份格式),销售额和利润是度量值。您只需将“订 单日期”拖到“页面”功能区,然后再次更改格式以与X轴 匹配。将标记类型从自动更改变更为圆形。转到“显示历史 记录”,然后选择“追踪”以查看趋势变化。瞧!您的动 态图表已准备好启动。按箭头按钮查看动作,更改“显示历 史”定制项,速度

7、项等:1.2凹凸图假设你想探索Superstore各个部门的销售额(整 整一年)。其中一种方法是:然而备选方案如下:虽然折线图能够显示每个细分部门之间的销售差异,但凹凸 图(上图)给出了更清晰和简明的相同结果图。这些图表 通常用于了解多年来特定产品的受欢迎程度如何变化。贞脚.现在让我们尝试自己创建一个:1)首先,我们需要考虑度量单位,根据这些度量单位我们对 我们的测量维度进行排名。这里我们采取的度量单位是销 售量,测量维度是部门。2)您需要计算模块的帮助才能制作凹凸图表。所以快速创建 一个如下所示的计算。我们将对每个细分部门的销售总额 进行排名:3)现在将“订单日期”拖到列中并将格式更改为 月

8、。在标记窗格中将“Segment”拖动到Marks Pane里的颜 色。最后将“Rank”拖到行。4)在你现在可以看到的图表中,排名是根据月份数量分配的。 但是,我们需要他们在细分部门的基础上。因此,右键单 击行中的排名,然后转到编辑表格计算。5)由于我们希望使用细分部门计算,请将配置更改为:您将获得的图表看起来不像仪表板中的图表,因为它缺少标 签。让我们在双轴(Dual Axis)的帮助下快速修复:6)再次 将排名拖到行上并重复步骤4)和5)以得到:您在Marks Pane中看到了 Rank和Rank吗?我们将使用这 些来创建带圆圈的标签。7)要将上述容转换为双轴图表,请右键单击第二个图表的

9、 Rank轴并选择双轴。8)在Marks Pane中,Rank或Rank(2),然后将标记类型更改贞脚. 为圆形而不是自动。9)这里的排名按降序排列。要将其更改为升序,请右键单击 左侧的Rank轴 编辑轴反向比例。对右边的Rank轴 重复同样的操作。10)最后,将“销售额”拖放到标签快速表计算总计 百分比上,以获得我们期望的凹凸图。1.3甜甜圈图圆环 图是初级图的另一种表现形式。坦率地说,它是一个中间 有一个洞的饼图,但它有助于更加强调各个细分市场,如下 所示:让我们了解这个区别的不同之处。1)我们将从一个简单的饼图开始描绘每个细分部门的利润:2)要创建饼图的双轴,将measure的numbe

10、r of records拖动 到rows两次。通过右键点击它们并选择最小值代替默认总 和来更改每个绿色药丸的度量:3)选择Marks Pane中的第二个饼图,并将其中的每个度量/ 维度拖岀。减小图表的大小,并将颜色更改为白色(尽管 此处未显示):4)要创建双轴,右键单击第二个饼图的Y轴,然后选择双轴, 以获得图表。现在你必须明白,以上所有图表虽然在最终外观上都不相贞脚. 同,但都是从“显示我”功能的核心图表中获得的。但是 等一下,它还没有结束。我有更多要展示给你。1.4瀑布图瀑布图的名称来自于其类似的方向和流动。在这 里,我们绘制了 Superstore多年来的运行销售情况,您可以 在2013

11、年中和2014年初看到两个小红色区域,表明销售额 实际下降了,并且还有多少。这意味着这些图表被用来分析一个度量的累积效应,并且看 它是如何作为一个整体增加和减少的。为了更好地理解这 一点,让我们想象它。瀑布图是折线图的衍生物,因此我们将从该图开始:注意:这里的X轴是订单日期(以月年格式并转换为离 散型),丫轴是利润1)右键单击绿色的Profit Pill,然后选择Quick TableCalculation - Running Total o2)将标记类型从自动更改为甘特条:3)创建一个名为NegProfit*的计算字段:4)将这个NegProfit拖到Marks框架中的Size上,得到: 计

12、算的字段用于填写甘特图中的空间。利润中的负值将向 下延伸,而正值则会向上延伸。图表中每个小条的长度表示利润从一个月到下一个月的变 化量。5)最后,将利润拖到颜色:贞脚. 6)您可以继续前进,将颜色更改为两步变化,并清楚地查看 上升和下降:您将获得的图表也可以非常容易地以条形图的 形式表示。请注意,我在这里将颜色分置,以使其凸显出 来:但我相信你会同意使用瀑布图是一种更直观的表示数据的 方式,特别是看看多年来度量的变化,例如销售和利润。1.5帕累托图下面我已经将一个流行的80-20数据分析原理可视化岀来。 如果你还没有听说过它,让我试着用例子来解释它。我们会 经常观察到超市的大部分销售来自少数几

13、种产品。人们不能指望面包和鸡蛋与蛋糕有相同的销售数字,对吧? 这正式被称为80-20原则,这意味着80%的销售额来自20% 的产品。在我们的超市里,这个原则可以在下面的图表中 看到,其部分销售是由和椅子生成的:这是一种相当流行的可视化,帕累托图通常用于风险管理, 以确定对项目造成最大负面影响的最常见问题;但正如我们 将看到的,它也可以有其他应用程序。让我们看看它是如何完成的:1)我们将从下面的图表开始。这具有作为X轴的子类别和 作为Y轴的销售。图表按降序排列:2)接下来,将销售额拖放到图表上,直到您看到绿色突出显 示的条形和最右边的虚线轴:贞脚.3)在此处下降销售以创建双轴。将第一个图表的标记

14、类型更 改为条形图,将第二个图表更改为直线,最终得到:4)右键单击第二个绿色销售药丸,并为其添加运行总计算:5)剩下的只是改变配色方案,并且您的帕累托图表已准备就 绪!2.在Tableau中引入R编程我喜欢Tableau的一个原因是,它不仅仅是一个工具,而且 意味着只需拖放操作即可创建漂亮的图形。随着2013年 Tableau 8.1的发布,出现了许多新的功能。R编程的引入使得更丰富和动态的可视化得以实现,这是主 要特征之一。R编程可与Tableau -起用于聚类、预测等技 术。我想通过Clustering开始对R和Tableau的探索,所以我使 用了超流行的Iris Dataset(http

15、s:/github./pavleenkaur/TableauTutorial-On-AnalyticsVid hya/blob/master/iris.csv)o它包含不同的功能来区分3种类 型的 flowers,即 Virginica, Setosa 和 Versicoloro 正如你在 下面的图片中看到的那样,R编程整合很容易创建这三种物 种的集群:如果你有兴趣,可进行一下操作。首先,深入了解基础知识 和安装过程,然后深入研究可视化问题!以下描述了 Tableau和R之间的控制流程,以实现此集成:贞脚.R脚本作为表计算写入Tableau,并发送到R的R服务包。 在此模块执行必要的计算并将结

16、果返回给Tableauo注意:为了正确理解并使用此功能,您必须具备R及其各种 语法的一些知识。对于相同的你可以参考以下教程:Learn Data Science in R fromscratch:https:/.analyticsvidhya./blog/2016/02/complete-tutorial- learn-data-science-scratch/现在让我们看看这个集成的步骤:1)安装 R ()2)安装Rserve软件包在R命令行中运行以下命令:3)配置Tableau以在R中运行打开Tableau帮助设置和性能管理R/外部连接。

17、使用以下默认信息填写字段并选择测试连接:所以,现在你已经准备好了适当的配料,让我们开始吧! 如上图所示,您可以使用Tableau的表计算与R进行通信: 如果您向下滚动功能列表,您将遇到以下四种情况: 当计算区域中包含这些函数时,Tableau会自动理解该脚本适 用于R我希望你最初兴奋的制作集群仍然存在!我们继续。1)从这里下载Iris数据集。https:/github./pavleenkaur/TableauTutorial-On-AnalyticsVidhy贞脚.a/blob/master/iris.csv2)在Tableau中导入数据集,并制作下图:3)在这里,您可以通过不同的度量获得总和

18、。要获得离散值, 请转至分析,并取消选中聚合度量,以获取:4)最后,要形成群集,请在标记窗格中将类维度拖到颜色上: 我们上面有一个散点图,它显示了分为3个不同群集的数据 点群集。现在让我们尝试与R样,并比较我们将得到的两个可视化。 我们将使用最常见的聚类算法K-Means:1)从与上面第2点相同的散点图开始。2)创建一个新的计算字段并填写以下容:为了清楚起见,上述计算是:3)最后,将新形成的Field Cluster拖放到Marks Pane中的Color,以使您的集群准备就绪!虽然有一些重叠,但这两个可视化确实看起来相当准确。 这是将R与Tableau集成的潜力的一个小要点。它的应用程 序是无限的,我相信你一定已经开始考虑可以与之交互的不 同方式。结束笔记如果我说这就是T“ble“u的全部,这可能稍显幼稚。随着新 版本的推出,新功能也将随之推出。不仅如此,人们总是在试验和探索Tableau,并提岀

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论