手把手教你Tableau高级数据分析功能(附数据集)_第1页
手把手教你Tableau高级数据分析功能(附数据集)_第2页
手把手教你Tableau高级数据分析功能(附数据集)_第3页
手把手教你Tableau高级数据分析功能(附数据集)_第4页
手把手教你Tableau高级数据分析功能(附数据集)_第5页
已阅读5页,还剩7页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

手把手教你 Tableau 高级数据分析功能 附数据集 原文标题 A Step by Step Guide to learn Advanced Tableau for Data Science and Business Intelligence Professionals 作者 Pavleen Kaur 翻译 李清扬校对 卢苗 苗 本文共 4000 字 建议阅读 8 分钟 本文借助高级图表创建计算深入研究数据以提取对数据的 分析 并了解 R 如何与 Tableau 相互集成和使用 简介 查看数据 显示图表 讲故事 吸引观众 Tableau 是当今数据科学和商业智能专业人员使用的最流行 的数据可视化工具之一 它使您能够以交互和多彩的方式 创建具有洞察力和影响力的可视化效果图 它的用途不仅 仅是创建传统的图表和图表 您可以使用它来挖掘可操作 的数据解析 这要归功于它提供的大量功能和自定义 以 其易用性和简单的功能而闻名 制作如下所示的富有洞察 力的仪表盘只需点击几下鼠标 在本文中 我们将看到一 些超越拖放功能的高级图表 我们将创建计算以深入研究 数据以提取对数据的分析 我们还将看看 R 如何与 Tableau 相互集成和使用 本文假定您掌握丰富的使用 Tableau 的知识 例如基本图表形成 计算 参数等 如果 您不这样做 我会建议先参考以下文章 然后再返回此处 Tableau for Beginners 简化数据可视化 visualisation made easy 中级 Tableau 指南 适用于数据科 学和商业智能专业人员 intermediate data science 目录 1 高级图形 可视化超越 显示我 运动图凹凸图甜甜圈图表瀑布图帕累托图 2 在 Tableau 中引入 R 编程 1 高级图形 可视化超越 Show Me 几乎所有的 Tableau 用户都知道各种基本图形 例如介绍仪 表板中显示的那些图形 这些图表可以使用 Tableau 的 Show Me 功能轻松完成 但由于这是一篇面向高级用 户的文章 因此我们将超越 Show Me 并探索需要额外计 算的图表 首先 让我们快速浏览一下我们将在接下来的 几节中做什么 以下是我们超市的销售额和利润的一些基 本分析 简单的图表可以达到与主板中的相同的目的 但 我认为您会对这些图表的宏伟感到兴奋和激动 AnalyticsVidhya blob master Sample Superstore xls 1 1 动态 图表 在开始之前 先看看 Hans Rosling 的世界经济图表展 示 https www gapminder org tools chart type bubbles 点击播放键 看到魔法在你面前展开 有兴趣自己做一个 类似的图表展示吗 不要担心如何做这些动画 你所看到 的被称为动态图表 使用此功能 您可以实时查看数据中 的变化 因此 我们首先下载可在此处找到的 Superstore 数据集 AnalyticsVidhya blob master Sample Superstore xls 现在让 趋势线如下图所示对你来说应该很容易 但是本节我们首 先要学习的是如何使下面的趋势线运动 gif 动图 https s3 ap south content uploads 2017 08 23131759 2 gif 所以让我们开始吧 导入您的数据集 并创建上述趋势图 我们的 X 轴是订单 日期 月份格式 销售额和利润是度量值 您只需将 订 单日期 拖到 页面 功能区 然后再次更改格式以与 X 轴匹配 将标记类型从自动更改变更为圆形 转到 显示 历史记录 然后选择 追踪 以查看趋势变化 瞧 您 的动态图表已准备好启动 按箭头按钮查看动作 更改 显示历史 定制项 速度项等 1 2 凹凸图 假设你想探索 Superstore 各个部门的销售额 整 整一年 其中一种方法是 然而备选方案如下 虽然折线图能够显示每个细分部门之间的销售差异 但凹 凸图 上图 给出了更清晰和简明的相同结果图 这些图 表通常用于了解多年来特定产品的受欢迎程度如何变化 现在让我们尝试自己创建一个 1 首先 我们需要考虑度量单位 根据这些度量单位我们对 我们的测量维度进行排名 这里我们采取的度量单位是销 售量 测量维度是部门 2 您需要计算模块的帮助才能制作凹凸图表 所以快速创 建一个如下所示的计算 我们将对每个细分部门的销售总 额进行排名 3 现在将 订单日期 拖到列中并将格式更改 为月 在标记窗格中将 Segment 拖动到 Marks Pane 里 的颜色 最后将 Rank 拖到行 4 在你现在可以看到的图表中 排名是根据月份数量分配的 但是 我们需要他们在细分部门的基础上 因此 右键单 击行中的排名 然后转到编辑表格计算 5 由于我们希望使用细分部门计算 请将配置更改为 您将获得的图表看起来不像仪表板中的图表 因为它缺少 标签 让我们在双轴 Dual Axis 的帮助下快速修复 6 再 次将排名拖到行上并重复步骤 4 和 5 以得到 您在 Marks Pane 中看到了 Rank 和 Rank 2 吗 我们将使用 这些来创建带圆圈的标签 7 要将上述内容转换为双轴图表 请右键单击第二个图表的 Rank 轴并选择双轴 8 在 Marks Pane 中 Rank 或 Rank 2 然后将标记类型更 改为圆形而不是自动 9 这里的排名按降序排列 要将其更改为升序 请右键单 击左侧的 Rank 轴 编辑轴 反向比例 对右边的 Rank 轴重复同样的操作 10 最后 将 销售额 拖放到标签 快速表计算 总计 百分比上 以获得我们期望的凹凸图 1 3 甜甜圈图 圆环 图是初级图的另一种表现形式 坦率地说 它是一个中间 有一个洞的饼图 但它有助于更加强调各个细分市场 如 下所示 让我们了解这个区别的不同之处 1 我们将从一个简单的饼图开始描绘每个细分部门的利润 2 要创建饼图的双轴 将 measure 的 number of records 拖动 到 rows 两次 通过右键点击它们并选择最小值代替默认总 和来更改每个绿色药丸的度量 3 选择 Marks Pane 中的第二个饼图 并将其中的每个度量 维度拖出 减小图表的大小 并将颜色更改为白色 尽管 此处未显示 4 要创建双轴 右键单击第二个饼图的 Y 轴 然后选择双 轴 以获得图表 现在你必须明白 以上所有图表虽然在最终外观上都不相 同 但都是从 显示我 功能的核心图表中获得的 但是 等一下 它还没有结束 我有更多要展示给你 1 4 瀑布图瀑布图的名称来自于其类似的方向和流动 在这 里 我们绘制了 Superstore 多年来的运行销售情况 您可以 在 2013 年中和 2014 年初看到两个小红色区域 表明销售 额实际下降了 并且还有多少 这意味着这些图表被用来分析一个度量的累积效应 并且 看它是如何作为一个整体增加和减少的 为了更好地理解 这一点 让我们想象它 瀑布图是折线图的衍生物 因此我们将从该图开始 注意 这里的 X 轴是订单日期 以月 年格式并转换为 离散型 Y 轴是利润 1 右键单击绿色的 Profit Pill 然后选择 Quick Table Calculation Running Total 2 将标记类型从自动更改为甘特条 3 创建一个名为 NegProfit 的计算字段 4 将这个 NegProfit 拖到 Marks 框架中的 Size 上 得到 计算的字段用于填写甘特图中的空间 利润中的负值将向 下延伸 而正值则会向上延伸 图表中每个小条的长度表示利润从一个月到下一个月的变 化量 5 最后 将利润拖到颜色 6 您可以继续前进 将颜色更改为两步变化 并清楚地查看 上升和下降 您将获得的图表也可以非常容易地以条形图 的形式表示 请注意 我在这里将颜色分置 以使其凸显 出来 但我相信你会同意使用瀑布图是一种更直观的表示数据的 方式 特别是看看多年来度量的变化 例如销售和利润 1 5 帕累托图 下面我已经将一个流行的 80 20 数据分析原理可视化出来 如果你还没有听说过它 让我试着用例子来解释它 我们 会经常观察到超市的大部分销售来自少数几种产品 人们不能指望面包和鸡蛋与蛋糕有相同的销售数字 对吧 这正式被称为 80 20 原则 这意味着 80 的销售额来自 20 的产品 在我们的超市里 这个原则可以在下面的图 表中看到 其中大部分销售是由电话和椅子生成的 这是一种相当流行的可视化 帕累托图通常用于风险管理 以确定对项目造成最大负面影响的最常见问题 但正如我们 将看到的 它也可以有其他应用程序 让我们看看它是如何完成的 1 我们将从下面的图表开始 这具有作为 X 轴的子类别和 作为 Y 轴的销售 图表按降序排列 2 接下来 将销售额拖放到图表上 直到您看到绿色突出显 示的条形和最右边的虚线轴 3 在此处下降销售以创建双轴 将第一个图表的标记类型 更改为条形图 将第二个图表更改为直线 最终得到 4 右键单击第二个绿色销售药丸 并为其添加运行总计算 5 剩下的只是改变配色方案 并且您的帕累托图表已准备就 绪 2 在 Tableau 中引入 R 编程 我喜欢 Tableau 的一个原因是 它不仅仅是一个工具 而且 意味着只需拖放操作即可创建漂亮的图形 随着 2013 年 Tableau 8 1 的发布 出现了许多新的功能 R 编程的引入使得更丰富和动态的可视化得以实现 这是主 要特征之一 R 编程可与 Tableau 一起用于聚类 预测等 技术 我想通过 Clustering 开始对 R 和 Tableau 的探索 所以我使 用了超流行的 Iris Dataset AnalyticsVidhya blob master iris csv 它包含不同的功能来 区分 3 种类型的 flowers 即 Virginica Setosa 和 Versicolor 正如你在下面的图片中看到的那样 R 编程整 合很容易创建这三种物种的集群 如果你有兴趣 可进行一下操作 首先 深入了解基础知 识和安装过程 然后深入研究可视化问题 以下描述了 Tableau 和 R 之间的控制流程 以实现此集成 R 脚本作为表计算写入 Tableau 并发送到 R 的 R 服务包 在此模块执行必要的计算并将结果返回给 Tableau 注意 为了正确理解并使用此功能 您必须具备 R 及其各 种语法的一些知识 对于相同的你可以参考以下教程 Learn Data Science in R from scratch e tutorial learn data science scratch 现在让我们看看这个集成的步骤 1 安装 R https cran r project org 2 安装 Rserve 软件包 在 R 命令行中运行以下命令 3 配置 Tableau 以在 R 中运行 打开 Tableau 帮助 设置和性能 管理 R 外部连接 使用以下默认信息填写字段并选择测试连接 所以 现在你已经准备好了适当的配料 让我们开始吧 如上图所示 您可以使用 Tableau 的表计算与 R 进行通信 如果您向下滚动功能列表 您将遇到以下四种情况 当计算区域中包含这些函数时 Tableau 会自动理解该脚本 适用于 R 我希望你最初兴奋的制作集群仍然存在 我们继续 1 从这里下载 Iris 数据集 AnalyticsVidhya blob master iris csv 2 在 Tableau 中导入数据集 并制作下图 3 在这里 您可以通过不同的度量获得总和 要获得离散值 请转至分析 并取消选中聚合度量 以获取 4 最后 要形成群集 请在标记窗格中将类维度拖到颜色上 我们上面有一个散点图 它显示了分为 3 个不同群集的数 据点群集 现在让我们尝试与 R 一样 并比较我们将得到的两个可视 化 我们将使用最常见的聚类算法 K Means 1 从与上面第 2 点相同的散点图开始 2 创建一个新的计算字段并填写以下内容 为了清楚起见 上述计算是 3 最后 将新形成的 Field Cluster 拖放到 Marks Pane 中的 Color 以使您的集群准备就绪 虽然有一些重叠 但这两个可视化确实看起来相当准确 这是将 R 与 Tableau 集成的潜力的一个小要点 它的应用 程序是无限的 我相信你一定已经开始考虑可以与之交互 的不同方式 结束笔记 如果我说这就是 Tableau 的全部 这可能稍显幼稚 随着新 版本的推出 新功能也将随之推出 不仅如此 人们总是在试验和探索 Tableau 并提出新的视 觉效果 在很多博客里 人们也发布了其数据实验 可以 搜索一下 您还可以在 Tableau 官方图库页面上查找每周更新的可视化 图像 建议你继续 参考这些帖子 创建自己的视觉效果 并与社区分享 作为一名数据探索者 保持创意并保持最佳状态 原文链接 advanced users easy expertise in data visualisation 译者简介 李清扬 清华大学工商管理研究生在读 主修管理学 对 大数据 人工智能在经济金融领域的应用感兴

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论