版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
主讲:第5章数据可视化分析数据可视化概述目
录数据可视化的实践操作
数据可视化概述
1数据可视化是将集中的数据以图形图像形式表示,并利用数据分析工具发现其中未知信息的处理过程。目的:借助于图形化手段,清晰有效地传达与沟通信息,挖掘人对可视化信息的认知能力优势,洞悉大数据背后的信息、知识与智慧。数据可视化的定义数据可视化主要从数据中寻找三个方面的信息:模式,指数据中的规律;关系:指数据之间的相关性;异常:指有问题的数据。数据可视化的定义数据可视化的作用信息传播与协同记录信息分析推理记录信息用图形的方式描述各种具体或抽象的事物是最早的可视化,这种可视化的目的就是将抽象的事物和信息记录下来。例如,古代将观察到的星象信息记录下来,用以推算历法。分析推理数据可视化极大地降低了数据理解的复杂度,有效地提升了信息认知的效率,从而有助于人们更快地分析和推理出有效信息。1854年,伦敦爆发了一场霍乱,英国医生JohnSnow绘制了一张街区地图,如右图所示,这就是著名的“伦敦鬼图”。该图分析了霍乱患者的分布与水井分布之间的关系,发现在一口井的供水范围内患者明显偏多,据此找到了霍乱爆发的根源个被污染的水泵。信息传播与协同俗话说“百闻不如一见”“一图胜千言”。一张好的可视化图可以让人留下深刻印象,更好的理解数据中的信息,进而带来更多传播流量,这对互联网时代的媒体尤为重要。唐诗宋词词云图信息传播与协同美国众议院议员当选前的职业生涯信息传播与协同数据可视化的分类A科学可视化面向自然科学如物理、化学、气象气候、航空航医学、生物学等学科。B信息可视化关注抽象、非结构化的数据集合(如文本、图表、层次结构、地图、软件、复杂系统等)。C可视分析学将可视化、人的因素和数据分析集成在一起的一种新的可视化分类。数据可视化的分类科学可视化空间标量场可视化-二维标量场-等值线数据可视化的分类信息可视化时变数据可视化-数据库CPU使用率监控-出入网bps监控-数据可视化的分类信息可视化层次与网络数据可视化数据可视化的分类可视分析学综合了图形学、数据挖掘、人机交互等技术。以可视化交互为通道,将人的感知和认知能力融入到数据处理过程,形成人脑智能和机器智能优势互补,完成有效的推理和决策。可视分析的范畴地理分析信息分析科学分析数据管理和知识表达感知与认知科学表达、作业和传播统计分析知识发现交互数据可视化的原则可视化的首要任务是准确地展示和传达数据所包含的信息。针对特定的用户对象,设计者可以根据用户的预期和需求,参考可视化设计原则进行展示设计,完成有效的可视化。颜色与透明度选择原则视图选择与交互设计原则数据到可视化的直观映射原则适当运用隐喻原则美学原则数据筛选恰当性原则数据可视化的原则数据筛选误区:信息展示越多越好,信息展示越少越好。
数据筛选恰当性原则信息展示过多,无法让用户集中关注某点,甚至无法理解哪些信息是重要信息。优先级自上而下数值型,适合用能够量化的视觉通道表示,如坐标、长度等。序列型,适合用区分度明显的视觉通道表示,比如密度、饱和度。类别型,适合用易于分组的视觉通道。数据可视化的原则
数据到可视化的直观映射原则数值型数据与可视化间的映射数据可视化的原则各月份售房量及售房金额组合图通过折线图、柱状图等方式(用位置、长度等反映数值间关系)呈现。序列型数据与可视化间的映射数据可视化的原则类别型数据与可视化间的映射数据可视化的原则数据可视化的原则
视图选择与交互设计原则视图选择针对不同的需求,确定展示不同的视图。对于简单的数据,可使用一个基本的可视化视图;对于复杂的数据,可考虑使用较为复杂的可视化视图。交互设计数据可视化系统除了视觉呈现部分,另一个核心要素是用户交互。交互的目的是让用户来操作视图和数据,从而从系统中捕获更多的信息量。选择适合体现每个月的金额占全年总金额的比重的图视觉选择交互设计导航跳转提取联动上卷下钻筛选滚动缩放拖动选择感兴趣的数据对象、区域或特征当视图显示不完整时,滚动鼠标,展示出未展示的部分改变已展示图像的分辨率,选择重点查看内容主要针对地图或其它有层级关系的维度,进行粗细粒度转换展示改变数据表中展示数据的前后顺序,或将感兴趣的信息拖至明显的位置操作一组图形的变动,可导致另外一组图形进行关联变动对选择的数据或者图形进行下载或导出、打印等操作页面信息过长,可点击对应导航按钮,跳转至对应的数据部分本页面内部弹出跳转,或者直接跳至新的页面常见的交互设计方式数据可视化的基本图表类型线图柱图饼图散点图指标看板雷达图漏斗图旋风漏斗树图来源去向矩阵树图仪表盘地图极坐标图词云堆积图双Y轴图面积图多指标折线图曲线图线图数据可视化的基本图表类型——线图样例特点:反映事物随时间或有序类别而变化的趋势,可以清晰展现数据的增减趋势、增减的速率、增减的规律、峰值等特征。柱图分组柱图堆积图百分比堆积图双Y轴柱图条形图数据可视化的基本图表类型——柱图样例特点:易于比较各组数据之间的差别,适合用于展示二维数据集,其中一个轴表示需要对比的分类维度,另一个轴代表相应的数值。饼图环图3D饼图数据可视化的基本图表类型——饼图样例特点:显示一个数据系列中各项的大小与各项总和的比例(组成成分的占比),适合用于二维数据。缺点:不适合较大的数据集展现;数据项中不能有负值;当比例接近时,人眼很难准确判别。分布聚合数据可视化的基本图表类型——散点图样例特点:显示变量间的相互关系或者影响程度,或者发现数据的分布或者聚合情况。数据可视化的基本图表类型——雷达图样例特点:将多个维度(一般四到八个)的数据量映射到起始于同一个圆心的坐标轴上,结束于圆周边缘,然后将同一组的点使用线连接起来。适合展现某个数据集的多个关键特征、关键特征和标准值的比对、比较多条数据在多个维度上的取值。适用于多维数据集。数据可视化的基本图表类型——漏斗图样例特点:适用于业务流程比较规范、周期长、环节多的单流程单向分析,通过漏斗各环节业务数据的比较能够直观地发现和说明问题所在的环节,进而做出决策。说明:漏斗图总是开始于一个100%的数量,结束于一个较小的数量。在开始和结束之间由N个流程环节组成,每个环节用一个梯形来表示。梯形的上底宽度表示当前环节的输入情况,下底表示当前环节的输出,上底与下底之间的差表现了在当前环节业务量的减小量,当前梯形边的斜率表现了当前环节的减小率。漏斗图的所有环节的流量都应该使用同一个度量。数据可视化的基本图表类型——漏斗图样例数据可视化的基本图表类型——树图样例特点:适用于与组织结构有关的分析,即有明确的层次关系的数据。数据可视化的基本图表类型——矩阵树图样例特点:从根节点开始,空间根据相应的子节点数目被分为多个矩形,矩形的面积大小对应节点的属性。每个矩形又按照相应节点的子节点递归的进行分割,直到叶子节点为止。适合展现具有层级关系的数据,能够直观体现同级之间的比较。数据可视化的基本图表类型——来源去向图样例特点:适用于电商或与营销有关系的分析,比如分析购物网站中,哪些商品最畅销或者哪一个时间段是访问高峰。数据可视化的基本图表类型——指标看板样例特点:通过文字、数字和符号的合理排版,对数据进行一目了然的展示。由看板标签和看板指标组成,标签由维度决定,指标由数据的度量决定。适合用来展示一个维度下的一个或者多个度量,特别是对某些指标需要精确读数的场景。数据可视化的基本图表类型——仪表盘样例特点:刻度表示度量,指针表示维度,指针角度表示数值,指针指向当前数值。用于管理报表或报告,直观的表现出某个指标的进度或实际情况。颜色地图气泡地图数据可视化的基本图表类型——地图样例特点:使用地图作为背景,通过图形的位置来表现数据的地理位置,将数据在不同地理位置上的分布通过颜色或者气泡映射在地图上。适合带有地理位置信息的数据集展现,展现的通常是以某个地区为单位的汇总的连续值信息。数据可视化的基本图表类型——极坐标图样例特点:由多个扇区构成的。每个扇区的标签由数据的维度决定,每个扇区长度由数据的度量决定。每个扇形的角度一样,通过半径展示变化。适用于枚举数据之间的比较,比如显示一段时间内的数据变化,或显示各项之间的比较情况。数据可视化的基本图表类型——词云图样例特点:是文本数据的视觉表示,由词汇组成类似云的彩色图形,用于展示大量文本数据。每个词的重要性以字体大小或颜色显示。适合用于描述网站上的关键字(即标签),可以对比文字的重要程度。其本质是点图,是在相应坐标点绘制具有特定样式的文字的结果。数据可视化的基本图表类型–使用场景数据可视化的工具
入门级工具:Excel
商业智能工具:Tableau,PowerBI,QuickBI,Echarts,魔镜,蓝鲸等
编程语言工具:R语言,Python语言AI工具:酷表ChatExcel数据可视化的工具R语言可视化-直方图数据可视化的工具R语言可视化-3D饼图数据可视化的工具R语言可视化-折线图数据可视化的工具R语言可视化-箱线图数据可视化的工具Python语言可视化-折线图数据可视化的工具Python语言可视化-柱状图数据可视化的工具Python语言可视化-饼状图
数据可视化的实践操作
2数据可视化的实践操作——Excel例:某店铺双十一流量数据参见图所示。应用Excel图表对付费流量和免费流量结构进行数据可视化分析。数据可视化的实践操作——Excel计算成交转化率(成交订单数/点击量)计算投入产出比(成交额/投入成本)数据可视化的实践操作——Excel付费流量数据组合图数据可视化的实践操作——Excel免费流量数据组合图数据可视化的实践操作——Tableau例:某公司销售数据参见数据文件(供货发货表数据.xlsx),新建以下图表:(1)客户年龄段分析视图,包括产品类别和订单数量;(2)购买时间分析视图,包括各个月份汇总的利润和订单数量;(3)购买地区(省级)分析视图,包括销售额和运输成本。(4)建立仪表板数据可视化的实践操作——Tableau客户年龄段分析视图步骤1:将度量值“订单数量”拖到视图区的“列”中。步骤2:将维度“产品类别”拖到视图区的“行”中。步骤3:将维度“客户年龄段”拖到“标记”的“颜色”中。数据可视化的实践操作——Tableau购买时间分析视图步骤1:将维度的“订单日期”拖到“列”,将度量值“利润”和“订单数量”拖到“行”。步骤2:右键单击“订单数量”纵轴,选择“双轴”。数据可视化的实践操作——Tableau购买时间分析视图步骤3:将“利润”编辑区域的图形改为“条形图”,“订单数量”编辑区域的图形改为“线”。更改图表标题。数据可视化的实践操作——Tableau购买地区分析视图步骤1:把“省级”的“地理角色”设置为“省/市/自治区”。然后双击“目标省份”,并将“销售额”拖放至“颜色”。数据可视化的实践操作——Tableau购买地区分析视图步骤2:点击“地图”--“地图层”,把“背景”下的“冲蚀”设置为“100%”。然后将行上的“纬度(生成)”复制一份,并点击第二个“纬度(生成)”的下拉箭头选择“双轴”。数据可视化的实践操作——Tableau购买地区分析视图步骤3:打开“标记”卡下的“纬度(生成)(2)
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 腹膜炎的护理沟通技巧
- 年轻人愿为精力管理付费困了解忧累了回血焦虑了安神方法指南
- 定期护理培训的核心要点
- 数据管理过程中的系统化处理指南
- 骨科护理中的护理沟通新技巧
- 2024-2025学年度三支一扶考前冲刺试卷及参考答案详解【培优A卷】
- 2024-2025学年度收银审核员考试历年机考真题集带答案详解(典型题)
- 2024-2025学年度电梯考试全真模拟模拟题含答案详解【新】
- 业务领域诚信承诺书(5篇)
- 2024-2025学年度医院三基考试试卷带答案详解(研优卷)
- 2026年环保碳捕捉技术报告及未来五至十年减排效果报告
- 2026年中考道德与法治一轮复习:情境100题含答案
- 模型蒸馏在金融应用中的有效性研究
- 车辆维修和保养服务框架协议采购项目投标文件(技术方案)
- 中国听性脑干反应临床操作规范专家共识(2026版)
- 装配式建筑概论全套课件
- 接待免责协议书
- 2025csco子宫内膜癌诊疗指南
- 地铁接触网工个人工作总结
- 2026年哈尔滨北方航空职业技术学院单招职业适应性考试题库含答案详解
- 生物会考动员课件
评论
0/150
提交评论