




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第八章数据——可视化学习目标:1.了解数据可视化的含义、作用、原则等2.掌握数据可视化的常用图表类型3.能利用相应的工具进行数据可视化图表制作DataVisualization引例如何提高人力资源大数据分析可视化技能?本章提纲数据可视化概述数据可视化图表分析0102数据可视化概述第一节数据可视化的含义狭义的数据可视化指利用计算机图形学和图像处理技术,将数据转换为图形或图像在屏幕上显示出来,并利用数据分析和开发工具发现其中未知信息,并进行各种交互处理的理论、方法和技术。广义的数据可视化指一切能够把抽象、枯燥或难以理解的内容,包括看似毫无意义的数据、信息、知识以―种容易理解的视觉方式展示出来的技术。数据可视化的流程一般包括数据采集、数据分析、可视化设计,从抽象的原始数据到具象的可视化图形。数据采集数据分析可视化设计数据图形应用信息理解信息信息图阅读数据源数据集合的汇总可视化数据具象的过程抽象数据真实的表达易懂理解现实的过程数据可视化的发展数据可视化技术的快速发展和其不断变化的认知框架正在为我们打开新的视野,很多新的数据可视化形式不断产生。(1)早期手工探索时期(18世纪-19世纪);(2)数据可视化初步发展(20世纪60年代);(3)图形图表开始应用(20世纪80年代);(4)数据统计得到高度认同(2000年);(5)依附计算机技术的快速发展(2010年);(6)可视化专业工具百花齐放(2020年);(7)VR/AR、AI工具应用(未来)。数据可视化的特征(1)可视性:数据可以用二维、三维图形和动画等显示,以视觉效果来加强用户对数据的感知能力。(2)交互性:允许用户选择感兴趣的内容,或者改变数据的展示形式,更好地促进用户和数据之间的互动。(3)多维性:对数据相关的多个变量或多个属性进行标识,可根据每一维的量值来进行显示、排序、组合与分类。1.传递速度快人脑对图形信息的处理要比文字信息快十倍。用图表来总结复杂的数据,可以确保对关系的理解更快。2.数据显示的多维性在可视化的分析下,将数据每一维的值分类、排序、组合和显示,这样就可以看到表示对象或事件的数据的多个属性或变量。数据可视化的作用3.直观的信息展示大数据可视化报告使我们能够用一些简单的图形体现复杂信息,甚至用单个图形也能做到。丰富且有意义的图形有助于让忙碌的主管或是业务伙伴了解问题。4.大脑记忆能力的限制很多研究已经表明,在进行理解和学习任务的时候,图文结合能够帮助读者更好地了解所要学习的内容,图像更容易理解,更有趣,也更容易让人们记住,这也是数据可视化的魅力所在。数据可视化的作用1.Excel和PowerPoint作为数据可视化入门级工具,Excel和PowerPoint依然被大量使用,但是在处理的数据量、图表样式选择上有限制。2.PythonPython是一种计算机程序语言,是相对复杂的开源工具。Python对工具使用者有较高的代码开发要求。数据可视化的工具利用Python绘制的统计图3.TableauTableau是一种专业数据可视化分析工具,Tableau具有多种可用版本,包括桌面应用程序、服务器和免费的公共版本。但它的操作需要学习和培训,非免费版本价格昂贵。4.GoogleChartsGoogleCharts是一款功能强大的免费数据可视化工具,专门用于创建在线嵌人的交互式图表。它的优点是提供多种图表格式,可以处理动态数据。数据可视化的工具5.百度Echarts百度Echarts是百度用JavaScript实现的开源可视化库,可运行在计算机和移动设备上,可以实现高度个性化定制。6.阿里DataV阿里DataV是阿里云专业大屏数据可视化工具,通过拖拽组件加配置数据的方式快速生成可视化大屏。7.用友分析云用友分析云是用于商业分析、可视化的工具,它支持拖拽操作,且图表丰富。数据可视化的工具数据可视化的应用数据可视化广泛应用于政府、企业经营管理分析等。随着多媒体和网络技术的发展,数据可视化应用产生了多种新兴形式。1.大屏大屏数据可视化需求正在逐步扩大,例如一些监控中心、指挥调度中心,以及如企业展厅、展览中心之类以数据展示为主的展示场所,还有电商平台在大促活动时对外公布实时销售数据来作为广告公关手段等。数据可视化图表分类图表名称常规的数据可视化图表柱形图(直方图)、堆积柱形图条形图、堆积条形图折线图、面积图————饼图、环形图玫瑰图(南丁格尔玫瑰图)双轴图(柱形图与折线图结合)雷达图————————散点图地理数据可视化图表地图—————————热力图线图(路径图)关系数据可视化图表关系图————————树图、矩形树图旭日图文本分析图表词云图(标签云)统计专用分析图表盒须图(箱形图)多维数据可视化图表平行坐标商务智能(BI)分析漏斗图————————仪表盘K线图数据可视化图表分析第二节Excel可视化利用Excel可以对数据做基础的可视化展示。Excel提供了10多种标准图表类型,常用的图表包括柱形图、条形图、折线图、饼图、组合图、雷达图等。1.柱形图Excel可视化条形图是将柱形图按照顺时针方向旋转90°之后生成的图形。当标签过长时,为了用户更方便地阅读标签,选择条形图明显要优于选择柱形图。2.条形图Excel可视化折线图比较适合对连续的数据进行绘制,从中发现数据走势规律。3.折线图Excel可视化当对某一组数据中各个数值的占比进行分析时,饼图是最佳选择。4.饼图Excel可视化组合图也叫双轴图,可以把多个图表组合在一起。5.组合图Excel可视化雷达图是一种可以表现多个分类数据大小的图表。6.雷达图Python可视化利用Python可视化数据一般需要调用专用于可视化的库,常用的有Matplotlib、Seaborn、Bokeh、Plotly、Pyecharts等。1.Matplotlib该库提供完全的二维图像支持和部分三维图像支持。在跨平台和互动式环境中生成高质量数据时,Matplotlib会很有帮助,也可以用来制作动画。2.Seaborn该库能够创建富含信息量和美观的统计图形。Seaborn基于Matplotlib,具有多种特性,比如内置主题、调色板,可以可视化单变量数据、双变量数据、线性回归数据和数据矩阵以及统计型时序数据等,能让我们创建复杂的可视化图形。Python可视化3.Bokeh该库是一个专门针对网页浏览器的呈现功能的交互式可视化Python库,支持现代化网页浏览器展示,这是Bokeh与其他可视化库最核心的区别。使用Bokeh可以快速便捷地创建交互式绘图、仪表盘和数据应用程序等。Bokeh能与NumPy、Pandas、Blaze等大部分数组或表格式的数据结构完美结合。4.Plotly该库是一个开源、交互式和基于网页浏览器的Python库,可以创建能在仪表盘或网页中使用的交互式图表。它是一个高级图表库,与Bokeh一样,Plotly的强项是制作交互式图表,有超过30种图表类型。Plotly绘制的图表能直接在jupyter中查看,也能保存为离线网页,或者保存在云端服务器内,以便在线查看。Python可视化5.Pyecharts该库是基于Echarts开发的,是一个用于生成Echarts图表的类库。Echarts是百度开源的一个数据可视化JavaScript库,凭借着良好的交互性、精巧的图表设计,得到了众多开发者的认可。该库的文档全部用中文撰写,而Pyecharts实际上就是Echarts与Python的对接。Python可视化图表1.条形图运行代码的输出结果如图所示。不同性别的平均月薪柱形图Python可视化图表2.折线图运行代码的输出结果如图所示。不同性别的平均月薪柱形图Python可视化图表3.堆积柱形图运行代码的输出结果如图所示。不同性别学历的平均月薪堆叠柱形图Python可视化图表4.散点图运行代码的输出结果如图所示。不同年龄的月薪散点图Python可视化图表5.气泡图运行代码的输出结果如图所示。不同年龄的月薪散点图Python可视化图表6.饼图运行代码的输出结果如图所示。不同年龄的月薪散点图Python可视化图表7.热力图运行代码的输出结果如图所示。注:绘制此图还需引入seaborn库,即:importseabornassns不同部门不同学历平均月薪热力图Python可视化图表8.直方图运行代码的输出结果如图所示。不同部门不同学历平均月薪热力图Python可视化图表9.箱线图运行代码的输出结果如图所示。不同部门不同学历平均月薪热力图用友分析云可视化1.数据可视化标签区显示当前正在编辑的数据可视化图表,可以通过加号添加数据可视化图表,实现批量创建数据可视化图表的功能。2.维度和指标备选区此处列出当前数据集所有的维度和指标字段,可以切换数据集、添加层级、计算字段。3.图形选择区共有34种图形可供选择。4.维度和指标应用区可以将左侧的维度和指标字段拖入该区域来制作数据可视化图表,实现排序过滤、计算、颜色设置等功能。数据获取用友分析云提供三种数据获取的方式:数据库连接、数据上传、数据填报。1.数据库连接在页面中点击“新建数据连接”,测试成功后数据库连接列表会显示添加的数据库连接。数据获取2.数据上传用友分析云可以通过上传数据来采集分析数据,用户可以在数据准备页面上传本地的数据文件(如XLS、CSV)到用友分析云,进一步支持分析。若选择了XLS数据文件,用友分析云则列出文件中所有页签供用户选择,后续需要继续选择保存文件夹等信息。若选择了CSV数据文件,用友分析云则列出所有字段供用户选择。上传数据后,在数据预览页面还可以追加数据、替换数据。追加数据是在当前数据的基础上直接追加,而替换数据则会用新数据替换当前数据。数据获取3.数据填报由于信息系统建设周期和历史原因,大多数企业只有部分数据存储在数据库。企业进行数据分析时,面临的首要问题是数据的不全,这部分数据一般通过邮件和Excel文件存储和在企业内部传播。为了解决这一问题,用友分析云同时支持数据填报功能,企业可以根据业务自定义表单和流程,把线下数据纳入系统统一管理,进一步支持分析。故事板管理与设计用友分析云的核心功能是进行故事板的设计,它体现了分析所要展现的信息。1.新建文件夹(1)点击左侧导航栏中的“分析设计”按钮进人分析设计模块;(2)在点击“新建”按钮后出现的下拉菜单中,选择“新建文件夹”。故事板管理与设计2.管理文件夹已经创建好的文件夹可以通过点击文件夹右边的“更多”图标打开下拉菜单进行管理,用友分析云对文件夹提供了如下管理功能:重命名(可以给文件夹更换名称);移动(可以移动文件夹到另一个文件夹下,也可以通过拖拽的方式直接移动文件夹到所需的位置,移动的文件夹携带文件夹下的所有故事板);删除(可以删除整个文件夹,删除的文件夹时文件夹下的故事板也被删除);移动端可见(可以设置文件夹是否能够在移动端显示)。故事板管理与设计3.管理故事板设计者可以在目录中直接对故事板进行管理,用友分析云提供如下几种管理操作:编辑(点击后进入故事板编辑页面,仅当用户拥有故事板编辑权限后出现);重命名(为故事板修改名称);复制(复制该故事板到其他目录);移动(移动该故事板到其他目录);删除(删除该故事板)。故事板管理与设计4.设计故事板(1)新建故事板在用友分析云界面中,点击左侧导航栏中的“分析设计”按钮,进入分析设计页面。点击“新建”后在出现的菜单中选择“新建故事板”,可以打开创建故事板的对话框。可选择创建普通故事板或者移动故事板。普通故事板是适合在计算机上使用的故事板,适配计算机的分辨率。移动故事板是专门给移动设备使用的故事板,适配移动设备分辨率。故事板管理与设计4.设计故事板(2)编辑故事板故事板编辑器主要由四大区域组成:顶部主功能区,主要包含故事板名称显示和编辑、保存故事板、添加数据可视化图表、添加筛选器、添加其他控件、预览故事板等功能。中央画布区,设计者可以在该区域设计故事板,添加数据可视化图表、筛选器等组件,打造自己的数据分析故事板。属性面板,提供所有组件和页面的样式设置,以及筛选器的数据设置功能。附属功能区,主要包含布局/编辑模式的切换、画布的缩放等功能。利用用友分析云制作可视化图表1.制作柱形图/条形图应注意的问题(1)避免使用太多颜色。一个柱形图/条形图表示一组相同的变量,使用相同的颜色或同一颜色的不同色调。如果需要强调某个数据时,可以使用对比色或者不同色调来突出显示有意义的数据点。(2)柱形图/条形图的柱形/条形的宽度和间隙要适当。当柱形/条形太窄时,用户的视觉可能会集中在两个柱形/条形中间的间隔区域,而这里是不承载任何数据的。合理的宽度和间隙应该是柱形/条形的宽度不小于柱形/条形间隙的两倍。利用用友分析云制作可视化图表1.制作柱形图/条形图应注意的问题(3)坐标轴刻度应该从0开始,以恰当地反映数值。如果展示的是被截断的数据,会误导读者做出错误的结论。(4)对多个数据系列排序时,如果不涉及日期等特定数据,要符合一定的逻辑顺序。可以通过升序或降序排布,如按照数量多少、字母顺序等来排序。(5)一般情况下不使用三维柱形图/条形图,因为它对于数据传达不太精准,读者需要猜测到底哪里才是数据的顶端。利用用友分析云制作可视化图表2.制作饼类图注意事项(1)饼图适合用来展示单一维度数据的占比。要求其数值中没有零或负值,并确保各扇区占比总和为100%。(2)饼图扇区数量控制在10个以内。当数据类别较多时,把较小或不重要的数据合并成“其他”模块。各类别都必须全部展示时选择柱形图或堆积柱形图更合适。利用用友分析云制作可视化图表2.制作饼类图注意事项(3)饼图不适合被用于精确数据的比较。各类别数据占比较接近时,可选用柱形图或玫瑰图来获取更好的展示效果。(4)绘制饼图时应从12点钟开始沿顺时针或逆时针由大到小排列各数据区块。按照数据大小排列顺序,不仅符合用户的视觉习惯,也更易于数据的识别和比较。也可将需要强调的最重要的部分(不一定是最大的部分)放在最突出重要的位置。(5)三维饼图歪曲了各区块相对于整体的比例关系,会造成理解困难甚至错误,一般不建议使用三维饼图。利用用友分析云制作可视化图表3.折线图/曲线图折线图非常适合用于展示一个连续的二维数据。一般来说,折线图主要用来展示数据随着时间推移的趋势或变化,还可以用来比较多个不同的数据序列。为了追求美观或特殊的效果,可将相邻两个数据点用曲线连接,这种图又叫曲线图或样条图。曲线图与折线图用法相同,每个数据点之间绘制的是曲线。利用用友分析云制作可视化图表3.折线图/曲线图制作折线图/曲线图的注意事项:使用实线绘制数据线,要保证能够区分数据线和坐标轴线,并且要使所有的数据清晰可识别。不要绘制4条以上的折线或曲线,线都折叠在一起整张图表会显得混乱并难以阅读。不使用过多的图例来区分数据系列,图例虽然可以帮助区分数据系列,但使用过多种类的图例会分散重点。展示折线图/曲线图的数据时,要避免刻意的歪曲趋势。要根据展示数据波动的参考单位,做有意义的波动分析。利用用友分析云制作可视化图表4.堆积面积图堆积面积图是一种特殊的面积图,可以用来比较在一个区间内的多个变量。如果有多个数据系列,并想分析每个部分与整体的关系,并展现部分量对于总量的贡献,那么使用堆积面积图是非常合适的选择。堆积面积图类型有两种不同的类型:(1)传统的堆积面积图:直接使用原始值堆积,显示整个过程如何变化。(2)百分比堆积面积图:百分比堆积显示不同部分之间的关系如何随时间而变化。其中累积的总数不重要,重要的是显示出类别分布在整体中的作用。利用用友分析云制作可视化图表5.地图当指标数据要表达的主题跟地域有关联时,一般会选择用地图为大背景。用户可以直观地了解整体的数据情况,同时也可以根据地理位置快速定位到某一地区来查看详细数据。利用用友分析云制作可视化图表6.仪表盘仪表盘也被称为拨号图表或速度图表。其数据显示类似于拨号盘或速度计上的读数,是一种拟物化的展示形式。仪表盘的颜色可以用来划分指示值的类别,使用刻度标示数据,指针指示维度,指针角度表示数值。仪表盘只需分配最小值和最大值,并定义一个颜色范围,指针(指数)将显示出关键指标的数据或当前进度。仪表盘可用于显示速度、体积、温度、进度、完成率、满意度等。利用用友分析云制作可视化图表6.仪表盘制作仪表盘的注意事项:(1)仪表盘非常适合在量化的情况下显示单一变量的值和衡量标准,不适合用于比较多个变量或者分析趋势。(2)仪表盘可以同时展示不同维度的数据,但指针不要超过3根。如果有多个数据需要展示,可使用多个仪表盘。利用用友分析云制作可视化图表7.气泡图气泡图是显示变量之间相关性的一种图表,与散点图类似。在直角坐标系中显示数据的两个变量(X轴和Y轴)之间的关系,数据显示为点的集合。与散点图不同的是,气泡图是一个多变量图,它增加了第三个数值即气泡大小这个变量,在气泡图中,较大的气泡表示较大的值。可以通过气泡的位置分布和大小比例,来分析数据的规律。利用用友分析云制作可视化图表7.气泡图制作气泡图的注意事项:(1)当数据具有3个序列、特征及相关值,使用气泡图能较直观显示出来。(2)可给气泡加入颜色编码。(3)气泡图还可和地图结合,用坐标轴表示经度和纬度的位置定位,气泡的大小可以表明该位置的变量数值的多少。利用用友分析云制作可视化图表8.漏斗图漏斗图又叫倒三角图,将数据呈现为几个阶段,每个阶段的数据都是整体的一部分,从一个阶段到另一个阶段数据自上而下逐渐下降。与饼图一样,漏斗图呈现的也不是具体的数据,而是该数据相对于总数的占比。漏斗图不需要使用任何数据轴。制作漏斗图的注意事项:(1)漏斗图要能够直观地展示和说明问题所在,以便有针对性地通过各阶段的分析去改善。(2)可将基于同一事情影响前后的两份数据制作的漏斗图重叠进行对比。(3)可以用左右对称放置的漏斗图对比分析两个项目。利用用友分析云制作可视化图表9.热力图热力图需要1个维度和1个指标来生成所需图形,根据要求将热力图所需指标选定后,可以分别设置过滤条件、颜色、显示设置、预警线等内容。10.矩形树图矩形树图是表达“层级数据”“树状数据”的可视化形式。它主要用面积的方式表现数值的大小,便于突出展现出“树”的各层级中重要的节点,适合多个类目指标对比大小。利用用友分析云制作可视化图表11.雷达图雷达图又叫作蜘蛛网图,适用于显示三个或更多的维度的变量。它是以从同一点开始的坐标轴上显示的三个或更多个变量的二维图表的形式来显示多元数据的方法,其中坐标轴的相对位置和角度通常是无意义的。雷达图对于查看哪些变量具有相似的值、变量之间是否有异常值都很有用。也可用于查看哪些变量在数据集内得分较高或较低,适合展示性能、排名、评估、评论等数据。利用用友分析云制作可视化图表11.雷达图制作雷达图的注意事项:(1)一个雷达图包含的多边形数量是有限的,一般不超过10个,以免轮廓、填充区域产生覆盖和混乱,使得数据难以阅读。(2)变量太多会产生太多的坐标轴,也会使图表变得混乱,要保持雷达图的简单并限制其变量数量。(3)很难直观地比较图表内变量具体的值,如果需要比较具体的值,应使用折线图。利用用友分析云制作可视化图表12.桑基图桑基图又称能量平衡图,是一种特定类型的流程图,是展现数据流动的利器,图中延伸的分支的宽度对应数据流量的大小,因1898年马修·亨利·菲尼亚斯·里亚尔·桑基(MatthewHenryPhineasRiallSankey)绘制的“
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 《公差配合与技术测量》课件-第6章:键和花键联结的公差与测量
- 工业互联网平台微服务架构性能测试报告2025:设备预测性维护效果评估
- QuestAuto 2025年新能源汽车市场发展半年报:月度活跃量逼近3400万辆!-行业研究报告-QuestMobile
- 台州塑料薄膜试题及答案
- 养殖基地管理办法
- 养鸭场地管理办法
- 内审人员管理办法
- 内部增票管理办法
- 内部认证管理办法
- 军人制服管理办法
- 水浒传每回内容梗概
- (译林版)二年级英语上册期中检测卷-附参考答案
- 工地试验室安全培训内容
- 小儿哮喘病护理
- 了解PLC的PID控制原理
- 辽宁省第二届职业技能大赛(健康照护赛项)理论参考试题及答案
- 中建桥面系及桥梁附属专项施工方案
- 2024年食品安全生产经营大比武理论考试题库-下(多选、判断题)
- 有限空间专项安全检查表
- Unit 1 Making friends(单元测试)-2024-2025学年人教PEP版(2024)英语三年级上册
- 2024光伏电站设备评级标准
评论
0/150
提交评论