数据可视化 课件 第7章有关关系的可视化_第1页
数据可视化 课件 第7章有关关系的可视化_第2页
数据可视化 课件 第7章有关关系的可视化_第3页
数据可视化 课件 第7章有关关系的可视化_第4页
数据可视化 课件 第7章有关关系的可视化_第5页
已阅读5页,还剩19页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第7章

有关关系的可视化本章主要内容在关系中寻求什么关联性(圆点、探索更多的变量、气泡)分布(老式分布图表、有关分布的柱形、延续性的密度)对照和比较7.1

在关系中寻求什么当某个数量增加时,另一个数量是否会减少?它们之间是因果关系还是关联关系?群体彼此之间是存在交叠还是互不干涉?关联性可以帮助我们根据某一已知指标来预测另一指标。7.2

关联性——散点图(探索更多的变量)图.

散点图矩阵的基本框架7.2关联性

气泡图优势在于一次比较3个变量:x轴y轴气泡的面积图.

气泡图的基本框架7.3

分布直方图Hist()用一系列宽度相等、高度不等的长方形来表示数据分布matplotlib.pyplot.hist(x, bins, range, density,weights, cumulative, bottom,histtype,**kwargs)参数说明(部分):

x→作图所用的数据,一维数组,多维数组可以扁平化后再作图

bins→直方图的柱数,可选项,整数、序列或字符串型。默认10

range→指定直方图数据的上下界,默认包含绘图数据的最大值和最小值(范围)

density→布尔值,如果为"True”,将y轴转化为密度刻度,默认为None

weights→为每个数据点设置权重

cumulative→布尔值,是否需要计算累计频数或频率,默认为False

bottom→为直方图添加基准线,数组型,默认为none

histtype→直方图类型,分为bar,barstacked,step,stepfilled。默认为bar内距IQRInter-QuartileRange ,又

四分位差。盒须图(箱形图主要用于反映原始数据分布的特征,也可以进行多组数据分布特征的比较。盒须图变种可以水平或者垂直绘制盒须图变种2DBox

PlotRelplotRangefinderBox

PlotBag

Plotmatplotlib.pyplot.boxplot(x,notch,vert,patch_artist,whis,widths,

labels,**kwargs)x:输入数据。类型为数组或向量序列。必备参数。notch:控制箱体中央是否有V型凹槽。当取值为True时,箱体中央有V型凹槽,凹槽表示中位数的置信区间;取值为False时,箱体为矩形。类型为布尔值,默认值为False。可选参数。sym:离群点的默认标记符号,详解flierprops参数。类型为字符串,默认值为'None'。可选参数。取值为''隐藏离群点,取值为'None'时,取值为'b+’。vert:箱体的方向,当取值为True时,绘制垂直箱体,当取值为False时,绘制水平箱体。类型为布尔值,默认值为True。可选参数。whis:箱须的位置。类型为浮点数或浮点数二元组,默认值为1.5。

可选参数。7.4

对照和比较(多变量比较)1.

切尔诺夫脸谱图(

Chernoff

Faces)根据数据,将多个变量一次性展现在人脸的各个部位上,例如耳朵、头发、眼睛、鼻子等图.

2008—2009赛季NBA前50位得分手的切尔诺夫脸谱图2.

雷达图(Radar

Chart,Spider

Chart)也称为网络图、蜘蛛图、星图、蜘蛛网图,是一种表现多维数据的图表。将多个维度的数据量映射到坐标轴上,每一个维度的数据都分别对应一个坐标轴,这些坐标轴以相同的间距沿着径向排列,并且刻度相同。网格线通常只作为辅助元素,将坐标轴上的数据点用线连接起来就形成了一个多边形。多组多维对比-多雷达链两款手机的综合表现雷达图:matplotlib

库polar(

)函数:matplotlib.pyplot.polar(theta,

r,**kwargs)theta:旋转角度r:每个标记到圆心的距离kwargs:关键字参数集合网格线设置函数:matplotlib.pyplot.thetagrids(angles=None,labels=None,fmt=None,

**kwargs)3.

热力图(Heat

Map)通过色差、亮度来展示数据的差异,直观了解点位的聚集情况,易于理解。热力图尤其关注分布。热力图可以不需要坐标轴,其背景常常是图片或地图。杭州房租热力图,用于显示杭州市房租价格分布seaborn.heatmap(data,vmin,vmax,cmap,annot,fmt,linewidths,xticklabels,yticklabels,**kwargs)根据data传入的值画出热力图,一般是二维矩阵vmin设置最小值,

vmax设置最大值cmap换用不同的颜色center设置中心值annot

是否在方格上写上对应的数字fmt写入热力图的数据类型,默认为科学计数,d表示整数,.1f表示保留一位小数linewidths

设置方格之间的间隔xticklabels,yticklabels填到横纵坐标的值。可以是bool,填或者不填。可以是int,以什么间隔填,可以是list4.

平行坐标图(Parallel)一种用来呈现多变量关系,或者高维度数据的可视化技术。纵向是属性值,横向是属性类别。为了反映变化趋势和各个变量间相互关系,往往将描述不同变量的各点连接成折线。pandas.plotting.parallel_coordinates(frame,class_column,

cols=None,ax=None,color=None,use_columns=False,xticks=None,colormap=None,axvlines=True,axvlines_kwds=None,sort_labels=False,

**kwargs)参数:frame:

DataFrameclass_column:str包含类名的列名。cols:列表,可选。

要使用的列名列表。返回:类

matplotlib.axis.Axes一、基于Pandas二、基于Pyecharts的Paralleladd_schema()用于定义平行坐标图中的坐标轴,设置坐标轴的名称、类型和标签格式等信息。dim:坐标轴的名称,字符串类型type:坐标轴的类型,可以是'value‘或'

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论