版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第7章
有关关系的可视化本章主要内容在关系中寻求什么关联性(圆点、探索更多的变量、气泡)分布(老式分布图表、有关分布的柱形、延续性的密度)对照和比较7.1
在关系中寻求什么当某个数量增加时,另一个数量是否会减少?它们之间是因果关系还是关联关系?群体彼此之间是存在交叠还是互不干涉?关联性可以帮助我们根据某一已知指标来预测另一指标。7.2
关联性——散点图(探索更多的变量)图.
散点图矩阵的基本框架7.2关联性
—
气泡图优势在于一次比较3个变量:x轴y轴气泡的面积图.
气泡图的基本框架7.3
分布直方图Hist()用一系列宽度相等、高度不等的长方形来表示数据分布matplotlib.pyplot.hist(x, bins, range, density,weights, cumulative, bottom,histtype,**kwargs)参数说明(部分):
x→作图所用的数据,一维数组,多维数组可以扁平化后再作图
bins→直方图的柱数,可选项,整数、序列或字符串型。默认10
range→指定直方图数据的上下界,默认包含绘图数据的最大值和最小值(范围)
density→布尔值,如果为"True”,将y轴转化为密度刻度,默认为None
weights→为每个数据点设置权重
cumulative→布尔值,是否需要计算累计频数或频率,默认为False
bottom→为直方图添加基准线,数组型,默认为none
histtype→直方图类型,分为bar,barstacked,step,stepfilled。默认为bar内距IQRInter-QuartileRange ,又
称
为
四分位差。盒须图(箱形图主要用于反映原始数据分布的特征,也可以进行多组数据分布特征的比较。盒须图变种可以水平或者垂直绘制盒须图变种2DBox
PlotRelplotRangefinderBox
PlotBag
Plotmatplotlib.pyplot.boxplot(x,notch,vert,patch_artist,whis,widths,
labels,**kwargs)x:输入数据。类型为数组或向量序列。必备参数。notch:控制箱体中央是否有V型凹槽。当取值为True时,箱体中央有V型凹槽,凹槽表示中位数的置信区间;取值为False时,箱体为矩形。类型为布尔值,默认值为False。可选参数。sym:离群点的默认标记符号,详解flierprops参数。类型为字符串,默认值为'None'。可选参数。取值为''隐藏离群点,取值为'None'时,取值为'b+’。vert:箱体的方向,当取值为True时,绘制垂直箱体,当取值为False时,绘制水平箱体。类型为布尔值,默认值为True。可选参数。whis:箱须的位置。类型为浮点数或浮点数二元组,默认值为1.5。
可选参数。7.4
对照和比较(多变量比较)1.
切尔诺夫脸谱图(
Chernoff
Faces)根据数据,将多个变量一次性展现在人脸的各个部位上,例如耳朵、头发、眼睛、鼻子等图.
2008—2009赛季NBA前50位得分手的切尔诺夫脸谱图2.
雷达图(Radar
Chart,Spider
Chart)也称为网络图、蜘蛛图、星图、蜘蛛网图,是一种表现多维数据的图表。将多个维度的数据量映射到坐标轴上,每一个维度的数据都分别对应一个坐标轴,这些坐标轴以相同的间距沿着径向排列,并且刻度相同。网格线通常只作为辅助元素,将坐标轴上的数据点用线连接起来就形成了一个多边形。多组多维对比-多雷达链两款手机的综合表现雷达图:matplotlib
库polar(
)函数:matplotlib.pyplot.polar(theta,
r,**kwargs)theta:旋转角度r:每个标记到圆心的距离kwargs:关键字参数集合网格线设置函数:matplotlib.pyplot.thetagrids(angles=None,labels=None,fmt=None,
**kwargs)3.
热力图(Heat
Map)通过色差、亮度来展示数据的差异,直观了解点位的聚集情况,易于理解。热力图尤其关注分布。热力图可以不需要坐标轴,其背景常常是图片或地图。杭州房租热力图,用于显示杭州市房租价格分布seaborn.heatmap(data,vmin,vmax,cmap,annot,fmt,linewidths,xticklabels,yticklabels,**kwargs)根据data传入的值画出热力图,一般是二维矩阵vmin设置最小值,
vmax设置最大值cmap换用不同的颜色center设置中心值annot
是否在方格上写上对应的数字fmt写入热力图的数据类型,默认为科学计数,d表示整数,.1f表示保留一位小数linewidths
设置方格之间的间隔xticklabels,yticklabels填到横纵坐标的值。可以是bool,填或者不填。可以是int,以什么间隔填,可以是list4.
平行坐标图(Parallel)一种用来呈现多变量关系,或者高维度数据的可视化技术。纵向是属性值,横向是属性类别。为了反映变化趋势和各个变量间相互关系,往往将描述不同变量的各点连接成折线。pandas.plotting.parallel_coordinates(frame,class_column,
cols=None,ax=None,color=None,use_columns=False,xticks=None,colormap=None,axvlines=True,axvlines_kwds=None,sort_labels=False,
**kwargs)参数:frame:
DataFrameclass_column:str包含类名的列名。cols:列表,可选。
要使用的列名列表。返回:类
matplotlib.axis.Axes一、基于Pandas二、基于Pyecharts的Paralleladd_schema()用于定义平行坐标图中的坐标轴,设置坐标轴的名称、类型和标签格式等信息。dim:坐标轴的名称,字符串类型type:坐标轴的类型,可以是'value‘或'
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2026广东广州番禺区第二人民医院高层次人才招聘6人备考题库附参考答案详解(预热题)
- 2026济南能源集团春季校园招聘11人备考题库带答案详解(黄金题型)
- 2026年4月西南医科大学附属中医医院招聘23人备考题库(四川)附参考答案详解(完整版)
- 2026广东清远私立学校2026年教师招聘37人备考题库附答案详解(完整版)
- 2026湖北武汉市第三医院眼科招聘备考题库附参考答案详解(预热题)
- 2026北京大学工学院(本科生学院)招聘1名劳动合同制人员备考题库带答案详解(达标题)
- 2026四川自贡市中医医院编外人员招聘10人备考题库及答案详解【典优】
- 2026湖北武汉市三级医院招聘14人备考题库附答案详解
- 脑性盐耗综合征(CSWS)总结2026
- 2026重庆奉节县教育事业单位招聘25人备考题库带答案详解
- 2026中国商用飞机公司招聘面试题库
- 4.1《致敬劳动者》课件 统编版道德与法治三年级下册
- 中考总复习数学100道基础题三大专题
- OpenClaw专题学习培训
- 安徽省合肥市一六八中学2026届高三3月份规范训练 语文试卷(含答案详解)
- 第一章 三角形的证明及其应用 单元测试(含答案)2025-2026学年数学北师大版八年级下册
- 2026年迎接国家义务教育质量监测工作实施细则方案及应急预案
- 危大巡视检查记录表(深基坑)
- 材料调差自动计算表EXCEL
- 第五章---挤出成型
- 加油站安全教育培训内容
评论
0/150
提交评论