数据可视化 课件 第2章 Matplotlib 的基本使用_第1页
数据可视化 课件 第2章 Matplotlib 的基本使用_第2页
数据可视化 课件 第2章 Matplotlib 的基本使用_第3页
数据可视化 课件 第2章 Matplotlib 的基本使用_第4页
数据可视化 课件 第2章 Matplotlib 的基本使用_第5页
已阅读5页,还剩76页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1数据可视化第一章Matplotlib的基本使用第二章Matplotlib的进阶使用第三章…第四章目录Contents…第五章绪论2第二章Matplotlib的基本使用12345引言安装方法图形组成元素基本设置基本图形3引言1.41引言Matplotlib是Python最著名的绘图库之一,它的pyplot子库提供了一整套和MATLAB相似的绘图API,方便用户快速绘制2D图表,包括直方图、饼图、散点图等。/51引言直方图61引言饼图71引言散点图81引言同时,Matplotlib为利用通用的图形用户界面工具包,如Tkinter,wxPython,Qt或GTK+向应用程序嵌入式绘图提供了各种API。此外,很多其他的优秀的可视化库,如后续我们会学到的seaborn,以及ggplot和plotnine都是以Matplotlib为底层实现的。9安装方法2.102安装方法

Linux打开Terminal窗口,输入以下内容:$sudoapt-getinstallpython3-matplotlib

MacOS打开Terminal窗口,输入以下内容:$pip3installmatplotlib

Windows打开AnacondaPromt窗口,输入以下内容:pipinstallmatplotlib112安装方法12图形组成元素3.133图形组成元素143图形组成元素在认识了这些组成元素后,我们就可以用matplotlib简单的绘制一个图形了。153图形组成元素163图形组成元素17基本设置4.184基本设置194基本设置——标题的设置在matplotlib中通过title()添加标题。可以通过help(plt.title)查看plt.title()的参数设置204基本设置——标题的设置▷label:标题的名称▷fontdict:包含一系列对标题字体的设置。具体如下:•

fontsize:设置字体大小,可选参数['xx-small','x-small','small’, 'medium','large','x-large','xx-large'];•

fontweight:设置字体粗细,可选参数['light','normal','medium’, 'semibold','bold','heavy','black’];•verticalalinement:设置水平对齐方式,可选参数:

['center'

,

'top'

,

'bottom'

,'baseline'];

horizontalalignment:设置垂直对齐方式,可选参数:['left','right’,

'center’]。▷loc:标题水平样式,可选参数:['center','left','right'],默认为居中。▷pad:

标题离图表顶部的距离,默认为None。▷kwargs:

可以设置一些其他的文本属性。214基本设置——标题的设置添加标题224基本设置——标题的设置修改标题字体234基本设置——标题的设置修改标题位置244基本设置——标记点的设置当点的个数比较少的时候,曲线实际上没有平滑的很好,这时就可以看到图形中的拐点。可以通过pyplot.plot中的marker参数自定义设置标记点的样式。254基本设置——标记点的设置Marker常用参数及含义264基本设置——标记点的设置274基本设置——网格线的设置在matplotlib中通过grid()添加网格线。可以通过help(plt.grid)查看plt.grid()的参数设置284基本设置——网格线的设置▷b:布尔值,用来控制是否显示网格。如果在grid()中设置为False,但又设置了其他参数,如颜色和宽度,则False失效。▷which:可选参数:['major','minor','both']。当输入为'minor'时网格为白色。▷axis:可选参数:['x','y','both']。若输入的是'x',则会隐藏平行x轴的网格线。▷kwargs:

可以设置一些其他的属性。如线的样式、颜色、宽度等。具体参数会在后续提到294基本设置——网格线的设置304基本设置——网格线的设置31基本图形5.325基本图形市场开拓目标单击此处可编辑内容,根据您的需要自由拉伸文本框大小335基本图形——折线图市场开拓目标单击此处可编辑内容,根据您的需要自由拉伸文本框大小折现图的实现其实就是通过pyplot.plot()实现的。plot()函数的本质就是根据点连接线。根据x(数组或者列表)和y(数组或者列表)组成点,然后连接成线,也就是折现图了。345基本图形——折线图市场开拓目标单击此处可编辑内容,根据您的需要自由拉伸文本框大小plot()语法如下355基本图形——折线图市场开拓目标单击此处可编辑内容,根据您的需要自由拉伸文本框大小实际使用过程中用到的参数其实并不是通过help(pyplot.plot)列举出来的这几个。具体常用参数有:▷x,y:输入的x和y的值,需要以列表形式输入。其中x是可选参数,若没有,将默认为[0,n-1],也就是y的索引值。▷fmt:定义线条颜色、标记点和线条样式的参数。这是一个快速设置的方式,如’ro:’意思是线条颜色为红色(r为red的缩写),标记点样式是实心圆(也就是o),线条的样式是虚线。▷kwargs:其他的属性。包括但不仅包括alpha(透明度)、drawstyle(点连接方式)、linestyle(线条样式)、linewidth(线条宽度)、color(线条颜色)。其中alpha的取值范围为[0,1];drawstyle可选参数有['steps','steps-pre','steps-mid','steps-post']。365基本图形——折线图市场开拓目标单击此处可编辑内容,根据您的需要自由拉伸文本框大小其中线条样式有:375基本图形——折线图市场开拓目标单击此处可编辑内容,根据您的需要自由拉伸文本框大小385基本图形——折线图市场开拓目标单击此处可编辑内容,根据您的需要自由拉伸文本框大小395基本图形——柱形图市场开拓目标单击此处可编辑内容,根据您的需要自由拉伸文本框大小柱形图是在对数据可视化过程中非常常见的一个图表。主要应用于定性数据的可视化场景中,或用于展示离散数据的分布情况,如:不同城市同一职位人数分布、出国旅游人士的职业分布等。在matplotlib中通过pyplot.bar()创建。405基本图形——柱形图市场开拓目标单击此处可编辑内容,根据您的需要自由拉伸文本框大小bar()语法如下:415基本图形——柱形图市场开拓目标单击此处可编辑内容,根据您的需要自由拉伸文本框大小常用参数有:▷x:x轴的位置序列,一般采用arange函数产生一个序列。▷height:y轴的数值序列,也就是柱形图的高度,一般就是我们需要展示的数据。▷width:柱形图的宽度。▷bottom:y轴的起始位置。▷hatch:填充柱形的样式。可选参数有['|','/','-','\','*'],同一符号出现的次数越多,形成的线条越密集。▷align:条形的中心位置。可选参数有['center','edge‘]。▷tick_label:下标的标签。▷log:y轴是否用科学计算法表示。▷facecolor:柱形的颜色。▷edgecolor:柱形外边框颜色。425基本图形——柱形图市场开拓目标单击此处可编辑内容,根据您的需要自由拉伸文本框大小435基本图形——柱形图市场开拓目标单击此处可编辑内容,根据您的需要自由拉伸文本框大小445基本图形——柱形图市场开拓目标单击此处可编辑内容,根据您的需要自由拉伸文本框大小455基本图形——条形图市场开拓目标单击此处可编辑内容,根据您的需要自由拉伸文本框大小柱形图中的柱体变成水平方向,柱形图就成了条形图在matplotlib中通过pyplot.barh()绘制条形图。465基本图形——条形图市场开拓目标单击此处可编辑内容,根据您的需要自由拉伸文本框大小barh语法如下:475基本图形——条形图市场开拓目标单击此处可编辑内容,根据您的需要自由拉伸文本框大小barh()和bar()参数基本一致。唯一的区别在于:在bar()函数中,width这一参数代表的是柱子的宽度(胖瘦),而在barh()函数中width这一参数代表的是横向柱子的长度(长短)485基本图形——条形图市场开拓目标单击此处可编辑内容,根据您的需要自由拉伸文本框大小495基本图形——条形图市场开拓目标单击此处可编辑内容,根据您的需要自由拉伸文本框大小还可以通过调整bar()中的参数绘制出条形图需要把:orientation="horizontal",然后x,与y的数据交换,再添加bottom=x,即可。505基本图形——条形图市场开拓目标单击此处可编辑内容,根据您的需要自由拉伸文本框大小515基本图形——直方图直方图是用来展示连续性数据分布特征的图形。主要应用于定量数据的可视化场景中,如:居民可支配收入、考试成绩区间分布等。在matplotlib中,通过pyplot.hist()绘制直方图。525基本图形——直方图hist()语法如下:535基本图形——直方图市场开拓目标常用参数有:▷x:数据集,最终的直方图将对数据集进行统计。▷bins:统计的区间分布。▷range:tuple,显示的区间。▷density:bool,默认为false,显示的是频数统计结果,为True则显示频率统计结果,这里需要注意,频率统计结果=区间数目/(总数*区间宽度),和normed效果一致,官方推荐使用density。▷histtype:可选参数为['bar','barstacked','step','stepfilled'],默认为bar,推荐使用默认配置,step使用的是梯状,stepfilled则会对梯状内部进行填充,效果与bar类似。▷stacked:bool,默认为False,是否为堆积状图。545基本图形——直方图市场开拓目标555基本图形——直方图565基本图形——饼图饼图主要应用在定性数据的可视化场景中,或是用来进行离散型数据的比例展示。通过绘制饼图,可以十分直观的反映所研究对象的比例分布情况。在matplotlib中,通过pyplot.pie()绘制饼图。575基本图形——饼图pie()语法如下:585基本图形——饼图▷x:数据集,数据类型为列表。▷explode:突出的部分,数据类型为列表。▷labels:标签,数据类型为列表。▷colors:每个区域的颜色,数据类型为列表。▷autopct:每个区域的百分比标签展示,如“%0.1f%%”为保留一位小数。▷pctdistance:百分比标签到圆心的距离,取值范围为[0,1],默认为0.6。▷labeldistance:标签到圆心的距离,默认为1.1。▷startangle:开始绘图的角度。以正右方为0°,startangle为正则逆时针旋转,为负则顺时针旋转。▷shadow:是否显示阴影。▷radius:圆的半径,默认为1。▷counterclock:布尔值,可选参数,默认为None。指定指针方向,若为

False,则顺时针绘制常用参数有:595基本图形——饼图605基本图形——饼图还可以修改起始角度615基本图形——散点图散点图也是非常常见的一种图标类型。绘制出离散点的分布,当离散点数量十分多的时候,甚至可以看出离散点分布的趋势。在matplotlib中通过pyplot.scatter()绘制散点图。625基本图形——散点图市场开拓目标scatter()语法如下:635基本图形——散点图▷x,y:表示的是shape大小为(n,)的数组,也就是我们即将绘制散点图的数据点。▷s:表示的是大小,是一个标量或者是一个shape大小为(n,)的数组,可选,默认20。▷c:表示的是色彩或颜色序列,可选,默认蓝色‘b’。但是c不应该是一个单一的RGB数字,也不应该是一个RGBA的序列,因为不便区分。c可以是一个RGB或RGBA二维行数组。▷cmap:Colormap,标量或者是一个colormap的名字,cmap仅仅当c是一个浮点数数组的时候才使用。如果没有申明就是image.cmap,可选,默认None。▷norm:Normalize,数据亮度在0-1之间,也是只有c是一个浮点数的数组的时候才使用。如果没有申明,就是默认None。▷vmin,vmax:标量,当norm存在的时候忽略。用来进行亮度数据的归一化,可选,默认None常用参数有:645基本图形——散点图655基本图形——散点图若想比较三维数据,可以通过调整散点大小来实现该目的665基本图形——箱型图箱型图常用于反映一组数据的分布特征,如:分布是否对称,是否存在离群点等。主要应用于一系列测量或观测数据的比较场景中,如:班级测试成绩的比较、产品优化前后测试数据比较等。在matplotlib中通过pyplot.boxplot()绘制675基本图形——箱型图boxplot()语法如下:685基本图形——箱型图常用参数有:▷x:指定要绘制箱线图的数据。▷notch:是否是凹口的形式展现箱线图,默认非凹口。▷sym:指定异常点的形状,默认为+号显示。▷vert:是否需要将箱线图垂直摆放,默认垂直摆放。▷whis:指定上下须与上下四分位的距离,默认为1.5倍的四分位差。▷positions:指定箱线图的位置,默认为[0,1,2…]。▷widths:指定箱线图的宽度,默认为0.5。▷patch_artist:是否填充箱体的颜色。▷meanline:是否用线的形式表示均值,默认用点来表示。▷showmeans:是否显示均值,默认不显示。▷showcaps:是否显示箱线图顶端和末端的两条线,默认显示。▷showbox:是否显示箱线图的箱体,默认显示。▷showfliers:是否显示异常值,默认显示。▷boxprops:设置箱体的属性,如边框色,填充色等。▷labels:为箱线图添加标签,类似于图例的作用。▷filerprops:设置异常值的属性,如异常点的形状、大小、填充色等。▷medianprops:设置中位数的属性,如线的类型、粗细等。▷meanprops:设置均值的属性,如点的大小、颜色等。▷capprops:设置箱线图顶端和末端线条的属性,如颜色、粗细等。▷whiskerprops:设置须的属性,如颜色、粗细、线的类型等。695基本图形——箱型图705基本图形——棉棒图棉棒图主要用来显示一个包含正负的数据集,如在地震勘探中表示地层间反射系数等。在matplotlib中通过pyplot.stem()绘制。715基本图形——棉棒图st

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论