计算金融与 Python 实践09 数据分析 Matplotlib 类库_第1页
计算金融与 Python 实践09 数据分析 Matplotlib 类库_第2页
计算金融与 Python 实践09 数据分析 Matplotlib 类库_第3页
计算金融与 Python 实践09 数据分析 Matplotlib 类库_第4页
计算金融与 Python 实践09 数据分析 Matplotlib 类库_第5页
已阅读5页,还剩30页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

数据分析Matplotlib类库09【学习目标】

可视化概念认知需理解数据可视化的基本概念,明确其核心内涵与应用基础。

Matplotlib绘图掌握掌握matplotlib.pyplot绘图基本方法,熟练运用Matplotlib实现数据可视化。【学习目标】:图形格式组件

图形核心组件构成典型图形为第一象限内的直角坐标系,包含横轴、纵轴、标题、绘图区域、图例,各轴均有标签与刻度值、刻度标签。

中文显示设置说明当前Matplotlib版本对中文字符显示存在问题,需设置中文字体以正常显示中文标签,同时需设置以正确显示数值符号“-”。

中文标签Matplotlib默认不支持中文,图例中文易乱码,可设fontproperties参数或用代码做全局字体及负号设置。【学习目标】:图形组件

图形核心构成完整图形主要由轴组件(含轴标签、刻度、显示范围、图标题、图例等)以及图形本身构成。

组件学习安排本小节将针对图形的主要组件,介绍其具体的使用方法。【学习目标】:图形组件标题

标题函数参数解析matplotlib.pyplot.title函数含label、fontdict等参数,fontdict为控制文本外观的字典,有默认配置,loc控制标题对齐,可选左、中、右,默认居中。

标题函数基础说明明确显示图形标题的matplotlib.pyplot.title函数原型,还提及该函数的使用示例相关内容。x轴标签x轴标签用于显示x轴标题,其函数原型为matplotlib.pyplot.xlabel,参数loc控制标签对齐方式,用法同plt.title()的loc参数。y轴标签y轴标签用于显示y轴标题,其函数原型为matplotlib.pyplot.ylabel(),参数用法与pyplot.xlabel()相同。【学习目标】:图形组件【学习目标】:图形组件读取或设置x轴区间轴范围设置方法若需显示图形局部区域,可设置x轴或(和)y轴范围,调用matplotlib.pyplot.xlim函数实现。xlim函数使用示例可通过xlim()返回x轴区间,也可传入元组设置区间,还能单独设置left或right参数限定单侧范围。【学习目标】:图形组件读取或设置y轴区间

ylim函数功能ylim和xlim作用类似,仅作用轴不同,可获取或设置y轴区间,也能单独设置一端的区间数值。

绘图函数说明matplotlib.pyplot中有几十个绘图函数,本节仅对其中常用的几个进行介绍。函数核心功能matplotlib.pyplot.xticks()可读取或设置x轴刻度标签和刻度文本标签,ticks为空值时可清除x轴刻度标签。参数与使用规则ticks为刻度标签列表,labels为对应刻度位置的文本标签,仅当ticks有值时才能设置labels参数。典型应用示例包含读取刻度信息、设置刻度标签、设置刻度文本标签及旋转角度、清除刻度标签等多种使用示例。【学习目标】:图形组件x轴刻度标签【学习目标】:图形组件时间刻度标签

时间轴标签处理方法处理金融时间序列数据的坐标轴时间标签,可借助matplotlib.dates模块中DateLocator子类,通过Axis相关方法设置主、次标记的定位与格式。

日期定位器类详解包含YearLocator、MonthLocator等多类,各有对应参数设置刻度间隔、时区等,AutoDateLocator可自动选取最佳定位参数。

日期格式化类说明有DateFormatter、AutoDateFormatter、ConciseDateFormatter三类,分别通过格式化字符串、自动匹配等方式设置日期标签格式。

实操示例要点以2000-2002年日交易数据可视化为例,x轴设为日期序列,可间隔6个月标识刻度标签,结合自动定位与紧凑格式化类实现。【学习目标】:图形组件

y轴刻度标签yticks()作用于y轴,使用方法同xticks(),函数原型为matplotlib.pyplot.yticks(ticks=None,labels=None,*,minor=False,**kwargs)【学习目标】:图形组件网格线

网格线基础认知网格线是坐标轴刻度线的延伸,分主、次网格线,主疏次密,便于查看和计算数据。

网格线函数参数matplotlib.pyplot.grid函数含visible、which、axis等参数,分别控制可见性、网格类型、显示方向。【学习目标】:图形组件图例

图例添加方法可调用matplotlib.pyplot.legend(),无参数时自动检测图形成员添加图例,也能用handles、labels参数指定图形对象或标签列表。面向对象绘图示例先生成样本数据,创建画布和坐标系子图,通过Axes对象绘制不同曲线,再添加轴标签、标题及图例。组件属性设置方法可使用plt.setp()或plt.getp()单独设置或获取图形组件属性,如修改x轴刻度标签旋转角度,**xta形式是Python语法对字典解包的要求。常用图形

绘图基础说明在x轴、y轴组成的第一象限中绘制图形,可借助matplotlib.pyplot模块的画图函数绘制几十种图形。

常见图形介绍本节将介绍折线图、条形图、直方图、散点图、饼图、盒型图和堆积图这7种常见图形的绘制。折线图基础定义折线图又称曲线图,是将绘制的点用直线连接而成的统计图,x轴值有序时可观察数据变化趋势。plot()函数使用说明matplotlib.pyplot中绘制折线图用plot()函数,有特定原型与调用格式,x、y为轴坐标序列,fmt是颜色等简略符号。常用图形:折线图折线图及plot()函数说明常用图形:折线图中文与负号设置及示例

中文与负号显示设置通过配置plt.rcParams参数,设置'SimHei'字体正常显示中文标签,关闭unicode负号正常显示负号。正弦折线图绘制示例导入matplotlib、numpy和math库,生成0到2π的x值与对应正弦y值,绘制并标注、展示正弦曲线。常用图形:折线图plot()格式化及属性参数

基础格式化参数plot()的格式化参数含标记、线型和颜色,对应符号及说明如表9-3,标记有点、四边形等多种,线型含实线、虚线等,颜色有蓝、红等多类。

关键字属性参数格式化参数及其他属性可用关键字参数传入,常用属性有x/y轴数据、颜色、标记、线型、线条粗细、透明度、图例等,对应要求及默认值如表9-4。常用图形:条形图条形图基础说明

01条形图基础介绍条形图又称条状图或柱形图,以等宽条形的高度或长度表示数据,主要用于比较数据多少。

02条形图参数说明函数原型包含x轴坐标列表、高度列表,还有color、fill、label、tick_label、edgecolor、log、bottom、linewidth等常用参数。常用图形:条形图

单类别营收条形图绘制下面绘制近三年牛奶营收条形图,垂直条形图如图9-4所示,代码如下。常用图形:条形图多类别比较条形图绘制

横向位移比较条图为实现数据比较,可将一个条形图横向位移形成相邻样式,通过对应代码绘制,执行结果如图9-6所示。纵向堆叠比较条图可将多个条形图在y轴方向堆叠显示为重叠样式,附含具体实现代码,执行结果如图9-7所示。常用图形:直方图直方图基础介绍直方图本质是条形图,用于展示数据分布,需先定样本范围、划分区间,再统计各区间样本数。常用图形:直方图直方图函数原型说明

直方图函数原型函数原型为hist(x,bins=None,range=None,density=False,weights=None,cumulative=False,bottom=None,histtype='bar',align='mid',orientation='vertical',rwidth=None,log=False,color=None,label=None,stacked=False,*,data=None,**kwargs)

核心参数说明x为样本,可为数组或数组序列;bins是分割区域,支持整数、区域间隔序列或'auto';density控制是否返回概率密度,cumulative控制是否累加。常用图形:直方图

示例相关说明示例代码如下,执行结果如图9-8所示。常用图形散点图散点图可展示两变量关系,还能通过标记色/大小呈现多变量,有特定参数与绘制代码。饼图饼图用于显示系列中各项占比,介绍其函数参数x、explode、labels、colors、autopct及示例代码。常用图形:盒型图

盒型图核心作用盒型图(箱型图)核心作用:展现数据内部整体分布情况,含上下限、各分位数和异常值。

函数参数说明本函数唯一需要设置的参数是x,x是绘制的数组或向量序列数据集。

盒型图绘制原理盒型图需先找Q1、Q2、Q3三个四分位点,算IQR、内限,识别异常值后可视化。

示例与结果说明示例代码如下,执行结果如图9-11所示。常用图形:堆积图堆积图用途说明堆积图用来比较数据在不同情况下的差异。常用图形:堆积图函数原型及参数说明

堆积图函数原型stackplot(x,*args,labels=(),colors=None,baseline='zero',data=None,**kwargs)

堆积图参数说明x轴为N维一维数组,y轴可为M×N二维数组或M个1×N一维数组序列,有两种调用示例。示例代码相关说明示例代码如下,执行结果如图9-12所示。常用图形:堆积图多子图区域

多子图基础概念使用Matplotlib画图需先创建figure画布,绘图区域为axes,默认figure及axes可用于绘图,多子图即一个figure中包含多个axes。

多子图实现方式设置figure上的axes布局即多子图区域布局,主要通过pyplot.subplots()、pyplot.add_subplot()和figure.add_subplots()这3个函数实现。多子图区域:划分多子图区域

子图区域划分说明多子图区域划分:用pyplot.subplots()在figure中设网格子区域,返回该figure和所有子图axes多子图区域:划分多子图区域函数参数详细介绍

子图布局参数说明nrows、ncols用于设置axes在figure上的行列布局,创建多子图,函数返回创建的figure和axes数组。

坐标轴共享参数说明sharex和sharey可实现子图坐标轴共享,取值有none、all、row或col,none等同False,all等同True,row、col分别指同行、同列子图共享坐标。多子图区域:划分多子图区域子图布局调整方法子图坐标区域范围不理想,用plt.autoscale()自动调整;子图重叠,用plt.tight_layout()调整布局。多子图区域:增加单子图区域

subplot函数说明matplotlib.pyplot.subplot()可在当前figure中添加单个子图,有4种调用形式,返回axe对象。常规参数设定参数args可设为3个整数(nrows,ncols,index),index起始为1,从左上角向右顺序增加,对应网格中序号区域。参数灵活设置index也可是二值元组(fir

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论