版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
数据可视化8DataVisualization内容概述本章学习目标财务数据分析财务数据分析(1)理解数据分析中不同类型数据的含义和统计学意义(5)能够利用Matplotlib、Seaborn进行Python财务数据分析。(4)掌握Matplotlib、Seaborn中基本图形的绘制方法;(2)熟练掌握Matplotlib绘图的基本过程;(3)熟悉Matplotlib对象的属性和方法;
目录CONTENTS财务数据分析财务数据分析第8章数据可视化6.1Matplotlib入门
6.2定量和定性数据
【Python财务数据分析】——财务数据的可视化基础图形Matplotlib入门PartOne01财务数据分析财务数据分析财务数据分析财务数据分析数据可视化数据的图形呈现是探索、分析数据的常用方法。相对于文字表述,图形更加直观且形象化,更适合人类的思维模式理解。使用图形来表示数据的方法称为数据可视化。数据以图形图像形式表示,可以揭示隐藏的数据特征,直观传达关揵信息;辅助建立数据分析模型,展示分析结果。Matplotlib和Seaborn是Python绘图第三方库,同时Pandas集成了Matplotlib中的常用可视化图形接口,可通过Series和DataFrame两种数据结构面向对象的接口方式简单调用。Pandas绘图中仅集成了常用的图表接口,更多复杂的绘图需求往往还需依赖Matplotlib或者其他可视化库。财务数据分析财务数据分析Matplotlib绘图过程1)导入模块importmatplotlib.pyplotasplt2)获取绘图数据3)绘图4)装饰图形5)保存与显示图形绘图过程,虽然简单,但是从面向对象的视角看反而不好理解。原因是,在绘图的过程隐式地创建画布(figure)和绘图区域(axes)。因此我们不推荐。使用plt的属性和方法赋予画布和绘图区域,完成绘图的过程更清晰,而且可以绘制更复杂的图形。财务数据分析财务数据分析Matplotlib绘图对象和类画布Figure、子图Axes和数轴Axis关系示意图Figure是容纳多个Axes的画板或画布,而Axes则是所有图标数据、图例配置等绘图形元素的容器,称为一个绘图区域。面向对象的绘图,就是将plt中的图形赋值给一个Figure或Axes实例,通过调用Figure或Axes两类实例的方法完成绘图。财务数据分析财务数据分析Matplotlib绘图对象和类1)创建画布创建画布,包括创建figure和axes对象,常用方法:(1)plt.figure(),接收一个元组作为figsize参数设置图形大小,返回一个figure对象;(2)plt.axes(),接收一个figure或在当前画布上添加一个子图,返回该axes对象,并将其设置为“当前”子图,缺省时会在绘图前自动添加;(3)plt.subplot(),接收3个数字或1个3位数作为子图的行数、列数和当前子图索引。索引从1开始,返回一个axes对象用于绘图操作。可以理解成是先隐式执行了plt.figure,然后在创建的figure对象上添加子图,并返回当前子图实例;(4)plt.subplots(),接收一个行数nrows和列数ncols作为参数,创建一个figure对象和相应数量的axes对象,同时返回该figure对象和axes对象嵌套列表,并默认选择最后一个子图作为“当前”图。财务数据分析财务数据分析Matplotlib绘图对象和类2)子图——axes对象(1)创建axes对象Matplotlib定义了一个Axes(轴域)类,创建的对象被称为axes对象(即轴域对象,或称为子图)。axes对象可以理解为有轴(axis)的集合,一般包含基本的2个axis,用来确定一个区域。一个画布设置若干绘图区域,从而实现对画布的布局。默认情况下,函数创建一个标准的axes对象填满整个图表区域。当只有画布上只有一张子图时,可以用plt代替ax。财务数据分析财务数据分析Matplotlib绘图对象和类(2)axes对象的属性和方法axes的属性和方法,本质上是由plt赋予的。因此axes的成员和plt类似,但是也要注意个别方法有细微差异。2)子图——axes对象①plot()绘图②grid()网格格式设置③xscale()或yscale(),spines()坐标轴④xlim()和ylim()坐标轴范围⑤xticks()和yticks()刻度和刻度标签⑥legend()绘制图例财务数据分析财务数据分析Matplotlib绘图对象和类plt.subplot()函数可以均等地划分画布,语法格式:3)subplot()函数和add_subplot()函数财务数据分析财务数据分析Matplotlib绘图对象和类3)subplot()函数和add_subplot()函数nrows×nclos表示子图数量,subplot(233)表示在当前画布的右上角创建一个2行3列的绘图区域,同时选择在第3个位置绘制子图。财务数据分析财务数据分析Matplotlib绘图对象和类4)subplots()函数subplots()函数与subplot()函数类似。其不同之处在于subplots()既创建了一个包含子图区域的画布,又创建了子图对象,而subplot()只是创建一个在当前画布下的子图对象。subplots的函数语法格式:fig,ax=plt.subplots(nrows,ncols)nrows与ncols表示两个整数参数,其他指定子图所占的行数、列数。函数的返回值是一个元组,包括一个画布对象和所有的子图对象。其中子图对象的数量等于nrows×ncols,且每个axes对象均可通过索引值访问。财务数据分析财务数据分析Matplotlib绘图对象和类5)subplot2grid()函数plt.subplot2grid()函数能够在画布的特定位置创建axes对象。还可以使用不同数量的行、列来创建跨度不同的绘图区域。即subplot2gird()函数可以以非等分的形式对画布进行切分,并按照绘图区域的大小来展示最终绘图结果。plt.subplot2grid()函数语法格式:plt.subplot2grid(shape,#规定的网格区域作为画布划分location,#子图绘制位置,初始位置(0,0)第1行第1列rowspan,#子图跨越网格区域行数colspan)#图跨越网格区域列数定量和定性数据PartTwo02财务数据分析财务数据分析财务数据分析财务数据分析定性与定量数据是指对客观事件进行记录并可以鉴别的符号,也就是对事物的性质、状态以及相互关系等进行记载的物理符号或这些物理符号的组合。数据按性质可分为:(1)定性数据(qualitativedata)在统计学上的包括分类数据和顺序数据,是一组表示事物性质、规定事物类别的文字表述型数据。见表示事物属性的数据(注册地、上市公司板块、公司行业、债券评级等)。(2)定量数据(Quantitativedata)的,反映事物数量特征的数据,如金额、价格、重量、速度等物理量。财务数据分析财务数据分析数据分类4种测定尺度的意义与特征:分类(nominal)尺度:无序类别数据。分类尺度将数字作为事物总体中不同类别/组别的代码,是最低层次的尺度。顺序(ordinal)尺度:顺序数据。顺序尺度不但可以用数表示量的不同类别,而且也反映量的大小顺序关系,从而可以列出各类的次序。定距(interval)尺度:间隔数据。定距尺度是对事物类别或次序之间间距的计量,它通常使用度量衡单位作为计量尺度。定距尺度是比顺序尺度高一层次的计量尺度。比例(ratio)尺度:连续数据。比例尺度是在定距尺度的基础上,确定可以作为比较的基数,将两种相关的数加以对比,而形成新的相对数。【财务应用与实践】
财经数据的可视化基础图形PartPractice05财务数据分析财务数据分析财务数据分析财务数据分析类别数据可视化——柱状图柱状图是一种用矩形柱来表示数据分类的图表,柱状图可以垂直绘制,也可以水平绘制,它的高度与其所表示的数值成正比关系。柱状图显示了不同类别之间的比较关系,图表的一个轴指定被比较的类别,另一个轴则表示具体的类别值。Matplotlib提供了bar()和barh()函数来绘制柱状图。财务数据分析财务数据分析类别数据可视化——饼图饼图只适用排列在数据帧的一列或一行中的数据。饼图显示一个数据系列中各项的大小与各项总和的比例。即显示为数据占整个饼图的百分比。Matplotlib提供了pie()函数来绘制饼图。财务数据分析财务数据分析顺序数据可视化——箱线图四分位数是把所有数值由小到大排列并分成四等份,处于三个分割点位置的数值分别是:第一四分位数(Q1),等于该样本中所有数值由小到大排列后第25%的数字第二四分位数(Q2),又称“中位数”,等于该样本中所有数值由小到大排列后第50%的数字第三四分位数(Q3),等于该样本中所有数值由小到大排列后第75%的数字第三、四分位数与第一四分位数的差距又称四分位距(IQR)。计算公式:IQR
=
Q3
−
Q1财务数据分析财务数据分析顺序数据可视化——箱线图箱线图作为描述统计的工具之一,其可以直观明了地识别数据中的异常值,非对称分布数据的特征,也可以用来对若干批次数据比较分析。财务数据分析财务数据分析间隔数据可视化——直方图直方图是一种统计图表,用于展示数据的分布情况。它的主要特点包括:直观展示数据的频率分布。通过矩形的高度来表示数据落在各个区间的数量或频率。财务数据分析财务数据分析比例数据可视化——散点图散点图来表述两个连续变量X和Y之间的关系,图中的每个点表示目标数据集中的每个样本,在直角坐标系平面上数据点的分布和因变量随自变量而变化的大致趋势。由此趋势可以选择合适的函数进行拟合,以用来表示某些模型,进而找到变量之间的函数关系。财务数据分析财务数据分析比例数据可视化——蜂巢图当有成千上万的数据样本点时,散点图会变得过于密集而无法解释。当数据量大我们采用蜂巢图(Hexbin)。其将图表划分为了一个六边形区域,基于聚合方法(例如点的数量),为区域的不同部分添加不同深度的颜色。hexbin()函数用于制作点x,y的2D六角形装箱图,颜色深度表示样本点数量财务数据分析财务数据
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 化工催化技术课件
- 化工仿真培训实操课件
- 飞秒技术科普
- 2026年人力资源管理师绩效考核体系设计知识练习(含答案解析)
- 2026云南保山市腾冲市边防办招聘边境专职联防员备考考试题库及答案解析
- 2026年青岛市即墨区部分事业单位公开招聘工作人员(53人)笔试备考试题及答案解析
- 2026云南嘉华食品有限公司招聘备考考试题库及答案解析
- 别墅搭架施工方案(3篇)
- 标识制作施工方案(3篇)
- 电力配电施工方案(3篇)
- 柴油维修技术培训课件
- 安全附件管理制度规范
- 2026院感知识考试题及答案
- 《红楼梦》导读 (教学课件) -高中语文人教统编版必修下册
- 室外供热管道安装监理实施细则
- 腰背部推拿课件
- 翰威特:2010年翰威特员工敬业度调研简介
- DL∕T 5210.6-2019 电力建设施工质量验收规程 第6部分:调整试验
- 新生儿机械通气指南
- 2023年PCB工程师年度总结及来年计划
- 绩效考核和薪酬方案通用模板
评论
0/150
提交评论