Python数据可视化(微课版) 课件 第5章 Python关系数据可视化_第1页
Python数据可视化(微课版) 课件 第5章 Python关系数据可视化_第2页
Python数据可视化(微课版) 课件 第5章 Python关系数据可视化_第3页
Python数据可视化(微课版) 课件 第5章 Python关系数据可视化_第4页
Python数据可视化(微课版) 课件 第5章 Python关系数据可视化_第5页
已阅读5页,还剩14页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

主讲人:AiPPT时间:20XX.XXPOWERPOINTDESIGN202XPowerPointDesign------------------Python关系数据可视化目录CONTENTS01关系数据在大数据中的应用02数据分布性的可视化03习题04实训:Seaborn绘图与主题更改--------------PowerPointDesign关系数据在大数据中的应用01PARTPOWERPOINTDESIGN关系数据价值关系数据在大数据中用于找到变量间联系,发掘事物背后因果关系。通过探索变量相关性,进而探索隐藏的因果关系。分析数据时,可从整体观察,也可关注数据分布,如数据间是否存在重叠或毫不相干,以及各分布数据的相关关系。数据可视化后,图表所表达的意义至关重要。关系数据具有关联性和分布性。关联性指数据间相互联系和影响,如股市中不同股票之间的相关性;分布性指数据在一个或多个维度上的分布情况,如通过直方图展示单个变量的分布情况。关系数据特性大数据挖掘与变量关联散点图散点图用于展示两个变量之间的关系,通过点的分布判断相关性。一般有三种关系:正相关、负相关和不相关。正相关时,横轴数据和纵轴数据变化趋势相同;负相关时,变化趋势相反;不相关时散点排列杂乱无章。使用散点图时要注意:当要在不考虑时间的情况下比较大量数据点时,常使用散点图;即便自变量为连续性变量,仍然可以使用散点图;如果在散点图中有多个序列,考虑将每个点的标记形状更改为方形、三角形、菱形或其他形状;散点图中包含的数据越多,比较的效果就越好。散点图矩阵散点图矩阵借助两变量散点图的作图方法,是一个大的图形方阵,其每一个非主对角元素的位置上是对应行的变量与对应列的变量的散点图,而主对角元素位置上是各变量名。借助散点图矩阵可以清晰地看到所研究多个变量两两之间的相关关系。气泡图气泡图和散点图相比,多了一个维度的数据。气泡图就是将散点图中没有大小的“点“变成有大小的“圆”,圆的大小就可以用来表示多出的那一维数据的大小。气泡图让我们可以同时比较三个变量。一个具体的例子是二手车的价格由车龄和里程来决定,可以看出,两个指标越小,气泡越大,代表价格越高,反之则反。如果使用Python绘制气泡图,只需要在散点图的代码上进行一些简单的修改。数据关联性的可视化--------------PowerPointDesign数据分布性的可视化02PARTPOWERPOINTDESIGN茎叶图定义与优点茎叶图又称“枝叶图”,是由20世纪早期的英国统计学家阿瑟·鲍利(ArthurBowley)设计。茎叶图的思路是将数组中的数按位数进行比较,将数的大小基本不变或变化不大的位作为一主干(茎),将变化大的位的数作为分枝(叶),列在主干的后面。茎叶图的优点是统计图上没有原始数据信息的损失,所有数据信息都可以从茎叶图中得到。茎叶图中的数据还可以随时记录,随时添加,方便记录与表示。茎叶图缺点与绘制茎叶图的缺点是只便于表示个位之前相差不大的数据,而且茎叶图只方便记录两组的数据。茎叶图十分直观且简单,可以使用Excel方便的进行绘制。茎叶图直方图又称质量分布图,是数值数据分布的精确图形表示。直方图中的柱形高度表示的是数值频率,柱形的宽度是取值区间。水平轴和垂直轴与一般的柱形图不同,它是连续的;一般的柱形图的水平轴是分离的。我们可以使用seaborn库来进行直方图的绘制,相关代码如下。绘制得到的图表如图5-8所示。直方图定义与绘制直方图密度图可用它对分布的细节变化进行可视化处理。当直方图分段变多时,分段之间的组距就会缩短,此时依着直方图画出的折线就会逐渐变成一条光滑的曲线,这条曲线就称为总体的密度分布曲线。这条曲线可以反映数据分布的密度情况。01我们可以使用seaborn库来进行密度图的绘制,相关代码如下。绘制得到的图表如图5-10所示。02密度图定义与绘制密度图--------------PowerPointDesign习题03PARTPOWERPOINTDESIGNB.关联性大数据分析中,探索变量的哪种关系是挖掘背后可能隐藏因果关系的重要一步?D.维度关系选择题内容C.分布性A.时间序列关系在数据关联性可视化中,使用哪种图可以展示两个变量之间的关系?选择题气泡图是在散点图基础上增加了一个维度的数据表示。()散点图不能用于表示两个以上的变量之间的关系。()茎叶图在显示数据分布时,会丢失原始数据信息。()判断题内容关系数据在大数据中的应用主要不包括数据的时间序列分析。()直方图的柱形高度表示的是数值的频率。()判断题大数据的一个重要价值是可以帮助我们找到变量之间的________。散点图可以用于发现数据和________之间的关联关系。茎叶图最初是由________设计的。在使用Python绘制气泡图时,可以通过设置s参数来调整________的大小。密度图可以反映数据分布的________情况。填空题内容填空题描述数据关联性可视化的目的是什么?问答题内容散点图矩阵的基本框架是怎样的?如何使用Python绘制气泡图?直方图在数据分布性可视化中起到什么作用?密度图与直方图有什么不同,它们分别适用于什么场景?问答题请设计一个实验,使用茎叶图和直方图分别展示同一数据集,比较它们在表示数据分布特性时的优势和不足。给定一组数据,如何使用散点图判断两个变量之间是否存在相关性?应用题内容应用题--------------PowerPointDesign实训:Seaborn绘图与主题更改04PARTPOWERPOINTDESIGN01在Python环境中使用Seaborn库创建多种类型的图表,并尝试应用不同的主题和样式来改变图表的外观。目标是熟悉Seaborn的基本绘图功能和主题更改选项,从而提高数据可视化的表达力。需求说明内容需求说明(3)主题应用:探索并应用Seaborn的不同主题(如dark,whitegrid等),观察和比较这些主题对图表外观的影响。(4)样式自定义:尝试调整图表的更多样式选项,如颜色、字体大小和图表元素的布局。(1)环境准备:确保Python环境已正确安装,并通过pip安装Seaborn库。(2)基本绘图:按照Seaborn的文档,创建

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论