版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
项目一
Python
数据分析基础任务一
认识Python数据分析工具任务二PyCharm集成开发环境任务三Python数据类型任务四Python流程控制任务一
认识Python数据分析工具一、Python简介二、下载和安装Python三、Python内置函数四、安装Python库任务一
认识Python数据分析工具任务引入小白是一名数据分析师,可以使用不同的软件进行数据分析。公司新接了一个
项目,统一要求使用Python,让小白带领全组完成,在使用Python之前,首先得
对Python有所了解。那么,Python有哪些内置函数呢?
知识准备Python是一门简单易学且功能强大的编程语言。它拥有高效的高级数据结构,
并且能够用简单又高效的方式进行面向对象编程。一、Python简介Python的诞生背景20世纪90年代初,荷兰数学和计算机科学研究学会的GuidovanRossum为替代ABC语言,受Modula-3语言影响,结合UNIXShell和C语言习惯开发了Python。Python的发展历程1989年Python诞生,1995年Guido在CNRI继续开发,2000年转到BeO等。2000年发布Python2,2008年发布Python3,2024年发布Python3.13.0。Python的应用领域Python从最初用于系统管理任务处理,逐渐广泛应用于Web编程、数据分析、人工智能等领域,成为最受欢迎的编程语言之一。一、Python简介1.逻辑判断类逻辑判断类Python内置函数如表所示。2.反射类反射类Python内置函数如表所示。一、Python简介一、Python简介3.I/O操作类I/O操作类Python内置函数如表所示。一、Python简介Python是一门解释性脚本语言,因此,要想让编写的代码得以运行,需要先安装Python解释器。1.Python下载打开Python官网下载界面,如图所示。向下滑动页面,如图所示,在“Pythonreleasesbyversionnumber.”列表框中显示不同版本的Python(Python3.8~Python3.14)。二、下载和安装Python2.软件安装(1)双击安装文件python-3.13.0-amd64.exe,弹出安装界面“InstallPython3.13.0(64-bit)”(2)单击“Customizeinstallation”(自定义安装)按钮,弹出选项设置界面“OptionalFeatures”,保持默认参数设置二、下载和安装Python
Python官网下载界面选择不同的Python版本安装界面
选项设置界面选择不同的Python版本(3)单击“Next”(下一步)按钮,进入下一个高级设置界面“AdvancedOptions”,在“Customizeinstalllocation”文本框中更改安装地址(不建议安装在C盘),其余保持默认设
置,设置完毕后如图所示。(4)确定好安装路径后,单击“Install”(安装)按钮,此时会显示安装进度,如图所示。(5)安装结束后,会出现“Setupwassuccessful”(安装成功)界面,如图所示。二、下载和安装Python高级设置界面安装进度“Setupwas
successful
”(安装成功)界面3.安装检查Python安装结束后,需要检查安装是否成功。二、下载和安装Python安装检查1.数学运算类数学运算类Python内置函数如表所示。2.集合类操作集合类操作Python内置函数如表所示。三、Python内置函数Python模块库丰富,含数据分析模块如NumPy、Pandas等。安装方法:1.pip工具安装:pip是Python包管理工具,可查找、下载、安装、卸载包。安装Python时已含pip。(1)安装NumPy。(2)安装数据分析库Pandas。四、安装Python库安装Pandas提示:(1
)fromnumpyimport
*表示导入NumPy
库。(2)eye(4)用于生成对角矩阵。任务二PyCharm集成开发环境一、下载和安装PyCharm二、新建PyCharm项目文件三、新建PyCharm文件四、PyCharm的编辑环境五、PyCharm加载和导入模块任务引入小白经过调查发现,虽然Python集成开发环境有很多,但是常用的也就几种。经
过综合考虑,小白决定下载PyCharm编辑器。PyCharm作为一款针对初学者使用的Python编辑器,配置简单、功能强大、使用起来省时省心。那么,什么是IDLE?如何
安装PyCharm编辑器?PyCharm编辑器怎么进行Python编程?
知识准备PyCharm是由JetBrains打造的一款PythonIDLE。PyCharm具备一般PythonIDLE的
功能,如调试、语法高亮、项目管理、代码跳转、智能提示、自动完成、单元测试、
版本控制等。另外,PyCharm还提供了一些很好的功能用于Django的开发,同时支持GoogleAppEngine和IronPython。任务二PyCharm集成开发环境1.下载软件登录PyCharm的官网,下载时有以下两个版本可以选择。.Professional(专业版,收费)。.Community(社区版,
免费)。2.安装PyCharm的具体过程双击pycharm-community-2021.3.exe文件,弹出安装界面,如图所示。一、下载和安装PyCharm
PyCharm
官网
安装界面一、下载和安装PyCharm
选择安装路径安装选项设置界面
选择安装菜单文件安装进度安装结束后一、下载和安装PyCharm3.PyCharm的配置双击桌面上的“PyCharm”图标,激活PyCharm启动界面。PyCharm激活之后会自动跳
转到编辑界面,如图所示。该界面包括“Projects”(项目)、“Customize”(自定义)、“Plugins”(插件)、“LearnPyCharm”(学习文档)4个选项卡。编辑界面“Customize(自定义)”选项卡中文版用户界面二、新建PyCharm项目文件在“项目”选项卡中,单击“新建项目”按钮,在弹出的“新建项目”对话框中,选择“纯Python”选项卡,设置项目路径,并将项目名称文件夹命名为DA_project,如图所示。(1)创建Git仓库:(2)创建欢迎脚本:(3)解释器类型:1)项目venv:2)基础conda:3)自定义环境:“新建项目”对话框PyCharm编辑器界面三、新建PyCharm文件1.通过菜单命令创建在PyCharm中创建新文件,最简便的方法是在“文件”→“新建”子菜单选适当文件类型。选择菜单栏“文件”→“新建”命令,打开子菜单;再选“Python文件”命令,弹出“新建Python文件”对话框,其包含Python文件、Python单元测试文件、Python存根3种类型。选“Python文件”选项,输入文件名称Pythonfile01,按Enter键,进入新建的Pythonfile01.py编辑界面
。2.利用右键快捷命令在项目文件上单击鼠标右键,选择“新建”→“Python文件”命令。新建文件类型
“新建Python文件”对话框四、PyCharm的编辑环境PyCharm的编辑环境如图所示,其工作界面由标题栏、菜单栏、工具栏、命令行窗口、Project(项目)面板、Run(程序运行结果)面板、状态栏组成。Python的程序运行包含以下3种方式。在命令行窗口中,在需要运行的代码上单击鼠标右键,选择“运行”命令。
单击菜单栏下方工具栏中的“运行”按钮
。
快捷键Ctrl+Shift+F10。案例——程序运行演示打开PyCharm,在Pythonfile01.py的命令行窗口中输入下面的程序:按下快捷键Ctrl+Shift+F10,Run面板中显示程序运行结果,如图所示。单击左上角
按钮,打开菜单栏。选择菜单栏中的“工具”→“Python或调试控制台”命令,在PyCharm中打开“Python控制台”窗口,在“运行”面板中显示命令行提示符“>>>”,如图所示。五、PyCharm加载和导入模块在Python数据分析中,NumPy、SciPy、Pandas和Matplotlib是不可或缺的模块库。通常,
可以使用pip3工具下载并安装这些模块。安装完成后,就可以在PythonShell(IDLE)中直接
使用这些模块提供的,用于处理数组、矩阵等的强大功能。1.加载模块选择PyCharm进行数据分析,pip3安装可能不足。需在PyCharm项目中配置。打开“设置”,选择“项目:DA_Project”→“Python解释器”,单击“安装”,搜索并安装“numpy”。“可用软件包”对话框
1五、PyCharm加载和导入模块“可用软件包”对话框2“可用软件包”对话框3“可用软件包”对话框4“可用软件包”对话框5五、PyCharm加载和导入模块2.模块导入Python模块分为标准库(内置模块)、第三方模块(通过pip3等安装)和应用程序自定义模块三种类型。(1)Python导入模块一般使用import,具体方式如下:(2)from…import。从一个模块中用import*导入所有模块,通常会导致可读性很差,使用该语句只导入module1模块中的部分变量,其调用格式如下:数据分析方法含列表法和作图法。作图法直观表达物理量间关系,便于求实验结果,可图形化复杂函数。下文用列表法和作图法分析可视化销售数据。【解】在PyCharm命令行窗口中输入以下程序:案例——绘制三角函数图形运行结果如下:缺失值数量:运行结果如图所示。案例——绘制三角函数图形任务三Python数据类型一、数据类型二、输入/输出函数三、数据迭代输出四、数据类型的转换五、函数定义任务引入在熟悉了Python开发环境(如PyCharm)之后,小李和团队成员需要进一步掌握Python处理数据的核心技能。为了能够有效地读取、操作和分析电商数据(如用户订
单、商品信息等),他们需要深入了解Python的数据类型、数据的输入输出方式、如
何遍历数据集(迭代)
,以及如何在不同数据类型之间进行转换。这些基础知识是构
建任何数据分析流程的基石。知识准备数据类型一般指数据元。数据元也称为数据元素,是用一组属性描述其定义、
标识、表示和允许值的数据单元,在特定的语义环境中被认为是不可再分的最小数
据单元。任务三Python数据类型一、数据类型按照数据的结构进行分类,Python中的数据主要包括Number(数值)、String(字符串)、list(列表)、range(区间)、tuple(元组)、set(集合)、dictionary(字典)。1.数值Python支持
以下4种不同的数值类型。.int:有符号整型。.float:浮点型。.complex:复数。.bool:布尔型,
表示真值和假值2.字符串字符主要由26个英文字母及空格等一些特殊符号组成,根据储存格式的不同,分为字
符常量与字符串常量。其中,所有的空格和制表符都照原样保留。(1)字符常量是用一对单引号引起来的单个字符,如'a'。(2)字符串常量是用一对双引号引起来的零个或多个字符序列,如'Whoareyou'。(3)字符串常量是用一对三引号引起来的零个或多个字符序列,如'''what'syourname?'''。3.列表Python列表是任意对象的有序集合,通常在中括号[]里创建,元素之间用逗号隔开。这
里的任意对象既可以是列表嵌套列表,又可以是字符串。一、数据类型案例——列表的创建与删除4.区间range(区间)类似于一个整数列表,是一个可迭代对象(类型是对象),也是一种数据结构。Python的自动补全功能一、数据类型5.元组元组(tuple)与列表类似,不同之处在于元组的元素不能修改。元组变量通过小括号创建,元素之间用逗号隔开。6.集合集合是一个无序不重复元素的序列,可以使用大括号{}或set函数创建。7.字典字典是一种可变容器模型,且可存储任意类型对象,通常由“{}”创建。字典(dictionary)是除列表以外,Python之中最灵活的内置数据结构类型。{}定义空字典。字典是一个无序的键(key)值(value)对的集合二、输入/输出函数在Python中的输入输出可以通过内置的input()和print()函数来完成。1.input函数。input函数用来提示用户从键盘输入数据、字符串或表达式,并接收输入值,其调用格
式如下:2.print函数。print函数用于打印输出,其调用格式如下:Python的格式化符号二、输入/输出函数案例——输出不同格式的变量【解】在PyCharm命令行窗口中输入以下程序:运行结果如下:在使用Python语言编制程序时,掌握常用的操作命令或技巧可以起到事半功倍的效果。在使用Python语言编制程序时,常用的操作命令如表所示。二、输入/输出函数在Python语言中,还包括一些标点符号,被赋予了特殊的意义,下面介绍常用的几种键盘按键与符号,如表所示。二、输入/输出函数1.运算符Python提供了丰富的运算符,能满足用户的各种应用要求。这些运算符包括算术运算
符、比较(关系)运算符、逻辑运算符、位运算符、成员运算符和身份运算符。
下面简要
介绍各种运算符的功能。Python语言的算术运算符如表所示。2.基本数学函数在Python中,数学运算常用的函数基本都在math和cmath模块中,math模块提供了许多
针对浮点数的数学运算函数,cmath模块包含了一些用于复数运算的函数。Python常用的三
角函数及角度转换函数如表所示。三、数据迭代输出迭代是Python最强大的功能之一,是访问集合元素的一种方式。从集合的第一个元素
开始访问,直到所有的元素被访问完。数据迭代函数及其调用格式如表所示。案例——输出区间元素【解】PyCharm程序如下:运行结果如下:四、数据类型的转换对于数据类型的转换,
只需将数据类型作为函数名即可。表中的几个内置的函数
可以执行数据类型之间的转换。四、数据类型的转换案例——控制数字显示格式【解】Python程序如下:
案例——将元组/列表转换为字典格式【解】PyCharm程序如下:运行结果如下:四、数据类型的转换案例——列表和元组的创建与转换【解】PyCharm程序如下:运行结果如下:四、数据类型的转换案例——元组创建演示【解】PyCharm程序如下:运行结果如下:五、函数定义Python中的函数是一段封装了特定操作的代码,用于执行一个特定的任务。将代码段封装成函数的过程称为函数定义。自定义函数有以下规则。
函数代码块以def关键字开头,后接函数名和括号。
任何传入参数和自变量都必须放在括号之间。括号之间可以定义参数。一般根据变量的有效范围将变量分为局部变量和全局变量。当局部变量和全局变量重名时,对函数内部的变量进行赋值后,不影响函数外部的变量。
函数的第一行语句可以选择性地使用文档字符串(用于存放函数说明)。
函数内容以冒号开头,并且缩进(一般为四个空格),以表示属于该函数的代码块。五、函数定义案例——输出公司员工人数本实例定义一个函数define_num_classes(),在函数内部外部内部定义公司员工人数,最后输出公司员工人数的值。操作步骤如下:(2)在命令编辑窗口输入如下程序:运行结果如下:任务四Python流程控制一、表达式语句二、顺序结构三、选择结构四、循环结构五、条件表达式六、流程控制命令七、程序调试任务四Python流程控制任务引入掌握了Python的基本数据类型和输入输出后,小李和团队成员需要进一步学习如
何控制程序的执行流程。在数据分析中,经常需要根据不同的条件执行不同的操作,
或者重复执行某些步骤来处理大量数据。那么,Python的程序结构有哪些?分别能实
现什么功能呢?知识准备程序结构就是程序的流程控制结构。对于一般的程序设计语言,程序结构大致可分为
如图
所示的顺序结构、选择结构(分支结构)与循环结构3种,Python程序设计语言也
不例外。一、表达式语句1.表达式数值表达式由常量、变量、函数、矩阵和运算符构成。符号表达式由符号常量、变量、函数和运算符或专用函数构成,分符号函数与符号方程两类。Python程序中常用数值和符号表达式。在Python中,eval函数用来计算字符串中的有效Python表达式,并返回一个对象,其调
用格式如下:案例——变量与表达式计算【解】PyCharm程序如下:运行结果如下:一、表达式语句2.语句单个表达式就是表达式语句。一行可以只有一个语句;也可以有多个语句,此时语句之间以英文输入状态下的分号或逗号或按Enter键换行结束。3.逻辑表达式逻辑表达式的一般形式如下:其中的表达式可以是逻辑表达式,从而形成嵌套。4.赋值语句将表达式的值赋值给变量构成赋值表达式。5.人机交互语句input命令用来提示用户从键盘输入数据、字符串或表达式,并接收输入值。二、顺序结构顺序结构是最简单、最易学的一种程序结构,由多个Python语句顺序构成,各语句之间用分号“;”隔开,若不加分号,则必须分行编写,程序执行时也是由上至下顺序进行的。案例——输入一个三位数,分别求出其个位数字、十位数字、百位数字的值【解】PyCharm程序如下:运行结果为:三、选择结构选择结构也叫分支结构,即根据表达式值的情况来选择执行哪些语句。在编写较复杂的算法时,一般都会用到此结构。其中较常用的是if-else结构。Python分支结构分为单分支结构、二分支结构、多分支结构。(1)单分支结构:根据判断条件进行结果判断而选择不同的向前路径的运行方式,如图所示。它的一般形式为:三、选择结构案例——判断学生成绩是否及格在本例中,通过输入成绩是否大于等于60进行判断,程序会输出“成绩合格”或“成绩不合格”来帮助我们了解学生的表现。【解】PyCharm程序如下:三、选择结构(3)多分支结构:对不同分支进行分级处理,需要注意条件间的包含关系,如图所示。它的一般形式为:三、选择结构案例——判断天气温度的适宜穿衣【解】PyCharm程序如下:四、循环结构1.for循环在for循环中,循环次数一般情况下是已知的,
除非用其他语句提前终止循环。这种循
环以for开头,其一般形式为:案例——利用for语句实现1至100偶数的和【解】PyCharm程序如下:运行结果为:四、循环结构2.while循环若不知道所需的循环到底要执行多少次,就可以选择while-end循环,这种循环以while开头,其一般形式为:案例——利用while语句实现1至100之间奇数的和【解】PyCharm程序如下:五、条件表达式在进行程序设计时,经常会根据表达式的结果有条件地赋值,可以使用循环结构的紧
凑形式进行设计。这种方式适用于简单表达式,是程序结构的简化形式,其一般形式为:案例——判断数字的正负性【解】PyCharm程序如下:六、流程控制命令1.break命令break命令一般用来终止for或while循环,通常与if条件语句一起使用,如果条件满足,
则利用break命令将循环终止。在多层循环嵌套中,break只终止最内层的循环。
案例——输入数字并检测其中是否包含负数,若有则跳出循环【解】PyCharm程序如下:六、流程控制命令2.continue命令continue命令通常用在for或while循环结构中,并与if一起使用,作用是结束本次循环,
即跳过其后的循环语句而直接进行下一次是否执行循环的判断。
案例——输入数值,若其中包含数值0,则显示输入错误,使用continue语句
继续执行循环【解】PyCharm程序如下:七、程序调试在程序执行过程中发生影响程序的正常执行的情况时,PyCharm会弹出报错信息,表
示程序出现错误,如图所示。
运行出现错误程序运行正确项目总结项目实操:实操一
用户输入并计算两数之和用户输入两个数字,程序会将这两个数字转换为整数,并计算它们的和。然后输出结
果并展示数字的类型。(1)定义一个计算两数之和的函数(2)用户输入两个数字(3)将输入的数字转换为整数(4)计算输入的数字和(5)输出结果和数据类型运行结果为:用户输入一个正整数,程序将计算并输出该数字的阶乘。程序应使用for循环遍历计算
阶乘,若用户输入负数,则提示重新输入。(1)输入正整数(2)初始化阶乘(3)使用for循环计算阶乘(4)输出结果
运行结果:项目实操:实操二
打印正整数的阶乘项目二
NumPy数据探索和预处理任务一NumPy数组操作任务二NumPy数组运算任务三
数据加载、统计与预处理任务一NumPy数组操作一、数组的数据类型二、创建数组三、数组的属性四、数组的索引任务一NumPy数组操作任务引入小王分到的项目主要是进行统计计算,由于没有数据,所以为了运行程序,小
王定义数组数据进行程序演示。那么,数组是什么?如何创建呢?
知识准备数组是有序的元素序列,向量、矩阵是线性代数中定义的数学概念。数组是计
算机中的概念,从外观和数据结构上看,二维数组和数学中的矩阵没有区别,一维
数组和数学中的向量没有区别。向量、矩阵是特殊的数组,三者的关系如图
所
示。一、数组的数据类型NumPy支持的数据类型比Python内置的类型要多,基本上可以和C语言中的数据类型对
应上,其中部分类型对应为Python内置的类型。表列举了常用的NumPy数据类型。一、数组的数据类型案例——查看数组的数据类型【解】PyCharm程序如下:运行结果如下:一、数组的数据类型案例——指定并查看数组的数据类型【解】PyCharm程序如下:运行结果如下:二、创建数组在NumPy中,每个线性的数组称为一个轴(axis),即维度(dimension)。根据数组中
元素的维度将数组分为一维数组、二维数组、多维数组。1.array函数NumPy使用array函数,通过直接定义数据创建数组,返回N维数组对象(ndarray),其
调用格式如下:案例——创建一维数组【解】PyCharm程序如下:运行结果如下:二、创建数组(1)arange函数。arange函数通过直接定义数据元素个数而不是数据元素来创建数组。此函数的调用格式
如下:案例——创建一个从0开始到10结束、增量为2的数组【解】PyCharm程序如下:运行结果如下:二、创建数组(2)linspace函数。linspace函数通过直接定义数据元素个数而不是数据元素的增量来创建一维数组(向
量)。该数组可以看作一个等差数列。此函数的调用格式如下:案例——创建一个从0开始到10结束、包含6个数据元素的向量【解】PyCharm程序如下:二、创建数组(3)logspace函数。与linspace函数一样,logspace函数也通过直接定义向量元素个数而不是数据元素之间
的增量来创建一个对数分隔的数组。logspace函数的调用格式如下:案例——使用等差函数与等比函数创建包含3个数据元素的向量【解】PyCharm程序如下:二、创建数组1.asarray函数asarray函数类似于array,可以用来创建数组。2.frombuffer函数frombuffer函数用于实现动态数组,通过buffer输入参数,以流的形式读入并转化成ndarray对象。3.fromiter函数fromiter函数从可迭代对象中建立ndarray对象,返回一维数组。4.初始化数组函数数组的初始化就是为其赋初值,即向这个数组中装入有意义的数据,在程序设计中,
数组初始化很重要。在NumPy模块库中,包含几种初始化函数,如表所示。二、创建数组案例——使用不同函数创建数组【解】PyCharm程序如下:三、数组的属性创建数组后,可以通过设置数组的属性来实现对数组的操作,在NumPy数组中,ndarray的对象属性如表所示。三、数组的属性
案例——数组的属性显示示例【解】PyCharm程序如下:四、数组的索引在Python中,一个数组可以分解为多个数组元素,这些数组元素可以是基本数据类型
或构造类型。数组的索引和切片都是对数组元素的引用。1.索引值索引数组元素引用的方式如表所示。四、数组的索引案例——数组索引示例【解】PyCharm程序如下:四、数组的索引2.choice函数除了使用索引和切片输出数组元素,NumPy模块中还提供了choice函数,用于从给定的
一维数组中随机采样。案例——数组元素输出【解】PyCharm程序如下:四、数组的索引3.take函数take函数用于沿轴取数组中的元素。4.choose函数choose函数按照索引对数组的元素进行选择案例——输出数组元素【解】PyCharm程序如下:任务二NumPy数组运算一、数值数组二、数组的数学运算三、深拷贝和浅拷贝
任务二NumPy数组运算任务引入为了演示程序,小王需要定义大量数据,直接输入数组数据过于烦琐,那么如
何解决这一问题呢?20世纪80年代以来,问题解决或解决问题已成为国际理科教育的一种潮流。调查发现,使用特殊数组可以直接定义指定大小的数组。那么,特
殊数组有哪些呢?
知识准备在工程计算及理论分析中,经常会遇到一些特殊的数组,如全0数组、单位数
组、随机数组等。对于这些数组,NumPy中都有相应的命令可以直接生成。下面就
介绍一些常用的命令。一、数值数组1.空数组在NumPy中,空数组使用empty命令表示。2.全0数组在NumPy中,全0数组使用zeros命令表示。3.全1数组在NumPy中,全1数组使用ones命令表示。4.指定数值数组在NumPy中,使用full函数创建数值数组,该数组元素均为指定数值。一、数值数组案例——数组生成示例【解】PyCharm程序如下:一、数值数组案例——数值数组生成示例【解】PyCharm程序如下:1.0到1的随机数组numpy.random模块可方便地生成随机数组,并返回指定范围内的一个整数或浮点数。一、数值数组案例——0到1的随机数组生成示例【解】PyCharm程序如下:运行结果如下:一、数值数组在Python中,NumPy模块库的random子模块中包含一些生成服从指定分布随机数组的
函数,具体的调用格式如表所示。一、数值数组
案例——生成服从指定分布的随机数组【解】PyCharm程序如下:一、数值数组二、数组的数学运算5.基本运算数组的基本运算包括加、减、乘、除、乘方等,与线性代数中的定义是一样的,相应的运算符为“+”“-”“*”“\”“**”。案例——数组基本运算示例【解】PyCharm程序如下:二、数组的数学运算2.数组广播在NumPy中,当对数组进行运算时,如果两个数组的形状相同,那么两个数组相乘就是两个数组的对应位相乘,这就要求维数相同,并且各维度的长度相同。广播规则如下。如果两个数组的维数不相同,那么低维数组的形状将会在最左边补1。如果两个数组的形状在任何一个维度上都不匹配,那么数组的形状会沿着维度为1的维度扩展以匹配另外一个数组的形状。如果两个数组的形状在任何一个维度上都不匹配,并且没有任何一个维度等于1,则会引发异常。数组广播函数如表所示。二、数组的数学运算案例——不同形状数组运算示例【解】PyCharm程序如下:二、数组的数学运算NumPy常用的数学运算函数如表所示三、深拷贝和浅拷贝1.深拷贝在NumPy中,copy函数用于创建一个数组的副本,新的数组与原数组具有相同的数据类型,但内存地址不同。其调用格式如下:numpy.copy(a)2.浅拷贝在NumPy中,view函数用于创建一个数组的新视图,新的视图与原数组共享同一块数据缓冲区,但可以拥有不同的数据类型。函数调用格式如下:numpy.view(dtype=None)任务三
数据加载、统计与预处理一、数据加载二、数据统计三、数据归一化和标准化任务三
数据加载、统计与预处理任务引入定义数组后,下一步是进行数组运算。那么,基本的数组运算有哪些?它们是
如何实现的?
知识准备数组运算是指数组对应元素之间的运算,也称点运算。矩阵的乘法、乘方和除
法都有特殊的数学含义,并不是数组对应元素的运算。因此,在数组的乘法、乘方
和除法的运算符前特别加了一个点。一、数据加载在实际使用中,在遇到复杂数据格式时,数组不再是最适合的数据加载方式,NumPy提供有了一些从文件中导入数据的函数,使用这些函数可以提高数据处理效率,
帮助用户
高效地处理数据。1.loadtxt函数loadtxt函数用于从文本文件中加载数据。2.genfromtxt函数genfromtxt函数同样用于从文本文件中加载数据,与np.loadtxt()相比,该函数提供了参
数来处理文件中的不规则数据、缺失值问题。3.savetxt函数savetxt函数用于将数组保存到文本文件中。一、数据加载案例——读取温度数据文件并处理本案例使用NumPy的函数来读取txt文件数据(图)。操作步骤如下:在PyCharm命令编辑窗口输入如下程序:二、数据统计使用NumPy的统计函数不仅加深了解数据的分布和特性,而且还是决策树、随机森林等算法的基础,在机器学习数据预处理和分析阶段扮演着极其重要的角色。NumPy常用的统计函数见表。下面介绍统计函数的分类:1.基本统计描述最小值与最大值
百分位数2.数据变异性度量标准差与方差
峰度与偏度3.数据分布特征
值范围
中位数三、数据归一化和标准化在机器学习中,数据归一化和标准化是常见的预处理步骤。它们的目的是将数据缩放到一个特定的范围或分布,以便更好地进行模型训练和预测。1.数据归一化数据归一化(Normalization)是将数据缩放到[0,1]范围内。常用的方法有最小-最大归
一化(Min-MaxScaling)和Z-score标准化(StandardScaling)。2.数据标准化数据标准化(Standardization)是将数据缩放到均值为0,标准差为1的分布,通常使用Z-score标准化实现。3.重新缩放在Numpy中,clip函数用于将数组中的元素限制在指定的最小值和最大值之间,这是一
种简单的归一化方法,在处理包含异常值或需要将数据规范化阶段非常有用。三、数据归一化和标准化1.数组排序NumPy的random子模块提供了两种数组排序函数:shuffle函数对原数组进行随机排列,permutation函数返回一个随机排列的数组。案例——数组排序示例【解】PyCharm程序如下:运行结果如下:三、数据归一化和标准化2.遍历数组遍历数组是指把数组中的每个数都读一遍,Python提供了两种遍历数组并输出所有元
素的方法。(1)一般情况下,使用for循环遍历数组元素。(2)数组迭代。案例——数组输出示例【解】PyCharm程序如下:三、数据归一化和标准化3.数组元素的增减数组元素用数组名和位置表示。下标从0开始,索引i表示第i+1个元素。如a[0]为第1个元素,a[1]为第2个元素。数组元素的增减是最基本的数组元素操作,常用的数组元素的增减命令如表所示。三、数据归一化和标准化案例——数组元素操作示例【解】PyCharm程序如下:项目总结项目实操:实操一
某市超市月度销售数据统计某市3家连锁超市月度销售额统计数据如表2-9所示,试对其进行数据处理和运算。(1)定义数组数据(2)统计运算(3)使用for循环输出每家超市的年度销售额(4)数组元素增减操作项目实操:实操二
分析城市PM2.5监测数据某城市设有5个空气质量监测站,现从这5个监测站收集了24小时内的4项指标数据,如表所示。(1)读取数据(2)计算最小值(3)计算最大值(4)计算平均值(5)输出数据项目三
Pandas数据处理与分析任务一Pandas数据采集任务二Pandas数据预处理与探索任务三Pandas描述性统计分析任务一Pandas数据采集一、Series对象二、DataFrame对象三、电子表格文件四、文本文件五、数据集文件任务一Pandas数据采集任务引入小刘受学校委托分析学生体检数据。数据含年级、性别、身高、体重、成绩和近视情况。使用Pandas采集数据,可定义数组。Pandas数据结构有哪些?如何定义?知识准备Pandas数据结构为Series和DataFrame。两者可处理多领域数据分析。Series为一维数组,含数据和索引;DataFrame为二维数组,含行、列数据和索引。部门费用统计表一维数组对象Series二维数组对象DataFrame一、Series对象Series是一种类似于一维数组的对象,由一组数据(NumPy中的数据类型)及一组与之相关的数据标签(索引)组成。1.创建Series在Pandas中,Series函数用来创建一维数组对象Series。它的使用格式如下:
data:一组数据(ndarray类型)。
index:数据索引标签,默认从0开始。
dtype:数据类型。
name:设置名称。
copy:复制数据,默认为False。创建Series对象后,可以通过设置Series属性达到修改Series的目的。Series常用属性如表所示。一、Series对象案例——创建一维数组对象Series本案例根据如图所示的某单位入职人数、离职人数创建一维数组对象。【解】PyCharm程序如下:一、Series对象案例——利用上例中的某工厂产量成本报表,通过定义索引属性编辑一维数组对象【解】PyCharm程序如下:一、Series对象2.Series常用函数Series集成了ndarray和dict的优点,可以使用ndarray或dict的所有索引操作和函数。Series常用函数如表所示。案例——利用某工厂产量成本报表输出指定的对象【解】PyCharm程序如下:二、DataFrame对象1.DataFrame生成在Pandas中,DataFrame函数用来创建二维数组对象DataFrame。案例——根据如图所示的某公司2016年员工医疗费用统计表创建DataFrame【解】PyCharm程序如下:二、DataFrame对象2.DataFrame属性通过DataFrame属性可以查看定义的数据。DataFrame常用属性如表所示。二、DataFrame对象案例——根据如图所示的淘宝某新开店铺的产品日销售表创建DataFrame.【解】PyCharm程序如下:三、电子表格文件Excel软件用于数据处理、统计分析,管理、统计财经、金融等领域。Excel2003前默认xls格式,2007后默认xlsx。openpyxl库读写Excel2010文档,需安装加载。安装加载设置略。1.读取Excel文件在Pandas中,使用read_excel函数读取Excel自带的xls或xlsx文件中的数据。该函数的使用格式如下:三、电子表格文件案例——导入如图所示的成本费用表的两个Sheet中各产品的费用【解】PyCharm程序如下:三、电子表格文件2、写入Excel文件在Pandas中,从文件中读取的数据以DataFrame或Series格式保存在内存中,to_excel函数可以将数据保存为xls或xlsx文件。案例——导入如图所示的商品订购单.csv中某家具销售公司二季度商品订购记录,将数据保存为“商品订购单.xlsx”【解】PyCharm程序如下:四、文本文件txt、csv文件能够实现简单的数据存储,是一个纯文本文件,常用于在程序之间转移表格数据,以兼容各类程序。txt、csv文件能够实现简单的数据存储,是一个纯文本文件,常用于在程序之间转移表格数据,以兼容各类程序。对于中文的文本文件,通常会出现因编码的问题而读取失败,解决办法有以下两种。(1)当原始的txt、csv文件的数据不是uft-8格式时,需要另存为utf-8格式编码。(2)如果原始的数据文件就是uft-8格式,为了正常读入,需要将read_csv函数的参数encoding设置为utf-8。1.read_csv函数在Pandas中,read_csv函数可用于从文件、URL、文件型对象中加载带分隔符的数据,默认分隔符为逗号。四、文本文件案例——导入白酒产量数据csv文件解:PyCharm程序如下:运行结果如下:四、文本文件2.from_csv函数PrettyTable支持手动和csv文件读取数据。读csv文件需用open函数打开,再用from_csv函数读取。案例——获取白酒产量数据CSV文件解:PyCharm程序如下:运行结果如下:五、数据集文件1.SAS数据集SAS数据集包含以表的观测(行)和变量(列)为形式存在的数据值,以及用于描述变量类型、长度和创建该数据集时所使用的引擎等信息的描述信息。在Python中,pandas.read_sas函数可以读取SAS数据集。案例——读取租赁筹资模拟运算SAS数据集解:PyCharm程序如下:运行结果如下:五、数据集文件2.Stata数据集pandas.read_stata函数可以读取Stata数据集。案例——读取租赁筹资模拟运算Stata数据集解:PyCharm程序如下:运行结果如下:五、数据集文件其他文件读取函数任务二Pandas数据预处理与探索一、数据清洗二、数据转换三、数据合并四、数据提取四、数据提取六、数据排序七、统计分组任务二Pandas数据预处理与探索任务引入小刘收集了一份包含不同年级、性别学生体检数据的宝贵资料。然而,这份原始
数据可能潜藏着各种问题:缺失值、异常值、重复记录,
甚至一些无用的信息。如果
直接对这些“不完美”的数据进行分析,很可能会得出偏差甚至错误的结论。那么,
如何从这份原始数据中筛选出可靠、可用的信息呢?面对那些异常、重复或无用的数
据,又该如何进行恰当的处理?在进行统计分析之前,还需要做哪些关键的准备工作?
数据预处理有哪些公认的标准和最佳实践?一、数据清洗1.数据缺失在数据输入过程中,很容易出现数据遗漏现象,Pandas对象的所有描述性统计默认都
不包括缺失数据,因此,在数值数据中,Pandas使用浮点值NaN表示缺失数据。这样可以
很明显地发现缺失数据,方便修改。
案例——处理缺失数据【解】PyCharm程序如下:一、数据清洗案例——利用函数处理缺失数据【解】PyCharm程序如下:一、数据清洗2.重复数据unique函数用于获取Series中的唯一值数组,删除重复数据。案例——利用函数删除重复数据【解】PyCharm程序如下:运行结果如下:一、数据清洗3.数据格式化数据格式化可以增强数据的可读性,如统一数据的小数点位数、添加千位分隔符;还可以实现特定的功能,如转换为百分比数据,百分比数据主要用于成绩分数等统计计算。案例——对所有列保持统一精度【解】PyCharm程序如下:一、数据清洗案例——已知某小学数学、语文考试分数,从中各抽取6份进行估测,测得数据如下:语文为95,82,79.5,87,83,86.5,数学为91,95,93,96,97,98,试对成绩进行格式化【解】PyCharm程序如下:一、数据清洗一、数据清洗案例——输入4所小学的联考平均分,控制输出精度、对齐数据,并保存到Excel文件中【解】PyCharm程序如下:保存到Excel文件中二、数据转换当获得数据时,首先需要确定的是正确类型的数据,Pandas扩展了NumPy的类型系统,用dtype属性显示元素的数据类型。Pandas主要有以下几种数据类型。
字符串类型:object。
整数类型:int64、int32、int16、int8。
无符号整数:uint64、uint32、uint16、uint8。
浮点数类型:float64、float32。
日期和时间类型:datetime64[ns]、datetime64[ns,tz]、timedelta[ns]。
布尔类型:bool。当利用Pandas进行数据处理的时候,经常会遇到数据类型的问题,一般需要通过数据类型的转化,只有这样才能进行后续的数据操作。表中列出了关于数据转换的函数。二、数据转换案例——将输入的数据转换为浮点型,并分别输出【解】PyCharm程序如下:三、数据合并在实际处理数据的过程中,经常会遇到将多个表连接起来进行数据的处理和分析的情况,Pandas中也提供了几种方法来实现数据合并功能。merge函数基于两个DataFrame的共同列进行合并。该函数的使用格式如下:三、数据合并案例——使用merge函数连接两个数组:正弦表、余弦表【解】PyCharm程序如下:三、数据合并案例——使用concat函数连接两个数组:正弦表、余弦表【解】PyCharm程序如下:四、数据提取数据分析需提取部分数据到目标系统加工利用,问题在于从哪取、何时取、如何取。数据提取过程难统一。Pandas中的数据抽取函数如表所示。案例——抽取表中的数据四、数据提取【解】PyCharm程序如下:五、数据分类数据分类是将数据进行一个自定义的分类,Pandas中提供了cut函数来实现数据分类。
该函数的调用格式如下:
案例——对8年间钢材消耗量进行分类【解】PyCharm程序如下:运行结果如下:五、数据分类数据排序数据排序可发现特征、趋势,解决问题,也是分析目的之一。《财富》杂志排500强,助企业定位、知差距、了解对手,定规划、战略。Pandas的sort_values函数可排序数据。该函数的调用格式如下:案例——对表格进行排序为了考察染整工艺对布的缩水率是否有影响,
选用5种不同的染整工艺,分别用A1、A2、A3、A4、A5表示,每种工艺处理4块布样,测得缩水率的百分数如表所示。六、数据排序Pandas中的其余数据排序函数如表所示。案例——对数据进行排序对某仓库超重包裹重新打包,随机抽取6个包裹进行最大最小质量对比,测得数据如下
(单位:kg):36.5,138.5,140.3,112.7,88.93,54.2。七、统计分组统计分组是基本方法,使资料系统化。分组优劣影响数据统计质量。如学校人员按老师、学生等标志分类。。
1.groupby函数Pandas中的groupby函数用于对DataFrame对象进行分组。groupby函数返回包含有关组的信息,groupby对象利用groups属性查看分组的信息,从
返回的结果中可以看到不同分组的样本在原数据框中的索引,如表所示。七、统计分组案例——已知员工医疗费用表,试通过分组,根据性别、所属部门统计医疗
费用【解】PyCharm程序如下:七、统计分组2.agg函数分组用于描述各组数据,以代表性数据解释数据规律。agg函数计算分组后的最大值、最小值、和等,如表所示。
案例——已知员工医疗费用表,试通过分组,根据性别计算和、最大值、最小
值【解】PyCharm程序如下:任务三Pandas描述性统计分析一、集中趋势分析二、离散程度分析三.相关性分析四、频数分析任务三Pandas描述性统计分析任务引入小刘希望对包含不同年级、性别学生体检数据进行更深入的分析,而不仅仅是计
算一些基本的数字。他想知道,Pandas提供了哪些更具针对性的统计分析方法?又有
哪些统计指标可以帮助他更全面地了解数据的特征?知识准备数据统计分析包括数据的离散程度分析、集中趋势分析、频数分析、分布,
以及
一些基本的统计图形分析。一、集中趋势分析集中趋势分析是用各种起代表值作用的量度来反映变量数值趋向中心位置的一种资料
分析方法,最常用的指标有均值、中位数、众数和分位数等。1.均值均值是数据总和除以个数,常用度量数据集趋势。Pandas用mean函数计算分组均值。2.中位数中位数是排序后居中的数据,不受极端数值影响。Pandas用median函数计算分组中位数。3.众数众数是频数最多的观测值,反映数据集中程度。Pandas用mode函数计算众数。4.分位数分位数将数据分成等份,描述数据分布,识别异常值。一、集中趋势分析案例——已知员工医疗费用表,试进行集中趋势分析,计算平均值、中位数和众数【解】PyCharm程序如下:二、离散程度分析离散程度是指通过数据间的差异程度来衡量风险大小的指标,最常用的指标有方差和标准差等。1.标准差标准差是最常用的反映随机变量分布离散程度的指标。标准差越大,数据波动越大;标准差越小,数据波动越小。在Pandas中,std函数用来计算分组数据的标准差。2.方差分析方差不仅表达了样本偏离均值的程度,还揭示了样本内部彼此波动的程度,在许多实际问题中,研究方差,即偏离程度有着重要的意义。在样本容量相同的情况下,方差越大,数据的波动越大,越不稳定。在Pandas中,var函数用来计算数据的方差。三.相关性分析相关性分析用于研究变量间关联。常用方法:1.计算协方差
协方差衡量两变量误差协同变化。变化趋势一致,协方差为正;相反,则为负。Pandas用cov函数计算。2.计算相关系数
协方差仅定性分析,引出相关系数概念。比较不同数据离散程度时,若测量尺度大或量纲不同,用相关系数。相关系数是标准化协方差,取值-1到+1。Pandas中,corr函数计算分组数据的相关系数。其调用格式如下:三.相关性分析案例——读取某公司产品的报价单,进行离散程度分析【解】PyCharm程序如下:四、频数分析频数指变量值出现次数。用于定类数据,了解背景。可用表或图形表示。Pandas中,count函数计算分组样本数,value_counts计算Series中各值频率。案例——读取某公司产品的报价单,进行频数列表分析【解】PyCharm程序如下:项目总结项目实操:实操一
各城市房源数据分析本实战对一份公开的房价数据各种数据清洗、转换、提取、分类、排序和统计分组操作。最终,得到各种有用的统计信息,例如各城市房源数量、各城市房源平均单价等等。(1)数据加载与查看(2)数据清洗(3)数据提取(4)数据分类(5)数据排序(6)统计分组项目实操:实操二
新生儿的得分分析本实战使用Pandas对航班乘客数据CSV文件进行集中趋势分析、离散程度分析、相关性分析和频数分析。(1)导入航班乘客数据(2)集中趋势分析(3)离散程度分析(4)相关性分析(5)频数分析项目四
Matplotlib数据可视化任务一
认识图表窗口任务二
图表通用属性设置任务三
核心绘图函数任务一
认识图表窗口一、图表的基本组成二、创建图形窗口三、绘制折线图四、创建子图任务一
认识图表窗口任务引入小白发现自己汇总完成的项目数据全是一对一对的指标的数据分析,
觉得不够直
观,于是让组员添加可视化数据分析。数据可视化分析实质上是可视化图表的创建,
可视化图表可将数据之间的复杂关系用图形表示出来,能够更加直观、形象地反映数
据的趋势和对比关系,使数据易于阅读和评价。那么,如何实现数据可视化分析?数
据可视化分析的工具有哪些?
知识准备数据可视化是对数据的一种形象、直观的解释,实现从不同的角度观察数据,
从
而得到更有价值的信息。数据可视化可以将抽象的、复杂的、不易理解的数据转化为
人眼可以识别的图形、图像、符号等,这些转化后的数据通常能够更有效地传达数据
本身包含的有用信息。一、图表的基本组成在开始学习Matplotlib可视化图表之前,有必要先对图表的结构有一个初步的认
识。图表的基本组成示例如图所示。二、创建图形窗口在Pyplot中,figure函数用来创建图形窗口。该函数的调用格式如下:参数说明如下。
num:指定图表编号或名称,数字为编号,字符串为名称。
figsize:指定figure的宽和高,单位为英寸。
dpi:指定绘图对象的分辨率,即每英寸(1英寸=2.5cm)多少个像素,默认值为80。
facecolor:背景颜色。
edgecolor:边框颜色。
frameon:是否显示边框。图形窗口二、创建图形窗口案例——创建城市交通流量分析图形窗口【解】PyCharm程序如下:运行程序,结果如图所示。在当前目录下生成一个“城市交通流量分析.png”文件。三、绘制折线图折线图连接各个单独的数据点,以等间隔显示数据的变化趋势。通常情况下,类别数据或时间的推移沿水平轴(x轴)均匀分布,数值数据沿垂直轴(y轴)均匀分布。plot命令是最基本的绘图命令,用来绘制折线图。该函数的调用格式如下:format_string的合法设置参见表。三、绘制折线图三、绘制折线图案例——交通流量折线图分析本案例基于表所示的24小时交通流量数据,绘制折线图以展现流量随时间变化的趋
势。【解】在PyCharm命令行窗口中输入如下命令:输出结果如图所示。交通流量随时间的变化关系三、绘制折线图案例——气温随时间的变化折线图现有三个城市(北京、上海、广州)在过去一年中每个月的平均气温数据如表所示。本实例演示在同一图中绘出不同城市的气温随时间的变化曲线。不同城市的气温与时间的数据气温随时间的变化曲线四、创建子图子图即在同一绘图区中分割出所需的几个绘图区,可以使用subplot和subplots函数来实现。subplots函数可以一次生成多个绘图区。该函数的调用格式如下:四、创建子图案例——运动员评分子图本案例创建了四个子图,每个子图显示一位运动员在一次评分中十个评委给出的分数。
折线图清晰地展示了每个评委的评分变化。运行后所得的图像如图所示。运动员评分不同样式的子图任务二
图表通用属性设置一、图表属性参数二、坐标系设置三、图形标注任务二
图表通用属性设置任务引入小刘收到组长小白的返回意见后,根据统计结果绘制可视化图表。那么,如何绘
制图表?如何实现数据可视化?知识准备Matplotlib提供了和MATLAB类似的绘图API——Pyplot。Pyplot包含一系列绘图
函数的相关函数,能很方便地让用户绘制2D图表。在数据可视化分析中,为了让图表显示更好的效果,需要对图表进行设置。下面
简单介绍一下图表的常见设置,给图表加上标记、网格、图例和注释等。一、图表属性参数Pyplot使用rc配置文件自定义图表的各种默认属性,称为rc配置或rc参数。通过rc参数,
可以修改默认的属性,包括窗体大小、每英寸的点数、线条宽度/颜色/样式、坐标轴、坐标
和网络属性、文本、字体等。例如:1.
自定义属性配置rcParams函数用来定义图形的默认属性。该函数的调用格式如下:一、图表属性参数其中key表示可以设置的属性,如表所示。2.指定配置文件在使用Matplotlib画图时,除可以针对每一个样式进行自定义外,还可以使用系统定义
好的样式进行快速配置。style是Pyplot的一个子模块,方便进行风格转换,里面定义了很多预设风格。从本质上
来说,每一个预设的风格都是一个style文件,它是以.mplstyle为后缀的文件。二、坐标系设置坐标系是被坐标轴围起来的部分,包括中间的数据系列区、坐标轴、坐标刻度、坐标
标签等部分。1.创建坐标系Pyplot绘图函数自选坐标系显曲线。不合适时,可用axes命令设新坐标。案例——医疗资源数据折线图医院管理部门收集了过去12个月的月度数据“医疗资源数据表.csv”,通过绘制折线图
分析其过去一年(2023年)的病人流量和床位使用率的变化趋势。运行结果如图所示。二、坐标系设置2.坐标轴控制axis命令用于控制坐标轴的显示、刻度、长度等特征。它有很多种使用方式,表4-8列出了一些常用的使用格式。该函数与axes.Axes.set_xlim、axes.Axes.set_ylim类似。二、坐标系设置案例——广告投放前后销售额对比本案例通过对比广告投放前后各7天的销售数据,利用折线图清晰展现投放后销售额的
显著增长趋势,Matplotlib将自动优化坐标轴范围,更突出地呈现增长效果。运行结果如图所示。3.坐标轴刻度范围在Python中,还可以对坐标轴刻度范围进行设置或查询,x、y轴相应的命令为xlim、ylim,它们的调用格式是一样的,与axes函数相同,这里不再赘述。4.双y轴坐标系在数据分析过程中,有时需要同时展示两组数据,因此需要建立双y轴坐标系。在Python中,ax.twinx用于产生一个双y轴坐标系。三、图形标注Python提供图形标注函数,可添加标题、坐标轴标注、图例及文本。本部分最常用,读者需仔细学习并调试例子。1.标注标题默认图表无标题,不美观且作用不明,需添加。Pyplot中,title命令用于加标题。三、图形标注案例——空气质量排名折线图添加标题为提升城市环境治理水平,推动空气质量改善,需要对各城市空气污染程度进行量化
评估与可视化呈现。本案例选取了一组城市空气质量数据,包含各城市的排名和对应的空
气质量指数(AQI)。如表所示。根据表绘制折线图并添加标题。运行结果如图所示。空气质量最差城市排名情况三、图形标注2.标注坐标轴名称对坐标轴进行标注的相应命令为xlabel、ylabel,作用分别是对x轴、y轴进行标注,它们的调用格式是一样的。下面以xlabel为例进行说明。案例——空气质量排名折线图添加坐标轴名称提升图表的可读性,本案例对前述生成的空气质量排名折线图进行增强,明确标注X轴为“排名”,Y轴为“空气质量指数(AQI)”。运行结果如图所示。三、图形标注3.标注坐标轴刻度在Python中,还可以对坐标轴刻度的样式进行设置或查询,x、y轴相应的命令为xticks、yticks,它们的调用格式是一样的。案例——空气质量排名折线图设置坐标轴刻度名称本案例将利用上面案例数据绘制的空气质量排名折线图,为X轴和Y轴添加清晰的刻度名称,以增强图表的可读性和信息表达能力。运行结果如图所示。三、图形标注4.标注图形在给所绘得的图形进行详细的标注时,最常用的两个命令是text与annotate,它们均可以在图形的具体部位进行标注。案例——空气质量排名折线图添加标签本案例将在空气质量排名折线图中通过添加数值标签,突出显示关键信息点,提升图表解读的深度与效率。运行结果如图所示。三、图形标注annotate命令在图形中增加带箭头的注释,其使用格式如下:参数说明如下。
s:注释文本内容。
xy:被注释的坐标点。
xytext:注释文字的坐标位置。
**kwargs:用于设置带箭头注释的属性。
xycoords:坐标轴位置,其参数如表所示。
extcoords:设置注释文字偏移量,其参数如表所示。
arrowprops:箭头参数,其参数如表所示。
bbox:给标题增加外框,其参数如表所示。三、图形标注三、图形标注三、图形标注案例——空气质量排名折线图添加注释本案例以城市空气质量排名数据折线图为基础,通过精确定位的注释,更着重于突出
污染最为严重的城市。运行结果如图所示。三、图形标注5.标注图例当在一幅图中出现多种曲线时,用户可以根据自己的需要,利用legend命令对不同的图例进行说明。参数说明如下。●handles:线条对象。●labels:图例的名称,用指定的文字string1,string2,…在当前坐标轴中为所给数据的
每一部分显示一个图例。●loc:图例在整个坐标轴平面中的位置,默认为'best',使用字符串或数字表示图例的最
佳位置,如表所示。三、图形标注案例——空气质量排名折线图添加图例本案例在上面案例绘制的城市空气质量排名折线图的基础上,添加图例说明,增强图
表的可读性。运行结果如图所示。三、图形标注6.控
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年重庆石油医院医护人员招聘考试试题及答案详解
- 2026年项目合作数据治理合同
- 2026年医疗运营数据资产管理合同
- 第三节 化学反应的方向教学设计高中化学人教版2019选择性必修1 化学反应原理-人教版2019
- 原液准备浸渍操作工创新方法能力考核试卷含答案
- 2026年四平市中西医结合医院医护人员招聘笔试模拟试题及答案详解
- Unit 3 Could you please clean your room Section A 3a-3c教学设计 2023-2024学年人教版八年级英语下册
- 2026年甘肃省西北民族学院附属医院医护人员招聘笔试备考题库及答案详解
- 2026年成都市老年病医院医护人员招聘笔试备考题库及答案详解
- 2025-2026学年做衣服整件教学设计
- 2026年统编版(2024)八年级下册语文期末质量监测试卷 3套(含答案)
- 风电机组塔筒防腐方案
- 高标准农田监理规划
- 2025年山东省高考数学试卷(含答案及解析)
- 2025河北省中考历史真题 (原卷版)
- 江苏省泰州市初二学业水平地理生物会考考试题库(含答案)
- 2025版美国糖尿病学会妊娠期高血糖诊治指南课件
- 2026年高考全国一卷数学题及参考答案
- 铸件成形原理 教学课件作者 祖方遒 第9章 凝固过程中的成分偏析
- 老人陪伴机器人商业计划书-v1
- GB/T 12149-2017工业循环冷却水和锅炉用水中硅的测定
评论
0/150
提交评论