Python商务数据分析与应用(AIGC版 微课版)课件 第1-4章:Python基础知识、Python基础模块、Python常用库、商务数据分析方法与指标_第1页
Python商务数据分析与应用(AIGC版 微课版)课件 第1-4章:Python基础知识、Python基础模块、Python常用库、商务数据分析方法与指标_第2页
Python商务数据分析与应用(AIGC版 微课版)课件 第1-4章:Python基础知识、Python基础模块、Python常用库、商务数据分析方法与指标_第3页
Python商务数据分析与应用(AIGC版 微课版)课件 第1-4章:Python基础知识、Python基础模块、Python常用库、商务数据分析方法与指标_第4页
Python商务数据分析与应用(AIGC版 微课版)课件 第1-4章:Python基础知识、Python基础模块、Python常用库、商务数据分析方法与指标_第5页
已阅读5页,还剩113页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第1章

Python基础知识SOUTHWESTERNUNIVERSITYOFFINANCEANDECONOMICS严谨勤俭求实开拓01Python概述02Python中的数据结构03控制流语句04函数05实训Part1Python概述严谨勤俭求实开拓01Python概述Python是一种高级编程语言特点简洁性:语法类似于英语,易于理解和编写可读性:可读性高,有助于团队协作和后期维护可扩展性:可嵌入其他语言编写的程序中,易于扩展开源:拥有活跃的社区支持,不断有新的库和框架推出跨平台:Python程序可以在多种操作系统上运行丰富的库:Python标准库提供了便捷的访问文件系统、系统调用、sockets等低级网络交互接口Python以语法清晰和代码可读性高而闻名,其强大的数据处理能力、简洁的语法和丰富的库支持,使其成为了企业人员进行数据分析的重要工具Python学习Python+AIGC:智能编程助手DeepSeek-Coder深度融合了AIGC技术,能够通过自然语言交互快速生成高质量的Python代码。Part2Python中的数据结构严谨勤俭求实开拓00Python中的数据结构基础数据类型组合数据类型可迭代对象序列映射无序01列表定义:一个容器数据结构,用于存储一组有序、可变的元素,具有可变性(可增删改元素)、索引和切片等特性列表没有长度限制,元素类型可以不同列表的长度和内容是可变的,可自由对列表中数据项进行增加、删除或替换列表属于序列类型,支持成员关系操作符(in)、长度计算函数(len())、分片([])列表可以同时使用正向递增序号和反向递减序号,可以采用标准的比较操作符(<、<=、==、!=、>=、>)进行比较[‘a’,‘b’,‘c’,d][]用于标记列表的起始‘’用于定义字符串,包裹字符串内容元素:列表中的单个成员,每个元素占据列表中的一个位置每个元素用逗号隔开元素可以是任意数据类型(如整数、字符串、列表、字典等)01列表列表相关的常用方法ls=[0,1,2,3,4,5,6,7,8,9]dells[2:8:3]print(ls)#输出[0,1,3,4,6,7,8,9]ls=[1,2,3]lt=[4,5]ls+=ltprint(ls)#输出[1,2,3,4,5]ls=[1,2,3,4,5]ls.reverse()#直接修改原列表print(ls)#输出[5,4,3,2,1]ls=[1,2,3]new_ls=ls.copy()#创建浅拷贝ls=[10,20,30,20,40]print(ls.index(20))#输出:1

(返回第一个匹配项的索引)01列表创建#用list函数,参数可以是字符串、元组、字典或者集合。但不能是整数、浮点数或者布尔值list(‘招商银行’)→['招','商','银','行']列表基本操作元素修改stock_info=[‘600000',‘浦发银行',11.52,11.54,11.61,11.4]stock_info[4]=12.00stock_info元素删除stock_info=[‘600000',‘浦发银行',11.52,11.54,11.61,11.4]delstock_info[1]stock_info分片赋值stock_info=[‘600000',‘浦发银行',0,0,0,0]stock_info[2:]=[11.52,11.54,11.61,11.4]stock_info列表常用函数extend函数-次在列表的末端插入多个元素stock_info=[‘600000',‘浦发银行']stock_price=[11.52,11.54,11.61,11.4]stock_info.extend(stock_price)stock_info=[‘600000',‘浦发银行',11.52,11.54,11.61,11.4]Append函数-直接把参数(任何类型)添加到尾部stock_info.append(stock_price)stock_info=[‘600000',‘浦发银行',[11.52,11.54,11.61,11.4]]pop函数-移除并返回指定列表中某个位置的元素my_list=[10,20,30,40,50]last_element=my_list.pop()print("Poppedelement:",last_element)#输出:Poppedelement:50print("Listafterpop:",my_list)#输出:Listafterpop:[10,20,30,40]specific_element=my_list.pop(1)print("Poppedelementatindex1:",specific_element)#输出:Poppedelementatindex1:20print("Listafterpoppingelementatindex1:",my_list)#输出:Listafterpoppingelementatindex1:[10,30,40]sort方法-排序(默认升序)02元组定义:是一个不可变的序列,意味着一旦创建,其内容不能被修改元组的元素可以是不同类型

的数据,如整数、字符串、对象等特点:由于具有不可变性,元组常用于维持数据的固定顺序,如函数可以安全地返回多个值而不用担心调用者会修改这些值。在列表操作中,除了对列表进行原地修改的函数,其他函数都可以应用在元组中,但与列表不同的是,在元组中使用这些函数,会返回新的元组。03字典定义:字典是Python中唯一内置的、核心的映射类型。字典通过特定的键(key),查找对应

的值(value)。键和值之间是一一对应的映射关系。特点:无序的;可变的;字典的键必须是不可变类型;字典的键不能重复;通过键来获取值。{'name':'John','age':30,'city':'NewYork'}用花括号创建:my_dict={'name':'John','age':30,'city':'NewYork'};用dict函数创建another_dict=dict(name="Alice",age=25,city="Boston")键值,键和值间用:隔开元素#访问字典print(my_dict['age'])#输出30

#修改字典my_dict['age']=28my_dict['profession']='Developer'可以进行迭代

forkeyinmy_dict:print(key)forvalueinmy_dict.values():print(value)forkey,valueinmy_dict.items():print(key,value)值可以是任意类型,可嵌套列表、元组或者字典03字典类似etdefault(),若值不存在,会被添加进字典字典常用函数04集合定义:集合类型与数学中的概念是一致的。它是由0个或多个唯一的、不可变的元素构成的无序组合。特点:集合也是通过一对花括号“{}”来标识的。集合支持添加和删除元素,同时也支持集合间的运算,如并集、交集、差集{1,2,3,4,5}#使用花括号创建集合my_set={1,2,3,4,5}#使用set函数创建集合,空集合必须使用set()创建another_set=set([2,4,6,8])#添加元素my_set.add(6)#移除元素

my_set.remove(2)my_set.discard(10)#如果元素不存在,不会抛出错误04集合集合常用函数Part3控制流语句严谨勤俭求实开拓03控制流语句条件判断(if-elif-else)循环(for和while)循环控制语句

(break和continue)条件判断语句允许根据一个条件的真假来决定执行哪个代码块

循环用于重复执行一段代码,直到满足特定条件break用于完全结束环;

continue用于结束当前迭代,并跳转到循环的下一次迭代在Python中,控制流语句是用来决定代码执行顺序的重要工具。控制流语句使得程序可以根据不同的条件执行不同的代码块,或者多次执行某个任务。主要的控制流语句包括条件判断(if-elif-else)、循环(for和while)以及循环控制语句(break和continue)。e.g.while循环e.g.breakPart4函数严谨勤俭求实开拓04函数定义语句运行后会新建一个名为repeator的变量名,其类型为function,即函数。参数的传递过程,实际上是一个赋值的过程。在调用函数时,调用者的实际参数自动赋值给函数的形式参数变量参数参数不可变和可变类型参数:不可变类型包括:整型、浮点型、字符串和元组等。可变类型有:列表、字典和集合等。位置参数:是调用函数为形参赋值的一种默认方式。实参与形参按照从左到右的位置顺序依次赋值关键字参数:为了避免位置参数赋值带来的混乱,Python允许调用函数时通过关键字参数的形式指定形参与实参的对应关系。

调用者使用name=value的形式来指定函数中的哪个形参接受某个值指定默认参数值指定默认参数值:在函数定义时,可以为参数指定值。这样当函数调用者没有提供对应参数值时,就可以使用指定的默认值任意数量参数:Python允许在定义函数时使用单星号*来收集位置参数,双星号**收集关键字参数。04函数变量作用域:Python中规定每个变量都有它的作用域,即变量只有在作用域范围内才是可见可用的全局变量和局部变量:全局变量是在所有函数之外创建的变量,在整个文件范围内都是可见的,局部变量仅仅在局部作用域内可用,在局部作用域之外,该变量是不可见的,函数执行结束后,局部变量被销毁。局部变量和全局变量同名的情况下,在局部作用域内,可见的是局部变量,全局变量被暂时隐藏起来关键字global语句通常放在函数体的开始部分,用于申明变量为全局变量局部变量04函数匿名函数:利用lambda函数来替代def,创建一个临时简单函数。与def语句不同,lambda是一个表达式。这就使得lambda能够出现在函数调用的参数中。而def语句则不能作为参数传递给函数用def创建函数返回参数x的第二个元素用lambda创建函数输出

浦发银行04函数异常处理:.try/except/else语句和try/finally语句尝试读取若读取失败,捕获异常并返回空字符串无论是否发生异常,最终关闭文件句柄Part5实训严谨勤俭求实开拓05实训请使用本章介绍的知识,按以下步骤编写相应代码并进行基本分析步骤一:生成并操作数据05实训请使用本章介绍的知识按以下步骤编写相应代码并进行基本分析步骤二:数据分类和统计05实训请使用本章介绍的知识按以下步骤编写相应代码并进行基本分析步骤三:数据存储和检索05实训请使用本章介绍的知识按以下步骤编写相应代码并进行基本分析步骤三:数据存储和检索THANKSFORYOURLISTENING本章结束感谢聆听第2章

Python基础模块SOUTHWESTERNUNIVERSITYOFFINANCEANDECONOMICS严谨勤俭求实开拓01math模块02random模块03time和datetime模块04re模块05实训Part1math模块严谨勤俭求实开拓00模块简介定义模块将一些函数、变量和类等定义保存在一个文件中,它是一种组织和重用代码的方式,可以将相关的代码逻辑组织在一个文件中,并通过使用import关键字导入模块的方式在其他程序中使用。模块使得代码的管理和维护更加方便,同时也促进了代码的重用和可扩展性。通过将相关功能封装在模块中,可以将复杂的程序分解为更小、更易于理解和维护的部分。这有助于提高代码的可读性和可维护性,并且可以在不同的项目中共享和重复使用代码。Python提供了许多内置模块,如math、random、data、time、re、sys和os等JUNE12th优势01math模块math模块提供了基础的计算功能数学常量算术函数导入模块01math模块常见的三角函数幂函数和对数函数Part2random模块严谨勤俭求实开拓02random模块定义:random模块主要用于生成满足各种分布的伪随机数,如随机整数、浮点数、选择随机项以及随机化序列等。其包含两类函数,分别为基本随机函数,如random()、seed();以及扩展随机函数,如randrange()、randint()、uniform()、choice()shuffle()等种子数一般是一个整数,作为伪随机数生成算法的初始输入。相同的种子会生成完全相同的随机数序列根据种子数a初始化随机数生成器生成一个[0.0,1.0)之间的随机浮点数基本随机函数:random()和seed()02random模块扩展随机函数生成指定范围内特定步长的随机整数候选数为1,3,5生成指定范围内的随机整数生成指定范围内的随机浮点数生成非空序列中的随机元素生成指定序列元素的随机排列以beta分布的概率分布返回0到1之间的随机数(Beta分布是一种定义在区间[0,1][0,1]上的连续概率分布,常用于描述某个事件成功概率的不确定性)Part3time和datetime模块严谨勤俭求实开拓03time和datetime模块time模块和datetime模块都可用于处理时间和日期time模块用于获取当前时间,以及执行与时间相关的操作,如暂停执行、获取时间戳等datetime模块则提供了日期和时间的日期对象,可以进行日期和时间的算术运算time模块使用范例按指定的秒数使程序休眠若干时间03time和datetime模块time模块使用范例03time和datetime模块datetime模块区别:本地当前日期和时间(无时区信息),相当于等同于datetime.now()(不带时区)datetime.now()当前日期和时间(可指定时区)根据指定的时间戳创建datetime对象不同日期或时间之间的差值返回日期时间对象所对应的时间元组Part4re模块严谨勤俭求实开拓04re模块定义:用于处理字符串的函数能够通过定义一串特殊规则匹配符合的字符,可以用来搜索、替换、分割和匹配字符串特殊字符04re模块常用函数04re模块常用函数Part5实训严谨勤俭求实开拓05实训请使用本章介绍的基础模块知识按以下步骤编写相应代码生成模拟实验数据,并进行基本分析。步骤一:生成实验数据05实训请使用本章介绍的基础模块知识按以下步骤编写相应代码生成模拟实验数据,并进行基本分析。步骤二:数据的正则表达式匹配05实训请使用本章介绍的基础模块知识按以下步骤编写相应代码生成模拟实验数据,并进行基本分析。步骤三:数据的异常检测THANKSFORYOURLISTENING本章结束感谢聆听第3章

Python常用库SOUTHWESTERNUNIVERSITYOFFINANCEANDECONOMICS严谨勤俭求实开拓01科学技术库NumPy02数据处理库pandas03数据可视化库Matplotlib04实训学习目标掌握Numpy多维数组的创建和操作技巧,能够进行数据处理和计算掌握如何使用Series和DataFrame处理和分析数据掌握各种类型的数据可视化图表,有效地展示和传达数据分析的结果引入案例苹果作为全球知名的电子品牌产品,产品覆盖范围广,使用Python数据分析能够为苹果带来很高的经济效益。在市场分析和趋势预测方面:对销量数据进行时间序列分析,识别销售高峰期。基于市场趋势,可以预测未来产品的需求量和市场动态,从而调整生产计划和供应链管理,确保产品供应与市场需求相匹配。在用户行为分析和市场定位方面:使用Python分析用户数据(如购买行为、偏好和用户反馈),可以帮助苹果公司更好地理解不同用户群体的需求和偏好。在产品质量和性能分析方面:借助Python的数据分析工具,可以收集和分析Mac电脑的性能测试数据,通过可视化技术识别产品中性能表现不佳的区域。同时统计不同型号产品的故障率,分析其与生产批次、材料选择等因素的关系,利用scipy进行假设检验,确定故障原因。通过对各个阶段进行跟踪和分析,能够及时调整设计或生产流程。思考:各个品牌通过短视频、直播等方式营销带货,企业获得运营及销售信息后应如何分析,哪些数据对于企业提升效益来说最为重要?主要内容3.1NumPyNumPy是Python中用于科学计算的基础包,提供了强大的多维数组对象和用于处理这些数组的函数3.2pandaspandas是Python中用于数据分析和处理的重要库,它提供了灵活而高效的数据结构和数据操作工具,使得数据的清洗、转换和分析变得更加简单和直观。3.3MatplotlibMatplotlib是Python中最流行的数据可视化库之一,它能够创建各种类型的静态、交互式和动态图形,帮助用户以直观、美观的方式呈现数据。Part1科学技术库NumPy严谨勤俭求实开拓3.1科学技术库(NumPy) NumPy是Python的一个开源数值计算库,也是Python数值计算最重要的基础包,主要用于数组计算,矩阵运算等。NumPy是在一个连续的内存块中存储数据,独立于其他Python内置对象。比起Python的内置序列,NumPy数组使用的内存更少,可以在整个数组上执行复杂的计算,而不需要Python的for循环。在数据可视化中,NumPy库非常方便地与其他数据可视化工具(如Matplotlib)结合使用,帮助用户快速高效地进行数据处理和可视化。3.1.1创建数据组例(1)使用array函数,该函数可以接受传入数据,然后将其转化为Numpy数组(2)array()可以将一组等长数组转换为n维列表

(3)Numpy提供创建特殊形式组数的函数Numpy特点:n维数组对象(ndaarry),Numpy提供了丰富的数组处理函数,可以用来创建、操作多维数组,进行数据处理和数学运算等,在处理大量、复杂的数据时这些函数乐意方便地用于数据处理和可视化3.1.2数学运算NumPy库提供了多种数学函数,可以方便地对数据进行数学运算,这些运算函数可以用于对数据进行处理,进而用于数据可视化。(1)Numpy中大小相等的数据之间的算术运算会应用到元素级(2)Numpy库中常用的运算函数①add()函数用于逐元素求和

②power()函数对数组逐元素进行幂运算③round()函数对每个元素四舍五入到最接近的整数3.1.2数学运算Numpy中其他常用的数学运算函数及功能3.1.3数据过滤和处理NumPy提供了多种函数用于数据的过滤和处理,如where()函数可以用来选取符合条件的数据,resize()函数可以用来改变数组的大小等。这些函数能够帮助用户对数据进行进一步处理,以便更好地展示数据。当需要根据条件从数组中选择特定的元素时,可以使用NumPy提供的数据过滤函数。例:①使用np.where()函数根据条件选择元素、提取元素②当需要对数组进行数据过滤时,NumPy提供了一些强大的函数,如使用np.nonzero()函数找出数组中非零元素的索引。③使用np.isin()函数检查数组中的元素是否包含在另一个数组中。3.1.3数据过滤和处理Numpy中还包括其他用于数据处理的函数3.1.4数据统计Numpy还提供了统计函数,可以用来计算数据的统计特性。这些函数可以帮助用户对数据进行统计分析,找出数据的中心趋势、离散程度、最大最小值等信息,从而更好地理解数据,为数据可视化提供支持。例:使用np.mean()函数计算数组的平均值

总的来说,numpy库在数据可视化中提供了丰富的功能和工具,可以帮助用户更轻松地处理和展示数据。同时,Numpy库的高效性和灵活性也使其成为数据处理和可视化领域中的重要工具之一。3.1.4数据统计Numpy中其他常用的数据处理函数Part2数据处理库pandas严谨勤俭求实开拓3.2数据处理库(pandas)pandas是Python中用于数据处理和分析的强大库,它提供了灵活而高效的数据结构和数据操作工具,使得数据的清洗、转换和分析变得更加简单和直观。pandas的核心数据结构包括Series(一维数组)和DataFrame(二维表格),这两种数据结构能够轻松处理不同类型的数据,并且支持各种数据操作和分析,例如索引、切片、合并、分组、聚合等。除了数据结构之外,pandas还提供了丰富的功能和方法,包括数据读取、数据清洗等。借助于这些功能,用户可以方便地进行数据预处理、数据探索性分析和建模分析,为实际业务问题提供可靠的数据支持。总之,pandas是Python数据科学领域中不可或缺的重要工具,它为用户提供了丰富的数据处理和分析功能,使得复杂的数据操作变得简单易行。3.2数据处理库(pandas)在使用pandas库时,首先要安装pandas库,可以使用以下命令进行安装:Pipinstallpandas安装完成后通过以下命令将pandas库导入Importpandasaspd将pandas库导入后可以进行读取文件的操作,从而获取数据进行分析。

3.2.1pandas的数据结构1.SeriesSeries是一种类似于一维数组的对象,它由一组数据(各种NumPy数据类型)以及⼀组与之相关的数据标签(即索引)组成。由一组数据产生最简单的Series:Obj=pd.Series([1,2,3,4,5])2.DataFrameDataFrame是pandas库提供的一种核心数据结构,是一种二维表格型的数据结构,别适合处理结构化数据。它含有⼀组有序的列,每列可以是不同的值类型(数值、字符串、布尔值等)。DataFrame既有⾏索引也有列索引,其中的数据是以⼀个或多个⼆维块存放的。创建DataFrame最常⽤的⼀种方式是直接传入⼀个由等长列表或Numpy数组组成的字典3.2.2数据读取1、读取excel文件(1)语法(2)参数说明

importpandasaspd#导入pandas库data=pd.read_excel(io,sheet_name=None,header=None,name=none,index_col=None,usecols=None,skiprows=None,nrows=None)#读取excel文件 io:读取的excel文件名,如r'./vote.excel"; sheet_name:excel文件中的sheet表名;

header:哪一行设置为列索引,默认是第一行,即header=0;

names:列索引名;

index_col:使用哪一列作为行索引,默认从0开始;

usecols:读取表格中哪几列,必须是位置索引; skiprows:跳过前几行读取文件,默认从0开始;nrows:读取多少行数据。3.2.2数据读取2、读取csv文件(1)语法(2)参数说明csv文件是以逗号为分隔符的文件,读取参数与excel基本类似。文件为gbk格式csv,若不设置encoding参数程序会报错。encoding:默认为'utf-8',还有中文编码‘gbk’、‘gb18030’、‘gb2312’。就汉字而言,三种编码方式的表示范围是:GB18030>GBK>GB2312即GBK是GB2312的超集,GB1803又是GBK的超集。一般读取中文文本可以直接用encoding=GB18030。data=pd.read_cvs(filepath_or_buffer:FilePathOrBuffer,encording=none)3.2.2数据读取3、读取txt文件(1)语法(2)参数说明#读取txt文件data=pd.read_table(filepath_or_buffer:FilePathOrBuffer,sep="\t")txt文件是以指制表符\t为分隔符的文件,参数与excel、csv基本类似,不同的地方在于必须要指定sep。sep:默认为'\t'。Part3数据可视化库Matplotlib严谨勤俭求实开拓3.3数据可视化库(Matplotlib)Matplotlib模块是一个用于创建图表和数据可视化的功能强大且灵活的工具。它可以用来绘制各种类型的图表,包括折线图、散点图、柱状图、饼图等。在数据分析和数据可视化领域,Matplotlib模块经常被用来探索数据、展示数据分布、比较不同数据集之间的关系以及展示趋势。通过Matplotlib模块,用户能够完全控制图表的外观和格式,包括图表的大小、颜色、线型、标签等。此外,Matplotlib还具有丰富的功能,例如添加图例、注释、网格线等,以帮助用户更清晰地呈现数据。在数据可视化中,Matplotlib通常与pandas、Numpy等数据处理模块一起使用。用户可以通过这些模块加载数据,然后使用Matplotlib创建各种图表来展示数据。3.3.1认识Matplotlib在任何绘图之前,需要创建一个Figure对象才能开始绘图:pltfig=plt.figure()#创建figure对象在拥有Figure对象之后,必须创建subplot才可以进行绘图:其中,nrows和ncols分别表示子图的行数和列数,index表示在这个网格中子图的索引(从1开始计数),**kwargs表示可选参数,例如调整子图的位置和间距等。常见的属性包括标题(title)、坐标轴标签(xlabel和ylabel)、坐标轴范围(xlim和ylim)等。通过调用这个函数,可以方便地对子图的各种属性进行设置。

fig.add_subplot(nrows,ncols,index,**kwargs)

importmatplotlib.pyplotasplt

#导入matplotlib库,为通常情况下的引入方式:3.3.2绘制线图(Matplotlib)Matplotlib中最常用的函数是plot()函数,用来绘制线图。在绘制图表时,plot()函数可以接受x和y坐标数组作为参数,将这些数据点连接起来,并根据需要添加不同的标记、线条颜色和样式。importmatplotlib.pyplotasplt#导入matplotlib库plt.plot(x,y,**kwargs)#接受xy坐标作为参数命令:x=np.linspace(0,10,100)#0到10等距离的100个点y=np.sin(x)plt.plot(x,y,color='#FF0000')#使用红色画线plt.show()3.3.3绘制垂直柱状图x表示柱子的横坐标;height表示柱子的高度;width表示柱子的宽度;bottom表示y轴的起始值;align表示柱子与x轴坐标的对齐方式。importmatplotlib.pyplotasplt#导入matplotlib库#绘制垂直柱状图plt.bar(x,height,width=0.8,bottom=None,align='center',**kwargs)命令:x_date=[5,7,4,6,8]y_date=[10,15,12,16,14]#x表示起始位置plt.bar(x=x_date,height=y_date,width=0.8,color='black’)plt.show()3.3.4绘制水平柱状图

y表示柱子在y轴上的坐标;width表示柱子的宽度,即水平长度;height表示柱子的高度,与垂直柱状图中的宽度相对应;left表示每个柱子在x方向的起始坐标;align表示柱子同y轴坐标的对齐方式。importmatplotlib.pyplotasplt#导入pandas库

#绘制水平柱状图plt.barh(y,width,height=0.8,left=None,align='center',**kwargs)x_date=[5,7,4,6,8]y_date=[10,15,12,16,14]#x表示起始位置plt.barh(y=x_date,width=y_date,height=0.8,color='grey’)plt.show()3.3.4绘制饼图

explode表示每个部分距离两边区域的距离,单位为圆半径的长度;labels表示每个区域对应的字符串序列;colors表示每个区域对应的颜色;autopct表示每个区域对应的数值,可以是格式化的形式(如"%3.2f%%",后两个百分号会转义成一个百分号)或者可以调用函数;pctdistance表示每个区域中的文字距离圆心的距离,单位为圆半径;shadow:是bool类型,表示是否添加阴影;labeldistane表示图例距离圆心的距离,单位为半径长度;startangle表示饼图的起点从x轴逆时针旋转的角度;radius表示饼图半径长度。importmatplotlib.pyplotasplt#导入pandas库plt.pie(x,explode=None,labels=None,colors=None,autopct=None,pctdistance=0.6,shadow=False,labeldistance=1.1,startangle=0,radius=1,counterclock=True,wedgeprops=None,textprops=None,center=0,0,frame=False,rotatelabels=False,*,normalize=None,data=None)#绘制饼图languages=['JavaScript','HTML/CSS','SQL','Python','Java’]popularity=[59219,55466,47544,36443,35917]plt.pie(popularity,labels=languages)plt.show()3.3.6绘制散点图x,y表示数据点的位置;s表示点的大小;c表示点的颜色;marker表示点的形状。importmatplotlib.pyplotasplt#导入pandas库#绘制散点图plt.scatter(x,y,s=None,c=None,marker=None,**kwargs)为更加清晰表示图表的内容,可以使用以下函数添加横纵坐标标签等:

matplotlib.pyplot.xlabel(xlabel,fontdict=None,labelpad=None,*,loc=None,**kwargs)#为图表添加横坐标标签matplotlib.pyplot.ylabel(ylabel,fontdict=None,labelpad=None,*,loc=None,**kwargs)#为图表添加纵坐标标签matplotlib.pyplot.title(label,fontdict=None,loc='center',pad=None,**kwargs)#为图表添加标题Part4实训严谨勤俭求实开拓4实训假设你是一位学校的数据分析师,你收到了一个包含学生姓名、数学成绩、英语成绩和科学成绩的Python字典。你的任务是利用Python中的pandas和Matplotlib库,完成以下分析和可视化任务:1.步骤一:创建一个包含学生成绩数据的pandasDataFrame,数据如下所示:2.步骤二:使用pandas对学生数据进行基本的统计分析,包括每门课程的平均成绩、最高成绩和最低成绩。3.步骤三:使用Matplotlib创建以下两个图表:

(1)一个条形图,显示每位学生的总成绩(数学成绩+英语成绩+科学成绩)。(2)一个折线图,显示每门课程的平均成绩随时间的变化趋势。Deepseek指令1:Deepseek指令2:Deepseek指令3:4实训结果:代码:4实训THANKSFORYOURLISTENING本章结束感谢聆听第4章

商务数据分析方法与指标SOUTHWESTERNUNIVERSITYOFFINANCEANDECONOMICS严谨勤俭求实开拓01商务数据常用的数据分析方法02商务数据常用的数据分析指标03实训提起农夫山泉,你会想到什么?案例引入农夫山泉为何成功?1.针对顾客需求:农夫山泉针对年轻人群体推出了色彩缤纷、口感丰富的果味饮料,如茶π系列,凭借其时尚的包装和独特的口味迅速走红;针对健康意识较强的群体,开发出低糖、零卡路里的产品,满足了他们对健康饮品的追求。2.供应链优化:分析销售数据和天气预报,农夫山泉能提前预测不同季节和天气状况下的产品销量,根据数据结果调整生产计划,避免了以往的产品积压或断货现象。当预测到即将到来的高温天气时,会提前加大生产力度,确保充足的库存供应;而当某一区域的销售数据呈现下滑趋势,会灵活调整运输和库存,避免产品积压。案例引入Part1商务数据常用的数据分析方法严谨勤俭求实开拓4.1商务数据常用的数据分析方法描述性分析探索性分析预测性分析优化性分析1.描述性分析:平均值、中位数和众数;标准差、方差等。2.探索性分析:(1)数据可视化:通过图表、图像等形式展示数据,帮助发现数据中的模式和关系。(2)关联规则挖掘:利用关联规则挖掘算法发现数据之间的有趣关系,如购买商品之间的相关性。4.1商务数据常用的数据分析方法3.预测性分析:常用的预测模型包含回归分析、分类算法等。回归分析旨在依据其他变量的数值来预测某个连续型变量的取值,例如预测未来的销售额等。而分类算法则是通过利用历史数据对分类模型进行训练,以预测对象所属的类别,如判断用户是否会购买某商品等。二者的计算步骤如下:(1)数据准备(2)数据清洗:处理缺失值、异常值和重复数据;(3)数据转换:对预测变量进行必要的特征工程,如缩放、编码等;(4)模型选择:选择适合的回归模型,如线性回归、逻辑回归等;(5)训练模型:使用训练数据集训练回归模型;(6)模型评估:使用测试数据集评估模型的性能。回归分析常用均方误差、R方值等来衡量,而分类算法准确率、混淆矩阵等来衡量;(7)模型应用:将训练好的模型应用于实际数据,进行预测。4.1商务数据常用的数据分析方法4.优化性分析:(1)库存优化:通过数学模型和算法优化库存管理,确保库存充足且不积压,以减少缺货风险并提高用户满意度。(2)定价策略优化:分析历史销售数据和市场趋势,制定有效的定价策略,提高销售额和利润率。(3)物流路径优化:通过算法优化物流配送路径,降低运输成本并提高配送效率,有助于提升用户满意度并降低退货率。4.1商务数据常用的数据分析方法Part2商务数据常用的数据分析指标严谨勤俭求实开拓页面或产品的用户活跃程度流量指标习惯与偏好用户行为指标销售效果转化指标数字广告投放中的指标和直播中的在线实时指标。其他关键指标4.2商务数据常用的数据分析指标01流量指标页面访问量指在一定时间范围内,用户访问网络页面的总次数,包括每次用户打开或刷新页面。(例:广告点击量)独立访客数(UniqueVisitor,简称UV)特定时间段内访问网络页面的独立用户数量。(例:每日新访客)直观反映网络页面受关注的程度,洞察用户对平台的兴趣程度和粘性。反映用户的数量和活跃度。更精确了解用户的来源、访问频率以及用户群体的特点。01流量指标浏览量(PageViews,简称PV)用户浏览的页面总数(例:用户浏览5个商品页→PV=5)用户互动率:用户互动行为(包含点赞、评论和分享等)的发生次数与总观看次数之间的比例关系,包括点赞数、评论数、分享数和收藏数等。互动率=(点赞+评论+分享)/观看次数×100%直接反映出用户对网页内容的兴趣和关注度。可以深入了解用户的浏览习惯和兴趣点,从而优化商品陈列和推广策略衡量用户与社交平台内容互动程度,用户对内容投入度与兴趣度。直接反映了内容的吸引力和用户的活跃程度,这一指标的核心在于量化用户对社交媒体内容的响应和参与度。01流量指标如果小红书上博主的某篇笔记的点赞数和评论数较高,说明该内容受到用户的欢迎,博主会分析该内容的主题、形式、关键词等因素,以便在后续的创作中继续采用类似的策略;如果某篇笔记的参与度较低,博主会尝试调整内容主题、优化标题和配图,以提高用户的参与度。

02转化指标衡量平台将流量转化为实际销售效果能力,评估平台销售能力和用户满意度。通过深入分析转化指标,运营方可以更好地了解用户需求,优化销售策略,提升用户满意度,从而实现持续的增长和发展。行业

按展示付费(千次/元)按点击付费(元)平均按点击付费(元)服装配饰3~250.1~0.70.25教育培训3~270.2~20.653C数码3~250.1~0.70.23日用百货3~280.1~0.70.26母婴育儿3~280.1~0.70.2402转化指标321指用户在访问网页后,从普通用户转化为注册、购买等其他用户类型的比率(转化率=(成交用户数/访客数)×100%)。转化率在一定时间内用户在商务平台下单购买商品或服务的数量订单数平均订单金额=总销售额/订单数平均订单金额高转化率意味着该活动或内容能够有效地吸引并留住用户,将流量转化为实际的销售,实现业务增长和盈利。反映用户的购买活跃度和对平台的信任度。稳定的订单数增长意味着用户对平台有持续的购买意愿和信任。反映了每个订单的平均消费额度和用户的消费水平和消费习惯,提高平均订单金额意味着增加销售额和利润。02转化指标在“618”大促期间,京东平台推出了各种促销活动,如满减、折扣、限时抢购等。如果某款商品在活动期间的访问量和浏览量大幅增加,但转化率却没有明显提升,可能说明商品详情页或促销策略需要优化。

03用户行为指标用户行为指标是衡量用户在平台上的行为特点和习惯的关键指标。通过深入分析用户需求可以更好地被发掘,从而优化用户体验,提升用户满意度和忠诚度。用户行为指标主要包括用户停留时间、用户点击率、用户复购率、活跃用户数和用户停留时间等03用户行为指标购买率用户从点击商品到实际完成购买行为的转化率。直接关联着商品的销售额和商家的利润。高购买率意味着商品的质量、性价比、用户评价等因素都符合用户的预期。用户停留时间用户在平台或特定内容上平均停留的时间长度,即从用户进入平台到离开平台的时间差。反映内容吸引力、用户对平台的关注度和粘性,直接关联到用户对平台的满意度和忠诚度、平台的流量和转化率。点击率用户在浏览页面时点击链接、按钮或其他交互元素的比例。反映用户对页面内容的兴趣和参与度,衡量页面内容质量和用户体验。03用户行为指标退货率及退货满意度用户购买商品后退回的比例,退货满意度通过用户对退货处理过程和结果的评价了解。低退货率:商品的质量可靠高退货满意度:商家售后服务好影响用户的复购率和商家的口碑活跃用户数日活跃用户数(DAU)指每日登录或使用平台功能的独立用户个体数量,月活跃用户数(MAU)则是每月达成此行为的独立用户个体数量。体现平台的用户活跃程度。高活跃用户数:平台拥有庞大且活跃的用户基础,侧面证明平台内容、服务等契合用户需求,用户参与度高。复购率在一定时间内,用户在重复购买该商品或服务的比例。反映用户对商家或平台的信任度和忠诚度,会员复购率比普通用户高30%。04商务活动效果评估指标广告投入回报率(ROI)活动参与度与满意度ROI=收益/投入成本,反映广告投放经济效益和回报率高ROI:广告投入成本得到良好的回报,广告投放策略有效。优化广告内容和投放方式可以提高ROI,实现更高的广告效益。用户参与营销活动的程度以及对活动的满意度评价,反映营销活动的吸引力和用户反馈。较高参与度和满意度:活动设计合理、奖励机制吸引人,能够激发用户的兴趣和参与度。积极参与和正面反馈可以推动活动传播和效果。05供应链与物流指标010203库存周转率在一定时间内库存商品的周转次数,即库存商品从入库到销售出库的循环速度,反映了库存管理的效率和经济性。物流时效与满意度用户对物流配送的时效性和服务质量的评价,反映平台的物流配送能力和服务质量,评估用户体验和忠诚度。高效且准时的物流配送系统:满足用户的购物需求;提升用户对商家或平台的信任感和满意度。订单处理时间用户下单到完成订单处理所需的时间,(生鲜电商要求<2小时)包括订单确认、拣货、包

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论