Python商务数据分析与应用(AIGC版 微课版)课件全套 第1-10章:Python基础知识、Python基础模块、Python常用库 -短视频营销数据分析_第1页
Python商务数据分析与应用(AIGC版 微课版)课件全套 第1-10章:Python基础知识、Python基础模块、Python常用库 -短视频营销数据分析_第2页
Python商务数据分析与应用(AIGC版 微课版)课件全套 第1-10章:Python基础知识、Python基础模块、Python常用库 -短视频营销数据分析_第3页
Python商务数据分析与应用(AIGC版 微课版)课件全套 第1-10章:Python基础知识、Python基础模块、Python常用库 -短视频营销数据分析_第4页
Python商务数据分析与应用(AIGC版 微课版)课件全套 第1-10章:Python基础知识、Python基础模块、Python常用库 -短视频营销数据分析_第5页
已阅读5页,还剩384页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第1章

Python基础知识SOUTHWESTERNUNIVERSITYOFFINANCEANDECONOMICS严谨勤俭求实开拓01Python概述02Python中的数据结构03控制流语句04函数05实训Part1Python概述严谨勤俭求实开拓01Python概述Python是一种高级编程语言特点简洁性:语法类似于英语,易于理解和编写可读性:可读性高,有助于团队协作和后期维护可扩展性:可嵌入其他语言编写的程序中,易于扩展开源:拥有活跃的社区支持,不断有新的库和框架推出跨平台:Python程序可以在多种操作系统上运行丰富的库:Python标准库提供了便捷的访问文件系统、系统调用、sockets等低级网络交互接口Python以语法清晰和代码可读性高而闻名,其强大的数据处理能力、简洁的语法和丰富的库支持,使其成为了企业人员进行数据分析的重要工具Python学习Python+AIGC:智能编程助手DeepSeek-Coder深度融合了AIGC技术,能够通过自然语言交互快速生成高质量的Python代码。Part2Python中的数据结构严谨勤俭求实开拓00Python中的数据结构基础数据类型组合数据类型可迭代对象序列映射无序01列表定义:一个容器数据结构,用于存储一组有序、可变的元素,具有可变性(可增删改元素)、索引和切片等特性列表没有长度限制,元素类型可以不同列表的长度和内容是可变的,可自由对列表中数据项进行增加、删除或替换列表属于序列类型,支持成员关系操作符(in)、长度计算函数(len())、分片([])列表可以同时使用正向递增序号和反向递减序号,可以采用标准的比较操作符(<、<=、==、!=、>=、>)进行比较[‘a’,‘b’,‘c’,d][]用于标记列表的起始‘’用于定义字符串,包裹字符串内容元素:列表中的单个成员,每个元素占据列表中的一个位置每个元素用逗号隔开元素可以是任意数据类型(如整数、字符串、列表、字典等)01列表列表相关的常用方法ls=[0,1,2,3,4,5,6,7,8,9]dells[2:8:3]print(ls)#输出[0,1,3,4,6,7,8,9]ls=[1,2,3]lt=[4,5]ls+=ltprint(ls)#输出[1,2,3,4,5]ls=[1,2,3,4,5]ls.reverse()#直接修改原列表print(ls)#输出[5,4,3,2,1]ls=[1,2,3]new_ls=ls.copy()#创建浅拷贝ls=[10,20,30,20,40]print(ls.index(20))#输出:1

(返回第一个匹配项的索引)01列表创建#用list函数,参数可以是字符串、元组、字典或者集合。但不能是整数、浮点数或者布尔值list(‘招商银行’)→['招','商','银','行']列表基本操作元素修改stock_info=[‘600000',‘浦发银行',11.52,11.54,11.61,11.4]stock_info[4]=12.00stock_info元素删除stock_info=[‘600000',‘浦发银行',11.52,11.54,11.61,11.4]delstock_info[1]stock_info分片赋值stock_info=[‘600000',‘浦发银行',0,0,0,0]stock_info[2:]=[11.52,11.54,11.61,11.4]stock_info列表常用函数extend函数-次在列表的末端插入多个元素stock_info=[‘600000',‘浦发银行']stock_price=[11.52,11.54,11.61,11.4]stock_info.extend(stock_price)stock_info=[‘600000',‘浦发银行',11.52,11.54,11.61,11.4]Append函数-直接把参数(任何类型)添加到尾部stock_info.append(stock_price)stock_info=[‘600000',‘浦发银行',[11.52,11.54,11.61,11.4]]pop函数-移除并返回指定列表中某个位置的元素my_list=[10,20,30,40,50]last_element=my_list.pop()print("Poppedelement:",last_element)#输出:Poppedelement:50print("Listafterpop:",my_list)#输出:Listafterpop:[10,20,30,40]specific_element=my_list.pop(1)print("Poppedelementatindex1:",specific_element)#输出:Poppedelementatindex1:20print("Listafterpoppingelementatindex1:",my_list)#输出:Listafterpoppingelementatindex1:[10,30,40]sort方法-排序(默认升序)02元组定义:是一个不可变的序列,意味着一旦创建,其内容不能被修改元组的元素可以是不同类型

的数据,如整数、字符串、对象等特点:由于具有不可变性,元组常用于维持数据的固定顺序,如函数可以安全地返回多个值而不用担心调用者会修改这些值。在列表操作中,除了对列表进行原地修改的函数,其他函数都可以应用在元组中,但与列表不同的是,在元组中使用这些函数,会返回新的元组。03字典定义:字典是Python中唯一内置的、核心的映射类型。字典通过特定的键(key),查找对应

的值(value)。键和值之间是一一对应的映射关系。特点:无序的;可变的;字典的键必须是不可变类型;字典的键不能重复;通过键来获取值。{'name':'John','age':30,'city':'NewYork'}用花括号创建:my_dict={'name':'John','age':30,'city':'NewYork'};用dict函数创建another_dict=dict(name="Alice",age=25,city="Boston")键值,键和值间用:隔开元素#访问字典print(my_dict['age'])#输出30

#修改字典my_dict['age']=28my_dict['profession']='Developer'可以进行迭代

forkeyinmy_dict:print(key)forvalueinmy_dict.values():print(value)forkey,valueinmy_dict.items():print(key,value)值可以是任意类型,可嵌套列表、元组或者字典03字典类似etdefault(),若值不存在,会被添加进字典字典常用函数04集合定义:集合类型与数学中的概念是一致的。它是由0个或多个唯一的、不可变的元素构成的无序组合。特点:集合也是通过一对花括号“{}”来标识的。集合支持添加和删除元素,同时也支持集合间的运算,如并集、交集、差集{1,2,3,4,5}#使用花括号创建集合my_set={1,2,3,4,5}#使用set函数创建集合,空集合必须使用set()创建another_set=set([2,4,6,8])#添加元素my_set.add(6)#移除元素

my_set.remove(2)my_set.discard(10)#如果元素不存在,不会抛出错误04集合集合常用函数Part3控制流语句严谨勤俭求实开拓03控制流语句条件判断(if-elif-else)循环(for和while)循环控制语句

(break和continue)条件判断语句允许根据一个条件的真假来决定执行哪个代码块

循环用于重复执行一段代码,直到满足特定条件break用于完全结束环;

continue用于结束当前迭代,并跳转到循环的下一次迭代在Python中,控制流语句是用来决定代码执行顺序的重要工具。控制流语句使得程序可以根据不同的条件执行不同的代码块,或者多次执行某个任务。主要的控制流语句包括条件判断(if-elif-else)、循环(for和while)以及循环控制语句(break和continue)。e.g.while循环e.g.breakPart4函数严谨勤俭求实开拓04函数定义语句运行后会新建一个名为repeator的变量名,其类型为function,即函数。参数的传递过程,实际上是一个赋值的过程。在调用函数时,调用者的实际参数自动赋值给函数的形式参数变量参数参数不可变和可变类型参数:不可变类型包括:整型、浮点型、字符串和元组等。可变类型有:列表、字典和集合等。位置参数:是调用函数为形参赋值的一种默认方式。实参与形参按照从左到右的位置顺序依次赋值关键字参数:为了避免位置参数赋值带来的混乱,Python允许调用函数时通过关键字参数的形式指定形参与实参的对应关系。

调用者使用name=value的形式来指定函数中的哪个形参接受某个值指定默认参数值指定默认参数值:在函数定义时,可以为参数指定值。这样当函数调用者没有提供对应参数值时,就可以使用指定的默认值任意数量参数:Python允许在定义函数时使用单星号*来收集位置参数,双星号**收集关键字参数。04函数变量作用域:Python中规定每个变量都有它的作用域,即变量只有在作用域范围内才是可见可用的全局变量和局部变量:全局变量是在所有函数之外创建的变量,在整个文件范围内都是可见的,局部变量仅仅在局部作用域内可用,在局部作用域之外,该变量是不可见的,函数执行结束后,局部变量被销毁。局部变量和全局变量同名的情况下,在局部作用域内,可见的是局部变量,全局变量被暂时隐藏起来关键字global语句通常放在函数体的开始部分,用于申明变量为全局变量局部变量04函数匿名函数:利用lambda函数来替代def,创建一个临时简单函数。与def语句不同,lambda是一个表达式。这就使得lambda能够出现在函数调用的参数中。而def语句则不能作为参数传递给函数用def创建函数返回参数x的第二个元素用lambda创建函数输出

浦发银行04函数异常处理:.try/except/else语句和try/finally语句尝试读取若读取失败,捕获异常并返回空字符串无论是否发生异常,最终关闭文件句柄Part5实训严谨勤俭求实开拓05实训请使用本章介绍的知识,按以下步骤编写相应代码并进行基本分析步骤一:生成并操作数据05实训请使用本章介绍的知识按以下步骤编写相应代码并进行基本分析步骤二:数据分类和统计05实训请使用本章介绍的知识按以下步骤编写相应代码并进行基本分析步骤三:数据存储和检索05实训请使用本章介绍的知识按以下步骤编写相应代码并进行基本分析步骤三:数据存储和检索THANKSFORYOURLISTENING本章结束感谢聆听第2章

Python基础模块SOUTHWESTERNUNIVERSITYOFFINANCEANDECONOMICS严谨勤俭求实开拓01math模块02random模块03time和datetime模块04re模块05实训Part1math模块严谨勤俭求实开拓00模块简介定义模块将一些函数、变量和类等定义保存在一个文件中,它是一种组织和重用代码的方式,可以将相关的代码逻辑组织在一个文件中,并通过使用import关键字导入模块的方式在其他程序中使用。模块使得代码的管理和维护更加方便,同时也促进了代码的重用和可扩展性。通过将相关功能封装在模块中,可以将复杂的程序分解为更小、更易于理解和维护的部分。这有助于提高代码的可读性和可维护性,并且可以在不同的项目中共享和重复使用代码。Python提供了许多内置模块,如math、random、data、time、re、sys和os等JUNE12th优势01math模块math模块提供了基础的计算功能数学常量算术函数导入模块01math模块常见的三角函数幂函数和对数函数Part2random模块严谨勤俭求实开拓02random模块定义:random模块主要用于生成满足各种分布的伪随机数,如随机整数、浮点数、选择随机项以及随机化序列等。其包含两类函数,分别为基本随机函数,如random()、seed();以及扩展随机函数,如randrange()、randint()、uniform()、choice()shuffle()等种子数一般是一个整数,作为伪随机数生成算法的初始输入。相同的种子会生成完全相同的随机数序列根据种子数a初始化随机数生成器生成一个[0.0,1.0)之间的随机浮点数基本随机函数:random()和seed()02random模块扩展随机函数生成指定范围内特定步长的随机整数候选数为1,3,5生成指定范围内的随机整数生成指定范围内的随机浮点数生成非空序列中的随机元素生成指定序列元素的随机排列以beta分布的概率分布返回0到1之间的随机数(Beta分布是一种定义在区间[0,1][0,1]上的连续概率分布,常用于描述某个事件成功概率的不确定性)Part3time和datetime模块严谨勤俭求实开拓03time和datetime模块time模块和datetime模块都可用于处理时间和日期time模块用于获取当前时间,以及执行与时间相关的操作,如暂停执行、获取时间戳等datetime模块则提供了日期和时间的日期对象,可以进行日期和时间的算术运算time模块使用范例按指定的秒数使程序休眠若干时间03time和datetime模块time模块使用范例03time和datetime模块datetime模块区别:本地当前日期和时间(无时区信息),相当于等同于datetime.now()(不带时区)datetime.now()当前日期和时间(可指定时区)根据指定的时间戳创建datetime对象不同日期或时间之间的差值返回日期时间对象所对应的时间元组Part4re模块严谨勤俭求实开拓04re模块定义:用于处理字符串的函数能够通过定义一串特殊规则匹配符合的字符,可以用来搜索、替换、分割和匹配字符串特殊字符04re模块常用函数04re模块常用函数Part5实训严谨勤俭求实开拓05实训请使用本章介绍的基础模块知识按以下步骤编写相应代码生成模拟实验数据,并进行基本分析。步骤一:生成实验数据05实训请使用本章介绍的基础模块知识按以下步骤编写相应代码生成模拟实验数据,并进行基本分析。步骤二:数据的正则表达式匹配05实训请使用本章介绍的基础模块知识按以下步骤编写相应代码生成模拟实验数据,并进行基本分析。步骤三:数据的异常检测THANKSFORYOURLISTENING本章结束感谢聆听第3章

Python常用库SOUTHWESTERNUNIVERSITYOFFINANCEANDECONOMICS严谨勤俭求实开拓01科学技术库NumPy02数据处理库pandas03数据可视化库Matplotlib04实训学习目标掌握Numpy多维数组的创建和操作技巧,能够进行数据处理和计算掌握如何使用Series和DataFrame处理和分析数据掌握各种类型的数据可视化图表,有效地展示和传达数据分析的结果引入案例苹果作为全球知名的电子品牌产品,产品覆盖范围广,使用Python数据分析能够为苹果带来很高的经济效益。在市场分析和趋势预测方面:对销量数据进行时间序列分析,识别销售高峰期。基于市场趋势,可以预测未来产品的需求量和市场动态,从而调整生产计划和供应链管理,确保产品供应与市场需求相匹配。在用户行为分析和市场定位方面:使用Python分析用户数据(如购买行为、偏好和用户反馈),可以帮助苹果公司更好地理解不同用户群体的需求和偏好。在产品质量和性能分析方面:借助Python的数据分析工具,可以收集和分析Mac电脑的性能测试数据,通过可视化技术识别产品中性能表现不佳的区域。同时统计不同型号产品的故障率,分析其与生产批次、材料选择等因素的关系,利用scipy进行假设检验,确定故障原因。通过对各个阶段进行跟踪和分析,能够及时调整设计或生产流程。思考:各个品牌通过短视频、直播等方式营销带货,企业获得运营及销售信息后应如何分析,哪些数据对于企业提升效益来说最为重要?主要内容3.1NumPyNumPy是Python中用于科学计算的基础包,提供了强大的多维数组对象和用于处理这些数组的函数3.2pandaspandas是Python中用于数据分析和处理的重要库,它提供了灵活而高效的数据结构和数据操作工具,使得数据的清洗、转换和分析变得更加简单和直观。3.3MatplotlibMatplotlib是Python中最流行的数据可视化库之一,它能够创建各种类型的静态、交互式和动态图形,帮助用户以直观、美观的方式呈现数据。Part1科学技术库NumPy严谨勤俭求实开拓3.1科学技术库(NumPy) NumPy是Python的一个开源数值计算库,也是Python数值计算最重要的基础包,主要用于数组计算,矩阵运算等。NumPy是在一个连续的内存块中存储数据,独立于其他Python内置对象。比起Python的内置序列,NumPy数组使用的内存更少,可以在整个数组上执行复杂的计算,而不需要Python的for循环。在数据可视化中,NumPy库非常方便地与其他数据可视化工具(如Matplotlib)结合使用,帮助用户快速高效地进行数据处理和可视化。3.1.1创建数据组例(1)使用array函数,该函数可以接受传入数据,然后将其转化为Numpy数组(2)array()可以将一组等长数组转换为n维列表

(3)Numpy提供创建特殊形式组数的函数Numpy特点:n维数组对象(ndaarry),Numpy提供了丰富的数组处理函数,可以用来创建、操作多维数组,进行数据处理和数学运算等,在处理大量、复杂的数据时这些函数乐意方便地用于数据处理和可视化3.1.2数学运算NumPy库提供了多种数学函数,可以方便地对数据进行数学运算,这些运算函数可以用于对数据进行处理,进而用于数据可视化。(1)Numpy中大小相等的数据之间的算术运算会应用到元素级(2)Numpy库中常用的运算函数①add()函数用于逐元素求和

②power()函数对数组逐元素进行幂运算③round()函数对每个元素四舍五入到最接近的整数3.1.2数学运算Numpy中其他常用的数学运算函数及功能3.1.3数据过滤和处理NumPy提供了多种函数用于数据的过滤和处理,如where()函数可以用来选取符合条件的数据,resize()函数可以用来改变数组的大小等。这些函数能够帮助用户对数据进行进一步处理,以便更好地展示数据。当需要根据条件从数组中选择特定的元素时,可以使用NumPy提供的数据过滤函数。例:①使用np.where()函数根据条件选择元素、提取元素②当需要对数组进行数据过滤时,NumPy提供了一些强大的函数,如使用np.nonzero()函数找出数组中非零元素的索引。③使用np.isin()函数检查数组中的元素是否包含在另一个数组中。3.1.3数据过滤和处理Numpy中还包括其他用于数据处理的函数3.1.4数据统计Numpy还提供了统计函数,可以用来计算数据的统计特性。这些函数可以帮助用户对数据进行统计分析,找出数据的中心趋势、离散程度、最大最小值等信息,从而更好地理解数据,为数据可视化提供支持。例:使用np.mean()函数计算数组的平均值

总的来说,numpy库在数据可视化中提供了丰富的功能和工具,可以帮助用户更轻松地处理和展示数据。同时,Numpy库的高效性和灵活性也使其成为数据处理和可视化领域中的重要工具之一。3.1.4数据统计Numpy中其他常用的数据处理函数Part2数据处理库pandas严谨勤俭求实开拓3.2数据处理库(pandas)pandas是Python中用于数据处理和分析的强大库,它提供了灵活而高效的数据结构和数据操作工具,使得数据的清洗、转换和分析变得更加简单和直观。pandas的核心数据结构包括Series(一维数组)和DataFrame(二维表格),这两种数据结构能够轻松处理不同类型的数据,并且支持各种数据操作和分析,例如索引、切片、合并、分组、聚合等。除了数据结构之外,pandas还提供了丰富的功能和方法,包括数据读取、数据清洗等。借助于这些功能,用户可以方便地进行数据预处理、数据探索性分析和建模分析,为实际业务问题提供可靠的数据支持。总之,pandas是Python数据科学领域中不可或缺的重要工具,它为用户提供了丰富的数据处理和分析功能,使得复杂的数据操作变得简单易行。3.2数据处理库(pandas)在使用pandas库时,首先要安装pandas库,可以使用以下命令进行安装:Pipinstallpandas安装完成后通过以下命令将pandas库导入Importpandasaspd将pandas库导入后可以进行读取文件的操作,从而获取数据进行分析。

3.2.1pandas的数据结构1.SeriesSeries是一种类似于一维数组的对象,它由一组数据(各种NumPy数据类型)以及⼀组与之相关的数据标签(即索引)组成。由一组数据产生最简单的Series:Obj=pd.Series([1,2,3,4,5])2.DataFrameDataFrame是pandas库提供的一种核心数据结构,是一种二维表格型的数据结构,别适合处理结构化数据。它含有⼀组有序的列,每列可以是不同的值类型(数值、字符串、布尔值等)。DataFrame既有⾏索引也有列索引,其中的数据是以⼀个或多个⼆维块存放的。创建DataFrame最常⽤的⼀种方式是直接传入⼀个由等长列表或Numpy数组组成的字典3.2.2数据读取1、读取excel文件(1)语法(2)参数说明

importpandasaspd#导入pandas库data=pd.read_excel(io,sheet_name=None,header=None,name=none,index_col=None,usecols=None,skiprows=None,nrows=None)#读取excel文件 io:读取的excel文件名,如r'./vote.excel"; sheet_name:excel文件中的sheet表名;

header:哪一行设置为列索引,默认是第一行,即header=0;

names:列索引名;

index_col:使用哪一列作为行索引,默认从0开始;

usecols:读取表格中哪几列,必须是位置索引; skiprows:跳过前几行读取文件,默认从0开始;nrows:读取多少行数据。3.2.2数据读取2、读取csv文件(1)语法(2)参数说明csv文件是以逗号为分隔符的文件,读取参数与excel基本类似。文件为gbk格式csv,若不设置encoding参数程序会报错。encoding:默认为'utf-8',还有中文编码‘gbk’、‘gb18030’、‘gb2312’。就汉字而言,三种编码方式的表示范围是:GB18030>GBK>GB2312即GBK是GB2312的超集,GB1803又是GBK的超集。一般读取中文文本可以直接用encoding=GB18030。data=pd.read_cvs(filepath_or_buffer:FilePathOrBuffer,encording=none)3.2.2数据读取3、读取txt文件(1)语法(2)参数说明#读取txt文件data=pd.read_table(filepath_or_buffer:FilePathOrBuffer,sep="\t")txt文件是以指制表符\t为分隔符的文件,参数与excel、csv基本类似,不同的地方在于必须要指定sep。sep:默认为'\t'。Part3数据可视化库Matplotlib严谨勤俭求实开拓3.3数据可视化库(Matplotlib)Matplotlib模块是一个用于创建图表和数据可视化的功能强大且灵活的工具。它可以用来绘制各种类型的图表,包括折线图、散点图、柱状图、饼图等。在数据分析和数据可视化领域,Matplotlib模块经常被用来探索数据、展示数据分布、比较不同数据集之间的关系以及展示趋势。通过Matplotlib模块,用户能够完全控制图表的外观和格式,包括图表的大小、颜色、线型、标签等。此外,Matplotlib还具有丰富的功能,例如添加图例、注释、网格线等,以帮助用户更清晰地呈现数据。在数据可视化中,Matplotlib通常与pandas、Numpy等数据处理模块一起使用。用户可以通过这些模块加载数据,然后使用Matplotlib创建各种图表来展示数据。3.3.1认识Matplotlib在任何绘图之前,需要创建一个Figure对象才能开始绘图:pltfig=plt.figure()#创建figure对象在拥有Figure对象之后,必须创建subplot才可以进行绘图:其中,nrows和ncols分别表示子图的行数和列数,index表示在这个网格中子图的索引(从1开始计数),**kwargs表示可选参数,例如调整子图的位置和间距等。常见的属性包括标题(title)、坐标轴标签(xlabel和ylabel)、坐标轴范围(xlim和ylim)等。通过调用这个函数,可以方便地对子图的各种属性进行设置。

fig.add_subplot(nrows,ncols,index,**kwargs)

importmatplotlib.pyplotasplt

#导入matplotlib库,为通常情况下的引入方式:3.3.2绘制线图(Matplotlib)Matplotlib中最常用的函数是plot()函数,用来绘制线图。在绘制图表时,plot()函数可以接受x和y坐标数组作为参数,将这些数据点连接起来,并根据需要添加不同的标记、线条颜色和样式。importmatplotlib.pyplotasplt#导入matplotlib库plt.plot(x,y,**kwargs)#接受xy坐标作为参数命令:x=np.linspace(0,10,100)#0到10等距离的100个点y=np.sin(x)plt.plot(x,y,color='#FF0000')#使用红色画线plt.show()3.3.3绘制垂直柱状图x表示柱子的横坐标;height表示柱子的高度;width表示柱子的宽度;bottom表示y轴的起始值;align表示柱子与x轴坐标的对齐方式。importmatplotlib.pyplotasplt#导入matplotlib库#绘制垂直柱状图plt.bar(x,height,width=0.8,bottom=None,align='center',**kwargs)命令:x_date=[5,7,4,6,8]y_date=[10,15,12,16,14]#x表示起始位置plt.bar(x=x_date,height=y_date,width=0.8,color='black’)plt.show()3.3.4绘制水平柱状图

y表示柱子在y轴上的坐标;width表示柱子的宽度,即水平长度;height表示柱子的高度,与垂直柱状图中的宽度相对应;left表示每个柱子在x方向的起始坐标;align表示柱子同y轴坐标的对齐方式。importmatplotlib.pyplotasplt#导入pandas库

#绘制水平柱状图plt.barh(y,width,height=0.8,left=None,align='center',**kwargs)x_date=[5,7,4,6,8]y_date=[10,15,12,16,14]#x表示起始位置plt.barh(y=x_date,width=y_date,height=0.8,color='grey’)plt.show()3.3.4绘制饼图

explode表示每个部分距离两边区域的距离,单位为圆半径的长度;labels表示每个区域对应的字符串序列;colors表示每个区域对应的颜色;autopct表示每个区域对应的数值,可以是格式化的形式(如"%3.2f%%",后两个百分号会转义成一个百分号)或者可以调用函数;pctdistance表示每个区域中的文字距离圆心的距离,单位为圆半径;shadow:是bool类型,表示是否添加阴影;labeldistane表示图例距离圆心的距离,单位为半径长度;startangle表示饼图的起点从x轴逆时针旋转的角度;radius表示饼图半径长度。importmatplotlib.pyplotasplt#导入pandas库plt.pie(x,explode=None,labels=None,colors=None,autopct=None,pctdistance=0.6,shadow=False,labeldistance=1.1,startangle=0,radius=1,counterclock=True,wedgeprops=None,textprops=None,center=0,0,frame=False,rotatelabels=False,*,normalize=None,data=None)#绘制饼图languages=['JavaScript','HTML/CSS','SQL','Python','Java’]popularity=[59219,55466,47544,36443,35917]plt.pie(popularity,labels=languages)plt.show()3.3.6绘制散点图x,y表示数据点的位置;s表示点的大小;c表示点的颜色;marker表示点的形状。importmatplotlib.pyplotasplt#导入pandas库#绘制散点图plt.scatter(x,y,s=None,c=None,marker=None,**kwargs)为更加清晰表示图表的内容,可以使用以下函数添加横纵坐标标签等:

matplotlib.pyplot.xlabel(xlabel,fontdict=None,labelpad=None,*,loc=None,**kwargs)#为图表添加横坐标标签matplotlib.pyplot.ylabel(ylabel,fontdict=None,labelpad=None,*,loc=None,**kwargs)#为图表添加纵坐标标签matplotlib.pyplot.title(label,fontdict=None,loc='center',pad=None,**kwargs)#为图表添加标题Part4实训严谨勤俭求实开拓4实训假设你是一位学校的数据分析师,你收到了一个包含学生姓名、数学成绩、英语成绩和科学成绩的Python字典。你的任务是利用Python中的pandas和Matplotlib库,完成以下分析和可视化任务:1.步骤一:创建一个包含学生成绩数据的pandasDataFrame,数据如下所示:2.步骤二:使用pandas对学生数据进行基本的统计分析,包括每门课程的平均成绩、最高成绩和最低成绩。3.步骤三:使用Matplotlib创建以下两个图表:

(1)一个条形图,显示每位学生的总成绩(数学成绩+英语成绩+科学成绩)。(2)一个折线图,显示每门课程的平均成绩随时间的变化趋势。Deepseek指令1:Deepseek指令2:Deepseek指令3:4实训结果:代码:4实训THANKSFORYOURLISTENING本章结束感谢聆听第4章

商务数据分析方法与指标SOUTHWESTERNUNIVERSITYOFFINANCEANDECONOMICS严谨勤俭求实开拓01商务数据常用的数据分析方法02商务数据常用的数据分析指标03实训提起农夫山泉,你会想到什么?案例引入农夫山泉为何成功?1.针对顾客需求:农夫山泉针对年轻人群体推出了色彩缤纷、口感丰富的果味饮料,如茶π系列,凭借其时尚的包装和独特的口味迅速走红;针对健康意识较强的群体,开发出低糖、零卡路里的产品,满足了他们对健康饮品的追求。2.供应链优化:分析销售数据和天气预报,农夫山泉能提前预测不同季节和天气状况下的产品销量,根据数据结果调整生产计划,避免了以往的产品积压或断货现象。当预测到即将到来的高温天气时,会提前加大生产力度,确保充足的库存供应;而当某一区域的销售数据呈现下滑趋势,会灵活调整运输和库存,避免产品积压。案例引入Part1商务数据常用的数据分析方法严谨勤俭求实开拓4.1商务数据常用的数据分析方法描述性分析探索性分析预测性分析优化性分析1.描述性分析:平均值、中位数和众数;标准差、方差等。2.探索性分析:(1)数据可视化:通过图表、图像等形式展示数据,帮助发现数据中的模式和关系。(2)关联规则挖掘:利用关联规则挖掘算法发现数据之间的有趣关系,如购买商品之间的相关性。4.1商务数据常用的数据分析方法3.预测性分析:常用的预测模型包含回归分析、分类算法等。回归分析旨在依据其他变量的数值来预测某个连续型变量的取值,例如预测未来的销售额等。而分类算法则是通过利用历史数据对分类模型进行训练,以预测对象所属的类别,如判断用户是否会购买某商品等。二者的计算步骤如下:(1)数据准备(2)数据清洗:处理缺失值、异常值和重复数据;(3)数据转换:对预测变量进行必要的特征工程,如缩放、编码等;(4)模型选择:选择适合的回归模型,如线性回归、逻辑回归等;(5)训练模型:使用训练数据集训练回归模型;(6)模型评估:使用测试数据集评估模型的性能。回归分析常用均方误差、R方值等来衡量,而分类算法准确率、混淆矩阵等来衡量;(7)模型应用:将训练好的模型应用于实际数据,进行预测。4.1商务数据常用的数据分析方法4.优化性分析:(1)库存优化:通过数学模型和算法优化库存管理,确保库存充足且不积压,以减少缺货风险并提高用户满意度。(2)定价策略优化:分析历史销售数据和市场趋势,制定有效的定价策略,提高销售额和利润率。(3)物流路径优化:通过算法优化物流配送路径,降低运输成本并提高配送效率,有助于提升用户满意度并降低退货率。4.1商务数据常用的数据分析方法Part2商务数据常用的数据分析指标严谨勤俭求实开拓页面或产品的用户活跃程度流量指标习惯与偏好用户行为指标销售效果转化指标数字广告投放中的指标和直播中的在线实时指标。其他关键指标4.2商务数据常用的数据分析指标01流量指标页面访问量指在一定时间范围内,用户访问网络页面的总次数,包括每次用户打开或刷新页面。(例:广告点击量)独立访客数(UniqueVisitor,简称UV)特定时间段内访问网络页面的独立用户数量。(例:每日新访客)直观反映网络页面受关注的程度,洞察用户对平台的兴趣程度和粘性。反映用户的数量和活跃度。更精确了解用户的来源、访问频率以及用户群体的特点。01流量指标浏览量(PageViews,简称PV)用户浏览的页面总数(例:用户浏览5个商品页→PV=5)用户互动率:用户互动行为(包含点赞、评论和分享等)的发生次数与总观看次数之间的比例关系,包括点赞数、评论数、分享数和收藏数等。互动率=(点赞+评论+分享)/观看次数×100%直接反映出用户对网页内容的兴趣和关注度。可以深入了解用户的浏览习惯和兴趣点,从而优化商品陈列和推广策略衡量用户与社交平台内容互动程度,用户对内容投入度与兴趣度。直接反映了内容的吸引力和用户的活跃程度,这一指标的核心在于量化用户对社交媒体内容的响应和参与度。01流量指标如果小红书上博主的某篇笔记的点赞数和评论数较高,说明该内容受到用户的欢迎,博主会分析该内容的主题、形式、关键词等因素,以便在后续的创作中继续采用类似的策略;如果某篇笔记的参与度较低,博主会尝试调整内容主题、优化标题和配图,以提高用户的参与度。

02转化指标衡量平台将流量转化为实际销售效果能力,评估平台销售能力和用户满意度。通过深入分析转化指标,运营方可以更好地了解用户需求,优化销售策略,提升用户满意度,从而实现持续的增长和发展。行业

按展示付费(千次/元)按点击付费(元)平均按点击付费(元)服装配饰3~250.1~0.70.25教育培训3~270.2~20.653C数码3~250.1~0.70.23日用百货3~280.1~0.70.26母婴育儿3~280.1~0.70.2402转化指标321指用户在访问网页后,从普通用户转化为注册、购买等其他用户类型的比率(转化率=(成交用户数/访客数)×100%)。转化率在一定时间内用户在商务平台下单购买商品或服务的数量订单数平均订单金额=总销售额/订单数平均订单金额高转化率意味着该活动或内容能够有效地吸引并留住用户,将流量转化为实际的销售,实现业务增长和盈利。反映用户的购买活跃度和对平台的信任度。稳定的订单数增长意味着用户对平台有持续的购买意愿和信任。反映了每个订单的平均消费额度和用户的消费水平和消费习惯,提高平均订单金额意味着增加销售额和利润。02转化指标在“618”大促期间,京东平台推出了各种促销活动,如满减、折扣、限时抢购等。如果某款商品在活动期间的访问量和浏览量大幅增加,但转化率却没有明显提升,可能说明商品详情页或促销策略需要优化。

03用户行为指标用户行为指标是衡量用户在平台上的行为特点和习惯的关键指标。通过深入分析用户需求可以更好地被发掘,从而优化用户体验,提升用户满意度和忠诚度。用户行为指标主要包括用户停留时间、用户点击率、用户复购率、活跃用户数和用户停留时间等03用户行为指标购买率用户从点击商品到实际完成购买行为的转化率。直接关联着商品的销售额和商家的利润。高购买率意味着商品的质量、性价比、用户评价等因素都符合用户的预期。用户停留时间用户在平台或特定内容上平均停留的时间长度,即从用户进入平台到离开平台的时间差。反映内容吸引力、用户对平台的关注度和粘性,直接关联到用户对平台的满意度和忠诚度、平台的流量和转化率。点击率用户在浏览页面时点击链接、按钮或其他交互元素的比例。反映用户对页面内容的兴趣和参与度,衡量页面内容质量和用户体验。03用户行为指标退货率及退货满意度用户购买商品后退回的比例,退货满意度通过用户对退货处理过程和结果的评价了解。低退货率:商品的质量可靠高退货满意度:商家售后服务好影响用户的复购率和商家的口碑活跃用户数日活跃用户数(DAU)指每日登录或使用平台功能的独立用户个体数量,月活跃用户数(MAU)则是每月达成此行为的独立用户个体数量。体现平台的用户活跃程度。高活跃用户数:平台拥有庞大且活跃的用户基础,侧面证明平台内容、服务等契合用户需求,用户参与度高。复购率在一定时间内,用户在重复购买该商品或服务的比例。反映用户对商家或平台的信任度和忠诚度,会员复购率比普通用户高30%。04商务活动效果评估指标广告投入回报率(ROI)活动参与度与满意度ROI=收益/投入成本,反映广告投放经济效益和回报率高ROI:广告投入成本得到良好的回报,广告投放策略有效。优化广告内容和投放方式可以提高ROI,实现更高的广告效益。用户参与营销活动的程度以及对活动的满意度评价,反映营销活动的吸引力和用户反馈。较高参与度和满意度:活动设计合理、奖励机制吸引人,能够激发用户的兴趣和参与度。积极参与和正面反馈可以推动活动传播和效果。05供应链与物流指标010203库存周转率在一定时间内库存商品的周转次数,即库存商品从入库到销售出库的循环速度,反映了库存管理的效率和经济性。物流时效与满意度用户对物流配送的时效性和服务质量的评价,反映平台的物流配送能力和服务质量,评估用户体验和忠诚度。高效且准时的物流配送系统:满足用户的购物需求;提升用户对商家或平台的信任感和满意度。订单处理时间用户下单到完成订单处理所需的时间,(生鲜电商要求<2小时)包括订单确认、拣货、包装、发货等环节,反映平台订单处理能力和效率,直接影响用户购物体验和满意度。JUNE12th库存周转率的高低直接影响资金利用率和运营成本。较高库存周转率:库存商品能快速周转,减少资金占用和仓储成本,提高整体运营效率。05供应链与物流指标苏宁易购根据需求预测、补货周期、存储成本等因素,设定合理的库存水平,并选择经济订货量(EOQ)、安全库存策略等库存管理策略。例如,在夏季来临前,预测到空调的需求会增加,提前加大空调的采购量,确保库存充足,避免出现缺货现象;在销售淡季,适当减少库存,降低存储成本。

05供应链与物流指标顺丰速运在配送货物时,通过收集所有待配送的订单数据,规划最佳的物流配送路线。根据路线规划,合理分配配送车辆、人员等资源,并实时监控配送进度和路线情况,根据实际情况进行调整。例如,在遇到交通拥堵或其他突发情况时,及时调整配送路线,以确保货物能够按时送达。

06其他数据指标数字广告投放中的指标每成本点击(CostperClick,简称CPC)广告主为每次广告点击所支付的费用(成本每点击=广告费用/点击次数),评估广告投放的成本效益。低成本每点击:广告主能用更少费用获得更多点击量,在预算内实现更优推广效果。成本每千次曝光(CostPerMille,简称CPM)广告主每获得一千次广告展示需支付的费用。成本每千次曝光=(广告费用/广告曝光次数)×1000较低成本每千次曝光:以较低成本获取更多曝光机会,了解不同广告位、不同投放渠道的曝光成本,选择性价比高的曝光方式.06其他数据指标JUNE12th某品牌在抖音上投放广告,如果广告的CPC过高,说明获取点击的成本较高,品牌会优化广告关键词、改善广告创意或精准定位受众,以降低CPC;如果广告的转化率较低,品牌会分析用户的购买路径,优化落地页设计,以提高转化率。

06其他数据指标直播中的在线实时指标平均在线人数在直播时长内观看直播内容的人数的平均值,反映直播间持久承接和稳定流量的能力。衡量直播运营效果,帮助评估直播账号的影响力和受众群体的规模平均在线时间平均每个用户访问直播网页停留的时间长度。平均在线时间较短,说明观众对直播内容不感兴趣,可能需要进行话术或内容调整或改进。当前在线人数直播中15分钟内在线的访客数。了解直播活动的实际影响力,识别出观众参与直播的热点时段和内容,及时调整直播计划和内容策略,提高直播活动的曝光和传播效果。Part3实训严谨勤俭求实开拓

淘宝用户行为数据集`taobao.csv`,该数据集记录了用户每天的多种指标信息,包括省份、城市、店铺名称、商品名称、商品单价、付款人数、是否包邮、是否来自天猫、满减情况等。请运用上文提到的数据分析方法和指标对数据集`taobao.csv`进行研究。实训步骤一:导入必要的Python库

在Python数据分析中,导入`Pandas`和`numpy`这两个常用的库。`Pandas`主要用于数据的读取、处理和分析,它提供了`DataFrame`等数据结构来方便地操作表格型数据;`numpy`则主要用于数值计算,提供了高效的数组操作和数学函数等。实训步骤二:读取数据并且进行描述性统计分析1.使用DataFrame对象的head()函数,默认查看前5行数据。这可以快速了解数据的大致结构和内容,确认数据是否被正确读取以及各列的数据类型和格式等。2.通过`DataFrame`对象的`info()`方法,获取数据的基本信息,包括列名、每列的数据类型、非空值的数量等。这有助于了解数据是否存在缺失值等问题,以便后续决定是否需要进行数据清洗等操作。实训实训步骤二:读取数据并且进行描述性统计分析

利用DataFrame对象的describe()方法,计算数据集中数值型列的描述性统计信息,包括均值、标准差、最小值、最大值、25%分位数、50%分位数(中位数)、75%分位数等。这些统计量可以帮助我们了解数据的集中趋势、离散程度等特征。实训步骤三:获取有用的指标1.数据集中已经有“访客数”这一列,直接从`data`这个`DataFrame`对象中提取该列数据即可。在Python中,通过`data['访客数']`的方式获取“访客数”列的数据。2.同理,数据集中有“浏览量”列,通过`data['浏览量']`的方式获取该列数据。3.计算每周转化率。首先取数据并将日期列转换为日期时间类型,接着添加了周数列,然后通过groupby()方法按周数分组,对“成交用户数”和“访客数”求和后计算出每周的转化率,并最终打印输出包含周数和每周转化率的结果实训步骤三:获取有用的指标THANKSFORYOURLISTENING本章结束感谢聆听第五章

用户行为洞察与分析UserBehaviorInsightsandAnalysis严谨勤俭求实开拓01用户行为洞察02用户行为分析实例03实训案例引入通常只是男士运动服尺码的简单改小,颜色改为粉色。“SuperGirls”Lululemon的成功建立在对“SuperGirls”及后来“新中产”的精准洞察。对用户需求的深刻理解,让品牌能够提供切合时代潮流的产品,在竞争激烈的市场中脱颖而出。“新中产”阶层Part1用户行为洞察UserBehaviorInsight严谨勤俭求实开拓01用户行为洞察用户行为分析概述数字时代的用户行为对企业商务活动的深刻影响与用户的交互方式个性化营销内容营销预测用户行为企业利用各种数字化渠道如电子邮件、社交媒体直接与用户进行沟通互动,使得品牌可以更迅速、全面地传递信息,从而塑造品牌形象、提升私域流量。用户根据自己的情况提出商品需求,企业尽可能按照其需求去生产以满足用户的个性需求和品位,并通过建立用户的个人数据库和档案,采用灵活的调整策略以提高生产者与用户之间的协调合作。更注重品牌的故事和核心价值,企业通过向用户提供有价值的信息,利用用户的价值认可和情感共鸣吸引用户。通过历史数据的分析能提前预测出用户对产品的消费行为,并针对性地调整产品、定价和营销策略,更好地满足市场需求,从而影响用户的购买行为。01用户行为洞察数字时代用户的行为特征数字时代下用户的行为特征体现在:科学消费观注重自我需求选择广泛科学种草01用户行为洞察数字时代用户的行为特征科学消费观数字时代更多用户认为消费的意义在于更高质量的生活,通过明智的选择可以实现对生活方方面面的改善。可持续消费是指在消费过程中考虑环境保护和资源节约的行为。边际效用是消费者在消费某种商品时,所获得的额外效用或满足感。粉红税是指女性获得同样的产品或服务比男性付出更多金钱的现象。相对收入消费理论:消费者的消费支出不仅依赖于他的现期收入,而且还依赖于其他人的收入水平以及他过去曾达到的最高收入水平。有助于用户保持健康的经济状况并且推动市场朝向健康、可持续的方向发展。01用户行为洞察数字时代用户的行为特征注重自我需求选择广泛

互联网上时刻涌现着各种产品,但用户在购买过程中展现出强烈的自我意识,更注重根据自身实际需求进行购物决策。用户更加强调产品与个体需求的契合度,从实际需求、实用性等,购买更符合自己需求的产品。这一消费观念的崛起展示了用户对于自主选择和个性化的追求。他们不再受制于潮流的束缚,而是更加注重在购物过程中体验到的实际益处。无论是产品的规格、功能、品质,还是其他用户的使用经验和评价,都可以在平台上得到详尽的展示。此外,用户不再受限于地域和传统渠道,可以从各种各样的购物App随时随地轻松获取各种产品。01用户行为洞察数字时代用户的行为特征科学种草知识型种草通过各种知识型平台,如小红书、知乎、百度等,获取有关产品的详尽信息,如产品的原材料、制造工艺、功能特点等方面的知识。购物不再仅仅是一次交易,更是对产品背后知识的了解和分享。科普型种草科普性的介绍产品背后的科学原理、技术革新等方面的信息。这种方式使得购物不再仅仅是满足需求,更是一个知识获取和学习的过程。测评型种草基于用户的实际使用体验和评价,让其他用户通过真实地了解产品的优劣,从而做出购物决策。用户能够从多个角度、多个维度了解产品,更有把握地选择符合个人需求的商品。科普型种草的核心目标是破除信息差,比如揭露行业真相/扫除认知盲区。知识型种草是提供可操作的选购方法论,帮助不同需求的消费者实现精准购买。《2024年扫地机器人选购指南:6大参数对比+避坑清单》——知识型种草《胶原蛋白口服液是智商税?生物学家解读吸收真相》——科普型种草01用户行为洞察用户行为分析用户信息和特征整合成虚构的“用户画像”——用户在购买、使用和评估产品或服务的过程中,展现出来的一系列心理和行为活动是用户用户画像的重要指标。用户画像对把握用户行为具有以下意义::1.用户行为具有多层次、多角度的复杂性。2.用户行为是多样化需求的聚合。全样本性事实性方便性动态性预测性01用户行为洞察用户行为分析模型

数字时代的用户在电子商务市场中的购买行为与传统实体市场存在显著差异。在数字时代,通过大数据和个性化推荐算法,企业可以更精准地满足用户的需求,提供个性化的产品和服务。

文化影响社会影响

身边人的意见和社交圈的影响也是用户购买决策的重要考量。家庭影响

在家庭环境中养成的消费观念和习惯会深刻地影响到用户的购物决策。涵盖生命周期阶段、职业、经济收入、生活方式、个性、自我观念和心理(态度、动机、感知和学习经验)等多方面的因素。除了考虑传统的外部和个人因素,数字时代特有的影响因素:网络文化、个人在线行为、网络零售商店气氛设计、在线用户形成的社交网络和在线评论等01用户行为洞察用户行为分析模型漏斗模型是一种常用的用户行为模型,用于描述潜在用户在购买过程中经历的各个阶段。它可以量化和优化整个销售过程中的每个环节,将潜在用户逐步引导转化为实际购买者。通过将整个购买流程拆分为多个步骤,并用转化率来衡量每个步骤的表现,可以更好地了解每个环节的效率,同时针对异常的数据指标进行调优,提高整体的购买转化率。漏斗模型01用户行为洞察用户行为分析模型获取(Acquisition)指从不同渠道,如广告、营销、社交媒体等吸引用户,引入新用户。需要解决渠道贡献、宏观走势、注册转化率等问题,以掌握不同渠道等获客效率和成本。激活(Activation)将新增用户转化为活跃用户。很多用户可能是通过广告被动进入商品页面的,如何把他们转化成活跃用户是这部分需要解决的问题。留存(Retention)关注如何减少用户流失率,以及持续使用产品的情况,需要解决用户规模稳定性、推广效果评估等问题。收益(Revenue)用户在产品上发生可使企业收益的行为,包括付费率等指标,需要解决付费率、活跃付费用户数等问题。推荐(Refer)涉及用户通过产品推荐引导他人使用产品。阶段指标定义获取日新登用户数每日注册并登录App的用户数激活日活跃用户数每日登录过App的用户数周活跃用户数每周登录过App的用户数月活跃用户数每月登录过App的用户数用户粘性用户每月访问App的平均天数是多少留存次日存留率日新增用户在+1日登录的用户数占新增用户的比例三日存留率日新增用户在+3日登录的用户数占新增用户的比例七日存留率日新增用户在+7日登录的用户数占新增用户的比例收益付资率付费用户数占活跃用户的比例活跃付费用户数关注日付费用户和周付费用户推荐K因子(K=每个用户向他的朋友们发出的邀请的数量×接收到邀请的人转化为新用户的转化率)当K>1时,用户群就会像滚雪球一样增大。当K≤1时,用户群到某个规模时就会停止通过自传播增长。01用户行为洞察用户行为分析模型RFM模型是一种用于评估用户价值和创利能力的重要工具。用户最近一次交易(Recency):用户最近一次和上一次交易的时间间隔(活跃度)交易频率(Frequency):指一定时间段内交易的次数(忠诚度)交易金额(Monetary):指用户在一定时间段内的交易金额(购买力)每个维度都需要设定一个阈值,比如在R维度,低于整体R值的平均值,用0表示;高于整体R值的平均值,用1表示。01用户行为洞察用户生命周期分析用户生命周期理论可以把用户群体划分为五个关键群体,分别对应五个阶段:展望群体潜在用户单一购买用户重复购买用户忠实用户01用户行为洞察用户生命周期分析这个阶段的用户群体,虽然尚未透露个人信息或出现实际购买行为,但却表达了对品牌有购买意向的潜在用户。营销策略:这是用户生命周期的起始阶段,企业应通过定向广告和产品展示吸引潜在用户的注意力。个性化的广告和产品展示有助于在激烈的市场竞争中脱颖而出,引导潜在用户进入购买决策流程。01用户行为洞察用户生命周期分析当用户表现出更为明显的兴趣和购买意向时,则进入了成长用户阶段。这一时期,用户可能已经开始在品牌网站上浏览产品,将商品添加到购物车,或在社交媒体上积极参与品牌活动。营销策略:企业需要加强与潜在用户的互动,通过个性化服务和定制化体验提高其购买意愿。建立完善的CRM系统,实现数据的互通互联,为潜在用户提供一致而有针对性的服务。01用户行为洞察用户生命周期分析随着第一次成功购买,用户转化为单一购买用户,成为品牌的新用户。他们已经亲身体验了品牌的产品或服务,并品尝到了与品牌建立连接的滋味。营销策略:针对已完成首次购买的用户,企业应通过定期的促销活动、会员权益等方式延长其消费周期。01用户行为洞察用户生命周期分析一次购买不仅仅只是一次交易,而是用户逐渐建立忠诚度的开始。在休眠期,用户不断选择品牌的产品或服务,表明他们对品牌的满意度较高。营销策略:针对已经成为回头客的用户,企业需要更深入地了解他们的偏好和需求,提供更具个性化的产品和服务。通过积分制度、会员专享等方式,激发用户的再次购买欲望。01用户行为洞察用户生命周期分析当用户逐渐建立深厚的忠诚度,成为品牌的忠实用户时,品牌与用户的关系变得更为牢固。但这时应该留意用户的流失。营销策略:对于已经形成忠诚度的用户,企业应当保持持续的关怀和沟通。定期的会员活动、专属礼遇以及个性化的关怀服务都有助于巩固用户忠诚度,进一步提升其生命周期价值。Part2用户行为分析实例ExamplesofUserBehaviorAnalysis严谨勤俭求实开拓02用户行为分析实例用户行为数据集概况数据集包含了淘宝App中2017年11月25日至2017年12月3日之间用户的所有行为。数据标签主要包含用户ID、商品ID、商品类目ID、行为类型和时间戳,用户的行为类型包括点击1、加购2、收藏3、购买4。字段说明用户ID淘宝用户的ID商品ID用户做出点击、加购、收藏、购买行为的商品商品类目商品所属类目的ID行为类型用户做出的点击、加购、收藏、购买行为时间戳行为发生的时间戳02用户行为分析实例数据清洗读取"UserBehavior.csv"的数据文件,查看缺失值情况。由于数据集的数据量太大,本部分使用了前10万条数据,保留了原始数据集的全部字段。通过对数据集进行缺失值查找,发现数据没有出现缺失值的情况,可以认为该数据集的基本情况良好,能够进行下一步分析。02用户行为分析实例用户行为整体概况先针对用户数量的基本信息进行统计,包括独立访客数、有操作的商品数量、有操作的商品类目数量、付费用户数量(发生购买行为)以及非付费用户数量,并将结果统计出来。02用户行为分析实例用户行为整体概况在用户针对商品的消费行为方面,针对点击量、购买量、加购量、收藏量进行了分析用户行为中,点击量以89.60%的占比表明绝大多数用户仍停留在商品浏览阶段。仅有约5.55%的点击用户会将商品加入购物车,而收藏量更低(2.81%),最终仅2.04%的点击用户完成购买。这样的用户行为基本符合沙漏模型,数据呈现逐层递减的规律。02用户行为分析实例用户行为整体概况这平台的访客数(UV)达到9739人,这一指标突显了数据集具备庞大的用户基础,一般大部分的用户都不会反复观看一个商品,也意味着数字时代下淘宝用户针对一个类目的商品有着更多元的选择。访客数UV付费用户数达到6689人,付费用户占比高达68.68%,这是一个可观的数字,说明淘宝商品得到了受到用户的广泛认可,大部分用户在浏览完商品后都可以选择出合适自己的商品。在商品数量方面,共计398971个商品,由此可见淘宝平台商品种类的多样性不仅满足了用户日益多元化的需求,同时为商家提供了更广泛的拓展空间。商品数量数据集涵盖了5793个不同的商品类别,意味着大部分的用户在进行浏览商品行为时都是有目的性地进行网上购物。商品类别付费用户访客数9739商品数量398971商品类别5793付费用户668902用户行为分析实例具体指标分析-页面访问量PV和独立访客数U

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论