版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、Python电商数据分析实战案例导读: 今天给家带来个电商数据分析案例。我整理了下,以笔记的形式分享给到家。案例背景致是某电商连续年的总体销售额都在上涨,但近年增速放缓,需要寻求有效的增涨点,以提升市场竞争。因为篇幅较长,因此本次案例分析共分为上下两篇。章较长,建议收藏电商分析基础知识在正式开始之前,云朵君为家准备了些常见的基础的电商分析基础知识,对于数据分析较为友好,电商分析佬可酌情查看,若有写得不好的地,还望佬纠正,共同进步!此处参考知乎:电商数据分析指标1电商分析指标 浏览量(PV):户访问页的总数。访客数(UV):独访客。台电脑为个独访问数。可分为新访户和回访户。当前在线数:指15分钟
2、内在线的UV数。平均在线时间:指平均每个UV访问页停留的时间长度。停留时间 = 访客打开站第个页的时间点 打开站最后个页的时间点。平均访问量:户每次浏览的平均页值。均流量:平均每天的流量。跳出率:只浏览了个页就离开的访问次数除以该页的全部访问次数。分为:页跳出率、关键页跳出率、具体产品页跳出率等。这个指标可以反映出个页内容的受欢迎程度。如果跳出率,说明该页需要调整和优化。跳出率不可怕,可怕的是不知道户跳出的原因。有了流量之后,我们希望户按照设计好的要求进动作,如希望户注册、收藏、下单、付款、参加我们的营销活动等等。这些动作就是转化。转化率:指进了相关动作的访问量占总访问量的例。转化率是电商营运
3、的核指标,也是来判断营销效果的指标。注册转化率:注册户数/新访户数。客服转化率:咨询客服员的户数/总访问数。收藏转化率:即将产品添加到收藏或关注的户数/该产品的总访问数。添加转化率:将产品添加到购物车的户数/该产品的总访问数。成交转化率:成交户数/总访问数。成交转化率可细分为渠道转化率、事件转化率、品牌转化率等。成交指标:成交额、成交数量、成交户数订单指标:订单额、订单数量、订单户数、有效订单、效订单退货指标:退货额、退货数量、退货户数、额退货率、数量退货率、订单退货率效率指标:客单价、件单价、连带率、动销率采购指标:采购额、采购数量库存指标:库存额、库存数量、库存天数、库存周转率、售罄率供应
4、链指标:送货额、送货数量、订单满率、订单响应时长、平均送货时间传统零售业和电商的会员概念上有些不同。传统零售业中,户需要消费到定的额数才有资格成为会员,所以传统零售的会员定是顾客。电商中,般户只要注册成功便成为会员。是时效性的差异,部分传统零售的会员管理有失效的规定,即如果会员不能在定期限内消费达到某额就将会失去会员的资格。电商中的会员则没有这种限制,只是对不同消费额的户设定了不同的等级。注册会员数:指曾经在站上注册过的会员总数。般来说这个定义没有太的意义,因为存在有只注册不买的户和买过东西但已经长时间不使的户,所以把这个指标定义为年中有购买记录的会员更准确。活跃会员数: 指在段时期内有过消费
5、或登录为的会员总数。活跃会员率: 活跃会员数占总会员数的例。会员复购率: 指在某时期内产了第次或以上购买会员数占总购买会员的总数。平局购买次数: 某时期内每个会员平均购买的次数。会员回购率: 指上期末活跃会员在下期时间内有购买为的会员率。会员留存率: 某时间节点的会员在某特定时间周期内登录或消费过的会员率。电商般使消费数据,游戏、社交领域则使登录数据。五、财务指标新客成本:公司花了100万获得了10000个新客户,则新客成本为100元/。新客成本般根据渠道计算,这样也可以区分不同的渠道质量。单成本: 营销成本/访客数。这的访客不区分是否是新访客、是否购买、是否注册等。单笔订单成本: 营销成本/
6、产的订单数费销: 营销成本/订单额。它的倒数就是ROI。对于不同业、不同性质、不同阶段的公司来说,关注的指标也是不样的,所以所谓核指标也并成不变的。对于个新电商来说,积累数据,找准营运向是最重要的,所以这阶段最关注的的指标就是流量指标,包括了:访客数、访客来源、注册户数、浏览量、浏览深度、产品的浏览量排、产品的跳出率、顾客评价指数等等。对于已经营运了段时间的电商来说,通过数据分析提销量就成为最重要的标。这个阶段最关注的的指标主要包括流量和销售指标:访客数、浏览量、转化率、新增会员数、会员流失率、客单价、动销率、库存天数、ROI、销售额等。对于具有了定规模的电商来说,利数据提升整体营运平就很关键
7、。他们的重点指标就是访客数、浏览量、转化率、复购率、流失率、留存率、客单价、利润率、ROI、新客成本、库存天数、订单满率、销售额等。电商案例分析接下来进我们今天案例分析的主题。1、了解业与公司现状业现状与趋势,如涉及哪些业务公司在市场中地位2、沟通明确需求头脑风暴,挖掘需求或瓶颈多次沟通,最有价值的分析3、最后数据进验证import numpy as npimport pandas as pdsns.set()pd.set_option(float_format, lambda x: %.2f % x)#显中plt.rcParamsfont.family = Arial Unicode MSp
8、lt.rcParamsaxes.unicode_minus=False宏观市场分析产品命周期(product life cycle),简称PLC,是产品的市场寿命,即种新产品从开始进市场到被市场淘汰的整个过程。费农认为:产品命是指市上的的营销命,产品和的命样,要经历形成、成长、成熟、衰退这样的周期。就产品,也就是要经历个起步、成长、成熟、衰退的阶段。图来络1、起步期企业规模可能很,关于该业的企业如何发展有不同看法,产品类型、特点、性能和标市场不断发展变化。市场中充满各种新发明的产品或服务,管理层采取战略持产品上市。产品设计尚未成熟,业产品的开发相对缓慢,利润率较低,市场增长率较。策略:跟踪对、
9、参与或观望。2、成长期该业已经形成并快速发展,多数企业因增长率在业中继续存在。管理层需确保充分扩产量达到标市场份额。需量资达到增长率和扩产计划,现短缺。利专利或者降低成本来设置进壁垒(内在规模经济),阻竞争者进业。策略:增加投、增加市场占有率、阻新进者。3、成熟期增长率降到较正常平,相对稳定,各年销售量变动和利润增长幅度较,竞争更激烈。后期些企业因投资回报率不满意退出业,部分企业主导业,需监控潜在兼并机会(啤酒业)、探索新市场(中国拖拉机出)、研发新技术、开发具有不同特功能的新产品。战略管理关重要策略:提效率、成本控制、进和控制市场细分。兼并扩张,研发新品。4、衰退期业产过剩,技术被模仿后出现
10、的替代品充斥市场,市场增长率严重下降,产品品种减少,业活动平随各公司从该业退出下降,该业可能不复存在或被并另业。业的存在期任何单产品都要长。充分运战略管理很重要策略:及时退出。数据准备本次案例数据量较多,下按照分类通过思维导图的式将其展出来。级市场容量分析数据读取wxtz=pd.read_excel(./baier/ /.xlsx)ff=pd.read_excel(./baier/ /.xlsx)mssc=pd.read_excel(./baier/ /.xlsx)wx=pd.read_excel(./baier/.xlsx)jrp=pd.read_excel(./baier/ /.xlsx)
11、wxp=pd.read_excel(./baier/ /.xlsx)wxy=pd.read_excel(./baier/.xlsx)将级市场到交易额按照份汇总到起,形成级市场到交易数据,来分析整个级市场(宏观市场)到市场容量势table.head()般后续分析要按照时间维度进各种汇总分析,最好把时间字段设置为该表的索引。table.set_index(,inplace=True)table=table.sum(axis=1)table.head()# table.plot()以时间索引为横轴,级市场销售总额为纵轴,绘制折线图,查看级市场销售趋势。由图中可以看出,销售总额趋势是周期性增长的。回归
12、算法预测销售额这有两点需要注意:般作宏观市场容量分析,般要求5年。发现年度数据不规整,2018年11、12缺失,2015年只有11、12。接下来回归分别对18年11、12数据做出简单的预测。先预测18年11的销售额,提取2015-2017年11的销售额。table_02 = pd.concat(table2015-11,table2016-11,table2017-11,axis=0)table_02对级市场作回归分析(上表每个字段作次)。from sklearn.linear_model import LinearRegressiony_11 = x_train=np.array(2015,
13、2016,2017).reshape(-1,1)y_pred = clf.predict(np.array(2018).round(1)y_11.append(round(y_pred0,2)y_116678677.55,71752495.99,1801318.82,193874.39,86784890.23将上得到的结果追加到15年到17年数据表中去。 ,name=date)table_02.locdate,:=y_11table_02同理,预测2018年12各个杀剂销量。从预测结果可以看到,2018年11和12的市场销售总额,会前三年还要进步增加。级市场容量分析将原始数据及预测得到的销售数
14、据合并,再继续分析。table_04 = table_04.drop_duplicates().sort_index(ascending=False).iloc:-2,:table_04.head()统计2016、2017和2018年级市场年销售总额。并绘制折线图。# table_04.resample(Y) .sum().plot()t4 = table_04.resample(Y) .sum()2016-12-31 917966079.692017-12-31 1395872729.272018-12-31 1699011039.03Freq: A-DEC, Name: ,dtype: f
15、loat64由上图可以看出,2018年相对于2017年全年销售总额增速有所降缓。进步分析级市场的容量,探寻市场增长点。table_05 = table_04.resample(Y).sum()table_05绘制各个驱剂三年内年消费总额折线图。从结果可以看到:级市场,灭杀剂市场销售额市场最,增长幅度稳定接下来对细分市场作分析,集中在灭杀市场内,也是由于需求产品线所处对级市场。灭蚊市场占较,增加产品多样性可以考虑灭蚊产品。级市场的占分析将所有杀剂年销售额除以级市场销售总额,得到每种杀剂市场占。a=for i in table_05.columns:a.append(table_05i/table
16、_05. )table_06=pd.DataFrame(a,index=table_05.columns)table_06.T将上得到的级市场占,进可视化分析,得到如下图所的各杀剂销售总额占。从结果可以看到:灭杀剂市场直以来占领级市场级市场60%以上的市场份额。其次是蚊液产品,占据20%以上份额。将各个杀剂每年年销售总额做差分并除以上年年销售总额得到年增幅。incre_01=(table_05.iloc1,:-table_05.iloc0,:)/table_05.iloc0,:incre_02=(table_05.iloc2,:-table_05.iloc1,:)/table_05.iloc1
17、,:incre=pd.DataFrame(incre_01,incre_02,index=16-17 ,17-18)incre将上述得到的数据进可视化。由上分析得到如下点:级市场容量的增幅确实是在放缓,放缓幅度较。级市场容量有所放缓,幅度较。本节使业排名top100品牌数据,包括品牌、业排名、交易指数、交易增长幅度、付宝转化指数等个重要字段。brand=pd.read_excel(./baier/ /top100.xlsx)brand.head()这我们只需要品牌和交易指数两个字段。brand=brand,brand.set_index(,drop=True,inplace=True)bran
18、d.head()并将业排名TOP10的品牌绘制饼图,查看各个品牌市场占情况。微观市场 竞争分析mm=pd.read_excel(./baier/ /.xlsx)ms=pd.read_excel(./baier/ /.xlsx)sc=pd.read_excel(./baier/ /.xlsx)sz=pd.read_excel(./baier/ /.xlsx)zl=pd.read_excel(./baier/.xlsx)t_01=sz,t_02=zl,t_03=mm,t_04=ms,t_05=sc,微观市场容量分析将灭杀剂细分市场各个类别数据进合并,并按照类别聚类,对预估销售额进求和。得到如下图所
19、的各杀剂类别-预估销售总额条形图。t = pd.concat(t_01,t_02,t_03,t_04,t_05)t.set_index(,drop=True,inplace=True)(t.groupby().sum().plot(kind=barh,color=cmap1,ax=ax)从条形图中可以获得不少有价值的信息:在级市场内,灭产品的预估销售额是最。其次是才是灭蟑产品,前拜的在驱剂市场的产品主要集中在灭蟑和杀。可以考虑灭和除螨的产品线。三级市场占分析将各个类别的产品除以总销售额,得到每个产品的销售额占情况,并绘制横向条形图。t = pd.concat(t_01,t_02,t_03,t_
20、04,t_05)(t.groupby().sum()/t.groupby( ).sum().sum(axis=0).plot(kind=barh,color=cmap1,ax=ax)从结果可以看到:拜主营业务市场,灭和灭蟑产品占市场份额60%左右。如果要介灭产品,以较低价引流产品为主,要以什么价格区间的灭产品较合适。引流产品价格定位通过对数据表进描述性统计,得到每个价格区间预告销售额。ms_02 = ms.loc:,ID,ms_02.describe()价格数据离散化,设置0,50,100,150,200,250,300七个切割点,将售价切分为六个价格区间。labels = 0-50,50-1
21、00,100-150,150-200,200-250,250-300ms_02=pd.cut(ms_02,bins=bins_01,labels=labels)ms_02.head()以价格区间聚合,对预估销售额进求和,得到如下结果。可以明显看到,价格区间在0-50时,预估销售总额是最的,且是排名第的50-100价格区间总预估销售额的近5倍。ms_02.groupby().sum().sort_values(ascending=False)价格区间15162086.5150-100 3335060.19100-150 2758086.29200-250 2743758.00150-200 62
22、9813.00250-300 237740.00Name: , dtype: float64如果拜想介灭产品,引流产品定位在0-50之间合适,但是哪个细分区间较合理?细化价格区间,将0-50价格区间继续以0,10,20,30,40,50即每10元为个区间,划分产品售价,得到如下结果。bins_02=0,10,20,30,40,50labels_02=0-10,10-20,20-30,30-40,40-50ms_02=pd.cut(ms_02,bins=bins_02,labels=labels_02)ms_02.head()同样聚合求和并排序,得到如下结果,其中10-20及20-30价格区间总
23、预告销售额相对较。ms_02.groupby().sum().sort_values(ascending=False)价格区间10-20 8102634.1420-30 4969620.9230-40 1240874.1940-50 707568.490-10 141388.77Name: , dtype: float64如果想做0-50块之间灭引流产品,10-30元以内较合适,市场较受欢迎,不容易亏损。竞争分析谁是我们的竞争对?他们的策略是什么?和他们相我们的优势和劣势在哪?这些是我们必须经常对的问题,竞争对处不在。作为名数据分析师,我们要如何帮助公司制定竞争策略?不能正确识别的竞争对会造成
24、各种被动,既浪费资源,还浪费宝贵的发展时机。本次竞争分析将从两个着,是销售竞争分析,其中包括拜、科凌控和安速家居销售分析。是产品结构分析,这部分将在本次案例分析下篇中继续展开,本篇不涉及。本次使的数据是竞争数据中商品销售数据内的三家公司近30天销售数据。安速家居 =pd.read_excel(./baier/ /30.xlsx)科凌控 =pd.read_excel(./baier/ /30.xlsx)查看下本次数据都包含哪些字段。拜 = pd.read_excel(./baier/ /30.xlsx).info()RangeIndex: 15 entries, 0 to 14Data colu
25、mns (total 16 columns):# Column Non-Null Count Dtype- - - -10 类11 物理形态 11 non-null object12 型号 15 non-null object13 净含量 13 non-null object14 使对象 15 non-null object15 销售额 15 non-null float64dtypes: float64(3), int64(4), object(9)memory usage: 2.0+ KB使切截取本次分析所需要的字段信息。baier = ID,30,baier.head()根据商品ID聚合,并对销售额求和,按照总销售额排序后绘制条形图如下所。从结果中可以看出,爆款产品527604730327的销售额远远超过其他任何个产品。(baier.groupby(ID).sum().sort_values(ascending=False).plot(kind=barh,color=cmap1,ax=ax)为了查看拜产品分不同使对象的总销售额,对
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- Janus-DOTA-生命科学试剂-MCE
- 2026年小猫玩球测试题及答案
- 2026年频率副词测试题及答案
- 2026年铅笔人学霸测试题及答案
- 2026年京东规则测试题及答案
- 2026年清洗质量监测试题及答案
- 2026年与友善为伴测试题及答案
- 2026年领导常用测试题及答案
- 医院急诊科工作会议制度
- 【深度】2026年中国算电协同行业研究报告 数字经济与能源安全双轮驱动的战略底座
- 工程项目施工安全管理指导手册
- 2026年水利三类人员安全员b证考试题库及答案(完整版)
- 延长石油招聘真题及答案
- 儿科患者引流管护理实践指南(2025年版)
- 深度解析(2026)《HGT 6029-2022煤化工企业节能诊断技术规范》
- 护理师资培训课件
- 2026年保安员证考试题库及1套完整答案
- 施工用电应急预案方案
- 2025年高考物理试题(浙江卷) 含答案
- 《土木工程智能施工》课件 第5章 钢筋混凝土工程-钢筋工程
- 2025年医学影像诊断学ct mri试题及答案
评论
0/150
提交评论