




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、电商户为数据分析前本针对淘宝app的运营数据,以业常见指标对户为进分析,包括UV、PV、新增户分析、漏流失分析、留存分析、户价值分析、复购分析等内容;本使的分析具以MySQL为主,涉及分组汇总,引变量,视图,关联查询等内容。1.本次分析的业务问题以及分析逻辑本次想通过对淘宝户为数据的分析,为以下问题提供解释和改进建议:1)基于AARRR漏模型,使常见电商分析指标,从新增户数量、各环节转化率、新户留存率三个进分析,确定影响新增户数量的因素,找到需要改进的转化环节,发现留存现存问题2)研究户在不同时间尺度下的为规律,找到户在不同时间周期下的活跃规律3)找出最具价值的核付费户群,对这部分户的为进分析
2、4)找到户对不同种类商品的偏好,制定针对不同商品的营销策略以下为本次分析逻辑:电商分析通常从四个展开,即流程效率分析、流量/户分析、商品分析、产品分析,通过流程效率拆解追踪问题产环节,通过户粘性、价值、满意度分析来进户分层及流失预警,通过商品命周期及关联分析来划分商品等级,通过产品分析提升户浏览-购买过程体验;本通过常的电商数据分析指标,采AARRR漏模型拆解户进APP后的每步为;并使RFM模型,对户价值进评价,找到最有价值的户群,针对这部分户进差异化营销。数据集包含了2017年11252017年123之间,约百万随机户的所有为(为包括点击、购买、加购、喜欢)。数据集情况为:户数量约100万(
3、987,994),商品数量约410万(4,162,024),商品类数量9,439以及总的淘宝户为记录数量为1亿条(100,150,807)。原数据集共有1亿条数据记录,数据量庞,本次分析选取了约100万条记录进分析,数据整体情况参考如下表格。1.选择集数据集的每个字段都有效,此处全部选择。2.列名重命名原数据集没有表头,sql语句创建表及6个字段,把淘宝户为数据导Mysql数据库。3.删除重复值数据导时,将主键定义为:user_id,item_id,timestamps,保证没有重复数据。4.缺失值处理在创建表格的时候,5个字段均定义为NOT NULL,数据导保证没有缺失值。致化处理转换时间数
4、据类型,并添加datentime,dates,hours三个字段,将转换好的数据放进去SET hours = SUBSTRING(datentime FROM 12 FOR 2);6.数据异常值处理检查期是否在规定范围内:2017年11252017年123。FROM UserBehavior;检查时间是否正确,并将不符合规定的数据删除DELETE FROM UserBehaviorWHERE datentime 2017-12-04 00:00:00;共删除了509数据,再次验证期时间的准确性,结果符合要求。完成清洗后的数据:四、构建模型分析户为的漏模型数据主要涉及每新增户数,户购买转化环节从
5、浏览到最终购买整个流程的流失情况(包括浏览、收藏、加购、购买),户次、3、7留存情况,以及户在研究时段内的复购次数和复购率1)获客:每新增户情况此处选取2017年1125为APP启的天,并定义新增户为出现第次购买为的户。如下图所,2017年11252017年123期间,每天都有新增户,但是新增户在递减,在122当天有幅回涨,故周末推出的营销活动或正在预热的双营销活动能够吸引新户。2)转化:转化及流失情况 AAP在9天内的各项指标情况如下访问户总数(UV):9768页总访问量(PV):897293SELECT COUNT(DISTINCT(user_id) AS UV,(SELECT count
6、(behavior) FROM UserBehaviorWHERE behavior = pv) AS PV,FROM UserBehavior; 跳失率=只点击次浏览的户数量/总户访问量当统计时长为9天时,有586个浏览了个页就离开了APP,占总访问量的0.65%,乎可以忽略不计,说明淘宝有够的吸引让户停留。WHERE user_id NOT IN(SELECT DISTINCT user_id FROM UserBehavior WHERE behavior = fav)AND user_id NOT IN(SELECT DISTINCT user_id FROM UserBehavior
7、 WHERE behavior = cart)AND user_id NOT IN(SELECT DISTINCT user_id FROM UserBehavior WHERE behavior = buy); 户为转化漏计算在购物环节中收藏和加购物车都是确定购物意向的为,没有先后之分,所以将这两个环节合并为购物环节中的步。由下图可以看到,从浏览到确定购买意向只有9%左右的转化率,夹点出现在点击-收藏或加购这过程中,可能原因是户花了量时间寻找合适的产品,可以针对性的优化平台的筛选功能,让户能够更容易的找到合适产品,并将流程指标再细化后进分析,找出影响户流失的关键问题点。# 先创建户为视图CR
8、EATE VIEW user_behaviorASSELECT user_id, count(behavior),GROUP BY user_idORDER BY COUNT(behavior) DESC;# 再计算转化率SELECT CONCAT(ROUND(SUM()/SUM()*100,2),%) AS pv,CONCAT(ROUND(SUM()+SUM()/SUM()*100,2),%) AS pv_to_favcart,CONCAT(ROUND(SUM()/SUM()*100,2),%) AS pv_to_buyFROM user_behavior; 独访客漏计算APP约有68%的付
9、费户,户付费转化率相当。ORDER BY COUNT(DISTINCT user_id) DESC;3)留存:新增户的留存情况由下表数据,次、3、7留存率均维持在20%左右,数据作为周留存率来看,表现还是常优秀的,但作为次留存来看,就不是很理想了,可以结合产品设计和新户转化路径来分析户的流失原因,通过不断的修改和调整来降低户流失,提升次留存率;另外,122、3的留存率相较之前有2%-8%的上涨,故促销活动能为提升留存带来定正向的影响。注:本次研究把2017年1125当天的户全作为新户,与实际情况不符,考虑实际情况进分析,淘宝APP的留存已经过了流失期和蒸馏期,进稳定期,在这样的条件下,若留存率
10、达到20%还是很可观的。4)变现:复购分析下图展了不同复购次数对应的户数量,发现复购5次以上的户仅占有购买为户数的10%,我们发现复购次数的户很少,商家可以从商品质量、服务质量、物流体验三寻找原因,定位所在问题点,寻求复购率突破。经下代码块计算,复购率为65%,淘宝APP的整体复购率相对可观,应将经营重点转化为培养户的忠诚度上,励户更频次的消费。SELECT CONCAT(ROUNDFROM user_behavior;2.不同时间尺度下的户为模式分析分别以研究全时段(9天,此处觉得再研究单周意义不),为单位,分析户购买为,找出活跃户规律。1)分析2017年1125123 9天中每天的户为由图
11、可见在研究期范围内户活跃度较为平稳,仅在122、3有明显增长,该期和1125、26同为周末,故除特别营销活动外,周末能为提升户活跃度带来的影响较;另外,项指标在122点击数涨幅最,收藏数涨幅最,可能是双促销活动刚开始预热,户开始量浏览商品;加购物车是户在批量购买商品时的前置动作,因此加购物车的为发次数同样幅增加。ORDER BY dates;2)分析天中每时的户为这SQL提取每天的数据,Excel绘成动态图表,观察发现每各项为数据变化趋势相同,这我们仅选择个周五2017年121进分析;观察下图发现,121这天共有两个峰期,分别是晚上20点22点和上午10点下午13点,对应了许多上班族中午和晚上
12、休息的时间,符合部分的作息规律;另外,我们发现加购和收藏量的峰值出现在晚上20-22点,购买量的峰值则在早上10点,部分喜欢晚上收藏加购,早晨购买,说明收藏和购买是异步的户为,收藏的峰值通常发在购买为的前段时间,加购则是购买的前置动作,其峰值也会发在购买为前。3.户价值分析1)户价值分层(RFM模型)由于数据缺少M(消费额)列,暂且通过R(最近次购买时间)和F(消费频率)的数据对客户价值进打分。通过打分可以了解每位顾客的特性,从实现差异化营销。例如对于user_value=44的户,可划分为VIP户重点关注,并且投放活动时不要引起反感;对于user_value=14这类户粘性不强消费时间间隔较
13、短,运营活动可以重点针对这部分户,提户使产品的频率,可以通过拼团打折、积分兑换、捆绑销售等活动唤起户注意;对于user_value=41这类忠诚度不购买能强的户,则需要关注他们的购物习惯做精准化营销。)AS user_valueFROMWHERE r.user_id=f.user_id;商品销售分析1)商品销售情况统计所有商品的购买次数,同时找到购买次数、浏览次数、收藏次数和加购物车次数最多的商品。本次分析的商品共有392778中,户购买的商品共有16743种,却没有出现购买数量常集中的商品;在本次统计的数据中,只购买次的商品有14817种,占户购买商品数的88.5%,说明商品售卖主要依靠长尾
14、商品的累积效应,爆款商品的带动。GROUP BY item_id) AS product_buypoolGROUP BY product_buytimesORDER BY product_buytimes ASC; 商品销量top20列出销量前20位的商品,item_ID为3122135的商品销量最,为15次,那么是否浏览次数最的商品销量也最呢? 商品浏览top20我们看到浏览数最的商品为812879,浏览次数最的商品甚没有进销量前20,说明这些吸引户更多注意的商品没有很好的转化为实际销量。 商品收藏top20下图为收藏数前20的商品,可以看到排在收藏前1、15、20位的商品在浏览top20中
15、也有出现,分别排名2、10、4,说明收藏和浏览的同步率更。 商品加购top20在加购物车次数最多的前20个商品中,可以看到销量第3、4、10位的商品在加购数中排第1、10、8,说明加购数与销量的关系更为直接。2)商品类销售情况商品类销售情况中有较为明显的集中趋势,top20如下表所,可根据畅销类优化商品展、加强商品捆绑,进提销量。WHERE behavior = buyGROUP BY category_idORDER BY cat_count DESC;五、结论与建议本分析了淘宝APP户为数据共100万条,从四个不同度提出业务问题,使AARRR模型和RFM模型分析数据给出如下结论和建议。通过
16、AARRR模型分析户使的各个环节1)获取户由于数据中没有给出每个户第次的登陆的时间,我们暂且把2017年1125作为每个户的第次登陆时间来处理。在研究时段内,每天都有新增户,但是新增户在递减,仅在推出营销活动的周末有幅回升,故推出的营销活动能够对新户产吸引,营销活动的推渠道或许是户量增长多少的关键。2)激活户在购物环节中收藏和加购物车都是确定购物意向的为,没有先后之分,所以将这两个环节合并为购物环节中的步。从浏览到有购买意向只有9%的转化率,当然有部分户是直接购买,但也说明多数户以浏览页为主购买转化较少,此处为转化漏中需要改善和提的环节。针对这环节改善转化率的建议有:优化电商平台的搜索匹配度和
17、推荐策略,主动根据户喜好推荐相关的商品,优化商品搜索的准确度和聚合能,对搜索结果排序优先级进优化;给客户提供同类产品较的功能,让户不需要多次返回搜索结果反复查看,便于户确定怡产品;在商品详情页的展上突出户关注的重点信息,精简信息流的呈现式,减少户寻找信息的成本;优化加购物车和收藏按键的触达,户在滑屏时也能便触达,增加功能使的次数。3)提留存留存分析同样把2017年1125作为每个户的第次登陆时间来处理。淘宝APP的留存相对较为稳定,周留存表现优秀,但次留存略显不理想,可以结合产品设计和新户转化路径来分析户的流失原因,通过不断的修改和调整来降低户流失,提升次留存率;另外,122、3的留存率相较之
18、前有2%-8%的上涨,故营销活动能为提升留存带来定正向的影响,可以多推出些营销活动,让户提使淘宝电商平台的频率。4)增加收使APP的户中有61%的付费户,付费转化率相当。有购买为的户中,概有65%的户会重复购买,淘宝APP的整体复购率相对可观,应将经营重点转化为培养户的忠诚度上,励户更频次的消费。复购次数的户少,商家可以从商品质量、服务质量、物流体验三寻找原因,定位所在问题点,寻求复购率突。5)户推荐淘宝本户基数庞,知名度,个认为在线城市的户基本已经达到饱和,传播作需要针对三四线城市的渠道下沉,在这些地区针对户价格敏感度的特性开展类似拼多多的拼团转发和打折促销活动,扩这部分户的使率。研究户在不同时间尺度下的为规律,找到户在不同时间周期下的活跃规
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 生态保护修复资金申请报告2025:生态修复与乡村振兴
- 2025年椭圆画法考试题及答案
- 问诊部分试题及答案
- 2025年山区消防员考试题及答案
- 建筑识图试卷及答案
- 安全述职报告讲解
- 浙江省温州市乐清市2023-2024学年七年级上学期语文阶段性作业试卷(含答案)
- p图剪辑培训课件
- 2025年正弦函数经典题目及答案
- 2025年拼音大班闯关题目及答案
- 老年人的心理健康(共29张课件)
- DB11∕T 1700-2019 洗染企业等级划分与评定
- 生理健康课件教学课件
- 《商业模式创新》教学大纲
- DB34T∕ 2615-2016 公路沥青路面同步碎石封层施工技术规程
- 公司数字化与信息化管理制度
- 2024年新湘少版三年级上册英语全册教学课件
- 部编四年级道德与法治上册全册教案(含反思)
- 《成人有创机械通气气道内吸引技术操作》标准解读
- 2024年教师招聘考试公共基础知识复习提纲
- 中考英语688高频词大纲词频表
评论
0/150
提交评论