Python商务数据分析与应用(AIGC版 微课版)课件 第八章:社交平台商务活动分析_第1页
Python商务数据分析与应用(AIGC版 微课版)课件 第八章:社交平台商务活动分析_第2页
Python商务数据分析与应用(AIGC版 微课版)课件 第八章:社交平台商务活动分析_第3页
Python商务数据分析与应用(AIGC版 微课版)课件 第八章:社交平台商务活动分析_第4页
Python商务数据分析与应用(AIGC版 微课版)课件 第八章:社交平台商务活动分析_第5页
已阅读5页,还剩40页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第八章

社交平台商务活动分析SOUTHWESTERNUNIVERSITYOFFINANCEANDECONOMICS严谨勤俭求实开拓01社交平台商务活动02社交平台用户行为--用户行为数据03用户行为画像04用户未来购买行为预测Part1社交平台商务活动严谨勤俭求实开拓01社交平台商务活动案例引入——可口可乐社媒活动JUNE12th#ShareACoke:可口可乐在社媒上的分享商务活动

个性化定制的可口可乐瓶子促进用户之间的分享与互动,如:可口可乐瓶上印上不同名字或常见的称呼,如“朋友”“宝贝”等。除个性化瓶子之外,可口可乐还鼓励用户在社交媒体平台上使用“#ShareACoke”的标签分享他们与瓶子的合照,或者记录他们分享可乐的时刻#ShareACoke”活动通过个性化定制、社交媒体互动等方式,成功地营造了一种参与性强、情感共鸣深的品牌体验,并为品牌带来了广泛的关注和参与度。01社交平台商务活动发展阶段&特征JUNE12th门户网站的崛起企业开始积极在平台上创建品牌页面、发布内容、与用户互动社交媒体初期阶段主要平台为个人网站、博客、在线论坛视频和图像社交的兴起短视频平台(如抖音、快手)和图像分享平台(如Instagram、小红书)的兴起Web2.0时代企业开始意识到可以通过社交媒体平台直接与用户进行沟通和互动移动互联网时代智能手机的普及和微信、微博等移动社交平台的崛起数据驱动和精准营销通过大数据分析工具收集和分析用户行为数据01社交平台商务活动四大特征JUNE12th01020304用户参与社交平台是互动的场所,企业可以通过举办线上活动和比赛、实时互动等形式引发用户参与,提高用户粘性和忠诚度。广告投放社交平台上广告投放是提升品牌知名度和销售量的重要途径。通过分析平台用户的兴趣、行为习惯和社交关系等数据,可以将广告精准地投放给目标受众,从而提高广告的触达效果和转化率。达人合作跟达人合作是社交平台商务活动的重要策略。扩大品牌曝光和影响力,吸引更多目标受众,也可以借助达人的影响力和粉丝基础来建立更加可信赖的品牌形象。建立品牌形象在社交平台上,企业可以通过发布有趣、有价值的内容来建立品牌形象。其中包括分享行业知识、产品故事、用户案例等,以此来提升品牌认知度和美誉度。Part2社交平台用户行为分析实例严谨勤俭求实开拓02用户行为数据概况JUNE12th本节将展示如何使用Python进行社交平台的数字商务分析,从数据预处理到模型构建,再到结果解释实例使用的数据集为小红书卖货与用户分析数据集,其中各字段解释如表8-2所示02用户行为数据概况JUNE12th1.不同性别的平均购买金额对比下面这段代码通过matplotlib和seaborn库展示了一个包含性别和购买金额数据的PandasDataFrame可视化分析。首先,代码通过matplotlib.font_manager设置中文字体属性。#导入matplotlib的字体管理模块,以便使用自定义中文字体importmatplotlib.font_managerasfm#设置中文字体路径font_path='E:\\OneDrive\\桌面\\simhei.ttf'prop=fm.FontProperties(fname=font_path)#使用FontProperties设置字体属性plt.rcParams['font.family']=prop.get_name()#设置matplotlib的全局配置,以支持中文显示plt.rcParams['axes.unicode_minus']=False02用户行为数据概况JUNE12th接着,使用seaborn的boxplot和barplot函数分别绘制不同性别用户的购买金额箱线图和平均购买金额柱状图,展示了性别对购买行为的影响。1.不同性别的平均购买金额对比#data是格式为pandasDataFrame的实训数据集,包含用户数据和购买金额信息#将性别数据转换为可读格式data['gender']=data['gender'].map({1.0:'男',0.0:'女'})#不同性别的平均购买金额对比plt.figure(figsize=(12,6))plt.subplot(1,2,1)#在图形窗口中创建第一个子图,1行2列的第一个位置sns.boxplot(x='gender',y='revenue',data=data)#使用seaborn的boxplot()函数绘制不同性别用户的购买金额箱线图plt.title('不同性别用户的购买金额箱线图',fontproperties=prop)#设置图表标题,使用之前设置的中文字体属性plt.xlabel('性别',fontproperties=prop)#设置x轴和y轴的标签,同样使用中文字体属性plt.ylabel('购买金额',fontproperties=prop)#对dataDataFrame按照gender字段进行分组,并计算每个性别的平均购买金额gender_avg_revenue=data.groupby('gender')['revenue'].mean().reset_index()plt.subplot(1,2,2)#在图形窗口中创建第二个子图,1行2列的第二个位置sns.barplot(x='gender',y='revenue',data=gender_avg_revenue)plt.xlabel('性别',fontproperties=prop)plt.title('不同性别用户的平均购买金额柱状图',fontproperties=prop)plt.ylabel('平均购买金额',fontproperties=prop)plt.colorbar(label='log_{10}$(population)')plt.tight_layout()plt.show()#显示图表02用户行为数据概况JUNE12th接着,使用seaborn的boxplot和barplot函数分别绘制不同性别用户的购买金额箱线图和平均购买金额柱状图,展示了性别对购买行为的影响。1.不同性别的平均购买金额对比02用户行为数据概况JUNE12th首先,通过matplotlib.font_manager模块设置中文字体属性。接着定义age_group函数将用户年龄分类,并用此函数对DataFrame中的年龄数据进行分组。2.不同年龄段的用户的购买平均金额对比#不同年龄段的用户的购买平均金额对比#加载中文字体importmatplotlib.font_managerasfmfont_path='E:\\OneDrive\\桌面\\simhei.ttf'prop=fm.FontProperties(fname=font_path)plt.rcParams['font.family']=prop.get_name()plt.rcParams['axes.unicode_minus']=False#定义年龄分段函数defage_group(age):ifage<30:return'30以下'elif30<=age<=50:return'30-50'elif50<age<=70:return'51-70'else:return'70以上'#对数据集中的年龄进行分段data['age_group']=data['age'].Apply(age_group)02用户行为数据概况JUNE12th使用groupby方法结合年龄分组对购买金额进行平均计算。设置索引并用年龄顺序列表来排序DataFrame。2.不同年龄段的用户的购买平均金额对比#计算每个年龄段的平均购买金额age_avg_revenue=data.groupby('age_group')['revenue'].mean().reset_index()#对年龄组进行排序以确保条形图按年龄顺序显示age_order=['30以下','30-50','51-70','70以上']age_avg_revenue=age_avg_revenue.set_index('age_group').loc[age_order].reset_index()plt.figure(figsize=(14,6))02用户行为数据概况JUNE12th条形图使用seaborn的barplot函数展示不同年龄段的平均购买金额;饼图使用autopct参数来格式化显示百分比,并通过pctdistance调整标签距离中心的位置,以增强图表的可读性。2.不同年龄段的用户的购买平均金额对比#绘制条形图,使用age_group列的数字排序plt.subplot(1,2,1)sns.barplot(x='age_group',y='revenue',data=age_avg_revenue)plt.title('不同年龄段用户的购买平均金额对比’,fontproperties=prop)plt.xlabel('年龄段',fontproperties=prop)plt.ylabel('平均购买金额',fontproperties=prop)#绘制饼图plt.subplot(1,2,2)#autopct='%1.1f%%'表示标签显示为百分比,保留一位小数#用pctdistance参数来控制这些百分比标签距离饼中心的位置plt.pie(age_group_count,labels=age_group_count.index,autopct='%1.1f%%',pctdistance=1.2,startangle=140,colors=plt.cm.tab20.colors,shadow=True)plt.tight_layout()plt.show()02用户行为数据概况JUNE12th02用户行为数据概况是否参与活动对用户平均购买金额的影响对比利用Pandas的groupby和describe方法对数据集中的revenue字段按用户是否在最近30天内参与App上的重要活动进行分组并开展描述性统计分析使用seaborn的barplot函数绘制两个条形图,分别展示这两组用户的销售额总和与平均值促销效应理论和用户参与度理论认为参与商务活动的用户往往对品牌有更高的认知度和情感连结,这可能会增加其购买意愿和消费频次,从而提升平均购买金额从总销售额来看,未参与活动的用户群体贡献了最大的销售额,这可能是因为这个群体用户数量较多。然而,当查看平均销售额时,参与活动的用户花费更多,这表明虽然他们的数量可能较少,但他们每个人的购买力更强对于品牌来说,鼓励用户参与活动可能会增加用户的参与度和购买意愿。未知组的数据表明这部分用户的行为模式不明确,需要进一步的数据分析来理解这一群体的行为。品牌可能需要更多关注提高参与活动用户的数量,因为这可能带来更高的平均购买额,同时也要研究如何将未参与活动的用户转化为参与活动的用户,以最大化销售额。02用户行为数据概况是否参与活动对用户平均购买金额的影响对比02用户行为数据概况不同生命周期的用户的平均购买金额对比用户生命周期理论和用户行为模式强调,用户在不同的生命周期阶段(如新用户、成长用户、成熟用户、衰退用户)具有不同的消费需求、购买能力和品牌忠诚度。利用Pandas的value_counts方法计算dataDataFrame中lifecycle列的值的频率分布,并通过设置normalize=True来获取每个生命周期阶段用户的比例利用matplotlib和seaborn库创建一个包含两个子图的图形:第一个子图使用sns.barplot方法绘制不同生命周期阶段用户的平均购买金额条形图,第二个子图使用Pandas的plot方法绘制饼图,显示各生命周期用户的人数占比。lifecycle_count=data['lifecycle'].value_counts(normalize=True)plt.figure(figsize=(12,6))plt.subplot(1,2,1)sns.barplot(x='lifecycle',y='revenue',data=data,order=['C','B','A'])plt.title('不同生命周期阶段用户的平均购买金额对比',fontproperties=prop)plt.xlabel('用户的生命周期阶段',fontproperties=prop)plt.ylabel('平均购买金额',fontproperties=prop)plt.subplot(1,2,2)lifecycle_count.plot(kind='pie',autopct='%1.1f%%',pctdistance=1.2,startangle=140,labels=lifecycle_count.index)plt.title('不同生命周期阶段用户的人数占比',fontproperties=prop)plt.ylabel('')plt.tight_layout()plt.show()生命周期C阶段的用户平均购买金额最高。生命周期B阶段的用户平均购买金额略低于C阶段,但仍然较高。生命周期A阶段的用户平均购买金额最低,表明这个群体的消费较为保守。生命周期C阶段的用户尽管占据了用户总数的大多数,他们的平均购买金额也最高,这可能表明随着对品牌的熟悉度增加,用户的购买信心增强,从而愿意进行更多消费。A阶段的新用户平均消费最低,这可能反映了新用户的对品牌的不熟悉进行了试探性购买。02用户行为数据概况不同生命周期的用户的平均购买金额对比Part3用户行为画像严谨勤俭求实开拓使用RFM模型(Recency-Frequency-Monetary,时间间隔-交易频率-交易金额)对用户进行行为画像分析和分层打分。03用户行为画像RFM模型搭建1.数据集处理检查数据集中是否有用户ID或类似的唯一标识符,以便按用户进行分组。缺少用户ID,无法直接按用户分组来计算购买频率。如果每行代表一个独立的交易,可以简化地将每行视为一个“用户”的单次交易。2.创建模型组成部分基于数据集所包含的信息和RFM模型,做出假设和简化。使用days_since_last_order字段计算R(Recency)。使用previous_order_amount字段来计算M(Monetary)。由于数据集无法确定具体的频率,将忽略F(Frequency)维度。03用户行为画像RFM模型搭建根据最近一次购买时间(Recency)和购买金额(Monetary)两个维度对数据进行分级。将用户分为以下几类:①高价值用户:高Recency得分和高Monetary得分;②潜在发展用户:低Recency得分,但高Monetary得分;③消费频繁用户:高Recency得分,但低Monetary得分;④低价值用户:低Recency得分和低Monetary得分。Recency(R_Score)数值越小表示越近期有交易,因此得分越高;Monetary(M_Score)数值越大表示消费金额越高,因此得分越高。3.数据分级03用户行为画像RFM模型搭建绘制最近一次交易(Recency)和交易金额(Monetary)的分布图(如下图所示)。在最近一次交易的分布图中,大部分用户的最近一次交易时间集中在较短的时间区间内,这表明大多数用户在不久前有过交易行为,用户群体整体较为活跃。然而,也存在一些用户在较长时间内没有交易,这可能是潜在流失用户。针对这一点,社交媒体商务活动应该关注于提高用户的活跃度和参与度。例如,通过发布定期的互动内容、促销活动和新产品信息来保持用户的兴趣和参与。03用户行为画像RFM模型搭建交易金额分布图中,大部分用户的交易金额集中在较低的金额区间,说明有很多小额交易。高金额的交易较少,但仍有一定数量的用户交易金额较高,这些可能是高价值用户。对于那些消费水平较高的用户群体,可以通过社交平台提供高价值内容,如独家优惠、会员专享活动,甚至是定制化的产品推荐,以进一步增强这些高价值用户的忠诚度和满意度。对于消费水平较低的用户,可以考虑使用更具吸引力的促销策略来提高他们的消费意愿和能力。03用户行为画像RFM模型搭建03用户行为画像RFM模型搭建依据不同RM得分组合(例如,“51”表示R得分为5,M得分为1)划分用户数量分布。RM得分为“55”的条形高度较高,这表明存在大量用户群体在最近一次购买行为中表现出了较高的消费金额(M得分为5),但购买行为相对低频(R得分为5)。与此相对,RM得分为“15”的条形较短,说明在近期内频繁购买且单次消费金额较低的用户群体较为稀缺。03用户行为画像细分用户标签第一步:定义复合标签根据数据集中gender(性别)、lifecycle(生命周期)和age(年龄)字段以及RFM得分来创建复合标签。第三步:提取和汇总对不同的复合标签进行计数,以了解各标签类别的用户数量。分析这些标签的分布,了解哪些用户群体最大,哪些群体可能需要更多关注。第二步:创建标签使用Python中的.Apply()方法,根据上文定义的规则(性别、生命周期、年龄分组)对数据进行分类。结合这些分类和RFM得分,创建复合标签。第四步:生成可视化图表使用可视化图表展示不同复合标签的用户分布。JUNE12th除了RFM得分之外,也可以考虑数据集中的其他维度,如年龄、性别、生命周期阶段等,来进一步细分用户标签。03用户行为画像细分用户标签:第一步第一步:定义复合标签根据数据集中gender(性别)、lifecycle(生命周期)和age(年龄)字段以及RFM得分来创建复合标签。其中gender字段中的1标记为“Male”,0标记为“Female”,其余标记为“Unknown”;使用lifecycle字段中的值(A,B,C),代表用户在注册后的不同阶段,分别对应注册6个月内,1年内,2年内;将年龄分为“Young”(<30岁)、“Middle-Aged”(30-60岁)、“Senior”(>60岁)。除了RFM得分之外,也可以考虑数据集中的其他维度,如年龄、性别、生命周期阶段等,来进一步细分用户标签。03用户行为画像细分用户标签:第二步第二步:创建标签使用Python中的.Apply()方法,根据上文定义的规则(性别、生命周期、年龄分组)对数据进行分类。结合这些分类和RFM得分,创建复合标签。#对性别标签进行分类defcategorize_gender(gender):ifgender==1:return'男'elifgender==0:return'女'else:return'性别未知'#对年龄标签进行分段defcategorize_age(age):ifage<30:return'青年'elifage<=60:return'中年'else:return'老年'#创建复合标签data['Gender_Group']=data['gender'].Apply(categorize_gender)data['Age_Group']=data['age'].Apply(categorize_age)data['Composite_Label']=data['Age_Group']+“_”+data['Gender_Group']+“_”+data['lifecycle']+“_RM”+data['RM_Score']03用户行为画像细分用户标签:第三步第三步:提取和汇总对不同的复合标签进行计数,以了解各标签类别的用户数量。分析这些标签的分布,了解哪些用户群体最大,哪些群体可能需要更多关注。03用户行为画像细分用户标签:第四步第四步:生成可视化图表使用可视化图表展示不同复合标签的用户分布。03商务活动策略基于上述分析的营销策略一、中年用户群体的兴趣和需求考虑到这些用户是中年群体,商务营销内容应该更加贴近他们的生活方式和兴趣。例如,可以在小红书平台上推广与家庭、健康、职业发展相关的产品和内容。三、不同RM得分的个性化策略例如:对于RM得分为12和13的用户(即最近较高频率的购买行为,但消费金额较低),可以通过推送高性价比的商品或捆绑销售来提高他们的消费金额。二、激活C生命周期阶段的用户由于这些用户处于注册2年内的生命周期阶段,可能需要更多的激励来提高其活跃度和购买频率,并可以通过提供特别优惠、限时折扣或忠诚度奖励来吸引他们再次购买。四、内容营销和社交互动利用小红书的社交媒体特性,通过创造吸引中年用户的内容(如博客、视频教程、用户体验分享)来提高参与度。同时可以鼓励用户之间的互动和社区建设,如创建或参与同产品相关的话题讨论,增加用户的参与感和归属感。JUNE12thPart4用户未来购买行为预测严谨勤俭求实开拓01模型、算法介绍JUNE12th随机森林(RandomForest):核心思想:"团队决策优于个人判断"通过整合多棵决策树的预测结果(如团队投票),提升准确性和稳定性,避免单棵树的过拟合风险。工作原理:1.双重随机性数据抽样:每棵树用随机样本训练(如抽奖券放回抽取),部分数据未被使用(天然验证集)。特征选择:节点分裂时仅用随机子集特征(如10个特征中随机选3个),增强多样性。2.结果聚合:所有树投票决定最终预测(分类任务)或取均值(回归任务)。01模型、算法介绍JUNE12th支持向量机(SVM):核心思想"最大化安全距离”寻找最优超平面分隔两类用户(如买/不买),确保边界到最近数据点的距离最大(类似拓宽护城河),提升泛化能力。关键技术1.支持向量:仅依赖边界上的关键样本(如高价值用户临界点),降低冗余数据干扰。2.核函数:线性核:特征与购买行为呈简单线性关系时(如"客单价>500"直接分类)RBF核:处理复杂模式(如用户突然从低频转高频购买),通过升维找到隐藏规律01模型介绍JUNE12th场景推荐模型原因数据量>10万条,特征冗余随机森林高效处理噪声,自动特征筛选样本<1万,特征精炼SVM边界优化更精准,避免过拟合需解释关键驱动因素随机森林输出特征重要性排名追求最高预测准确率SVM小样本下分类边界更稳定02基于DeepSeek的用户行为预测-指令1JUNE12th02基于DeepSeek的用户行为预测-指令2JUNE12th02基于DeepSeek的用户行为预测-指令3JUNE12th、由DeepSeek的结果可知,随机森林模型的RMSE约为276.032,R2约为-0.066。02结果解读JUNE12thR²:模型解释变量变异的比例(0-1,越高越好)R²小于1的主要原因(1)模型过于简单或不适当:随机森林可能不适合这个特定的数据集,或者需要更多的调优来改进模型:(2)数据特征不足:可能需要更多的特征或更有信息量的特征来提高模型的预测能力:(3)数据质量问题:如果数据中有很多噪声或异常值,这可能会影响模型的性能;(4)过拟合或欠拟合:模型可能没有很好地从训练数据中学习,或者它过度地学习了训练数据中的噪声。RMSE:它衡量的是预测值与真实值之间的差异,即模型预测的误差大小。RMSE均值→预测性能RMSE标准

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论