Python商务数据分析与应用(AIGC版 微课版)课件 第6、7章:数字化广告、电子商务平台商务活动分析_第1页
Python商务数据分析与应用(AIGC版 微课版)课件 第6、7章:数字化广告、电子商务平台商务活动分析_第2页
Python商务数据分析与应用(AIGC版 微课版)课件 第6、7章:数字化广告、电子商务平台商务活动分析_第3页
Python商务数据分析与应用(AIGC版 微课版)课件 第6、7章:数字化广告、电子商务平台商务活动分析_第4页
Python商务数据分析与应用(AIGC版 微课版)课件 第6、7章:数字化广告、电子商务平台商务活动分析_第5页
已阅读5页,还剩105页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第6章

数字广告投放及效果分析SOUTHWESTERNUNIVERSITYOFFINANCEANDECONOMICS01案例引入02数字广告概述03数字广告数据分析04数字广告效果分析05Deepseek实训Part1案例引入严谨勤俭求实开拓案例引入——豪士面包的神不知鬼不觉植入操作01Part2数字广告概述严谨勤俭求实开拓02何为数字广告?数字广告是指通过互联网和移动设备等数字渠道传播的广告形式,根据广告的形式和内容,数字广告可以分为以下几种类型:搜索引擎广告社交媒体广告原生广告视频广告开屏广告插屏广告横幅广告02数字广告类型——搜索引擎广告

举例

概念搜索引擎广告是一种基于关键词搜索的广告形式,广告主可以通过竞价排名的方式,在搜索引擎的搜索结果页面中展示广告。当用户输入与广告相关的关键词时,搜索引擎会将广告显示在搜索结果中,吸引用户的点击和转化。谷歌AdWords和百度推广是两个常见的搜索引擎广告平台。当用户在搜索引擎上输入与广告相关的关键词时,相关的广告就会显示在搜索结果页面的顶部或侧边,吸引用户点击。02数字广告类型——社交媒体广告举例概念社交媒体广告是投放在社交媒体平台的广告形式。广告主可以在社交媒体平台上创建广告账户,根据目标受众和预算进行定向投放。社交媒体广告可以以多种形式呈现,如文字、图片、视频等,吸引用户的关注和互动。02数字广告类型——原生广告举例概念原生广告是通过模拟内容形式和流程,与用户产生一致性融合的广告形式。它可以在网站或App等数字渠道的内容中,以类似于自然内容的形式呈现。原生广告可以提高广告的曝光度和接受度,减少用户的抵触感。——简单概括,就是看起来不明显,和产品环境融为一体的广告。02数字广告类型——视频广告举例概念视频广告是通过视频展示广告内容的广告形式。它可以在电视、网络视频和移动设备等多种平台上进行投放。视频广告可以以拍摄、动画等不同形式呈现,刺激用户的视觉和听觉等感官,提高广告的影响力和品牌认知度。这些广告可以以各种形式呈现,从短片到完整的宣传片,吸引用户的视听感官,传达品牌信息。02数字广告类型——开屏广告举例概念开屏广告是全屏展示的广告形式,在用户进入网站或App时自动弹出开屏广告,其遮挡了网站或App的内容,通常有一个关闭按钮,图中展示的是微博App的开屏广告。开屏广告可以在短时间内吸引用户的注意力,但也容易引起用户的不满和抵触。02数字广告类型——插屏广告举例概念插屏广告是以全屏或半屏等形式展示广告内容的广告形式,它可以在用户操作网站或App时,以弹出窗口的形式进行展示,弹出的可能是图片、视频或其他形式的广告。插屏广告通常有一个关闭按钮,用户可以选择关闭或进一步了解广告内容。02数字广告类型——横幅广告举例概念横幅广告是在网站或App页面上以横向条形的形式展示广告内容的广告形式。横幅广告通常位于网站或App的顶部或底部,以文字、图片或动画等形式呈现。横幅广告可以在用户浏览网站或App时,吸引用户的注意力。网页上的横幅广告通常显示在内容的上方或下方,并且可以是图片广告或动画广告。02数字广告特点数字广告特点效果个性化营销

可以根据用户的兴趣、行为数据等信息,向特定目标受众投放定制的广告内容灵活性和实时性

数字广告制作周期较短,可以及时调整广告内容、投放渠道和投放时间广告效果可测量

通过数据分析工具可以提供详细的广告效果报告,包括展示量、点击量、转化率等指标创意表现形式多样

可以通过文字、图片、视频、动画等多种方式来吸引用户的注意力成本效益

数字广告通常具有更低的投放成本和更高的投资回报率实时互动和反馈

提供了实时互动和反馈机制,使得企业可以与用户进行即时的沟通和互动跨平台传播

数字广告可以在多个平台上进行传播,如搜索引擎、社交媒体、移动应用等可持续优化基于详细的广告效果报告,企业可以进行持续的广告优化和改进02数字广告推广步骤定向投放广告监测和优化广告效果实时互动和反馈定期评估创作吸引人的广告内容定义目标受众123458选择合适的广告平台制定广告投放策略7602数字广告推广——定义目标受众目的

了解目标受众的特点、兴趣和需求等信息,提高广告的精准度和针对性。举例

华为品牌不同系列的手机对应不同需求的人群nova系列、mate系列、P系列。市场调研和数据分析年龄性别地理位置兴趣爱好消费习惯建立清晰的用户画像02数字广告推广——选择合适的广告平台目的

根据目标受众特点和广告目标,选择合适的平台进行推广以提高广告的曝光度和点击率。搜索引擎平台社交媒体平台视频平台常见广告平台02数字广告推广——制定广告投放策略目的

根据不同的平台和受众特点,制定相应的广告投放策略。具体的广告投放策略广告预算、广告形式、投放时间、频次控制、确定清晰的广告目标竞争对手的广告投放策略(注意差异化突出自身优势)2020年暑期6-8月暑期的集中投放时间投放平台投放的Top素材投放文案的侧重点相似处美团外卖集中在7月份力推的“超级外卖节”以及夜宵大促活动投放各平台的占比较为平均;长尾化程度较高投放的素材内容更多体现商家/店铺的卖点。更多关注菜品本身,同时注重餐饮商家品牌的展现更加强调如何促进老用户的活跃性,增加复购率。关键词种草上,更加强调“网红店”。两者投放的素材均以图片广告为主,其占比超过9成。两者在近期的获客基本都在通过明星的影响力和粉丝效应而带动自身的热度。两款App同时会在其官方微信、微博平台通过跨界营销的方式持续提升自身的品牌曝光度。饿了么反观《饿了么》在8月则联合潮牌、综艺、游戏厂商等举办了一系列“出圈”活动头部化特点,其在巨量引擎且占比远超其余平台;以头条系媒体为主聚焦在C端并通过折扣与优惠信息来吸引消费者。更加注重平台本身Logo的露出和打折优惠信息。《饿了么》更加注重新用户的获取,如“首单”、“新用户专享”频繁出现。关键词种草上,主打情怀牌,强调“家”、“童年”等人生重要记忆点。内容来自热云数据分析文章02数字广告推广——创作吸引人的广告内容目的

优质广告内容激发受众兴趣并深入人心。在设计广告内容时,要简洁明了、富有创意,并与目标受众的价值观和需求相契合。那些深入人心的广告印象士力架:林黛玉守门员央视出品的公益类精品广告:关爱老人系列、回家系列、环保公益、童年公益系列、社会主义核心价值观系列……尝试故事性元素、情感共鸣的方式02数字广告推广——定向投放广告并检测和优化广告效果目的

将广告精准地传达给潜在用户,提高广告投放效果;根据数据分析结果,及时调整广告投放策略,优化广告内容和投放方式,提高广告效果和回报率。一般过程利用广告平台提供的定向投放功能,根据用户的兴趣爱好、行为特征等信息进行精准定位。举例

巨量引擎(面向B端客户)、巨量千川(面向电商商家)数据分析工具和广告平台提供的数据报告,实时监测广告的展示量、点击量、转化率等指标。举例

千瓜数据、飞瓜数据、热云数据ADI02数字广告推广——实时互动和反馈并定期评估目的

及时回复用户的评论和问题,积极参与用户互动,可以增加用户对品牌的认可度和信任感。企业通过互动和反馈了解用户的需求和反馈,从而针对性地优化广告内容和推广策略,促进用户参与和品牌互动。

定期对广告推广效果进行评估和分析,了解广告的优势和不足。根据评估结果,及时调整广告策略和推广方案,优化广告投放效果,提高广告的相关性和转化率,持续评估和调整有助于提高广告推广的效果和回报率。

两者贯穿广告投放始终。Part3数字广告数据分析严谨勤俭求实开拓03数字广告数据分析数字广告数据集概况本章数据为阿里云天池提供的公开的淘宝网广告展示/点击数据,共有4个数据列表(1)raw_sample数据集是从淘宝网站中随机抽样了114万用户8天内的广告展示/点击日志03数字广告数据分析数字广告数据集概况(2)广告基本信息ad_feature数据集文件涵盖了raw_sample中全部广告的基本信息PS:其中一个广告ID对应一个商品,一个商品属于一个类目,一个商品属于一个品牌03数字广告数据分析数字广告数据集概况(3)用户基本信息表user_profile文件涵盖了raw_sample中所有用户的基本信息03数字广告数据分析数字广告数据集概况(4)用户的行为日志behavior_log文件涵盖了raw_sample中所有用户22天内的购物行为03数字广告数据分析数据清洗(1)数据缺失值和重复值查询importpandasaspd#读取数据df=pd.read_csv(r'raw_sample.csv')users=pd.read_csv(r'user_profile.csv')ad=pd.read_csv(r'ad_feature.csv')bl=pd.read_csv(r'behavior_log.csv')#数据预处理#查询缺失值missing_values_df=df.isnull().sum()print("raw_sample缺失值:\n",missing_values_df)通过

pd.read_csv()函数导入了4个CSV文件,分别是raw_sample.csv、user_profile.csv、ad_feature.csv、behavior_log.csv通过.isnull().sum()可以统计每个数据集中的缺失值数量03数字广告数据分析数据清洗(1)数据缺失值和重复值查询duplicate_rows_df=df[df.duplicated()]print("raw_sample重复行:\n",duplicate_rows_df)duplicate_rows_users=users[users.duplicated()]print("ad_feature重复行:\n",duplicate_rows_users)duplicate_rows_ad=ad[ad.duplicated()]print("ad_feature重复行:\n",duplicate_rows_ad)duplicates_count_bl=bl.duplicated().sum()print("behavior_log重复行:",duplicates_count_bl)通过.duplicated()可以检测重复行,并使用.sum()计算重复行的总数03数字广告数据分析数据清洗(2)数据处理—处理缺失值#使用众数填充缺失值pvalue_level_mode=users['pvalue_level'].mode()[0]users['pvalue_level'].fillna(pvalue_level_mode,inplace=True)new_user_class_level_mode=users['new_user_class_level'].mode()[0]users['new_user_class_level'].fillna(new_user_class_level_mode,inplace=True)'pvalue_level'(消费档次:1低2中3高)与'new_user_class_level'(城市层次)字段的属性值为分类属性.mode()[0]统计数据列中的众数.fillna将缺失值替换成众数inplace=True在原数据上进行修改,而非生成一个新的数据副本'brand'(品牌ID)字段为id类数据,可填充其上下条数据的值#用前一个数据对'brand'缺失的数据进行填充ad.fillna(method='pad',inplace=True)method='pad'表示使用前一个非缺失值来填充当前的缺失值03数字广告数据分析数据清洗(2)数据处理—处理缺失值03数字广告数据分析数据清洗(2)数据处理—处理重复行#删除重复行bl.drop_duplicates(inplace=True)#重新设置索引,从0开始bl.reset_index(drop=True,inplace=True)#删除重复行bl.drop_duplicates(inplace=True)#重新设置索引,从0开始bl.reset_index(drop=True,inplace=True)drop_duplicates()识别和删除重复行reset_index()用于重置索引drop=True表示丢弃原来的索引,用从0开始的连续整数索引替代查找缺失值与重复行填充缺失值再次查找缺失值删除重复行重新设置索引数据导入总结03数字广告数据分析数字广告指标分析(1)广告点击率目的

提高广告投放效果;提升用户体验和品牌认知度①广告角度广告角度将从广告投放渠道、广告投放时间、广告投放价格三个方面分析计算整体广告点击率#查看整体广告点击率clk_per=df.clk.sum()/1000000*100print(clk_per)df.clk.sum():对raw_sample里clk列的所有值进行求和输出结果:4.9493%03数字广告数据分析数字广告指标分析(1)广告点击率①广告角度广告投放渠道raw_sample文件中的‘pid’字段——“资源位”资源位通常是一种受欢迎的广告展示位置,通常由平台或网站的所有者或管理者提供,并且这些位置往往被认为是有较高曝光度和流量的位置。种类位置路径形式开屏页APP打开前通常为满屏海报或视频弹屏页APP内弹出模态弹窗,可交互Banner页首页醒目位置通常为轮播图Push手机消息页面进入后一般为长图文内容或H5页03数字广告数据分析广告投放渠道#查看广告投放渠道点击率importmatplotlib.pyplotaspltimportseabornassnsfrommatplotlib.font_managerimportFontPropertiesfont=FontProperties(fname=r"C:\Windows\Fonts\SimHei.ttf",size=12)#设置字体sns.set_style("white")#设置Seaborn图表样式为简洁白色背景plt.figure(figsize=(3,4),dpi=200)#创建图表,宽3英寸高4英寸,分辨率200dpix=df['pid'].unique()#获取所有不同的投放渠道IDy=df.groupby(by=['pid'])['clk'].sum()/1000000#将资源位分组分别求点击率

sns.barplot(x,y,palette='Oranges_r')#设置横纵坐标标签plt.xlabel('投放渠道',fontproperties=font)#设置x轴标签为"投放渠道"plt.ylabel('点击率',fontproperties=font)#设置y轴标签为"点击率"plt.show()#显示图形首先使用Seaborn库绘制了一个柱状图,用于显示不同广告资源位的点击率。通过df['pid'].unique()获取了所有广告资源位的唯一标识,然后利用

groupby()函数按照广告资源位分组,计算每个资源位的点击率(点击次数除以总曝光次数),最后使用Seaborn的

barplot()函数将资源位和对应的点击率绘制成柱状图。最终,通过调用plt.show()函数显示生成的图形。03数字广告数据分析图示如下:03数字广告数据分析首先按照小时数对数据进行分组,并计算每个小时的点击次数。接着,使用

Seaborn的条形图函数barplot()绘制每个小时的点击次数的柱状图,并将结果按照小时数进行排序。广告投放时间——一天时间段分析frommatplotlib.font_managerimportFontPropertiesfont=FontProperties(fname=r"C:\Windows\Fonts\SimHei.ttf",size=12)df['hour']=pd.to_datetime(df['time_stamp'],unit='s').dt.hourdf['hour']=df['hour'].astype('int')#将小时数转换为整数类型sns.set_style("white")plt.figure(figsize=(6,5),dpi=200)x=sorted(df['hour'].unique())#对小时数进行排序y=df.groupby(by=['hour'])['clk'].sum()/1000000sns.barplot(x=[i+1foriinrange(len(x))],y=y,palette='GnBu')plt.xlabel('时间',fontproperties=font)plt.ylabel('点击率',fontproperties=font)plt.show()03数字广告数据分析广告投放时间——一周时间段分析frommatplotlib.font_managerimportFontPropertiesfont=FontProperties(fname=r"C:\Windows\Fonts\SimHei.ttf",size=12)df['weekday']=pd.to_datetime(df['time_stamp'],unit='s').dt.weekdaydf['weekday']=df['weekday'].astype('int')#将周几转换为整数类型sns.set_style("white")plt.figure(figsize=(8,5),dpi=200)x=sorted(df['weekday'].unique())#对周几进行排序y=df.groupby(by=['weekday'])['clk'].sum()/4000000sns.barplot(x=[i+1foriinrange(len(x))],y=y,palette='BuPu')plt.xlabel('一周时间',fontproperties=font)plt.ylabel('点击率',fontproperties=font)plt.show()从一天时间扩展至一周时间,查看一周内的广告点击率情况03数字广告数据分析广告投放价格-不同价格区间的广告点击率importnumpyasnpbins=[-float('inf'),200,400,600,800,1000,float('inf')]#定义价格区间的边界,包含负无穷和正无穷作为边界labels=['[0,200)元','[200,400)元','[400,600)元','[600,800)元','[800,1000)元','[1000,+∞)元']#定义标签#使用numpy的digitize函数将价格分类,并将结果放入新的'price_class'列中ad['price_class']=np.digitize(ad['price'],bins=bins,right=False)#将标签映射到新的列中ad['price_class']=ad['price_class'].map({i:labelfori,labelinenumerate(labels,1)})#连接ad_feature和raw_sample两表,并计算不同价格区间中广告的点击率情况df_ad=df.merge(right=ad,on='adgroup_id',how='left')frommatplotlib.font_managerimportFontPropertiesfont=FontProperties(fname=r"C:\Windows\Fonts\SimHei.ttf",size=12)PS:对广告投放价格进行分组,并分别计算不同价格区间的广告点击率情况03数字广告数据分析广告投放价格-不同价格区间的广告点击率#计算每个价格分类的广告点击率情况price_class_counts=df_ad['price_class'].value_counts()sns.set_style("white")plt.figure(figsize=(8,5),dpi=200)x=df_ad['price_class'].unique()y=df_ad.groupby(by=['price_class'])['clk'].sum()/price_class_counts#计算每个价格分类中的点击率plt.ylim(0,0.08)#设置Y轴范围lineplot=sns.lineplot(x=y.index,y=y.values,marker='o')#绘制折线图#在每个数据点上显示数值fori,valinenumerate(y.values):lineplot.annotate(f'{val:.3f}',(y.index[i],val),textcoords="offsetpoints",xytext=(0,5),ha='center')plt.ylabel('点击率',fontproperties=font)plt.show()03数字广告数据分析图示如下:03数字广告数据分析广告投放价格-不同价格区间的广告点击率占比#计算每个价格分类点击率在总体点击率的占比情况sns.set_style("white")plt.figure(figsize=(8,5),dpi=200)x=df_ad['price_class'].unique()y=df_ad.groupby(by=['price_class'])['clk'].sum()/1000000#绘制饼图plt.pie(y,labels=x,colors=sns.color_palette('Blues_r'))plt.xlabel('价格区间',fontproperties=font)plt.ylabel('点击率',fontproperties=font)plt.show()03数字广告数据分析数字广告指标分析(1)广告点击率目的

提高广告投放效果;提升用户体验和品牌认知度②用户角度从用户的角度分析广告点击率,总结有点击行为的用户特征,有助于筛选出广告投放的目标人群。本部分将从用户性别、消费档次、购物深度、是否为大学生、年龄层次

5个方面展开03数字广告数据分析用户性别#连接user_profile和raw_sample两表,筛选出有点击广告行为的用户#数据预处理df.set_index(["user"],inplace=True)users['user']=users.useriduser_ac=pd.merge(df,users,right_on='user',left_index=True,how='outer')#合并user_ac.clk.replace(0,np.nan,inplace=True)#clk=0的替换为nan值user_ac.dropna(inplace=True)#删除缺失值所在的行user_ac.clk.replace(0,np.nan,inplace=True)#确保'clk'列中不含有0值#用户性别画图plt.figure(figsize=(4,4),dpi=200)x=user_ac['final_gender_code'].astype(int).unique()#转换为整数类型y=user_ac.groupby(by=['final_gender_code']).size()sns.barplot(x,y,palette='Oranges_r')plt.ylabel('点击次数',fontproperties=font)plt.show()连接两张数据表user_profile和raw_sample,筛选出有点击广告行为的用户,查看其性别分布情况。首先将raw_sample数据表以用户作为索引,与user_profile数据表按照用户ID进行合并,保留了两表中共有的用户信息,并且剔除了clk列为0的行,最后通过绘制柱状图展示了不同性别用户的数量。03数字广告数据分析图示如下:03数字广告数据分析消费档次#消费档次画图plt.figure(figsize=(3,3),dpi=200)x=user_ac['pvalue_level'].astype(int).unique()y=user_ac.groupby(by=['pvalue_level']).size()sns.barplot(x,y,palette='Accent_r')plt.ylabel('点击次数',fontproperties=font)plt.show()

分析潜在用户的购买能力,需要分析不同消费档次人群的广告点击情况。03数字广告数据分析购物深度#购物深度plt.figure(figsize=(3,3),dpi=200)x=user_ac['shopping_level'].astype(int).unique()y=user_ac.groupby(by=['shopping_level']).size()sns.barplot(x,y,palette='GnBu')plt.ylabel('点击次数',fontproperties=font)#设置纵坐标范围和刻度间隔plt.ylim(5000,160000)plt.yticks(range(5000,160000,50000))plt.show()

为了深入了解潜在用户的购买意图和行为模式,需要分析不同购物深度用户的广告点击情况。03数字广告数据分析是否是大学生#是否为大学生画图plt.figure(figsize=(4,4),dpi=200)x=user_ac['occupation'].astype(int).unique()y=user_ac.groupby(by=['occupation']).size()sns.barplot(x,y,palette='Oranges_r')plt.ylabel('点击次数',fontproperties=font)plt.show()

大学生群体具有独特的消费习惯和生活方式,其购买力和在线活跃度也较高。通过深入了解是否是大学生,广告主能够精准定位目标市场,调整广告内容和营销策略以更好地满足他们的需求和引起他们的兴趣。03数字广告数据分析年龄层次#年龄层次plt.figure(figsize=(4,4),dpi=200)frommatplotlib.font_managerimportFontPropertiesfont=FontProperties(fname=r"C:\Windows\Fonts\SimHei.ttf",size=10)plt.figure(figsize=(4,4),dpi=200)x=user_ac['age_level'].astype(int).unique()y=user_ac.groupby(by=['age_level']).size()sns.barplot(x,y,palette='Blues_r')#设置横坐标标签plt.xticks(ticks=[0,1,2,3,4,5,6],labels=['60岁以上','51-60岁','41-50岁','31-40岁','26-30岁','18-25岁','18岁以下'],fontproperties=font,rotation=30)plt.ylabel('点击次数',fontproperties=font)plt.show()PS:点击用户的年龄层次分布情况可以帮助广告主更精确地理解目标受众特征,并针对不同年龄段的用户设计和优化广告内容,以增强用户的关注度和互动性。03数字广告数据分析图示如下:02数字广告数据分析数字广告指标分析(2)广告转化率前面分析是基于广告点击率为指标对比广告效果(CPC相关),接下来将按用户点击后的行为作为指标来进行广告效果对比分析,用户点击后的行为主要包括加入加购转化率,收藏转化率和购买转化率(CPA相关)。03数字广告数据分析(2)广告转化率frompyechartsimportFunnel#分析转化率#统计每种btag值的数量btag_counts=bl['btag'].value_counts()print(btag_counts)#创建包含数据和列名的datadata=[['pv',3530621,3530621/3530621], ['fav',51711,51711/3530621], ['cart',88026,88026/3530621],['buy',49641,49641/3530621]]columns=['btag','count','percentage']btag=pd.DataFrame(data,columns=columns)使用Python中的Pyecharts库来创建一个漏斗图,用于分析转化率。首先,通过统计behavior_log数据集中不同'btag'值的数量,将数据存储在DataFrame中,计算每个'btag'值对应的转化率百分比03数字广告数据分析(2)广告转化率#打印DataFrame的摘要信息print(())#提取列并计算百分比attrs=btag['btag'].tolist()attr_value=(np.array(btag['percentage'])*100).tolist()print(attrs)print(attr_value)#画漏斗图frompyechartsimportoptionsasoptsfrompyecharts.chartsimportFunnel#提取数据attrs=btag['btag'].tolist()attr_value=(np.array(btag['percentage'])*100).tolist()03数字广告数据分析#绘制漏斗图funnel_chart=(Funnel().add(series_name="",data_pair=list(zip(attrs,attr_value)), gap=2, tooltip_opts=opts.TooltipOpts(trigger="item",formatter="{a}<br/>{b}:{c}%"),).set_global_opts(title_opts=opts.TitleOpts(title="漏斗图示例")))#保存漏斗图funnel_chart.render("funnel_chart.html")03数字广告数据分析图示如下:Part4数字广告效果分析严谨勤俭求实开拓04数字广告效果分析数字广告指标分析能够帮助识别出对于评估广告效果较为重要的指标,以及如何运用这些指标分析广告效果。数字广告效果分析将综合这些关键指标,从广告投放的整体层面分析多个指标对广告实际效果和业务成果的影响,为优化广告投放策略提供更深入的见解和指导。通过各类广告渠道90天内日均UV、平均注册率、平均搜索量、访问深度、平均停留时间、订单转化率、投放时间、素材类型、广告类型、合作方式、广告尺寸和广告卖点等特征将渠道分类,找出每类渠道的重点特征,为业务讨论和数据分析提供支持。04数据清洗与预处理数据勘探导入分析所需要的numpy、Pandas、matplotlib和sklearn库,通过head()与info()方法获取数据结构和简要摘要,随后,使用isnull().any(axis=0)方法检查每一列是否存在缺失值,使用duplicated()方法查找数据集中的重复行。倘若有缺失值,调用

dropna()方法删除包含至少一个缺失值的行,确保数据集中的每一行都是完整的。然后,使用drop()方法删除名为'Unnamed:0'的无用索引列。04数据清洗与预处理相关性分析由于数值型变量较多,可能会有一些特征是高度相关的。通过相关性分析,可以识别出这些高度相关的冗余特征。常用的数据相关性分析可视化工具则是热力图。热力图通过颜色深浅直观呈现数据间的相关性强度,相较于纯数字表格,其色块矩阵能快速定位高相关或弱相关变量组合,尤其适合呈现多维数据的全局关联模式。此外,渐变色阶强化了对比度,便于识别极端值或异常区域,而视觉连续性设计则凸显了数据分布趋势,帮助观察者无需逐行解析即可把握核心规律。.04数据清洗与预处理相关性分析色块的颜色越深,表示数据间的相关性越强。这说明数值型变量相关性很高,平均停留时间与访问深度相关性较大,考虑二者表达的含义相近,故删除平均停留时间列,完成数据再处理.04数据清洗与预处理处理分类变量数据中存在“素材类型”“广告类型”等分类变量,其取值为离散值(如“jpg”“横幅广告”等),且不同变量的取值范围不同。大多数机器学习算法(如K-means聚类)仅能处理数值型数据,无法直接识别分类数据的语义信息,因此需将分类变量转换为数值形式,以便模型学习。步骤:1.查看取值情况通过遍历分类变量(如“素材类型”“广告类型”等),打印其所有唯一取值,明确每个变量的可能取值范围。例如,“素材类型”可能包含“jpg”“swf”“gif”等取值。2.独热编码(One1-HotEncoder)原理:将每个分类变量的不同取值转换为独立的二进制哑变量(0或1)。作用:消除分类变量取值的顺序影响(如“jpg”和“swf”无高低之分),将分类信息转换为机器可识别的数值特征。3.数值型特征归一化方法:采用离差标准化(MinMaxScaler),将数值型特征值缩放到[0,1]区间作用:消除不同特征量纲的影响(如“日均UV”和“订单转化率”量纲差异大),避免模型因特征尺度不同而产生偏差。4.合并特征矩阵将归一化后的数值型特征与独热编码后的分类特征合并,形成新的特征矩阵X。该矩阵统一了数据格式,确保后续聚类分析时模型能有效学习数据模式。04数据清洗与预处理图示如下:04基于Deepseek的K-means聚类K-means聚类算法原理K-means聚类是一种无监督学习算法,核心目标是将数据点按相似性划分为K个群组,无需预先标注数据类别。步骤初始化聚类中心:随机选择K个数据点作为初始聚类中心。分配数据点:计算每个数据点到K个中心的距离,将其分配到最近的中心所属的群组。更新聚类中心:重新计算每个群组内所有数据点的均值,作为新的聚类中心。迭代优化:重复上述分配和更新步骤,直到聚类中心不再显著变化或达到最大迭代次数,最终形成稳定的聚类结果。04广告效果分析通过聚类后,所有的渠道被分为4类,下面将利用柱状图展示每个聚类类别下的样本量和样本占比。首先利用groupby()函数对merge_data中的'渠道代号'列按照'clusters'列进行分组,然后使用count()函数计算每个聚类类别的样本量。接着,将样本量除以总样本量,并利用round()函数取两位小数以得到每个聚类类别的样本量占比。04广告投放效果分析提炼出不同聚类类别中的主要特征值,便于综合、直观地对比和分析各类别之间的差异,有助于识别广告在不同类别中的效果差异,从而判断哪种广告策略或类别的广告效果更好,调整不同类别的广告资源,提高广告的整体效率和效果。04广告效果分析雷达图适用于展示多维度数据,能直观反映各变量的强弱对比,还可用于评估个体在多个指标上的综合表现,便于进行不同个体或方案的比较。plotly是Python一个强大的交互式可视化库,可利用plotly库中的graph_objects模块依据各个类别的显著特征绘制雷达图。Part5Deepseek实训05请结合聚类模型,利用raw_sample.csv、user_profile.csv、ad_feature.csv文件数据,分析淘宝网站的广告数据集不同用户群体与点击率的关系。步骤一:数据预处理①读取数据集,使用merge函数将raw_sample.csv、user_profile.csv、ad_feature.csv文件数据集合并。对数据进行清洗,查询并处理缺失值、重复值。实训①会得到一个新表步骤一:数据预处理②采用特征工程提取和转换数据形式。选取几个分析维度创建分类变量,例如对clk(点击与否)、age_level(年龄层)、final_gender_code(性别)和shopping_level(购物层次)、price(价格水平)等分析维度创建新的分类变量,并转换数据类型为字符串类型。删除无用的原始列。实训②会得到一个新表步骤一:数据预处理③将分析变量拆分为数值变量和分类变量。对于数值列,使用MinMaxScaler对数值列进行最小-最大归一化处理;对于分类列,使用OneHotEncoder对分类列进行独热编码,把数据转换成适合机器学习模型处理的格式。实训③会得到一个新表05步骤二:K-Means聚类分析①使用K-Means和MiniBatchKMeans进行聚类,并计算对应的轮廓系数以确定最优的聚类数量。05步骤二:K-Means聚类分析②完成K-Means聚类后,计算每个类别数值特征的平均值和类别特征的众数,利用雷达图可视化呈现每类群体的特征分布情况。③请结合聚类模型,分析不同用户群体特征(如性别、年龄、购物层次、价格偏好等)与点击率的关系。THANKSFORYOURLISTENING本章结束感谢聆听第七章

电子商务平台商务活动分析SOUTHWESTERNUNIVERSITYOFFINANCEANDECONOMICS严谨勤俭求实开拓01电子商务平台02电商平台商品分析--商品数据集03实训Part1电子商务平台ADDYOURTITLEHEREPLEASE严谨勤俭求实开拓01电子商务平台引导案例——明星进入直播带货赛道JUNE12th电商直播带货电商平台的直播间向来不缺明星们的身影,除了客串嘉宾,许多明星们也因优异的直播带货战绩频频登上微博热搜,林某就是一个很好的例子。在以歌手身份成名之前,他做过厨师,出版过3本美食书,并主持和参与过多档美食综艺节目。2014年,他创立自有食品品牌“饭爷”,产品涵盖多款自主研发的辣椒酱和速食。基于知名的美食家人设,他注重在专业领域进行垂直选品;同时,以人设赋能产品,让他直播间里推荐的食材、食品和厨具等都更有分量,从而促进用户购买。直播推荐产品时,他并非单纯地口播或者念文稿,而是现场使用产品,将产品最真实的一面展现给观众。例如在直播介绍酱料、牛排等食材时,他亲自起锅做菜,教大家怎样用这些产品做出美味佳肴。01电子商务平台概念JUNE12th用户:电商平台上浏览各类商品信息、比较价格、查看评价,实现在线购物。商家:在电商平台上开设线上店铺,展示产品、接受订单、进行销售。(电商平台商家端)电子商务平台是指通过互联网构建的在线购物平台,为用户和商家提供一个交易的虚拟空间。电商平台的出现极大地改变了传统零售模式,提升了购物的便利性和效率,拓展了用户的购物选择。01电子商务平台特征六大特征特征三:数字化和在线化电商平台营销是数字时代的产物,主要依赖于互联网和数字技术。用户可以通过在线购物平台浏览产品、下单和支付。特征四:大数据和个性化电商平台能够收集大量关于用户的数据,包括购物习惯、兴趣和偏好,用于个性化推荐和广告,以提供更好地购物体验。特征一:全球性和无界限性电商平台商务活动不受地理位置的限制,用户可以从世界各地的在线商店购买产品。特征二:多样化的销售渠道电商平台多种多样,包括在线商店、社交媒体(如微信、微博等)等。JUNE12th特征五:社交化和用户生成内容用户通过社交媒体分享购物体验,产品评价和建议等信息。如,淘宝平台也提供“用户分享”窗口。特征六:即时互动和用户服务用户可以随时联系客服并提出问题,为企业提供了宝贵的市场反馈和用户数据,也可以提升销售转化率和订单完成率。特征七:营销工具和数据分析电商平台提供了多种营销工具,帮助企业更好地理解用户需求和行为,以此制定更有效的营销战略。Part2电商平台商品分析实例严谨勤俭求实开拓02电商平台商品数据集概述电商平台商品数据集概述JUNE12th字段名含义用户id淘宝用户的ID商品id用户做出购买、加入购物车、收藏行为的商品商品类目商品所属类目的ID行为类型用户做出的购买、加入购物车、收藏行为(表7-2)时间戳行为发生的时间戳表7-1数据集描述表7-2用户行为类型本实例使用的数据集为阿里云天池的淘宝用户行为数据文件serBehavior.csv(同第5章),包含2017年11月25日至2017年12月3日之间,约一百万随机用户的所有行为(行为包括点击、购买、加购、收藏)。7.2电商平台分析实例数据预处理步骤:在主要的处理前对数据进行预处理,以提高数据的质量和可分析性。预处理的目的主要是使数据更适合后续的分析和挖掘工作。本版块主要的预处理步骤包括:使用pandas数据库读取文件,重命名列名为用户ID、商品ID、商品类目ID、行为类型、时间戳。检查数据集中是否存在空值和重复行。将时间戳转换为datatime的数据类型,并从中提取创建日期、星期、小时信息。JUNE12th数据预处理7.2电商平台分析实例在主要的处理前对数据进行预处理,以提高数据的质量和可分析性。预处理的目的主要是为了使数据更适合后续的分析和挖掘工作。JUNE12th新增3列(日期、小时、星期字段)修改列名,便于后续分析检查空值与重复值情况数据类型转化数据预处理7.2电商平台分析实例1.计算不同统计周期内,在用户行为路径上的数量变化和转化率变化(采用北京时间)JUNE12th点击到收藏(pv2fav)点击到加购物车(pv2cart)点击到购买(pv2buy)收藏到购买(fav2buy)加购物车到购买(cart2buy)点击-pv加购物车-cart收藏-fav购买-buy商品销售转化分析7.2电商平台分析实例1.计算不同统计周期内,在用户行为路径上的数量变化和转化率变化(采用北京时间)JUNE12th通过遍历统计行为数量并计算每个行为类型的转化率,并用空列表convs存储计算出的转化率提取三个不同的统计周期:小时、星期、日期商品销售转化分析7.2电商平台分析实例1.计算不同统计周期内,在用户行为路径上的数量变化和转化率变化(运行输出结果)JUNE12th(1)当统计周期为小时时:【结果分析】a.数量变化(左图):大多数用户在早上10点开始浏览电商平台,浏览量从傍晚的18点开始增速加大,并且21点达到顶峰,说明绝大多数用户是在晚上下班后开始浏览电商平台,部分运营活动可以有针对性地在17—24点开展;b.转化率变化(右图):转化率的下降趋势和数量的上升趋势相反,可能说明大多数用户在前一天浏览完商品后,在第二天10点—16点之间,购买前一天加入购物车或者收藏的商品,这说明商家可以在这个时间段推送促进用户购买和支付的活动和策略。商品销售转化分析7.2电商平台分析实例1.计算不同统计周期内,在用户行为路径上的数量变化和转化率变化(运行输出结果)JUNE12th(2)当统计周期为星期几时(0代表星期一,6代表星期日,以此类推):【结果分析】a.数量变化(左图):周末的浏览量比工作日的浏览量几乎翻了一番;b.转化率变化(右图):工作日的购买转化率比周末的反而稍微高一点。因此,引流活动或策略可以在周末展开,促购活动或策略可以适当在工作日或周末展开。商品销售转化分析7.2电商平台分析实例1.计算不同统计周期内,在用户行为路径上的数量变化和转化率变化(运行输出结果)JUNE12th(2)当统计周期为天时:【结果分析】c.特别的是:11月25日到26日的周末,比12月2日到3日的周末的流量少,可能的原因是平台双十二的预热活动。查阅淘宝2017年下半年活动发现,双十二预热阶段和服务换新活动,相较于其他活动,可以更好的吸引用户。商品销售转化分析7.2电商平台分析实例2.计算用户不同行为路径上的数量变化和转化率变化

由于加入购物车和收藏商品并没有行为的先后性,因此达成购买目的的行为路径转化率有5条(以下将“将添加购物车”简称为“加购”),通过

5条路径分别计算了转化率:①

直接购买转化率=点击且购买量/点击量②

加购购买转化率=点击且加购量+购买量/点击且加购量③

收藏购买转化率=点击且收藏且购买量/点击且收藏量④

加购收藏购买转化率=点击且加购量+收藏量且购买量/点击且加购量+收藏量⑤

流失率=点击且流失量/点击量JUNE12th商品销售转化分析7.2电商平台分析实例JUNE12th具体代码呈现:商品销售转化分析7.2电商平台分析实例JUNE12th最终结果如下图所示。从图中可以看出,用户在浏览商品后,其主要行为是加构或收藏,通过加购和收藏后的行为分析,可以看出用户有较强的购买意愿,且购买流程的设计对用户来说相对顺畅和便捷。加购的用户比例(4.77%)明显高于收藏的用户比例(1.18%),这可能是因为加购后,用户可以在购物车页面直接进行结账操作,流程更为直观和方便。购买转化率在不同场景下有所差异,其中直接加购的转化率最高(69.18%),其次是收藏后购买(60.17%和80.25%),这种差异可能与用户的心理预期和购买流程的便捷性有关。商品销售转化分析7.2电商平台分析实例JUNE12th3.计算复购率复购率=重复购买的用户数量/总用户数量×100%,其中,分子是重复购买用户的数量(len(set(twbuy_user))),分母是所有进行过购买的总用户数量(len(set(buy_user)))。复购率反映了购买过商品的用户中有多大比例进行了重复购买。计算复购率后,计算每个用户购买行为发生的次数,然后对这些次数进行计数,得到一个用户购买频次的分布情况。商品销售转化分析7.2电商平台分析实例JUNE12th【运行输出结果】【代码】根据运行结果,约一周的统计周期内,约65.9%的用户进行复购,复购率较高。同时,也可以通过用户复购次数反应用户的购买频率。如左图所示,在此期间,绝大多数用户的复购次数在2-5次之间。商品销售转化分析7.2电商平台分析实例JUNE12th商品精准推荐用户的历史行为,是分析用户对不同品类商品偏好的基础,也是进行商品精准推荐的前提。本部分将基于UserBehavior数据集和物品协同过滤算法,利用DeepSeek给相似的用户推荐其他用户购买的商品品类,实现对商品的精准推荐。由于数据集太大,本实例利用第5章截取的数据UserBehavior_sample,上传至DeepSeek,完成以下任务。DeepSeek指令如下。请针对导入的数据集,基于用户的历史行为,分析用户对商品的偏好,给用户推荐相似的商品。具体而言,通过物品协同过滤算法(ItemCF),对购买过某些商品的用户,推荐其他相似品类的商品。请产生相应的Python代码和结果。7.2电商平台分析实例JUNE12th1)其中'1'表示用户ID,'2268318'

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论