目标人群优选算法模型及实践解析_第1页
目标人群优选算法模型及实践解析_第2页
目标人群优选算法模型及实践解析_第3页
目标人群优选算法模型及实践解析_第4页
目标人群优选算法模型及实践解析_第5页
全文预览已结束

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

目标人群优选算法模型及实践解析全域营销(Uni-Marketing)战略是依托大阿里生态,以消费者运营为核心,在新零售体系下实现全链路、全媒体、全数据、全渠道的品牌大数据营销。Uni-Marketing产品矩阵包括品牌数据银行、全域策略(策略中心)、全域传播(Uni-Desk)、全域运营(品牌号、智慧门店、天猫营销产品)等。传统品牌营销的痛点在于效果无法量化和追踪,而阿里的产品和数据闭环可以很好的解决这个问题。策略中心年货节投放海豹项目,通过大数据+算法的手段,对A品牌的目标人群进行分析,建立人群优选算法模型,挖掘品牌目标潜客。品牌A的年货节实际投放效果,算法优选人群相比基于业务经验使用规则圈选的人群,在“O->IPL”人群关系加深率指标上好47%,显示了人群优选算法的有效性。名词解释品牌消费者关系:Opportunity(机会)、Awareness(认知)、Interest(兴趣)、Purchase(购买)、Loyalty(忠诚)。人群关系加深率:衡量品牌营销效果的直接指标。“O->I”人群关系加深率,即机会人群到兴趣人群的转化率。品牌数据银行:从“融合、分析、激活”三个纬度实现品牌消费者数据资产的管理和增值,即品牌消费者数据资产的高效梳理、消费者全链路的透视分析、最后到多元营销场景的应用,包括阿里的电商、娱乐和营销服务矩阵。品牌策略中心:以解决“机会在哪里”和“如何增长”为目标,赋能品牌开发生意策略,实现策略的可应用、可验证、可优化。功能包括市场概览与细分、竞争与得失分析、消费者细分与多维洞察、人群放大与优选等,可用于新品上市、品类拉新、品类成长、品牌升级等场景。项目目标基于策略中心的品牌人群定向,与程序化广告的不同之处在于,要根据品牌方的营销需求(包括目标、渠道、时间和预算)产出特定规模的目标人群,进而再针对性地营销投放。此次实践即以年货节拉新为目标,找到指定规模的潜在机会人群或者认知人群,通过营销投放将其转化为品牌兴趣人群和已购人群,从而提升品牌消费者资产。业界方案业界相关方案主要与程序化广告中人群定向相关,方法基本都是Look-alike人群扩散,具体有以下几种:1) 标签扩散:根据已有目标用户画像,给用户打各种标签,再利用标签找到机会人群。2) 基于标签的协同过滤:在标签扩散的基础上,采用基于用户的协同过滤算法,找到与种子人群相似的机会人群。3) 基于社交关系的扩散:以具有相似社交关系的人也有相似的兴趣爱好/价值观为前提假设,利用社交网络关系进行人群扩散。4) 基于聚类的扩散:根据用户画像或标签,采用层次聚类算法(如BIRCH或CURE算法)对人群进行聚类,再从中找出与种子人群相似的机会人群。5) 目标人群分类方法:以种子人群为正样本,候选对象为负样本,训练分类模型,然后用模型对所有候选对象进行筛选。涉及PULearning的问题。技术方案介绍根据项目目标,我们制定了“种子人群聚类细分+聚类人群扩散”和“多方向人群扩散+人群分类优选”的两种方案。由于聚类分群属于无监督学习且分群效果不容易评估,因此选择后者优先实施。方案整体流程如下图所示:人髀娜幕用关竞品人彝升失人样品牌年荒珅干人薜IRAET呻羊:.MAP人髀娜幕用关竞品人彝升失人样品牌年荒珅干人薜IRAET呻羊:.MAP5.1多方向人群扩散在人群扩散方向上,我们探索了6类方向,并在每个方向下挖掘有效特征,通过白盒条件筛选和黑盒模型预测的方式进行人群扩散。5.1.1兴趣偏好方向采用特征值TGI和TA浓度2个指标,挖掘了4个特征中与品牌相关的特征值,并根据特征值的全网覆盖量设定TGI和TA浓度阈值,进行白盒扩散。TGI指标衡量了特征值在品牌人群中的显著性,TA浓度则衡量了特征值在品牌人群中的覆盖率,因此二者共同考虑才能筛选出有效的人群扩散特征值。5.1.2相关品类方向1) 主营类目分析:根据品牌在线商品数和销售额计算筛选主营类目,并得出主营类目权重。2) 相关品牌分析:根据brand-user关系矩阵,采用Jaccard相似度计算相关品牌及相关分。相似度计算公式如下:3)相关类目分析:根据线上user-cate购买行为,通过AssociationRuleMining挖掘相关类目,使用confidence指标筛选类目并作为相关分,然后经过类目关系的二度扩散得到最终相关类目结果。类目扩散公式如下,其中表示类目k:5.1.3竞品人群方向1)竞品分析:当前品牌主营类目中,市场份额top10的其他品牌。2) 人群流转分析:分析发现品牌新增人群中,有较大比例来自竞品,说明选择该方向进行扩散是可靠的。3) 竞品人群转化模型:以来自竞品的人群为目标,挖掘用户在竞品的AIPL状态、退款、退货、评分、评价等特征,训练竞品人群转化模型。通过模型对竞品人群进行转换预测,实现人群扩散。5.1.4搜索人群方向1)搜索关键词:从引导到品牌成交的搜索词中,综合考虑搜索词是否充分竞争以及本品牌在搜索词上是否有优势,实现品牌拉相关的搜索词发现。公式如下,其中E表示关键词引导成交的类目信息熵,表示关键词引导成交额,表示关键词引导到品牌的成交额:kwsds=argtop〔E如少』*仇宫占出一虹以^/片心^)2)搜索人群扩散:近15天内搜索了kwords并点击了品牌主营类目的用户。5.1.5流失人群方向对于之前属于品牌人群而现已流失了的用户,也进行扩散召回,包括近半年从IPL状态流失的用户和近1个月从A状态流失的用户。5.1.6同好人群方向基于用户的向量表示,可以直接计算用户与用户直接的相似度,从而得到种子用户最相似的topN个用户。用户表示的方法有多种,例如:a) 用户偏好的类目向量、品牌向量组合。b) 将user-item表示为二部图,基于graphembedding方法生成用户向量。5.1.7人群扩散汇总最终6个方向的品牌扩散人群汇总去重,作为人群优选模型的输入。5.2目标人群优选模型没有历史投放数据,是此次项目面临的一个挑战。我们通过训练模型来区分目标人群和非目标人群。5.2.1评估指标训练集的正负样本,分别从品牌已购人群和其他品牌的人群中采样得到。从中训练的分类模型,可以较好的区分品牌目标人群和全网其它人群(大都和目标人群相距较远),但对区分和品牌目标人群相距不远的扩散人群则并非同样有效。因此,直接使用传统的分类指标,只能评估模型在训练集上的效果,不能准确评估其在扩散人群上的分类效果,需要设计新的评估指标。PredictTATopNPrecision指标由此而来,表示优选的TopN人群中品牌目标人群的占比,该指标越大说明模型预测效果越好。我们通过对比该指标在不同模型上使用不同topN值的值,验证了它的一致性;并设计NewTAtopNRecall指标,即优选人群在之后一段时间品牌新增目标人群的占比,验证了它的正确性。上图中,紫色框表示品牌目标人群即种子人群,蓝色框表示模型优选出的TopN人群,它与种子人群有小部分交集,交集占蓝色框的比例即为PredictTATopNPrecisiono绿色框表示一周内品牌实际新增人群,与蓝色框的交集为预测准确的人群,交集占绿色框的比例即为NewTAtopNRecall。对于有效的算法模型,PredictTATopNPrecision指标随着TopN的减小而增大。两个不同的算法模型,PredictTATopNPrecision指标在不同TopN取值上的表现是一致的,说明该指标的稳定性。以A品牌为例,其一致性验证结果如下图所示:PredictTATopNPrecisian5.2.2模型训练以品牌目标人群为正样本,从全网其它品牌的人群中随机选负样本,经过数据预处理、归一化、序列化编码后,训练并优化人群优选模型。1) 样本选择正样本选择:对于线上市场份额大的品牌而言,直接用品牌已购人群即可。但对新品牌或者线上市场份额小的品牌,已购人群可能很小,这时

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论