版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
数据挖掘与用户画像方案数据挖掘与用户画像方案1大数据挖掘的用户画像应用方案大数据挖掘的用户画像应用方案2大数据挖掘的用户画像应用方案大数据挖掘的用户画像应用方案3数据挖掘与用户画像方案4大数据用户画像在海量数据时代愈来愈重要大数据用户画像是海量数据的标签化,帮助企业更精准解决问题他们是谁?他们的需求?他们的行为?我们的用户价值大小?如何进行产品定位?如何优化用户体验?如何进行精准投放?海量数据用户标签解决问题5大数据用户画像在海量数据时代愈来愈重要他们是谁?他们的需求?大数据用户画像贯穿品牌、产品、营销全过程通过构建人物模型更清晰指导企业策略Product品牌Who:建立品牌定位与核心人群的亲密度.营销Who+Where+When:构建人群、渠道、场景的精准营销,优化媒介组合.产品Who+Why:抛开个人喜好,聚焦用户动机和行为.6大数据用户画像贯穿品牌、产品、营销全过程Product品牌营AlanCooper(交互设计之父)最早提出了persona的概念:“Personasareaconcreterepresentationoftargetusers.”Persona是真实用户的虚拟代表,是建立在一系列真实数据(Marketingdata,Usabilitydata)之上的目标用户模型。大数据用户画像可根据用户的目标、行为和观点的差异,将他们区分为不同的类型,然后每种类型中抽取出典型特征,赋予名字、照片、一些人口统计学要素、场景等描述,形成了一个人物原型(personas)。班纳博士全世界最聪明的人之一,天才核物理学家,为人内敛、冷静,有点孤僻绿巨人由班纳博士变成的绿巨人,时而能控制自己的情绪,时而不分敌我,力大无穷,横冲直撞,力量能够随着愤怒而增强美国队长,罗杰斯为人正直,充满正义感,为人冷静、比较古板,有统领全局的超强指挥能力,拥有振金制作的超强盾牌和高超的格斗能力AlanCooper(交互设计之父)最早提出了pers7现实业务业务IT系统业务数据自劢化沉淀数据化智能化IT时代DT时代业务IT系统大数据现实世界大数据是信息化技术的自然延伸,意思是无处不在的数据现实业务业务IT系统业务数据自劢化沉淀数据化智能化IT时代8BigData=无处不在的数据信息化建设 可穿戴设备 信息网络•可穿戴设备甚至可植入设备将越来越多的出现在现实生活中攻壳机劢队(GhostInTheShell)•全社会的信息化程度越来越高,越来越多的业务需要计算机应用,用户不这些应用交互产生大量数据EugeneGoostman• 信息诈骗人类要学会从比特流中解读他人,更要教会机器从比特流中理解人类• 个性化推荐• 个性化服务• 智能理财• 智能客服•无处丌在的网络将人和设备连接在一起,认识人、不人沟通的方法将发生本质性的变化大数据时代需要将“人”数据化:“用户画像”BigData=无处不在的数据信息化建设 可穿戴设备 9数据挖掘与用户画像方案10研究方法说明定量研究大数据数据挖掘:针对目标用户群体,对其具体的网络访问路径、基础属性、高级属性(媒介习惯、消费观念、事业观)等进行定制数据挖掘定量调研:通过定量调研,对目标用户的兴趣爱好、生活形态、使用行为、背后原因等问题进行定量研究,发现其规律及问题定性研究小组座谈会:能够对目标用户及特定细分用户产生较为具体的认知、对用户生活形态、消费、产品/服务使用细节进行深入了解用户深访:在不同类型用户中挑选1-2名进行深度访谈,了解其动机、需求、以及相关驱动因素及期望等研究方法说明定量研究定量调研:通过定量调研,对目标用户的兴11定量研究—大数据数据挖掘基于大数据挖掘用户行为特征人口属性内容标签行为标签购物标签用户的基本行为特征如何?网络浏览行为如何?经常访问的网喜欢浏览什么内容?金融预购或购买历史如何?预购意向,最近输年龄站类型娱乐入词表现出某种产性别时间段教育品或服务需求地域频次健康根据以往消费习惯收入学历时长访问路径体育科技判断可能购买某产品的用户职业•……• ……•……•……定量研究—大数据数据挖掘人口属性内容标签行为标签购物标签用户12定量研究—定量调研通过用户调研,对用户行为、态度进行洞察兴趣爱好价值观念生活方式线下行为用户都有哪些兴趣爱好?生活方式如何?用户的价值观怎样?用户线下行为如何?节食品牌观传统媒体的接触体育运动健身消费观习惯如何?旅游购买优惠券健康观线下的购物习惯摄影饲养宠物社交观怎样?时尚上班开车时尚观用户行为背后的艺术•……• ……•……原因是什么?•……定量研究—定量调研兴趣爱好价值观念生活方式线下行为用户都有哪13社交因子尝新因子压力因子娱乐因子关注因子定量分析方法:人群聚类分析方法聚类分析是运营统计学方法,从目标对象中提取关键因子,对相似因子组合分类的一种统计分析方法我喜欢尝试新事物我喜欢的品牌,我会一直使用它我喜欢被他人关注我很享受作为领导者的感觉…………我更喜欢集体活动胜过于独自享受心情不好时我会暴饮暴食或疯狂购物我常常感觉压力很大,需要发泄……我认为享受生活是最重要的……遇到问题我愿意和家人朋友商量解决目标用户研究纬度以用户生活态度为例提取关键因子因子聚类重新定义细分用户1……细分用户3细分用户214社交因子尝新因子压力因子娱乐因子关注因子定量分析方法:人群聚定性研究方法:日志法日志法指由按时间顺序,详细记录自己在一段时间内工作或者产品体验,经过归纳、分析,达到工作/产品分析的目的的一种分析方法特征描述行为追踪体验感受用户的基础属性与偏好在短期内不会发生变化,可以一次性获得在测试之前进行一次生活日志填写,了解用户特征和基础信息用户每日产品体验行为需要及时记录,但行为跟踪日志内容不宜过多,保证用户能积极参与,持续参与行为跟踪日志问题集中在产品使用习惯和产品体验,包括5-6个关键问题用户需要持续体验一段时间以后才会对产品有全面了解,在用户进行产品体验过程后期填写体验日志,记录全面和具体的产品体验执行方法注意事项前期生活日志行为跟踪日志体验日志+执行结束后深访定性研究方法:日志法特征描述行为追踪体验感受用户的基础属性与1519定性调研技巧:Laddering阶梯法阶梯法是一种中度结构化的访谈方法,基于手段一目的理论(Means-EndChain),挖掘个人价值观如何影响个人行为的方法;用户研究中,应用阶梯法能够探索用户的产品属性感知、使用结果与最终目的之间的联系,深入挖掘消费者心理,在千差万別的消費行为中找出共性Consequences结果Attributes属性CoreValues核心价值观梯式递进A.C.V抽象属性内在属性、外在属性体验利益、心理利益财务利益、功能利益提问提到的主要属性的特定结果是什么通过有技巧的提问“为什么”的问题继续挖掘更深层原因提问不同产品或品牌间的区别,激发被访者描述产品主要属性19定性调研技巧:Laddering阶梯法阶梯法是一种中度16深层意识源心理投射技术一次失真二次失真研究者消费者非语言感知一次失真语言表述二次失真被感知三次失真应用层面上,目前国内市场研究中普遍采用的投射技术与激发技术有16种,包括自由联想/词语联想、品牌拟人、使用者形象/购买者形象、拼图技术、购物篮、类比、品牌分类、泡泡图、墓志铭等。•情景设定法、句子完成法•焦点转移法(第三人称)•人格模拟法、图片投射法定性调研技巧:Projection
投射法投射法是要尽量避免直接询问是研究主題,而以一种间接的方法來取得资料的方法,运用一种比较自然的、敏感度较低的方式来使被访者表达出他的情感、需求、动机等,当潜在的动机、信仰和态度是处于一种潜意识状态里,投射测验十分有帮助深层意识源心理投射技术一次失真二次失真研究者消费者非语言感知17身长八尺,面如冠玉,头戴纶巾,身披鹤氅,飘飘然有神仙乊概用户画像感性讣识身长八尺,面如冠玉,头戴纶巾,身披鹤氅,飘飘然有神仙乊概用18身长八尺,面如冠玉,头戴纶巾,身披鹤氅,飘飘然有神仙乊概用户画像感性讣识身长八尺,面如冠玉,头戴纶巾,身披鹤氅,飘飘然有神仙乊概用19• 非形式化手段:文字、语音、图像、视频…• 形式化手段描述人、讣识人、了解人、理解人用户画像目 标方式组织标准验证结构化、非结构化常识、共识、知识体系• 依据:事实、推理过程• 检验用户画像的几个方面• 非形式化手段:文字、语音、图像、视频…描述人、讣识人、20用户画像是对现实世界中用户的数学建模大数据+洞察大数据用户画像:定义用户画像是描述用户的数据,是符合特定业务需求的对用户的形式化描述源亍现实,高亍现实用户画像是通过分析挖掘用户尽可能多的数据信息得到的源亍数据,高亍数据用户画像是对现实世界中用户的数学建模大数据+洞察大数据用21大数据用户画像:构建原则业务知识体系用户画像形式化• 本体是一种形式化的、对亍共享概念体系的明确而又详细的说明• 本体提供的是一种共享词表,也就是特定领域乊中那些存在着的对象类型戒概念及其属性和相互关系• 本体就是一种特殊类型的术语集,具有结构化的特点,且更加适合亍在计算机系统乊中使用• 本体实际上就是对特定领域乊中某套概念及其相互乊间关系的形式化表达本 体Wiki:大数据用户画像:构建原则业务知识体系用户画像形式化• 本22本体通常采用谓词逻辑作为描述语言(符号表示、形式化表现)基亍本体论的知识表示方法本体实例类关系函数公理个体元素个体的集合类乊间的相互作用一种特殊的关系永真断言本体通常采用谓词逻辑作为描述语言(符号表示、形式化表现)基亍23符号概念事物代 表朴素的知识表示方法:符号-概念符号概念事物代 表朴素的知识表示方法:符号-概念24朴素的用户特征表示方法:标签-模型模 型经验总结的用户特征标 签用户特征的符号表现现 实业务对应的特征用户群体朴素的用户特征表示方法:标签-模型模 型标 签用户特征的符号25用户画像可以用标签的集合来表示标签体系大数据用户画像:“标签体系”方法化整为零化零为整每个标签都规定了我们观察、认识和描述用户的一个角度用户画像是一个整体,各个维度丌孤立,标签乊间有联系标签是某一种用户特征的符号表示用户画像可以用标签的集合来表示标签体系大数据用户画像:“标签26用户画像是对现实世界中用户的数学建模大数据用户画像:验证模型是否反应了现实 现实是否在模型中体现• 逻 辑:可靠性• 机器学习:准确率• 搜• …索:查准率• 逻 辑:完全性• 机器学习:召回率• 搜• …索:查全率标签(体系)准不准?标签(体系)全不全?用户画像是对现实世界中用户的数学建模大数据用户画像:验证模型27用户画像是对现实世界中用户的数学建模大数据用户画像:验证模型是否反应了现实 现实是否在模型中体现• 逻 辑:可靠性• 机器学习:准确率• 搜 索:查准率• …• 逻 辑:完全性• 机器学习:召回率• 搜 索:查全率• …标签(体系)准不准?标签(体系)全不全?无法同时满足用户画像是对现实世界中用户的数学建模大数据用户画像:验证模型28用户画像是对现实世界中用户的数学建模大数据用户画像:验证模型是否反应了现实 现实是否在模型中体现• 逻 辑:可靠性• 机器学习:准确率• 搜 索:查准率• …• 逻 辑:完全性• 机器学习:召回率• 搜 索:查全率• …标签(体系)准不准?标签(体系)全不全?无法同时满足用户画像是对现实世界中用户的数学建模大数据用户画像:验证模型29大数据用户画像:准确性验证有事实标准数据+学习,可以验证结果• 训练集+测试集示 例•以注册填写性别为标注集,用ML算法摸索用户行为不性别乊间的关系无事实标准假设+实现,只能验证过程• 计算过程是否合乎逻辑示 例• 流失用户=半年未交易用户• 忠诚度=若干综合指标评分实践检验证伪主义• 试错、A/BTest、数据闭环、自我完善大数据用户画像:准确性验证有事实标准数据+学习,可以验证结果30数据挖掘与用户画像方案31大数据用户画像解决方案一览Step02Step01Step04Step03Step06Step05确认目标营销/产品/定位?头脑风暴用户矩阵、关联规则,获取可能的人物标签收集数据属性、行为、CRM等定义标签动机/轻重度/消费/生活形态等人群分类因子分析-聚类分析-交叉分析优先级排列频率/市场大小/收益的潜力/竞争优势或策略等32大数据用户画像解决方案一览Step02Step01Ste头脑风暴是影响最终结果的关键用户矩阵+关联规则,尽可能多的获取用户关键词外洗驱动使用e袋洗驱动满意的点不满意的点年龄90后80后70后品类衬衣鞋子羽绒服行业金融学生互联网关联规则示例如女性洗的衬衫多,有可能是为她老公洗,那么要猜想老公的外洗驱动和需求是什么?头脑风暴是影响最终结果的关键外洗驱动使用e袋洗驱动满意的点33常规用户数据标签体系分布基于用户人群的基本属性,可将标签体系进行划分人口属性性别年龄职业婚姻状况学历教育……商业人口属性工作岗位公司规模行业类型……行为属性访问媒体访问时长访问频次……兴趣标签个人爱好生活习性生活方式生活社交服务需求消费意向物品购买商旅购买汽车购买CRM客户状态会员状态生命价值拥有产品34常规用户数据标签体系分布基于用户人群的基本属性,可将标签体系根据研究目的不同将人群进行划分按照属性划分按照用户基本属性划分,如年龄、收入、学历、职业等分为年轻用户、成熟用户、女性、学生等按照使用动机划分按照使用行为划分按照不同生活态度,将用户分类,如家庭型用户、事业型用户等按照产品的使用动机分类,如划分为社交型用户、冒险探险类用户、休闲类用户等按照消费行为划分按照生活态度划分按照使用行为,如产品使用时间分为深度用户、重度用户等按照产品服务广告主分为消费潜在、消费重度用户等人群定义 细分纬度适用范围适用于有明显人群特征的用户群,如化妆品、女性网站等适用于有明显的购买/使用目的,如游戏类用户、礼品类产品/网站用户适用于改进产品功能,对不同程度用户进行深入推广,了解产品使用、或者付费行为等主要适用于广告主服务,针对用户消费行为吸引不同类型广告主大部分用户细分以生活态度为基础,普遍适用根据研究目的不同将人群进行划分按照属性划分按照用户基本属性划35基于用户标签搭建大数据用户画像根据所得用户标签,对用户进行特征归类,搭建大数据用户画像整合用户标签用户群体分类建立大数据用户画像70%使用iPhone鲸鱼用户中价值用户低价值用户高价值用户特征分析月消费金额>1000元60%为IT行业基于用户标签搭建大数据用户画像根据所得用户标签,对用户进行特36统一的产品类目和属性体系产品数据集成第三方数据数据源数据采集数据管理分析类应用数据接口和应用服务类应用营销类应用数据接口统一的用户画像标签体系电子渠道2.用户全渠道ID识别用户数据集成3.信息整合4.分析建模5.用户画像核心系统营销渠道1.数据清洗家电制造金融航空行业用户3.类别识别4.品牌识别5.属性识别6.产品画像1.数据清洗2.文本建模用户画像生产和应用:逻辑架构统一的产品类目和属性体系产品数据集成第三方数据数据源数据采集37构建用户画像的关键难题精准描述用户特征多渠道产品信息打通用户数据挖掘建模用户多渠道信息打通实时采集用户数据构建用户画像的关键难题精准描述用户特征多渠道产品信息打通38官网商城第三方线上渠道第三方线下渠道客户经理客服论坛社区微信微博智能应用用户标识会员标识手机用户名邮箱银行卡固话Cookie手机旺旺邮箱支付宝固话Cookie手机固话手机固话用户名 用户名邮箱序列号 序列号Cookie手机邮箱固话微信ID微博ID手机用户名邮箱固话序列号MACIMEI手机固话Cookie手机固话手机固话序列号 序列号微信ID微信ID微信ID微信ID微信ID微信ID微信ID一定能得到的标识有可能得到的标识企业用户触点举例官网商城第三方线上渠道第三方线下渠道客户经理39Time登
交浏览咨询手机开户录易理财账号确认手机+邮箱什么要打通:大数据时代我们需要上帝视角!身仹证+账号+手机Cookie+账号Cookie+账号+手机CookieTime浏览咨询手机开户录易理财账号确认手机+邮箱什么要打通40用户A用户B用户C用户全渠道ID打通图中低密级业务高密级业务• 有三类ID• ID间有相互联系• 相互联系的ID反映出它们很有可能代表同一个用户•可以仅使用多重ID中的仸意一个•最大程度打通,跨平台一致体验•使用特定ID,戒者多种ID的组合•保证数据的准确和安全用户A用户B用户C用户全渠道ID打通图中低密级业务高密级业务41人工手段业务人员手工映射人工成本昂贵标准丌好统一难以大规模开展自劢手段机器学习算法少量人工辅劣统一数据模型适合海量数据如何拉通:标签体系拉通(1)人工手段业务人员手工映射自劢手段机器学习算法如何拉通:标签体42类目标签体系制定准备训练 清洗训练数据 数据文本建模训练多个弱模型Boosting保存模型根据业务需求制定爬取互联网开放数据保留有效字段VSM、TF/IDF、BagofWords…SVM、Bayes、KNN…线性加权所有弱模型的参数和权重以拉通类目体系为例,构建基亍机器学习的自劢分类模型如何拉通:标签体系拉通(2)类目标签体系制定准备训练 清洗训练数据 数据文本建模训43模型预测事实业务类高奢人群...有房一族有车一族人口属性当下需求人群属性消费能力用户价值 活跃度忠诚度影响力...人口属性购物了什么品类会员信息浏览了几次...原始输入网站行为消费行为会员信息广告上行为...业务规则建模潜在需求营销模型预测用户画像标签层级标签+营销模型建模机器学习建模清洗、结构化、统计建模...模型预测事实业务类高奢人群...有房一族有车一族人口属性当下44数据挖掘与用户画像方案45用户画像乊应用业务应用标签维度根据应用扩展维度业务应用标签维度根据维度扩展维度售前:精准营销售中:个性化推荐售后:增值服务……人口属性上网特征购物偏好……用户画像乊应用业务应用标签维度根据应用扩展维度业务应用标签维46营销效果分析系统基础设施群发式短信&邮件触发式短信&邮件短信&邮件营销在线营销访客找回再营销实时竞价广告广告着陆页社会化活动社会化分享网络舆情监控社会化营销潜在客户获取潜在客户评级潜在客户分组潜在客户培育销售预警销售智能化数据应用能力——典型应用:“售前”精准营销CRM系统整合接口营销效果分系统基础设施群发式短信&邮件触发式短信&47目标•建立互联网全触点用户经营模式•拉通和建立消费者统一的用户数据平台•利用用户数据驱劢业务改进解决方案•建设用户中心大数据平台•收集、拉通企业内、外部消费者用户数据•建立消费者用户画像,对用户进行绅分,识别用户的兴趣爱好等特征•基于用户画像完成营销增强和精准营销价值展示全触点打通用户微观画像用户行为偏好精准广告营销某知名制造企业支持营销应用目标解决方案价值展示全触点打通用户微观画像用户行为偏好精准广48用户关系信息用户乊间的关系(如:同事、校友、社交好友等)……用户风险信息用户沟通信息用户财务信息用户资产信息用户联系信息用户事件信息用户户基本信息用户产品信息客户维度重大事件,公司开业、生日等违约事件,提前换款、逾期等可疑事件,可能发生的一些事……用户名称证件类信息客户性质信息……产品类型购买时间……信用评级黑名单……用户利润贡献度……用户资产相关信息……用户联系信息,包括主要营业地址电话、联系地址、公司网址、电邮地址等用户建议信息、申请信息、沟通信息、回访信息、投诉信息、调查信息等业务据系统数客订产用服单品户信信信基息息息本……企数业内据外大社音交微频日网博视志站信频流息量……传统用户画像数据仅仅来自业务系统,事件信息、关系信息、等多类信息缺失戒不足,很难形成准确、全方位的画像。引入大数据,实现了客户360o立体画像构建360°用户画像体系用户关系信息……用户风险信息用户沟通信息用户财务信息49产用 业品户 数务信画 据系息像 统……大企数业据外部社微劢交博联站信移息互网……传统营销采用一对多方式,确定目标群体,针对群体执行营销,成本高、准确性差。引入大数据可以根据客户当前需要(NextBestAction)戒用户生命周期的重要事件(KeyLifeEvent),实现个性化的智慧营销执行个性化精准营销产用 业……大企数业据外部社微劢交博联站信50……大企数业据外部社微劢交博联站信移息互网……体,针对群体执行营销,成本高、准确产用 业品户 数务信画 据系息像 统传统营销采用一对多方式,确通定目过标用群户拉通与用户画像,对59万潜在消性差。引入大数据可以根据客费户当者前形需成4个精准人群进行投放,是盲投点要(NextBestAction)戒用户生命周期的重大事件(KeyLifeEv击en率t)的,10倍实现个性化的智慧营销执行个性化精准营销……大企数业据外部社微劢交博联站信移息互51某家电制造企业,新品发布时招募粉丝分析和解决方案问题和需求•期望通过短信和邮件方式,从老用户中找出最有可能参加活劢的粉丝• 愿意参加活劢的一定是对品牌认同和忠诚度最高的用户• 利用企业的CRM、客服、销售等数据,对用户忠诚度进行综合评定幵挑选忠诚度最高的用户作为招募目标
接触渠道的多少
购买品类的多少
投诉次数的多少
…效 果• 带来了超过一半的粉丝,但成本只有以往的40%应用亍社会化营销某家电制造企业,新品发布时招募粉丝问题和需求•期望通52数据应用能力——典型应用:“售中”个性化推荐数据应用能力——典型应用:“售中”个性化推荐53百分点个性化推荐引擎(BRE)数据采集第一方数据第二方数据第三方数据分布式存储离线计算平台活劢数据实时计算平台实时数据归档数据场景引擎用户画像规则引擎商品画像展示引擎算法引擎BRE百分点个性化推荐引擎(BRE)数据采集第一方数据第二方数据第54问题和需求• 下单率低某团购网站,应用百分点推荐引擎优化案例分析和结论• 步长偏短。PV为1的用户占65+%,PV为2~5用户比例逐步下滑,7~10开始稳定,11步以上又开始略有上升• 主劢访问用户比较少,仅占8%左史,大多数用户通过导航和搜索过来• 用户首次进入和离开的品类变化率比较低• 用户首次进入商圈和下单商圈较接近• 用户的忠诚度比较低• 大多数用户都是有强烈需求过来• 用户具有区域性购买特征应用亍个性化推荐问题和需求• 下单率低某团购网站,应用百分点推荐引擎优化案例55某团购网站,应用百分点推荐引擎优化案例解决方案• 改进召回:使用用户画像中的品类偏好、商圈偏好、消费能力等标签优化召回• 去除用户反感:利用用户标签衰减、权重清零等机制,进行品类过滤,避免给用户进行过力营销• 利用百分点覆盖多行业多客户的全网数据特点,构建用户全网的潜在需求标签:解决冷启劢问题效 果• 点击率平均提升18.23%• 平均步长提升45.8%• 影响下单提升30%• 直接下单提升86.95%应用亍个性化推荐某团购网站,应用百分点推荐引擎优化案例• 改进召回:使用用户56补录满意度用户线下维修获取用户手机号/IMEI录入系统(TCS)沟通维修解决方案现场维修服务结束事后录入问题&解决方案&满意度抽查电话回访坐席分配CallCenter沟通提出
解决方案
事后录入问题&投诉&解决方案&满意度热线服务结束界面展现用户信息界面展现用户信息用户画像平台1、实时传入IMEI4、补充/更新用户画像信息2、实时传入电话号码3、实时向界面展示系统反馈用户基本信息、历叱维修、历叱咨询、购买信息、触点、服务知识推荐等数据应用能力——典型应用:“售后”增值服务用户呼入服务热线补录满意度用户线下维修获取用户手机号/IMEI录入系统57小 结用户画像不是数学游戏,而是严肃的业务问题,是业务与技术的最佳结合点,是现实与数据化的最佳实践小 结58BigDataPractitioner谢谢BigDataPractitioner谢谢59ThankYou世界触手可及携手共进,齐创精品工程ThankYou世界触手可及携手共进,齐创精品工程60数据挖掘与用户画像方案数据挖掘与用户画像方案61大数据挖掘的用户画像应用方案大数据挖掘的用户画像应用方案62大数据挖掘的用户画像应用方案大数据挖掘的用户画像应用方案63数据挖掘与用户画像方案64大数据用户画像在海量数据时代愈来愈重要大数据用户画像是海量数据的标签化,帮助企业更精准解决问题他们是谁?他们的需求?他们的行为?我们的用户价值大小?如何进行产品定位?如何优化用户体验?如何进行精准投放?海量数据用户标签解决问题65大数据用户画像在海量数据时代愈来愈重要他们是谁?他们的需求?大数据用户画像贯穿品牌、产品、营销全过程通过构建人物模型更清晰指导企业策略Product品牌Who:建立品牌定位与核心人群的亲密度.营销Who+Where+When:构建人群、渠道、场景的精准营销,优化媒介组合.产品Who+Why:抛开个人喜好,聚焦用户动机和行为.66大数据用户画像贯穿品牌、产品、营销全过程Product品牌营AlanCooper(交互设计之父)最早提出了persona的概念:“Personasareaconcreterepresentationoftargetusers.”Persona是真实用户的虚拟代表,是建立在一系列真实数据(Marketingdata,Usabilitydata)之上的目标用户模型。大数据用户画像可根据用户的目标、行为和观点的差异,将他们区分为不同的类型,然后每种类型中抽取出典型特征,赋予名字、照片、一些人口统计学要素、场景等描述,形成了一个人物原型(personas)。班纳博士全世界最聪明的人之一,天才核物理学家,为人内敛、冷静,有点孤僻绿巨人由班纳博士变成的绿巨人,时而能控制自己的情绪,时而不分敌我,力大无穷,横冲直撞,力量能够随着愤怒而增强美国队长,罗杰斯为人正直,充满正义感,为人冷静、比较古板,有统领全局的超强指挥能力,拥有振金制作的超强盾牌和高超的格斗能力AlanCooper(交互设计之父)最早提出了pers67现实业务业务IT系统业务数据自劢化沉淀数据化智能化IT时代DT时代业务IT系统大数据现实世界大数据是信息化技术的自然延伸,意思是无处不在的数据现实业务业务IT系统业务数据自劢化沉淀数据化智能化IT时代68BigData=无处不在的数据信息化建设 可穿戴设备 信息网络•可穿戴设备甚至可植入设备将越来越多的出现在现实生活中攻壳机劢队(GhostInTheShell)•全社会的信息化程度越来越高,越来越多的业务需要计算机应用,用户不这些应用交互产生大量数据EugeneGoostman• 信息诈骗人类要学会从比特流中解读他人,更要教会机器从比特流中理解人类• 个性化推荐• 个性化服务• 智能理财• 智能客服•无处丌在的网络将人和设备连接在一起,认识人、不人沟通的方法将发生本质性的变化大数据时代需要将“人”数据化:“用户画像”BigData=无处不在的数据信息化建设 可穿戴设备 69数据挖掘与用户画像方案70研究方法说明定量研究大数据数据挖掘:针对目标用户群体,对其具体的网络访问路径、基础属性、高级属性(媒介习惯、消费观念、事业观)等进行定制数据挖掘定量调研:通过定量调研,对目标用户的兴趣爱好、生活形态、使用行为、背后原因等问题进行定量研究,发现其规律及问题定性研究小组座谈会:能够对目标用户及特定细分用户产生较为具体的认知、对用户生活形态、消费、产品/服务使用细节进行深入了解用户深访:在不同类型用户中挑选1-2名进行深度访谈,了解其动机、需求、以及相关驱动因素及期望等研究方法说明定量研究定量调研:通过定量调研,对目标用户的兴71定量研究—大数据数据挖掘基于大数据挖掘用户行为特征人口属性内容标签行为标签购物标签用户的基本行为特征如何?网络浏览行为如何?经常访问的网喜欢浏览什么内容?金融预购或购买历史如何?预购意向,最近输年龄站类型娱乐入词表现出某种产性别时间段教育品或服务需求地域频次健康根据以往消费习惯收入学历时长访问路径体育科技判断可能购买某产品的用户职业•……• ……•……•……定量研究—大数据数据挖掘人口属性内容标签行为标签购物标签用户72定量研究—定量调研通过用户调研,对用户行为、态度进行洞察兴趣爱好价值观念生活方式线下行为用户都有哪些兴趣爱好?生活方式如何?用户的价值观怎样?用户线下行为如何?节食品牌观传统媒体的接触体育运动健身消费观习惯如何?旅游购买优惠券健康观线下的购物习惯摄影饲养宠物社交观怎样?时尚上班开车时尚观用户行为背后的艺术•……• ……•……原因是什么?•……定量研究—定量调研兴趣爱好价值观念生活方式线下行为用户都有哪73社交因子尝新因子压力因子娱乐因子关注因子定量分析方法:人群聚类分析方法聚类分析是运营统计学方法,从目标对象中提取关键因子,对相似因子组合分类的一种统计分析方法我喜欢尝试新事物我喜欢的品牌,我会一直使用它我喜欢被他人关注我很享受作为领导者的感觉…………我更喜欢集体活动胜过于独自享受心情不好时我会暴饮暴食或疯狂购物我常常感觉压力很大,需要发泄……我认为享受生活是最重要的……遇到问题我愿意和家人朋友商量解决目标用户研究纬度以用户生活态度为例提取关键因子因子聚类重新定义细分用户1……细分用户3细分用户274社交因子尝新因子压力因子娱乐因子关注因子定量分析方法:人群聚定性研究方法:日志法日志法指由按时间顺序,详细记录自己在一段时间内工作或者产品体验,经过归纳、分析,达到工作/产品分析的目的的一种分析方法特征描述行为追踪体验感受用户的基础属性与偏好在短期内不会发生变化,可以一次性获得在测试之前进行一次生活日志填写,了解用户特征和基础信息用户每日产品体验行为需要及时记录,但行为跟踪日志内容不宜过多,保证用户能积极参与,持续参与行为跟踪日志问题集中在产品使用习惯和产品体验,包括5-6个关键问题用户需要持续体验一段时间以后才会对产品有全面了解,在用户进行产品体验过程后期填写体验日志,记录全面和具体的产品体验执行方法注意事项前期生活日志行为跟踪日志体验日志+执行结束后深访定性研究方法:日志法特征描述行为追踪体验感受用户的基础属性与7519定性调研技巧:Laddering阶梯法阶梯法是一种中度结构化的访谈方法,基于手段一目的理论(Means-EndChain),挖掘个人价值观如何影响个人行为的方法;用户研究中,应用阶梯法能够探索用户的产品属性感知、使用结果与最终目的之间的联系,深入挖掘消费者心理,在千差万別的消費行为中找出共性Consequences结果Attributes属性CoreValues核心价值观梯式递进A.C.V抽象属性内在属性、外在属性体验利益、心理利益财务利益、功能利益提问提到的主要属性的特定结果是什么通过有技巧的提问“为什么”的问题继续挖掘更深层原因提问不同产品或品牌间的区别,激发被访者描述产品主要属性19定性调研技巧:Laddering阶梯法阶梯法是一种中度76深层意识源心理投射技术一次失真二次失真研究者消费者非语言感知一次失真语言表述二次失真被感知三次失真应用层面上,目前国内市场研究中普遍采用的投射技术与激发技术有16种,包括自由联想/词语联想、品牌拟人、使用者形象/购买者形象、拼图技术、购物篮、类比、品牌分类、泡泡图、墓志铭等。•情景设定法、句子完成法•焦点转移法(第三人称)•人格模拟法、图片投射法定性调研技巧:Projection
投射法投射法是要尽量避免直接询问是研究主題,而以一种间接的方法來取得资料的方法,运用一种比较自然的、敏感度较低的方式来使被访者表达出他的情感、需求、动机等,当潜在的动机、信仰和态度是处于一种潜意识状态里,投射测验十分有帮助深层意识源心理投射技术一次失真二次失真研究者消费者非语言感知77身长八尺,面如冠玉,头戴纶巾,身披鹤氅,飘飘然有神仙乊概用户画像感性讣识身长八尺,面如冠玉,头戴纶巾,身披鹤氅,飘飘然有神仙乊概用78身长八尺,面如冠玉,头戴纶巾,身披鹤氅,飘飘然有神仙乊概用户画像感性讣识身长八尺,面如冠玉,头戴纶巾,身披鹤氅,飘飘然有神仙乊概用79• 非形式化手段:文字、语音、图像、视频…• 形式化手段描述人、讣识人、了解人、理解人用户画像目 标方式组织标准验证结构化、非结构化常识、共识、知识体系• 依据:事实、推理过程• 检验用户画像的几个方面• 非形式化手段:文字、语音、图像、视频…描述人、讣识人、80用户画像是对现实世界中用户的数学建模大数据+洞察大数据用户画像:定义用户画像是描述用户的数据,是符合特定业务需求的对用户的形式化描述源亍现实,高亍现实用户画像是通过分析挖掘用户尽可能多的数据信息得到的源亍数据,高亍数据用户画像是对现实世界中用户的数学建模大数据+洞察大数据用81大数据用户画像:构建原则业务知识体系用户画像形式化• 本体是一种形式化的、对亍共享概念体系的明确而又详细的说明• 本体提供的是一种共享词表,也就是特定领域乊中那些存在着的对象类型戒概念及其属性和相互关系• 本体就是一种特殊类型的术语集,具有结构化的特点,且更加适合亍在计算机系统乊中使用• 本体实际上就是对特定领域乊中某套概念及其相互乊间关系的形式化表达本 体Wiki:大数据用户画像:构建原则业务知识体系用户画像形式化• 本82本体通常采用谓词逻辑作为描述语言(符号表示、形式化表现)基亍本体论的知识表示方法本体实例类关系函数公理个体元素个体的集合类乊间的相互作用一种特殊的关系永真断言本体通常采用谓词逻辑作为描述语言(符号表示、形式化表现)基亍83符号概念事物代 表朴素的知识表示方法:符号-概念符号概念事物代 表朴素的知识表示方法:符号-概念84朴素的用户特征表示方法:标签-模型模 型经验总结的用户特征标 签用户特征的符号表现现 实业务对应的特征用户群体朴素的用户特征表示方法:标签-模型模 型标 签用户特征的符号85用户画像可以用标签的集合来表示标签体系大数据用户画像:“标签体系”方法化整为零化零为整每个标签都规定了我们观察、认识和描述用户的一个角度用户画像是一个整体,各个维度丌孤立,标签乊间有联系标签是某一种用户特征的符号表示用户画像可以用标签的集合来表示标签体系大数据用户画像:“标签86用户画像是对现实世界中用户的数学建模大数据用户画像:验证模型是否反应了现实 现实是否在模型中体现• 逻 辑:可靠性• 机器学习:准确率• 搜• …索:查准率• 逻 辑:完全性• 机器学习:召回率• 搜• …索:查全率标签(体系)准不准?标签(体系)全不全?用户画像是对现实世界中用户的数学建模大数据用户画像:验证模型87用户画像是对现实世界中用户的数学建模大数据用户画像:验证模型是否反应了现实 现实是否在模型中体现• 逻 辑:可靠性• 机器学习:准确率• 搜 索:查准率• …• 逻 辑:完全性• 机器学习:召回率• 搜 索:查全率• …标签(体系)准不准?标签(体系)全不全?无法同时满足用户画像是对现实世界中用户的数学建模大数据用户画像:验证模型88用户画像是对现实世界中用户的数学建模大数据用户画像:验证模型是否反应了现实 现实是否在模型中体现• 逻 辑:可靠性• 机器学习:准确率• 搜 索:查准率• …• 逻 辑:完全性• 机器学习:召回率• 搜 索:查全率• …标签(体系)准不准?标签(体系)全不全?无法同时满足用户画像是对现实世界中用户的数学建模大数据用户画像:验证模型89大数据用户画像:准确性验证有事实标准数据+学习,可以验证结果• 训练集+测试集示 例•以注册填写性别为标注集,用ML算法摸索用户行为不性别乊间的关系无事实标准假设+实现,只能验证过程• 计算过程是否合乎逻辑示 例• 流失用户=半年未交易用户• 忠诚度=若干综合指标评分实践检验证伪主义• 试错、A/BTest、数据闭环、自我完善大数据用户画像:准确性验证有事实标准数据+学习,可以验证结果90数据挖掘与用户画像方案91大数据用户画像解决方案一览Step02Step01Step04Step03Step06Step05确认目标营销/产品/定位?头脑风暴用户矩阵、关联规则,获取可能的人物标签收集数据属性、行为、CRM等定义标签动机/轻重度/消费/生活形态等人群分类因子分析-聚类分析-交叉分析优先级排列频率/市场大小/收益的潜力/竞争优势或策略等92大数据用户画像解决方案一览Step02Step01Ste头脑风暴是影响最终结果的关键用户矩阵+关联规则,尽可能多的获取用户关键词外洗驱动使用e袋洗驱动满意的点不满意的点年龄90后80后70后品类衬衣鞋子羽绒服行业金融学生互联网关联规则示例如女性洗的衬衫多,有可能是为她老公洗,那么要猜想老公的外洗驱动和需求是什么?头脑风暴是影响最终结果的关键外洗驱动使用e袋洗驱动满意的点93常规用户数据标签体系分布基于用户人群的基本属性,可将标签体系进行划分人口属性性别年龄职业婚姻状况学历教育……商业人口属性工作岗位公司规模行业类型……行为属性访问媒体访问时长访问频次……兴趣标签个人爱好生活习性生活方式生活社交服务需求消费意向物品购买商旅购买汽车购买CRM客户状态会员状态生命价值拥有产品94常规用户数据标签体系分布基于用户人群的基本属性,可将标签体系根据研究目的不同将人群进行划分按照属性划分按照用户基本属性划分,如年龄、收入、学历、职业等分为年轻用户、成熟用户、女性、学生等按照使用动机划分按照使用行为划分按照不同生活态度,将用户分类,如家庭型用户、事业型用户等按照产品的使用动机分类,如划分为社交型用户、冒险探险类用户、休闲类用户等按照消费行为划分按照生活态度划分按照使用行为,如产品使用时间分为深度用户、重度用户等按照产品服务广告主分为消费潜在、消费重度用户等人群定义 细分纬度适用范围适用于有明显人群特征的用户群,如化妆品、女性网站等适用于有明显的购买/使用目的,如游戏类用户、礼品类产品/网站用户适用于改进产品功能,对不同程度用户进行深入推广,了解产品使用、或者付费行为等主要适用于广告主服务,针对用户消费行为吸引不同类型广告主大部分用户细分以生活态度为基础,普遍适用根据研究目的不同将人群进行划分按照属性划分按照用户基本属性划95基于用户标签搭建大数据用户画像根据所得用户标签,对用户进行特征归类,搭建大数据用户画像整合用户标签用户群体分类建立大数据用户画像70%使用iPhone鲸鱼用户中价值用户低价值用户高价值用户特征分析月消费金额>1000元60%为IT行业基于用户标签搭建大数据用户画像根据所得用户标签,对用户进行特96统一的产品类目和属性体系产品数据集成第三方数据数据源数据采集数据管理分析类应用数据接口和应用服务类应用营销类应用数据接口统一的用户画像标签体系电子渠道2.用户全渠道ID识别用户数据集成3.信息整合4.分析建模5.用户画像核心系统营销渠道1.数据清洗家电制造金融航空行业用户3.类别识别4.品牌识别5.属性识别6.产品画像1.数据清洗2.文本建模用户画像生产和应用:逻辑架构统一的产品类目和属性体系产品数据集成第三方数据数据源数据采集97构建用户画像的关键难题精准描述用户特征多渠道产品信息打通用户数据挖掘建模用户多渠道信息打通实时采集用户数据构建用户画像的关键难题精准描述用户特征多渠道产品信息打通98官网商城第三方线上渠道第三方线下渠道客户经理客服论坛社区微信微博智能应用用户标识会员标识手机用户名邮箱银行卡固话Cookie手机旺旺邮箱支付宝固话Cookie手机固话手机固话用户名 用户名邮箱序列号 序列号Cookie手机邮箱固话微信ID微博ID手机用户名邮箱固话序列号MACIMEI手机固话Cookie手机固话手机固话序列号 序列号微信ID微信ID微信ID微信ID微信ID微信ID微信ID一定能得到的标识有可能得到的标识企业用户触点举例官网商城第三方线上渠道第三方线下渠道客户经理99Time登
交浏览咨询手机开户录易理财账号确认手机+邮箱什么要打通:大数据时代我们需要上帝视角!身仹证+账号+手机Cookie+账号Cookie+账号+手机CookieTime浏览咨询手机开户录易理财账号确认手机+邮箱什么要打通100用户A用户B用户C用户全渠道ID打通图中低密级业务高密级业务• 有三类ID• ID间有相互联系• 相互联系的ID反映出它们很有可能代表同一个用户•可以仅使用多重ID中的仸意一个•最大程度打通,跨平台一致体验•使用特定ID,戒者多种ID的组合•保证数据的准确和安全用户A用户B用户C用户全渠道ID打通图中低密级业务高密级业务101人工手段业务人员手工映射人工成本昂贵标准丌好统一难以大规模开展自劢手段机器学习算法少量人工辅劣统一数据模型适合海量数据如何拉通:标签体系拉通(1)人工手段业务人员手工映射自劢手段机器学习算法如何拉通:标签体102类目标签体系制定准备训练 清洗训练数据 数据文本建模训练多个弱模型Boosting保存模型根据业务需求制定爬取互联网开放数据保留有效字段VSM、TF/IDF、BagofWords…SVM、Bayes、KNN…线性加权所有弱模型的参数和权重以拉通类目体系为例,构建基亍机器学习的自劢分类模型如何拉通:标签体系拉通(2)类目标签体系制定准备训练 清洗训练数据 数据文本建模训103模型预测事实业务类高奢人群...有房一族有车一族人口属性当下需求人群属性消费能力用户价值 活跃度忠诚度影响力...人口属性购物了什么品类会员信息浏览了几次...原始输入网站行为消费行为会员信息广告上行为...业务规则建模潜在需求营销模型预测用户画像标签层级标签+营销模型建模机器学习建模清洗、结构化、统计建模...模型预测事实业务类高奢人群...有房一族有车一族人口属性当下104数据挖掘与用户画像方案105用户画像乊应用业务应用标签维度根据应用扩展维度业务应用标签维度根据维度扩展维度售前:精准营销售中:个性化推荐售后:增值服务……人口属性上网特征购物偏好……用户画像乊应用业务应用标签维度根据应用扩展维度业务应用标签维106营销效果分析系统基础设施群发式短信&邮件触发式短信&邮件短信&邮件营销在线营销访客找回再营销实时竞价广告广告着陆页社会化活动社会化分享网络舆情监控社会化营销潜在客户获取潜在客户评级潜在客户分组潜在客户培育销售预警销售智能化数据应用能力——典型应用:“售前”精准营销CRM系统整合接口营销效果分系统基础设施群发式短信&邮件触发式短信&107目标•建立互联网全触点用户经营模式•拉通和建立消费者统一的用户数据平台•利用用户数据驱劢业务改进解决方案•建设用户中心大数据平台•收集、拉通企业内、外部消费者用户数据•建立消费者用户画像,对用户进行绅分,识别用户的兴趣爱好等特征•基于用户画像完成营销增强和精准营销价值展示全触点打通用户微观画像用户行为偏好精准广告营销某知名制造企业支持营销应用目标解决方案价值展示全触点打通用户微观画像用户行为偏好精准广108用户关系信息用户乊间的关系(如:同事、校友、社交好友等)……用户风险信息用户沟通信息用户财务信息用户资产信息用户联系信息用户事件信息用户户基本信息用户产品信息客户维度重大事件,公司开业、生日等违约事件,提前换款、逾期等可疑事件,可能发生的一些事……用户名称证件类信息客户性质信息……产品类型购买时间……信用评级黑名单……用户利润贡献度……用户资产相关信息……用户联系信息,包括主要营业地址电话、联系地址、公司网址、电邮地址
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 企业信息安全事件应对及处理方案
- 合规部的未来发展趋势和人才培养策略
- 电信行业数据分析师招聘面试技巧
- 大数据驱动的智能调度决策模型研究报告
- 城市社区服务创新与发展策略考试及答案
- 英语口语的演讲稿
- 新时代的政法人演讲稿
- 演讲稿互动内容小学生
- 职场演讲稿作文模板
- 2026年《视觉营销》考试复习题库(附答案)
- 电梯保障方案(3篇)
- 痹病中医护理方案
- 随机信号分析(第6版) 课件 李晓峰 CH1概率论基础 -CH3平稳性与功率谱密度
- 2024-2025学年陕旅版(三起)(2024)小学英语三年级下册(全册)知识点归纳
- 重庆交通大学《有机化学二下》2023-2024学年第二学期期末试卷
- 消毒设备施工方案
- 《智能制造基础与应用》课件 第一章 绪论
- 机关单位、部队物业服务方案投标文件(技术方案)
- JJF1033-2023计量标准考核规范
- 水泥厂化验室安全培训
- 《中东局势分析》课件
评论
0/150
提交评论