机器学习在美团:吃喝玩乐中的大数据与云计算_第1页
机器学习在美团:吃喝玩乐中的大数据与云计算_第2页
机器学习在美团:吃喝玩乐中的大数据与云计算_第3页
机器学习在美团:吃喝玩乐中的大数据与云计算_第4页
机器学习在美团:吃喝玩乐中的大数据与云计算_第5页
已阅读5页,还剩41页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

机器学习@美团

——吃喝玩乐中的算法问题•

O2O行业及美团简介• 机器学习在用户端的应用• 机器学习在商户端的应用• 算法应用八大“坑”概要

背景

算法应用

总结

什么是O2O?

O2O

(Online

to

Offline)

=

本地服务(LBS)

+

线上连接

通过信息流动,减少物理流动

平台用户需求信息结构化

来源:TalkingData及品途网

2014

O2O移动应用行业报告O2O⾏行业应⽤用图谱来源:TalkingData及品途网

2014

O2O移动应用行业报告外卖打车电影票频度门票酒店机票租房挂号美业租⻋车拼车

家政垂直

vs.⽔水平(平台)

什么样的领域有机会?

用户获取成本

vs.

用户价值

渗透率

团购买房微信

刷牙All

That

Is

Solid

Melts

into

Air.

——

Karl

Marx

猫眼电影

国内最大的电影分销商

美团外卖

国内最大的外卖平台

美团简介

美团团购



国内最大的本地生

活服务电商平台

美团酒店

国内第二大酒店

分销商

消费频度

vs

行业深度O2O

vs

网络电商

共同:双边市场

差异:LocaEon

based,

消费距离受限

O2O的特点

市场规模大、增长速度快

懒人经济:质优价廉低价格

高品质

低成本

高效率

低毛利

高科技200

0

1000

800

600

400

1400

1200

2010

2011

2012

2013

2014

2015e

美团网交易额(亿元)2014年12月:美团网拥有1亿多活跃移动用户,移动端贡献>90%的交易额80

70

60

50

40

30

20

10

0

2011

2012

2013

2014

美团移动交易占比移动化day:1

day:3-­‐3.5

day:5-­‐10

0hr

3hr

6hr

9hr

12hr

15hr

18hr

21hr

50.00%

40.00%

30.00%

20.00%

10.00%

0.00%

电影酒店美发/美容/美体美食摄影写真生活服务休闲娱乐运动健身所有品类

分品类持券时⻓长60.00%

4000

3500

3000

2500

2000

1500

1000

500

0

广

成京

都美容美发休闲娱乐生活服务运动健身摄影写真电影酒店美食

场景化、即时化

分品类持券80%距离4500

美团持券时⻓长及消费距离用户•个性化化•场景化化•即时化化O2O平台商户•动态触触达用用户•提供丰丰富产产品平台•获取用用户/商户•匹配供供给需需求传统模模型::边际际收益益递减减平台模模型::双边边市场场的网网络效效应=》边际收收益递递增=》平台台价值值平台::⽤用用户端端吸引访访问/再访•自然流流量•站外广广告•主动推推送促成购购买•信息聚聚合•用户行行为引引导•运营拉拉新提升多多次访购购•搜索、、浏览览主动动引导•个性化化推荐荐•跨品类类转新新平台::商户户端商机发发现•销售拜拜访路线优优化商家入入住及上单单•预测可可能入入住商商户•自动写写单提提高上上单效效率运营•风控防防刷单单•销量预预估•O2O及美团团介绍绍•机器学学习在在用户户端的的应用用•机器学学习在在商户户端的的应用用•算法应应用八八大““坑””概要背景算法应应用总结•运营拉拉新•推送引引导•流量转转化用户•个性化化•场景化化•即时化化机器学学习@美团团•销量预预估•电影票票房预预估•……商户•动态触触达用用户•提供丰富产产品平台•获取用户/商户•匹配供给需需求⽤用户端::运营拉新新背景:首购-­‐>留存,吸引引已注册用用户完成首首购目标:少花钱,,多办事⽤用户端::运营拉新新方法:新用户画画像SVM分类•准确率:75%•召回率:68%效果•拉新单位成成本下降35%单位用户营营销成本=总花销/总新客数•总开支节省省30%选择对象•选择准则优化⽤用户端::推送引导导背景:对不活跃跃用户发个个性化推送送消息,提提升访问及及购买目标:提高用户户转化,减减少打扰用用户方法:效果:有效降低低了对用户户的打扰。。发出消息•目标:发出出率•固定时间拉拉取改为灵活推送送•发送时机优优化,考虑用户的的历史联网时间,,当前位置发出率提高高100%+打开消息•目标:打开率•动态文案(todo)打开率提高高21%浏览/购买•目标:转化化率•类似推荐的的优化方式,,提高访购率率综合转化率率提高94%⽤用户端::流量转化化搜索浏览推荐意图强度流量规模用户偏好⽤用户端::流量转化化场景位置快速交互首页推荐个性化数据据同义词挖掘掘专名识别新词识别user

profile挖挖掘deal/poiprofile

挖掘query/deal的的topicmodel……评估框架模型训练数据清洗特征抽取数据流……推荐和搜索索框架的统统⼀一搜索推荐平平台Poil化化列表浏览览人工规则干干预CTR

model相关性模型型QueryRetrieval通用数据Query补全排序机制Actionmodel业务规则UserRetrieval关系数据应用层排序层模型层准入层触发层数据层FlumeAgentImpressionLogOrder/ClickLogDealDBControlServiceModel1Model2…APIOnlinetrainfeatureLabeledDataOfflinetrain服务架构演演进featuremonitor高度可配置置LRSVMAPICommand应用层模型层选特择征一特化征归ChisquaredStandardTopicModelGBDTMutualInformaEonMinMax分级日志模型评估基于spark的离线训练练平台美团搜索历史查询词词查询补全结果页搜索系统实实践数据获取时时效性清洗提高准准确性基础数据获获取查询引导同义词挖掘掘团单品类映映射查询分析系统架构调调整增加吞吐量量改进协议架构支撑特征工程LR+GBDT融合效果重排序实时品类偏偏好实时下单位位置模型在线更更新实时化分词/归一一化查询纠错语义扩展展意图识别别查询分类类紧密度计计算Term赋权召回及排序策略略Query

suggestion相关搜索索热搜词ü用户查询询自然语语言化ü检索基于于字面匹匹配,缺缺乏语义义扩展ü语义漂移移查询分析析查询分析析面临的的问题ü用户意图图多元化化•精确/模模糊查询询•领域多::寻找吃吃喝玩乐乐,购物物,旅游,住宿宿…策略类型

及占比

商

家

品

类

商

圈

地

标

酒

店

旅

游

商

品

电

影

复合意图

其

他

改进前

12%

8%

-

3%

-

-

-

<1%

-

76%

改进后

21%

17%

7%

5%

6%

<2%

<1%

4%

9%

28%

意图识别别搜索意图图歧义示示例及解解决方案案找门票还还是酒店店?通过意图图分类,,将“旅旅游”意图图的POI排序序提前团单品类类细分品类内差差异对用用户造成成的困扰扰“咖啡/酒吧/蛋糕””在后台配置为为同一个个类目下下的品类通过文本本分类拆拆分子品品类,或者说打打标签人工定义义体系+SVM学习,,构建覆覆盖全面面合理的的品类类类目,更更好满足用户精精确品类类检索的的意图美团频道道筛选groves频道筛选选实践数据清洗洗在线获取取训练所需特征征数据及特特征工程程使用位置置信息引入排序序模型粗排序新单推荐荐使用位置置信息冷启动Additive使用位置置分品类细细化重排序实时品类类偏好实时下单单位置实时特征征更新实时化poi-­‐user特征•当前距离离•历史距离离•最近点击击/下单/支付•历史点击击/下单/支付deal特征•CTR/CVR•CVR•折扣力度度•是否新单单•是否促销销deal-­‐‐user特征•商圈•品类•价格user特征•终端类型型•地理位置置•消费水平平•品类偏好好•CPR重排序::特征poi特征•#评论数数•#有图评论论/优质评论论•CTR/CVR/CXRrankAdditiveGroves数值类特特征详情页特特有特征列表页特特有特征GBDTLR重排序::框架数据实时时化•预测结果果随数据据更新而而变化•2小时销销量数据据•2小时内内数据预预测用户户实时偏偏好•进入列表表页请求求用户地地理位置置,下单单率提升升3%•模型天级级更新•Onlinelearning继续尝试试中美团推荐荐其他展位位:搜索无结结果推荐荐,购买买后推荐荐,评价后推推荐,附近近推荐推荐系统统实践user/itemcf相似性调调整经典算法法改进销量预估估用户分群群地理位置置偏好冷启动附近热单单异地浏览览时间上下下文上下文筛筛选LRGBDT融合效果果重排序特征实时时化偏好实时时化算法实时时化实时化hap:///mt-­‐‐recommend-­‐‐pracEce.html⽤用户冷冷启动•行为少,,找不到到有意义义的相似似用户•LocaEon,locaEon,locaEon•基于地理位置置计算用户相相似性:作为为替补策略,效果果一般•浏览地附近热热单,作为上上下文信息使使用20140609201406102014061120140612201406132014061420140615201406162014061720140618201406192014062020140621201406222014062320140624201406252014062620140627201406282014062920140630加⼊入contextbaselinehot_for_local•附近热单•“本地人热单单”•“本地热单””下单率浏览推荐意图强度流量规模⽤用户端:流流量转化统一框架,快快速迭代,经经验共享搜索商户端:不仅仅是算法挑战战训练数据规模模小标注标准复杂杂主观单用户特征不不可用多团队合作挖掘可扩展的的特征采用非线性、

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论