版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、视频精准推荐系统架构技术创新,变革未来目录背景介绍精准推荐系统架构精准推荐算法架构计划与方向背景介绍-需求场景流量运营用户/场景定向用户调查/反馈英语教学自频道长李雷勤奋专业有潜力,优土想 扶持他成为“万万计划”的一员韩梅梅新做了一个餐馆评测,想尽快让更多中关 村地区的小清新吃货看到联合出品捉妖记:哪种片花更能吸 引大学生群体?背景介绍-展现形态1背景介绍-展现形态2背景介绍-展现形态3背景介绍需求方内部业务方:来疯、会员、PGC、分成、生态、游戏、BD外部业务方:自频道主,PGC精准推荐系统目的整合和优化推广位,尽量满足各方需求,使资源位的价值最大化打造视频生态:扶持自频道主、PGC,并引导
2、他们的行 为保证用户的体验:在合适的时机给合适的用户推荐合适的限定集合内的视频目录背景介绍精准推荐系统架构精准推荐算法架构计划与方向精准推荐系统-所处位置用户前端系统端UP/VP系统大 推 荐 系 统业务端来疯PGC版权/自制会员交易PUGC用户 成长内容流量售卖来疯收入PC/移动播放页APPPUSHIKU 弹窗会员电影游戏其他2.提供内容/用户标签定 向功能展 示点 击精准定向 推荐系统3.实时匹配定 向条件并计算 推荐结果1.输入(标签)定向条件与出 价4.向目标用户展示精准 推荐结果价值链游戏联运 收益5.以点击率和后续转化 进行价值评估精准推荐系统架构-概览实时统计系统客户端实时统计数
3、据投放内容素材内容推荐宿主系统投放系统集群Log系统 (kafka)UP/VP在线服 务推荐项索引(所 有推荐项)UP/VP离线数 据推荐项索引计算(离线计算)推荐项信息前台后台精准推荐系统架构-链式结构链式结构责任链模式(Chain of Responsebility):一系列有序的command能够按照顺序执行,并能够互相交换或者传递执行结果解耦:方便在线更换处理节点,通过节点组合实现不同的功 能自动降级:方便跳过一些节点,实现自动降级功能UP查询VP查询订单过滤频次控制算法在线计算元信息封装算法链式处理召回(获取候选集)排序重排序精准推荐系统架构-定向投放通过UP、VP系统获取用户画像和
4、视频画像通过索引系统将订单索引起来精准推荐系统架构-索引管理推荐项索引推荐计划管理投放引擎标签/关键字匹配的推荐项索引管理(在线)索引管理(离线)推荐项变化消息队列索引更新索引框架推荐计划信息库读取(投放量级)更新(订单变化量级)框架变化(每日几次)索引管理核心模块图例定期检测定期同步(日级)系统架构经验1-服务稳定性保障服务降级当服务器负载过高时,简化运算逻辑外部依赖的外部服务出现异常, 及时熔断防止主服务被拖垮降级顺序算法降级:非线性模型(GBDT)-线性模型(LR)分流控制模块关闭up、tp模块功能关闭投放缓存内容第三方服务调用服务状态 是否可用结束服务调用本次请求是否 作为探测流量降级
5、处理逻辑否是是否更新服务可用状态系统架构经验2-在线debug系统快速定位问题发现潜在问题便于技术和产品调研-找到新的优化方向系统架构经验3-监控报警系统系统状态监控CPU、IO、内存接口响应时间、外部依赖接口响应时间线程数、jvm状态自定义sql监控数据库异常订单报警运营数据监控自定义接口监控支持自定义接口实现复杂的监控功能精准推荐系统架构-关键数据每天收到的请求量5亿+峰值QPS8000+,平均响应时间20ms以下每天的曝光4亿+,点击率0.5%以上满足优土集团十几个事业部的内部推广需求目录背景介绍精准推荐系统架构精准推荐算法架构计划与方向精准推荐算法架构-概览召回(获取候选集)排序重排序
6、模型训练相关视频猜你喜欢运营位GBDT/LR日志点击反馈人工调权文本信息图片信息CF候选文本相关性 候选图片相关候 选其他候 选符合条件的订单精准推荐算法-召回用户行为:( Item-based CF)看了又看收藏了还收藏了评论了还评论了内容:同主演、同导演、同嘉宾同一题材:校园偶像剧、时空穿越类科幻标题相似:LSH、word2vec视频内容相似:截图、关键帧热门夏季热播IMDB Top 200、2016奥斯卡获奖电影精准推荐算法-截图召回截图召回图片理解:通过CNN embedding到高维空间计算图片相似性精准推荐算法-排序模型:LR、FTRLGBDT特征工程特征预处理:归一化,one-h
7、ot编码, 缺失值补充,异常值去除, 数据变化特征选择Filter:计算特征和目标的相关性,比如方差、卡方检验、相关系数Wrapper:根据损失函数,递归增加或者消除若干特征模型的方法:L1正则,基于树模型实践比较有效的特征选择方法专家经验:和产品运营的同学多聊模型选择方法:L1正则,GBDT给出feature重要性排序用非线性模型取代线性模型来减少对组合特征发现的依赖快速迭代,快速上线测试精准推荐算法-特征模型特征:候选集自带的特征,比如CF相似度,文本相关性相似度用户类:人口统计学特征,比如年龄、性别、收入频道偏好兴趣标签使用的终端类别源视频所属频道、标签标题、描述视频时长目标视频视频质量
8、、播放完成率所属频道、标签视频时长上下文(Contextual Info)时间位置精准推荐算法-重排序点击反馈多样性根据线索分组人工调权节奏控制精准推荐算法架构-A/B Test系统分层实验,促进流量的最大化利用保证用户真正随机为每次实验构建一个实验层*参考paper:Overlapping Experiment Infrastructure:More, Better, Faster Experimentation其他候选Rec LayerPromoted Rec Result LayerLaunch Layer1UI LayerLaunch Layer2Rec/UI LayerRec Res LayerPromoted Rec Layer目录背景介绍精准推荐系统架构精准推荐算法架构计划与方向计划与方向-技术实时化模型实时更新使用更多的实时化特征:比如用户短时兴趣增强推荐解释同标签、同主演、同嘉宾、同类top10、奥斯卡、本站 最热用户显性反馈深度学习观看序列分析:RNN、LSTM视频截图和视频内容分析:CNN计划与方向-
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2026年慈善事业信息技术管理师全国考试试题及答案
- 气功指导员考试合格证书颁发流程规范试卷
- 区块链智能合约漏洞测试试题
- 人身保险承保管理与保单签发手册
- 生活垃圾收集转运与无害化处理手册
- 苯巴比妥杂质检查课件
- 2025年影视声音艺术设计评估试题及答案
- 水行政执法考核制度
- 统战通讯员考核制度
- 大陆官员考核制度
- (高清版)DB31∕T 1289-2021 户外广告和招牌设施安全检测要求
- 丁华野教授:上卷:幼年性纤维腺瘤与叶状肿瘤
- 输液导轨施工方案
- 货运行业安全责任意识培训计划
- 《肿瘤治疗相关心血管毒性中医防治指南》
- 《电力电子技术》复习资料
- 工作作风存在问题及整改措施
- JC╱T 529-2000 平板玻璃用硅质原料
- 肺结节科普知识宣教
- 脾胃论与现代医学的契合医学课件
- 钢结构安装合同
评论
0/150
提交评论