版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、DNN优化首页排序的应用推荐页场景和 Ranking 介绍多目标学习探索和应用 DNN 中 online learning 的尝试及经验 总结与展望推荐页场景和 Ranking 介绍基于用户兴趣个性化推荐问答发现更大的世界渗透率达88%,使用时长占比76%推荐页场景和 Ranking 介绍线上模块召回:协同/标签/ 排序:规则/机器学习重排序:提权/隔离/强插.线下模块准备数据:落地请求相关的 日志特征提取:确定特征和生成 训练数据模型训练:生成模型供线上 使用推荐页流程推荐页场景及 Ranking 介绍用户特征固有属性:性别, 年龄统计特征:阅读长 度用户兴趣:实时, 话题,关键词过去行为:
2、浏览/点 赞/分享/收藏上下文特征访问时间,机型, session内容特征统计特征:CTR,点 赞数文本特征:关键词, 话题,tf,idf作者特征:权威度, 被关注数交叉特征用户特征与内容交 叉:是否关注话题/ 作者,对内容感兴 趣度特征介绍推荐页场景及 Ranking 介绍DNNGBDTEdgeRankTimeLine基于规则基于模型Ranking 策略演进过程上线效果-CTR+25.4%-人均天时长+300 秒-次日留存+1.98%推荐页场景及 Ranking 介绍DNN 结构推荐页场景及 Ranking 介绍DNN 模型演进过程单目标DNN多目标DNNOnline learning多目标
3、学习探索和应用分别训练多个模型,每个模型学习一个目标优点:可以分别针对不同的目标优化效果而不影响其他模型缺点:线上服务预估部分计算量加倍,机器资源比较浪费独立模型以点击为主要目标,对含有其他正向行为的样本,loss 进行加权优点:只修改训练代码就行,线上服务不需要做改动,直接加载生成模 型即可上线缺点:难于评估每个目标的贡献,无法对特定的用户群做策略优化加权模型一个模型中预测所有目标分数,模型共享大部分参数优点:减少模型参数量和计算资源开销,排序时各目标分数灵活组合缺点:各 loss 权重不好调整,模型后期容易产生震荡多目标模型多目标方案多维度提升用户体验CTR 单一指标不能准确反映用户体验与
4、用户圈层结合,给产品提供更多的可优化空间多目标网络结构:底层共享参数,最上层参数不同,学习各自目标loss:各目标交叉熵损失函数加权组合loss调权方式等权重相加按 loss 大小配平,效果差算法自动调权,无明显效果各目标 loss 交替学习,效果差多目标学习探索和应用共享参数方案多目标学习探索和应用多目标融合方案方式一: =- - -方式二: = -(- + -)67log: - - log(- + - )用户圈层结合高互动用户提高互动权重 低互动用户提高阅读权重 高创作用户提高回答权重多目标学习探索和应用上线效果-10.00%0.00%10.00%20.00%30.00%40.00%50.
5、00%60.00%CTR人均点赞人均收藏人均分享专业性内容多目标多目标多目标学习探索和应用 = + (1 )/修正 ESSM 模型多目标 ESSM 模型将用户次目标行为拆解为点击率*转化率副目标正样本数量过于稀疏,可以更好地利用主目标样本的信息来提升副目标预估效果直接应用,小流量无正向效果修正 ESSM 模型根据训练数据负样本的降采样率,对 ctr 预估值按照以下公式进行矫正 = + (1 )多目标学习探索和应用-0.10%0.90%1.90%2.90%3.90%4.90%5.90%6.90%7.90%8.90%CTR人均点赞人均分享人均回答多目标人均收藏多目标修正 ESSM 模型上线效果On
6、line Learning 的尝试及经验1. 提高模型更新频率,防止概念漂移DNN 刚上线时一周更新一次模型解决模型训练慢的瓶颈后天级更新小时级 or 分钟级实时训练与推断新内容分发后快速学习 itemembedding新用户产生浏览行为后快速学习 user embedding2. 快速学习ID类特征背景面临问题Online Learning 的尝试及经验实时生成样本特征等待 label方式数据采样方式训练数据流新增特征映射问题特征映射优化器选择batch size 及学习率调整模型调整模型服务方式模型更新间隔模型更新方式Online Learning 的尝试及经验实时训练数据流程通过 red
7、is 实现,可动态进行特征映射,让online learning 学习新特征Online Learning 的尝试及经验离散 ID 特征动态映射方案Online Learning 的尝试及经验模型调整优化器Adam 相比 SGD 及 FTRL,收敛快且效果更好稀疏特征较多,选择 LazyAdambatch size 设大效果好防止短时 label 过于集中Batch SizeID 特征应当使用 dropoutDropout正则效果持平正则elu 相比 relu 效果好,AUC 提升 0.5%elu + scale + center 相比 elu AUC 提升 0.3%激活函数Online Le
8、arning 的尝试及经验提升模型效果降低模型更新频率,真正达到 online learning 效果随着模型结构的迭代越来越复杂,gpu 对训练和预测的时间有保证降低机器成本用 gpu 替换 cpu 运算,减少在线 cpu 容器数dnn 模型参数量大,占用内存多,降低内存预算实时训练与预测Online Learning 的尝试及经验实时训练与预测结构GPU 实时训练与预测变量分布图Online Learning 的尝试及经验Online Learning 的尝试及经验收藏数(人均)+9.74%分享数(人均)+5.97%评论数(人均)+10.29%回答数(人均)+3.50%天时长(人均)+2.43%次日留存+0.41%点击率+4.75%直接阅读(人均)+3.41%点赞数(人均)+5.23%上线效果核心指标:常规指标:总结与展望D
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2026年一级建造师考试模拟试题及答案(市政公用工程管理与实务)(吕梁)
- 2026年(党建基础知识)湖北省襄阳市专业技术职务水平能力测试强化训练试题及答案
- 临床药物性胆囊结石特点特点、声像学表现及鉴别诊断
- 心理干预在高血压危象护理中的应用
- 天津外国语大学附属河北外国语中学2025-2026学年七年级上学期10月月考语文试题(解析版)
- 护理中的急诊护理技巧
- 福建省百校2026届高三下学期5月联考生物试卷(含答案)
- 2026年河南驻马店市上蔡县2026年初中学业水平中考模拟考试(二) 数学试卷(含答案)
- 2026学年内蒙古自治区乌兰浩特市六年级数学期末高分专项特训题(详细参考解析)详细答案和解析
- 急诊科护理人员的药物管理规范
- 2026年湖南长沙新奥燃气有限公司社会招聘5人考试参考题库及答案解析
- 2026年安全生产月知识竞赛试题(7套完整版 含答案)
- 2026年全国安全生产月主题培训
- 2025年江苏省中考道德与法治试题及答案解析
- 2026年4月自考07816公共行政学试题及答案含评分参考
- 放射性肠炎治疗管理
- 物理教学方法交流
- 2026年二级建造师之二建机电工程实务真题含答案详解
- 2025年全国统一高考数学试卷(全国一卷)含答案
- 示波器的原理和使用课件
- 完整版全套消防工程施工组织设计方案
评论
0/150
提交评论