




已阅读5页,还剩34页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
排序介绍,课程回顾,为什么要排序,排序指标,排序的流程,排序介绍,作业,计算MAP,计算nDCG,排序介绍,排序流程,数据,预处理,特征抽取,模型训练,后处理,模型训练,PointWise,PairWise,主要是将排序问题转化为机器学习中常规的分类或回归问题。,预测单个item点击率、转化率或相关度,item1是否应该排在item2前面,转换成二分类问题,模型训练,PointWise建模,转换成二分类问题:预测点击率、转化率,x,f(x),0,1,损失函数,LogLoss,-ylog(f(x)-(1-y)log(1-f(x),模型训练,PointWise建模,多标签怎么办,转换成多分类问题?,转换成带权重的二分类问题,转换成回归问题,模型训练,PointWise建模,带权重的二分类问题,label越大权重越大,正样本带权重,负样本不带,损失函数,LogLoss,-ylog(f(x)-(1-y)log(f(x)weight,模型训练,例如:,模型训练,PointWise建模,多标签问题:回归,正样本是大于0数,具体值根据需要调整,损失函数:,负样本为0,rmse,模型训练,例如,模型训练,PairWise方法,(x1,x2),f(x1,x2),0,1,损失函数:LogLoss,-log(f(x1,x2),性质:,f(x1,x2)+f(x2,x1)=1,模型训练,PairWise方法,Pair生成,转化大于点击,点击大于不点击,转化大于不点击,模型训练,例子,模型训练,总结:排序可以转化成这三种情况,带权重二分类问题,回归问题,Pair排序预测,x,f(x),0,1,x,,,f(x),(x1,x2),f(x1,x2),0,1,f是什么?,模型训练,假设空间中:,x,,,g(x),二分类:,回归:,Pair排序:,f(x)=(g(x),f(x)=g(x),f(x1,x2)=(g(x1)-g(x2),模型训练,g可以是任意的函数,一次函数:线性模型,二次函数:因子模型,复杂函数:神经网络、树模型,模型训练,g可以是任意的函数,一次函数:线性模型,二次函数:因子模型,复杂函数:神经网络、树模型,模型训练,因子模型,矩阵分解:,g(x)=u*i,u和i都是向量,模型训练,因子模型:,矩阵分解:,x=(u1,i1)g(x)=0.1*0.3+0.5*0.7+0.3*0.7,x=(u2,i1)g(x)=0.5*0.3+0.4*0.7+0.2*0.7,模型训练,因子模型:,特征矩阵分解,X=r,a,b,部分参数带有因子项,模型训练,例子,x=r,a,b,r是4维向量,a是2维向量,b是3维向量,因子数为3,b是(4+2+3)维向量,p是2*3矩阵,q是3*3矩阵,模型训练,b:,p:,q:,x(1,0,1,0),(0,1),(1,1,0),y=3+0+1+(2,1,3)*(4,3,8)=39,模型训练,b:,p:,q:,x(1,1,0,0),(1,1),(1,0,1),y=?,模型训练,因子模型,FacorizationMachine,模型训练,v:,x1,0,1,0,0,0,1,y=0.5+2.1+v1*v3+v1*v7+v3*v7=0.5+2.1+0.61+2.01+1.06=6.28,例子,x:维度为7,w0:0.5,w1,因子为3个,模型训练,v:,x1,0,1,0,0,1,0,y=?,例子,x:维度为7,w0:0.5,w1,因子为3个,模型训练,算法优化:,减少乘法个数,模型训练,算法优化,(x1*v1)*(v2*x2)+(x1*v1)*(x3*v3)+(x2*v2)*(x3*v3)=(x1*v1+x2*v2+x3*v3)2-(x1*v1)2-(x2*v2)2-(x3*v3)2/2,假设长为3,v1,v2,v3的平方每次计算完保存,模型训练,算法优化,向量平方保存,v:,w1,w0:0.5,x1,0,1,0,0,1,0,y=?,模型训练,因子模型,Field-AwareFM,模型训练,因子模型,Field-AwareFM,x=0,1,1,0,1,1=(0,1),(0,1),(1,1),例子:x分为三组,因子矩阵也分为三组,组内不做内积,组间内积用不同的矩阵,模型训练,x=0,1,1,0,1,1=(0,1),(0,1),(1,1),v1,v3,v2,v3,v1,v3,v2,v1,v2,y=(x1*v1,2)*(x2*v2,1)+(x1*v1,3)*(x3*v3,1)+(x2*v2,3)*(x3*v3,2)=(0,2)*(1,0)+(2,0)*(3,5)+(2,1)*(1,5),模型训练,x=0,1,1,0,1,1=(1,0),(1,0),(1,1),v1,v3,v2,v3,v1,v3,v2,v1,v2,y=?,模型训练,其他模型,树模型,随机森林,GBDT,LambdaRank,大作业,内容:利
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 鲁迅的故乡情结与《朝花夕拾》教学
- 狼特殊句式课件
- 狗狗采耳知识培训班课件
- 牧场消防安全培训课件
- 山东省潍坊市2025年中考数学真题附真题答案
- 安全教育培训重要性课件
- 跨境公司面试题库及答案
- 农业产业园项目2025年产业政策适应性评估及可行性研究
- 2025年新能源风能发电技术创新与风力发电控制系统报告
- 农业2025年数字化转型典型案例剖析报告
- 酒店携程培训
- 2025年高考真题-政治(湖北卷) 含答案
- 儿科护士PICU进修工作汇报
- 机关单位固定资产管理制度
- 水利工程概论课件
- 一例胃癌患者的疑难病例讨论
- 法人变更免责协议书
- 看美剧学口语知到智慧树期末考试答案题库2025年青岛职业技术学院
- 技能竞赛汇报课件
- 重庆市社区工作者招聘真题2024
- 《数字营销》课程标准(电子商务)
评论
0/150
提交评论