版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
本发明实施例提供的一种推荐系统的数据考商品的点击率影响因子;计算相应的参考评有效提高了数据精度进而提升了推荐系统的准2获取多条周期统计的样本数据,所述样本数据包括对应于商品和用户的历史曝光次按照历史曝光次数和历史点击次数将样本数据分成多个数据组,在样本数预设筛选集,所述筛选集包括最近向用户推荐的商品,或者,参根据商品的特征,循环计算每个参考商品相对于筛选集中商品的特征,ci是一个周期记录的历史曝光次数中的第i个数据,ET是一个周期记录的历史点击次数中,3,,,r:是当第i路召回1个商品后的召回比例,是第i路召回1个商品后第j路的召回比,,5.根据权利要求1所述的推荐系统的数据处理方法,其特征在于,所述根据商品的特筛选集中第j个商品的相似度,e-"表征衰减因子,dj表示第i个参考商品与筛选配值,L2(D,Dj)是第i个参考商品与筛选集中第j个商品第i个参考商品与筛选集中第j个商品的品牌匹配值,Spu_id(D,Dj)是第i个参考商品与4获取模块,用于获取多条周期统计的样本数据,所述样本数据包括对应统计模块,用于按照历史曝光次数和历史点击次数将样训练模块,用于以所述比值作为回归标签,批量梯度下降求解筛选模块,用于根据商品的特征,循环计算每个参考商通过以下公式求解得到对应于商品和用户的点击率影响,ci是一个周期记录的历史曝光次数中的第i个数据,ET是一个周期记录的历史点击次数中5筛选集中第j个商品的相似度,e-"表征衰减因子,dj表示第i个参考商品与筛选配值,L2(D,Dj)是第i个参考商品与筛选集中第j个商品第i个参考商品与筛选集中第j个商品的品牌匹配值,Spu_id(D,Dj)是第i个参考商品与由处理器加载并执行以实现如权利要求1至5中任一项所述的推荐系统的数据处理方法的67P=wo+1cw+例,cj是除第i路外的第j路已召回的商品数量;Distance(i8选集中第j个商品的相似度,e-"4表征衰减因子,dj表示第i个参考商品与筛选集中第j个商品间隔,a是间隔衰减因子;Dist(D,Dj)是第i个参考商品与筛选集中第j个商品的标题编辑距离,L3(D,Dj)是第i个参考商品与筛选集中第j个商品的三级目录匹配值,L2(D,Dj)是第i个参考商品与筛选集中第j个商品的二级目录匹配值,B(D,Dj)是第i个参j个商品的编码匹配值。统计模块,用于按照历史曝光次数和历史点击次数将样本数据分成多个数据组,9P=wo+1cw+N是一个周期记录的历史曝光次数或历史点击次数的总数据量,C是点击影响,E是曝光影筛选集中第j个商品的相似度,e-"4表征衰减因子,dj表示第i个参考商品与筛选集中标题编辑距离,L3(D,Dj)是第i个参考商品与筛选集中第j个商品的三级目录匹配值,L2(D,Dj)是第i个参考商品与筛选集中第j个商品的二级目录匹配值,B(D,Dj)是第i个参j个商品的编码匹配值。图4是本发明实施例提供的执行推荐系统的数据处理方法的电子设备的硬件结构发明的基本构想,遂图示中仅显示与本发明中有关的组件而非按照实际实施时的组件数[0028]本发明采用基于用户反馈自适应的重复曝光商品控制和降权方法,在已推荐过[0036]同样以第1个数据组为例,基于上一个步骤记录的样本数据,对应历史曝光次数P=wo+1cw+N是一个周期记录的历史曝光次数或历史点击次数的总数据量,C是点击影响,E是曝光影近分别记录为ctie(1~N)。每个时间间隔影响衰减比例为a,曝光量分别记录为c=1c;a"-',曝光影响E的方法从剩下的n_1路召回中取召回商品,直至召回商品的总数达到预设的参考商品的总score=⃞*ctr*cvr*price[0068]筛选集是最近向用户推荐的商品的集合,例如在电脑或越高,反之用户不太感兴趣的,出现两条用户可能就反感了。基于MMR(英文:Maximal选集中第j个商品的相似度,e-"4表征衰减因子,dj表示第i个参考商品与筛选集中第j个商品推送的时间间隔,a是间隔衰减因子;Dist(D,Dj)是第i个参考商品与筛选集中第j值,L2(D,Dj)是第i个参考商品与筛[0073]表示参考商品Di与已选出的[0074]内层是一个softmax函数,用于将相似度转换为权重分布,并引入衰减因子。外层的DjES是对所有已选筛选集商品Dj进行求和。衰减因子er"d,中dy表示参考商品Di与筛选集商品n之间的间隔,此处的间隔可以理解为推送时大。a是一个正数超参,用于调节衰减速度。[0075]在sim2(D,D)的数据计算过程中,标题编辑距离是针对两个商品的标题名称计算个字符串之间的相似性。在本申请中,标题编辑距离Dist(D,Dj)是商品标题编辑距离除以评分高的筛选集中的商品供推荐系统调用。[0083]由上述实施例的描述可见,本发明实施例提供的一种推包括获取多条周期统计的样本数据,所述样本数据包括对应于商品和用户的历史曝光次商品加入筛选集,所述特征评分是参考商品和筛选集商品的参考评分与相似度的加权差借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:只读存储器统计模块12,用于按照历史曝光次数和历史点击次数将样本数据分成多个数据因子计算模块15,用于由点击率影响因子模型得每个参考商品的点击率影响因P=wo+1cw+N是一个周期记录的历史曝光次数或历史点击次数的总数据量,C是点击影响,E是曝光影例,cj是除第i路外的第j路已召回的商品数量;Distance(iscore=⃞*ctr*cvr*price选集中第j个商品的相似度,e-"4表征衰减因子,dj表示第i个参考商品与筛选集中第j个商品间隔,a是间隔衰减因子;Dist(D,Dj)是第i个参考商品与筛选集中第j个商品的标题编辑距离,L3(D,Dj)是第i个参考商品与筛选集中第j个商品的三级目录匹配值,L2(D,Dj)是第i个参考商品与筛选集中第j个商品的二级目录匹配值,B(D,Dj)是第i个参j个商品的编码匹配值。[0091]图4是本发明实施例提供的执行推荐系统的数据处理方法的电子设备的硬件结构[0094]存储器420作为一种非易失性计算机可读存储介质,可用于存储非易失性软件程[0095]存储器420可以包括存储程序区和存储数据区,其中,存储程序区可存储操作系[0096]输入装置430可接收输入的数字或字符信息,以及产生与推荐系统的数据处理装[0097]所述一个或者多个模块存储在所述存储器420中,当被所述一个或者多个处理器[0100](2)超移动个人计算机设备:这类设备属于个人计算机的范畴,有计算和处理功以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 幼儿园家园共建工作制度
- 幼儿园常态维稳工作制度
- 幼儿园感冒预防工作制度
- 幼儿园教师值班工作制度
- 幼儿园法律教育工作制度
- 幼儿园留守儿童工作制度
- 幼儿园线上教学工作制度
- 幼儿园规范管理工作制度
- 幼儿园门口保安工作制度
- 建筑管理站保密工作制度
- (2025年)电工三级安全教育试题及答案
- 2026年设备状态监测的标准与规范
- 2026广东东莞市常平镇编外聘用人员招聘5人备考题库附答案详解(完整版)
- 广东省广州市黄埔区第八十六中学2024-2025学年八年级下学期4月期中物理试题(含答案)
- 2026年广东食品药品职业学院单招职业技能测试题库附参考答案详解(a卷)
- 深海采矿生态修复技术的可行性研究
- 企业价值成长中耐心资本的驱动作用研究
- GB/T 45899-2025麻醉和呼吸设备与氧气的兼容性
- 儿童生长发育与矮小症讲座
- 《联合国海洋法公约》(中文完整)
- 超星尔雅学习通《中国文化复兴古典同济天下》章节测试含答案
评论
0/150
提交评论