CN110400169A 一种信息推送方法、装置及设备 (阿里巴巴集团控股有限公司)_第1页
CN110400169A 一种信息推送方法、装置及设备 (阿里巴巴集团控股有限公司)_第2页
CN110400169A 一种信息推送方法、装置及设备 (阿里巴巴集团控股有限公司)_第3页
CN110400169A 一种信息推送方法、装置及设备 (阿里巴巴集团控股有限公司)_第4页
CN110400169A 一种信息推送方法、装置及设备 (阿里巴巴集团控股有限公司)_第5页
已阅读5页,还剩41页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

特征日志基于设定维度从数据库中提取具有点击特征的第一样本集合与具有分享特征的第二2根据所述第一数据特征日志基于设定维度从数据库中提取具有点击特征的第一样本将所述点击预测模型迁移到分享预测模型中,结合所述第二样本集合采用所述训练后的分享预测模型对在线候选用户进行将所述点击预测模型的输出结果作为所述分享预所述分享预测模型利用所述输入层与所述第二样本集合继续训练得到训练后的分享根据所述第一数据特征日志中的用户标识从所述数据库中提取所述用户标识对应的根据所述第一数据特征日志中的场景标识从所述数据库中提取所述场景标识对应的得到包含所述用户特征、所述场景特征和所述点击4.如权利要求3所述的方法,所述采用所述训练后的分享预测模型对在线候选用户进根据所述目标广告信息确定针对所述目标广告信息的在线候选用户;将所述场景信息以及所述在线候选用户对应的用户个根据所述预测分数从所述在线候选用户中确定目标用户3所述根据所述第一数据特征日志基于设定维度从数据库中提取具有点击特征的第一根据所述第一数据特征日志中的用户标识从所述数据库中提取所述用户标识对应的根据所述第一数据特征日志中的场景标识从所述数据库中提取所述场景标识对应的根据所述第一数据特征日志中的广告标识从所述数据库中提取所述广告标识对应的得到包含所述用户特征、所述场景特征、所述广告6.如权利要求5所述的方法,所述采用所述训练后的分享预测模型对在线候选用户进根据所述广告标识从所述数据库中提取所述广告标根据所述目标广告信息确定所述目标广告信息对应的场景信息以及针对所述目标广将所述目标广告信息、所述场景信息以及所述在线候选根据所述预测分数从所述在线候选用户中确定目标用户7.如权利要求2所述的方法,所述分享预测模型利用所述输入层与所述第二样本集合根据所述分享链路对所述第二样本集合中的所述分享预测模型利用所述输入层与具有所述权重值的第二样本集合继续训练得到8.如权利要求7所述的方法,所述根据所述分享链路对所述第二样本集合中的各个样根据所述每个用户的分享链路确定每个所述用户分4根据所述第二数据特征日志对所述训练后的分享预测11.如权利要求10所述的方法,所述根据所述第二数据特征日志对所述训练后的分享从所述第二数据特征日志中获取所述目标用户的实根据所述第二数据特征日志中的历史数据预测分数以及所述目标用户的实际操作行第一数据特征日志获取模块,用于获取用户样本集合确定模块,用于根据所述第一数据特征日样本包括所述用户标识对应的用户特征、场景标识对应的场景特征以及第一历史行为特迁移学习模块,用于将所述点击预测模型迁移到分享预目标用户确定模块,用于采用所述训练后的分享预测模型对在线候选用户进行预测,得到满足预设条件的目标用户;将所述点击预测模型的输出结果作为所述分享预所述分享预测模型利用所述输入层与所述第二样本集合继续训练得到训练后的分享5场景特征第一提取单元,用于根据所述第一数据特征日样本集合第一确定单元,用于得到包含所述用户特征在线候选用户第一确定单元,用于根据所述目标广告第一预测单元,用于将所述场景信息以及所述在目标用户第一确定单元,用于根据所述预测分数从所述在线候选用户中确定目标用场景特征第二提取单元,用于根据所述第一数据特征日广告特征提取单元,用于根据所述第一数据特征在线候选用户第二确定单元,用于根据所述目标广告第二预测单元,用于将所述目标广告信息、所6目标用户第二确定单元,用于根据所述预测分数从所述在线候选用户中确定目标用根据所述分享链路对所述第二样本集合中的所述分享预测模型利用所述输入层与具有所述权重值的第二样本集合继续训练得到根据所述每个用户的分享链路确定每个所述用户分第二数据特征日志获取模块,用于获取向所述目标用户修正模块,用于根据所述第二数据特征日志对所述训练后的分享预测模型进行修正,修正单元,用于根据所述第二数据特征日志中的历史数据预测分数以及所述目标所述存储器存储有可被所述至少一个处理器执行根据所述第一数据特征日志基于设定维度从数据库中提取具有点击特征的第一样本7将所述点击预测模型迁移到分享预测模型中,结合所述第二样本集合采用所述训练后的分享预测模型对在线候选用户进行8用逻辑回归算法(logisticregression,简称LR)或者迭代决策树(GradientBoosting[0004]但是现有技术中的方法往往只选取单场景数据进行训练得到学习模型来预测用[0009]根据所述第一数据特征日志基于设定维度从数据库中提取具有点击特征的第一9[0017]点击预测模型确定模块,用于将所述第一样本集合输入深度学习模型中进行训[0026]根据所述第一数据特征日志基于设定维度从数据库中提取具有点击特征的第一(trainingdata)、模型训练(modeltraining)、模型预测(modelserving)、排序[0043]原始的全量用户行为数据存储在数据仓库(OpenDataProcessingService,简[0046]步骤201:获取用户的第一数据特征日志,所述第一数据特征日志中包括用户标[0050]步骤202:根据所述第一数据特征日志基于设定维度从数据库中提取具有点击特方案中数据库可以是某应用平台对应的数据库,数据库中可以存储有各用户的用户信息、在设定的时间内登陆某APP(应用程序)的次数或者是设定时间内在某应用程序平台中的搜[0054]根据所述第一数据特征日志基于设定维度从数据库中提取具有点击特征的第一行了点击,x0表示用户对已投放的某广告未进行点击。第二样本集合Y中可以有多个样本享样本可以表示为(user-id,item-id,y)这种格式,其中,user-id可以表示用户标识,[0055]步骤203:将所述第一样本集合输入深度学习模型中进行训练,得到点击预测模[0056]深度学习(DeepLearning),通过组合低层特征形成更加抽象的高层表示属性类地找出分类问题或者预测问题所需要的重要特征;而传统机器学习则需要人工地给出特[0063]另外,传统的机器学习/数据挖掘只有在训练集数据和测试集数据都来自同一个featurespace(特征空间)和统一分布的时候才运行的比较好,意味着每一次换了数据都[0068]所述分享预测模型利用所述输入层与所述第二样本集合继续训练得到训练后的述分享预测模型利用所述输入层与所述第二样本集合继续训练得到训练后的分享预测模够取得更好的学习效果(可以理解为一层层网络中每个节点的权重从一个训练好的网络迁经训练好一个网络(basenetwork),可以将已经训练好的网络中的前n层复制到target[0072]目标用户可以表示的是训练后的分享预测模型预测得到的满则可以设定目标用户的数量相对多一些。若预测分数高于0.7的在线候选用户数量并根据预测分数从候选用户中确定用户作为目标用户。[0077]图2中的方法,通过基于多维度进行特征选取,能够针对性地从数据库中选取特击预测模型迁移到分享预测模型中,结合分享数据继续训练得到训练后的分享预测模型,[0079]在实际应用过程中,同一用户针对同一广告在不同场景中的[0080]方式一(需要将场景信息和用户个人信息输入训练后的分享预测模型中进行预示所述用户对所述广告的点击情况,所述分享标识表示所述用户对所述广告的分享情况;所述根据所述第一数据特征日志基于设定维度从数据库中提取具有点击特征的第一样本[0082]根据所述第一数据特征日志中的用户标识从所述数据库中提取所述用户标识对[0083]根据所述第一数据特征日志中的场景标识从所述数据库中提取所述场景标识对[0086]根据所述场景标识从所述数据库中提取所述场景标识对应的场景中的目标广告[0088]将所述场景信息以及所述在线候选用户对应的用户个人信息输入所述预测模型[0090]在实际应用中,从数据库中选取的特征的好坏能够决定最终预测模型的预测效者历史评价记录中提到货涉及的家居用品或者汽车用品、汽车改装配件的概率来进行评[0091]用户历史行为特征可以包括用户搜索(query)特征、活跃度特征以及历史交易特征等,所述活跃度特征可以根据用户在设定的时间内登陆某APP的次数或者是设定时间内行的广告以及观影类广告的点击率较高,可以推测用户对于旅行或者观影类的广告感兴[0096]方式二(需要将场景信息、用户个人信息以及广告信息都输入训练后的分享预测[0098]所述根据所述第一数据特征日志基于设定维度从数据库中提取具有点击特征的[0099]根据所述第一数据特征日志中的用户标识从所述数据库中提取所述用户标识对[0100]根据所述第一数据特征日志中的场景标识从所述数据库中提取所述场景标识对[0101]根据所述第一数据特征日志中的广告标识从所述数据库中提取所述广告标识对[0105]根据所述目标广告信息确定所述目标广告信息对应的场景信息以及针对所述目标广告信息的在线候选用户;[0113]所述分享预测模型利用所述输入层与具有所述权重值的第二样本集合继续训练[0119]所述分享预测模型利用所述输入层与具有所述权重值的第二样本集合继续训练据特征日志中包括所述目标用户对应的历史数据预测分数以及所述目标用户的实际操作[0130]根据所述第二数据特征日志中的历史数据预测分数以及所述目标用户的实际操[0137]样本集合确定模块302,用于根据所述第一数据特征日志基于设定维度从数据库[0138]点击预测模型确定模块303,用于将所述第一样本集合输入深度学习模型中进行[0140]目标用户确定模块305,用于采用所述训练后的分享预测模型对在线候选用户进[0144]所述分享预测模型利用所述输入层与所述第二样本集合继续训练得到训练后的对应的场景信息以及针对所述目标广告信息的在线候选用户;[0168]所述分享预测模型利用所述输入层与具有所述权重值的第二样本集合继续训练[0189]所述存储器430存储有可被所述至少一个处理器410执行的指令420,所述指令被[0191]根据所述第一数据特征日志基于设定维度从数据库中提取具有点击特征的第一此,不能说一个方法流程的改进就不能用硬件实体模块来实现。例如,可编程逻辑器件(ProgrammableLogicDevice,PLD)(例如现场可编程门阵列(FieldProgrammableGate而要编译之前的原始代码也得用特定的编程语言来撰写,此称之为硬件描述语言(AdvancedBooleanExpressionLanguage)、AHDL(AlteraHardwareDescription(JavaHardwareDescriptionLanguage)、Lava、Lola、MyHDL、PALASM、RHDL(RubyHardwareDescriptionLanguage)等,目前最普遍使用的是VHDL(Very-High-Speed该清楚,只需要将方法流程用上述几种硬件描述语言稍作逻辑编程并编程到集成电路中,器以及存储可由该(微)处理器执行的计算机可读程序代码(例如软件或固件)的计算机可读介质、逻辑门、开关、专用集成电路(ApplicationSpecificIntegrated

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论