基于群体相似性的智能推荐模型_第1页
基于群体相似性的智能推荐模型_第2页
基于群体相似性的智能推荐模型_第3页
基于群体相似性的智能推荐模型_第4页
基于群体相似性的智能推荐模型_第5页
已阅读5页,还剩5页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、产业市场研究所n 基于群体相似性的智能推荐模型目录1产业市场研究所2基于协同过滤的推荐模型功能功能根据用户之间在历史访问记录上的关联性,预测用户对于未访问项的偏好程度,并进行推荐适用范围适用范围业务产品、互联网内容资讯、广告等内容推荐,不需要内容的文本特征,只要有用户的历史访问、下载、评分等数据即可模型输入模型输入目标用户u、系统中所有用户访问过的内容项(页面、文章、书籍)集合I及对每个用户对集合中元素的访问权重(可以是访问频次、评分值或根据不同的用户行为类型指定一个相应权值)模型输出模型输出目标用户u可能喜欢的Top-N项列表用户数据分析平台中提供了多种类型的协同过滤算法,主要包括:a.以用

2、户为中心的算法。以用户为中心的算法。为目标用户构建与其偏好类似的近邻集合,向其推荐近邻里用户的喜好的项集;b.以以Item为中心的算法。为中心的算法。为每个Item构建近邻集合,向目标用户推荐与其历史访问记录相似的项集;c.基于基于Item影响集合的算法。影响集合的算法。扩展以Item为中心的算法,考虑逆向近邻以改善性能;d.基于二部图随机游走的算法。基于二部图随机游走的算法。利用用户和Item之间的传递关联性改善性能;e.基于矩阵分解的算法。基于矩阵分解的算法。通过矩阵分解技术将用户访问记录矩阵映射到低维空间,提升在线计算的效率。产业市场研究所3基于协同过滤的推荐模型用户游戏a游戏 b游戏

3、c游戏d游戏ex1231y3413z344?示例为一个用户-项目评分矩阵,其中评分值代表用户对项目的偏好度。评分值可以是由用户提供的,或者是按照某种转化原则从用户行为中推导出的,例如浏览为1分、下载免费版本为2分、付费购买为3分、给予好评得4分示例我们假定任务是向用户z推荐一个他尚未下载过的最喜欢游戏,在本例中,这个问题简化为从游戏d和游戏e中挑选一个用户z最可能喜欢的。根据历史记录,用户z与用户y的相似程度较高,因此用户y的评价会更接近于z的观点,游戏e可能是用户z较喜欢的。实际系统中的用户数和项目数量通常非常庞大,因此这个筛选过程也要复杂得多产业市场研究所4基于协同过滤的推荐模型用户Ite

4、m aItem bx34y24z4?用户z对事物b的评分可能是多少?SlopeOne算法认为:平均值也可以代替某两个未知个体之间的评分差异,事物a对事物b的平均差是:(3 4) + (2 4) / 2 = -1.5,也就是说人们对事物b的评分一般比事物a的评分要高1.5,于是SlopeOne算法就猜测z对事物b的评分是4 + 1.5 = 5.5产业市场研究所5基于FP Tree的关联规则推荐模型功能功能挖掘用户访问记录中存在频繁模式,最后根据频繁模式生成带有置信度权重的关联推荐规则,用于关联性产品、内容、链接推荐等用途适用范围适用范围业务产品、互联网内容资讯、广告等内容推荐,具体展现通常为在页

5、面中生成相关列表模型输入模型输入系统中所有用户访问过的内容项(页面、文章、书籍)集合I及对每个用户对集合中元素的访问情况,当前的请求项i模型输出模型输出与当前请求项i相关的Top-N项列表用户数据分析平台中使用如下方式对关联规则挖掘进行改进:a.基于频繁树的优化。基于频繁树的优化。按照数据库中的访问事务集生成频繁模式树,再对频繁模式树进行挖掘生成频繁模式,最后根据频繁模式生成带有置信度权重的关联推荐规则b.聚类优化聚类优化。预先对项目进行聚类,按照类别生成关联规则。产业市场研究所6基于FP Tree的关联规则推荐模型歌曲歌曲1 1歌曲歌曲2 2歌曲歌曲3 3歌曲歌曲4 4歌曲歌曲4 4歌曲歌曲

6、5 5歌曲歌曲5 5歌曲歌曲7 7歌曲歌曲8 8歌曲歌曲9 9歌曲歌曲1010歌曲歌曲1111歌曲歌曲12121010000000000001100000000001101100000001001001001000001000011000000111010001000010000010011001100100000000101000001110001000001000001100111000001111000000001000010000011001100000100000100001100010011001010001。示例规则1:下载过歌曲5的用户也下载过歌曲3(置信度67%,覆盖率5%)

7、规则2:下载过歌曲5的用户也下载过歌曲6(置信度50%,覆盖率6%):规则k:置信度:规则成立的可能性覆盖率:同时下载了规则中包含歌曲的比率用途示例:当用户访问歌曲5的页面时,将关联规则中置信度和覆盖率较高的歌曲显示在页面中的推荐位,以提升用户转化率。产业市场研究所7基于社会网络的推荐基于社会网络的推荐模型模型功能功能通过用户的通话、短信、好友关系等信息,构建用户之间的社会网络,向社会网络中关联较为密切的节点推荐相似的内容适用范围适用范围互联网内容资讯、广告等内容推荐,以及兴趣偏好相似的用户群推荐。相比基于内容和协同过滤的推荐,这种方法特别适合对行为数据较少甚至没有行为数据的用户进行推荐模型输

8、入模型输入目标用户u、用户之间的社会关系网络G、系统中所有用户访问过的项(页面、文章、书籍)集合I及对每个用户对集合中元素的访问权重(可以是访问频次、评分值或根据不同的用户行为类型指定一个相应权值)模型输出模型输出目标用户u可能喜欢的Top-N项列表用户数据分析平台中提供如下几种算法:a.基于广度优先搜索的算法。基于广度优先搜索的算法。通过广度优先遍历目标用户的社会网络至一定深度,对这个范围内好友对于项集和偏好程度进行加权,并根据权值进行排序产生推荐列表;b.基于网络流的算法基于网络流的算法。通过模拟随机走动,获取社会网络中与节点关系密切且全局影响度高的节点,将他们偏好的项作为推荐结果。产业市

9、场研究所8基于社会网络的推荐基于社会网络的推荐模型模型关系挖掘推荐结果其他用户偏好的项偏好加权关系挖掘:寻找与目标用户u关系紧密的群体Nu以及关系的类型与强度;偏好加权:对Nu中用户所偏好的项进行加权和排序,产生最终的推荐结果如何向用户u推荐新产品内容业务?示例产业市场研究所9模型特点模型特点u 支持多种来源数据采集支持多种来源数据采集:客户端API、网站插码等实时数据,日志数据。u 高效率大规模数据挖掘高效率大规模数据挖掘:支持上亿用户的小时级模型训练。u 自动化实时推荐自动化实时推荐:采集、分析、计算、推荐过程全自动,在线响应秒级。u 部署简单,灵活部署简单,灵活:软件包;在线服务。产业市场研究所10现网应用实验现网应用实验u 支付基地团购网站支付基地团购网站“聚惠啦聚惠啦”精准推荐精准推荐:用户参团率由之前的3.8%提升到11.9%,提升比例高达213%。u 互联网基地互联网基地MM应用精准推荐应用精准推

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论