【《关于协同滤波算法的计算过程综述》1500字】_第1页
【《关于协同滤波算法的计算过程综述》1500字】_第2页
【《关于协同滤波算法的计算过程综述》1500字】_第3页
全文预览已结束

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

关于协同滤波算法的计算过程综述1.1相似度公式如果想使用系统列表算法,那么一定逃不掉相似度的类比运算。无论是基于用户还是物品,都要对用户或者物品进行相似度运算。本文选择余弦相似度做为算法基础。余弦相似度公式就是假设空间中存在两个向量,用它们在空间中的夹角的余弦值来作为评判这两个向量相似度的值。两个空间向量的余弦值越接近1,就代表着两个向量的夹角越小,方向性越一致,所以相似度就越高。余弦相似度公式ru表示一个用户的打分合集,rv表示另一个用户的评分合集,i代表视频,为用户u对视频1的打分乘以用户v对视频1的打分加上用户u对项目2的打分乘以用户v对项目2打分……然后相加再相乘直到最后一个视频。为用户u对视频1的打分取平方加上用户u对视频2的打分取平方加上……先平方再相加直到最后一个视频然后得到的值取平方根,平方根乘以用户v的平方根。当两个用户之间对某些视频集共同的相似操作很多,当数据庞大至某一阀值,便可使用皮尔森相关系数来计算相似度。这种情况下会比余弦相似度公式精准度更高。当然这是建立在两个用户拥有较多共同评分项目的基础上。反之如果两个用户间共同相思操作很少,皮尔森相关系数的精准度会下降,甚至并不如余弦相似度公式的效果好。两个公式各有利弊。皮尔森相关系数计算公式如下所示,j、k为两个假设存在的向量。皮尔逊相关系数计算公式1.2基于用户的协同滤波算法N(u)N(v)v喜欢的的视频集合。则两个用户的相似度W为:但是上面的公式原理过于简单粗糙且仍有缺陷。事实上,许多用户从未对彼此的物品产生相关性。所以在视频数量庞大,但是用户稀少的环境下N(u)⌒N(v)无限近似于0,甚至有可能出现N(u)⌒N(v)=0的情况。为了避免这种情况的发生,我们选择首先计算出N(u)⌒N(v)≠0的情况。假设存在用户对(u,v),然后将这种情况除以分母。为此可以建立物品到用户的倒排表,对于每个物品都保存对该物品执行过操作的用户列表。令稀疏矩阵C[u][v]=N(u)交N(v)。那么,假设用户u和用户v同时属于倒排表中K个物品对应的用户列表,就有C[u][v]=K。可以扫描反向列表中每个项目对应的用户列表,将用户列表中的两两用户对应的C[u][v]加1,最终就可以得到所有用户之间不为0的C[u][v]。图2-1两个使用者对应的倒排表计算得出用户u对物品的感兴趣程度:再采用的是JohnS.Breese在论文[14]提出的中的计算相似度的公式的公式:通过1/log(1+|N(i)|)降低了两个用户的兴趣列表中都存在热度高的视频,从而令他们的相似度过高产生的影响。这样得到用户之间的相似度之后,该改进过的基于用户的协同滤波算法记为UCF+[14]。I(i)是对视频i进行评分的用户集。S(u,k)为一组k个用户。rvi为用户v对视频i的评分。最终将推荐排名靠前的N部视频推荐给用户u,即为最终推算结果。1.3基于物品的协同滤波算法设表示喜欢视频i的用户数,表示同时喜欢视频i和视频j的用户数,则视频i和视频j的相似度W为:在本系统中这个公式即有效地降低了视频j的在整体公式中的相对重要程度,在本系统中可以将大家都喜欢的视频从特定用户群喜欢的视频中抽离出来。在基于物品的协同滤波算法中,要惩罚活跃用户。活跃用户评分的视频过多,会导致他评价出的视频集过于杂糅。比如这个用户如果是一个全方面视频爱好者,那么他的评分视频集会使数据库中的几乎所有视频都产生关联,这时视频与视频之间就似乎失去了不同,算法便会被干扰,会在内存中生成一个十分庞大的没有规律的矩阵。这个矩阵会影响所有用户被采集的数据。所以最好要将活跃用户提供的数据减小至非活跃用户之下。改进的公式为:1/(log(1+|N(u)|))降低了活跃用户增加的视频相似度。然后如此计算用户v对视频j的兴趣度。表示用户v爱好的

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论