传统的协同过滤方法既不能处理大数据量的推荐也不能处理_第1页
传统的协同过滤方法既不能处理大数据量的推荐也不能处理_第2页
传统的协同过滤方法既不能处理大数据量的推荐也不能处理_第3页
全文预览已结束

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、传统的协同过滤方法既不能处理大数据量的推荐,也不能处理只有很少评分的用 户。这篇论文提出了著名的概率矩阵分解的方法来解决这个问题。 概率矩阵分解 的思想是以中线性因子模型,它使用与用户相关的系数,将用户的偏好建模成一 个一系列向量的线性组合。具体如下: 假设有M个电影和N个用户。R_ij表示第i个用户对电影j的评分。假设隐变 量的维度是D,那么我们希望将评分矩阵 R分解成两个矩阵,即用户隐矩阵 URdxn,和电影隐矩阵VRdw。其中,U表示第i个用户的隐向量,V 表示第j个电影的隐向量。假设评分是一个有高斯噪音的正态分布。 那么我们的 评分应当有如下公式:JV MT内=JJJ "(扯

2、10坯异卩 i=l j=l这里的声存仝扣是指高斯分布的概率密度函数。I是指示函数,表明如果用户i评论了电影j,那么其结果等与1,否则就是0。因此,上面的结 果就是所有已经被评论的电影得分的乘积,也就是似然函数了。我们给每个用户和电影的隐向量(特征向量)一个均值为0的高斯先验。有:t=i喲=律)J=1这里的I是一个D维单位对角矩阵。那么,用户和电影特征的后验分布计算如 下:図耳叨乩/庐唸)=>>巧眄丿唬,唸)x號睥扇)卩伍叼匕/,吨扇)料冋眄=nn M陶囚乃i=l j=4= p(RUtV,lpU)pV) 讥 対N1"化口砧I)二】&) x ji"®

3、;帆翻)x亠 i=l对两边取个InN MNMlnp(t/j VRou,a) 乂 乂 如 b"(九|口与丿+In"口 |U, 丄)+、: hi 11 J111J1V(vyoJi)上面这三项都是形式完全一样,只是系数和均值方差不同,我们以其中一个为例,剩下都一样。即求解In"(口|0辭)我们给出用户i的概率密度函数:川哋翻一丽叫册吹-押创“),所以:(zr2I)_1 =丄戛注意,由于I是对角阵,那么网即辭)二叫一爲严)-雰=ln(|和严)一答+一瓢研)-雰D . UUi=-丁 111(%)_苍旷+血类似地,我们可以得到进而我们可以得到最终的公式。公式如下:lnp(U,VR,a2tcrlal) = - 右土 £>畑-0疔-去fx 口舟士厅岭I 尸 1 ilV jlN Al In <r2 + _VD Ln + MD In Uy I + C, (3) J/最大化后验概率U和V (最大可能性),等价于求下式的最小值:£=|

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论