余弦相似度度量_第1页
余弦相似度度量_第2页
余弦相似度度量_第3页
全文预览已结束

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、2.2.1 余弦相似度度量为了找到相似物品,需要定义一种相似度度量标准。在基于物品的推荐方法中,余弦相似度由于效果精确, 已经被证实是一种标准的度量体系。这种度量标准用两个n维向量之间的夹角来测算相似度。这种方法也 被广泛用于信息检索和文本挖掘,用来比较两份文本文档,其中文档可以表示为词语的向量。将两个物品a和b用对应的评分向量和 来表示,其相似度可以定义如下:符号表示向量间的点积,表示向量的欧式长度,即向量自身点积的平方根。物品 5 和物品 1 的余弦相似度因此可以计算为:sim(/571) = 0 阳51CTtjBPH1相似度值介于0和1之间,越接近1则表示越相似。基本的余弦方法不会考虑用

2、户评分平均值之间的差异。 改进版的余弦方法能够解决这个问题,做法是在评分值中减去平均值。相应地,改进余弦方法的取值在 1 到+1 之间,就像 Pearson 方法一样。设U为所有同时给物品a和b评分的用户集,改进的余弦相似度计算如下:我们因此可以对原始的评分数据集进行变换,用评分值相对于平均评分值的偏差取代原始值,如表2-2所示。表 2-2均值调整评分数据库物品1 物品2 物品3 物品4 物品5Alice1.00-1.000.000.00?用户10.60-1.40-0.400.600.60续)续)物品1物品2物品3物品4物品5用户20.20-0.800.20-0.801.20用户3-0.20-0.20-2.202.800.80用户4-1.802.202.20-0.80-1.80物品5 和物品1 的改进余弦相似度值为:确定物品间的相似度之后,我们可以通过计算Alice对所有与物品5相似物品的加权评分总和来预测Alice对物品 5 的评分。形式上,我们预测用户 u 对物品 p 的评分为:技术成技术成就像在基于用户的方法

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论