




已阅读5页,还剩59页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
洳乡:土曾论文题目 浙江大学硕士学位论文交工具的出现,引发研究用户影响力这一课题的热潮。 浙江大学硕士学位论文 , 瓵 浙江大学硕士学位论文踅纭 浙江大学硕士学位论文 浙江大学硕士学位论文图图对挠跋炝治觥图用户电影评分示意图图用户信任网络图用户相似网络图相似用户集合图算法传递网页等级的示意图图随机游走的示意图图单条路径间接相似度计算 浙江大学硕士学位论文表目录 浙江大学硕士学位论文,自己的相似度,为用户找出最近邻居集合,然后为用户做推荐。这就会存在几个 浙江大学硕士学位论文 浙江大学硕士学位论文似用户集,最后利用候选的相似用户集以及用户影响力因子为目标用户作推荐。年,等学者正式提出来推荐系统这一概念。推荐系统的出推荐系统有几个重要的模块:用户信息采集模块、用户建模模块、推荐对象建模模块、推荐算法模块 浙江大学硕士学位论文用户的偏好信息的推荐方法。在一个基于内容的推荐系统中,常常使用关键字 浙江大学硕士学位论文 浙江大学硕士学位论文领袖” 浙江大学硕士学位论文的排序并与其他排序方式进行对比,发现粉丝数目只是影响用户影响力的其中一个因素。随着社交网络的发展,互联网行业出现一批专门分析用户影响力的企业。其赥 浙江大学硕士学位论文痵籇篴孽舅霁趖上的影响力分析 ,甜妗耄琻图籩訲的影响力分析匆端狗掷嗥鳍等。基于内容推荐算法普遍存在数 浙江大学硕士学位论文据扩展问题和冷启动问题,造成推荐的效果不理想。蚏是推荐系统中比较早期的优秀工业产品。的。该系统与煌牡胤绞牵琈主要运用于电影推荐并且是 浙江大学硕士学位论文一个在线推荐系统。:畊甧:畊産甤新闻:甶甤协同过滤算法 图用户电影评分示意图表用户电影评分矩阵项目的打分数据构成了一个门的矩阵。矩阵中的每一个元素硎居没对于项目的评分,可以看出里面有很多缺失的元素值。协同过滤的提出是为了预测该矩阵中的缺失值,也就是预测的用户对项目的 浙江大学硕士学位论文 基于模型的推荐算法的思想是首先对用户的历史评分数据进行算法使用场景用户与项目数量少,评分矩阵变化快 浙江大学硕士学位论文主要体现在以下几个方面: 浙江大学硕士学位论文滤算法至少要对用户和项目进行一次循环读取和计算,也就是说协同过滤算法对用户和项目的处理过程是不可避免的,对于上百万之巨的数目,一般的推荐算法将遭遇到严重的扩展性问题。而如今很多的用户希望立即获取推荐的结果,而不管这个用户过去到底有什么样的购买记录和使用习惯,这就更加需要推荐系统具有高可扩展性。本文工作 浙江大学硕士学位论文与用户影响力的推荐方法的架构介绍、各阶段具体内容阐述、算法描述以及实验究工作。 浙江大学硕士学位论文本章小结 浙江大学硕士学位论文问题的定义条信任链越长,证明信任度越低。 浙江大学硕士学位论文图用户信任网络这种关系可以是有向的,也可以是无向的。图中所示的是单向的信任关系,本文中所讨论的、算法所涉及的以及实验的数据集均是采用单向的信任关系。图中,对于用户此担淞诰佑没、喽远员绕湎乱患兜牧诰佑没、信任度更高。而本文中涉及到的用户影响力因子这个影响推荐结果的重要因素的计算是基于信任网络的。与信任网络相似,相似网络也是由用户与用户组成的一种网络,不同的是相似网络中的边的关系是相似关系。将相似网络中的相似性定义为两种类型,一种是直接相似性,一种是间接相似性。直接相似性指的是可以通过一般的相似度算法计算出来的用户之间的相似性。由于数据的稀疏性导致相似性不好计算,所以计算出来的直接相似用户偏少,所以需要定义间接相似性。间接相似性指的是需要用相似性传递算法来计算出来的用户之间的相似性。这样就产生了两种类型的相似用户集合。直接相似用户集合和间接相似用户集合。由于所涉及到的网络的复杂性,相似用户集合中可能包含很多的直接相似用户和间接相似用户,因此就需要从集合中挑选子集作为推荐中使用的候选用户集合,而这部分用户集合可以称为直接市用户候选集合和间接相似用户候选集合。如图所示: 浙江大学硕士学位论文图中实线箭头表示直接的相似关系,虚线箭头表示的是间接的相似关系。间接相似关系是通过相似度传递算法计算出来,文中会进行详细阐述。一般来说,一个用户的直接相似用户个数要少于间接相似用户个数。尤其是在数据比较稀疏的情况下表现的更加明显。图中所示的诘悖渲苯酉嗨朴没狟,间接相似用户为虵,如果放宽相似度传递算法的阀值,可能用户陀没也是用户 浙江大学硕士学位论文图中表示的是相似网络中某个用户与相似网络中其他用户之间的关系。关系,这部分用户与用户涫侵苯酉嗨乒叵担簿褪怯没的直接相似用户内的数。信任网络中,用户与用户之间存在着信任关系。我们定义一个集合 浙江大学硕士学位论文怯没鍪琺是项目个数。每个用户“有一个对于项目的集合,表示用户“的相似用户的集合,其中的屯,表示用户甜与用图,鏞穑瑅蕌,蔛。法计算出来的。可以使用。来表示从乩计算出来的用户“的候选用户集合。是俗虬的子集。在给定的用户信任网络,丁己,没稀荆“,海和项目集合 浙江大学硕士学位论文算法概述户影响力这一因素也可以为推荐作一些权衡。 浙江大学硕士学位论文 浙江大学硕士学位论文 浙江大学硕士学位论文用户影响力因子计算算法撑琶,由的创始人拉里佩奇和谢尔盖布林发明的分别将上述的网页标记为珺,虳。该图说明了在网页之间值是 浙江大学硕士学位论文值为瞅萘闯鐾匙苁椒忠桓鐾车腜担敲赐械腁、篜狿,咫骸狿、也就是说郴等鳎渲萆俺唤挪汛覣嘣。 浙江大学硕士学位论文定的概率选择某个网页,这个概率其实就是这个网页的值。进行了统计和比较。也就说每六分钟就可以完成上述任务的一次迭代。图随机游走的示意图算法在早期为搜索引擎判断一个网页的重要性提供了重要技术支 浙江大学硕士学位论文网。人们提出了更多的基于的改进算法来弥补它的不足。本文主要对算法依据用户浏览的网页信息获取到此时的查询的麵峭硃公式可以计算得到每一个网页最终的值。 公式如下: 浙江大学硕士学位论文改进的公式为:撒一占鏊乃乃,算法具体描述如下: 浙江大学硕士学位论文 篹簍:札;,只: 浙江大学硕士学位论文。,: 簑篹用户直接相似度计算,就是采用常见的相似度计算方法来计算两个用户之问 浙江大学硕士学位论文琕碛没昂陀没相似度。,代表用户“打过分的所有项目的评两个用户向量。用户向量可以通过用户的所有相关资料进行产生,如用户的兴趣,浏览资源,标签资源等。 浙江大学硕士学位论文 浙江大学硕士学位论文亍取这些路径中的最小值作为最终的间接相似度值取这些路径中的平均值作为最终的间接相似度值 浙江大学硕士学位论文关,路径越长表示权值越小。路径的长度。现在的相似网络中,对于用户甜来说,存在两类邻居用户,一类是通过原本 浙江大学硕士学位论文整个算法的思想是优先从靠近目标的邻居节点中选取候选用户节点,如果均点。对于算法中求图中点的邻居节点集合,不同的图的存储结构,采用的算法不同。若图的存储结构为邻接表的方式,那么直接做单链表的遍历,直到最后一个节点。显然时间复杂度与图中的边的数目有关。若图的存储结构为邻接矩阵方式,那么需要对所有节点进行遍历。显然时间复杂度与图中的顶点个数有关。若是稀疏图,邻接表的表示方式要比邻接矩阵的表示方式在查找邻居节点的时间复杂度要低。反之,则后者优于前者。因此,信任网络的数据结构表示方式会影响到本算法的时间复杂度。 浙江大学硕士学位论文韫琣篿琒玩; 浙江大学硕士学位论文基于上述的流程,我们得出两类的候选用户集合。直接相似用户候选集合目标用户和目标项目做出评分的预测。 浙江大学硕士学位论文本章小结 浙江大学硕士学位论文本实验所有代码均用语言实现,开发狤。砥鳎诖僮飨低砏 浙江大学硕士学位论文基于用户的协调过滤算法计算公式如下:。未圣:掣坐些皇忪则川,其中,表示项目的集合。, 浙江大学硕士学位论文准平均绝对误差。推荐系统中,用户与用户对于事物的衡量标准不一样,有些用户要求比较严苛,评分普遍很低;有些用户要求比较随意,评分相对较高。这样就会导致评分误差不能比较客观的反映算法推荐效果的优劣。因此需要对评分误差标准化进行标准化处理。标准平均绝对误差这个衡量标准就是一种统一不同用户评价标准的误差衡量标准。分值以及实际评分值。蚴氍。,吒扎砌,。,吒,直鸨硎驹谙钅考螶中,用户“对项目评分的最大值以及最小值。 浙江大学硕士学位论文。对,一基于路径衰减的相似度传递算法数据稀殖度图基于路径衰减的相似度传递算法实验比较 浙江大学硕士学位论文籉一目标用户个数第三个实验将分析本文提出的社交网络下的推荐算法的推荐结果。本实验采用实验一的数据抽取标准,仍然将数据集合划分为年两部分,用的 浙江大学硕士学位论文衕一数据稀噎度如图所示,基于社交网络与用户影响力的推荐算法与基于项的协同过滤 浙江大学硕士学位论文貉一、怀数据稀碴度图平衡因子对于推荐效果的影响 浙江大学硕士学位论文因为每个用户在信任网络中对其他用户所产生的影响力是不一样,所以我们由于数据的稀疏性导致用户的相似用户过少,我们提出基于路径衰减的相似度传递算法来增加用户的相似用户数量,以挖掘出潜在的相似用户。为了既考虑信任网络又考虑用户的偏好关系,我们将用户的相似性结合到信任关系中。提出两种类型的相似用户,直接相似用户和间接相似
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 翠亨村出了个伟人说课稿初中音乐粤教花城版2024七年级下册-粤教花城版2024
- 北京昌平事业单位笔试真题2025
- (正式版)DB65∕T 4267-2019 《大果沙棘标准化育苗技术规程》
- (正式版)DB65∕T 4230-2019 《肉牛养殖小区机械化清粪设备操作规程》
- 获取网络资源试题及答案
- 2025年韩国高考化学真题及答案
- 6.3 能源开发与环境保护说课稿高中物理沪教版2019必修 第三册-沪教版2019
- 2025年输血科人员能力评估考核试题附答案
- 第12课 日益进步的交通和通信工具说课稿高中历史北师大版2010必修2-北师大版2010
- 测试执行监控工具在覆盖率分析中的应用-洞察及研究
- 小学四年级数学学情分析报告
- 2023-2024学年上海市杨浦区六年级上学期期中考试语文试卷含详解
- 农行超级柜台业务知识考试题库(含答案)
- 旅游接待计划表
- 新标准大学英语(第三版)综合教程3(智慧版)课件 Unit6 Path to prosperity
- 道路环卫清扫保洁项目原有人员的接收和安置设备采购及工作交接方案
- 乘法的初步认识教学公开课一等奖课件省课获奖课件
- 3认识你自己-大学生自我意识发展课件
- 中药学全套(完整版)课件
- GB 1886.232-2016食品安全国家标准食品添加剂羧甲基纤维素钠
- 育儿嫂服务合同
评论
0/150
提交评论