基于协同过滤算法的推荐系统_第1页
基于协同过滤算法的推荐系统_第2页
基于协同过滤算法的推荐系统_第3页
基于协同过滤算法的推荐系统_第4页
基于协同过滤算法的推荐系统_第5页
已阅读5页,还剩1页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、重庆大学本科学生毕业设计(论文)附件附件B:开题报告B B 附件B:毕业设计(论文)开题报告1、课题的目的及意义(含国内外的研究现状分析或设计方案比较、选型分析等)本课题研究的是基于协同过滤算法的推荐系统设计与实现,实现根据用户的兴趣特点和购买行为,向用户推荐相对应的商品。个性化商品推荐是根据用户的兴趣特点和购买行为,向用户推荐用户感兴趣商品。随着电子商务规模的不断扩大,商品个数和种类快速增长,顾客需要花费大量的时间才能找到自己想买的商品。这种浏览大量无关的信息过程无疑会使淹没在信息过载问题中的顾客不断流失。为了解决这些问题,个性化推荐系统应运而生。个性化推荐的最大的优点在于,它能收集用户特征

2、资料并根据用户特征,如兴趣偏好,为用户主动作出个性化的推荐。而且,系统给出的推荐是可以实时更新的,即当系统中的商品库或用户特征库发生改变时,给出的推荐序列会自动改变。目前主要有两种类型的推荐系统,一种是以网页为推荐对象的搜索系统,主要采用web数据挖掘的方法与技术,为用户推荐符合其兴趣爱好的网页,如Google等;另一种是网上购物环境下、以商品为推荐对象的个性化推荐系统,为用户推荐符合兴趣爱好的商品,如书籍、音像等,称这种推荐系统为电子商务个性化推荐系统,简称电子商务推荐系统。整个电子商务推荐系统主要可分为输入功能模块、推荐方法模块和输出功能模块。输入可来自客户个人和社团群体两部分。客户个人输

3、入主要指目标用户,即要求获得推荐的人,为得到推荐必须对一些项目进行评价,以表达自己的偏好,包括隐式浏览输入、显式浏览输入、关键词和项目属性输入以及用户购买历史等;社团群体输入主要指集体形式的评价数据,包括项目属性、社团购买历史、文本评价和等级评分等。输出主要为推荐系统获得输入信息后推荐给用户的内容,主要形式有:建议(suggestion),分为单个建议(singleitem)、未排序建议列表(unorderelist)和排序建议列表(orderedlist),典型的如TopN:根据客户的喜好向客户推荐最可能吸引客户的N件产品;预测(prediction),系统对给定项目的总体评分;个体评分(i

4、ndividualrating),输出其他客户对商品的个体评分;评论(Review),输出其他客户对商品的文本评价。推荐方法模块是推荐系统的核心部分,决定着推荐系统的性能优劣。协同过滤推荐是目前研究最多的个性化推荐技术,它基于邻居用户的资料得到目标用户的推荐,推荐的个性化程度高。协同过滤的最大优点是对推荐对象没有特殊要求,能处理非结构化的复杂对象,如音乐、电影。协同过滤推荐主要分为两类:一是基于内存的协同过滤:先用相似统计的方法得到具有相似兴趣爱好的邻居用户,所以该方法也称基于用户的协同过或基于邻居的协同过滤。二是基于模型的协同过滤,先用历史数据得到一个模型,再用此模型进行预测。基于模型的推荐

5、广泛使用的技术包括神经网络等学习技术、潜在语义检索和贝叶斯网络,训练一个样本得到模型。优点是:1)能够过滤难以进行机器自动基于内容分析的信息。如艺术品、音乐;2)能够基于一些复杂的,难以表达的概念(信息质量、品位)进行过滤;3)推荐的新颖性。正因为如此,协同过滤在商业应用上也取得了不错的成绩。CDNow,MovieFinder,都采用了协同过滤的技术来提高服务质量缺点是:1)用户对商品的评价非常稀疏,这样基于用户的评价所得到的用户间的相似性可能不准确(即稀疏性问题);2)随着用户和商品的增多,系统的性能会越来越低(即可扩展性问题);3)如果从来没有用户对某一商品加以评价,则这个商品就不可能被推

6、荐案例:AMAZON个性化推荐系统先驱(基于协同过滤)AMAZON是一个虚拟的网上书店,它没有自己的店面,而是在网上进行在线销售。它提供了高质量的综合节目数据库和检索系统,用户可以在网上查询有关图书的信息。如果用户需要购买的话,可以把选择的书放在虚拟购书篮中,最后查看购书篮中的商品,选择合适的服务方式并且提交订单,这样读者所选购的书在几天后就可以送到家。AMAZON书店还提供先进的个性化推荐功能,能为不同兴趣偏好的用户自动推荐尽量符合其兴趣需要的书籍。AMAZON使用推荐软件对读者曾经购买过的书以及该读者对其他书的评价进行分析后,将向读者推荐他可能喜欢的新书,只要鼠标点一下,就可以买到该书;A

7、MAZON能对顾客购买过的东西进行自动分析,然后因人而异的提出合适的建议。读者的信息将被再次保存,这样顾客下次来时就能更容易的买到想要的书。此外,完善的售后服务也是AMAZON的优势,读者可以在拿到书籍的30天内,将完好无损的书和音乐光盘退回AMAZON,AMAZON将原价退款。当然AMAZON的成功还不止于此,如果一位顾客在AMAZON购买一本书,下次他再次访问时,映入眼帘的首先是这位顾客的名字和欢迎的字样。其他算法:(1)基于内容的推荐技术(2)基于用户统计信息的推荐(3)基于效用的推荐(4)基于知识的推荐(5)基于关联规则的推荐。2、课题任务、重点研究内容、实现途径2.1课题任务和重点研

8、究内容:本课题的任务是设计实现一个基于协同过滤算法的推荐系统,主要内容包括:用户管理:创建若干个用户,买家可以在搭建的平台上购买,评价商品。卖家销售商品。可以修改用户资料,查看购物车等。权限管理:为每个创立的用户授予权限,买家和卖家各自的权限,买家只能购买商品,卖家只能销售商品。商品管理:描述商品信息,如价格,图片等,包括之前买家的评价。添加,删除,修改商品价格等等商品管理的功能。评价管理:买家购买后添加评价,评价只能由买家添加和删除,卖家不得添加和删除,评价添加和更新商品信息的数据库。推荐管理:根据先前买家的评价和当前买家购买的内容,根据此对用户进行推荐。2.2实现途径:基于用户的协同过滤算

9、的基本思想是:通过计算用户对项目评分之间的相似性,搜索目标用户的临近邻居,然后根据最近邻居的评分向目标用户产生推荐,这里采用基于用户的,协同过滤算法分为3步:建立用户模型,寻找最近邻居,产生推荐项目。n是项目数,其中Rij表示第i个用户对第j个项目的评分建立用户模型:协同过滤算法的输入数据通常表示为一个m*n的用户一评价矩阵R,m是用户数,值;rr.r11121nrr.r21222nrr.ri1i2inrr.rm1m2mnR=主要完成对目标用户最近邻居的查找。通过计算寻找最近邻居:在这一阶段,目标用户与其他用户之间的相似度,算出与目标用户最相似的“最近邻居”集。即:对目标用户u产生一个以相似度

10、sim(u,v)递减排列的“邻居”集合。该过程分两步完成:首先计算用户之间的相似度,可采用皮尔森相关系数、余弦相似性和修正的余弦相似性等度量方法,其次是根据如下方法选择“最近邻居”:(1)选择相似度大于设定阈值的用户;(2)选择相似度最大的前k个用户;(3)选择相似度大于预定阈值的k个用户。产生推荐项目:计算方法如下:(1)P=R+乂二i,*Rd-9(sim(i,j)i,dijeNBSi其中sim(i,j)表示用户i与用户j之间的相似性,R.d表示最近邻居用户j对项J,d目d的评分,兀和rj分别表示用户i和用户j的平均评分,公式(i)的实质是在用户的最近邻居集NESi中查找用户,并将目标用户与

11、查找到的用户的相似度的值作为权值,然后将邻居用户对该项目的评分与此邻居用户的所有评分的差值进行加权平均。通过上述方法预测出目标用户对未评价项目的评分,然后选择预测评分最高的TOP-N项推荐给目标用户。系统实现:网上购物推荐系统的实现可以如图1所示。用户访问p|数揚访问挖掘推荐算法图1数据库部分主要存储用户信息和项目信息,用SQLServer实现。挖掘推荐算法完成个性化推荐的任务,用Java实现。数据访问层实现了与用户交互必需的存储过程以及触发器,也使用SQLServer实现。3、进度计划序号起止周次工作内容11周至3周资料阅读和消化24周至5周需求分析阶段36周至7周系统设计阶段48周至11周编码阶段512周至12周测试阶段613周至

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论