




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、 基于个性化的协同过滤图书推荐算法研究 黄瑛+杨维伟Summary:近年来,随着国家对教育的重视,图书馆图书呈线性增长,借阅者很难从海量的图书资源中选取有用的信息。基于个性化的协同过滤推荐算法有效地解决了这个问题,为了提高推荐的准确度,引入相似度影响因子,充分考虑不同因素对推荐结果影响力的大小。Key:推荐系统;系统过滤;用户相似性;影响因子:TP311 :A :1009-3044(2016)28-0088-021 背景协同过滤算法给我们的生活带来了极大的便利,特别是当我们在网上购物时,网站总是能推送我们需要的商品,简化了购物过程,方便了我们的生活。协同过滤算法可以根据用户偏好和其他特征为用户
2、推荐相似物品,面对海量的图书馆图书资源,如果可以将协同推荐算法用于图书馆图书推荐,将能极大地方便学生的学习生活。2 相关工作以前图书馆推荐算法直接依据图书评分数据,按评分高低向用户进行推荐,没有考虑到用户的偏好和需求。随着技术的发展,图书推荐算法也得到了改进,目前常用的图书馆推荐算法大致分为三种:1)基于内容的推荐算法:该算法的基本思想是根据用户的借阅历史记录,分析借阅书籍,提取用户标签数据,然后将用户标签和图书标签进行匹配,观察匹配程度,选取前N本图书,生成图书推荐列表。2)协同过滤推荐算法:该算法在基于内容的推荐算法上进一步改进,加入相似度概念,考虑有着相似兴趣爱好的读者对用户的影响。我们
3、需要计算用户相似度,找到与该用户最相似的top-N用户,然后分析用户对这些相似用户已借阅读书的感兴趣程度,得到图书推荐列表。目前有三种常用方法用于计算用户之间的关联度。欧几里得距离法:将用户对读书的评分转换成向量的形式,由此我们得到一个n维的评分向量,利用欧几里得公式计算两个向量之间的距离,距离值越小相似度越高,欧氏公式为:余弦相似性:将用户评分看成一个n维的向量,利用余弦公式计算两个用户向量夹角余弦值,值越大两个用户就越相似,余弦公式为:相关相似性:利用Pearson相关系数计算两个读者之间的相似程度。3)基于用户个性化协同过滤推荐算法:根据高校的实际情况和需求,应运而生了一种基于用户背景的
4、个性化推荐方法。一般情况下,用户多会借阅本专业的相关书籍,所以在进行推荐的过程中可以重点考虑相关专业同学的借阅记录,将他们借阅过的书籍进行重点推荐。3 基于个性化的协同过滤推荐算法3.1 图书初始评分每天图书馆会有大量的新书上线,这些新书由于之前没有人借阅,需要为这些图书人为的划分类别和设置评分初值,根据中图法可以将图书划分成不同的22个大类。3.2 计算用户对每一类别图书的偏好根据用户的借阅历史和历史评分,结合之前的图书分类数据,计算用户对一类书籍的总评分。用户借阅不同类别书籍的数量不同,可以反映用户对某类书籍的喜爱程度,为此我们为用户已评价类别赋予不同的权重值:。为某类别图书借阅统计次数,
5、为所有借阅图书的总次数。由此我们可以计算出用户对该类图书的评分,评分公式为:表示读者a对类别书籍的评分,i属于类别的图书,是用户对类别图书的总评分。3.3 根据用户偏好,计算用户相似度上一步我们得到了用户对图书类别的评分,根据这个评分,使用皮尔逊相关系数算法计算用户之间的相似度,找出用户的近邻集合U。皮尔逊相关性公式为:M为用户a和b的共同评分项,和分别为用户a和用户b的平均评分,利用图书类别计算用户间的相似度可以大大减少计算量。根据上式我们得到用户之间的相似度,依据相似度大小进行排序,选取前N个用户作为用户a的邻居集合U。3.4 预测用户对其他书籍的评分产生推荐我们根据用户的近邻集U可以产生
6、图书推荐列表,为了使推荐列表更准确,我们引入读者相似度的影响因子。考虑到实际情况,影响因子的主要有用户专业、职位和以往评分准确度这三个方面。1)专业:众所周知,相同专业的学生对书的需求是相似的,所有相同专业学生的借阅书籍对推荐影响较大(),影响因子表达式如下:2)职位学校内老师、研究生和大学生是借书的主力军。不同职位的人对图书好坏的判读力是不同的,因此老师对图书推荐的推荐影响力应该最大。下表中的,呈现逐渐递减关系:3)历史评分准确度不同用户有不同的评分习惯,对图书评分的标准不同,为了确保推荐的准确度,我们引入第三个影响因子。如果用户评分越接近平均分则用户评分越准确,影响因子也就越大,影响因子计
7、算公式为:其中S为用户评分图书集,为用户对图书i的评分,为图书的平均评分,max和min分别为图书i获得评分的最大值和最小值。综上所述,用户的综合评分影响因子表达式为:用户对某本图书的预测评分公式为:n为属于U集合的用户数量,和分别为用户a和用户b的平均评分,为用户b对j图书的评分。由用户对某本图书的预测评分公式,我们得到用户对推荐列表内每本图书的预测评分,根据实际情况,我们选择前N本图书进行推荐。4 结束语随着科技的发展,推荐系统在我国得到广泛使用,图书推荐系统也逐渐进入学生的学习生活。根据高校的实际情况,我们提出了一种改进的图书推荐系统,引入影响因子概念,提高推荐准确度。使学生在面对海量的
8、数据时可用更方便地找到符合自己的学习资源。Reference:1 刘建国, 周涛, 汪秉宏. 个性化推荐系统的研究进展J. 自然科学研究进展, 2009, 19(1): 1-15.2 张怡文, 岳丽华, 张义飞. 基于共同用户和相似标签的好友推荐方法J. 计算机应用, 2013, 33(8); 2273-2275.3 吕果, 李法运. 基于改进协同过滤的移动个性化推荐服务研究J. 情报探索, 2014(20): 101-105.4 杨涛, 曹树金. 图书馆用户的个性化服务需求实证研究J. 大学图书馆学报, 2011(2): 76-85.5 许文青, 林双平. 融合热门度因子基于标签的个性化图书推荐算法J. 图书情报研究,2015(3): 82-86.6 Koren Y. Factor in the ne
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 41.2025年新能源行业农村生物质能分布式供能系统普及率考核试卷
- 2025年零售行业门店废弃物回收台账管理合规考核试卷
- 2025年房地产经纪服务客户关系管理规范考核试卷
- 难点解析-人教版八年级上册物理声现象《声音的特性》同步测试练习题(含答案详解)
- 浅谈画图策略在小学数学教学中的应用和思考
- 考点解析-人教版八年级上册物理物态变化《熔化和凝固》综合练习练习题(解析版)
- 2025年建筑工地扬尘治理保证金合同协议
- 2025年建筑工地安全培训合同协议
- 2024年矿山生态修复监测技术考核试卷
- 客户化开发合同(标准版)
- 2025年软件定义汽车:SOA和中间件行业研究报告
- 塞尔达玩家测试题及答案
- 2025-2030中国单反数码相机市场现状深度剖析及需求预测研究报告
- 施工质量检查制度
- 2025年粮油集团笔试试题及答案
- 个人成长目标设定与实现路径
- 化学发展史课件
- 尿路感染的护理常规
- 应急计划评审表
- 配电房岗位职责
- 2024-2025华为ICT大赛(实践赛)-网络赛道理论考试题库大全-上(单选题)
评论
0/150
提交评论