




免费预览已结束,剩余1页可下载查看
下载本文档
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第一部分目前推荐算法应用背景较多,方法也各不相同。按推荐背景分:社交网络推荐系统,服务推荐系统,视频推荐系统,电子商务推荐系统等。目前采用的推荐算法分类:(该部分总结基本均参考文献17)1.协同过滤算法:(1)基于记忆的推荐算法1) 基于内容推荐算法2)基于用户推荐算法3)基于用户的Top-N算法4)基于项目的Top-N推荐算法 (2)基于模型的推荐算法1)基于朴素贝叶斯分类的推荐算法 1利用加权朴素贝叶斯方法对没有评分的数据进行预测。优点:缓解稀疏性,推荐准确度提高。较好的计算精度 缺点: 用户评分之间存在相互依赖关系时,该算法的准确性将打折扣 2)基于线性回归的推荐方法 1缺点:推荐精度低。3) 基于马尔科夫决策过程 MDP的推荐算法 优点:考虑每个推荐的长期影响,以及每个推荐的期望值。4) 基于矩阵分解的推荐算法,SVD系列推荐算法优点:缓解稀疏度,推荐准确性好 缺点:只能对二维数据进行分析,考虑因素较少。5) Slope one 优点:产生结果速度快缺点:准确性不高6)基于聚类的 Gibbs 抽样方法 缺点:计算复杂度大7) 概率相关方法缺点:计算复杂度大8) 极大熵方法 缺点:计算复杂度大2.基于内容的推荐算法 1) 文本推荐方法 优点:特征提取容易,应用广泛。2) 基于潜在语义分析( Latent Semantic Analysis,LAS) 的推荐 缺点:潜在语义空间物理意义不明确,计算量大 3) 自适应推荐(1)决策树 (2)聚类(3)人工神经网络 优点:根据用户兴趣动态调整推荐 3. 基于图结构的推荐算法:基于图结构的推荐算法通过分析二部图结构给出合理的推荐。优点:推荐准确性较高。 4.混合推荐算法 应用最多的是协同过滤推荐算法,并且很多方法已经并行化实现。基于记忆的推荐算法较简单,推荐准确性不高;基于模型的比较复杂,推荐准确性高,研究较多。基于内容的推荐算法着重强调文本信息,研究也较多。基于图结构的推荐算法和混合推荐算法应用较少。第二部分以下是近年来的水平较高的推荐算法汇总,这些算法均进行了并行化实现:1.云环境下top-n推荐算法1:多层分布式存储架构 MDSA,在该架构中,网络节点被组织成一棵层次索引树 MDSA-Tree,而电子商务数据按照特定的规则分割存储于 MDSA-Tree 的各节点上 为了降低网络传输代价和 I/O 开销,提出了适合 top-n 推荐的数据编码模式,而为了缩减系统响应时间,利用 map /reduce 分布式编程模型来快速获取满足用户偏好的前 n 个项。优点:实用性和可扩展性强。2. 基于混合推荐和隐马尔科夫模型的服务推荐方法2:云环境下对最优服务进行有效推荐的方法,,针对常常被忽略的新用户学习策略,提出新用户偏好的确定方法;针对服务的动态变化情况,基于隐马尔科夫模型(hidden Markov model)提出一种冗余服务消解策略。优点:更高的准确度和更好的服务质量,能更有效地提高系统性能。缺点:仅仅考虑了基于内存的 协同过滤方法(memory-based collaborative filtering),还没有考虑网络的本身的结构拓扑。3. 融合用户集合关系的稀疏线性( UCSLIM) 推荐算法3:将用户划分为用户集合,进一步挖掘用户与用户集合之间的隐含关系,并综合考虑用户与用户相关性、用户与用户集合相关性这两个因素。优点:时间复杂度低。缺点:用户集划分不够精准。4. 一种基于标签与协同过滤的并行混合推荐算法4:该算法通过计算标签的词频逆文档频率()值降低流行标签权重,根据用户的历史行为预测用户对其他资源的偏好值,最后依据预测偏好值排序产生Top-N推荐结果。优点:推荐质量高,具有一定的普适性;解决传统协同过滤算法的Top-N冷启动问题。算法并行化提高了推荐效率,复杂度较低。缺点:实际应用中,标签质量对实验结果的影响。5. 基于实值的状态玻尔兹曼机模型5:模型和用户的社交关系相结合。优点:解决数据稀疏问题。缺点是:应用领域都是传统的0-1数据。6. 基于Apache Spark 的一种混合分布式协同过滤算法6:在spark平台上实现基于用户的协同过滤算法,并结合了维度减少和机器学习中的聚类算法。还通过标签得到用户对项目的关联性。优点:解决了冷启动问题,同时效率提高。缺点:当新的数据加入时需要更新模型。7. 非负稀疏潜在语义分析算法7:采用图形处理单元加速的方法来优化非负稀疏潜在语义分析的算法,用来挖掘多媒体资源和标签数据关联背后的潜语义空间。优化了非负稀疏潜在语义模型,并且并行化实现,用一个数据分区方案高效地解决了内存拥堵。优点:计算复杂度低。8. 一个采用Mapreduce框架来并行计算标签亲和力的方法8:采用Mapreduce编程框架来计算微观、宏观和二元标签的同现出现频率。大概采用wordcount方法来计算标签同时出现率。优点:性能好,可扩展性强9.并行化的隐式反馈推荐模型9:优点:克服了在隐式反馈推荐场景下只有正反馈而缺乏负反馈导致的困难,通过建模用户与产品间的选择倾向来提高推荐质量;极大地提高了优化算法的效率和可扩展性。缺点:只考虑了隐式反馈,没有考虑显式反馈,实际中隐式反馈也可能与显式反馈并存。10. 基于规范矩阵因式分解的推荐模型(RMF模型)10:并行改进的规范矩阵因式分解的推荐模型(P-RMF)。优点:推荐准确度高和可扩展性强,速度快。缺点:在处理极度不平衡的数据集上,可能会导致训练瓶颈。目前每种推荐算法都有应用,并且都有创新。应用最多的是基于模型的推荐算法。因为每个领域都有各自独特的特征,因此研究方法也就不一样,内容也较多。基于标签的推荐算法外文文章较多,但是没有查到其并行化实现的文章。以上都是并行化实现过的。第三部分没有实现并行化的:11. 基于标签推荐的数据挖掘算法11:利用扩展激活算法来学习标签推荐的主题,这种方法建立在一种假设上,及推荐给用户的标签来自于从现存的微博和主题中提取的关键字。同样也提出一个标签分类系统,即基于相关性的特征选择遗传算法和支持向量机分类器。12. 用户生成内容协同过滤推荐12:一种标准的方法来利用各种类型的用户生成内容算法来提高推荐准确性。建立两个新的统计模型协同过滤和主题建模。一个模型的重点是学习用户的喜好,另一个模型的目的是学习用户偏好和项目方面。还有一个参数评估算法使模型不仅可以得到确实的预测值,而且还产生可解释的话题。优点:推荐准确,延伸性好。13. 张量分解算法13(用户-服务-时间)这种三维模型。优点是可以把多维信息融合进系统,推荐准确性高。缺点是要注意过拟合的问题,当因子矩阵维过高的时候,预测性能会有所下降。14. 一种基于时序消费行为的最近邻建模方法14:寻找对用户(产品)影响最大的邻居集合,将该邻居集合成功融合到基于概率矩阵分解的协同过滤推荐算法中。优点:推荐准确性够。缺点:只考虑时间元素,考虑因素较少。15. 排序学习的推荐算法15:通过采样对训练集数据整合大量特征并进行参数的自动化调整,构建复杂的用户兴趣偏好模型,进而更新项目排序列表,并最终向用户产生有效的推荐列表。优点:能更有效地反映用户的不同偏好以及提高推荐的准确性。16. 基于Logistic函数的社会化矩阵分解推荐算法16:从非线性和社会化两个方面对矩阵分解推荐算法进行了改进。优点:缓解数据稀疏性问题,提高推荐准确性。1黄震华. 云环境下top-n推荐算法J. 电子学报, 2015, 43(1):54-61.2马建威, 陈洪辉, STEPHAN Reiff-Marganiec. 基于混合推荐和隐马尔科夫模型的服务推荐方法J. 中南大学学报(自然科学版), 2016(1):82-90.3杨 娟,张鹏业,基于 Spark 的 UCSLIM 推荐算法研究及实现J,北京邮电大学学报,2016,39:37-41.4祝晓斌, 蔡强, 白璐,等. 一种基于标签和协同过滤的并行推荐算法J. 高技术通讯, 2015, 25(3):307-312.5何洁月, 马贝. 利用社交关系的实值条件受限玻尔兹曼机协同过滤推荐算法J. 计算机学报, 2016(1):183-195.6Panigrahi S, Lenka R K, Stitipragyan A. A Hybrid Distributed Collaborative Filtering Recommender Engine Using Apache Spark J. Procedia Computer Science, 2016, 83:1000-1006.7Zhang Y, Yi D, Wei B, et al. A GPU-accelerated non-negative sparse latent semantic analysis algorithm for social tagging dataJ. Information Sciences, 2014, 281:687-702.8Kim H, Lee T, Kim H J. A parallel tag affinity computation for social tagging systems using MapReduceJ. 2014, 1(3).9印鉴, 王智圣, 李琪,等. 基于大规模隐式反馈的个性化推荐J. 软件学报, 2014(9):1953-1966.10黄晓凤, 罗辛, 朱庆生. 一种基于规范矩阵因式分解协同过滤推荐模型的并行改进J. 电子与信息学报, 2013(6):1507-1511.11Vairavasundaram S, Varadharajan V, Vairavasundaram I, et al. Data miningbased tag recommendation system: an overviewJ. Wiley Interdisciplinary Reviews Data Mining & Knowledge Discovery, 2015, 5(3):87112.12Xu Y, Yin J. Collaborative recommendation with user generated contentJ. Engineering Applications of Artificial Intelligence, 2015, 45:281-294.13张万才,刘旭东,郭晓辉基于张量分解的动态Web服务推荐J北京航空航天大学学报,2016,42 ( 9 ) : 1892-190214孙光福, 吴乐, 刘淇,等
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025机务考试题目及答案
- 2025中航培训面试题及答案
- 2025模拟飞行理论试题及答案
- 2025至2030年中国全棉人字斜绒布市场分析及竞争策略研究报告
- 安全招聘考试试题及答案
- 高空作业维修施工合同(3篇)
- 高空水管施工合同范本(3篇)
- 爱心树心理测试题及答案
- 电动汽车充电桩建设与运维项目融资合同
- 知识产权质押担保贷款协议
- 大模型概念、技术与应用实践 课件 第6章 智能体
- 生物制药技术专业介绍
- 2024年辽宁轨道交通职业学院单招《英语》真题含完整答案详解【易错题】
- 2025年picc置管与维护临床护理实践指南
- 成功销售的八种武器-大客户销售策略
- 2025年浙江省中考科学试题卷(含答案解析)
- 石油化工设备维护检修规程 第十册 空分设备
- 银行慈善管理办法
- 1.2 观察植物 课件 教科版(2024)一年级科学上册
- 供排水泵站运行工公司招聘笔试题库及答案
- 电磁计量员岗位面试问题及答案
评论
0/150
提交评论