基于移动互联网的个性化新闻推荐系统研究与实现_第1页
基于移动互联网的个性化新闻推荐系统研究与实现_第2页
基于移动互联网的个性化新闻推荐系统研究与实现_第3页
基于移动互联网的个性化新闻推荐系统研究与实现_第4页
基于移动互联网的个性化新闻推荐系统研究与实现_第5页
已阅读5页,还剩67页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

基于移动互联网的个性化新闻推荐系统研究与实现 近年来,移动互联网在世界范围内取得了飞速的普及和发展,与此同时,大量的信息涌入移动互联网用户的视野中, 使人们逐渐走进了 “信息过载” 的时代。无论是信息的发布者还是信息的接收者都遇到了很大的挑战: 对于信息接收者而言,想要在众多的信息中筛选出自己真正感兴趣的部分是一件困难的事情;而对于信息发布者,想让自己生产的信息受到更多用户的关注,也是一件非常困难的事情。这就给计算机科学领域的关注者和从业者带来一个前所未有的机遇和挑战,也同时成为了互联网尤其是电子商务领域和社交领域的一个重点和热点问题。深入、准确地挖掘出用户的使用行为、特点,了解用户的兴趣,之后分析出用户的潜在需求,势必将会大大提升用户粘性和满意度。 个性化推荐指的是根据用户的兴趣特点和购买行为, 向用户推荐用户感兴趣的信息和商品, 帮助用户从浩瀚的信息海洋中找到自己感兴趣的部分, 实现了互联网中的信息从被动接收到主动推送的过程。 而协同过滤作为推荐系统中最为成功和研究最多的算法之一,其基本思想是根据用户兴趣的相似性来进行推荐,把与当前用户相似性最大的用户找出来并作为邻居用户, 然后将邻居用户兴趣进行计算和加权作为当前用户的兴趣并产生推荐。 本文从移动互联网中的新闻系统出发, 通过研究个性化推荐在新闻领域的应用来帮助用户改善移动终端阅览新闻的体验。根据传统的协同过滤推荐方法,本文提出了三种改进的推荐模型,分别是基于内容的推荐、基于用户属性和相似度的改进协同过滤推荐以及基于时间上下文12,13的改进协同过滤推荐模型。通过量化并计算新闻内容的关键词、 用户与用户之间的相关程度和分析不同时间上下文下用户的兴趣特点来进行新闻推荐。在三种推荐模型的基础上,本文实现了一个简单的基于移动互联网的个性化新闻推荐系统并通过测试, 推荐系统通过对三种推荐模型的实现,将用户信息和新闻信息进行了处理和过滤,在一定程度上帮助用户找到了适合自己的新闻信息。相对于传统的新闻类应用,本系统实现了把传统新闻中统一、无差异化的新闻变成个性化、差异化的新闻推送过程。 并介绍了个性化推荐问题的国内外应用现状,分析了移动互联网环境下新闻推荐问题的特点,在此基础上提出了基于移动互联网的个性化新闻推荐的系统,之后根据软件工程的思想,对系统进行了详细的需求分析、系统设计以及数据库设计及实现,最终完成了对整个系统的测试。之后通过对全文进行总结,提出了下一步的工作展望。 关键词: 信息过载,新闻推荐,推荐模型,协同过滤,时间上下文 he of on of a of of in so of of of As to to in is a in of As to to of is by of is a to of It a is in in of s s be to of of to is on s it in it to as a is of is to be to in it is to It as in of on in of to in on on of It it to to of on a is to in to of of of at of on it of of of an n 目 录 摘 要 . I . 1 章 绪论 . 1 题背景 . 1 题意义 . 2 用现状 . 3 发工具与环境 . 6 发工具 . 6 发环境 . 7 要研究内容与论文结构 . 7 要研究内容 . 7 文结构 . 8 第 2 章 相关理论和技术 . 9 性化推荐 . 9 性化推荐系统的原理 . 9 性化推荐系统的分类 . 10 同过滤推荐 . 11 于用户(协同过滤推荐 . 12 于产品(协同过滤 . 13 基于模型(协同过滤 . 13 文提出的改进协同过滤推荐模型 . 13 于用户属性信息和用户相似度的改进协同过滤推荐模型 . 14 于内容的推荐方法 . 17 于时间上下文的推荐模型 . 21 第 3 章 系统需求分析 . 23 写目的 . 23 统目标 . 23 能需求规定 . 24 间特性要求 . 24 度要求 . 25 行环境规定 . 25 第 4 章 系统设计 . 26 统结构 . 26 统模块设计 . 27 . 27 于内容移动个性化推荐模块 . 32 于时间上下文的推荐模块 . 38 要类结构设计 . 41 统界面设计 . 46 用户注册和登陆界面 . 46 统主页面 . 47 第 5 章 数据库设计 . 49 据库的设计 . 49 据库的连接 . 53 第 6 章 系统测试 . 56 第 7 章 全文总结 . 60 作总结 . 60 一步的工作展望 . 61 参考文献 . 62 作者简介及在学期间所取得的科研成果 . 64 致 谢 . 65 1 第 1 章 绪论 题背景 随着移动互联网通信技术的迅速发展, 安卓 等各种最新智能终端操作系统的出现,更好的终端体验方式向移动互联网方向发展,向移动用户提供个性化的新闻业务将会有巨大的市场。 2012 年 6 月底, 我国手机网民达到 机接入互联网的移动终端用户比例由去年底的 长到 将有希望迎来移动互联网的新时代。新闻、微博、电子商务形式多样的网络产品如雨后春笋接连不断的出现, 它们在推进社会主义精神文明建设方面发挥着越来越重要的作用。物联网、云计算、移动智能终端等新兴产业的持续发展,为移动互联网等相关产业带来更多更新的增长点。从目前 的第三代数字移动通信( 3G)系统向第四代移动通信( 4G)系统发展是当前发展的必然趋势。移动终端用户对移动业务等的需求越来越强烈,人们可以使用数字功能更强大更智能的平板电脑、智能手机终端和便携笔记本电脑等来从事大量的数据处理和新闻阅读等业务,从而真正满足广大用户在移动方面的各种需求。 4G 时代的移动互联网11业务将向用户提供个性化、内容关联和交互作业的终端应用,其业务范围将涵盖新闻、美食、旅游和电子商务等领域。 以上技术的迅速发展使得大量的各种如新闻等信息同时呈现在移动终端用户面前,而传统的在这方面用于寻找用户所需要的信息是通过搜索算法,它只能呈现给所有的用户一样的如时间等排序结果, 无法针对不同用户的兴趣爱好和在不同环境下提供相应的新闻信息来阅读。 信息的大爆炸使得像比如新闻信息的利用率反而降低,这种现象被称为信息过载。用户在面对超大量的新闻信息,则很难找到自己真正感兴趣的新闻内容, 而新闻提供商也很难把优质的新闻准确推送给感兴趣的用户。个性化新闻推荐系统被认为是解决这些问题的有效方法,它对用户的阅读的新闻历史行为进行数据挖掘,对用户兴趣7进行数据建模,并对用户未来可能的行为进行一个预测, 从而建立了用户和新闻内容直接的关系。 比如,访问 的用户通常会看到此类个性化推荐语, “如果您喜欢那款产品,您可能也会喜欢这款产品” , “购买此物品的顾客也 同时购买那款物品” ,不需 2 要猜测用户对什么样的新闻内容感兴趣,只需要通过个性化新闻推荐14系统,就可以透明地、智能地识别各个用户所喜欢的和所不喜欢的新闻信息,并使用这些信息为各个用户定制个性化新闻, 根据用户以往的历史经验来推荐一个新的选择是遍及许多领域的一项推荐任务。综上所述,一般个性化推荐被认为是当前解决这种信息过载问题最有效的工具之一。而随着推荐技术的不断的向前发展,推荐已经在电子商务 (例如 当网等 ) 和一些基于社会化的站点 (例如豆瓣等 ) 都取得了巨大的成功。这也进一步的 说明了,在面对超大量的数据信息面前,用户需要这种更加智能的、透明的,更加了解他们需求、口味和喜好的个性化信息发现机制。 题意义 自从进入新的世纪以来, 信息技术尤其是互联网技术在全世界范围内飞速发展着,以计算机和软件技术为主的互联网领域不断增加着新鲜的思想和血液,不断地引进着很多其他领域的知识和技术,例如神经网络、图形学、情感计算等。 推荐系统作为一个大的研究领域, 在传统的互联网领域已经得到了广泛的使用和推广。目前,国内关于个性化推荐服务主要应用于电子商务、在线视频等领域。如淘宝网、凡客诚品、当当网、京东商城等各大电子商务网站主要运用推荐技术为用户提供需要的商品或服务 推荐;另外,优酷土豆、 56 网等视频领域的网站也应用了推荐技术,将个性化的服务推送给用户。然而,在新闻领域,大部分门户网站和新闻网站遵循的是统一内容、根据题材和类别对新闻进行分类,之后通过新闻的发布时间来进行更新,将旧的新闻换成最新的新闻,这种方式固然节约了开发成本和维护成本,但是对于每一个个性化的用户来说,由于用户需要在大量的新闻信息中进行手动筛选,无疑降低了用户的产品体验,增加了用户的体验“负担” 。 近几年, 互联网从传统的互联网发展到移动通信领域, 移动互联网因其轻便、快捷、实时等特点,很快得到了巨大发展,现在已经成为人们生活不可或缺的一部分,越来越多的用户开始倾向于通过移动网络获取知识和信息。 由于国内新闻领域应用了推荐技术的网站很少, 在移动互联网领域更是少之又少,因此为了能改善移动用户浏览新闻的体验,本文研究了推荐技术在移动互 3 联网新闻服务中的应用,通过挖掘用户的属性相似度信息、用户阅读内容的相似度信息、用户的使用习惯等信息来计算出用户的偏好、用户之间的关系度等,进而得到推荐模型,产生基于用户兴趣和相似度的新闻推荐结果。因此,本文研究的基于移动互联网的个性化新闻推荐系统有很大的研究价值和意义, 可以应用在现存的移动互联网新闻类 网站中,可以帮助其改善用户体验,提高用户粘性,同时帮助移动互联网用户在浩瀚的知识海洋中,找到自己更感兴趣、更适合自己的新闻推送。 用现状 国内外许多公司, 研究机构等都曾经对个性化新闻推荐系统有过比较深入的研究,但很多都只停留在理论层面,投入运营的实际产品并不多见,所以基于移动互联网的个性化新闻推荐系统将会有着很高的应用价值。 下面先简要介绍分析几个有代表性的推荐系统的应用如下。 马逊5)是全球最大的电子商务公司之一,作为推荐系统的开山鼻祖之一,它已经将个性化推荐的思想运用在它的系统各个角落。卓越亚马逊推荐的核心是通过数据挖掘来猜测用户的消费购物的偏好, 并与其他用户进行多角度多方位的对比,从而预测用户可能感兴趣的物品。卓越亚马逊根据已记录的所有用户在站点上的各种历史行为, 及不同物品数据的所表现的特点对它们进行处理,并分成不同的类别为用户进行推荐。通常是根据用户近期的历史购买纪录或者查看过的商品记录,并结合目前一些流行的商品给出一个折中的推荐。卓越亚马逊拥有着巨大的用户历史数据优势,在社会化方面的推荐,卓越亚马逊会给您百分比的数据依据,让购买用户更加相信。例如:查看购买此手机的用户 75%也查看或购买了另一款手机;基于商品本身的推荐,卓越亚马逊也会列出对应的推荐理由,例如:因为您的购物车中有或浏览过某手机或者购买过某手机,因此给您推荐类似的某手机。如下图 示了用户在卓越亚马逊上用到的推荐。 4 图 卓越亚马逊主页的推荐方法 豆瓣6是目前国内做的比较好的社交网站之一 ,它有图书,电影,音乐等功能,当然它里面的推荐功能是必不可少的。下面我们介绍下豆瓣是如何进行推荐的, 当您在豆瓣的电影模块将一些您已经看过的或是感兴趣的电影加入到您看过和想看的列表里,并为它们一个相应的等级评分,这时豆瓣的推荐系统已经得到关于您的一些初始偏好兴趣信息,那么它将给你展示如下图 的电影推荐。为了让用户清楚这些推荐结果是怎样得出来的, 豆瓣还给出了其原理的一个简要的介绍说明:您的个性化推荐结果是根据你的收藏和评分自动分析出来的,每个人的推荐列表是不相同的。你收藏的电影和评价评分项目越多,给你的推荐结果则会越丰富和准确,每天推荐结果可能都会有一些变化。随着时间的增加和你的初始偏好数据越来越多,给你推荐的结果也会越来越准确。这样良性循环下去,使用豆瓣用户越来越多,用户的反馈越来越多,那么推荐的效果就会越来越准确。相对于亚马逊的用户行为模型,豆瓣电影模型更加简单易懂,仅只需要通过两种选择: “看过 ”和 “想看 ”,这也让他们的推荐方法更专注于用户的兴趣品味,毕竟购物和看电影的区别还是有着很大的不同。 5 图 豆瓣的电影推荐机制 百度新闻搜索1,3是由百度公司于 2003 年 7 月推出,百度新闻现在每天更新发布的新闻就有 200000230000 条,不管是任何关键字相关的信息新闻都在每天第一时间发布出来,可见其新闻数量巨大,更新频率之快。它的优点之一是可以通过主页个性化定制新闻,根据地区、关键字在新闻标题或者正文中、限定新闻媒体、按焦点排序等方式进行搜索。缺点是不可以根据用户访问新闻的历史,也不能根据用户在不同时间段的兴趣的变化,自动的推送用户可能喜欢的新闻。如下图 示。 图 百度个性化设置新闻 6 闻搜索4跟百度新闻搜索有些类似,也允许用户个性化设置,和百度新闻的区别是可以根据国际,国内,财经,娱乐,科技等类别,及极少显示,偶尔显示,有时显示,经常显示,一律显示这几个频率来手动调档订制显示的新闻结果。缺点也和百度新闻类似,只能靠用户手动调整类型来显示新闻结果,不能自动的进行推荐。如下图 示。 图 谷歌个性化设置新闻 发工具与环境 发工具 本系统开发语言主要使用 言,及 发框架等技术,各种工具技术详细介绍如下。 ( 1)开发框架: 618一个开源软件,使用 目的是可以通过配置文件隔离模型 和视图,以一个 概念对用户请求做封装,使代码清晰易读。 另一个开源的框架,负责使用数据库连接等功能, 发人员 将其对象数据保存到数据库,将方便地使用面向对象编程来使用数据库。 是指一种创建交互式网页应用的网页开发技术,是一种用于创建更好 更快以及交互性更强的 用程序的技术。 ( 2)开发工具: 够进行数据库和 发等,是一个优秀的集成开发环境,使用它可以大大提高工作效率。它有一个功能丰富的 成开发环境,包 7 括一个完整的编码、调试、测试和发布功能,支持 。 ( 3)服务器端: 3 可以做为独立的 务器来运行, 应用( 务器,它只是一个 器,是 扩展。 (4)数据库软件: 据库有着体积小,速度快,低成本等优点,它是一个小型关系型数据库管理系统,一般中小型网站的开发都选择 为网站数据库。 (5) 本: 开发环境 本系统是在 7 操作系统下,电脑硬件配置为 存 220G 下运行的。 要研究内容与论文结构 要研究内容 本文主要研究了推荐系统在新闻推荐 领域的应用,根据移动互联网的特点,设计和实现了一个基于移动互联网的个性化新闻推荐系统。主要研究内容包括: (1) 通过查阅资料和借助互联网工具,了解了推荐系统目前在个性化新闻推 荐领域的背景和应用,明确了本文的选题意义。 (2) 通过分析和总结大量的关于个性化推荐技术的研究文献和资料,提出了 三种新的依据移动互联网新闻推荐系统特点的推荐模型并得以实现。 (3) 对每一个推荐系统模型都给出了模型中属性和相似度的计算方法,为实 现最终推荐提供了理论依据。 (4) 设计了个性化新闻推荐系统的数据库,从数据库管理和设计角度,提升 了自身分析问题和解决问题的能力。 (5) 熟悉 发框架、 架、 发技术, 深入理解了 层开发结构,从开发的角度进行了学习和实践。 8 文结构 本文共分为七个章节,具体内容安排如下: 第一章绪论,从总体上介绍本课题的研究背景、意义及应用现状等。 第二章介绍系统应用到的相关理论和 技术,包括移动互联网、个性化推荐、协同过滤等。同时,通过分析现有协同过滤存在的缺陷,提出了三种改进的协同过滤推荐方法。 第三章系统需求分析,说明系统需要实现的目标与功能,并规定系统的性能和运行环境。 第四章系统设计,包括总体结构、模块设计、 主要类设计和系统界面设计。 第五章是数据库设计。 第六章是系统测试。 第七章总结,对本文工作进行全面总结,展望下一步的工作,同时指出存在的不足和改进方向。 9 第 2 章 相关理论和技术 性化推荐 前面介绍了个性化推荐15,21,22系统的背景及应用等,本小节首先介绍一下个性化推荐系统原理图,如下图 示。 性化推荐系统的原理 图 个性化推荐系统工作原理图 如上图 示。在正常情况下来看,推荐系统数据来源包括以下一些内容:用户的偏好信息,根据文章内容本身,其中可能包括用户查看项目的购买记录和停留在页面的时间;要推荐的物品内容信息,如关键字,产品描述信息;用户的基本信息,如性别,学历,所在地,年龄等。我们在这里将个性化推荐系统封装成一个函数模块,它接收的输入是推荐的数据源,处理方法是对用户透明的推荐方法,输出将物品推荐给用户。 可将推荐数据来源进行分类如下:第一种,隐式的用户反馈信息方法,用户产生的数据,在页面上的行为如停留时间滚动点击鼠标次数等,例如,用户阅读 10 多篇文章,推荐系统将推荐用户相似的文章,隐式反馈方法的优点是通过数据的分析和处理,可以反映用户的喜好。如果当来源数据不精确,并且分析处理有很大的干扰时,需要将来源数据进行去噪处理后再进行推荐。只要选择了正确的用户行为和数据源,这种方法也可以得到比较好的推荐效果;第二种,显式的用户反馈信息方法,如用户在项目上的评分或评论等。显式反馈更真实更准确的反映用户的偏好,但需要用户额外的评分和评价等其他行为,根据用户的评分等计算用户对物品的偏好,直接将感兴趣的物品推荐给用户。 使用如上图的一部分数据源,以一定的规则对这些数据进行分析处理后,然后经计算可预测用户可能感兴趣其他物品 ,这就是个性化推荐系统的推荐机制。经实践,用户使用含有个性化推荐功能网站,可以得到用户感兴趣的物品。 性化推荐系统的分类 个性化810推荐系统的分类方法有很多种,通 过从不同方面来对其进行如下分类: 个性化推荐系统的数据来源 大多数的推荐系统的工作原理是这样运作的, 它是对物品的本身信息或者利用用户之间相似性来进行计算,最后来根据相似性等结果等来进行推荐。出个性化的推荐系统的示意图,说明根据数据源得到的数据间的相关性,因此可分为以下三种推荐方法: 基于内容的推荐方法是根据被推荐物品或文章的内容,挖掘出文章或内容之间的相似性;基于人口统计学的推荐方法是根据用户基本信息之间的相关程度如同性别、学历、年龄等的用户则推荐同样的物品;协同过滤推荐方法是根据用户资料和用户对物品的偏好值, 然后来计算用户之间的相似性,最后根据用户对物品偏好来预测推荐。 个性化推荐系统的推荐模型建立方式 根据推荐系统模型的建立方式可以分为以下三种推荐方法:基于项目本身和用户推荐的方法,基于关联规则的推荐方法和基于模型的推荐方法。 面对大量数据,利用复杂的推荐方法计算量是非常大的,所以推荐方法不仅要求准确,而且要运行效率高。在现有的推荐功能网站中,很少有只使用一种推荐方法的情况。因此使用推荐系统时,为了达到最好的推荐效果,最好根据不同的情况使用多种推荐方法来进行推荐,如亚马逊的推荐功能,它会根据用户自己 11 的历史记录及已购买商品来进行推荐,还有根据用户浏览的情况来进行推荐等。总的来说,为了得到一个更好的用户体验效果,最好使用多种推荐方法,从而全方位推荐并且找到自己感兴趣的东西。 同过滤推荐 协同过滤的概念起源于 1992 年,是 施乐帕克研究中心 ( 一篇论文中第一次提出来的。这篇论文是最早应用协同过滤思想的设计,主要是解决研究中心的信息过载的问题。施乐帕克研究中心试图开发一个实验性质的邮件系统来帮助员工解决每天收到大量的电子邮件却无从筛选和具体分类的这个问题。 系统运作机制大致如下: 首先,施乐帕克研究中心的每个员工可以自己决定感兴趣的邮件类型,然后员工可以向系统发布资讯的需求,这时候会得到非常多的反馈信息,之后员工可以从这些文件中选出几项自己认为最重要、最感兴趣的信息,邮件系统就会记录下用户这些感兴趣的信息偏好,在以后会优先将符合偏好的邮件送到用户的信箱。以上的系统就是协同过滤最早的应用了。 协同过滤下一步大的发展是 是协同过滤推荐算法发展的一个里程碑。作为一个新闻筛选的协同过滤推荐系统, 的用户需要对看过的新闻进行评分,系统会根据用户的历史评分,从大量的新闻信息中筛选出用户感兴趣的内容进行推荐。该系统简单来说分为服务器端与客户端两部分,服务器端实现了协同过滤算法,对新闻进行过滤排序,最后推送到客户端,客户端则是一个新闻阅读器,用来接收推荐结果。在 后还有性质相近的 音推荐系统、 话推荐系统、 乐推荐系统和 影推荐系统。 随着电子商务的出现,越来越多的用户通过计算机或手机购买产品,这样既为用户节省了时间,又可以使用户在任何时间任何地点进行产品的选购。协同过滤推荐算法已经在电子商务领域 广泛地应用,如亚马逊网络书店( ,顾客选择了一本感兴趣的书籍以后, 根据选择该书籍的其他用户的书单进行推荐,顾客 马上会在网页底下看到一行“ 该推荐基于这样一个假设:“如果不同的读 12 者对同一本书感兴趣,那么他们的兴 趣接近”。协同过滤算法在 头也有大范围的应用,它的广告推 荐系统就是根据周围好友感兴趣的广告信息对用户其他好友进行推荐,方便了使用者。 目前国内的推荐系统的应用有淘宝网、豆瓣网、当当网、京东商城、凡客诚品等,但是采用协同过滤算法作为推荐技术的还不多,主要是由于协同过滤本身存在的稀疏性、可扩展性、冷启动19等问题限制了协同过滤算法的实际应用,因此国内大部分对协同过滤的研究停留在了理论层面上。 综上所述,协同过滤推荐就是找到有相似兴趣的用户,发现他们各自没有涉足的产品进行推荐。它主要有三种基本推荐类型,分别是: 于用户(协同过滤推荐 基于用户( 协同过滤方法是根据用户兴趣相似度找到和他兴趣相似度最大的其他用户作为邻居,再根据邻居用户对目标用户进行推荐,步骤如下: 集用户的信息包括对网站上用户的行为进行观察和搜集,比如搜集用户对电影的评分,或者用户下载商品的次数、浏览商品次数、页面停留时间等,都可以作为信息进行搜集。我们用来做研究的主要是用户评分。 居用户计算是根据用户之间的相似度,计算出和用户相似度最大的用户作为邻居用户。比如用户 A 和用户 B 是邻居用户,那么可以将用户 B 的产品列表 I 中 A 没有过行为的产品推荐给 A。 了邻居用户之后,就可以对用户进行推荐。现在对于推荐系统的研究通常有两种方法,一种是 荐。找出邻居用户后,在邻居用户中找出目标用户没有过行为的产品,作为推荐列表推荐给用户;另外一种评分预测多用于论文研究中,将原始的用户对产品的行为分为训练集和测试集,用训练集计算用户相似度,用测试集来验证结果的准确性。 13 于产品(协同过滤 对于刚才介绍的基于用户的协同过滤方法,在用户数量比较多的情况下,由于需要计算用户两两之间的相似度,需要进行大量的计算。于是,有学者提出了另外一种协同过滤方法,基于项目的协同过滤,它的基本思想是用户对产品的偏好值与他们对其他产品的偏好有关系,具体计算步骤如下: 基于用户的协同过滤类似。 基于用户的协同过滤类似,需要计算待预测的产品和已评价产品的相似度。然后找到和待预测的产品相似度最大的作为邻居,产生预测。不过要注意对于产品相似度计算,要找到同时对两个产品打过分的组合,这样才能计算相似度。 于产品的协同过滤推荐,虽然推荐精度比较差,但是它不需要用户的具体资料,不需要计算用户之间的相似度,只需要产品之间的信息就可以进行推荐,对于粗粒度的推荐系统完全可以胜任。并且这种方式可以进行离线计算,省去了大量在线计算耗费的时间,可以提升推荐速度,节约了时间成本。 于模型(协同过滤 基于用户的协同过滤和基于产品的协同过滤统称为以记忆为基础的协同过滤技术,资料稀疏是他们共同的缺点,难以在大量资料的情况下生成即时结果。后来发展出基于模型的协同过滤技术。通过使用之前的资料得到数据模型,再用模型进行预测,就称为基于模型的协同过滤,同时,会因为算法的不同产生不同的推荐模型,这里不做赘述。 文提出的改进协同过滤推荐模型 本文在传统推荐算法的基础上,提出了三种改进的协同过滤推荐模型, 三种推荐模型分别从用户属性信息、 新闻关键词信息和时间上下文信息三个不同的侧 14 面来进行推荐行为,与传统方法相比,既提高了推荐内容的丰富性,又在一定程度上提升了推荐准确度,以下将在下面的章节中分成了三个子模块进行介绍。下面先从理论上介绍一下三种推荐模型。 于用户属性信息和 用户相似度的改进协同过滤推荐模型 荐系统需要根据用户的历史行为记录和兴趣爱好预测用户未来的行为和兴趣,因此大量的用户行为数据对推荐系统来说,是它重要的组成部分和先决条件。当然,对于很多像百度、豆瓣这样的网站来说,这或许不是个问题,这是因为它们目前已经积累了大量用户

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论