




已阅读5页,还剩19页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
电子商务推荐系统毕业论文目录摘要1Abstract2第一章 绪论41.1 电子商务推荐系统背景41.2 电子商务推荐系统研究意义51.3 电子商务推荐系统现状5第二章 电子商务推荐系统基础理论52.1 电子商务推荐系统52.2 电子商务推荐系统的输入和输出62.2.1 电子商务推荐系统的输入72.2.2 电子商务推荐系统的输出82.3电子商务推荐系统分类9第三章 电子商务推荐算法113.1 电子商务推荐系统算法概述113.2 协同过滤推荐算法123.2.1 User-based协同过滤推荐算法 数据表示 最近邻查询 推荐产生15第4章 推荐系统应用于电影推荐164.1原始数据的输入164.2.1 Matlab数据处理程序164.2.2 Matlab数据处理结果164.3 算出目标用户的最近邻居用户174.3.1 运用matlab求相似性值程序174.3.2 Matlab算相似性运行结果184.4 推荐系统最终推荐结果184.4.1 运用matlab推荐程序194.4.2 运用Matlab推荐结果20第5章 结论与展望21参考文献23附录2424 第一章 绪论1.1 电子商务推荐系统背景 如今,电子商务系统空前的巨大,虽然给用户提供了很大的选择空间,但是,随着电子商务系统不断增大,也变得相当的复杂。其一,用户在海量的电子商务系统数据中想找到自己想要的商品具有相当的难度以及耗费大量的时间;其二,商家与消费者也很难建立一种互动联系。随着电子商务迅速的发展运用,对电子商务研究越来越深入,人工智能、Web技术与商业模型的集成研究逐步得到了重视。其中在B2C方面,推荐系统也就形成了研究重点。在海量的商品信息中,推荐系统模拟商店销售人员向用户提供商品推荐,帮助用户找到偏好的相关产品,提高了用户购买效率,也就使得用户对推荐系统形成依赖习惯,使得电子商务网络销售变得快捷方便;商家也可以通过推荐系统有效的与用户进行互动联系。首先,推荐系统可以在电子商务系统中推荐用户感兴趣的产品,其次,推荐系统也可以在大量的电子商务系统数据中不断地发挥其作用以及优化1。其原因如下:(1)海量数据:电子商务系统中数据巨大,如用户注册数据、用户交易数据、用户评分数据、用户购物信息、用户浏览数据等,大量的数据以便于推荐系统的开发。(2)网络信息数据的收集:电子商务系统中的不同数据收集方式是用户操作不断累积,避免了单一人工操作造成的误差,收集的数据质量大幅提高。(3)评价推荐系统优劣:运用电子商务推荐系统,看它是否达到所推荐商品的访问量以及销售量增量的预期效果。推荐系统发展的潜力巨大,前景光明。推荐系统不仅有助于用户高效选择商品,而且也有助于商户与客户之间的联系,反过来说,进一步促进了电子商务推荐系统的发展。由此,推荐系统在电子商务中运用越发广泛,例如亚马逊、淘宝、天猫等都在运用推荐系统,并且已经运用的相当成熟。并且推荐系统支持着各类互联网网站。在互联网时代,网络竞争非常激烈,推荐系统能为电子商务保留用户以及提高用户忠实度,从而增加了电子商务系统的销售量。好的推荐系统会给社会带来巨大的经济效益。不管是在理论上还是在实践上,电子商务推荐系统都在不断地发展壮大。由于电子商务的发展,其系统数据不断增加,推荐系统运用效率同时在降低,这也就是推荐系统要不断的优化升级的原因。电子商务推荐系统需要优化升级,本文将对电子商务推荐系统中关键技术进行探索和研究,以至于推动电子商务推荐系统的发展。1.2 电子商务推荐系统研究意义推荐系统的最为关键是推荐计算,一个好的推荐计算能够很好地向用户推荐所需的商品,从而增强了用户的精神体验。本文主要研究协同过滤推荐算法,希望能够进行有益的改进,推动电子商务推荐系统的进一步发展。1.3 电子商务推荐系统现状随着互联网的普及和电子商务的发展,推荐系统逐渐成为电子商务IT技术的一个重要研究内容,得到了越来越多研究者的关注。美国计算机学会ACM从1999年开始每年召开一次电子商务的研讨会,其中关于电子商务推荐系统的研究文章占据了很大比重。从1999年开始此协会的数据挖掘特别兴趣组SIGKDD小组设立WEBKDD讨论组,主题集中在电子商务中的WEB挖掘技术和推荐系统技术,而ACM下面的信息检索特别兴趣组SIGIR在召开的第24届研究和发展会议上,开始专门把推荐系统作为一个讨论主题。第7届国际人工智能联合会议IJCAI01则把E-Business & the Intelligent Web作为一个独立的研讨小组。99年召开的人机界面会议CHI99专门设立推荐系统特别兴趣组。同时,第十五届人工智能会议AAAI-98、第一届知识管理应用会议PAKM、96年协同工作会议CSCW96等也纷纷开始将电子商务推荐系统作为研究主题。2经过多年的努力,国内外在电子商务推荐技术和系统的研究方面已取得较多的理论和应用成果。第二章 电子商务推荐系统基础理论2.1 电子商务推荐系统电子商务系统通过互联网建立虚拟的网上商店,但这些虚拟的网上商店并没有配备相应的销售人员来引导用户购物。随着电子商务系统规模的不断扩大,商品越来越多,这一方面让用户有了更大的选择空间,另一方面也增加了用户购买所需商品的难度,用户在找到自己需要的商品之前,必须浏览大量的无关信息为了解决上述信息过载问题,有效的知道用户在电子商务系统中方便的购物,人们提出了推荐系统技术。3电子商务推荐系统直接与用户交互,模拟商店销售人员向用户提供商品推荐,帮助用户找到所需商品,从而顺利完成购买过程。电子商务推荐系统产生的推荐可以基于电子商务系统的销售排行,可以基于用户以前的购买行为,也可以基于用户表现出来的兴趣爱好等。电子商务不仅为用户提供了便利的交易方式和广泛的选择,同时也为商家提供了更加深入了解用户需求和购物行为特征的可能性。推荐系统作为电子商务中的重要应用技术之一,为电子商务系统实现“一对一营销”提供了可能。电子商务推荐系统正式的定义是1997年Resnick和Varian给出的,“电子商务个性化推荐系统是利用电子商务网站向用户提供产品信息和相关建议,帮助用户决定购买什么产品,通过模拟销售人员帮助用户完成购物过程的系统4”,同时还指出其作用主要表现在三个方面:将电子商务网站的浏览者转变为购买者;提高电子商网站的交叉销售能力;提高客户对电子商务网站的忠诚度。目前,推荐系统已广泛运用到各行业中,推荐对象包括书籍、音像、网页、文章和新闻等。研究表明,电子商务的销售行业使用个性化推荐系统后,销售额能提高2%8%,尤其在书籍电影、CD音像、日用百货等产品相对较为低廉且商品种类繁多、用户使用个性化推荐系统程度高的行业,推荐系统能大大提高企业的销售额。2.2 电子商务推荐系统的输入和输出从总体的层次结构看,整个电子商务推荐系统的组成主要可以分为三个模块:输入功能模块、推荐方法模块、输出功能模块,如图,其中推荐方法模块是个性化推荐技术的集中体现,决定着推荐系统的性能优劣,本文将于第三章详细论述。2.2.1 电子商务推荐系统的输入不同类型的电子商务推荐系统,其输入信息也不相同。不同电子商务推荐系统根据不同的输入信息产生不同类型的推荐。电子商务推荐系统的输入可以是用户当前的行为,也可以是用户访问过程中的历史行为。在大型的电子商务系统中,为了产生高质量的推荐,推荐系统可能需要多种类型的输入信息。电子商务推荐系统的输入包括多种形式,主要包括:(1) 隐式浏览输入:将用户访问电子商务Web站点的浏览行为作为推荐系统的输入,用户的浏览行为与访问一般的Web站点没有区别。并不知道电子商务推荐系统的存在。用户当前正在浏览的商品、用户购物篮中选择的商品、用户的浏览路径等都可以作为作为隐式浏览输入信息。例如:亚马逊可以根据用户当前浏览的图书项向用户推荐相关内容的书籍。(2) 显式浏览输入:也是将用户的浏览行为作为电子商务推荐系统的输入,但与隐式浏览输入不同,用户的显式浏览输入是有目的的向电子商务推荐系统提供自己的兴趣爱好。例如,电子商务系统提供一系列热门商品供用户选择,用户只选择浏览自己感兴趣的商品列表,电子商务根据用户的浏览行为向用户提供个性化的推荐服务。例如Movie Finder的Top10给用户提供了一个超链接列表,它包含了编辑推荐的10种产品。(3) 关键字/商品属性输入:用户在搜索引擎中输入关键字作为推荐系统的输入,或者将用户当前正在浏览的商品类别作为推荐系统的输入。这种类型的输入不同于用户随意的浏览行为,用户输入的目的就是在电子商务系统中搜索自己需要的商品。(4) 用户评分输入:将用户对商品的数值评分数据作为推荐系统的输入。电子商务推荐系统列出一系列商品让用户评分,用户的评分可以是一个数值,数值大小表示用户对商品的喜好程度,也可以是一个布尔值,0代表不喜欢,l代表喜欢。用户提供的评分数据使得电子商务推荐系统可以为用户提供个性化的推荐服务。(5) 用户文本评价输入:用户对已经购买的商品或自己熟悉的商品以文本的形式进行个人评价,推荐系统本身并不能判断这些评价的好坏。其他用户浏览该商品时,可以看到用户对商品的文本评价信息。(6) 编辑推荐输入:将领域专家对特定商品的评价作为推荐系统的输入,领域专家对商品的性能特点进行全面详细的介绍,用户通过专家的专业介绍,可以对自己并不熟悉的商品加深认识,从而决定是否购买该商品。(7) 用户购买历史输入:推荐系统将用户的购买历史作为隐式评分数据。一旦用户购买了特定商品,则认为用户喜欢该商品。推荐系统根据用户的购买历史产生相应的推荐。但是用户购买了某件商品并不代表用户喜欢该商品,所以在精确的推荐系统中,用户可以对购买的商品进行重新评分,从而使推荐系统产生更精确的推荐。2.2.2 电子商务推荐系统的输出不同类型的电子商务推荐系统,其输出也各不相同。大型电子商务系统可以同时向用户产生多种不同形式的输出。电子商务推荐系统的输出形式主要包括:(1)相关商品输出:推荐系统根据用户表现出来的行为特征或电子商务系统的销售情况向用户产生商品推荐,这种方式是电子商务推荐系统中最为普遍的一种输出。相关商品输出可以基于简单的销售排行向用户推荐热门商品;也可以基于对用户的行为特征进行深入分析,发现用户的购买行为模式,从而产生个性化的推荐。(2)个体文本评价输出:电子商务推荐系统向目标用户提供其他用户对商品的文本评价信息个体文本评价一般是非个性化的,对每个项而言,所有用户得到的个体文本评价均相同。(3)个体评分输出:向目标用户提供其他用户对商品的数值评分信息。个体评分输出没有大量的文本描述信息,因此更加简洁明了。个体评分输出比较适合于个体数值评分数据比较少的场合。(4)平均数值评分输出:电子商务推荐系统向用户童工其他用户对商品数值评分信息的平均值。这种输出形式具有简洁明了的优点,用户可以立即获得对该商品的总体评价。(5)电子邮件输出:电子商务推荐系统通过电子邮件的形式向用户提供商品的最新信息。这种输出形式可以吸引用户再次访问电子商务系统,从而达到保留用户,防止用户流失的目的。(6)编辑输出推荐:向用户提供领域专家对商品的专业介绍,用户通过专家的专业介绍可以对自己并不熟悉的商品加深认识,了解商品的性能特点,从而决定是否购买该商品。2.3电子商务推荐系统分类从不同的角度出发,电子商务推荐系统可以有不同的分类,下面给出电子商务推荐系统的几种分类方式:(1)对于非注册用户采用协作过滤的方法。根据当前非注册用户的访问状态,把用户归类。在用户所属的类里,权值较高的物品(页面)代表是这一类用户普遍感兴趣的。在这一类用户中权值较高和已经购买该物品(浏览过的页面)的用户对它的平均评价值也高的物品(页面),就是系统推荐给用户的对象。(2)对于注册用户则根据用户的当前购买状态和购买历史向用户做推荐。站点上的物品存在一定的关联相似关系。根据这个关系,系统就可以对当前注册用户已经购买的物品来确定推荐。此外,如果某些物品购买时间距离当前购买时间久远,则基于这类物品推荐的可能性降低。(3)无论是注册用户还是非注册用户,系统根据他们请求的最新页面中所涉及到的物品和物品之间存在的关联相似关系,寻找可以推荐的物品。如果某个物品在当前用户请求的最新页面中的权值高,那么和这个物品有极高的相似关联关系的物品可以作为推荐的对象。根据用户获得推荐的自动化程度和持久性程度,可以将将电子商务推荐系统分为非个性化电子商务推荐系统,基于属性的电子商务推荐系统,商品相关性推荐系统和用户相关性推荐系统。(1)非个性化电子商务推荐系统,向当前用户提供的推荐结果可能基于其他用户对商品的平均评价,或者基于电子商务系统的销售排行,或者基于电子商务系统的编辑推荐。这种推荐技术独立于各个用户,每个用户得到的推荐都是相同的。非个性化电子商务推荐系统属于自动化方式推荐,产生的推荐基于用户的单个会话。典型例子包括亚马逊提供的Average Customer Rating推荐,eBay提供的Customer Comments推荐。5(2)基于属性的电子商务推荐系统,根据商品的属性特征向用户产生推荐列表,这种推荐系统类似于搜索引擎,用户需要手工输入所需商品的属性特征。基于属性的电子商务推荐系统需要用户显式输入商品的属性特征,因此属于手工方式推荐。产生的推荐可以基于用户的单个会话,也可以基于用户的多个会话。典型例子包括Amazon提供的Delivers推荐,Reel提供的Movie Map推荐。6(3)商品相关性推荐系统,根据商品之间的相关性向用户产生相应的推荐。商品相关性推荐系统可以是全自动化推荐系统,也可以是全手工方式推荐系统。这种推荐技术一般是基于用户的单个会话。典型例子如Amazon提供的Customers who bought this book also bought推荐,CDNOW提供的Album Advisor 推荐。(4)用户相关性推荐系统,又称为协同过滤推荐系统,这种推荐系统首先搜索当前用户的最近邻居,然后根据最近邻居的购买历史或评分信息向当前用户产生推荐。用户相关推荐一般不需要用户显式输入信息。产生的推荐一般是基于用户的多个会话。典型例子包括Amazon提供的Book Matcher推荐,Movie Find提供的Web Predict推荐。7 按照客户购买频度划分产品类型,可以把产品分为频繁购买的产品和非频繁购买的产品。(1)频繁购买的产品包括各种快速消费品,例如食品、日用品、化妆品等;其它可能频繁购买的产品,例如书籍、CD、DVD、服装等。对于这一类产品推荐系统通过分析客户的个人信息、浏览记录及其以前的网上购物记录推断他的个人参数。这类推荐系统的核心是学习客户个人参数和对客户兴趣变化的适应能力。在收集信息阶段,可以给出一个表单让用户明确地表示他的兴趣。这种方式是获得初次访问客户兴趣参数的最为有效的方法。针对这类产品,采用基于模块的方法构建推荐系统,每个模块自治地执行各自的任务,同时共同完成产品推荐。(2)非频繁购买的产品包括家用电器、耐用消费品、层次性消费品。这类产品客户不会像前一种产品一样经常购买。由于没有足够的关于客户过去购买的信息,推断客户以前的参数将会非常困难;另一方面,客户的每次购买通常无太大的关联,而且每次购买的要求都不尽相同,那么推断客户以前的参数也没有必要了。在这种情况下,客户常常没有特殊的领域知识来评价这类产品,专家的建议变得非常重要。推荐系统必须要具备特殊领域的知识和与客户即时交互的能力。这类推荐系统不是建立在客户过去的参数模型上,而是获得和分析客户当前的需求,然后在有关的产品中帮助他寻找最合适的一个。客户先简单确定他所需要的产品类型,形容出产品特征或要求的特殊功能;推荐系统比较数据库中的产品与客户要求的产品之间的相似处,选出一些与客户要求最为匹配的产品;然后客户对这些预推荐产品的某些特征进行修正,或者增加或减少某些特征的需要程度;推荐系统根据修改后的要求提供新的推荐产品。通过这种方式,客户可以在推荐系统的引导下逐渐找到最符合需要的产品。13利用这类推荐系统,客户可以更直接地接近他们感兴趣的信息,系统的引导也使得客户能顺利地在自己不太熟悉的领域内选择产品,或者使原本模糊的需求变得清晰。但是由于客户很可能对产品的了解程度不够,完全按照其需求得出的产品并不是最优的,这时候需要一些专家意见来修正或者认可基于客户目前需求的理想产品。第三章 电子商务推荐算法3.1 电子商务推荐系统算法概述为了产生精确而有效的推荐,保证推荐系统的实时性要求,研究者提出了各种不同的推荐算法,其中许多方法来自于数据挖掘领域的最新研究成果。电子商务推荐算法主要包括User-based协同过滤推荐、Item-based协同过滤推荐、Cluster-based协同过滤推荐、基于降维的协同过滤推荐、基于Bayesian网络技术的推荐、关联规则推荐等。基于数据挖掘技术的电子商务推荐算法通过数据挖掘技术对各种用户数据进行深入分析,得到每个用户的兴趣爱好特征和特定的购买行为模式。基于数据挖掘技术的电子商务推荐算法一般包括学习阶段和应用阶段,在学习阶段,数据挖掘系统对数据进行分析并建立相应的推荐模型,推荐模型用于解释用户的行为模式:在应用阶段,推荐算法根据建立的推荐模型和用户行为实时向用户提供推荐服务。某些电子商务推荐算法没有离线建立推荐模型的学习阶段,直接在在线阶段实时建立推荐模型产生推荐,如果同时访问电子商务系统的用户人数庞大,这种推荐系统的实时性难以保证。电子商务推荐算法可以分为基于内存的推荐算法和基于模型的推荐算法两类:(1)基于内存的推荐算法:推荐算法运行期间需要将整个用户数据库调入内存,因此可以利用最新的用户数据产生推荐。(2)基于模型的推荐算法:首先根据用户数据建立模型,推荐算法运行期间将建立的模型调入内存。基于模型的推荐算法可以通过各种机器学习算法建立模型,如Bayesian网络技术、聚类技术等。由上述定义可知,User-based协同过滤推荐算法、基于Horting图技术的协同过滤推荐算法和Item-based协同过滤推荐算法属于基于内存的推荐算法,而Cluster-based协同过滤推荐算法、基于降维的协同过滤推荐、基于Bayesian网络技术的推荐算法和关联规则推荐算法则属于基于模型的推荐算法。 在大型的电子商务系统中,用户数据库非常庞大,在整个用户数据库产生推荐非常耗时,从而使得整个电子商务推荐系统的实时性难以保证,这也是基于内存的推荐算法面临的主要挑战。在基于模型的推荐算法中,建立的模型相对于原始数据集而言小得多,因此能有效缓解推荐算法的实时性问题。模型相对于原始用户数据而言具有滞后效应,为了保证模型的有效性,必须周期性的对模型进行更新。本章余下部分将对关联规则推荐算法和协同过滤推荐算法两种推荐算法进行详细介绍。在关联规则推荐算法中,我们给出了关联规则的定义,介绍了各种关联规则挖掘算法以及关联规则推荐算法的具体步骤。在协同过滤推荐算法中,首先介绍了User-based协同过滤推荐算法和Item-based协同过滤推荐算法,然后基于这两种推荐技术存在的不足,介绍了Cluster-based协同过滤推荐算法和基于降维的协同过滤推荐算法。本章最后分析了电子商务推荐算法在大型电子商务系统中存在的主要挑战。153.2 协同过滤推荐算法本节重点介绍协同过滤的两个基本算法:基于用户的协同过滤、基于项目的协同过滤。在这两个算法中,前者是最早出现的协同过滤算法,也是至今为止使用最为广泛的协同过滤算法,它以用户项目评分矩阵中行为基础计算用户之间的相似性;后者则是以用户项目评分矩阵中的列为基础计算项目之间的相似性,已在A等众多电子商务网站得到广泛的应用。两个算法的共同点在于,它们都是基于用户项目评分矩阵来预测用户兴趣偏好并进行推荐服务。到目前为止,绝大多数改进的协同过滤算法都是在上述两个基本算法的基础上尤其是基于用户的协同过滤基础上给出的。因此,这两个基本算法是协同过滤研究的重点内容。3.2.1 User-based协同过滤推荐算法基于用户的协同过滤又称最近邻协同过滤,其基本思想是基于与目标用户具有相同(或相似)兴趣偏好的其他客户的观点向其提供商品推荐或评分预测。基于用户的协同过滤使用统计技术来寻找与目标用户有相同或相似兴趣偏好(例如对不同商品的评分相似或所购商品相似)的邻居用户,再根据邻居用户对商品项的评分来预测目标用户对其未评分项的评分值,进而选择预测及评分最高的前N项商品作为推荐集反馈给用户(即top-N推荐)。Sarwar等人将基于用户的协同过滤算法分为三个步骤:Step 1数据表示,即收集可以代表用户兴趣的信息;Step 2邻居用户形成,即最近邻搜索;Step 3推荐生成,即生成top-N推荐。下面将详细介绍以上三个步骤的实现。 数据表示在User-based协同过滤推荐中,必须根据不同用户对商品的评分信息产生推荐结果。用户评分数据可以用一个阶矩阵表示,行代表个用户,列代表个项,第行第列的元素代表用户对项的评分。用户评分数据矩阵如表。用户评分数据矩阵用户 项目1阿凡达2泰坦里克号3死神来了4这个杀手不太冷5海上钢琴师6终极斗 士7拳霸8非常人 贩9极品飞 车10激情与速度用户25514224342用户34325233254用户45522451235用户54454234432用户65532554224用户71442534223用户84554442345用户94544553425用户104531544324目标用户54342 用户对所有项目的评分值是15的范围之内,其中1表示用户对项目评分最低,5表示用户对项目评分最高,空表示用户对该项目还没有进行评分。 最近邻查询邻居用户形成,又称最近邻查询。最近邻查询时基于用户的协同过滤算法最关键的步骤。对于目标用户,算法需要搜寻的最近邻(nearest neighbor)集合,且与中用户之间的相似性由大到校排列。的取值范围为,越接近+1表示用户、之间相似性越高;越接近-1表示用户、具有相反的兴趣偏好;则表示用户、之间不具有相似性。例如在图4.2中,通过计算目标用户(图中心黑点)与其他用户之间的相似性,选择了以目标用户为中心的个最近用户作为其最近邻集合。 用户之间的相似度可采用目前常用的向量空间相似度计算和Pearson相关等方法加以计算。较之常用的用户之间相似性的度量方法主要有修正的余弦相似性(Adjusted Cosine): 在余弦相似性度量方法中没有考虑不同用户的评分尺度问题,修正的余弦相似性度量方法通过减去用户对项的平均评分改善上述缺陷,设用户和用户共同评分过的项集合用表示,和分别表示用户和用户评分过的项集合,则用户和用户之间的相似性为: 表示用户对项的评分,和分别表示用户和用户的平均评分。 推荐产生 通过上面提出的相似性度量方法得到目标用户的最近邻居,下一步需要产生相应的推荐。设用户的最近邻居结合用表示,则用户对项的预测评分可以通过用户对最近邻居集合中项的评分得到,计算方法如下: (4) 表示用户与用户之间的相似性,表示用户对项的评分。和分别表示用户与用户 对项的平均评分。 通过上述方法预测用户对所有未评分项的评分,然后选择预测评分最高的前若干项(top-N)作为推荐结果反馈给当前用户。 当使用交易数据作为算法输入时,User-based协同过滤推荐算法无法预测用户对商品的评分,则可以采用如下两种方式产生top-N推荐:最频项推荐:扫描当前用户每一个最近邻居的购买记录,对其购买的商品进行计数,选择出现频率最高且当前用户没有购买过的前N件商品作为推荐结果。第4章 推荐系统应用于电影推荐4.1原始数据的输入以下我们用matlab软件导入数据,matlab数据程序如下: %原始评分数据a0=5 4 3 4 2 0 0 0 0 0; %目标用户,其中0表示没有评分b0=5 5 3 1 4 4 5 2 3 5; 5 5 1 4 2 2 4 3 4 2; 4 3 2 5 2 3 3 2 5 4; 5 5 2 2 4 5 1 2 3 5; 4 4 5 4 2 3 4 4 3 2; 5 5 3 2 5 5 4 2 2 4; 1 4 4 2 5 3 4 2 2 3; 4 5 5 4 4 4 2 3 4 5; 4 5 4 4 5 5 3 4 2 5;4 5 3 1 5 4 4 3 2 4;4.2 数据的处理由于目标用户后几项没有评分,那就得先把目标用户评分数据与所有用户评分数据进行处理,以至于保留目标用户所评价的项目数据以及所有用户相应项目评价数据,以便进行目标用户与所有用户的相似性值,得出最近邻的用户,数据处理如下:4.2.1 Matlab数据处理程序%对原始数据进行处理u=find(a0=0); %找出a0中不为0元素位置a=a0(u); %把a0不为0元素赋值于ab=b0(:,u); %把b0中相应位子的列保存在b中4.2.2 Matlab数据处理结果其中,a表示目标用户对已评价的项目评分数据,b表示对应于a的评分数据。4.3 算出目标用户的最近邻居用户 通过上面处理后的数据,我们要对目标用户进行最近邻查询,找出与目标用户相似的用户,要达到这一步,目标用户要与所有用户进行一次相似性的分析,相似性值得大小决定用户与目标用户的距离程度。求相似值如下:4.3.1 运用matlab求相似性值程序%用修正的余弦相似性求得a对b的每行相似性值,找出与目标用户最近用户p,q=size(b); %求向量b的行数 %求目标用户对所有用户的相似性值for t=1:p ap=sum(a)/length(a); %求向量a的平均值 bp=sum(b(t,:)/length(b(t,:); %求向量b的平均值 fz=sum(a-ap).*(b(t,:)-bp); %相似性分子值 fm=sqrt(sum(a-ap).2).*sum(b(t,:)-bp).2); % 相似性分母值 sim=fz/fm; %相似性 s(t)=sim; %把向量a分别与吧的每行的相似性值保存到send n=find(s0) ; %s中大于0的位置nv=b(n,:) ; %把s中大于零的数赋值与v%相似值图形plot(1:10,s,-bo);title(相似值图形); xlabel(用户序号);4.3.2 Matlab算相似性运行结果以上结果是,目标用户与所有用户的相似性值,其中前5个是正值,表示目标用户与前五个用户具有正相似性,目标用户与第二个用户相似性值为0.8208,说明目标用户与第二个用户非常相似。其中后五个为负值,表示目标用户与后五个用户具有负相似性,目标用户与第六个用户相似性值为0,说明目标用户与第六个用户不相似。与第7个用户相似值为-0.8807,相似性最低。4.4 推荐系统最终推荐结果 通过以上得出的相似性值结果,我们可以判断前五个用户是目标用户的最近邻居,以下我们就用前五个用户来给目标用户进行推荐,运用User-based协同过滤推荐算法来对目标用户没有评论过得项目进行评分,从而进行推荐。4.4.1 运用matlab推荐程序%最近邻居,目标用户再只对满足条件的邻居做相似性,求得相似性值p1, q1=size(v); %求v的行数%求目标用户与最近邻居用户相似性值for k=1:p1 ap=sum(a)/length(a); %求向量a的平均值 vp1=sum(v(k,:)/length(v(k,:); %求向量b的平均值 fz1=sum(a-ap).*(v(k,:)-vp1); %相似性分子值 fm1=sqrt(sum(a-ap).2).*sum(v(k,:)-vp1).2); % 相似性分母值 sim1=fz1/fm1; %相似性 ss(k)=sim1; %把向量a分别与吧的每行的相似性值保存到ssend%对目标用户进行推荐,只推荐目标用户所没有评价的项目v0=b0(n,:); %所有所得出的最近邻居的评价数据保存到v0vh, vl=size(v0); %求出v0的行数与列数rp=sum(v0,2)/vl; %求出最近邻居的平均评价分数%求目标用户对各个项目预测评分for i=1:vl pf(i)=sum(ss.*(v0(:,i)-rp)/sum(abs(ss)+ap; %预测评分endm=find(a0=0); %找出目标用户未评价的项目位置disp(一、目标用户已经评价过的项目序号以及预测评分:);disp(u);ykpf=pf(u); %目标用户已经评过分数的项目的预测评分disp(ykpf);disp(二、目标用户没有评价过的项目序号以及预测评分:);disp(m);tjpf=pf(m); %目标用户还没有评分的项目预测评分disp(tjpf);%评分图plot(1:5,a,-bo,1:10,pf,-r*);title(预测评分);axis(0,10,0,5);ylabel(评分值);legend(真实评分,预测评分);4.4.2 运用Matlab推荐结果以上结果,是每一部电影都有一个用户的预测评分。前五部电影预测评分分别为: 4.7613 4.4719 2.6055 4.1104 2.6262 目标用户真实的评分分别为: 5 4 3 4 2我们可以清楚地看到,预测值与真实值相当的接近,所以的出此种方法推荐还是非常的可靠。后五部电影,目标用户还没有进行过评分,以上的预测评分可以得出给目标用户推荐项目的先后次序,分别为:项目9,项目7,项目10,项目6,项目8。总结:推荐系统给目标用户的推荐结果依次如下:极品飞车 拳霸 激情与速度 终极斗士 非常人贩第5章 结论与展望 针对电子商务推荐系统面临的主要挑战,本文对电子商务推荐系统中推荐算法设计以及推荐系统体系结构等关键技术进行了有益的探索和研究。论文首先系统综述了目前国内外在推荐系统领域的理论研究和发展现状,继而从电子商务推荐系统的基础理论和相关技术出发,对电子商务推荐系统的总体架构以及理论技术进行深刻分析。重点分析了电子商务推荐算法,通过对基于内容协同过滤推荐算法的介绍、步骤阐述。最后本文给出了评价推荐系统的重要因素平均绝对值误差MAE的理论介绍。 限于作者的水平和学识,从研究所涉及的范围和深度来说,本论文仍有一些局限之处,需要在未来研究中加以补充和改善。推荐系统是电子商务系统中最重要的技术之一,但随着电子商务系统规模越来越大,推荐系统也面临着一系列挑战,主要包括:推荐质量与实时性的矛盾、可扩展性问题、数据稀疏性问题等等。面对这些挑战,在推荐算法的具体设计和实现上,以协同过滤技术为主,在客服其缺陷(数据矩阵的稀疏性、可扩展性、最初评价问题等)的基础上,结合其他技术,改进推荐系统的推荐质量,这也成为今后开展的方向:(1)对现有推荐算法的进一步改进尽管协同过滤式目前在电子商务推荐系统中应用较为成功的个性化推荐技术,但随着站点结构、内容复杂度和用户数量、商品数量不断增加,对推荐算法的运算性能提出了更高更新的要求,要求提高推荐算法的速度和准确性,加强算法的推荐实时性,以使推荐系统能产生更精确、实时的推荐。(2)多种数据多种技术的集成传统的协同过滤推荐技术根据用户显示评分产生推荐结果,不仅用户使用不方便,而且不能有效地解决数据稀疏问题及最初评价问题等经典问题。随着www的发展,Web本身就是一种新数据源,在Web日志中积累了大连咁的游泳的信息,因此可以通过Web挖掘技术来获取用户的隐式评分,所以未来的电子商务推荐系统应该利用尽可能多的信息,收集多种类型的数据,有效集成多种推荐技术,提供多种推荐功能,从而提供更加有效地个性化服务。参考文献1青海. 电子商务推荐系统核心技术研究D. 北京工业大学,2009.2韩慧俊. 电子商务个性化推荐系统的研究D. 上海交通大学,2007.3邓爱林. 电子商务推荐系统关键技术研究D. 复旦大学,2003.4邓爱林,朱杨勇,评分预测的系统过滤推荐算法J. 软件学报,2003,5邓秀勤,姜莲花. 电子商务推荐系统研究J. 辽东学院学报,2005,6李聪. 电子商务推荐系统中协同过滤研究D. 合肥工业大学,2009.7杨芳. 电子商务系统协同过滤推荐算法研究D. 河北工业大学,2006.8周凤林. 电子商务下的柔性推荐系统D. 华中科技大学,2007.9李俭霞. 电子商务智能推荐技术及应用研究D. 重庆大学,2009.10张校慧. 基于Web日志与聚类分析的协同过滤算法D,河南大学,2008.11曾确令. 基于Web挖掘的消费者细分及推荐应用研究D,吉林大学,2009.12黄光球,魏芳. 基于贝叶斯动态预测模型推荐J. 微计算机信息,2007,13田伟,彭玉青. 电子商务应用的协同过滤J. 计算机工程与科学,2008,14肖敏. 基于领域本体的电子商务推荐技术研究D. 武汉理工大学,2009.15王集思. 基于协同过滤的电子商务推荐系统研究D. 哈尔滨大学,2009.16张富国. 基于信任的电子商务个性化推荐D. 江西财经大学,2009.17孙多. 基于聚类协同过滤推荐系统J. 安徽大学学报(自然科学版),2007,18李婷. 基于个性化电子商务推荐系统研究D. 哈尔
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年中国热处理材料项目创业计划书
- 2025年中国十二醇项目创业计划书
- 忻州市中医院神经介入技术考核
- 2025年金融数据加密机项目合作计划书
- 长治市人民医院物理治疗师执业资格认证
- 包头市人民医院呼吸科住院总医师岗位胜任力360度评估题库
- 牡丹江市人民医院营养食堂食品安全关键点控制试题
- 2025年学校学生放学后校内托管服务协议书
- 朔州市人民医院内镜中心信息系统操作准入考核试题
- 邯郸市中医院内镜中心安全管理制度消防用电考试题
- DB3301∕T 65.1-2024 反恐怖防范系统管理规范 第1部分:通则
- 天燃气工程管道施工组织设计及方案2
- 专业学位硕士研究生英语智慧树知到答案2024年黑龙江中医药大学
- 放射科影像合作协议书
- JTJ034-2000 公路路面基层施工技术规范
- SS4G型电力机车车体设备布置认知
- 幼儿园大班艺术课件:《国旗国旗红红的哩》
- 铸牢中华民族共同体意识论文(4篇)
- 3.4从分子内到分子间探究生命和生活的奥秘配合物与超分子大单元说课课件高二化学人教版选择性必修2
- 《审计实务》第5讲 函证程序(中)
- 西式面点师(技师 高级技师)课件 项目1、2 巧克力造型制作、糖艺制作
评论
0/150
提交评论