(计算机应用技术专业论文)基于用户个人特征的多内容项目协同过滤推荐.pdf_第1页
(计算机应用技术专业论文)基于用户个人特征的多内容项目协同过滤推荐.pdf_第2页
(计算机应用技术专业论文)基于用户个人特征的多内容项目协同过滤推荐.pdf_第3页
(计算机应用技术专业论文)基于用户个人特征的多内容项目协同过滤推荐.pdf_第4页
(计算机应用技术专业论文)基于用户个人特征的多内容项目协同过滤推荐.pdf_第5页
已阅读5页,还剩41页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

两南大学硕 一学位论文 摘耍 基于用户个人特征的多内容项目 协同过滤推荐 计算机应用技术专业硕士研究生彭玉 指导教师程小平教授 摘要 近年来,电子商务个性化推荐系统在网络上获得了普遍的成功,协同过滤是其中应用最 为广泛的个性化推荐技术。但是,网上有效信息的数量和商品的种类的急速增长对推荐系统 提出了严峻挑战,协同过滤推荐中存在的冷开始和稀疏性问题还有在基于项目的协同过滤推 荐中的项目多内容问题急待解决。 本文通过分析传统的基于项目协同过滤算法中存在的项目多内容问题,提出了一种基于 项目的协同过滤的改进算法,算法综合考虑了项目自身属性和用户评价的影响,在进行目标 项目最近邻查询时,首先基于项目特征属性矩阵计算项间相似性,找出邻居项目候选集,然 后基于用户一项评分矩阵计算目标项目与邻居项目候选集中项目的相似性,找出目标项目的 最近邻居项目集。 用户的个人特征在很大程度上决定着用户的消费习惯。所以针对用户评分数据的极端稀 疏性和新用户的推荐问题,本文提出了一种基于用户个人特征的最近邻协同过滤推荐算法, 通过描述用户个人特征的特征矩阵来计算用户问的相似性,初步预测用户对未评分项目的评 分,对用户一项评分矩阵进行调整,然后采用一种新颖的相似性度量方法计算用户的最近邻 居。 随后,分别设计了本文提出的两个改进算法的仿真实验,统计分析了实验结果,比较了 改进的推荐算法和传统的协同过滤推荐算法、基于内容的推荐算法,从而表明了改进的推荐 算法的准确性。最后,介绍了基于用户个人特征的推荐方法的电子商务个性化推荐系统在网 上音像制品销售行业的应用。 关键词:推荐系统;协同过滤;推荐算法;属性相似性;个人特征 而南j 、学硕i 。# 位论文a b s t r a c t a b s t r a c t r e c e n t l y , p e r s o n a l i z e dr e c o m m e n d e rs y s t e m s ,e s p e c i a l l yc o l l a b o r a t i v ef i l t e r i n gr e c o m m e n d e r s y s t e m s ,h a v ea c h i e v e dw i d e s p r e a ds u c c e s s e s o nt h ew e b t h et r e m e n d o a sg r o w t hi nt h ea m o u n to f a v a i l a b l ei n f o r m a t i o na n dt h ek i n d so f c o m m o d i t i e st ow e bs i t e sp o s e ss o n l ek e yc h a l l e n g e sf o r r e c o m m e n d e rs y s t e m s s ot h ep r o b l e m so f c o l d - s t a r ta n ds p a r s i t yi nc o l l a b o r a t i v ef i l t e r i n g r e c o m m e n d a t i o na n dm u l t i p l e - c o n t e n tp r o b l e mo f i t e m - b a s e dc o l l a b o r a t i v ef i l t e r i n ga l g o r i t h ma r ei n d i r en e e dt ob es o l v e d b ya n a l y z i n gm u l t i p l e - e o n t e n tp r o b l e mo fi t e m - b a s e dc o l l a b o r a t i v ef i l t e r i n ga l g o r i t h m , a n i m p r o v e di t e m - b a s e dc o l l a b o r a t i v ef i l t e r i n ga l g o r i t h mw a sp r o p o s e d t h i sn e wa l g o r i t h mt a k e s s y n t h e t i c a l l yi n t oa c c o u n tt h ei n f l u e n c eo fi t e ma t t r i b u t ea n du s e rr a t i n g i nt h en e a r e s tn e i g h b o r s q u e r y , f i r s t l yc o m p u t es i m i l a r i t yo fi t e mb yt h ec h a r a c t e r i s t i c so fa t t r i b u t e sm a t r i xo fi t e m st of i n d o u tn e i g h b o ri t e mc a n d i d a t es e t ,a n dt h e nc o m p u t et h es i m i l a r i t yb e t w e e nt h et a r g e ti t e ma n di t e mo f c a n d i d a t es e tb yu s e rr a t i n gm a t r i xt of i n do u tt h en e a r e s tn e i g h b o ri t e ms e t s ot h em u l t i p l e - c o n t e n t p r o b l e mo fi t e m - b a s e dc o l l a b o r a t i v ef i l t e r i n gr e s o l v e d e x p e r i m e n t a lr e s u l t si n d i c m e t h a tt h e a l g o r i t h mc a ns o l v em u l t i p l e - - c o n t e n tp r o b l e ma n dp r o v i d eb e t t e rr e c o m m e n d a t i o nr e s u l t se v e n t h o u g ht h eu s e rr a t i n g sa r cv e r ys p a r s e l y i n d i v i d u a lu s e rc h a r a c t e rd e t e r m i n e su s e r s c o n s u m ei nac e r t a i ne x t e n t t oa d d r e s st h ep r o b l e m o fe x t r e m es p a r s e n e s so fu s e rr a t i n gd a t aa n dn e w - 哪r e c o m m e n d a t i o n , an o v e lc o l l a b o r a t i v e f i l t e r i n ga l g o r i t h mb a s e do nu s e rc h a r a c t e ri sp r o p o s e d t h i sm e t h o dp r e d i c t si t e mr a t i n g st h a tu s e r s h a v en o tr a t e db yt h es i m i l a r i t yb a s e do nu s e rc h a r a c t e ra n da d j u s t st h eu s e rr a t i n gm a t r i x t h e nu s e s an e ws i m i l a r i t ym e a s u r et of m dt h et a r g e tu s e r s n e i g h b o r s t h e n ,e x p e r i m e n t sa r ed e s i g n e d t h er e s u l t so f t h ee x p e r i m e n ta r ca n a l y z e d t h ei m p r o v e d a l g o r i t h m , t h ec o l l a b o r a t i v ef i l t e r i n gr e c o m m e n d a t i o na l g o r i t h ma n dt h ec o n t e n t - b a s e d r e c o m m e n d a t i o na l g o r i t h ma r ec o m p a r e d ,s ot h a tt h ea c c u r a c yo f t h ei m p r o v e da l g o r i t h mi ss h o w e 正 f i n a l l y ,t h es t r u c t u r eo f t h ep e r s o n a l i z e dr e c o m m e n d e rs y s t e m sw i t ht h ec o l l a b o r a t i v ef i l t e r i n g a l g o r i t h mb a s e d u s e r c h a r a c t e rt h a ti sp r o p o s e di si l l u m i n a t e d a n dt h ea p p l i c a t i o no f t h e p e r s o n a l i z e dr e c o m m e n d e rs y s t e m sw i t ht h i sa l g o r i t h mi nt h ei n d u s t r yo f v i d e o ss a l eo nw e bi s i n t r o d u c e d k e y w o r d s :r e c o m m e n d a t i o ns y s t e m ;c o l l a b o r a t i v ef i l t e r i n g ;r e c o m m e n d a t i o n a l g o r i t h m ;a t t r i b u t es i m i l a r i t y ;u s e rc h a r a c t e r i i 独创性声明 学位论文题目: 基王用崖仝厶鉴挺塑垒囱窒亟旦迹回过遗撞蓥 本人提交的学位论文是在导师指导下进行的研究工作及取得的研究 成果。论文中引用他人已经发表或出版过的研究成果,文中已加了特别标 注。对本研究及学位论文撰写曾做出贡献的老师、朋友、同仁在文中作了 明确说明并表示衷心感谢。 学位论文作者:饬至 签字日期:加7 年j 月8 日 学位论文版权使用授权书 本学1 ) 奇:论文作者完伞了解西南大学有关保留、使用学位论文的规定, 有权保留并向国家有关部fj 或机构送交论文的复印件和磁盘,允许沦文被 查阅和借阅。本人授权两南大学研究生院( 筹) 可以将学位论文的全部或 部分内容编入有关数据库进行检索,口j 以采用影印、缩印或扫描等复制手 段保存、汇编学伉论文。 ( 保密的学位论文在解密后适用本授权书,本论文:口不保密,口保 密期限至年月止) 。 学位论文作者签名:勘五导师签名:锄7 签字日期:劢刁年j 饲8 日 签字日期:7 - 7 年歹月,p 日 学位论文作者毕业后去向:四川托普信息技术学院f 工作单位: 婴刖抵釜焦! 曼越苤堂睦 通讯地址:邮编 两南大学硕i 学位论史第一章绪论 第一章绪论 1 1 引言 i n t e m e t 的迅猛发展将人类带入了信息社会和网络经济时代,对个人生活和企业发展都产 生了深远的影响。一方面,i n t e r n e t 的发展正在极大的改变着我们每个人的生活,人们不出家 门就可随心所欲的得到自己想要的商品,网上购物的经历让我们感受到电子商务带来的惊喜; 另一方面,基于i n t e m e t 的虚拟企业不再需要像传统的物理环境下企业那样的实体投资,企业 与顾客、供麻商等建立起更直接的联系,电子商务模式为企业的发展提供了更多的机会。 据预计,到2 0 0 5 年电子商务活动的总价值将达到7 5 亿元。但事实上,电子商务的应用还 远没有被挖掘出来,这其中同然有硬件设施滞后、用户观念未改变等原因,而企业服务不到 位更是一个重要的原因。电子商务的发展模式对企业服务提出了许多新的要求,包括商品的 质量保证、送货及时、商品选购舒适、退货方便等。其中,最为突出的一个问题就是商品选 购的个性化推荐问题。 目前,几乎所有大型的电子商务系统,如a l l z o n 、c d n o w 、e b a y 、当当网上书店等,都 不同程度的使用了各种形式的推荐系统。电子商务推荐系统的作用主要表现在三个方面:1 ) 将 电子商务网站的浏览者转变为购买者。2 ) 提高电子商务网站的交叉销售能力( c r o s ss e l l i n g ) 3 ) 提高客户对电子商务网站的忠诚度。研究表明,电子商务的销售行业使用个性化推荐系统后, 销售额能提高2 8 ,尤其在书籍、电影、c d 音像、日用百货等产品相对较为低廉且商品种 类繁多、用户使用个性化推荐系统程度高的行业,推荐系统能大大提高企业的销售额。 协同过滤( c o l l a b o r a t i v ef i l t e r i n g ,cf ) 技术是应用最为广泛的个性化推荐技术,是推荐系统 的一个重要组成部分。协同过滤通过参考与活动用户具有相似兴趣和需求的其他用户的选择 来决定如何为该用户进行信息过滤。协同过滤技术是知识获取的一种方式之一,是从可利用 的知识源中抽取形式化知识的过程。用通俗的话来说,协同过滤就是“如果和我兴趣爱好相 同的人喜欢这样东西那我也会喜欢这样东西的”。 1 2 协同过滤推荐的国内外研究现状 协同过滤推荐( c o l l a b o r a t i v ef i l t e r i n gr e c o m m e n d a t i o n ) 是目前研究最多的个性化推荐技术, 著名的系统有g r o u pl e n s n e tp e r c e p t i o n s 1 ,r i n g o ,f i r e f l y 2 及t a p e s t r y 3 等。协同过滤的 最大优点是对推荐对象没有特殊要求,能处理非结构化的复杂对象如音乐、电影。 近年来陆续提出了许多协作过滤的实现算法。协同过滤推荐算法主要分为两类:一是基 于内存的协同过滤( m e m o r y - b a s e dc o l l a b o r a t i v ef i l t e r i n g ) ,先用相似统计的方法得到具有相似兴 趣爱好的邻居用户,所以该方法也称基于用户的协同过滤( u s e r - b a s e d c o l l a b o r a t i v ef i l t e r i n g ) 或基 于邻居的协同过滤( n e i g h b o r - b a s e dc o l l a b o r a t i v ef i l t e r i n g ) 4 ,5 】:二是基于模型的协同过滤 ( m o d e l - b a s e dc o l l a b o r a t i v ef i l t e r i n g ) ,先用历史数据得到一个模型,再用此模型进行预测【5 】。基 于模型的推荐广泛使用的技术包括神经网络等学习技术,潜在语义检索f l a t e n ts e m a n t i c i n d e x i n g ) 和贝叶斯网络( b a y e s i a n n e t w o r k s ) ,训练一个样本得到模型。b r e e s e 教授认为基于用户 的协同推荐比基于模型的协同推荐方法更好【6 】。 西南大学碗卜学位论文第章绪论 基于用户的协同推荐算法随着用户数量的增多,计算晕成线性加大,其性能越来越筹,并 且不能对推荐结果提供很好的解释。为此,在2 0 0 1 年s a r 2 w r 教授提出了第三种协同过滤推荐 算法,即基于项目的协同过滤推荐算法( i t e m - b a s e dc o l l a b o r a t i v ef i l t e r i n ga l g o r i t h m s ) 。该算法通 过先计算已评价项目和待预测项目的相似度,以相似度作为权重,加权各已评价项目的评价 分,得到预测项目的预测值,并指出基于项日的推荐算法比基于用户的推荐算法还要好,且 能解决基于用户的协同推荐的两个问题。但m i l d 教授从批判的角度重新审视了各种推荐算法, 指出基于项目的协同推荐并不一定好,算法准确度与采用的实验规模数据有关m 。虽然协同 过滤作为一种典型的推荐技术有相当的应用,但其仍有许多问题需要解决。目前很多技术都 是围绕协同过滤展开研究的,最典型的有稀疏问题( s p a r s i t y ) 和冷开始问题( c o l d - s t a r t ) 8 ,9 】,除 此之外,还有新用户问题和算法扩展性等问题。 除了协同过滤推荐技术外,还有一些其他推荐技术: ( 1 ) 基于内容的推荐技术( c o n t e n t - b a s e x tr e c o m m e n d a t i o n ) 它是基于用户评价对象的特征学 习用户的兴趣,依据用户资料与待预测项目的匹配程度进行推荐,如新闻组过滤系统n e w s w e e d e r 1 0 ,1 1 。 ( 2 ) 基于用户统计信息的推荐( d e m o g r a p h i c - b a s e dr e c o m m e n d a t i o n ) 推荐系统基于用户个人 属性对用户进行分类,再基于类对类中的用户进行推荐b 0 ,不要求有一个历史的用户数据, 而协同过滤和基于内容的推荐技术都需要。 ( 3 ) 基于效刚的推荐( u t i l i t y - b a s e dt c c o t m n e n d a t i o n ) 它是根据对用户使用项目的效用进行计 算的,核心问题是如何为每个用户创建效用函数,并考虑非产品属性,如提供商的可靠性 ( v e n d o r r e l i a b i l i t y ) 和产品的可用性( p r o d u c ta v a i l a b i l i t y ) 等。 ( 4 ) 基于知识的推荐( k n o w l e d g e - b a s e dr e c o m m e n d a t i o n ) 在某种程度上可以看成是一种推理 ( i n f e r e n c e ) 技术,各方法冈所用的知识不同而有明显区别 1 2 。t 3 。 ( 5 ) 基于关联规则的推荐( a s s o c i a t i o nr u l e - b a s e dr e c o m m e n d a t i o n ) 以关联规则为基础,把已 购商品作为规则头,推荐对象作为规则体,其中关联规则的发现最关键且最耗时,是算法的 瓶颈,但可以离线进行,商品名称的同义性问题也是关联规则的一个难点。 由于各种推荐方法都有优缺点,所以在实际中常采用组合推荐( h y b r i dr e c o m m e n d a t i o n ) 。 研究和应用最多的是内容推荐和协同推荐的组合【8 ,1 l 】。最简单的做法是分别用基于内容的方 法和协同推荐方法,产生一个推荐预测结果,然后用某方法组合其结果【1 4 1 。文献【1 3 】利用用 户评价数据得到的文档词矩阵( t h et e r m - d o c u m e n tm a t r i x ) 产生一个基于内容用户资料的矩阵 ( c o n t e n tp r o f i l em a t i n ) 。通过潜在语义索引o a t o n ts e m a n t i ci n d e x i n g 。l s d 计算一个基于内容用 户资料的排序形式,在l s i 空间中,加权用户档案中的词义向量产生推荐;文献1 1 1 用w i n n o w 算法从训练集中导出一个具有权重的词义向最作为用户资料模型,在此基础上,用协同过滤方 法进行预测;f a b 通过构建个人过滤器和主题过滤器,文档先用主题过滤器排序,再用个人过 滤器处理,用户的反馈可以修改个人代理器和主题代理器 8 】;文献 9 】用协同过滤和多个个人 信息过滤代理,协同过滤基于当前用户的个人代理和其他用户集上。虽然这些研究在定程 度上改进了协同过滤算法,有效的缓解了协同过滤算法的稀疏性问题和冷开始问题,但是也 并没有从根本上解决数据的稀疏性和推荐的冷开始问题。并且随着电子商务网站规模的不断 扩大,访问网站的顾客与产品的数据人量增多。其协同过滤推荐的效率随之线性卜降,这时 2 两南人学硕一l 学位论文第一章绪论 协同过滤算法的计算复杂性上便遇到了很人的问题,显示出自身的不足性。 为了产生精确而有效的推荐,保证推荐系统的实时性要求,研究者提出了各种不同的推 荐算法,如协同过滤推荐、基于项目的协同过滤推荐、b a y e s i a n 网络技术、聚类技术、关联规 则技术以及基于图的h o r t i n g 技术等。b a y e s i a n 网络技术利用训练集创建相应的模型e 1 5 ,模 型f 决策树表示,节点和边表示用户信息。训练得到的模型非常小,所以对模型的应用非常 快,这种方法适合用户的兴趣爱好变化比较慢的场合。 1 3 本课题的研究意义 电子商务个性化推荐系统是现代商务发展的产物,协同过滤推荐适应了对推荐系统的实 际技术要求。研究电子商务个性化推荐系统中的协同过滤推荐具有重要意义 社会的发展对研究电子商务个性化推荐系统提出了需要。信息时代的至0 来和电子商务的 出现改变了人们的生活,人们对个性化服务和产品产生了迫切的需求。在电子商务的虚拟环 境下,电子商务企业所能提供的商品种类和数量非常多,但是用户不希望也不可能浪费大量 时间在网上寻找商品。这就需要电子商务系统提供个性化服务的功能把用户可能感兴趣的商 品推荐给用户,使用户能够方便、容易的得到自己所需要的商品。从企业方面来说,要在激 烈的市场竞争中赢得存在和发展,除了生产价廉物美的产品之外,还必须在产品营销上主动 的把合适的产品送到合适的用户手中,为用户的网上购物提供便捷的个性化购物环境。因此, 电子商务个性化推荐系统符合现代商务中用户个体、企业和社会的需要。 同时,研究电子商务个性化推荐系统对企业和社会具有很高的经济价值。顾客是利润的 来源,谁能提供给顾客更好、更满意、更具个性化的产品和服务,谁就能赢得市场。应该看 到,电子商务模式使用户从物理购物环境转向虚拟购物环境的同时,也对企业服务提出了许 多新的、更高的要求,包括商品选购便捷、付款方便、质量保证、送货及时、退货容易等, 其中首先遇到的一个重要问题就是如何满足不同顾客对不同商品的个性化需求,提供给顾客 所需要的商品信息,以便顾客选购,而这正是企业价值链的源头和市场营销的起点。 在理论研究方面,电子商务个性化推荐系统具有较高的学术价值。自从1 9 9 2 年以来,电 子商务个性化推荐系统和协同过滤推荐被国际学术界广泛关注,并逐渐被应用于各个行业。 电子商务个性化推荐系统中的协同过滤推荐能对非结构化的复杂对象提供准确性较高的个性 化推荐结果。但是传统的协同过滤推荐存在的冷开始和稀疏问题严重影响了推荐性能,成为 国内外研究学者的研究焦点,人们逐渐认识到对电子商务个性化推荐系统中协同过滤推荐的 研究在学术研究领域占有重要的地位。 由于协同过滤技术涉及数据挖掘,机器学习,人工智能,信息检索,统计学以及模式识 别等方面的内容,通过协同过滤技术的研究也可以扩展作者本人的视野。 1 4 本课题的主要工作 尽管协同过滤技术在个性化推荐系统中获得了极大的成功,但随着站点结构、内容的复 杂度和用户人数的不断增加,协同过滤技术的一些缺点逐渐暴露出来,主要有 1 6 1 : 1 ) 精确性( a c c u r a c y ) 问题,即提高对_ 【 j 户的推荐质量的挑战,用户需要一个可以让他们感 到信任的推荐系统来给他们提供项目的推荐,如果一个推荐系统推荐的项目经常不符合用户 3 的要求,用户是会“用脚来投票”的。 2 ) 稀疏性( s p a r s i t y ) f 珂题:在许多推荐系统中,每个用户涉及的信息量相当有限,在一些大 的系统如w w a m a z o n c o m 网站中,用户最多不过就评估了上百万本书的1 - 2 ,造成评估矩 阵数据相当稀疏,难以找到相似用户集,导致推荐效果人大降低【16 】。 3 ) 冷启动( c o l ds t a n ) 问题:分为新项目( n e w i t e m ) 问题和新用户( n e w u s e r ) f 司题。如果一个新 项目没有人去评价它,则这个项目肯定得不到推荐,推荐系统就失去了作用,这在运用协同 推荐技术的系统中最为突 d l 1 7 。同样,如果一个新用户从未对系统中的项目进行评价,则系 统无法获知他的兴趣点也就无法对他进行推荐。 4 ) 扩展性( s c a l a b i l i t y ) 问题:现有大部分协同过滤算法的计算罱随着用户和项目的增加而大 大增加,对于上百万之巨的数目,通常的算法将遭遇到严重的扩展性问题【1 6 】,但由于大多数 算法可以离线进行运算,随着计算机计算能力的不断提高,可扩展性问题相对于前面几个问 题来说不是特别严重。 本文主要针对协同过滤技术中的稀疏性与冷启动问题进行研究,在评分数据稀疏的情况 下使预测的准确性保持较高的水平,在新用户进入系统后或者新项目加入系统后给该用户或 项目提供较准确的评分。同时也探讨了在基于项目的协同过滤推荐中如何解决项目的多内容 问题。 1 5 本文的组织结构 第一章介绍了电子商务个性化推荐系统中协同过滤推荐的背景和意义,协同过滤推荐技 术在国内外的研究现状,然后陈述了本课题所研究的主要内容和意义。 第二章介绍电子商务个性化推荐系统的一些基本概念、功能、体系结构、应用流程,以 及目前电子商务个性化推荐系统的研究内容以及所采用的相关技术等。 第三章介绍了信息过滤系统,其中重点介绍了协同过滤技术以及经典的基于用户和基于 项目的协同过滤推荐算法。 第四章研究了基于项目的协同过滤推荐中的项目多内容问题和稀疏性问题,提出了一个 改进的i t e m - b a s e d 协同过滤算法,算法的核心就是利_ 【l ;j 基于内容的过滤方法对传统i t e m - b a s e d 协同过滤算法进行优化。并进行了仿真实验设计和结果分析。 第五章介绍了影响消费者购买决策的第三个因素个人特征,针对协同过滤中的稀疏 性问题和新用户推荐问题,提出了基于用户个人特征的组合推荐算法,并在数据集上进行了 仿真实验和结果分析。 第六章描述应用基于用户个人特征的组合推荐算法进行电子商务个性化推荐系统的范 例。 最后对本文进行了总结,对需进一步研究的问题进行了简单探讨。 1 6 小结 本章介绍了电子商务个性化推荐系统中协同过滤推荐的背景、国内外研究现状,强调了 本文研究的意义,提出了研究的工作,并对论文的结构安排进行了简要说明。 4 两南j 、节硕卜学位论文第:章电了商务个件化持荐系统 第二章电子商务个。性化推荐系统 电子商务个性化推荐是指在电子商务过程中针对不同的用户提出个性化的产品和服务的 应用系统。本章将介绍电子商务个性化推荐系统的一些基本概念、功能、体系结构、应用流 程,以及目前电子商务个性化推荐系统的研究内容以及所采用的相关技术等。 2 1 电子商务个性化推荐系统概述 电子商务个性化推荐系统( p e r s o n a l i z e dr e c o m m e n ds y s t e m sf o re - c o n u n e r c e ) 的正式定义 由r e s n i c k & v a r i a n 在1 9 9 7 年给出:“电子商务个性化推荐系统是利用电子商务网站向用户提供 产品信息和相关建议,帮助用户决定购买什么产品,通过模拟销售人员帮助用户完成购物过 程的系统”。这个定义现在己经被广泛的应用。推荐系统的使_ i i ;j 者是用户( 电子商务活动中的 用户) ,推荐的对象是项目( i t e m ) 。项目是推荐系统提供给用户的产品和服务,也即最终的推荐 内容。 根据推荐对象的特点,目前存在的推荐系统可以大致分为两类:一类是以网页为主要推荐 对象的推荐系统,这种推荐系统主要采用w e b 数据挖掘,尤其是w e b 使用日志挖掘的方法和技 术来分析用户的兴趣,向用户推荐符合其兴趣爱好的网页链接。另一类推荐系统的推荐对象 主要是产品,这种推荐系统主要在电子商务网络购物环境中使用,帮助用户找出他真正想要 的商品,为用户推荐满足其需要又符合用户兴趣爱好的产品,这些产品除了是在实体商店中 出售的产品以外,还包括文章、新闻、音乐、电影等“无形”的产品,这种推荐系统就是通 常所说的电子商务个性化推荐系统。 2 1 1 电子商务个性化推荐系统的功能 电子商务推荐系统的功能可以概括为以下三点:为用户提供个性化的产品信息服务、提供 其它删户对产品的评价、为用户推荐产品。电子商务个性化推荐系统最主要的功能在于它能 够收集瑁户资料,通过分析这些资料,针对用户兴趣偏好主动为其做出个性化的推荐。换句 话说,每当川户登录到电子商务网站后,电子商务推荐系统就会按照当前用户偏好推荐其可 能感兴趣的很有可能购买的n 个产品,并且根据用户当前的活动,推荐系统给出的推荐是实时 更新的,即当系统的产品库和用户资料发生改变时,推荐系统给出的推荐序列会自动改变。 总的来说,电子商务个性推荐系统的作用主要表现在以下几方面:帮助用户寻找他们真正 想购买的并且符合其兴趣爱好的产品,大大节约了用户采购产品的时间和成本;同时,电子 商务推荐系统的个性和推荐服务,提高了用户对电子商务网站的忠诚度,将更多潜在的用户 浏览者变成真正购买产品的用户;通过向用户推荐相关的国外产品,提高交叉销售,帮助电 子商务企业建立起客户关系管理系统,为电子商务企业赢得了更多的发展机会。 研究表明,在基于电子商务的销售行业使用个性化推荐系统以后,销售额能提高2 一8 , 尤其在书籍、电影、c d 音像、日用百货等产品相对较为低廉并且产品种类繁多的行业,用户 使用个性化推荐系统程度较高的行业,电子商务个性化推荐系统能够大大提高企业的销售额。 电子商务个性化推荐系统和销售系统、供应链决策支持系统既有相似点又有所不同。销售系 统是帮助销售人员如何把产品销售出去。电子商务推荐系统的最终目的是帮助用户,辅助用 户对购买什么产品做出决策。供应链决策支持系统是帮助生产者决定什么时候生产多少什么 5 西南上学硕十学位论文第二章屯了商务个忡化推荐系统 商品,以及仓库应该存储多少各类产品,其展终日的是为了企业生产者服务的。同样,电子 商务推荐系统也是面向用户的系统。 电子商务个性化推荐系统具有显著的经济效益,可以大大降低企业的销售成本。可以预 见,在未来的几年内,我国电子商务个性推荐系统将有一个相当广阔的发展前景。 2 1 2 电子商务个性化推荐系统的构成 电子商务个性化推荐系统主要由以下三个模块组成:输入( i n p u t ) 模块、推荐方法 ( r e c o m m e n d a t i o nm e t h o d ) 模块、输出( o u t p u t ) 模块。 ( 1 ) 输入模块 输入模块主要负责对用户信息的收集和更新。输入来源按时间来划分,可以分为用户当 前行为输入和刚户访问过程中的历史行为输入;也可以按个人输入和群体输入来划分成两部 分。用户个人输入( t a r g e t c u s t o m e r i n p u t s ) 主要是指推荐系统的目标用户为了得到系统准确地 推荐结果而对一些项目进行评价,这些评价表达了用户自己的偏好。群体输入主要以群体形 式来表现评价数据。 电子商务推荐系统包括多种形式,主要包括【2 】: ( a ) 用户注册信息输入:用户在注册电子商务站点的时候需要输入一些个人信息,这些信 息包括用户的年龄、性别、职业等,用户也可以明确地表达自己的喜好兴趣。这类信息是电 子商务推荐系统收集到的关于特定用户的最初的信息。 ( ”隐式浏览输入:将j 户访问电子商务站点的浏览行为作为推荐系统的输入,用户的浏 览行为与在一般w e b 站点访问没什么区别。用户并不知道电子商务推荐系统的存在。用户当前 正在浏览的产品是用户购物篮中选择的产品,用户的浏览路径都可以作为隐式浏览输入信息。 ( c ) 显式浏览输入:这也是将用户的浏览行为作为电子商务推荐系统的输入,或将朋户当 前正在浏览的产品类别作为推荐系统的输入。这种类型的输入不同于用户随意浏览行为,用 户输入的目的就是在电子商务系统中寻找自己需要的商品。 ( d ) 用户评分输入:将用户对产品的数值评分数据作为推荐系统的输入。电子商务推荐系 统列出一系列产品让用户评分,用户的评分可以是一个数值,数值的大小表示用户对该产品 的喜好程度,也可以是一个布尔值,0 代表不喜欢,1 代表喜欢。通过用户提供的评分数据, 使得电子商务推荐系统可以为用户提供个性化的推荐服务。 ( e ) 用户文本评价输入:用户对已经购买的产品或者自己熟悉的产品以文本形式进行个人 评价,推荐系统本身并不能判断这些评价的好坏。用户浏览该产晶时,可以看到其他用户对 产品的文本评价信息。 ( g ) 编剧推荐输入:将领域专家对特定产品的评价作为推荐系统的输入,领域专家对产品 的性能特点进行全面详细地介绍,用户通过专家的专业解释,可以对自己并不熟悉的产品加 深认识,从而决定是否购买该产品。 用户购买历史输入:推荐系统将用户的购买历史将作为隐式评分数据。一旦用户购买 了特定产品,则认为用户喜欢该产品。推荐系统根据用户的购买历史产生相应的推荐。但是 用户购买了某件产品并不代表用户真正地喜欢上该产品,所以在精确的推荐系统中,用户可 以对购买的产品进行重新评估,从而使推荐系统产生更精确的推荐。 6 两南大学砀! f 学位论文第二章电了商务个性化推荐系统 用户个人输入往往包括用户注册信息输入、隐式浏览输入:显示浏览输入、关键词项目 属性输入和_ i ;i 户购买历史输入等。群体输入主要包括项目属性输入、用户购买历史输入、文 本评价输入、用户评分输入等。 ( 2 ) 推荐方法模块 推荐方法模块是整个电子商务推荐系统中的核心部分,它直接决定着推荐系统的性能优 劣。推荐方法模块以推荐技术和推荐算法为技术支撑,具体推荐算法将在第三章详细讨论。 ( 3 ) 输出模块 输出模块负责将推荐结果输出给用户。电子商务推荐系统的输出形式主要包括【3 1 : ( a ) 相关产品输出:推荐系统根据用户表现出来的行为特征和电子商务系统的销售情况向 用户产生商品推荐,这种方式是电子商务推荐系统中最为酱遍的一种输出。相关产品输出可 以基于简单的销售排行向用户推荐热门商品;也可以基于用户的行为特征进行深入分析,发 现用户的购买行为模式,从而产生个性化的推荐。 ( b ) 个体文本评价输出:电子商务推荐系统向目标用户提供其他用户对商品的文本评价信 息。个体文本评价一般是非个性化的,对每个项目而言,所有用户得到个体文本评价都是相 同的。 ( c ) 个体评分输出:目标用户提供其他用户对产品的数值评分信息。个体评分输出没有大 量文本描述信息,因而更加简沾明了。个体评分输出比较适合个体数值评分数据比较少的场 合。 ( d ) 平均数值评分输出:电子商务推荐系统向用户提供其他用户对于商品的数值评分信息 的平均值。这种输出形式具有简洁明了的优点,用户可以立即获得对该产品的总体评价。 ( e ) 电子邮件输出:电子商务推荐系统通过邮件的形式向用户提供产品的最新信息。这种 输出的方式可以吸引用户再次访问电子商务站点,从而达到保留用户,防止客户流失的目的。 ( f ) 编辑推荐输出:向用户提供领域专家对产品的专业介绍,用户通过专家的解释可以对 自己并不熟悉的产品加深认识,了解产品的性能特点,从而决定是否购买该产品。 2 2 电子商务个性化推荐系统的总体框架及流程 电子商务个性化推荐系统的完整框架主要由操作数据库、数据仓库、推荐模型库、用户 交互模块等构成。 ( 1 ) 操作数据库:操作数据库中存储与用户操作密切相关的数据,包括产品数据库、用户 数据库、销售数据库、w e b 日志数据库等。 ( 2 ) 数据仓库:用来存储经过清洗和初步挖掘后的数据,是推荐系统直接操作的数据库, 包括属性数据,购买数据、产品数据、点击数据等。 ( 3 ) 推荐模型库:用于存储推荐算法。 ( 4 ) 推荐引擎:主要功能是接收推荐请求,运行推荐策略,产生推荐结果。 推荐引擎对推荐算法提供了统一的运行环境,方便了推荐算法的编制,对# b 且l l j 提供了统 一的推荐服务接口。 ( 5 ) 用户交互一方面接受用户的要求,另一方面提供给用户推荐结果。 电子商务推荐系统需要完成从数据信息采集到推荐应用的完整的系统应用流程,具体来 7 两南大学珂! t 。学位论文第二:市电于商务个r 化推荐系统 说,包括以f 几个部分: ( 1 ) 数据清洗、转换和加载:由数据挖掘i :具从操作数据库中选择数据,使用e t l ( 清洗、 转换和加载) 把选择出来的数据加载到数据仓库中,成为规整数据。选择什么样的数据是由具 体的推荐应用指定的,例如“用户评分模型”需要用户评分数据,而“关联规则推荐模型” 需要用户的交易数据。 ( 2 ) 模型生成:根据推荐的应用,选择所对应的规整数据,使用适合的模型产生推荐模型, 存储在模型库中。如何选择合适的模型生成推荐模型也是由具体的推荐戍用决定的。 ( 3 ) 推荐策略配置:推荐策略是推荐过程的配置,其中包括推荐算法和推荐模型。具体的 推荐功能是由推荐引擎运行对应的推荐策略来实现的。推荐引擎提供推荐服务,必须有已经 配置好的推荐策略。配置工作主要是修改推荐策略,采用新的推荐模型,然后根据具体的推 荐应用到配置推荐策略,并请求推荐引擎启动或重载此策略。 ( 4 ) 推荐服务访问:电子商务系统直接向推荐引擎提供当前用户的信息,并请求用户指定 的推荐策略产生产品的推荐列表。推荐引擎则根据电子商务系统的请求运行相应的推荐策略, 产生合适的推荐结果。 ( 5 ) 操作数据更新:电子商务系统开展网络商业活动,并向用户提供推荐服务,由于不断 有新用户新产品的加入,用户也不断地有情感活动,因此操作数据库也在不断地发生变化, 需要及时进行更新。 整个电子商务个性化推荐系统流程是一个不断循环的流程,当操作数据库变化到一定程 度时,数据仓库推荐模型需要更新,及时地反映当前用户行为的变化。更新模型由具体的应 朋要求决定,一般采用周期性的方法,也可以采用推荐效果反馈i c j 值来控制。 2 3 电子商务个性化推荐系统的研究内容 电子商务个性化推荐系统的研究主要围绕四个方面的问题: ( 1 ) 电子商务个性化推荐系统的信息来源问题。 电子商务个性化推荐系统的基础是用户兴趣资料信息,如何在电子商务环境下尽可能获 得更多的用户相关信息,并以合适的形式表示,是进行个性化推荐的前提。根据当前在电子 商务环境中对用户信息的研究来看,主要着眼于收集能反映用户兴趣偏好的信息,以及如何 通过网络数据挖掘等方法更自动化的收集用户的隐式信息,解决用户信息收集过多的依赖于 显式评价数据的问题。 ( 2 ) 设计准确高效的个性化推荐算法 要实现被用户接受和认可的电子商务个性化推荐系统,设计准确、高效率的个性化推荐 算法是个性化推荐的核心问题。目前的推荐技术有协同过滤推荐、基于用户统计信息的推荐、 基于内容的推荐、基于效用的推荐、基于知识的推荐、基于规则的推荐等等。协同过滤推荐 是电子商务个性化推荐中研究和应用最多的方法,被广泛地应用于电子商务网站、数字图书 馆、网页搜索,新闻过滤等,其假设前提是存在具有相似兴趣爱好的用户群,每个用户都有 与其兴趣爱好相似的邻居用户。预测用户对某一项目的偏好是根据邻居用户对该项目的偏好 程度计算的,也就是说如果其邻居用户喜欢某一项目,则该用户也有可能会喜欢这个项目。 协同过滤最大的优点是不需要分析对象的属性,所以对推荐对象没有特殊的要求,能处理非 8 两南上学硕十学位论文第二章电了商务个件化扮荐系统 结构化的复杂对象,例如音乐、电影等。 ( 3 ) 电子商务个性化推荐系统的评价问题 要使电子商务个性化推荐系统被广大用户所接受,必须对推荐系统做出客观、综合的评 价,即需要从准确性、个性化、安全性、用户满意度等多方面进行评价。对推荐系统总体性 能的评价是个性化推荐系统研究的重要组成部分,但目前大都只是采用准确率、召回率等评 价尺度对推荐算法进行评价,并没有真正意义上提升到对整个推荐系统进行评价,尤其缺乏 从个性化程度、实用化程度、系统中的安全性及用户接受程度等多方面对推荐系统综合的评 价。 ( 4 ) 电子商务个性化推荐系统的应用问题 电子商务个性化推荐系统不仅要为用户提供一个个性化的购物环境,更应该为电子商务 企业的销售决策和用户关系管理提供支持。目前对电子商务个性化推荐系统的应用研究方面 主要集中在个性化推荐技术,还较少从更广阔的范围和更深入的专门领域,例如从营销决策、 市场分析、用户关系管理或者系统集成商务智能等角度来讨论其应用。 2 4 小结 本章从电子商务个性化推荐系统的概念着手,分析了电子商务个性化推荐系统的作用、 构成、整体构架、应用流程和主要的研究内容。 9 至:i :型,:i 丝,一! 一! , 釜三兰互:呈兰鎏至釜 第三章信息过滤系统 信息过滤系统可分为基于内容过滤的系统和协同过滤系

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论