(信号与信息处理专业论文)推荐系统中协同过滤算法若干问题的研究.pdf_第1页
(信号与信息处理专业论文)推荐系统中协同过滤算法若干问题的研究.pdf_第2页
(信号与信息处理专业论文)推荐系统中协同过滤算法若干问题的研究.pdf_第3页
(信号与信息处理专业论文)推荐系统中协同过滤算法若干问题的研究.pdf_第4页
(信号与信息处理专业论文)推荐系统中协同过滤算法若干问题的研究.pdf_第5页
已阅读5页,还剩126页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

。 ;: 毒, j i 之e s e a r c ho nk e yp r o b l e m sf o r c o l l a b o r a t i v ef i l t e r i n gi n r e c o m m e n d a t i o ns ys t e m b y l i a n gz h a n g s u p e r v i s o r :p r o f j u ng u o ad i s s e r t a t l 0 n p r e s e n t e dt ot h ef a c u l t y o ft h eu n i v e r s i t yo fp o s t s t e l e c o m a 仉r n i c a t i o n s i nc a n d i d a c yf o r t h ed e g r e e o fd o c t o ro fp h i l o s o p h y r e c o m m e n d e df o ra c c e p t a n c e b y t h es c h o o lo f i n f o r m a t i o ne n g i n e e r i n g m a y 2 0 0 8 吣2川5 叭06m 7 1y lijll川 一 一也 囊 毒 羹, j 独创性( 或创新性) 声明 本人声明所呈交的论文是本人在导师指导下进行的研究工作及取得的研究成果。 尽我所知,除了文中特别加以标注和致谢中所罗列的内容以外,论文中不包含其他人 已经发表或撰写过的研究成果,也不包含为获得北京邮电大学或其他教育机构的学位 或证书而使用过的材料。与我一同工作的同志对本研究所做的任何贡献均己在论文中 作了明确的说明并表示了谢意。 申请学位论文与资料若有不实之处,本人承担一切相关责任。 i 本人签名:趁i 堑么同期:9 。歹、之。 关于论文使用授权的说明 学位论文作者完全了解北京邮电大学有关保留和使用学位论文的规定,即:研究 生在校攻读学位期间论文工作的知识产权单位属北京邮电大学。学校有权保留并向国 家有关部门或机构送交论文的复印件和磁盘,允许学位论文被查阅和借阅;学校可以 公布学位论文的全部或部分内容,可以允许采用影印、缩印或其它复制手段保存、汇 编学位论文。( 保密的学位论文在解密后遵守此规定) 保密论文注释:本学位论文属于保密在一年解密后适用本授权书。非保密论文注 释:本学位论文不属于保密范围,适用本授权书。 本人签名: 导师签名: 日期: 沙,夕;夕 日期:罗,? 汐 j aj 推荐系统中协i r d 过滤算法若十问题的研究 推荐系统中协同过滤算法若干问题的研究 摘要 随着互联网的飞速发展,互联网的应用也在快速普及,并受到了公 众的认可和赞同。同时,互联网也渗透到我们每个人的生活中,网上交 易购物,也变得越来越流行。但是,对于互联网的使用者来说,在网上 购物还要面临一个巨大的问题。由于互联网信息的种类繁多,商品数量 庞大,如何在众多商品中正确的选择商品和购买到自己需要的商品成为 用户要面临的一个问题。为了帮助用户在互联网上更好地选择商品,推 荐系统应运而生。推荐系统是用来帮助用户选择商品和产生商品智能推 荐的系统。其中最重要的推荐技术是协同过滤技术,协同过滤技术利用 用户品味间的相似来产生推荐。目前,协同过滤技术在研究和应用领域 上均取得了很大成功,但依然有很多问题需要解决和研究。 目前,国内外学者研究的热点问题主要有三个。第一是算法的准确 性问题。为了使推荐的结果更加准确,研究者们一直在推荐准确性方面 做着不懈的努力,但是由于用户和产品的数据的稀疏性,其推荐的准确 性受到严重的影响。由于用户并不能购买所有商品,而是只能购买其中 很少的一部分,从而导致数据矩阵十分稀疏,数据稀疏性也成为影响协 同过滤技术最主要的原因。第二是算法的可伸缩性问题。由于用户和产 品数量庞大,并且用户和产品的数量都在高速增长,因此如何使算法更 加适合不断增长的大规模数据,以提高算法的可伸缩性成为一个重要的 研究课题。第三是协同过滤算法的评估问题。推荐系统的评估是一个非 常重要的课题,它不但可以帮助我们评估推荐系统的推荐质量,还可以 针对不同的数据及数据属性选择合适的推荐算法。 针对上述问题,本文开展了以下创新性的研究工作: 第一,提出了一种新的基于模型的协同过滤算法。传统的基于用户 的协同过滤算法基于一个如下假设:如果用户对一些项目的评分比较相 似,则他们对其它项目的评分也比较相似;如果大部分用户对一些项的 评分比较相似,则当前用户对这些项的评分也比较相似。但是两个用户 北京邮i u 人学博i j 学位论义推荐系统中协f 净过滤算法若十问题的研究 存在品位的相似往往只是针对部分项目而言。传统的协同过滤算法往往 忽略了这一点,而是把所有的项目都考虑进来。针对这个问题,本文提 出了一个新的基于聚类的模型算法。这种算法在聚类的同时试图在类别 中发现簇中用户所共有的部分偏好相似项目,并依据偏好相似程度赋予 不同的权值,然后再在每个簇中使用本文定义的新的相似度计算方法来 计算最近邻并产生预测。实验结果表明,该方法有比较高的准确度,同 时由于使用了聚类的方法,可以有效的减少计算复杂度,提高算法的可 伸缩性。 第二,针对目前协同过滤算法存在的预测准确度受数据稀疏性影响 比较大的问题,提出了一种新的基于用户和基于项目结合的协同过滤算 法。数据稀疏或者是由于某些用户选择项目太少或者某些项目被用户选 择次数过少而导致。因此,本文的算法首先定义了用户稀疏度和项目稀 疏度,并根据用户稀疏度的不同来结合基于用户和基于项目的协同过滤 算法。实验结果表明,该方法能够有效地解决数据稀疏的问题,并能很 好的提高算法的准确性。 第三,提出了一种新的最近邻选择方式。最近邻的选择是协同过滤 算法中最为核心的问题,因为最后的预测结果要使用选择后的最近邻来 进行组合预测,因此如何选择最近邻将对算法的准确性产生至关重要的 影响。本文指出了传统的最近邻选择和计算方法所带来的弊端和存在的 问题,并对该类问题进行了定义和分析,针对这类问题,提出了一种新 的最近邻选择方法,该方法考虑了两个用户相似时的用户的部分偏好相 似问题,从而结合项目问的影响来选择最近邻。实验结果表明,该方法 能够更加正确的选择最近邻,从而改善了协同过滤算法的准确性。 最后,文本还提出了一种新的评估和测量协同过滤算法的方法。有 效性和时间消耗作为推荐系统的重要指标,其评价准则的设计一直是一 个热点,但是没有统一的结论。最常用的协同过滤的有效性的评估指标 是m a e ( m e a n a b s o l u t ee r r o r ) 。这个指标只能笼统地描述算法准确性,并 没有针对协同过滤算法的特殊性进行评价。文本认为一个好的推荐系统 应该满足如下三个条件:( 1 ) 准确性,能够正确反映用户的品位;( 2 ) 完整 性,能够推荐用户可能忽略或者没有足够时间去查找的商品项目;( 3 ) 可 信任性,要能真正赢得用户的信任。并根据这些特殊性提出了三个指标: 修正的平均绝对偏差( j m a e ) ,漏荐率( l r r ) 和误荐率( w r r ) 。这三 t r j 北京i i i g , u 人学博l :学位论文推荐系统中协i 州过滤算法若干问题的研究 个指标分别从正面和反面来对推荐系统中的协同过滤算法进行有效的评 估。通过实验对比了当前最为流行和权威的几种协同过滤算法,并基于 上述新指标对比分析了各种协同过滤算法的准确性。 关键词:推荐系统,协同过滤,聚类,部分相似,评估度量 i i i 弓 1 6 咚、j r e s e a r c ho nk e yp r o b l e m sf o r c o l l a b o r a t i v ef i l t e r i n gi nr e c o m m e n d a t i o n s y s t e m a b s t r a c t w i t ht h ee x p o n e n t i a li n c r e a s eo ft h ei n f o r m a t i o no ft h ei n t e m e t i n t e m e t t r a d i n gh a sb e c o m em o r ea n dm o r ep o p u l a r b u to n em a i np r o b l e mt h a tu s e r s f a c ei sh o wt of i n dt h ep r o d u c tt h e yl i k ef r o mm i l l i o n so fp r o d u c t s t oa i d u s e r si nt h ed e c i s i o nm a k i n gp r o c e s s ,i th a sb e c o m em o r e i m p o r t a n tt od e s i g n r e c o m m e n d e rs y s t e m st h a ta u t o m a t i c a l l yi d e n t i f yt h el i k e l yc h o i c e so f u s e r s ap o p u l a r a l g o r i t h mo ft h er e c o m m e n d e rs y s t e m si s a na u t o m a t e d c o l l a b o r a t i v ef i l t e r i n g ( a c fo rc f ) a l g o r i t h m t h e s ea l g o r i t h m s p r o d u c e r e c o m m e n d a t i o n sb a s e do nt h ei n t u i t i o nt h a ts i m i l a ru s e r sh a v es i m i l a rt a s t e s c o l l a b o r a t i v ef i l t e r i n gh a sb e e n v e r ys u c c e s s f u l i nb o t hr e s e a r c ha n d a p p l i c a t i o n ss u c ha si n f o r m a t i o nf i l t e r i n ga n de c o m m e r c e h o w e v e r , t h e r e s t i l lr e m a i ns o m ei m p o r t a n tr e s e a r c hi s s u e si no v e r c o m i n gt w of u n d a m e n t a l c h a l l e n g e sf o rc o l l a b o r a t i v ef i l t e r i n g i nt h e s ep r o b l e m s ,t h e r ea r et h r e em a i ni m p o r t a n tc h a l l e n g e s t h ef i r s t c h a l l e n g ei st oi m p r o v et h eq u a l i t yo f r e c o m m e n d a t i o n s g e n e r a l l y , s p a r s i t yo f u s e rd a t ai sr a t a lf a c tw h i c ha f f e c t st h ea c c u r a t eo ft h er e s u l t s p a r s i t yr e f e r st o t h ef a c tt h a tm o s tu s e r sd on o tr a t em o s ti t e r n sa n dh e n c eav e r y s p a r s e u s e r - i t e mr a t i n gm a t r i xi sg e n e r a t e d t h es e c o n dc h a l l e n g ei st oi m p r o v et h e s c a l a b i l i t yo ft h ec o l l a b o r a t i v ef i l t e r i n ga l g o r i t h m s t h ec o l l a b o r a t i v ef i l t e r i n g s u f f e r ss e r i o u ss c a l a b i l i t yp r o b l e m si nf a i l i n gt os c a l eu pi t sc o m p u t a t i o nw i t h t h eg r o w t ho fb o t ht h en u m b e ro fu s e r sa n dt h en u m b e ro fi t e r n s t h el a s ti s i i i h o wt oe v a l u et h ec o l l a b o r a t i v e f i l t e r i n ga l g o r i t h m c o l l a b o r a t i v ef i l t e r i n g e v a l u a t i o ni sa ni m p o r t a n ti s s u e i tc a nh e l pu sm e a s u r et h eq u a l i t yo ft h e r e c o m m e n d a t i o n sm a d eb yt h er e c o m m e n d a t i o ns y s t e mo rc h o o s et h er i g h t a l g o r i t h mf o ro u rd a t ao ro u rd o m a i n f o rt h e s ep r o b l e m s ,w em a k et h em a i nc o n t r i b u t i o n so ft h i sd i s s e r t a t i o n a r es u m m a r i z e da sf o l l o w s : f i r s t l y ,w ep r e s e n tan e wa p p r o a c ht oi m p r o v et h ea c c u r a c ya n dt h e s c a l a b i l i t y o fc o l l a b o r a t i v e f i l t e r i n g t r a d i t i o n a l c o l l a b o r a t i v e f i l t e r i n g a l g o r i t h mb a s e do no n ea s s u m p t i o n :p e o p l ew h oh a v es i m i l a rp r e f e r e n c eo n s o m eo fi t e m s ,t h e yw i l lh a v et h es i m i l a rp r e f e r e n c eo no t h e ri t e m s b u tw e a r g u et h a tu s e r sh a v es i m i l a rp r e f e r e n c eo n l yo np a r t so fi t e m s ,s ow ep r o p o s e an o v e lm o d e l b a s e da l g o r i t h mf o rc o l l a b o r a t i v ef i l t e r i n gb a s e do nl o c a l i z e d p r e f e r e n c eb e t w e e nu s e r s w eu s ean e wm e t h o dt op a r t i t i o nt h eu s e r s ,a n d s y n c h r o n o u sd i s c o v e r e dt h el o c a l i z e dp r e f e r e n c ei ne a c hc l u s t e r b yu s i n gt h e i n t e g e rw e i g h to ni t e m si no n ec l u s t e r , w ee a s i l yg o tt h el o c a l i z e dp r e f e r e n c e o fu s e r sa n du s e di tt o s e l e c tt h en e i g h b o r sf o rp r e d i c t i o n w ep r e s e n t e m p i r i c a lr e s u l t sw h i c hs h o wt h a tt h em e t h o dh a v eb e t t e rs a t i s f a c t o r y a c c u r a c ya n dp e r f o r m a n c e s e c o n d l y , w ep r o p o s ean e wa p p r o a c hb yu n i f y i n gt h eu s e r - b a s e da n d i t e m - b a s e dc o l l a b o r a t i v e f i l t e r i n gt oo v e r c o m et h ed a t as p a r s i t y a l t h o u g h u s e r - b a s e dc fa n di t e m b a s e dc fa r es u c c e s s f u l l ya p p l i e di nw i d er e g i o n s , t h e ys u f f e rf r o maf u n d a m e n t a lp r o b l e m :d a t as p a r s i t y f o rt h i sp r o b l e m ,w e f i r s td e f i n et h eu s e r - s p a r s i t ya n di t e m - s p a r s i t ya n dt h e np r o p o s eah y b r i d a p p r o a c ht o o v e r c o m et h ed a t a s p a r s i t yb yu s i n gh eu s e r - s p a r s i t ya n d i t e m s p a r s i t y w ea l s od e f i n eas i m i l a r i t yw e i g h tt od e a l i n gw i t ht h ed a t a s p a r s i t y e x p e r i m e n t a lr e s u l t ss h o w e dt h a to u rn e wa p p r o a c hc a ns i g n i f i c a n t l y i m p r o v et h ep r e d i c t i o na c c u r a c yo fc o l l a b o r a t i v ef i l t e r i n ga n dd e a l i n gw i t ht h e d a t a t h i r d l y , w ep r o p o s ean e wm e t h o dt os e l e c tn e i g h b o r sf o rc o l l a b o r a t i v e f i l t e r i n g i nc o l l a b o r a t i v ef i l t e r i n ga l g o r i t h m ,t h em o s ti m p o r t a n tp r o c e s si s s e l e c t i n gn e i g h b o r sf o rt h ea c t i v eu s e r t r a d i t i o n a lm e t h o d sc o m p u t eu s e r s s i m i l a r i t yo nt h ew h o l es e to fi t e m s b e c a u s er e s e a r c h e r sb e l i e v e di fu s e r s i v 6 j 北京邮i 乜人学博i j 学位论文推荐系统中协i 一过滤算法若十问题的研究 h a v es i m i l a rp r e f e r e n c eo ns o m eo fi t e m s ,t h e yw i l lh a v et h e s i m i l a r p r e f e r e n c eo no t h e ri t e m s b u tw ea r g u et h a tu s e r sh a v es i m i l a rp r e f e r e n c e o n l y o np a r t so fi t e m s i no u rp a p e r ,w ef i r s ta n a l y z et h ep r o b l e mo f t r a d i t i o n a l a p p r o a c hi n t h ep r o c e s so fs e l e c t i n gn e i g h b o r s a n dt h e nw e p r o p o s e an o v e lm e t h o dt os e l e c t i n gn e i g h b o r sf o rt h ea c t i v eu s e rb yu s i n gt h e v a r i a n c eo ft h ep r o c e s so fc o m p u t i n gs i m i l a r i t yb e t w e e nu s e r s e x p e r i m e n t a l r e s u l t ss h o wt h a to u ra p p r o a c hc a ns i g n i f i c a n t l yi m p r o v et h ea c c u r a c yo f p r e d i c a t i o n a tl a s t ,w ep r o p o s ean e wm e t r i ct oe v a l u et h ec o l l a b o r a t i v ef i l t e r i n g c o l l a b o r a t i v ef i l t e r i n ge v a l u a t i o ni sa ni m p o r t a n ti s s u ef o rr e s e a r c h e r s ,b u ti t h a sn ou n i f o r mc o n c l u s i o nf o rt h i sp r o b l e m t r a d i t i o n a lm e t r i ci sm e a n a b s o l u ee r r o r ( m a e ) ,b u tt h i sm e t r i ch a sl o t so fl i m i t a t i o nf o re v a l u i n gt h e c o l l a b o r a t i v ef i l t e r i n g f o rt h i sp r o b l e m ,w ef i r s ta n a l y z et h ec h a r a c t e r i s t i co f r e c o m m e n d a t i o ns y s t e m ,a n dt h e nw ea r g u et h a tag o o dr e c o m m e n d a t i o n s y s t e ms h o u l dh a v et h r e eq u a l i f i c a t i o n :( 1 ) a c c u r a c y , r e c o m m e n d a t i o ns y s t e m m u s tr e f l e c tt h eu s e r sp r e f e r e n c ei na c c u r a c y ;( 2 ) i n t e g r a l i t y , r e c o m m e n d a t i o n s y s t e mc a ng i v es o m er e c o m m e n d a t i o n sw h i c ha r ee a s i l yi g n o r e db yu s e r s ; ( 3 ) d e p e n d a b l e ,r e c o m m e n d a t i o n ss y s t e mc a nb et r u s t e db yu s e r s w ep r o p s e t h r e em e t r i c :j m a e ,l r ra n dw r rb a s e do nt h e s ec o n d i t i o n s w em a k ea n e x p e r i m e n tf o re v a l u i n g t h e q u a l i t yo ft h e m a i nc o l l a b o r a t i v ef i l t e r i n g a l g o r i t h mb yu s i n go u rn e wm e t r i c k e yw o r d s :r e c o m m e n d a t i o n c l u s t e r i n g ,l o c a l i z e dp r e f e r e n c e , s y s t e m , c o l l a b o r a t i v e f i l t e r i n g , e v a l u a t i o nm e t r i c v 北京邮l u 人学博f j 学位论义 推荐系统中协同过滤算法菪十问题的研究 v i i i 心 j 北京邮l u 人学博i :学位论文推荐系统中协川过滤算法若十问题的研究 目录 摘要i a 】;l s t r a c t i i i 目录i x 第一章绪论l 1 1 立论背景1 1 2 推荐系统研究现状3 1 2 1 推荐系统发展简述3 1 2 2 推荐系统的主要研究内容3 1 2 3 推荐系统实例5 1 2 4 推荐系统研究面临的挑战6 1 3 本文的研究工作8 1 4 论文结构9 参考文献1 1 第二章推荐系统及其相关技术简介1 5 2 1 信息检索和信息过滤15 2 1 1 信息检索15 2 1 2 信息过滤1 7 2 1 3 信息检索和信息过滤比较18 2 2 数据挖掘技术2 0 2 2 1 数据挖掘概念2 0 2 2 2 数据挖掘过程2 l 2 2 3 数据挖掘功能2 1 2 3 推荐系统及其核心算法2 3 2 3 1 基于内容的推荐算法2 3 2 3 2 协同过滤推荐算法2 5 2 3 3 基于规则的推荐算法2 7 2 3 4 组合推荐算法2 8 2 3 5 推荐系统算法比较3 0 参考文献3 2 第三章推荐系统中协同过滤算法相关技术3 6 3 1 协同过滤算法简单描述3 6 3 1 1 研究内容3 6 3 1 2 问题描述3 7 3 1 3 协同过滤算法步骤3 7 3 2 基于用户的协同过滤算法3 8 3 2 1m e m o r y b a s e d 3 9 3 2 2m o d ei b a s e d 4 0 3 2 3 特点分析”4 1 3 3 基于项目的协同过滤算法4 2 3 3 1m e m e o r y - b a s e d 4 2 3 3 2m o d ei b a s e d 4 4 3 3 3 特点分析一) 3 4 混合的协同过滤算法及其他方法”4 5 3 5 协同过滤算法的评估一) 3 6 协同过滤算法研究所用数据4 7 参考文献一y 第四章基于用户部分偏好相似的协同过滤算法5 4 4 1 引言j | 4 2 相关研究 4 3 相关背景 4 3 1 问题描述) o 4 3 2u s e r b a s e d 协同过滤算法5 6 4 3 3 it e m - - b a s e d 协同过滤算法5 6 4 4 基于部分偏好相似的协同过滤算法5 。7 4 4 1 定义川 4 4 2 数据预处理0 5 4 4 3 相似度量”泌 4 4 4 算法描述o y 4 5 试验评估o z 4 。5 1 实验数据o j 4 5 2 实验结果评估o j 4 。5 3 实验结果”o j 4 6 结论0 0 参考文献引 第五章混合模式的协同过滤推荐算法7 0 5 1 引言,u 5 2 研究背景,l 5 2 1 协同过滤问题定义,l 5 2 2 基于用户的协同过滤算法7 2 5 2 3 基于项目的协同过滤算法。7 3 5 3 混合模式协同过滤算法,j 5 3 1 问题提出和定义7 3 5 3 2 相似度量1 4 5 3 3 相似权值d 5 3 4 概率函数”b x 赫 t 北京邮l u 人学博i :学位论文推荐系统中协i 叫过滤算法若十问题的r o d f 5 3 5 参数确定7 7 5 4 实验结果7 8 5 4 1 实验数据7 8 5 4 2 实验结果评估7 8 5 4 3 实验结果7 9 5 5 结论8 l 参考文献8 2 第六章基于部分偏好的最近邻选择8 4 6 1 引言8 4 6 2 研究背景_ 8 5 6 2 1 问题定义8 5 6 2 2 用户相似度量8 5 6 2 3 传统的协同过滤算法8 6 6 3 基于偏好的最近邻选择8 7 6 3 1 问题分析8 7 6 3 2 选择正确的最近邻8 8 6 4 实验结果8 9 6 4 1 实验数据9 0 6 4 2 试验结果评估度量9 0 6 4 3 实验结果9 0 6 5 结论9 1 参考文献:9 3 第七章协同过滤算法的评价9 5 7 1 协同过滤算法评价简介:。9 5 7 2 评估协同过滤算法新度量9 9 7 2 1 协同过滤算法满足目标9 9 7 2 2 问题定义10 0 7 2 3 修正的平均绝对偏差的方法( j m a e ) 1 0 0 7 2 4 误荐率( w r r ) 1 0 1 7 2 5 漏荐率( l r r ) 一1 0 1 7 3 试验评估_ 10 2 7 3 1 实验数据10 2 7 3 2 实验结果1 0 3 7 4 结论l0 4 参考文献1 0 5 第八章总结和展望。10 8 8 1 总结1 0 8 8 2 展望n o 至j 【谢11 2 北京l l l gj i j , 人学博l :学位论义 推荐系统中协同过滤算法若十问题的研究 攻读博士学位期i b j 发表的论文1 1 3 x i l 1 1 一 一 j 北京邮l 乜人学博l :学位论文推荐系统中协h 过滤算法若十问题的研究 1 1 立论背景 第一章绪论 i n t e m e t 的迅猛发展对企业发展和个人生活都产生了深刻的影响【1 1 。但随着w e b 使用的普及,信息以指数级数增长,远远超出了人们所能够接受的程度,人们在大量 的信息面前感到束手无策,这就是所谓的“信息过载”问题。面对着过量的信息,重 要的信息和不重要的信息之间的界限很容易消失。面对知识的海洋,如何快速有效的 帮助用户获取真正需要的信息成为一项富有挑战性的工作,也是当前学术界研究者的 热点问题。 “信息过载现象同样存在于电子商务中,随着企业电子商务规模的进一步扩大, 为用户提供越来越多选择的同时,电子商务系统的结构也变得更加复杂。一方面,用 户面对大量的商品信息无所适从,经常会迷失在大量的商品信息中,无法顺利找到自 己需要的商品;另一方面,商家也失去了与消费者的联系。事实上,电子商务的应用 远没有挖掘出来,其中固然有硬件设施滞后、用户观念未改变的原因,但更多的是企 业服务不到位。电子商务的发展模式对企业服务提出了许多新要求,包括商品的质量 保证、送货及时、商品选购舒适、退货方便等,其中,最为突出的问题就是商品选购。 因此,用户很希望电子商务系统具有一种类似采购助手的功能来帮助其选购商品,并 能根据用户的兴趣爱好自动地推荐给每个用户可能感兴趣且满意的商品。 在这种背景下,推荐系统( r e c o m m e n d e rs y s t e m s ) 应运而生,成为解决这一问 题的最有效方法之一。目前来说,推荐系统的定义相对模糊,在学术界缺乏比较权威 的定义。现在被广泛引用的推荐系统( r e c o m m e n d e rs y s t e m ) 的定义是r e s n i c k & v a r i a n 在1 9 9 7 2 】年给出的:“它是利用电子商务网站向客户提供商品信息和建议,帮 助用户决定应该购买什么产品,模拟销售人员帮助客户完成购买过程”。推荐系统也 称为个性化推荐系统( p e r s o n a l i z e dr e c o m m e n d e rs y s t e m s ) 1 2 】。 北京邮电人学博i :学位论义推荐系统中协同过滤算法若干问题的研究 推荐系统有三个组成要素:推荐候选对象、用户、推荐方法。用户可以向推荐系 统主动提供个人偏好信息或推荐请求,或者用户不提供,而是推荐系统主动采集。推 荐系统可以使用不同的推荐策略进行推荐,如将采集到的个性化信息和对象数据进行 计算得到推荐结果,或者直接基于已建模的知识数据库进行推荐,推荐系统将推荐结 果返回给用户使用【3 1 。 根据推荐对象的特点,目前主要有两种类型的推荐系统,一种是以网页为推荐对 象的搜索系统,主要采用数据挖掘的方法与技术,为用户推荐符合其兴趣爱好的网页, 如g o o g l e 、百度等;另一种是网上购物环境下以商品为推荐对象的个性化推荐系统, 为用户推荐符合兴趣爱好的商品,如书籍、音像等,称这种推荐系统为电子商务个性 化推荐系统( r e c o m m e n d e rs y s t e mi ne c o m m e r c e ) 。 根据个性化程度不同,推荐系统还可以分为非个性化推荐系统( n o n p e r s o n a l i z e d r e c o m m e d a t i o n ) 和个性化推荐( p e r s n a l i z

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论