




已阅读5页,还剩61页未读, 继续免费阅读
(计算机应用技术专业论文)电子商务中个性化信息自主推送技术的研究.pdf.pdf 免费下载
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
k 奋 业夫学硕l 。学位论文 摘要 随着互联网的普及和电子商务的发展,推荐系统逐渐成为电子商务i t 技 术的一个重要研究内容,越来越多地得到研究者的关注。目前,几乎所有大 型的电子商务系统,如a m a z o n ,c d n o w ,e b a y ,当当网上书店等,都不同程 度地使用了各种形式的推荐系统。 本文研究的对象是电子商务推荐系统中的协同过滤推荐方法。最近邻协 同过滤推荐是当前最成功的推荐技术,其基本思想就是基于评分相似的最近 邻居的评分数据向目标用户产生推荐。由于最近邻居对项目( 电子商务中的 商品、电影、音乐等) 的评分与目标用户非常相似,因此目标用户对未评分 项目的评分可以通过最近邻居对该项目评分的加权平均值逼近。 随着电子商务系统规模的进一步扩大,用户数目和项目数据急剧增加, 导致用户评分数据的极端稀疏性,在用户评分数据极端稀疏的情况下,传统 相似性度量方法均存在各自的弊端,使得计算得到的目标用户的最近邻居不 准确,推荐系统的推荐质量急剧下降。针对用户评分数据的极端稀疏性,本 文提出了一种改进的u s e r b a s e d 协同过滤推荐算法,通过计算项目之间的 相似性,初步预测用户对未评分项目的评分,然后采用一种合适的相似性度 量方法计算用户的最近邻居。本文的研究内容主要包括: 1 对不同的电子商务推荐方法及其在电子商务推荐系统中的应用进行 研究和分析。 2 详细研究和分析了传统的协同过滤算法在应用中所面临的问题和挑 战,例如;推荐质量、可扩展性、数据稀疏性、冷开始问题等等,并介绍了 现有的解决方法。 3 结合传统的协同过滤算法的思想,本文提出了一种u s e r b a s e d 协同 过滤推荐算法的改进算法,并设计了测试实验。 4 测试与比较改进算法与传统的协同过滤算法的推荐质量,并解释实验 结果,验证了改进算法的合理性和有效性。 实验结果表明,u s e r b a s e d 协同过滤推荐算法的改进算法可以有效地 解决用户评分数据极端稀疏情况下传统相似性度量方法存在的不足,显著地 提高推荐系统的推荐质量。 关键词:个性化信息;相似性;协同过滤;推荐算法;平均绝对偏差 长春t 业人学坝i 学位论文 a b s t r a c t w i t ht h e p o p u l a r i t y o ft h ei n t e r n e ta n de - c o m m e r c e d e v e l o p m e n t , r e c o m m e n d a t i o ne - c o m m e r c es y s t e mh a sg r a d u a l l yb e c o m ea ni m p o r t a n ti t r e s e a r c h ,a n dg e t sm o r ea n dm o r ea t t e n t i o nf r o mr e s e a r c h e r s c u r r e n t l y , a l m o s t a l ll a r g e s c a l ee c o m m e r c es y s t e m s ,s u c ha sa m a z o n ,c d n o w ,e b a y ,d a n g d a n g o n l i n eb o o k s t o r e sa n ds o o n ,a r ei nv a r i o u ss t a g e so fu s ev a r i o u sf o r m so f r e c o m m e n d a t i o ns y s t e m t h eo b je c tw h i c hi ss t u d i e d b y t h i sa r t i c l ei sc o l l a b o r a t i v e f i l t e r i n g r e c o m m e n d a t i o nm e t h o di nt h ee l e c t r o n i cc o m m e r c er e c o m m e n d a t i o ns y s t e m n e a r e s tn e i g h b o rc o l l a b o r a t i v e f i l t e r i n gt e c h n o l o g yi s t h em o s ts u c c e s s f u l r e c o m m e n d a t i o nt e c h n o l o g yi nc u r r e n t t h eb a s i ci d e ai sb a s e do nt h es i m i l a r r a t i n g sw h i c ht h er e c e n tn e i g h b o rg i v e sr e c o m m e n dd a t at ot a r g e tu s e r s a st h e p r o j e c tr a t i n g so ft h en e a r e s tn e i g h b o r s ( e - c o m m e r c ep r o d u c t s ,m o v i e s ,m u s i c , e t c ) i sv e r ys i m i l a rt ot a r g e tu s e r s ,t h e r e f o r et h er a t i n g sw h i c ht a r g e tu s e r so n p r o j e c tw h i c hh a s n tb e e nr a t e dc a na p p r o a c ht h r o u g ht h en e a r e s tn e i g h b o r st o t h ew e i g h t e da v e r a g er a t i n go ft h i si t e ma p p r o x i m a t i o n w i t ht h ef u r t h e re x p a n s i o no ft h es c a l eo fe - c o m m e r c es y s t e m s ,t h ed r a m a t i c i n c r e a s ei nt h en u m b e ro fc u s t o m e r sa n dp r o j e c td a t al e a d st ot h ee x t r e m e s p a r s i t yr a t i n gd a t a 【1 1 ,u n d e rt h eu s e rr a t i n g sd a t ai se x t r e m e l yr a r e ,t h e t r a d i t i o n a lm e t h o d so fs i m i l a r i t ym e a s u r i n gh a v et h e i rr e s p e c t i v es h o r t c o m i n g s , i tm a k e st h en e a r e s tn e i g h b o r so ft h et a r g e tu s e r si sn o ta c c u r a t et h a tg o tb y c a l c u l a t i n g s ot h er e c o m m e n d a t i o nq u a l i t yo ft h er e c o m m e n d a t i o ns y s t e m d e c l i n ed r a m a t i c a l l y i nv i e wo ft h ee x t r e m e l ys p a r s ed a t au s e r ss c o r e ,t h i sp a p e r p r e s e n t s ai m p r o v e dc o l l a b o r a t i v e f i l t e r i n ga l g o r i t h m o nu s e r b a s e db y c a l c u l a t i n gt h es i m i l a r i t yb e t w e e nt h ep r o j e c t st of o r e c a s tr a t i n g sw h i c ht h e u s e r sd i dn o ts c o r ep r e l i m i n a r i l y t h e nt h ep a p e ra d o p t e da n a p p r o p r i a t e s i m i l a r i t ym e t h o do fm e a s u r i n gt oc a l c u l a t et h en e a r e s tn e i g h b o ra b o u tu s e r s i n t h i sp a p e r ,t h es t u d yi n c l u d e s : 1 t oc a r r yo nr e s e a r c ha n da n a l y s i so nt h ed i f f e r e n te - c o m m e r c er e c o m m e n d m e t h o da n dt h ea p p l i c a t i o ni ne c o m m e r c er e c o m m e n d i n gs y s t e m 2 d e t a i l e dr e s e a r c ha n da n a l y s i st h ee x i s t e dp r o b l e m sa n df a c i n gc h a l l e n g e s w h i c ht h et r a d i t i o n a lc o l l a b o r a t i v ef i l t e r i n ga l g o r i t h mi sa p p l i e dt o ,f o re x a m p l e , 长春工业大学形! i 。学位论文 r e c o m m e n d e dq u a l i t y ,s c a l a b i l i t y ,d a t a s p a r s e ,c o l ds t a r t a n ds oo n ,a n d i n t r o d u c et h ec u r r e n te x i s t i n gs o l u t i o n s 3 c o m b i n i n gt h et r a d i t i o n a lc o l l a b o r a t i v ef i l t e r i n ga l g o r i t h m ,t h i sp a p e r p r e s e n t sa ni m p r o v e du s e r b a s e dc o l l a b o r a t i v ef i l t e r i n gr e c o m m e n d e da l g o r i t h m , a n dd e s i g n e dat e s t i n gl a b o r a t o r y 4 t e s ta n dc o m p a r ew i t ht h er e c o m m e n d a t i o nq u a l i t yb e t w e e nt h ei m p r o v e d a l g o r i t h m a n dt h et r a d i t i o n a lc o l l a b o r a t i v ef i l t e r i n ga l g o r i t h m ,m e a n w h i l e , e x p l a i nt h ee x p e r i m e n tr e s u l t s ,v e r i f yt h el e g i t i m a c ya n de f f e c t i v e n e s so ft h e i m p r o v e da l g o r i t h m t h ee x p e r i m e n t a lr e s u l t ss h o wt h a tt h ei m p r o v e du s e r b a s e dc o l l a b o r a t i v e f i l t e r i n gr e c o m m e n d e da l g o r i t h mc a ne f f e c t i v e l yr e s o l v et h ed e f i c i e n c i e sw h i c h t h et r a d i t i o n a ls i m i l a rm e t h o do fm e a s u r i n ge x i s ti nu s e rr a t i n gd a t as p a r s e e x t r e m ec i r c u m s t a n c e si no r d e rt oi m p r o v et h er e c o m m e n d a t i o nq u a l i t yo ft h e r e c o m m e n d a t i o ns y s t e ms i g n i f i c a n t l y k e yw o r d s :p e r s o n a l i z e di n f o r m a t i o n ;s i m i l a r i t y ;c o l l a b o r a t i v ef i l t e r i n g ; r e c o m m e n d a t i o na l g o r i t h m ;t h ea v e r a g ea b s o l u t ed e v i a t i o n 长存t 业人学顾t 学位论史 学位论文原创性声明 本人郑重声明:所呈交学位论文,是本人在指导教师的指导下,独立进 行研究工作所取得的成果。除文中已经注明引用的内容外,本论文不包含任 何其他个人或集体已经发表或撰写过的作品成果。对本文的研究做出重要贡 献的个人和集体,均已在文中以明确方式标明。本人完全意识到本声明的法 律结果由本人承担。 学位论文作者签名:取豫胡涉 e t 期: 加口7 年;月;7 日。 6 l k 备t 业大学硕f + 学位论史 引言 i n t e r n e t 的迅猛发展将人类带入了信息社会和网络经济时代,对企业发 展和个人生活都产生了深刻的影响。一方面,基于i n t e r n e t 的虚拟企业不 再需要像传统的物理环境下企业那样的实体投资,企业与顾客、供应商等建 立起更直接的联系,电子商务模式为企业发展提供了更多的机会;同时, i n t e r n e t 的发展正在极大地改变我们每个人的生活,人们不出家门就可随心 所欲地得到自己想要的商品,网上购物的经历让我们感受到电子商务带来的 惊喜。据统计,到2 0 0 5 年,中国电子商务交易总额达到6 2 0 0 亿元。事实上, 电子商务的应用远没有挖掘出来,其中固然有硬件设施滞后、用户观念未改 变的原因,但更多的是企业服务不到位。电子商务的发展模式对企业服务提 出了许多新要求,包括商品的质量保证、送货及时、商品选购舒适、退货方 便等,其中,最为突出的问题就是商品选购。由于供应链和物流的发展,在 电子商务的虚拟环境下,商家能够在网上提供的商品种类和数量非常多,但 用户不可能通过一个小小的计算机屏幕很方便地发现自己感兴趣的商品,用 户既不愿意花太多时间在漫无边际的网上寻找商品,也不可能像在物理环境 下那样检查商品的质量。因此,需要商家提供一些智能化的选购指导,根据 用户的兴趣爱好推荐用户可能感兴趣或是满意的商品,使用户能够很方便地 得到自己所需要得到的商品。而且,从现实经验来看,用户的需求经常是不 明确的、模糊的,可能会对某类商品有着潜在的需求,但并不清楚什么商品 能满足自己的模糊需求。这时,如果商家能够把满足用户模糊需求的商品推 荐给用户,就可以把用户的潜在需求转化为现实的需求,从而提高产品的销 售量。 现代社会的竞争趋势要求对因特网上大量出现和产生的信息进行实时 和深层次的分析,虽然可借助于强大的搜索引擎和搜索技术,但用户在分析 和使用这些信息时仍然面临许多困难。同时基于w w w 的w e b 站点设计、w e b 服务设计、w e b 站点导航设计以及s e r v i c e 工作也正变得越来越复杂和繁重。 解决这些问题可通过利用个性化技术,将传统的数据挖掘( d a t am i n i n g ) 同 w e b 结合起来,进行w e b 挖掘,即从w e b 文档和w e b 活动中抽取用户感兴趣 的潜在的有用模式和隐藏的信息。利用这些模式和信息为用户提供一对一的 具备自适应性的智能个性化服务。 目前w e b 系统为所有用户提供相同的服务。其典型的服务方式为通过建 立一个w e b 站点来向所有用户发布相同的信息。然而w e b 用户的需求千差万 别,我们不可能奢望几千万的用户具有相同的需求。因此,用户希望w e b 系 k 春t 业人学城 一学位论文 统能够根据他们特性的不同提供个性化的服务。事实上,针对用户特性并向 用户提供个性化服务已经成为w e b 技术的一个研究热点。 目前,通过w e b 进行电子商务活动带来的便利以及所产生的交易速度已 成为电子商务快速发展的关键推动力。与此同时,涉及客户端的电子商务活 动也正在进行着巨大的革新。如果能够跟踪发生在w e b 上的浏览行为并进行 模式分析,这样将缩短销售商与客户之间的距离,让销售商更了解自己客户 的需求,有锁定性地开展电子商务活动,实现个性化服务,将会更大程度地 提升企业的经济效益和竞争力,使企业长期、持续地发展。 在这种背景下,推荐系统( r e c o m m e n d e rs y s t e m s ) 应运而生,它是根据 用户的兴趣爱好,推荐符合用户兴趣爱好的对象,也称个性化推荐系统 ( p e r s o n a l iz e dr e c o m m e n d e rs y s t e m s ) 。根据推荐对象的特点,目前主要有 两种类型的推荐系统,一种是以网页为推荐对象的搜索系统,主要采用w e b 数据挖掘的方法与技术,为用户推荐符合其兴趣爱好的网页,如g o 0 9 1 e 等; 另一种是网上购物环境下、以商品为推荐对象的个性化推荐系统,为用户推 荐符合兴趣爱好的商品,如书籍、音像等,称这种推荐系统为电子商务个性 化推荐系统,简称电子商务推荐系统( r e c o m m e n d e rs y s t e mi ne - c o m m e r c e ) 。 长春t 业人学够! f :学位论文 第一章绪论 个性化信息服务是未来信息服务的主流模式,它实现的是“信息找人, 按需服务”。其实现途径就是通过对用户信息需要、兴趣爱好和访问历史的 收集分析,建立用户模型,并将用户模型应用于网上信息的过滤和排序,从 而指导用户的浏览过程和信息检索,或向用户主动推送信息。个性化信息服 务系统可能是一个具有智能的w e b 工具,也可能是个性化的网站、个性化信 息代理。用户的个性化模型适于应用于电子商务的个性化服务中。具有智能 的w e b 工具被用来帮助用户检索、定位和管理w e b 文档。智能水平高的w e b 工具,能学习产生用户模型,并能使用用户模型进行推理,对用户和信息源 的行为进行学习。站点的个性化就是针对特定的用户建立相应的w e b 内容和 应用。这就要收集和存储站点访问者的信息,并分析这些信息,在此基础上, 向每一个访问者在恰当的时间传送恰当的信息,即个性化地发布新闻、推荐 文档、提供建议、发送w e b 信息、播送广告、推销产品等。 总之,i n t e r n e t 上的个性化信息服务系统必须具有三个能力,即用户模 型要能很好地反映用户的兴趣偏好;为适应用户偏好的变化,用户模型要能 做适应性的改变;自动开发新的信息领域,主动向用户提供推荐服务。 国内外关于个性化信息服务的相关研究很多,而且个性化的研究是和人 工智能及其主体、多主体系统( m a s ) 的研究及数据开采的研究相结合的, 现有不少成功的系统。 1 1 个性化信息概述 个性化信息推送技术的实现需要借助w e b 挖掘来进行,个性化w e b 站点 的研究与存在的问题日益注重对消费者个性和消费过程的智能化的研究。如 何更有效地从纷繁复杂且呈指数级不断增长的网页中挖掘并推荐适合消费 者个性的信息和知识一直是w e b 个性化服务理论和技术研究的重点。 1 1 1 个性化信息研究中存在的问题 许多研究者提出了各种解决方法,m y y a h o o 和p m i n e r 是基于服务器端日 志挖掘关联规则的,卡耐基一梅隆大学( c m u ) 的p w w 和m i t 的l e t i z i a 等是具 有导游功能的智能浏览器原型,但实现真正的个性化推荐是项复杂的工作, 目前的研究还存在许多问题1 。 1 ) 服务器端实现个性化信息挖掘需要解决i p 识别问题。借助用户注册 王奋工业人学俩i 学位论史 或跟踪i p 地址对未注册或通过代理上网用户无法识别;服务器资源开销大。 2 ) 将w e b 日志文件f t p 到客户端进行挖掘或用修改过的浏览器软件虽避 开了服务器资源占用过多等问题,但也带来了网络带宽限制,浏览主题提取, 模型的建立等新的困难。 3 ) 对消费者下一步的消费行为不能实现在线预测,不同消费者的消费目 标,同一消费者在不同阶段的不同消费要求,使得预先设计好的w e b 站点难 以顾及全部消费者及其兴趣特征,固定的浏览路径常使得为获取少量的信息 而不得不付出较大的代价。 4 ) 无法对消费者可能访问的页面集进行推荐,不能实现个性化,造成了 网络繁忙时时延,以及消费者时间和经济上的开销增加。 1 1 2 基于w e b 日志挖掘和个性化推荐的可行性及困难 统计表明,不同消费者对w e b 页面的访问是有历史性和相对集中规律性 的。 1 ) 一段时间内的消费者,其兴趣具有一致性。 2 ) 在页面上的停留时间与该页面是辅助页面还是内容页面相关。 3 ) 访问主题改变时,才会访问历史页面,以跳转到其它页面。 4 ) 一次访问的时间一般不会超过一个最大的限制一一时间窗口。 5 ) 上述访问信息、引用信息、代理信息等遵循w 3 c 标准n 1 ,均被记录在 服务器日志文件中。服务器日志文件是结构化的数据,通过传统的挖掘技术, 对其分析,可发现消费群普遍的访问和个体的兴趣访问模式,并据此可以为 用户定制合适的推荐页面,或改进站点结构,因而向消费者提供个性化服务 是可能的且是有效的1 。 但由于下列一些因素的影响,使得服务器日志常不能精确地记录用户的 所有请求,导致w e b 日志不准确的因素有以下几个方面。 1 ) 本地c a c h e 的影响。当用户点击b a c k 时,为减少数据传输量,浏览 器会就近访问c a c h e 页面缓存,如有,检查对应w e b 服务器上页面是否更新, 若没有,直接c a c h e 出该页,否则,从服务器g e t 页面,同时日志记录本次 请求。 2 ) 代理服务器的设置。为用户提供了中间缓存,减少了网页下载时间, 但也带来了以下问题 ( 1 ) 由于缓存w e b 服务器请求过的所有页面,这些页面可直接下传给多 个通过代理发出w e b 请求用户,会导致多个用户的多次请求没有被日志记录 下来。 2 k 备t 业人学坝l 。学位论文 ( 2 ) 内网中多个不同i p 地址的消费者通过代理进行w e b 请求时,日志中 记录的是相同的代理i p 地址。 3 ) 防火墙的影响。许多企业出于安全的考虑,为内网设置了防火墙。内 网上不同的w e b 请求在服务器的日志中记录的都是相同的防火墙地址。 因此,直接挖掘并不能反映和预测用户的实际浏览行为。故挖掘前须做 数据准备和除噪工作“”。 1 2 个性化服务方式 在网络环境下,个性化服务是一种网络信息服务的方式,这种服务方式 的实现主要是根据用户的设定,借助于计算机及网络技术,对信息资源进行 收集、整理和分类,向用户提供和推荐相关信息,以满足用户对信息的需求。 开展图书馆网络个性化服务是提高图书馆信息服务质量和信息资源使用效 益的重要手段,突出了信息服务的主动性,开拓了图书馆信息服务的新思路。 从整体上说,个性化服务打破了传统的以馆藏资源为主的被动文献服务模 式,能够充分利用网络资源的优势和各种软件支持,主动开展以满足用户个 性化需求为目的的全方位服务。 目前,个性化服务的方式可归纳为如下七种: 1 信息分类定制服务方式 分类定制是指信息用户可以按照自己的目的和需求,在某一特定的系统 功能和服务形式中,自己设定信息的资源类型、表现形式,选取特定的系统 服务功能等。通过分类定制,用户每次登录网站时,只要键入自己的账户名 与密码,服务器根据用户数据库将查询结果主动递送给信息用户,并利用动 态网页自动生成用户定制的动态页面。 2 信息推送服务方式 信息推送服务是运用推送技术( p u s ht e c h n o l o g y ) 来实现的一种个性 化主动信息服务方式。推送技术又称“w e b 广播”,它是通过一定的标准和 协议,在i n t e r n e t 上按照用户的需求,定期主动传送用户需要的信息的一 项计算机技术。 3 信息智能代理服务方式 用户在检索信息时,有时很难清楚地知道自己的兴趣爱好和需求,或者 用户知道自己的兴趣和需求,但却不知道如何贴切地表达出来,分类定制的 方法让用户填写兴趣表单有时会使用户不知所措。智能代理技术的运用很好 地满足了用户的这一需要,它是一种能够完成委托任务的智能计算机系统, 能模仿人的行为执行一定的任务,不需要或很少需要用户的干预和指导。智 k 备t 业人学仍! i 。学位论史 能代理通过跟踪用户在信息空间中的活动,自动捕捉用户的兴趣爱好,主动 搜索可能引起用户兴趣的信息并提供给用户。 4 信息垂直门户服务方式 随着网络信息资源的急剧增长,数字图书馆网站上基于个人特定需求的 信息深度越来越低,消化吸收越来越难,利用搜索引擎和综合性门户网站很 难满足用户系统地获取专业相关信息的需求。垂直门户是和综合性门户及水 平门户相对应的概念,它通过汇聚网上某一特定专题信息资源并对其进行挖 掘及加工,以满足用户基于专业的深入的信息需求。如中国化工网、中国医 药信息网、中国工程技术信息等。 5 信息帮助检索服务方式 如何帮助用户进行高效的信息搜索也是当今数字图书馆信息服务向纵 深发展的一个重要内容,也就是向用户提供满足各种个性化需求的服务。系 统应该可以用来帮助用户修改检索提问式。如当用户输入了一个检索词,系 统就会将检索词与内部词表中相关词进行比较,并在界面上显示各种与该词 有逻辑关联性的词组,以供用户选择。这样可以通过帮助用户选择更接近自 己检索目标的检索词来提高信息查询效率。 6 数据挖掘服务方式 数据挖掘也称知识发现,是从数据库中获取人们感兴趣的知识,这些知 识是隐含的、潜在的。数字图书馆的数据挖掘是从数字图书馆大型数据库、 数据仓库和浩瀚的网络信息空间中发现并提取隐藏在其中的信息,目的是帮 助信息用户( 决策者) 寻找数据间潜在的关联,发现被忽略的要素,而这些 信息对预测趋势和决策行为也许是十分有用的。 7 信息呼叫中心服务方式 信息呼叫中心是一种新近发展起来的专门提供一对一的用户个性化信 息服务系统,在企业界有着广泛的应用。信息呼叫中心由最初的电话中心发 展而来,这种电话中心主要利用电话、传真等方式来服务客户,处理简单的 呼叫流程。数字图书馆呼叫中心引入客户关系管理( c r m ) ,建立客户数据 库,对信息统计分析、处理、采集和提炼,使呼叫中心可以得到每一个客户 的详细信息,如过去交往记录、客户爱好等,由此为客户提供一对一的个性 化服务。 1 3 国外个性化信息推送技术的应用状况 目前国外有好多关于电子商务网站管理及个性化服务方面的研究。比 如,美国的亚马逊书城,根据用户的偏好进行相应记录,以便日后进行其他 4 长春t 业人学倾f 。学位论上 产品的自主推送。又如,美电子商务网站为用户提供个性化客户服务,即某 些互联网电话公司开始着手为用户提供个性化电话服务,让销售代表通过电 话帮助用户解决上网购物过程中遇到的技术困难,从而在顾客心中树立良好 的公司形象。再如,i b m 客户个性化网站,是i b m 出资专门为特定客户创建 的个性化专用网站或电子商务项目,实现对客户一对一的7 2 4 小时网络客 户关系服务( e r e l a t i o n s h i p ) ,并提供一站式的在线产品信息、采购、培训 和技术支持等服务,是i b m 运用互联网技术和供应链管理优化大客户与i b m 之间的业务流程的郑重承诺。 s m a r t p u s h 系统根据用户的个性信息向用户递送电子数据,这些数据是 由芬兰一家大报纸提供的。 w e b w a c h e r 是一个非常著名的导航器,它使用一个称为信息查找助理的 主体,导航用户在网上的浏览过程。该系统通过对用户选择“链路”或站点 进行跟踪学习,学习产生哪一超链接是可能到达目标信息的知识,通过采用 这些知识来帮助用户定位希望的信息,改善导航质量。 a 1 e x a ( w w w a l e x a c o m ,w w w a l e x a t o m s u p p o r t t e c h n 0 1 0 9 y h t m l ) 系 统收集用户的使用方式,作为对站点的质量评估的原始资料,以此为基础, 来决定相关的链接,提供推荐服务。 l e t i z a 系统用于在用户浏览时向用户建议用户可能感兴趣的链接,这些 链接与用户当前访问的页面内容有关。 p r o f u s i o np e r s o n a la s s is r a n t 是一个信息过滤工具,它使用用户明确 的相关度反馈决定用户感兴趣的领域,以此为据,将元搜索引擎p r o f u s i o n 返回的结果进行过滤,决定哪些结果提交给用户,哪些抛弃。 案例1 - - - - d e l l 公司: 满足个性化需求在电子商务活动中的成功者一定得谈谈p c 零售业的巨 头- - - - d e l l 公司。d e l l 公司是由其创始人m i c h a e ld e l l 于1 9 8 3 年在其德 克萨斯州的大学宿舍创办的,现在d e l l 公司年销售额可达1 8 0 亿美元,其 p c 机的销售量已经超过了老牌的电脑巨人i b m 、h e w l e t t - p a c k a r d 和c o m p a q 。 d e l l 公司之所以取得如此大的成就,与其独特的经营模式是分不开的。电脑 销售,一般是通过代理商进行的,而d e l l 公司却采取一种直销模式即“按 用户订单装配电脑”的模式。用户可以通过电话和互联网将自己所需的电脑 组合、配置、型号等资料告知d e l l 公司,d e l l 公司就按用户的要求定制出 用户所需的电脑,从客户订货到送货时间不超过3 6 小时。此外,d e l l 公司 还为其最好的客户创建了1 5 0 0 个个性化主页,使得他们可以直接获得公司 长存t 业大学坝t 学位论文 的许多信息资料。d e l l 的个人电脑单机销售额年增长率为7 0 以上,远远超 过整个行业的平均增长率( 1 1 ) 。 案例2 一一a m a z o n 网上书店: 如果说是d e l l 把一个新兴的科技产业带入了个性化的大潮的话,那么 就可以说是a m a z o n 把一个承续上千年的书籍销售也带入了这场大潮。 a m a z o n 是一个虚拟的网上书店,它没有自己的店面,而是在网上进行在 线销售。它提供高质量的综合节目数据库和检索系统,用户可以在网上查询 有关图书的信息。如果用户认为需要购买的话,可以把选择的书放在虚拟购 书篮,最后查看购书篮中的商品,选择合适的服务方式并提交订单,那么读 者所选购的书在几天后就可以送到家门上了。a m a z o n 书店还提供了完善的售 后服务,例如,读者可以在拿到实品的3 0 天内,将完好无损的书和m u s i c 退 回a m a z o n 。a m a z o n 将原价退款。当然a m a z o n 的成功还不止源于此,如果一 位顾客在a m a z o n c o m 购买一本书,下次他再次访问,映入眼帘的首先是这 顾客的名字和欢迎的字样:a m a z o n 使用推荐软件对他曾经购买过的书以及该 读者对其他书的评价进行分析后,将向读者推荐他可能喜欢的新书,只要用 鼠标点一下,就可以买到该书了;a m a z o n 能对顾客购买过的东西进行自动分 析,然后因人而异地提出合适的建议。读者的信息将被再次保存。这样顾客 下次来时就能更容易买到想要的书。 1 4 国内个性化信息推送技术的应用状况 如果说d e l l 和a m a z o n c o m 毕竟是销售有形的商品的话,那么前程无 忧网就是地地道道的“人贩子”了。因为人人都是不同的,那么这个“人贩 子”的生意就是彻彻底底的个性化,为买家量身订做的了。 前程无忧网目前是业内公认的最大招聘网站,就北京地区而言,其网站 收入占据了总收入的5 0 以上;他们的另一块王牌就是前程周刊,这份由前 程无忧自办的报纸在武汉、西安、成都等内地城市有很大的影响力。其实, 前程无忧所做的很简单,人才来找它,用人单位也来找它,它只要把各方面 的资料整合后再搬上平台,本来没什么可个性的,但因人才这种特殊的商品, 使得前程无忧网在个性化服务方面就更加前程无忧了。 由以上三个案例可以看出成功的个性化服务的电子商务化企业,无不是 在其组织结构和产品组成上具有极强的敏捷性,要想在电子商务个性化的舞 台上有施展空间的话,除了应意识到满足个性化需求的趋势外,更应该理解 满足个性化的动因和必然性,及其实现个性化的手段与技术。 个性化信息推送服务系统在国内外高校图书馆有所应用。清华推出国内 6 k 奋工业人学坝i 擘位论文 首个个性化信息系统。2 0 0 4 年4 月2 1 同,在桂林召开的“建设服务主导型 数字图书馆,打造信息服务星级品质主题研讨会”上,清华同方光盘股份有 限公司正式发布了自主研发的t p l 个性化信息服务系统和t p i 数字参考咨询 系统2 0 。这两个新品以其领先的技术、完善的功能和优异的行业应用性获 得了与会图书情报界专家、学者的一致信赖和认可。 t p l 个性化信息服务系统集成了世界上最先进的以用户为中心的智能代 理技术、个性化定制技术、信息推送技术等相关支持个性化信息服务的技术, 全面满足信息用户对于深层次、多元化复杂知识信息的需要,并真正实现了 信息服务的主动性。据专家介绍,信息服务机构在经过一段时期的信息资源 建设后,怎样提升服务质量和创新服务模式已成为业界关注的焦点,清华同 方光盘股份有限公司作为信息服务的旗舰企业,在信息服务平台软件技术上 一直保持国内领先的地位,最新推出的这两个信息服务平台软件产品将助力 于专业信息服务机构开展以信息用户为中心的多样化、个性化、深层次的信 息服务。 目前,国内在推荐技术方面研究较多的是基于内容的推荐,典型的如各 种搜索引擎的研究,但在个性化推荐和自动化推荐方面的理论研究几乎处于 空白,以关键词“推荐系统个性化推荐”在中国期刊网上搜索,只能发现 极少数与此相关的文章,严重影响了个性化推荐技术在我国的应用。为此, 对国内各电子商务个性化推荐的应用情况进行了调查。为方便比较,选择了 国内四个在书籍方面有影响的电子商务网站,并和国外著名电子商务网站 a m a z o n 进行了比较分析。从分析结果来看,国内主要使用的推荐策略有:分 类浏览,按商品类别进行逐层次的查找;基于关键词的搜索,对要查找内容 的关键词进行搜索;流行推荐,推荐最畅销的商品;基于某一商品的推荐, 推荐与该商品有关的商品;信函式推荐,系统下线以e m a i l 形式回答用户 要查找的商品。各电子商务网站所采用的推荐技术如表1 1 所示。 表1 1国内外电子商务网站推荐策略比较 超星中国 当当网新浪亚马逊 相关的推荐方法 数字数字 上书店商城书店 图书馆图书馆 分类浏览 + 内容搜索 + 销售最好流行的商品 + + + 个性化推荐 7 长存_ t 业人学坝l 学位论文 最近的浏览历史 + 编辑修改_ 嘲户的评价资料 折扣最大的 + 新书推荐 + 通过下线信函推荐 书的基本信息 + 详细信息 + 基 让用户给出描述性评价 + 于 用户给出等级评价 + 本查看其他用户的评价 + 书 的 促销信息 + 推 买过此商品又购买过的 + 荐 按主题寻找相似书链接 + + 购买过该作者作品的 + 还买过以下作者作品的 从表1 1 可以看出,与a m a z o n 相比,国内电子商务网站的推荐存在以 下问题:缺乏个性化的推荐,不能根据不同用户的兴趣爱好给出不同的产品 推荐;推荐的自动化程度低,由于所采用的推荐技术主要是基于内容的搜索 和分类浏览技术,用户想要得到相关的信息,必须输入搜索的关键词或是按 商品的所属类别逐层查找;推荐的持久性程度低,国内绝大多数电子商务网 站给出的推荐都是基于用户一次登录得到的,不能收集用户每次浏览网页时 给出的兴趣偏好信息,并据此信息对用户做出个性化的推荐;推荐方法单一, 大多数电子商务网站基本都是采用分类浏览和基于内容的检索;不能在线推 荐。 上述比较表明,我国电子商务网站并没有采用真正意义上的个性化推荐 技术,所使用的仅仅是一些查找技术,这些技术的个性化程度和自动化程度 都很低,表明我国个性化推荐技术的应用还处于低水平或空白阶段。 1 5 本文主要研究内容 本文研究的对象是电子商务推荐系统中的协同过滤推荐方法。针对电子 商务推荐系统面临的主要挑战,对电子商务推荐系统中协同过滤推荐算法进 行了探索和研究。本文的研究内容主要包括: 1 ) 对不同的电子商务推荐方法及其在电子商务推荐系统中的应用进行 k 备t 业人学坝j + 学位论文 研究和分析。 2 ) 详细研究和分析了传统的协同过滤算法在应用中所面临的问题和挑 战,例如:推荐质量、可扩展性、数据稀疏性、冷开始问题等等。 3 ) 结合传统的协同过滤算法的思想,本文提出了一种u s e r b a s e d 协 同过滤推荐算法的改进算法,并设计了测试实验。 本文主要研究成果是提出了u s e r - b a s e d 协同过滤算法的改进算法: 1 ) 算法利用选择的相似性度量方法离线预计算项目之间的相似度与项 目最近邻居,结果保存于数据库中。 2 ) 利用传统的u s e r - b a s e d 协同过滤算法形成邻居,在这一步骤中, 计算用户间相似度时需要计算两个用户评分集合的并集,在并集中如果用户 对某个项目未评分,则利用已经预计算的存于数据库中的项目相似度及项目 最近邻居来预测用户对该项目的评分,然后计算用户的相似度,形成用户的 最近邻居集合。 3 ) 最后,利用用户的最近邻居集合,预测对每个项目的评分,产生推 荐给目标用户。 最后,本文设计了测试实验,实验实现了u s e r b a s e d 协同过滤推荐算 法、i t e m - b a s e d 协同过滤推荐算法与改进的u s e r - b a s e d 协同过滤推荐算 法。测试与比较改进算法与传统的协同过滤算法的推荐质量,并解释实验结 果,验证了改进算法的合理性和有效性,从而可以有效解决用户评分数据极 端稀疏情况下传统协同过滤推荐方法存在的不足,有效地提高了电子商务推 荐算法的推荐质量。 9 长备t 业,:学形! i 。学位论文 第二章电子商务个性化推荐系统 目前,推荐系统已经运用到多个行业中,推荐对象包括书籍、音像、网 页、文章、新闻等,如表2 1 。大多数的推荐系统主要应用在电子商务和w e b 中,其中已应用到商业中的推荐系统主要有电子商务、电影和音乐等领域。 这反映推荐系统想要运用到商业中,必须能够为用户提供一个确实有价值的 推荐功能,从而为商业企业带来一定的经济价值。 表2 i 主要推荐系统一览表 领域推荐系统 电子 a m a z o n c o m ,e b a y ,l e v i s ,s k i e u r o p e c o m 商务 f a b ,f o x t r o t 。i f w e b ,m e m o i r ,m e t i o r e w ,p r o f b u i l d e r ,q u i c ,q u i c k s t e p , 网页 r 2 p ,s i t e s e e r s u r f l e n 音乐c d n o w ,c o c o a ,r i n g o 电影 m o v i e f i n d e r c o l l l ,m o v i e l e n s ,r e e l c o m 新闻 g r o u p l e n s ,p h o a k s ,p t a n g o 过滤 2 1 电子商务推荐系统简介 2 1 1 电子商务推荐系统的概念 电子商务推荐系统( r e c o m m e n d e rs y s t e m ) 的定义是r e s n i c k v a r i a n 在1 9 9 7 年给出的:“利用电子商务网站向客户提供商品信息和建议,帮助用 户决定应该购买什么产品,模拟销售人员帮助客户完成购买过程”1 。该定 义现已被广泛引用。1 9 9 8 年7 月,由美国a a a i 组织各学者在威斯康辛州专
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
评论
0/150
提交评论