(管理科学与工程专业论文)基于神经网络的电子商务个性化推荐系统研究.pdf_第1页
(管理科学与工程专业论文)基于神经网络的电子商务个性化推荐系统研究.pdf_第2页
(管理科学与工程专业论文)基于神经网络的电子商务个性化推荐系统研究.pdf_第3页
(管理科学与工程专业论文)基于神经网络的电子商务个性化推荐系统研究.pdf_第4页
全文预览已结束

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

摘要 随着计算机技术与网络技术的快速发展,互联网成为了人们日常生活中必不 可少的工具。电子商务因其成本低廉、方便快捷、不受时空限制等特点而以令人 难以置信的速度蓬勃兴起,基于互联网的商业w | e b 站点结构也变得更加复杂, 用户经常会迷失在大量的商品信息空间中,无法顺利找到自己需要的商品。怎样 在电子虚拟世界中有效的提高产品的吸引力,使企业尽可能获得更多的效益? 怎 样让用户在成百上万的商品中,选择到自己满意的商品? 电子商务推荐系统应运 而生,成为解决这些“信息超载 问题最有效的工具之一。电子商务推荐系统通 过模拟商店销售人员,分析用户的购买动机,主动向用户推荐商品,帮助用户找 到所需商品,从而顺利的完成购买过程。因此,电子商务个性化推荐系统有着强 烈的应用需求,具有非常高的研究价值。 本文梳理并分析了电子商务推荐系统的研究内容与研究热点,创造性地提出 了用户空间兴趣与时间兴趣的概念,并基于人工神经网络对用户的综合兴趣进行 建模。协同过滤是个性化推荐技术中应用最为成功的技术之一,但由于推荐系统 本身和客观环境要求的不断提高,协同过滤技术也面临了许多挑战。本文针对传 统协同过滤的稀疏性、用户兴趣本身的时间动态性,提出了一种采用人工神经网 络的方法进行修正,并进行了对比实验。实验结果表明,该方法的推荐质量比传 统的协同过滤方法有所改善。主要研究工作如下: ( 1 ) 详细综述电子商务个性化推荐下系统的研究现状,并重点对用户兴趣 建模技术进行归纳总结,在此基础上,提出了一个综合用户空间兴趣和用户时间 兴趣的用户兴趣时空模型。 ( 2 ) 从空间角度研究用户兴趣,在传统协同过滤技术的基础上,提出了一 种基于b p 神经网络的最近邻用户集构建方法,在一定程度上缓解了评分矩阵稀 疏性对系统推荐质量的影响。 ( 3 ) 从时间角度研究用户兴趣,详细论述了用户兴趣的动态性,并提出了 时间窗口和时间片的概念,试图解释用户兴趣纵向规律。 最后,本文进行了相关实验及分析,结果表明,本文提出的基于神经网络的 方法能够在一定程度上提高系统的推荐质量,更好地反映用户的兴趣。 关键词:电子商务个性化推荐、协同过滤、邻居用户、人工神经网络 a b s t r a c t w i t ht h er a p i dd e v e l o p m e n to fc o m p u t e rt e c h n o l o g ya n d t h en e t w o r kt e c h n o l o g y , t h ei n t e m e th a sb e c o m ed i s p e n s a b l et op e o p l e sd a i l yl i v e s h o w e v e r ,e 。c o m m e r c e l s b u r g e o n i n gw i t hi n c r e d i b l es p e e d b e c a u s eo fi t sl o w - c o s t ,c o n v e m e n t ,f r e et i o m c o n 咖i n t so ft i m ea n ds p a c e ,a n do t h e ra d v a n t a g e s ,t h ec o m m e r c ew e b s i t eb a s e do n i n t e m e th a sa l s ob e c o m em o r ec o m p l e x ,a n du s e r s a reo f t e nl o s ti nah u g ei n f o r m a t i o n s p a c eo fg o o d s ,a n di t sh a r d t of i n dt h eg o o d st h e yr e a l l yn e e d h o wt oe n h a n c et h ea t t r a c t i v e n e s so ft h eb u s i n e s sa sm u c ha sp o s s i b l ei n t h e v i r t u a lw o r l d ? h o wt oh e l pp e o p l ec h o o s et h e i rw a n t e dg o o d sw i t hm o r es a t i s f a c t i o n ? r e c o m m e n ( i a t i o ns y s t e mo ne c o m m e r c ec a l t l ei n t ob e i n g i tc a ne f f e c t i v e l ys o l v e t h o s e ”i n f o m a t i o no v e r l o a d ”p r o b l e m s r e c o m m e n d a t i o ns y s t e ma n a l y z e st h eu s e r s m o t i v a t i o no fp u r c h a s i n g ,a n dh e l p su s e r st of i n dt h ev e r yg o o d sj u s tl i k es h o p p i n g a s s i s t a i l t a sar e s u l t ,p e r s o n a l i z e dr e c o m m e n d a t i o ns y s t e mo ne - c o m m e r c eh a sa s t r o n gd e m a n df o ra p p l i c a t i o n sw i t hv e r yh i g hr e s e a r c hv a l u e t h ep a p e ra n a l y z e dt h er e s e a r c hc o n t e n to ft h er e c o m m e n d a t i o ns y s t e mo n e c o m m e r c ei nd e t a i l s ,a n dp u tf o r w a r dt w oc o n c e p t ss a y i n gt i m e 。i n t e r e s t a n d s p a c e i n t e r e s t ,a n dm o d e l e df o ru s e r s i n t e r e s t sb a s e d o nt h ea r t i f i c i a ln e u r a ln e t w o r k c 0 1 1 a b o r a t i v ef i l t e r i n g i so n eo ft h em o s ts u c c e s s f u lt e c h n o l o g i e s i nt h e r e c o m m e n d a t i o ns y s t e m s ;h o w e v e r , i ta l s oh a sm a n yc h a l l e n g e sb e c a u s eo f t h em u c h m o r er e q u i r e m e n t si nr e c o m m e n d a t i o ns y s t e mi t s e l fa n dt h ee n v i r o n m e n t t r y i n gt o i m p r o v et h er e c o m m e n d a t i o nq u a l i t y ,t h ep a p e rp r o p o s e d a na p p r o a c ht a k i n gt h e a r t i f i c i a ln e u r a ln e 咖r ki n ,a n dm a d eac o m p a r i s o nt e s t t h er e s u l t ss h o wt h a tt h e m e t h o dd o s e si m p r o v et h er e c o m m e n d a t i o nq u a l i t y t h em a i nr e s e a r c hw o r k sa r ea s f o l l o w s : ( 1 ) s u m m a r yd e t a i l e dt h ep e r s o n a l i z e dr e c o m m e n d a t i o ns y s t e m o ne - c o m m e r c e , w i t ha ne m p h a s i so nm o d e l i n gt e c h n o l o g yo fu s e ri n t e r e s t a n dac o m p r e h e n s i v e u s e r i n t e r e s t sm o d e lc o m b i n e di ns p a c ea n dt i m ei sm a d e ( 2 ) f r o mt h ep e r s p e c t i v eo fs p a c e ,am o d e l i n gm e t h o do f n e i g h b o ru s e r sb a s e do n b pn e u r a ln e t w o r ki sp r o p o s e d t oac e r t a i ne x t e n t ,i tc a n e a s e dt h el o wq u a l i t yo ft h e r e c o m m e n d a t i o ns y s t e mc a u s e db yt h es p a r s es c o r em a t r i x ( 3 ) f r o mt h ep e r s p e c t i v eo ft i m e ,t h ep a p e ra n a l y z e dt h ed y n a m i c u s e r si n t e r e s t i nd e t a i l s a n dt h e ni n t r o d u c e dt h et i m ew i n d o wa n dt i m e c h i pc o n c e p t st oe x p l a i n t h e v e r t i c a ll a wo fu s e ri n t e r e s t 2 f i n a l l y ,t h ep a p e rc a r r i e do u tt h er e l e v a n te x p e r i m e n t sa n dm a d es o m ea n a l y s i s t h er e s u l t ss h o wt h a tt h ep r o p o s e d a p p r o a c hb a s e do nt h en e u r a ln e t w o r km a y i m p r o v et h eq u a l i t yo ft h er e c o m m e n d a t i o ns y s t e mt oac e r t a i ne x t e n t k e y w o r d s :p e r s o n a l i z e dr e c o m m e n d a t i o ns y s t e mo ne - c o m m e r c e , c o l l a b o r a t i v ef i l t e r i n g ,n e i g h b o r su s e r s ,a r t i f i c i a ln e u r a ln e t w o r k s 3 独创性声明 本人声明所呈交的论文是我个人在导师指导下进行的研究工 作及取得的研究成果尽我所知,除了文中特别加以标注和致谢 的地方外,论文中不包含其他人已经发表或撰写的研究成果,也 不包含为获得江西财经大学或其他教育机构的学位或证书所使用 过的材料与我一同工作的同志对本研究所做的任何贡献均已在 论文中作了明确的说明并表示了谢意 警咎神瓤丛彳 关于论文使用授权的说明 本人完全了解江西财经大学有关保留、使用学位论文的规定, 印:学校有权保留送交论文的复印件,允许论文被查阅和借阅; 学校可以公布论文的全部或部分内容,可以采用影印、缩印或其 他复制手段保存论文 ( 保密的论文在解密后遵守此规定) 签名:导师签名: 1 绪论 1 绪论 随着计算机技术与网络技术的快速发展,互联网成为了人们日常生活中必不 可少的工具。越来越多的人习惯于从网上接收信息,越来越多的人通过网络发布 信息、传播信息。电子商务作为一种重要的商务模式,也慢慢将人们的消费方式 从线下转到网上,人类社会进入了一个全新的电子商务信息时代。 然而,正当人们惊叹于网络社会快捷方便的同时,信息爆炸随之而来,每天 收到的广告信息多得使人们无所适从,电子商务用户更是迷失在商品的信息海洋 之中,无法快速地找到自己真正所需要的物美价廉的商品。另一方面,企业在市 场竞争之中,由于无障碍的信息流通,其技术、产品、营销手段更快地趋向同质 化。在这个电子商务时代,竞争者在短时间内就能获取对方的技术信息、营销策 略,马上模仿并推出性能接近成本相当的产品。这种情况下,传统的市场营销、 营销传播显得不再那么有效。那么,如何在成千上万的商品海洋中,让用户能够 快速准确地找到满意的商品? 如何让电子商务网站提供更个性化更人性化的服 务,从而有效提高网站的吸引力和客户对网站的忠诚度? 电子商务个性化推荐系 统正是解决上述问题的一条重要途径。 1 1 研究背景与意义 i n t e r n e t 的迅猛发展将人类带入了信息社会和网络经济时代,对企业发展和 个人生活都产生了深刻的影响。一方面,基于i n t e r n e t 的虚拟企业不再需要像传 统企业物理环境下的实体投资,企业与顾客、供应商等建立起更直接的联系,电 子商务模式为企业发展提供了更多的机会;同时,i n t e r n e t 的发展正在极大地改 变我们每个人的生活,人们不出家门就可随心所欲地得到自己想要的商品,网上 购物的经历让我们感受到电子商务带来的惊喜。图1 清晰地描述了电子商务的一 般流程。 一资金、信息。 电子商 资金、信息 用户 l 7 务网站 【 一瓷口仕白 i ku 仕白1 图卜1 网络购物示意图 2 0 0 3 年是中罔网络购物市场发展的元年,b 2 c 和c 2 c 购物市场当年交易额都 突破了l o 亿元,在市场成长阶段初期,由于相对c 2 c ,b 2 c 交易避免了信用和支 付安全等问题,更容易被用户接受,因此交易额在2 0 0 3 年和2 0 0 4 年都高于c 2 c ; 基于神经网络的电子商务个性化推荐系统研究 随着第三方支付平台的出现和信用评价体系的建立,c 2 c 更灵活和自由的购物模式 也得到越来越多用户的认可,c 2 c 的交易额也得到了飞速增长。2 0 0 7 年中国网络 购物市场规模为5 6 1 亿元,同比增长11 7 4 ,其中b 2 c 和c 2 c 总体交易额分别为 4 3 亿元和5 1 8 亿元。据预测,2 0 1 1 年中国的网络购物市场交易总体规模将达到4 0 6 0 亿元( 如图卜2 所示) 。 2 0 0 2 2 0 i1 年中田一络购物市场交易搜棰 5 。、e 甚艺:唧1 7 ”“”:s ? 3 , 。,。里= 罱妄高亓同 2 - a o 0 d d i 1 1蕾- l 一肇一帮簟謦盘嗣棘誓 s 6 l 0 9 4 亿元) 甘i 1 2 ;q - t - 膏鲁埔青枷 6 t 3 2 2 f 亿元) e = = j c 2 c 囔子膏舅宣再嘲 3 i o l 2 s s3 8 n :光1 一一培冉柙簟立,脯一 3 7 6 4 #t 74,& 7 2 8 s 镕( ;) 建b 2 c 聍膏芳一青幌曩埋竹却一培著 一,不包禽蕾蚶打量鼻一r c 目t 啪fi r e 地啪h 、c - v w ,e “h ,c h c o m c n 图卜22 0 0 2 2 0 11 年中国网络购物市场规模 我国政府正全面、积极、稳妥地推进中国电子商务的发展。我国电子商务发 展的总体框架( 包括整体战略、发展规划、发展措施、技术体制标准以及相关法 律法规) 的推出,将会使电子商务有一个更加规范有序的应用与发展环境。不少 地方政府也都对电子商务给予了前所未有的关注与支持,开始将电子商务作为重 要的产业发展方向。另外,具有外资背景的电子商务企业和项目日益增加,其表 现形式是双向的:既有海外风险投资直接进入国内的电子商务企业,也有国内企 业通过海外上市吸收海外资金。在不少电子商务企业内,外籍或具有外资企业背 景的高级管理人员显著增加。与此同时,海外电子商务企业开始直接进入中国市 场。随着中国加入世界贸易组织,基于超越国界的i n t e r n e t 的电子商务正走上了 世界经济一体化的道路。 在电子商务的虚拟环境下,商家所提供的商品种类和数量非常多,用户不可 能通过一个小小的计算机屏幕一眼就知道所有的商品,用户也不可能如在物理环 境下那样检查挑选商品。因此,需要商家提供一些智能化的选购指导,根据用户 的兴趣爱好推荐用户可能感兴趣或足满意的商品,使用户能够很方便地得到自己 所需要得到的商品。而且,从现实经验来看,用户的需求经常是不明确的、模糊 的,可能会对某类商品有着潜在的需求,但并不清楚什么商品能满足自己的模糊 需求。这时,如果商家能够把满足朋户模糊需求的商品推荐给用户,就可以把用 2 1 绪论 户的潜在需求转化为现实的需求,从而提高产品的销售量。 在这种背景下,推荐系统( r e c o m m e n d e rs y s t e m s ) 应运而生,它是根据用户 的特征,比如兴趣爱好,推荐满足用户要求的对象,也称个性化推荐系统 ( p e r s o n a l i z e dr e c o m m e n d e rs y s t e m s ) 。实际中应用最多的,是在网上购物( 尤 其是b 2 c 类型) 环境下的、以商品为推荐对象的个性化推荐系统,它为用户推荐 符合兴趣爱好的商品,如书籍,音像等。据i n t e r n e t 研究机构j u p i t e r c o m m u n i c a t i o n s 报道,通过对2 5 个电子商务消费网站的调查发现,这些网站在 提供推荐系统后第一年中,平均增加了4 7 的新用户,利润同比增加5 2 。另 一个i n t e r n e t 研究机构n i e l s e nn e t r a t i n g 报道,与一般的电子商务网站相比, 提供推荐系统的电子商务网站将可以把更多的访问者变成购买者,并且受到个性 化推荐服务的用户的在线消费金额比未受到的用户的要高。 1 2 研究现状综述 推荐系统是信息检索和信息过滤领域的研究热点,得到了许多著名研究机构 和学者的关注和研究。1 9 9 7 年以前,推荐系统主要用于信息过滤,如电子邮件的 过滤、新闻组文章的过滤等,代表系统有t a p s t r y ,g r o u p l e n s ,p h o a k s , f a b ,r e f e r r a lw e b ,s i t e s e e r 等。1 9 9 7 年以后,推荐系统被引入了一个新的应 用领域电子商务。 电子商务推荐系统的研究内容和研究方向主要包括以下几点:n 幻 ( 1 )推荐技术的研究。设计准确、高效率的推荐算法是推荐系统研究的核 心问题。目前使用的推荐技术主要有协同过滤推荐、基于内容的推荐、基于规则 的推荐、基于数据挖掘技术的推荐等。其中协同过滤推荐是个性化推荐中研究和 应用最多的方法之一,被广泛的应用于电子商务网站、数字图书馆、网页搜索、 新闻过滤等。 基于内容的过滤是信息检索领域的重要研究内容1 。基于内容过滤的推荐系统 需要分析资源内容信息,根据用户兴趣建立用户模型( p r o f i l e ) ,然后根据资源 内容与用户档案之间的相似性向用户提供推荐服务。文献m3 提出了使用智能代理技 术来分析顾客的需求,并建立用户模型,并据此提供推荐服务。协同过滤技术则 是根据用户之叫的柏似性产生推荐结果。文献暗1 提出使用奇异值分解技术减少特征 向量空间的维数,提高最近邻居的搜索速度。k a r y p i s 等旧1 提出根据项之间的相似 性来提供推荐服务。文献j 提出对用户最近邻居和项采用不同权重的方法来提高推 荐质量。 由于传统的协同过滤技术根据用户显式评分产生推荐结果,用户使用不方便, 许多研究者提出町以通过w e b 挖掘技术获取用户隐式评分陋 们。由此,各种数据挖 3 基于神经网络的电子商务个性化推荐系统研究 掘技术也开始应用到推荐系统中。s a r w a r 等人n 们提出了基于关联规则挖掘的推荐 系统。文献3 中提出了基于b a y e s i a n 分类挖掘的推荐系统。文献n 2 3 将w e b 挖掘、 关联过着挖掘和决策树技术应用到电子商务推荐系统中,为网上商店的顾客推荐 适合他们需要的产品。文献n 3 3 提出了一种通过用户购物的历史记录生成用户模型, 并通过用户模型来进行书籍和c d 的推荐。文献n 卅提出可以通过对w e b 日志的挖掘 来提供推荐服务。各种挖掘技术如关联规则挖掘、聚类挖掘等被应用于w e b 日志 的分析中,以提高推荐系统的精度。 随着i n t e r n e t 的普及和电子商务的发展,推荐系统得到了越来越多研究者的 关注擒9 1 。遗传算法、神经网络等机器学习技术也在推荐系统中得到应用,并且以 其良好的适应性和学习能力越来越受到重视。文章n 司中提出了一个利用神经网络 和遗传k - - m e a n s 算法通过分析用户在电子商务网站的浏览路径来获取用户偏好的 方法。该方法首先利用了神经网络来筛选确定用户常用的浏览路径,然后用遗传k - - m e a n s 方法来分析这些路径,最终得到用户的偏好。文献n 6 3 提出了一种基于自组 织特征映射( s e l f o r g a n i z e df e a t u r em a p p i n g ,s o m ) 神经网络和案例式推理( c a s e b a s e dr e a s o n i n g ,c b r ) 协同过滤推荐系统。文献n 刀则提出了一个产品订单优化 选择的决策支持系统。对于决策过程中的定性因素,首先通过调查问卷总结领域 专家的知识,形成i f t h e n 模糊规则,然后用f n n 来学习这些规则。最后用反馈 式神经网络a n n 和e b p 学习算法来整合决策过程中的定性因素和定量因素,并最 终输出结果。 另外,推荐技术中的稀疏问题( s p a r s i t y ) 、冷开始问题( f i r s ts t a r t ) 、奇 异发现问题( s e r e n d i p i t y ) 、健壮性分析和评价数据模型成为当前推荐系统领域 的主要研究热点。 ( 2 )实时性的研究。在大型电子商务推荐系统中,推荐系统的伸缩能力和 实时性要求越来越难以保证。如何有效满足推荐系统的实时性要求得到了越来越 多研究者的关注。 ( 3 )推荐质量的研究。在大型电子商务系统中,用户评分数据极端稀疏。 用户评分数据的极端稀疏性使得推荐系统无法产生有效的推荐,推荐系统的推荐 质量难以保证。 ( 4 )多种数据多种技术的集成。当前大部分的电子商务推荐系统都只利用 了一部分可用信息来产生推荐。随着研究的深入,新型电子商务推荐系统应该利 用尽可能多的信息,收集多种类型的数据,有效集成多种推荐技术,从而提供更 加有效的推荐服务。 ( 5 )数据挖掘技术在推荐系统中的应用。随着研究的深入,各种数据挖掘 技术( 主要包括关联规则挖掘、序列模式挖掘、聚类分析、b a y e s i a n 分类等) 在推 4 1 绪论 荐系统中得到了广泛的应用。基于w e b 挖掘的推荐系统研究得到了越来越多学者 的关注。 ( 6 ) 用户隐私保护的研究。由于推荐系统需要分析用户的购买习惯和兴趣 爱好,涉及到用户隐私问题,如何在提供推荐服务的同时有效保护用户隐私值得作 进步深入的研究。 ( 7 ) 推荐系统可视化的研究。推荐系统的目的是为用户提供服务,因此必 须为用户提供友好的可视化服务界面。主要包括推荐结果可视化研究和推荐结果 解释研究等方面的内容。 目前,国内对推荐系统研究相对国外有一定差距,主要表现:( 1 ) 缺乏个性 化的推荐,很多的推荐结果是对所有客户的,是非个性化的推荐,可能很多的推 荐与某一客户的兴趣并不相符;( 2 ) 推荐的自动化程度低,大多数的推荐功能都 需要客户经过一段时间与计算机的交互,输入自己的兴趣信息,然后才能得到结 果,系统不能保存客户每次的输入信息;( 3 ) 推荐的持久性程度低,目前的推荐 技术都是建立在当前客户会话基础上,不能利用客户以前的会话信息,推荐的持 久性程度非常低,这也是我国推荐技术和国外的推荐技术的一个重要差别。( 4 ) 推荐方法单一,大多数所用的推荐策略基本就是分类浏览和基于内容的检索,缺 乏多种推荐策略的混合使用,尤其缺少个性化与非个性化推荐策略的混合使用。 ( 5 ) 实时性差,不能在线推荐,有的推荐不能做到在线推荐,如信函式推荐,使 推荐不能及时。近年来我国比较重视i n t e r n e t 智能推荐方面的研究工作,自然科 学基金也曾资助过“面向电子商务的顾客偏好分析与个性化分析系统 、“电子商 务个性推荐系统及应用研究”。“8 1 3 本文研究思路与结构 根据霍金斯的消费者行为综合解释模型( 如图卜3 所示) ,用户选择商品是一 个多因素共同作用的复杂决策过程,而最终通过自我概念与生活方式的表达即需 要与欲望来决定。 5 基于神经网络的电子商务个性化推荐系统研究 ij磊-_。_西:i器弄:了:;ji一一一一-j :个性、情绪、: :态度: - i - 一i 图:i - 3 霍金斯模型 电子商务个性化推荐系统试图通过各种方法来获得用户的这种需要和欲望信 息( 在推荐系统领域,我们称之为用户兴趣) ,从而达到对目标用户进行推荐的目 的。一般地,推荐系统需要经过数据输入、用户建模、项目匹配、推荐输出四个 阶段来实现个性化推荐。数据输入是采集相关数据,一般分为显示和隐式两种方 法。用户建模是获取和维护与用户兴趣、需求或习惯相关的知识的过程,其结果 将产生一个表示用户特有背景知识或兴趣、需求的用户模型。项目匹配阶段将以 这一模型为依据,运用各种推荐技术寻找出与其相匹配的项目,然后在推荐输出 阶段将这些项目以预测值、t o p n 推荐或者其他形式呈现给用户。 本文梳理并分析了电子商务推荐系统的研究内容与研究热点,独创性地提出 了用户空间兴趣与时间兴趣的概念,并综合用户兴趣的这两个维度进行建模;另 外,论文基于神经网络改进了协同过滤中的邻居用户构建和用户兴趣的时间模型。 本文的研究思路如图卜4 所示。 6 1 绪论 图卜4 论文研究思路 论文研究的落脚点是电子商务个性化推荐系统中的用户兴趣建模。针对电子 商务推荐系统面临的主要挑战,对传统的用户兴趣获取方法进行了深入地探索和 研究,并通过引入人工神经网络来改进传统算法。 论文共分为七章,文章结构及各章内容简介如下: 第一章分析了电子商务个性化推荐系统的产生背景,对推荐系统的研究现状 进行了综述,并介绍了论文的研究内容和组织结构。 第二章详细论述了电子商务个性化推荐系统的概念,分析了推荐系统的组成 与分类,并对推荐系统的应用和相关技术进行了介绍。 第三章深入分析了推荐系统中用户兴趣的表示和更新方法,并提出了一种基 于神经网络的用户空间兴趣模型,对传统的邻居用户构建进行了改进。 第四章对用,、兴趣的时间性进行研究,提出了一种基于d s o m 分类的用户时间 兴趣模型。 第五章从总体卜构建了基于神经网络的时空综合推荐模型,并对推荐系统的 7 基于神经网络的电子商务个性化推荐系统研究 总体结构进行了设计。 第六章描述了相关实验的设计,并对实验结果进行分析与总结。 第七章总结全文,指出本文的后续研究方向。 8 2 电子商务推荐系统及其相关技术 2 电子商务推荐系统及相关技术 2 1 电子商务推荐系统概述 电子商务因其成本低廉、方便快捷、不受时空限制等特点而以令人难以置信 的速度蓬勃兴起,基于互联网的商业w e b 站点结构也变得更加复杂,用户经常 会迷失在大量的商品信息空间中,无法顺利找到自己需要的商品。而怎样在电子 虚拟世界中有效的提高产品的吸引力,使企业尽可能获得更多的效益? 怎样让用 户在成百上万的商品中,选择到自己满意的商品? 电子商务推荐系统 ( e c o m m e r c er e c o m m e n d e rs y s t e m ) 应运而生,成为解决这些“信息超载”问题 最有效的工具之一。电子商务推荐系统通过模拟商店销售人员,分析用户的购买 动机,向用户提供商品推荐,帮助用户找到所需商品,从而顺利的完成购买过程。 2 1 1 推荐系统的概念 现在被广泛引用的推荐系统( r e c o m m e n d e rs y s t e m ) 的定义是r e s n i c k v a r i a n 在1 9 9 7 年给出的:“它是利用电子商务网站向客户提供商品信息和建议, 帮助用户决定应该购买什么产品,模拟销售人员帮助客户完成购买过程”。 推荐有三个组成要素:推荐候选对象、用户、推荐方法。推荐活动在我们日 常生中普遍存在,根据不同的推荐对象和推荐方法,推荐活动的形式多种多样, 如,超市导购员为用户推荐用户喜爱的产品,提高销售能力;现实生活中朋友间 相互推荐喜爱的电影;推销员向用户推销产品等,都是推荐活动,可以说,只要 存在多个候选对象,就存在选择问题,存在选择就存在推荐。 个性化推荐的最大的优点在于,它能收集用户特征资料并根据用户特征,如 兴趣偏好,主动为用户提供个性化的推荐。而且,系统给出的推荐是可以实时更 新的,即当系统中的商品库或用户特征库发生改变时,给出的推荐序列会自动改 变。这就大大提高了电子商务活动的简便性和有效性,同时也提高了企业的服务 水平。 总体说来,一个成功的个性化推荐系统的作用主要表现在以下三个方面: ( 1 ) 将电子商务网站的浏览者转变为购买者( c o n v e r t i n gb r o w s e r si n t o b u y e r s ) :电子商务系统的访问者在浏览过程中经常并没有购买欲望,个性化推 荐系统能够向用户推荐他们感兴趣的商品,从而促成购买过程。 ( 2 ) 提高电子商务网站的交叉销售能力( c r o s s - s e l l ) :个性化推荐系统 在用户购买过程中向用户提供其他有价值的商品推荐,用户能够从系统提供的推 荐列表中购买自己确实需要但在购买过程中没有想到的商品,从而有效提高电子 商务系统的交叉销售。 9 基于神经网络的电子商务个性化推荐系统研究 ( 3 ) 提高客户对电子商务网站的忠诚度( b u i l d i n gl o y a l t y ) :与传统的 商务模式相比,电子商务系统使得用户拥有越来越多的选择,用户更换商家极其 方便,只需要点击一两次鼠标就可以在不同的电子商务系统之间跳转。个性化推 荐系统分析用户的购买习惯,根据用户需求向用户提供有价值的商品推荐。如果 推荐系统的推荐质量很高,那么用户会对该推荐系统产生依赖。因此,个性化推 荐系统不仅能够为用户提供个性化的推荐服务,而且能与用户建立长期稳定的关 系,从而有效保留客户,提高客户的忠诚度,防止客户流失。 一般地,推荐系统包括输入模块、用户兴趣建模和推荐方法模块、推荐结果 输出模块。其中,用户兴趣建模和推荐方法模块是推荐系统的核心部分,决定着 推荐系统性能的优劣。 输入模块采集的信息可以是用户当前的行为,也可以是用户访问过程中的历 史行为。般推荐系统都有多种输入信息,主要有:( 1 ) 隐式浏览输入:将当前 用户访问w e b 站点的浏览行为作为推荐系统的输入,用户的浏览行为与访问普通 w e b 站点没有区别,并不知道推荐系统的存在。用户当前正在浏览的网页、用户 选购的商品、用户的浏览路径等都可以作为隐式浏览输入的信息。( 2 ) 显式浏览 输入:也是将用户的浏览行为作为推荐系统的输入,但与隐式浏览输入不同,用 户的显式浏览输入是有目的的向推荐系统提供自己的兴趣爱好。例如,w e b 网站 提供一系列热门信息供用户选择,用户只选择自己感兴趣的信息列表,推荐系统 根据用户的选择向用户提供个性化推荐服务。 具体的输入内容包括:( 1 ) 关键字物品属性输入:用户在搜索引擎中输入 关键字作为推荐系统的输入,或者将用户当前正在浏览的信息类别作为推荐系统 的输入。这种类型的输入不同于用户随意浏览的行为,用户输入的目的就是w e b 网站上搜索自己需要的信息。( 2 ) 用户评分输入:将用户对信息的数值评分数据 作为推荐系统的输入。推荐商务系统列出一系列信息让用户评分,用户的评分可 以是一个数值,数值大小表示用户对信息的感兴趣程度,也可以是一个布尔值, 0 表示不感兴趣,1 表示感兴趣。用户提供的评分数据使得推荐系统可以为用户 提供个性化的推荐服务。( 3 ) 用户文本评价输入:用户对自己已经知道的信息以 文本形式进行个人评价,推荐系统本身并不能判断这些评价的好坏。其他用户浏 览该信息时,可以看到该用户对信息的文本评价信息。( 4 ) 编辑推荐输入:将领 域专家对特定信息的评价作为推荐系统的输入,领域专家对该信息或商品进行全 面详细的介绍,用户通过专家的专业介绍,可以对自己并不熟悉的信息加深认识, 从而决定是否选择该信息或产品。( 5 ) 用户购买历史输入;推荐系统将用户的购 买历史作为隐式评分数据。一旦用,、购买的特定商品,则认为用户喜欢该商品。 推荐系统根据用户的购买历史产,t - 十i t 应的推荐。但是用户购买了某件商品并不代 l o 2 电子商务推荐系统及其相关技术 表用户喜欢该商品,所以在精确的推荐系统中,用户可以对购买的商品进行重新 评分,从而使推荐系统产生更精确的推荐。 输出模块是将系统产生的推荐结果呈现给用户,为用户提供个性化的商品选 择。因此,输出方式设计的好坏是影响推荐系统的使用者( 即电子商务用户) 能 否真正接受所提供的推荐意见的一个重要方面。目前,电子商务网站都向用户提 供多种形式的输出,主要有:( 1 ) 相关信息输出:推荐系统根据用户表现出来的 行为特征或w e b 网站的热门信息排行情况向用户产生信息推荐,这种方式是推荐 系统中最为普通的一种输出。相关信息输出可以基于简单的信息排行向用户推荐 热门信息;也可以基于对用户的行为特征进行深入分析,发现用户的浏览行为模 式,从而产生个性化的推荐。( 2 ) 个体文本评价输出:推荐系统向目标用户提供 其他用户对信息的文本评价一般是非个性化的,对每个项而言,所有用户得到的 个体文本评价均相同。( 3 ) 个体评分输出:向目标用户提供其他用户对信息的数 值评分。评分输出没有大量的文本描述,因此更加简洁明了。个体评分输出比较 适合于个体数值评分比较少的场合。( 4 ) 平均数值评分输出:推荐系统向用户提 供其他用户对信息的数值评分的平均值。这种输出形式具有简洁明了的优点,用 户可以立即获得对该信息的总体评价。( 5 ) 电子邮件输出:推荐系统通过电子邮 件的形式向用户提供最新信息。这种输出形式可以吸引用户再次访问网站,从而 达到保护用户,防止用户流失的目的。( 6 ) 编辑推荐输出:向用户提供领域专家 对商品的专业介绍,用户通过专家的专门介绍可以对自己并不熟悉的商品加深认 识,了解商品的性能特点,从而决定是否购买该商品。 推荐系统的界面表现形式主要有:( 1 ) b r o w s i n g :客户提出对用户信息的查 询要求,推荐系统根据查询返回高质量的推荐;( 2 ) s i m il a ri t e m ,推荐系统根 据用户可能感兴趣的信息或购买的商品推荐类似的信息或产品;( 3 ) e m a i l ,推 荐系统通过电子邮件的方式通知用户可能感兴趣的信息;( 4 ) t e x tc o m m e n t s : 推荐向用户提供其他用户对相关信息的文字评论;( 5 ) a v e r a g er a t i n g ,推荐系 统向客户提供其他用户对相应信息的等级评价;( 6 ) t o p n ,推荐系统根据用户 的喜好向用户推荐最可能吸引用户的n 条信息或产品;( 7 ) o r d e r e ds e a r c h r e s u l t s ,推荐系统列出所有搜索结果,并将搜索结果按照用户的兴趣降序排列。 2 1 2 推荐系统的分类 目前,主要的推荐方法包括:基于内容推荐、协同过滤推荐和组合推荐。另 外,近年来也有人在研究基r 多维度情境信息的推荐。 ( 1 ) 基于内容推荐 基于内容的推荐( c o n t e n t - b a s e dr e c o m m e n d a t i o n ) 是信息过滤技术的延续 与发展,它是建立在项目的内容信息上做出推荐的,而不需要依据用户对项目的 基于神经网络的电子商务个性化推荐系统研究 评价意见,更多地需要用机器学习的方法从关于内容的特征描述的事例中得到用 户的兴趣资料。在基于内容的推荐系统中,项目或对象是通过相关的特征的属性 来定义,系统基于用户评价对象的特征,学习用户的兴趣,考察用户资料与待预 测项目的相匹配程度。用户的资料模型取决于所用学习方法,常用的有决策树、 神经网络和基于向量的表示方法等。 基于内容的用户资料是需要有用户的历史数据,用户资料模型可能随着用户 的偏好改变而发生变化。基于内容推荐方法的优点是: a 、不需要其它用户的数据,没有冷开始问题和稀疏问题。 b 、能为具有特殊兴趣爱好的用户进行推荐。 c 、能推荐新的或不是很流行的项目,没有新项目问题。 d 、通过列出推荐项目的内容特征,可以解释为什么推荐那些项目。 e 、已有比较好的技术,如关于分类学习方面的技术已相当成熟。 缺点是要求内容能容易抽取成有意义的特征,要求特征内容有良好的结构 性,并且用户的口味必须能够用内容特征形式来表达,不能显式地得到其它用户 的判断情况。 ( 2 ) 基于协同过滤推荐 协同过滤推荐( c o l l a b o r a t i v ef i l t e r i n gr e c o m m e n d a t i o n ) 技术是推荐系 统中应用最早和最为成功的技术之一。它一般采用最近邻技术,利用用户的历史 喜好信息计算用户之间的距离,然后利用目标用户的最近邻居用户对商品评价的 加权评价值来预测目标用户对特定商品的喜好程度,系统从而根据这一喜好程度 来对目标用户进行推荐。协同过滤最大优点是对推荐对象没有特殊的要求,能处 理非结构化的复杂对象,如音乐、电影。 协同过滤是基于这样的假设:为一用户找到他真正感兴趣的内容的好方法是 首先找到与此用户有相似兴趣的其他用户,然后将他们感兴趣的内容推荐给此用 户。其基本思想非常易于理解,在n 常生活中,我们往往会利用好朋友的推荐来 进行一些选择。协同过滤i f 是把这思想运用到电子商务推荐系统中来,基于其 他用户对某一内容的评价来向目标用户进行推荐。 基于协同过滤的推荐系统可以说是从用户的角度来进行相应推荐的,而且是 自动的,即用户获得的推荐是系统从购买模式或浏览行为等隐式获得的,不需要 用户努力地找到适合自己兴趣的推荐信息,如填写一些调查表格等。和基于内容 的过滤方法相比,协同过滤具有如下的优点: a 、能够过滤难以进行机器自动内容分析的信息,如艺术品,音乐等。 b 、共享其他人的经验,避免了内容分析的不完全和不精确,并且能够基于 一些复杂的,难以表述的概念( 如信息质量、个人品味) 进行过滤。 1 2 2 电子商务推荐系统及其相关技术 c 、有推荐新信息的能力。可以发现内容上完全不相似的信息,用户对推荐 信息的内容事先是预料不到的。这也是协同过滤和基于内容的过滤一个较大的差 别,基于内容的过滤推荐很多都是用户本来就熟悉的内容,而协同过滤可以发现 用户潜在的但自己尚未发现的兴趣偏好。 d 、能够有效的使用其他相似用户的反馈信息,较少用户的反馈量,加快个 性化学习的速度。 虽然协同过滤作为一种典型的推荐技术有其相当的应用,但协同过滤仍有许 多的问题需要解决。最典型的问题有稀疏问题( s p a r s i t y ) 和可扩展问题 ( s c a l a b i l i t y ) 。 ( 3 ) 组合推荐 由于各种推荐方法都有优缺点,所以在实际中,组合推荐( h y b r i d r e c o m m e n d a t i o n ) 经常被采用。研究和应用最多的是内容推荐和协同过滤推荐的 组合。最简单的做法就是分别用基于内容的方法和协同过滤推荐方法去产生一个 推荐预测结果,然后用某方法组合其结果。尽管从理论上有很多种推荐组合方法, 但在某具体问题中并不见得都有效,组合推荐一个最重要原则就是通过组合后 要能避免或弥补各自推荐技术的弱点。 在组合方式上,有研究人员提出了七种组合思路: a 、加权( w e i g h t ) :加权多种推荐技术结果。 b 、变换( s w i t c h ) :根据问题背景和实际情况或要求决定变换采用不同的 推荐技术。 c 、混合( m i x e d ) :同时采用多种推荐技术给出多种推荐结果为用户提供参 考。 d 、特征组合( f e a t u r ec o m b i n a t i o n ) :组合来自不同推荐数据源的特征被 另一种推荐算法所采用。 e 、层叠( c a s c a d e ) :先用一种推荐技术产生一种粗糙的推荐结果,第二种 推荐技术在此推荐结果

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论