(管理科学与工程专业论文)数据挖掘在电子商务旅游线路推荐系统中的应用研究.pdf_第1页
(管理科学与工程专业论文)数据挖掘在电子商务旅游线路推荐系统中的应用研究.pdf_第2页
(管理科学与工程专业论文)数据挖掘在电子商务旅游线路推荐系统中的应用研究.pdf_第3页
(管理科学与工程专业论文)数据挖掘在电子商务旅游线路推荐系统中的应用研究.pdf_第4页
(管理科学与工程专业论文)数据挖掘在电子商务旅游线路推荐系统中的应用研究.pdf_第5页
已阅读5页,还剩49页未读 继续免费阅读

(管理科学与工程专业论文)数据挖掘在电子商务旅游线路推荐系统中的应用研究.pdf.pdf 免费下载

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

摘要 随着经济的发展和人民生活水平的提高,旅游业呈现出前所未有的强劲发展 势头,多景点、多样化的旅游消费新形式越来越受到游客的青睐。而各地旅游业 在快速发展的同时,也面临着其他旅游地区或景点的有力竞争。如何有效整合本 地旅游资源、提高旅游服务质量,成为当地政府的一大难题;如何通过为游客提 供一条合理的旅游线路,从而增强企业的竞争力,也是旅游从业者亟需破解的难 题;而作为游客,在缺乏足够有效信息的情况下,很难在众多旅游景点和旅游形 式前做出抉择。而电子商务推荐系统的出现,无疑为相关问题的解决提供了一个 很好的思路和途径。 当前电子商务推荐系统研究的热点主要集中在如何提高商品的推荐效率和 准确率上,其通过接口直接与用户进行交互,为用户提供商品推荐,帮助用户找 到所需商品,从而完成购买过程,以提高用户对自己网站的忠诚度,赢得用户更 多的青睐。 电子商务推荐系统尽管在理论和应用上都得到了很大的发展,但同时也存在 着一系列的挑战和问题,而在旅游产业规划和旅游线路开发上,并没有充分利用 到相关的技术成果。针对上述问题,本文对电子商务旅游线路推荐系统中的算法 设计以及推荐系统的应用进行了研究和探索。 本文首先介绍了与电子商务推荐系统相关的基本概念、存在问题及发展方向 等。并分析了电子电子商务推荐系统使用的相关技术。其次重点介绍了关联规则 分析的基本概念,并着重讨论了关联规则算法。通过将关联规则算法应用到旅游 线路推荐系统中,得到了各景点之间的关联关系,取得了较好的旅游线路推荐效 果。 然后借助于数据挖掘技术,根据旅游线路的特点,对旅游线路的规划进行了 系统、客观地分析,突破了以往以单纯应用整理、归纳方法总结出旅游线路的传 统思路,开启了应用计算机辅助分析旅游线路的新思路。 本文提出了基于数据挖掘技术的电子商务旅游线路推荐系统,并设计了一个 具有基本功能的电子商务旅游线路推荐系统,从而为带动整个旅游产业的发展、 促进行业竞争力的提高产生积极的促进作用。 最后,本文总结了相关的研究工作,并指出了以后需要努力的方向和应用前 景。 关键词:数据挖掘;电子商务;旅游线路;推荐系统;关联规则 a bs t r a c t w i t ht h ed e v e l o p m e n to fe c o n o m i ca n dg r o w t hi nl i v i n gs t a n d a r d ,t o u r i s t p r e s e n t su n p r e c e d e n t e dl e v e lo fg r o w t hm o m e n t u m ,n u m e r o u sb e a u t ys p o ta n dn e w p a t t e mo fd i v e r s i f i e dt o u r i s mc o n s u m p t i o ni sb e c o m i n gm o r ea n d m o r ea p p r e c i a t e d h o w e v e r ,w i t ht h er a p i dd e v e l o p m e n to ft o u r i s t ,i nt h em e a n t i m e ,w h i c hf a c e st o u g h c o m p e t i t i o n h o wt oi n t e g r a t et o u r i s tr e s o u r c e sa n di m p r o v eq u a l i t yo fs e r v i c e ,i sa p r o b l e mf o rv a r i o u sr e g i o n s ;a n dh o w t oe n h a n c et h ec o m p e t i t i v e n e s so fe n t e r p r i s e s b yp r o v i d i n gar e a s o n a b l et o u r i s tr o u t e sf o rt o u r i s t s ,i sa l s oap r o b l e mf o rt o u r i s m o p e r a t o r ;a sat o u r i s t ,i ti s d i f f i c u l tt oc h o o s ear o u t ew h e nl a c ko fa d e q u a t e i n f o r m a t i o n t h ee m e r g e n c eo fe c o m m e r c er e c o m m e n d a t i o ns y s t e mu n d o u b t e d l y p r o v i d e san e ww a ya n dn o t i o nf o r i t t h ec u r r e n th o t s p o t sr e s e a r c ho fr e c o m m e n d a t i o nc e n t r eo nh o wt oi n c r e a s eo f r e c o m m e n d i n ge f f i c i e n c ya n dr a t eo fa c c u r a c y , t h ee - c o m m e r c er e c o m m e n d m i o n s y s t e mi n t e r a c t sc o n s u m e r sb yi n t e r f a c e sd i r e c t l y , a n dw h i c hr e c o m m e n d sp r o d u c t st o h e l pc o n s u m e r s t oc h o o s ep r o d u c t s w h i l e ,f r o mt h ep o i n to ft h ew e bs a t e ,i tn e e d st o p r o v i d ea sm a n ya sp o s s i b l e i t e m st o s a t i s f yd i f f e r e n tc u s t o m e rw i t hd i f f e r e n t c o n s u m i n gp r e f e r e n c e ss oa st oi m p r o v ec u s t o m e r s l o y a l t i e s a l t h o u g he c o m m e r c er e c o m m e n d a t i o ns y s t e mh a v eb e e nd e v e l o p e di n b o t h r e s e a r c ha n dp r a c t i c e ,c h a l l e n g i n gr e s e a r c hp r o b l e m sr e m a i n ,e s p e c i a l l yi nt o u r i s t r o u t e s ,w h i c hd i d n tt a k ef u l la d v a n t a g eo ft h er e l a t e dt e c h n o l o g y a i m e da tt h i s ,t h e p a p e rc o n c e n t r a t e sa l g o r i t h ma sw e l la sa p p l i c a t i o no nt o u r i s tr o u t e sr e c o m m e n d a t i o n s y s t e m f i r s t l yt h ep a p e rg i v e sad e t a i l e di n t r o d u c t i o nt ot h ed e f i n i t i o n ,t e c h n o l o g i e sa n d s t u d y o r i e n t a t i o n so fe - c o m m e r c er e c o m m e n d a t i o ns y s t e m ,a n dt h e n m a i n l y i n t r o d u c e st h ec o n c e p t sa s s o c i a t i o nr u l e s ,b ya n a l y z i n ga p r i o r ia l g o r i t h ma n di t s i m p r o v e m e n t ,a n du s i n gt h e mi ne c o m m e r c et o u r i s tr o u t e sr e c o m m e n d a t i o ns y s t e m , t oo b t a i nt h ea s s o c i a t i o nr e l a t i o n s h i po fs p o t s ,i ta c q u i r e sg o o de f f e c t s t h e n ,w i t ht h eh e l po f d a t a m i n i n gt e c h n o l o g y , a n da c c o r d i n gt o t h e c h a r a c t e r i s t i c so ft o u r i s tr o u t e s ,a n a l y z et h er o u t ep l a n n i n gr e g u l a r i t ys y s t e m a t i c a l l y a n do b j e c t i v e l y ,b r e a c ht r a d i t i o n a lt h o u g h to fa r r a n g i n ga n di n d u c i n gt o u r i s tr o u t e s s i m p l y , c r e a t ean e wm e t h o dt h a tu s i n gc o m p u t e r st oa n a l y z et o u r i s tr o u t e s t h ep a p e rp r o p o s e se c o m m e r c et o u r i s tr o u t e sr e c o m m e n d a t i o ns y s t e mw h i c h b a s e do nd a t am i n i n g ,a n dd e s i g n sa l le c o m m e r c et o u r i s tr o u t e sr e c o m m e n d a t i o n s y s t e mt h a th a dt h eb a s i cf u n c t i o n s ,w h i c hp l a yap o s i t i v er o l ef o rp r o m o t i n gt h e d e v e l o p m e n to ft h et o u r i s mi n d u s t r ya n di m p r o v i n gc o m p e t i t i v e n e s so ft h ei n d u s t r y f i n a l l y , t h ep a p e rs u m m a r i z e st h er e s e a r c h i n gw o r k ,a n dt a k e sag l a n c ei n t ot h e f u t u r ew o r k k e y w o r d s :d a t am i n i n g ;e c o m m e r c e ;t o u d s tr o u t e s ;r e c o m m e n d a t i o ns y s t e m ; a s s o c i a t i o nr u l e s 重庆交通大学学位论文原创性声明 本人郑重声明:所呈交的学位论文,是本人在导师的指导下,独立进行研究 工作所取得的成果。除文中已经注明引用的内容外,本论文不包含任何其他个人 或集体己经发表或撰写过的作品成果。对本文的研究做出重要贡献的个人和集 体,均已在文中以明确方式标明。本人完全意识到本声明的法律结果由本人承担。 学位论文作者签名: 灵细 i日期:渺7 年舌月2 日 重庆交通大学学位论文版权使用授权书 本学位论文作者完全了解学校有关保留、使用学位论文的规定,同意学校保 留并向国家有关部门或机构送交论文的复印件和电子版,允许论文被查阅和借 阅。本人授权重庆交通大学可以将本学位论文的全部内容编入有关数据库进行检 索,可以采用影印、缩印或扫描等复制手段保存和汇编本学位论文。同时授权中 国科学技术信息研究所将本人学位论文收录到中国学位论文全文数据库,并 进行信息服务( 包括但不限于汇编、复制、发行、信息网络传播等) ,同时本人 保留在其他媒体发表论文的权利。 学位论文作者签名:乒j b 翎 日期:p 1 年 妇多日 本人同意将本学位论文提交至中国学术期刊( 光盘版) 电子杂志社c n k i 系 列数据库中全文发布,并按中国优秀博硕士学位论文全文数据库出版章程规 定享受相关权益。 。学位孳文擎签名:笋茶阳 日期:叼年6 月目 指导教师签名: 日期:沙移年易月 何觚 f 第一章绪论 1 1 研究背景和意义 第一章绪论弟一早三百t 匕 1 1 1 电子商务旅游线路推荐系统研究背景 本次选题是数据挖掘技术在电子商务旅游线路推荐系统中的应用研究。旅游 线路是旅游部门凭借旅游资源、旅游设施和旅游服务,针对目标市场,为方便旅 游者进行旅游活动而设计,用交通线合理连接客源地和一系列旅游地、旅游区和 旅游点的线性连续空间。 当前,旅游景点之间的竞争非常激烈,部分地区甚至达到了白热化的地步。 一个景点不仅要面临周围众多景点的竞争,还要面临与自己性质相同或类似景点 的竞争压力。同时,由于各地旅游景区规划的问题,以及旅游从业者线路的安排 也会影响到游客的选择。因此,相关的景点或公司必须在提高景点自身影响力和 服务的同时,协同其他景点,从而达到“共赢”的目的。当f j 旅游景区线路规划 问题得到了广泛的重视,在实践中显示出很高的应用价值。 随着网络技术的发展,互联网已经变为一个巨大的、潜在价值无限的分布式 海量信息空间。随同网络技术的进步,电子商务以及企业信息化程度也不断提高, 电子商务的应用越来越显示出其重要的价值,电子商务网站也不再单单作为门户 使用,而是成为企业经营环节中的重要一环。各地的旅游景点或旅游公司也建立 了电子商务网站来推介自己或提供的服务。由于电子商务网站在运行中会产生大 量的各种数据,如用户注册时提供的信息、历史购买信息和访问记录等;这就要 求电子商务系统必须通过分析相关的数据,在合适的时间向意向客户推荐恰当的 产品或服务显得尤为重要。 由于电子商务的特性( 诸如数据量大、数据类型多等) ,使得要分析相关数 据显得十分困难。当前在规划旅游线路时,一般采用以下几种方式:一是主题旅 游线路设计,比如红色旅游等来安排旅游线路;二是超市型旅游路线设计,顾客 可以根据自己需求随意挑选景点,来安排自己的旅游线路;三是应用运筹学方法 来寻求最优线路,从而把整个路线关联起来;最后就是市场导向,根据市场的要 求来安排路线。但这些方法并没有充分利用信息技术的优势,随着数据库技术的 发展,尤其是数据挖掘在各个行业中的广泛应用,为挖掘出合适的旅游线路提供 了可能。 第一章绪论 2 因此,把数据挖掘技术应用到电子商务推荐系统中显得十分必要和迫切。如 何根据客户的爱好、习惯,模仿销售人员向景点的潜在访问者推荐信息和服务, 在网站上有效提高景点或服务的吸引力的同时,使企业的经济效益最大化,成为 各个企业亟需破解的难题。应用电子商务网站的推荐系统为客户提供符合其需要 的推荐服务成为企业的选择之一。 1 1 2 电子商务旅游线路推荐系统研究意义 旅游线路是旅游产品的重要组成部分,是连接旅游者、旅游企业及相关部门、 旅游目的地的重要纽带,对区域旅游开发、旅游企业的生存与发展、旅游者的旅 游体验等都有重要意义。旅游线路的设计的关键是适应市场需求,具体而言,即 是它必须最大限度地满足景点内容最丰富,最有价值、最受游客欢迎等几点。由 于旅游者来自不同的国家和地区,具有不同的身份以及不同的旅游目的,因而, 不同的游客群有不同的需求。总的来说分为:观光度假型、娱乐消遣型、文化知 识型、商务会议型、探亲访友型、主题旅游型、修学旅游型、医疗保健型等。 旅游线路设计是旅行社的一项重要工作,旅游线路设计人员应该掌握旅游线 路设计的相关知识和技能,旅游从业者也应该了解旅游线路设计的要求与方法。 而电子商务旅游线路推荐系统具有良好的发展和应用前景。其可以通过多种方式 提高电子商务系统的销售能力: l 、针对系统的一些随意浏览者,电子商务推荐系统可以向其推荐他们感兴 趣的景点或服务,提高他们的购买欲望,从而促进景点服务的销售,将浏览者转 变为意向客户或购买者。 2 、针对正在使用系统选择景点或服务的用户,电子商务推荐系统可以向其 推荐其他有价值的景点或服务,使用户能从推荐列表中选择自己需要但在选择过 程中没有想到的景点或服务,从而有效提高电子商务系统的交叉销售能力。 3 、电子商务推荐系统通过分析用户的购买习惯,根据用户需求向用户提供 有价值的景点推荐。如果电子商务推荐系统的推荐质量和推荐效率很高,满足用 户的需求,那么,用户将对该系统产生很高的依赖。因此,电子商务推荐系统可 以通过为用户提供个性化的推荐服务,来提高用户的忠诚度,从而建立长期的稳 定关系。 本文创新性的提出将数据挖掘的相关技术应用到电子商务旅游线路推荐系 统中,为以后旅游线路推荐提供了一个很好的思路。因为当前旅游线路的安排都 是基于旅游从业者以往经验或部分数据统计得出的结论,并不能真正反映出游客 的真实需求。而数据挖掘恰恰能解决这一点,通过在电子商务推荐系统中应用数 据挖掘技术,就可以根据客户的访问记录、访问频度,动态的记录相关的数据, 第一章绪论 3 并通过应用相关技术,挖掘合适的数据,从而推荐给意向客户,开展有针对性的 电子商务,以满足不同客户群体的需求。 1 2 电子商务推荐系统的研究现状和发展趋势 1 2 1 电子商务推荐系统研究现状 推荐系统( r e c o m m e n d a t i o ns y s t e m ) 就是根据用户个人的喜好、习惯来向 其推荐信息、商品的程序 1 。自推荐系统这个概念提出以后,其理论研究和应 用都得到了很大的发展,当前电子商务推荐系统热点可分为如下四类 2 : ( 1 ) 改进当前的电子商务推荐系统,提供更为精确的推荐。 ( 2 ) 将电子商务推荐系统由虚拟的销售人员转变为市场分析工具。 ( 3 ) 为商家的产品定价、促销活动及交叉销售等提供推荐数据。 ( 4 ) 使用数据挖掘技术,产生完全自动化、个性化的推荐。 国外对推荐系统的研究走在了前列,早在上世纪末就提出了很多理论,并设 计了许多推荐系统模型等。近些年来更是得到了很大的发展。针对许多推荐系统 不能综合应用不同推荐算法的问题,文献 3 设计了一个只有单一推荐数据库的 综合了不同算法的基于规则的推荐系统框架。针对仅仅应用用户数据的算法, 4 提出了结合网页结构和链接的分析算法来改善推荐系统的质量。为解决协同过滤 算法中存在的稀疏、扩展性和冷启动等问题,文献 5 提出了结合用户分级协同 过滤和似然关系模型的算法。为预测网络用户需求及为他们提供个性化的推荐, g i o v a n n ac a s t e l l a n o 等 6 提出了一个基于用户数据的神经模糊方法,通过一 系列的模糊规则为用户提供个性化的链接推荐。由于当前的w e bs e r v i c e 推荐系 统是基于服务器端性能的,当w e bs e r v i c e 客户端出存在于异质环境中时,需要 一种考虑到环境异质性的w e bs e r v i c e 分析和推荐框架 7 。为解决私密数据不 便于公开的问题,h u s e y i np l o a t 等 8 设计了有关水平划分数据的二分t o p n 推荐模型。随着用户数量的快速增长和系统的应用,系统的推荐质量更多的依赖 于邻区尺寸和质量,文献 9 提出了一种新的基于先选邻元素的p 2 p 框架结构。 而在实际应用中,a m a z o n c o m 等 1 0 取得了非常不错的效果。 而国内近些年来也出现了研究电子商务推荐系统的热潮。自然科学基金也曾 资助过“面向电子商务的顾客偏好分析与个性化分析系统”、“电子商务个性推荐 系统及应用研究”等项目。协同过滤是推荐系统中采用最为广泛和成功的推荐技 术,但随着电子商务系统用户数目和商品数目的增加,出现了耗时导致系统性能 下降的现象,为解决此问题,文献 1 1 则提出了一种基于用户项目类偏好值矩阵 第一章绪论 4 聚类的合作推荐方法。文献 1 2 探讨了协同过滤推荐系统中数据稀疏问题,对各 种算法在不同数据稀疏程度下的算法性能进行了评估。针对电子商务推荐系统中 各种推荐技术的不足,文献 1 3 提出了推荐策略的自适应方法。随着个性化电子 商务的发展,个性化推荐系统也成为研究的热点之一,文献 1 4 提出了一种新的 基于贝叶斯模型的商品推荐方法;文献 1 5 提出了利用知识领域进行相似度计算 的协同过滤算法,使用户在评分的共同项目很少或为零的情况下也能找到最近邻 进行协同推荐;文献 1 6 提出了一个基于层次分析和数据挖掘的个性推荐系统; 文献 1 7 设计了一个基于数据挖掘的w e b 个性化信息推荐系统,这样有利于在推 荐策略中考虑针对不同类型的用户采用不同的推荐算法。基于网格环境和知识网 格的推荐技术研究工作也取得了初步进展,文献 1 8 设计了基于知识网格的电子 商务智能推荐系统结构;文献 1 9 设计了基于知识的电子商务智能推荐平台的逻 辑框架。而在推荐系统实际应用方面,国内做的比较好的有当当网上书店、卓越 网、淘宝网等。 综上所述,我们可以看出,电子商务推荐技术己经成为电子商务推荐系统研 究领域热点问题,研究者对各种推荐技术在电子商务领域的应用进行了许多有益 的探索,形成了一定的知识积累,并且一些较为成熟的推荐技术己经得到了商业 化的运用。事实上,随着我国电子商务的蓬勃发展,对个性化推荐技术的需求在 不断增长,谁先使用个性化推荐技术,谁就可能获得更多的用户。 1 2 2 电子商务推荐系统的发展趋势 目前,电子商务推荐系统主要有以下发展趋势: 1 、由b s 结构向c s 结构发展 目前大部分的电子商务推荐系统采用的是嵌入式构架,如a n l a z o n , c d n o w , e b a y , 当当等。推荐引擎作为商务系统的一部分,特点是实施简单,一 般通过函数库、类库或软件组件等形式实现。在嵌入式推荐构架中,推荐系统强 烈依赖于应用系统,要求采用和应用系统相同的运行环境,如相同的应用服务器 软件平台。 而c s 结构的推荐构架有这自身的优势。推荐引擎作为提供推荐服务的服务 器端,独立于商务系统;商务系统则作为请求推荐的客户端。它们之间用某种应 用接口( 例如t c p i p h t t p 或者r c p 等) 交互。此构架的特点是推荐系统的运行 环境不需要和应用。 2 、侧重文本分析 对于推荐的产生,现阶段较少用到文本的分析。而对文本的分析却对推荐的 产生起着重大的作用。举个例子,在客户服务中心,把同客户的谈话转化为文本 第一章绪论 5 数据,再对这些数据进行挖掘,进而了解客户对服务的满意程度和客户的需求以 及客户之间的相互关系等信息,从而作出准确的推荐。但是文本的分析并不是一 件容易的事情,尤其是在分析方法方面,还有很多需要研究的专题。目前市场上 有些类似的软件,但大部分方法只是把文本移来移去,或简单地计算一下某些 词汇的出现频率,并没有真正的分析功能。 3 、多算法、多模型 3 现有的推荐系统多以某个或某种推荐算法为核一t l , ,推荐功能单一,不能灵活 提供多种推荐。而未来的推荐系统会采用多种算法、多种模型,算法之间进行互 相协调,从而使推荐结果更满足用户的需求;通过多种模型的比较,可以得到更 理想的效果。 1 3 电子商务推荐系统面临的挑战 目前已有的推荐系统虽然取得了一定的成果,但依然存在着一些难题 2 0 、2 1 、 2 3 : 1 、特征提取问题:尽管在信息检索方面文本等对象特征提出技术已经非常成 熟,但推荐系统中不一定有文本特征或不足以作为描述,尤其是系统中存在的多 媒体数据等的特征提取方法需要利用到多领域的技术和方法。另一个问题是特征 的区分性问题,海量数据情况下不同对象的特征错配会影响系统的性能。 2 、可扩展性问题:由于用户没有对足够多类别的对象进行评价,因此推荐算 法无法完全掌握用户所有的兴趣和需求。模拟过拟合的问题的本质来自于数据的 不完备性,而这在实际应用中是无法完全避免的。 3 、新用户问题:系统没有存储或者存储很少新用户的信息,包括查看对象的 历史记录和新用户对对象的评分,基于模型的方法无法获得训练数据而基于规则 的方法难以进行推理近期一些研究特别针对这个问题提出了解决方法。文献 2 4 ,2 5 利用对象熵( e n t r o p y ) 、受欢迎程度( p o p u l a r i t y ) 、用户个性属性等来 改进效果。 4 、新对象问题:新用户和新对象问题都属于冷启动问题在推荐系统尤其是 协同过滤系统中,新对象加入数据库后必须等待一段时间才有用户查看并进行评 价( 点击、打分、评论等都是评价的手段) 。在评价达到一定数量之前无法对此对 象进行分析和推荐不同于新用户问题,这类问题一般考虑使用组合推荐的方法 来应对。 5 、稀疏问题:在大型推荐系统中,由于用户之间的选择的差异性过大造成稀 疏性问题。文献 5 提出了结合用户分级协同过滤和似然关系模型的算法来解决 这个问题。 第一章绪论 6 6 、私密数据问题:对于在电子商务推荐系统中如何解决私密数据问题的解 决需要进一步加快研究进度。 随着我国电子商务的发展,尤其是b 2 c ,c 2 c 为代表的商业网站的飞速进 步,以查找和对比的推荐技术显然满足不了当前用户的需求。 1 4 本文的主要研究内容与创新点 本文研究的主要内容与创新点: l 、本文创新性的提出将数据挖掘技术应用到电子商务旅游线路推荐系统。 当前的电子商务旅游线路推荐,仅仅只是相关公司根据以往数据或者是相关资源 安排的线路,没有充分考虑到用户的需求,尤其是针对不同文化背景和经济能力 游客的需求。而通过整合相关的海量数据,并从中挖掘出有效的数据,可以达到 以下目的: ( 1 ) 从中挖掘出的有效信息可以为相关部门规划旅游景点提供参考。比如 发现红色旅游景点受到相当多的用户的关注,那么旅游管理部门就可以通过整合 这一部分景点,打破地域的限制,建立套票联盟,从而吸引用户、形成产业优势。 ( 2 ) 旅游从业者通过分析数据得到相关的关联信息,可以提供满足不同兴 趣用户的需求路线,提供公司的盈利能力和客户的忠诚度及吸引潜在客户资源。 ( 3 ) 用户通过系统可以得到自己满意的旅游线路信息。电子商务旅游线路 推荐系统最重要的功能也就在于此,其通过分析系统用户的访问记录、偏好等, 从而推荐相关的线路安排,满足客户的个性化需求。 2 、对电子商务推荐系统的应用现状及其应用技术进行了研究,然后针对数 据挖掘技术在电子商务推荐系统中的应用,结合旅游线路规划的特点,对旅游线 路的规划进行了系统、客观地分析,并采用数据挖掘的关联规则技术中的a p r i o r i 算法,在旅游景点规划中进行应用,取得了良好的应用效果。 3 、本文提出了基于数据挖掘技术的电子商务旅游线路推荐系统的概念,并 设计了一个具有基本功能的电子商务旅游线路推荐系统原始模型,为后续研究提 供了参考,也为带动整个旅游产业的发展、促进行业竞争力的提高、用户满意度 的提高产生积极的推进作用。 通过对电子商务推荐系统的研究与分析,有助于电子商务企业进一步强化对 电子商务的认识和理解、尤其是对电子商务推荐系统的深化体会,体会到现代信 息技术的发展对电子商务应用的巨大促进作用。 第一章绪论 7 1 5 本文的组织结构 本文主要内容安排如下: 1 、第一章介绍了本文的研究背景和意义,分析了电子商务推荐系统的研究 现状和发展趋势,指出了现阶段电子商务推荐系统所面临的挑战,并指明了本文 的主要研究内容与创新点,最后总结了本文的组织结构。 2 、第二章主要介绍了电子商务推荐系统及其相关技术。首先简述了电子商 务系统的相关概念与分类,第- d , 节则简要介绍了与之相关的技术,包括信息检 索和信息过滤、a g e n t 技术、协同过滤技术、数据挖掘技术等,并重点介绍了数 据挖掘中的关联规则技术。 3 、第三章主要对电子商务推荐系统中的应用技术进行了详解,并着重介绍 了经关联规则技术的相关概念和研究现状,详细分析了经典a p r i o r 算法,并结 合旅游线路的实际情况,将之进行了应用。 4 、第四章阐述了电子商务推荐算法对旅游线路规划的重要作用,提出了基 于数据挖掘技术的电子商务旅游线路推荐系统的概念,并详细介绍和分析了系统 的体系结构和相关流程。 5 、第五章结合前一章所述内容,设计了一个具有基本功能的电子商务旅游 线路推荐系统原始模型系统,并在系统原型上进行了应用,得到了良好的推荐效 果,得到的关联信息可以为多方提供服务。 6 、第六章对论文作了总结。介绍了本文所做的工作,并指出了以后需要进 一步努力与改进的地方。 1 6 本章小结 本章对论文的整体情况进行了概述,并对相关的研究内容进行了分析与总 结,其中第三、四章与第五章为本文的重点内容。 第二章电子商务推荐系统及其相关技术的概述 8 第二章电子商务推荐系统及其相关技术的概述 2 1 电子商务推荐系统 2 1 1 电子商务推荐系统功能及其个性化服务 推荐系统推荐何种商品是在电子商务网站整体商品的购买情况、客户的人数 统计或者对客户购买的历史记录上进行分析产生的。广义上讲,这些因素的考虑 使电子商务具有了个性化的色彩,而且对于不同的客户,具有推荐系统的电子商 务网站表现出了一定的自适应性。个性化推荐是基于每个用户的兴趣偏好做出, 给出的推荐必须结合每个用户的兴趣偏好,要求具有更高的个性化服务水平,如 亚马逊等网站给注册用户量身定做的推荐服务。 电子商务推荐系统的作用主要体现在如下三个方面 2 6 、2 7 】: l 、将电子商务系统的浏览者转变为购买者。己有明确购物目标的客户也许 可以借助检索系统找到自己需要的东西,但对于大多数只是漫无目的的浏览者, 或是对需求比较模糊的购买者来说,很难有耐心在长达几十个页面的商品目录中 查找是否有自己感兴趣的东西。推荐系统通过合适的推荐,往往可以将一个浏览 者变为购买者,或者其成为一个潜在的用户。 2 、促进销售。电子商务推荐系统在用户购买过程中向用户提供其它有价值 的商品推荐,用户能够从提供的推荐列表中购买自己确实需要但在购买之前没有 计划的商品,从而有效提高电子商务系统的交叉销售。 3 、提高客户的忠诚度。与传统的商务模式相比,电子商务系统使得用户拥 有越来越多的选择,用户更换商家极其方便,只需要点击几次鼠标就可以在不同 电子商务系统之间跳转。电子商务推荐系统分析用户的购买习惯,根据用户需求 向用户提供有价值的商品推荐。如果电子商务推荐系统的推荐质量很高,那么用 户会对该电子商务推荐系统产生信赖。 因此电子商务推荐系统不仅能为用户提供个性化的推荐服务,而且能与用户 建立长期稳定的关系,从而能有效提高客户的忠诚度,并吸引潜在客户群。 2 1 2 电子商务推荐系统的结构 电子商务推荐系统在电子商务领域的应用表现出独有的特点。其主要有三 部分组成:输入模块、推荐模块和输出模块。 第二章电子商务推荐系统及其相关技术的概述 9 ( 1 ) 输入模块 电子商务推荐系统的输入模块是推荐系统和用户之间的交互窗口,承担着收 集用户行为偏好数据的重要任务。该模块通过给用户提供定的界面和方式,使 用户能方便的使用电子商务系统网站,同时也方便电子商务推荐系统收集用户的 行为偏好数据。电子商务推荐系统的输入包括多种形式,主要有【2 8 】: 1 、隐式浏览输入:将用户访问电子商务w e b 站点的浏览行为作为推荐系统的 输入,用户的浏览行为与访问一般的w e b 站点没有区别。并不知道电子商务推荐 系统的存在。用户当前正在浏览的商品、用户购物篮中选择的商品、用户的浏览 路径等都可以作为隐式浏览输入信息。 2 、显式浏览输入:也是将用户的浏览行为作为电子商务推荐系统的输入,但 与隐式浏览输入不同,用户的显式浏览输入是有目的的向电子商务推荐系统提供 自己的兴趣爱好。例如,电子商务系统提供一系列热门商品供用户选择,用户只 选择浏览自己感兴趣的商品列表,电子商务根据用户的浏览行为向用户提供个性 化的推荐服务。 还有其他输入,诸如用户的历史购买记录、文本评价、搜索引擎的关键字等。 ( 2 ) 推荐模块 处理模块是电子商务推荐系统的核心部分。按照推荐技术的不同,推荐处理 的过程和方法也不同。一般情况下,一个完整的电子商务推荐系统的推荐处理过 程包括以下四个重要的方面:用户兴趣建模、推荐策略库生成、用户需求分析和 在线推荐。本文将在后续章节进行详细讲解。 ( 3 ) 输出模块 电子商务推荐系统的输出模块主要承担向用户展示推荐结果的任务。推荐系 统在获得用户行为偏好信息后,不同的推荐算法可以有不同的推荐方式。电子商 务系统可以根据自己的需要选择如何使用推荐。 1 、相关商品输出:推荐系统根据用户表现出来的行为特征或电子商务系统的 销售情况向用户产生商品推荐,这种方式是电子商务推荐系统中最为普遍的一种 输出。相关商品输出可以基于简单的销售排行向用户推荐热门商品;也可以基于 对用户的行为特征进行深入分析,发现用户的购买行为模式,从而产生个性化的 推荐。 2 、t o p n :推荐系统根据客户的喜好向客户推荐最可能吸引他n 件产品,一 方面可以把网站的浏览者转变为客户,另一方面帮助客户决定是否购买自己最初 感到犹豫不决的产品。 当然还有其它,比如电子邮件、评论信息、等级评价等,各具特点。 第二章电子商务推荐系统及其相关技术的概述 1 0 2 1 3 电子商务推荐系统的分类 电子商务推荐系统以用户为中心,为用户提供服务,根据使用不同的技术可 以将电子商务推荐系统分类如下 2 9 、3 0 ; 1 、基于内容的推荐技术( c o n t e n t - - b a s e dr e c o m m e n d a t i o n ) 它是信息过滤技术的延续与发展,项目或对象通过相关特征的属性来定义, 系统基于用户评价对象的特征学习用户的兴趣,依据用户资料与待预测项目的匹 配程度进行推荐,如新闻组过滤系统n e w s w e e d e r 。 2 、基于用户统计信息的推荐( d e m o g r a p h i c - - b a s e dr e c o m m e n d a t i o n ) 推荐系统基于用户个人属性对用户进行分类,再基于类对类中的用户进行推 荐n ,不要求有一个历史的用户数据,而协同过滤和基于内容的推荐技术都需要。 3 、基于效用的推荐( u t i l i 岫a s e dr e c o m m e n d a t i o n ) 它是根据对用户使用项目的效用进行计算的,核心问题是如何为每个用户创 建效用函数,并考虑非产品属性,如提供商的可靠性( v e n d o rr e l i a b i l i t y ) 和产品的 可用性( p r o d u c ta v a i l a b i l i t y ) 等。 4 、基于知识的推荐( k n o w l e d g e - - b a s e dr e c o m m e n d a t i o n ) 在某种程度上可以看成是一种推理( i n f e r e n c e ) 技术,各方法因所用的知识 不同而有明显区别。 5 、基于关联规则的推荐( a s s o c i a t i o nr u l o b a s e dr e c o m m e n d a t i o n ) 以关联规则为基础,把已购商品作为规则头,推荐对象作为规则体,其中关 联规则的发现最关键且最耗时,是算法的瓶颈,但可以离线进行,商品名称的同 义性问题也是关联规则的一个难点。 6 、基于协同过滤推荐( c o l l a b o r a t i v ef i l t e r i n gr e c o m m e n d a t i o n ) 是目前研究最多的个性化推荐技术,它基于邻居用户的资料得到目标用户的 推荐,推荐的个性化程度高。著名的系统有g r o u p l e n s n e t p e r c e p t i o n s ,r i n g o f i r e f l y 及t a p e s t r y 等。协同过滤的最大优点是对推荐对象没有特殊要求,能 处理非结构化的复杂对象,如音乐、电影。 2 2 相关技术简介 2 2 1 信息检索和信息过滤 信息检索技术一般是指根据用户需求,从大规模的相对静止的数据库中检索 用户需要的信息,主要满足用户瞬时的信息需求。信息检索技术主要用于相对静 第二章电子商务推荐系统及其相关技术的概述 1 1 止的信息存储领域。例如,当用户在电子商务网站中进行检索时,用户提交的商 品特征关键字反映了用户当前需要寻找的商品信息,电子商务网站中的搜索引擎 根据预先建立好的产品信息索引,检索出用户需要的商品信息。 信息检索的研究内容主要包括索引技术和查询技术。索引技术是对资源内容 进行分析,从而将资源内容表示为计算机可处理的数据结构的过程。查询技术根 据用户需求,查询用户需要的资源信息。其研究内容主要包括查询语言设计研究、 可视化查询接口研究、用户请求与资源信息的匹配研究等。在很多情况下,索引 技术和查询技术是重叠的,查询技术依赖资源信息所采用的索引结构。 与信息检索不同,信息过滤对动态信息进行筛选,着重排除不希望得到的信 息,带有即时性。虽然实现技术十分相似,但信息检索和信息过滤所完成的任务 完全不同:信息过滤技术一般用于用户需求相对不变,但信息动态更新比较频繁 的情况。信息过滤系统主要面对的是半结构化和非结构化的数据,它为用户的长 期信息需求提供信息过滤服务。用户的兴趣可用用户模型( u s e rp r o f i l e ) 文件的形 式表示。信息过滤系统将动态信息与用户模型文件进行匹配,根据匹配结果返回 用户需要的信息。 信息过滤与信息检索的区别主要包括: 信息过滤面向用户长期的信息需求,而信息检索技术面向的是用户短期 的、实时的查询。 信息过滤用户模型文件表示用户的信息需求特征,而信息检索技术是用关 键词表达用户的查询请求。 信息过滤中用户需求相对不变,但用户访问的是动态数据流,是从动态数 据流中选择数据:信息检索技术访问的是相对静止的数据,但用户需求却具有瞬 时性。 信息过滤技术是实现推荐系统的关键技术。邮件系统信息过滤和新闻组信息 服务是信息过滤技术的典型应用。在新闻组信息服务中,用户输入自己感兴趣的 一组关键词,新闻组信息服务通过关键词建立用户模型文件。当新闻组中加入新 信息时,信息过滤系统对新信息进行过滤,将满足用户需求的新信息反馈给用户。 新闻组信息服务也可以分析用户订阅的信息自动抽取关键词,建立用户模型文 件,然后通过信息过滤系统将用户感兴趣的新信息反馈给用户。 2 2 2a g e n t 技术 a g e n t 技术是9 0 年代在网络技术和i n t e r n e t 发展的基础上兴起的、- - i - j 实用 性很强的、计算机软件技术。目前,人们还没有对它作出精确的定义,但学术界 对其基本上有一个共识,i 0 a g e n t 技术是具有下列属性的计算机软件系统 3 1 : 第二章电子商务推荐系统及其相关技术的概述 1 2 1 、自主。l 生( a u t o n o m y ) :甚1 a g e n t 可以通过它自身的内部状态控制自己的行为。 换句话说,a g e n t 不需要人类的直接干涉,就可以进行连续的动作,它的行为是 主动的、自发的a g e n t 具有自己的目标( g o a l ) 和意图( i n t e n t i o n ) ,根据目标和环 境的需求,a g e n t 能对自己的短期行为作出规划。 2 、社会性( s o c i a la b i l i t y ) :即a g e n t 可以通过其通讯语言( a c l :a g e n t c o m m u n i c a t i o nl a n g u a g e ) 与其它的a g e n t 进行交互。对于a g e n t 的社会性特点也 可以解释成是通信性,这时所说的通信,是指a g e n t 之间可以进行信息交换,更 进一步,a g e n t 甚至可以进行一定意义下的“会话 任务的承接等,多a g e n t 的协 作、协商均以a g e n t 的社会性,即通信性为基础。 3 、反应性( r e a c t i v i t y ) :即对环境的感知和响应。a g e n t 具有探知自身所处 环境的能力,并能对该环境作出反应,无论是生存在现实世界( 如机器人或 i n t e m e t 上) ,还是虚拟世界( 如虚拟商场中) 中的a g e n t 都应该能感知它们所处 的环境,并通过它们的行为改变环境,一个对环境不能作出响应的软件不能被 称为a g e n t 。 4 、能动性( p r o a c t i v e ) :最p a g e n t 可以主动采取行动,而这些行动是面

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论