(管理科学与工程专业论文)基于商品基因和GA的智能商品推荐系统研究.pdf_第1页
(管理科学与工程专业论文)基于商品基因和GA的智能商品推荐系统研究.pdf_第2页
(管理科学与工程专业论文)基于商品基因和GA的智能商品推荐系统研究.pdf_第3页
(管理科学与工程专业论文)基于商品基因和GA的智能商品推荐系统研究.pdf_第4页
(管理科学与工程专业论文)基于商品基因和GA的智能商品推荐系统研究.pdf_第5页
已阅读5页,还剩71页未读 继续免费阅读

(管理科学与工程专业论文)基于商品基因和GA的智能商品推荐系统研究.pdf.pdf 免费下载

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

摘要 捅要 近年来,随着电子商务的迅速发展,产生了商品信息过载问题,使得一方面 用户的使用成本大大增加,另一方面商家开展针对性营销的困难加大。智能商品 导购系统通过与用户的交互,分析其行为,预测其偏好并向其推荐他们真正感兴 趣的商品,它类似于采购助手的功能来帮助用户过滤信息,选购满足其真正需求 的商品。智能商品导购系统能大大提升用户购物体验,提供个性化的服务,帮助 企业在激烈的电子商务竞争环境下,促进产品的销售,提高用户的忠诚度。 目前多数b 2 c 电子商务系统存在着商品推荐策略单一、推荐结果精度低,推 荐缺乏个性化的问题。本文通过对非线性网络用户行为进行研究,利用一种改进 的非线性回归分析方法对用户兴趣进行建模,提出利用a j a x 技术完成对用户兴 趣数据源的搜集,取代以往对w e b 日志处理的繁杂过程,并着重分析了关联规则 和协同过滤两种主要的推荐算法各自的原理、适用范围及优缺点等。在此基础上, 引入商品基因的概念,通过将商品特征基因数据库、用户购买历史记录、用户在 线浏览内容及邻近用户行为结合起来,提出一种基于商品基因和遗传算法的个性 化推荐算法。该算法可以弥补现行推荐算法推荐精度不高、推荐效率低、新上市 或购买率较低的商品不能及时推荐给客户的不足,同时利用遗传算法对顾客兴趣 度偏好候选集进行学习,得到最佳邻居用户模式,使得推荐商品的覆盖率得到一 定的提升。最后,利用j 2 e e 框架搭建了一个开放式推荐系统原型。 图 2 3 】表 9 】参 6 4 】 关键词:推荐系统;用户建模;推荐算法;商品基因;遗传算法;j 2 e e m v c ; 安徽理: 大学硕士学位论文 a b s t r a c t w i t ht h er a p i dd e v e l o p m e n to fe l e c t r o n i cc o m m e r c e ,w e b s i t ee m c e e di n t oa p r o b l e mo fm e r c h a n d i s ei n f o r m a t i o no v e r l o a d ,w h i c h i sv e r yd i f f i c u l tf o rm e r c h a n t st o c a l t yo u tt a r g e t e dm a r k e t m g s m a r tm e r c h a n d i s eg u i d es y s t e mt h r o u g h i n t e r a c t i o nw i t h u s e r , a n a l y s i st h e i rb e h a v i o r , t h e i rp r e f e r e n c e sa n dr e c o m m e n d i n gt h em e r c h a n d i s et h a t t h e yr e a l l yi n t e r e s t e di n ,a n di ti ss i m i l a rt ot h ef u n c t i o no fp u r c h a s i n ga s s i s t a n t st oh e l p u s e r st of i l t e ri n f o r m a t i o n , t op u r c h a s et h em e r c h a n d i s et om e e tt h e i rr e a ln e e d s s m a r t m e r c h a n d i s eg u i d es y s t e mc a na l s og r e a t l ye n h a n c es h o p p i n ge x p e r i e n c ea n dp r o v i d e p e r s o n a l i z e ds e r v i c e sf o ru s e r , i ta l s oc a np r o m o t ep r o d u c ts a l e sa n di m p r o v eu s e r l o y a l t yi nt h ef i e r c ec o m p e t i t i v ee n v i r o n m e n tf o re - c o m m e r c ee n t e r p r i s e s a tp r e s e n t ,m a j o r i t yo fb 2 ce - c o m m e r c es y s t e m se x i s tm e r c h a n d i s er e c o m m e n d s t r a t e g ys i n 西e r e c o m m e n dr e s u l t s sa c c u r a c yl o w e r , a n db es h o to fp e r s o n a l i z e d q u e s t i o n s i nt h i sp a p e r , w er e s e a r c ho nn o n - l i n e a rn e t w o r k u s e rb e h a v i o r , m o d e l i n g w h a tu s e r si n t e r e s t e du s e da ni m p r o v e dn o n l i n e a rr e g r e s s i o na n a l y s i sm e t h o d ,u s i n g 心k x t e c h n o l o g yt of i n i s ht h ed a t as o u r c ec o l l e c t i n gt h a tu s e ri n t e r e s t e di n , r e p l a c et h e c o m p l i c a t e dp r o c e s so f w e bl o g ,a n da n a l y s i sa d v a n t a g e sa n dd i s a d v a n t a g e so fe x i s t i n g r e c o m m e n ds t r a t e g y , s p e c i a l l yo nt h ea s s o c i a t i o nr u l e sa n dc o l l a b o r a t i v ef i l t e r i n g r e c o m m e n d a t i o na l g o r i t h mp r i n c i p l ea n ds oo n ,i n t r o d u c i n gap e r s o n a l i z e dr e c o m m e n d a l g o r i t h mb a s e do nt h em e r c h a n d i s ec h a r a c t e r i s t i c sa n dg e n e t i ca l g o r i t h m s ,e f f e c t i v e l y i m p r o v e dt h ec o v e r a g er a t ea n da c c u r a c yo fm e r c h a n d i s er e c o m m e n d w ei n t r o d u c e d t h ec o n c e p to ft h ec h a r a c t e r i s t i c so fm e r c h a n d i s e ,b yc o m b i n i n gt h ed a t a b a s eo ft h e m e r c h a n d i s ec h a r a c t e r i s t i c s ,t h eh i s t o r yu s e rp u r c h a s i n g ,t h ec o n t e n tu s e rb r o w s i n g o n l i n ea n dt h eu s e rb e h a v i o ri nn e i g h b o r i n g ,p r o p o s e dap e r s o n a l i z e dr e c o m m e n d a l g o r i t h mw h i c hi sb a s e do i lc h a r a c t e r i s t i c so fc o m m o d i t ya n dg e n e t i ca l g o r i t h m s t h i s a l g o r i t h mc a nm a k eu pf o rr e c o m m e n dl o wa c c u r a c y , l o we f f i c i e n c y , n o tr e c o m m e n d t i m e l ya n ds oo n , a tt h es a m et i m es t u d y i n gc a n d i d a t es e t sw h i c hc u s t o m e r si n t e r e s t e d , o b t a i nt h eb e s tn e i g h b o r - u s e rm o d et ou p g r a d em e r c h a n d i s er e c o m m e n dc o v e r a g e r a t e f i n a l l y , w es e tu pa no p e nr e c o m m e n d a t i o ns y s t e mp r o t o t y p eb a s e do nt h ej 2 e e f r a m e w o r k f i g u r e 【2 3 】t a b l e 【9 】r e f e r e n c e s 【6 4 】 k e y w o r d s :r e c o m m e n d e rs y s t e m ;u s e rm o d e l i n g ;r e c o m m e n da l g o r i t h m ;m e r c h a n d i s e g e n e ;g e n e t i ca l g o r i t h m ;j 2 e e m v c ; 独创性声明 本人声明所呈交的学位论文是本人在导师指导下进行的研究工作及 取得的研究成果。据我所知,除了文中特别加以标注和致谢的地方以外, 论文中不包含其他人已经发表或撰写过的研究成果,也不包含为获得 塞邀堡王太堂或其他教育机构的学位或证书而使用过的材料。与我一 同工作的同志对本研究所做的任何贡献均已在论文中作了明确的说明并 表示谢意。 学位论文作者签名:阜吐日期:2 竺4 年 月! 日 学位论文版权使用授权书 本学位论文作者完全了解塞筮堡王太堂有保留、使用学位论文 的规定,即:研究生在校攻读学位期间论文工作的知识产权单位属于 塞徽堡王太堂。学校有权保留并向国家有关部门或机构送交论文的 复印件和磁盘,允许论文被查阅和借阅。本人授权安徽理工大学 可以将学位论文的全部或部分内容编入有关数据库进行检索,可以采 用影印、缩印或扫描等复制手段保存、汇编学位论文。( 保密的学位 论文在解密后适用本授权书) 学位论文作者签名:伽i 移 导师签名:亟青蕃珐 签字日期:一年月,口日 签字日期:砷年月r 日 1 绪论 1 绪论 近年来,随着电子商务的迅速发展,产生了商品信息过载问题,使得一方面 用户的使用成本大大增加,另一方面商家开展针对性营销的困难加大。智能商品 导购系统通过与用户的交互,分析其行为,预测其偏好并向其推荐他们真正感兴 趣的商品,能大大提升用户购物体验,提供个性化的服务,帮助企业在激烈的电 子商务竞争环境下,促进产品的销售,提高用户的忠诚度。本章将简要的介绍智 能商品推荐系统的相关背景及应用现状,并总结全文所作的研究工作和各章节的 安排。 1 1 课题来源 本课题来源于淮南市科技局研究项目:基于j 2 e e 的中小企业电子商务平台 的设计与实现。 随着经济和科技的发展,广大的中小企业必然将改变传统经营模式,转而投 向更富有活力的电子商务商业模式上来,其必然将成为电子商务领域最活跃的参 与者,但是随着电子商务规模的迅速增长,给用户带来更多选择机会的同时,也 使得用户搜索所需商品的成本越来越高。电子商务智能商品导购系统可以向用户 提供商品推荐,帮助用户找到所需商品,满足用户个性化的需求,将用户从浏览 者转变为购买者,通过网站与用户的互动提高了用户的忠诚度,从而增加企业的 效益,同时将用户从繁重的搜索任务中解脱出来。目前几乎所有的大型电子商务 网站都不同程度地使用电子商务推荐技术,比如a m a z o n 、c d n o w 、e b a y 和 d a n g d a n g 等。 1 2 研究背景与意义 电子商务冈其成本低廉、快捷、不受时空限制等优点在全球范围内得到广泛 的普及和发展,其规模和复杂度也在进一步扩大。我们面临的问题不再是信息的 获取,而是如何从爆炸式增长的信息中获取有用的信息。目前电子商务的发展正 面临这样一些新问题【。 1 电子商务网站提供的商品信息资源空前丰富,然而,用户对其提供的众多 商品信息并非完全感兴趣,用户不可能通过一个小小的计算机屏幕很方便地发现 自己感兴趣的商品,通常要通过多次浏览才能找到满足自己需求的商品。因此, 用户很希望电子商务系统具有一种类似采购助手的功能来帮助其选购商品并能根 安徽理工大学硕+ 学位论文 据用户的兴趣爱好自动地推荐给每个用户可能感兴趣并且满意的商品。 2 电子商务网站从“以站点为中心”向“以用户为中心”的转变也对企业提 出了新的挑战,如何利用企业的内外部数据来进行知识发掘辅助决策,如何了解 到顾客尽可能多的爱好、个人需求和价值取向,以优化网站设计,为用户提供个 性化服务,维护稳定的客户关系,成为电子商务发展迫切要解决的问题。 与传统的商务模式相比,在当前电子商务模式下,保持老客户的同时获得新 客户的难度更大,从各个方面建立起与客户的良好关系,提高客户的忠诚度就显 的非常重要。这就要求站点有一个能够识别用户偏好,并且自动根据这些信息向 用户提供高质量的商品导购服务的系统,实现网络上的“一对一营销”【2 】,这是 一个有着广泛研究潜力和实际应用前景的领域,本文j 下是基于这种背景下展开研 究。 一般来说,商品推荐系统在电子商务活动中的作用可以概括为以下几点: 1 帮助用户检索有用的信息 对于己有明确购物目标的用户,借助电子商务网站提供的检索系统可以免除 在产品目录中一页页翻找,比较迅速地找出其需要的产品。但是对于没有明确购 物目的,只是随便逛逛,或者对自己的需求比较模糊的购物者,检索系统就无法 发挥它的作用了。 2 促进产品的交叉销售 推荐系统模拟销售人员帮助客户完成购买过程,根据用户兴趣推荐一些有价 值的但用户本来没有想到要购买的产品,或者根据用户已经购买的产品推荐相关 或同类的产品,可以有效的促进交叉销售【3 】。加强己有的产品或服务,满足用户 个性化的需求,进而提升销售量,从而增加企业的效益,同时将用户从繁重的搜 索任务中解脱出来,为企业创造最大的利润。 3 将用户从浏览者转变为购买者 潜在客户在对电子商务站点访问时,没有明确的目的和购买需求,可能只是 浏览一下网站的信息,此时通过推荐系统对需求模糊和购买欲望低的客户根据用 户兴趣和以往购买历史数据等知识进行推荐,帮助潜在的客户发现目标商品和服 务,使用户从浏览者转变为购买者,从而强化站点的凝聚力。 4 提高用户的忠诚度 个性化的服务在用户和电子商务网站之间建立了一条稳固的纽带。用户越多 的使用推荐系统,推荐系统就越能掌握用户的兴趣爱好,电子商务网站可以更好 的满足用户的需要,将用户更多的吸引到自己的网站中来,提高用户的忠诚度。 2 1 绪论 1 3 研究现状 1 3 1 数据挖掘与商务智能 数据挖掘也被称为数据库中的知识发现( k n o w l e d g ed i s c o v e r yi nd a t a b a s e , k d d ) ,是指从大型数据库或数据仓库中提取隐含的、未知的、非平凡的及有潜 在应用价值的信息或模式1 4 】【5 1 。主要用来研究如何从海量数据当中提取对人有用 的知识,融合了数据库、人工智能、机器学习、统计学等多个领域的理论和技术。 因其所涉及的知识领域众多、应用范围广泛,数据挖掘成为最近十多年来最为研 究人员和商业组织所关注的领域之一。 数据挖掘方法有多种,其中比较典型的有关联分析、序列模式分析、分类分 析、聚类分析等 6 1 。数据挖掘工具能够对历史信息进行具有创新性的分析,并对 将来的趋势和行为进行预测,从而很好地支持人们的决策。数据挖掘技术自从诞 生之日起就一直被不断的应用于各类新的领域,在商业、银行、保险、证券、电 信、生物技术等方面都有广泛的应用,尤其是在市场预测和销售过程当中,数据 挖掘可以帮助商家节约成本、减少浪费,在增加销售的同时还可以提高服务质量, 使其顾客也能够最大程度的受益,数据挖掘在电子商务中的应用也在蓬勃发展。 在竞争r 益激烈的商业环境中,电子商务的智能化越来越成为企业关注的重 点,也是保障企业生存和发展的重要因素。商务智能( b u s i n e s si n t e l l i g e n c e ) 是在 数据仓库技术的基础上,运用在线分析和数据挖掘技术来分析和处理大量商业数 据的技术,它允许客户查询和分析数据库和数据仓库,得出影响商业活动的关键 因素,最终帮助企业客户做出更好、更合理的商业决策i r l 。一般地,商务智能由 商务智能应用、访问工具、数据存储和数据源、元数据管理、安全控制和数据集 成工具等几部分组成。 商务智能应用针对不同行业或应用领域有不同的商务智能解决方案,许多软 件制造商提供商务智能的通用解决方案或面向行业的方案支持。其中,o r a c l e 公 司的o r a c l e l 0 产品提供了为大中型企业的商务智能构建提供了较佳的平台支持, 该平台尤其重视大容量数据带来的挑战和对电子商务环境中近似实时复杂分析的 需要。此外,o r a c l e l o 还提供了第一个真正的商务智能平台,带有对联机分析处 理( o l a p ) ,d a t a - m i n i n g ( 数据挖掘) 以及e x t r a c t i o n ( 提取) 、t r a n s f o r m a t i o n ( 转换) 和l o a d i n g ( 加载,e t l ) 操作的扩展数据库支持【8 j 。 3 安徽理ji :人学硕:t :学位论文 1 3 2 电子商务与智能推荐系统 国外发达国家、发展较快的发展中国家和国内重要城市及大部分省会城市都 已建立了电子商务公共服务平台,电子商务公共服务平台已成为推动经济建设和 发展的重要手段,代表了一个国家或中心城市的综合实力和水平。目前,在国外 已有部分电子商务企业把w e b 挖掘和商务智能技术应用到电子商务智能系统推荐 方向上来,用以提高企业的收益。电子商务智能推荐系统在电子商务的应用主要 是在c r m 中,体现为客户分析、站点自适应、交叉营销策略、客户的获取和保 持、改善站点结构等几个方面1 9 】0 0 】。 电子商务智能推荐系统是商务智能领域发展强劲的一个分支,得到越了来越 多研究者的关注。a c m 每年召开一次电子商务的研讨会,主题集中在电子商务 中的w e b 挖掘技术和推荐系统技术;s i g i r 在召开的第2 4 届研究和发展会议上, 开始专门把推荐系统作为一个研讨主题;第7 届国际人工智能联合会议i j c a i 则 把e b u s i n e s s & t h ei n t e l l i g e n tw r e b 作为一个独立的研讨小组1 9 1 。推荐系统是w e b 数据挖掘在电子商务中运用的一个热点。 国内外较为突出的研究机构有以下几个: 1 n e c 公司的“v 5 - 7 8 2 0 系统; 2 i b m 公司a b a l l m a n 等人研究的s p e e d t r a c e r 系统; 3 m i n n e s o t a 大学的j b e ns c h a f e r 等人运用协作过滤方法产生推荐; 4 s t a n f o r d 大学m e h m e th g o k e r 等人研究对话形式的推荐系统,主要帮助 用户过滤信息; 5 k w o n gh i uy u n g 等人的在线售书推荐系统,运用到了多种数据挖掘技术; 6 意大利p a o l ob u o n 等人研究的推荐系统中,从显示和隐式两方面获得用 户模式及用户评价,以此作为推荐依据; 7 i l l i n o i s 大学的b a m s h a dm o b a s h e r 、r c o o l e y 等人则在事务数据的处理、 用户模式的建立上做了相当的研究,并在w e bc o n t e n t 和u s a g e 结合上做了相应的 尝试; 8 清华大学的o p e nb o o k m a r k ,南京大学推出了个性化信息检索智能体 d o l t r i a g e n t ,浙江大学研制了个性化信息检索系统n e t l o o k e r 。 电子商务推荐系统( e cr e c o m m e n d e rs y s t e m s ) 它是根据用户的兴趣爱好推荐 符合用户兴趣爱好的对象。根据推荐对象的不同,目前主要有两种类型的推荐系 统【1 0 l ,种是以网页为推荐对象的搜索系统,主要采用w e b 数据挖掘的方法和技 4 1 绪论 术,为用户推荐符合其兴趣爱好的网页,如g o o g l e 等;另一种是网上购物环境下 的、以商品为推荐对象的个性化推荐系统,为用户推荐符合兴趣爱好的商品,如 书籍、音像制品等。 电子商务推荐系统给客户推荐产品,并提供给客户所需要的信息来帮助他们 更好的进行消费。智能推荐系统既可以通过统计学的方法,将最热销的商品推荐 给客户,也可以根据某个客户以往的消费行为,预测出客户可能需要购买的其他 相关商品,从而进行商品推荐。同时,推荐的形式也是多种多样的,可以建议客 户购买某件商品,可以提供个性化的商品信息,还可以汇总并提供其他客户的意 见和评论。总的来说,智能推荐系统帮助网站给不同的客户提供不同的个性化服 务。从某种意义上来说,智能推荐系统是在为每一个客户创建一个为其量身定做 的商店i l 。 1 3 3 国内外推荐系统应用现状 目前几乎所有的大型电子商务网站都不同程度地使用了电子商务推荐技术, 比如a m a z o n 、c d n o w 、e b a y 和d a n g d a n g 等,但是相对于大多数商业网站来说电 子商务推荐技术应用的规模和运行的质量还存在着很多的问题,特别是一些中小 型的企业在推荐系统的成熟商业应用上还有很大的距离,构建高效率、低成本、 易实施的电子商务智能推荐系统是十分迫切和必要的。国内外推荐系统的应用现 状如下1 1 2 1 : 1 a m a z o n :a m a z o n c o m 亚马逊是最大的网上书店,其推出一种名为p l o g 的服务。p l o g 是一种个性化的b l o g ,主要通过对用户们浏览过的商品和购物记录 进行筛选,来给用户提供推荐的商品和相关的购物信息。它可以帮助用户发现新 推出的商品和跟踪自己的订单。p l o g 中的记录是按照时间的逆序进行排列的,而 且p l o g 会随着用户访问a m a z o n 次数的和交易数口的增加而变得更加有用和有 趣。 2 e b a y :e b a y 是世界最大的网上交易平台。e b a y 使用用户反馈模型机制来 促进买卖双方的交易。反馈包括一个满意度的评分( 感到满意、一般或感到不满意) 以及关于其它客户相关评述,系统根据反馈信息向用户提供推荐。反馈模型包括 最近的7 天、过去的一个月以及最近的6 个月的用户评分,在需要的情况下,买 方可以浏览只针对卖主的评分和评论。 3 g r o u p l e n s :由m i t 开发的自动协同过滤推荐系统,用于新闻组信息的推 荐。g r o u p l e n s 系统通过用户的评分信息自动搜索用户的最近邻居,然后根据近 5 安徽理工人学硕士学位论文 邻居的评分信息产生最终的推荐结果,适合于用户数量比较大的场合。g r o u p l e n s 系统具有极好的开放性,用户可以通过g r o u p l e n s 系统提供的a p i 函数向 g r o u p l e n s 服务器提供评分信息,请求推荐结果。同时,g r o u p l e n s 系统提供三种 客户端上具e m a c sg n u s ,n n 和n e w s w a t c h e r 达到上述目的。 4 m o v i e l e n s :是m i n n e s o t a 大学开发的研究型自动协同过滤推荐系统,用 于推荐电影。与g r o u p l e n s 不同,m o v i e l e n s 系统是一个基于w r e b 的推荐系统, 系统通过浏览器的方式进行用户评分数据收集与推荐结果显示,用户使用更加方 便。 5 h i d e or e c o m m e n d e r :是b e l l c o r e 开发的协同过滤推荐系统,用于电影推 荐。v i d e o r e c o m m e n d e r 系统通过电子邮件的方式收集用户评分数据,提供推荐服 务。在v i d e or e c o m m e n d e r 系统中,不仅可以预测用户最喜欢的电影,也可以预 测用户对特定电影的评分。在v i d e or e c o m m e n d e r 系统提供推荐结果时,同时向 用户提供用户最近邻居的电子邮件联系方式,以及用户与最近邻居的相似度等信 息。 6 r i n g o :由m i t 媒体实验室开发的研究型协同过滤推荐系统,用于提供个 性化的音乐推荐服务。r i n g o 系统可以向用户推荐用户最喜欢的音乐,预测用户 最不喜欢的音乐,也可以预测用户对特定音乐的评分。 7 国内的商业网站如e b a y 、当当、卓越等也设计了依附于商品展示的推荐 模块,这些推荐模块被设置为对客户浏览或购买行为处于敏感状态,方便了客户 购物,也促进了网站商品销售。 1 4 论文的研究对象和所做的工作 本文的研究的对象是电子商务个性化智能商品推荐系统,这里特别是指在电 子商务网络购物环境下,以产品为主要推荐对象的个性化推荐系统及个性化推荐 算法。对智能商品推荐系统中的用户兴趣建模、推荐算法、推荐系统体系结构及 智能推荐系统的设计与实现等关键技术进行了有益的探索和研究。 本文主要做了以下几方面的研究工作: 1 对现有电子商务推荐系统的形式、分类和一般体系结构进行了深入的分析 和研究。对推荐系统采用的信息检索、信息过滤和w e b 数据挖掘等相关技术进行 了简要的介绍,并将动态模糊逻辑在电子商务信息处理中的应用进行了初步的探 索。 2 研究用户兴趣建模的相关内容,综合用户浏览时间、点击次数和拉动滚动 6 l 绪论 条次数等反应用户兴趣的数量化描述,建立一种改进的非线性回归分析方法对用 户兴趣进行建模,并提出利用a j a x 技术完成对用户兴趣数据源的搜集,取代以 往对w e b 日志处理的繁杂过程。 3 分析现有的推荐策略及其优缺点,着重分析了关联规则和协同过滤两种主 要的推荐算法各自的原理、适用范围及优缺点等。并在此基础上,引入商品基因 的概念,提出一种基于商品基因和遗传算法的个性化推荐算法,有效的提高了商 品推荐的覆盖率和准确率,并通过试验初步验证了算法的准确性和有效性。 4 基于j 2 e e 框架搭建了一个开放式推荐系统原型,j 2 e e 技术可以方便的将 m v c ( m o d e l v i e w c o n t r o l l e r ) 模式应用于复杂的网络平台之上,因此很适合网上 智能推荐系统的需求。系统的设计目标是生成一个通用性的智能推荐系统平台, 可以方便的集成多种模式的推荐算法,针对不同的用户情况采用适应性的推荐算 法和推荐策略。 1 5 论文的结构安排 本文主要的结构安排如下: 绪论部分先介绍了课题来源、选题背景与研究意义,对电子商务智能推荐系 统的应用现状、存在问题及经济和社会意义作了一个概貌性的描述,其后,介绍 了本文的研究对象和所做的工作。 第二章研究了电子商务智能推荐系统的概念、分类、推荐问题的形式化描述 和推荐系统的数据形式,对推荐系统框架做了简要的分析,并介绍了推荐系统的 一些相关技术。 第三章主要研究了用户兴趣建模的相关内容,利用一种改进的非线性回归分 析方法对用户兴趣进行建模,并提出利用a j a x 技术完成对用户兴趣数据源的搜 集,取代以往对w e br 志处理的繁杂过程。 第四章主要研究现今电子商务智能推荐系统中主要采用的推荐策略和推荐算 法,比较其原理、优缺点及其适用范围等相关问题,并再此基础上引入商品基因 的概念,提出一种基于商品基因和遗传算法的个性化推荐算法,有效的提高了商 品推荐的覆盖率和准确率。 第五章基于j 2 e e 框架搭建了一个开放式推荐系统原型,j 2 e e 技术可以方便 的将m v c 模式应用于复杂的网络平台之上,因此很适合网上智能推荐系统的需 求。 第六章为本文的总结和展望,提出将来的进一步工作。 7 安徽理:l :人学硕: 二学位论文 2 电子商务智能推荐系统及其相关技术 根据推荐对象的不同目前主要有两种类型的推荐系统,一类推荐系统的对象 为网页链接,主要运用w e b 挖掘技术,推荐符合用户兴趣的网页;另一类推荐系 统的对象为产品,这类推荐系统主要应用在电子商务购物环境下,帮助用户找出 其真正想要购买的产品。本章将详细介绍电子商务推荐系统体系结构及其相关技 术。 2 1 电子商务智能推荐系统概述 2 1 1 电子商务推荐系统的含义 电子商务推荐系统( r e c o m m e n d a t i o ns y s t e m sf o re c o m m e r c e ) 的正式定义 由r e s n i c k & v a r i a n 在1 9 9 7 年给出【1 3 】:“利用电子商务网站向用户提供产品信息 和相关建议,帮助用户决定购买什么产品,通过模拟销售人员帮助用户完成购物 过程的系统 。 推荐系统面对的是用户( u s e r ) ,任务是为用户提供对项目( i t e m ) 的推荐。用户 是指推荐系统的使用者,也就是电子商务活动中的客户。项目是被推荐的对象, 是指电子商务活动中提供给客户选择的产品和服务,也就是最终推荐系统返回给 用户的推荐内容。在一个电子商务活动中,用户数和项目数是非常多的,推荐系 统面对的当前用户,称为目标用户或者活动用户。推荐系统的当前工作,就是为 根据一定的算法,给出对目标用户的推荐项目。 电子商务智能推荐系统的关键是建立用户模型,为了建立合理的用户模型, 保证不同用户对实时性,推荐方式等的要求,产生了一系列的推荐技术和算法。 例如协同过滤技术、分类和聚类技术、关联规则技术、神经网络技术等1 1 4 1 。推荐 系统研究的热点是推荐技术和推荐算法的研究。推荐算法是整个推荐系统的核心, 它的性能决定了最终推荐结果的好坏。电子商务个性化服务已经成为网络技术和 智能信息处理中研究的热点。 电子商务推荐系统的概念模型如图2 1 ,它描述了典型的推荐系统的一般过 程。首先,用户访问网站,其浏览行为信息包括显式参与和隐式获得两种途 径的信息,由浏览器反馈给网站服务器。然后网站的业务逻辑分析层对用户信息 进行处理,再结合该用户以往浏览网站所登记的行为信息生成用户模型,接下来 核心推荐引擎通过分析用户模型、已有模式和存在的商品信息三方面的数据得到 8 安徽理工人学硕+ 学位论文 准备推荐给用户的候选商品列表,最后再经过预先定义规则的筛选生成最终的推 荐结果。w e b 服务器再把最终的推荐结果转换为w e b 页面的形式返回给用户的浏 览器。 一一一i 图2 1 电子商务推荐系统概念模型图 f i g2 1t h ec o n c e p tm o d e lo fe - c o m m e r c er e c o m m e n d e rs y s t e m 2 1 2 推荐问题的形式化描述 表现层 推荐层 数据层 推荐问题可以用以下形式化的方法加以阐明: c 表示所有用户( c u s t o m e r ) 的集合,s 表示所有可能被推荐的商品项目 ( s u b j e c t ) 集合。s 的向量空间可能非常大,在一个具体的应用中会包含成千上万 的项目。同样,在实际应用中用户集合c 空问也会非常大。函数u 作为度量某商 品项目s 对用户c 的有用程度( 即c 对s 的评价) 效用函数,u 的定义为: 甜:c s 专尺( 2 1 ) r 是所有用户的评价集合。对于用户空间中的每一个用户,我们的目的是从 9 w e b 浏览器 一-一一一一一一一一一一一一一一一一一一一一一一一一一一一一一一一一一一一一叫r 一一一一一一一一 用户浏览信息推荐结果集 1;一一一一一一一一一一一一一一一_ 一一- 一一一一一一一一一一一一一一一一一_ w e b 服务器 l j + r 生 r 核 r 生 数 据 当成当心推成 预 前 用 前 推 荐 推 处 用 户 用 荐 候 荐 户 模 户 引 选 结 理事模列 务 型 型 擎 表 果 用户历史信息 二7 r 、二信息 一一一一 - 一一卜一一一i 一一一1 西户信息司e 模式库j昏品信息司 安徽理: 大学硕士学位论文 商品项目空间中寻找能使用户效益( 代表用户的满意度) 最大化的商品项目,即: vc c ,s 。= ma x “( c ,j )( 2 2 ) j s 由于推荐系统巨大的实际应用价值,己经引起了学术界和商业界的共同兴趣, 成为电子商务中热门的研究领域之一。 2 1 3 电子商务推荐系统的分类 一种完全以顾客观点为中心的基于二维属性分类方法【l5 1 ,这二维属性分别为 自动化程度( d e g r e eo fa u t o m a t i o n ) 和持久性程度( d e g r e eo fp e r s i s t e n c e ) 两个标 准。 1 自动化程度是指客户为了得到推荐系统的推荐是否需要显式地通过手工 或自动地输入信息的程度。自动方式意味着推荐的产生不需要客户任何明显的操 作,例如当客户与网站进行交互时,系统自动出现客户感兴趣的商品推荐。手工 方式意味着客户得到符合自己兴趣的推荐前需要进行一些显式的操作,如对产品 进行评价等。自动化程度范围从完全手工到完全自动化。 2 持久性程度指推荐系统产生的推荐是基于客户当前的单个会话( s e s s i o n ) 还是基于客户的多个会话,是短暂的还是持久的。短暂性的推荐只考虑当前客户 的会话,不考虑该客户以前的任何信息。持久性的推荐则通过对当前客户的识别, 再结合以往他的个人行为信息,分析他的偏好进而进行推荐。 按照以上二维属性,推荐系统可大致分为四类【l6 】: 1 非个性化推荐( n o n p e r s o n a l i z e dr e c o m m e n d a t i o n ) 非个性化推荐是指推荐是基于其他客户的平均情况产生的,由于推荐独立于 用户,所以每个用户得到相同的推荐。非个性化推荐是自动化的,因为它们几乎 不需要客户的参与,同时它又是短暂的,因为系统既然不是基于用户的,也就无 法鉴别会话中的用户。这种推荐系统来源于实际的商场推荐应用一把最畅销的商 品摆在最明显的位置。简单和自动化是这种系统最大的特点,但是没有考虑客户 个性需求的问题也是这种系统致命的缺陷。 2 基于属性输入推荐( a t t r i b u t e d b a s e dr e c o m m e n d a t i o n ) 基于属性输入推荐是指用户根据所需商品的某一种或几种属性特征,明确地 向推荐系统提出搜索要求,由系统返回满足要求商品列表的过程。基于属性输入 推荐通常是手工操作的,需要用户向系统提供特征关键词描述来得到推荐。它可 以是持久的也可能是短暂的,主要取决于系统是否记录了用户的前次会话信息作 1 0 安徽理工人学硕士学位论文 为本次可参考的描述。 3 项目之间相关性推荐( i t e m - t o i t e mc o r r e l a t i o n ) 项目之间相关性推荐是指推荐是通过学习用户己选的或喜好的商品项目,来 掌握用户的兴趣,进而据此向用户推荐的过程。它可以看作是一种应用“购物篮 分析技术的系统。项目之间相关性推荐是基于用户的行为( 购物篮中的商品) ,所 以可以自动地向用户推荐相关或互补的商品,另外用户手动输入一些自己感兴趣 的信息,有助于系统更加准确的推荐。它不需要了解用户历史的会话信息所以是 短暂性的。 4 用户之间相关性推荐( p e o p l e - t o p e o p l ec o r r e l a t i o n ) 用户之间相关性推荐是指,基于用户与该网站上的其他客户的相关性,来指 导系统产生推荐的过程。这种系统使用的是一种叫做“协同过滤”的技术【1 7 】【1 8 】【1 9 】 ( c o l l a b o r a t i v ef i l t e r i n g ) 一种信息过滤技术的延伸。用户之间相关性推荐可以 是手工的,需要用户对商品的评价值,也可以是自动的,通过用户在网站上的浏 览行为隐式地得到用户对某类商品的评价值。它一般都需要从用户的历史会话信 息中学习用户兴趣,所以它是持久性的。这种推荐系统是目前研究的最多的,也 被认为是最能满足用户个性化要求的系统,有广泛的应用前景,本文后面的部分 将详细地描述它的实现技术。以上仅仪是对推荐系统一个学术上的硬性分割,在 现实中其实很难找到标准的某类推荐系统,应用中往往都是结合了多种特征的混 合系统,比如a m a z o n c o r n 的推荐系统就是结合了以上所有四种特征的混合体。 2 1 4 推荐系统的数据类型 1 输入数据 如前文所述,不同类型的电子商务推荐系统其核心推荐引擎不尽相同,所以 其要求输入信息也有所差异。各种电子商务推荐系统根据各自的输入信息会产生 不同类型的推荐。电子商务推荐系统的输入可以是用户当前的行为( o n 事务信息、 浏览行为) ,也可以是用户访问过程中的历史行为。在大型的电子商务系统中,为 了产生高质量的推荐,推荐系统可能需要多种类型的输入信息。 电子商务推荐系统的输入包括下列七种形式【2 0 】: 1 ) 隐式浏览输入 将用户访问电子商务w e b 站点的浏览行为作为推荐系统的输入,用户的浏览 体验与访问一般的w e b 站点没有区别,并不知道电子商务推荐系统的存在。用户 当前正在浏览的商品、用户购物篮中选择的商品、用户的浏览路径等都可以作为 安徽理工大学硕+ 学位论文 隐式浏览输入信息。 2 ) 显式浏览输入 也是将用户的浏览行为作为电子商务推荐系统的输入,但与隐式浏览输入不 同,用户的显式浏览输入是有目的的向电子商务推荐系统提供自己的兴趣爱好。 例如,电子商务系统提供一系列热门商品供用户选择,用户需要选择浏览自己感 兴趣的商品列表,电子商务根据用户的浏览行为向用户提供个性化的推荐服务。 3 ) 关键字商品属性输入 用户在搜索引擎中输入关键字作为推荐系统的输入,或者将用户当前正在浏 览的商品类别作为推荐系统的输入。这种类型的输入不同于用户随意的浏览行为, 用户输入的目的就是在电子商务系统中搜索自己需要的商品。 4 ) 用户评分输入 将用户对商品的数值评分数据作为推荐系统的输入。电子商务推荐系统列出 一系列商品让用户评分,用户的评分可以是一个数值,数值大小表示用户对商品 的喜好程度,也可以是一个布尔值( 0 代表不喜欢,1 代表喜欢) 。用户提供的评分 数据使得电子商务推荐系统可以为用户提供个性化的推荐服务。 5 ) 用户文本评价输入 用户对己经购买的商品或自己熟悉的商品以文本的形式进行个人评价,推荐 系统本身并不能判断这些评价的好坏。其他用户浏览该商品时,可以看到用户对 商品的文本评价信息。 6 ) 编辑推荐输入 将领域内专家对特定商品的评价作为推荐系统的输入,领域专家对商品的性 能特点进行全面详细的介绍,用户通过专家的专业介绍,可以对自己并不熟悉的 商品加深认识,从而决定是否购买该商品。 7 ) 用户购买历史输入 推荐系统将用户的购买历史作为隐式评分数据。一旦用户购买了特定商品, 则认为用户喜欢该商品。推荐系统根据用户的购买历史产生相应的推荐。但是用 户购买了某件商品并不代表用户喜欢该商品,所以在精确的推荐系统中,用户可 以对购买的商品进行重新评分,从而使推荐系统产生更精确的推荐。 2 输出数据 不问类型的电子商务推荐系统,其输出也各不相同。大型电子商务系统可以 同时产生多种不同形式的输出结果。 电子商务推荐系统的输出形式主要包括2 0 j : 1 2 安徽理工人学硕十学位论文 1 ) 相关商品输出 推荐系统根据用户表现出来的行为特征或电子商务系统的销售情况向用户产 生商品推荐,这种方式是电子商务推荐系统中最为普遍的一种输出:相关商品输 出可以基于简单的销售排行,向用户推荐热门商品。也可以基于对用户的行为特 征进行深入分析,发现用户的购买行为模式,从而产生个性化的推荐。 2 ) 个体文本评价输出 电子商务推荐系统向目标用户提供其他用户对商品的文本评价信息。个体文 本评价一般是非个性化的,对每个项而言,所有用户得到的个体文本评价均相同。 3 ) 个体评分输出 向目标用户提供其他用户对商品的数值评分信息。个体评分输出没有大量的 文本描述信息,因此更加简洁明了。个体评分输出比较适合于个体数

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论