1电子商务推荐模型介绍.doc_第1页
1电子商务推荐模型介绍.doc_第2页
1电子商务推荐模型介绍.doc_第3页
1电子商务推荐模型介绍.doc_第4页
1电子商务推荐模型介绍.doc_第5页
已阅读5页,还剩3页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1电子商务模型介绍当前,企业经营已经由“以产品为中心” 转变为“以客户为中心”。任何与消费者行为有关的信息对商家都是非常宝贵的。一个好的构架的电子商务网站,会给买家或卖家带来一些无形的价值。随着企业电子商务的蓬勃发展,电子商务的后台数据库能够保留下来大量的交易资料和与顾客相关的数据,但数据并不能代表信息。如何从海量的数据资源中挖掘所蕴涵的有益信息是当前的研究热点.当前经济模式的变化,从传统的实体的商店到Internet上的电子交易,同时也改变了销售商和顾客的关系。现在,网上顾客的流动性很大,他们关注的主要因素是商品的价值,而不像以前注意品牌和地理因素。因此,电子零售商一个主要的挑战是需要了解到客户尽可能多的爱好、价值取向,以保证在电子商务时代的竞争力。通过在Web上应用数据挖掘技术,从买家、卖家信息及交易数据中挖掘潜在有用的信息。使得卖家能够深入了解竞争对手的销售情况并能更好的找到潜在的买家;使得买家能够更好的了解自己中意的商品最近有哪些买家买过以及商品价格走势情况如何。1.1 卖家信用级别电子商务给我们提供了快速、便利的网上销售渠道。作为一个卖家,自然想到的是如何才能销售更多的产品,获取更大的赢利。这也是每个C2C卖家十分关心的问题。然而要想在网上开店,需要考虑的问题也就很多了。首先关注的是在网上众多的商品种类中,目前畅销的有哪些类别的产品?在确定销售某类商品后,在该类商品下哪些品牌、型号或者样式最好卖呢?同时,我们也要考虑给商品定一个合适的价位,什么样的价位才最有竞争力。知己知彼,百战百胜。竞争对手的信息对卖家来讲也是十分有用的。通过了解对手、学习对手,才能更好的超越对手。通过的一定的分析,寻找和自己销售同样类别商品的对手卖家,对其销售记录、所售商品类别、销售行为、客户分布等一系列的分析,试图从各个角度来找对竞争对手的一些规律,就找到自己努力的方向了。当然卖家还可以通过各种不同的途径来了解各种不同类型的买家,分析其各自的兴趣爱好等特点,有针对性的销售自己的产品,等等一系列很多的因素决定了卖家的赢利。对于买家来讲,关注的不仅仅是卖家所卖的商品,价格,很自然的就会去关注卖家历史的销售记录、买家对其评价如何,该卖家的信用如何,级别是高或低?我们坚持从分析自身角度出发,卖家自身的各方面的条件也得具备。我们知道,卖家信誉度越高,级别也就越高。当然其级别也是和销售商品的数量成正比关系的。与此同时,卖家级别越高,信誉度自然就高,买家就会去思考该卖家的产品是否也会卖的好。要不然怎么会有那么多人来买。C2C买家自然就很信任该卖家。所以大家都倾向于向他购买商品。那么,各个不同级别(比如 红心、 钻石、 皇冠)的卖家除了和本身销售的商品数量积累有关系外,是否还有其它因素会影响卖家级别呢?比如卖家所在地区、所卖商品类别、注册时间、拥有的商品数量等等。卖家信用级别分析讨论的关键问题也就是分析影响卖家级别的因素,找出其中蕴含的规律。数据挖掘技术在卖家级别分析过程中,我们知道,卖家的级别(钻石、红心等)是和卖家销售的商品数量成正比的。除了这个因素之外,我们试图找出与卖家级别相关的其他指标。这可以通过数据挖掘中的关联规则或者分类算法分析。卖家级别分为红心,钻石、皇冠,将其作为类标签属性。选择卖家的所在地区、注册时间、拥有商品的数量和商品类别作为训练属性,来找出卖家的级别和哪些因素有关系。通过用数据挖掘的方法来发现隐藏在其中的规律。1.2买家细分买家细分是指将一个买家群体划分为一些小的买家群集合。同属一个买家群体的买家彼此相似,不同买家群的买家被视为是不同的。最后我们可以利用数据来描述或给出买家的特征,然后根据当前买家的特征,去寻找新的买家。基本的出发点是每个买家对某种产品的关注是不同的,因此作为卖家来讲,必须尽可能的考虑这些差异,发现存在于买家整体内部的、具有不同特征或消费习惯的买家群体,再根据每个群体的特征执行针对性的管理或营销策略。 对于生活日用品或者游戏点卡或者宠物用品这样的易耗品,找到稳定的买家名单,或者是找到喜好某种风格或者品牌的买家,便找到了可以进行针对性营销的对象,将其发展成为店铺的好友或者vip会员也是一个不错的方法。不仅如此,我们可以通过一些方法获取买家的购买记录,购买偏好分析,购买行为分析,卖家选择偏好分析。更多的了解买家,有针对性地销售,多渠道的提升自己的利润。分析买家、了解买家并引导买家的需求已经成为各C2C卖家非常关注的问题。通过对电子商务系统收集的交易数据进行分析,可以按各种买家指标(如自然属性、收入贡献、交易额、价值度等)对买家进行分类,然后确定不同类型买家的兴趣爱好和购物行为,以便采取相应的营销措施,卖家也就获取最大的利润。数据挖掘技术在买家细分过程当中,我们开始并不确切知道在所有C2C买家中,购买游戏点卡的买家有什么样的特点,哪些类型的买家会经常在晚上八点购物等等。很显然,通过买家细分我们能找到买家的特点,发现其兴趣爱好。从而有针对性地采取不同销售措施。由于当中涉及到很多不同的因素,一般统计方法并不能对买家做出不同的类别划分。然而,数据挖掘技术为我们找到了答案。物以类聚,人以群分。我们可以通过数据挖掘中聚类的方法,来对买家做出细分模型,从而找出具有不同属性特点的不同类别的卖家。聚类的目标是把数据划分到不同的组中,组之间的差别尽可能大,组内的差别尽可能小。1.3 商品促销在电子商务交易过程当中,买家和卖家之间的一买一卖,累积了大量的数据。数据丰富,但我们如何发现隐藏其中的信息才是我们最关注的问题。大量的数据对于数据挖掘的准确性来说是有很大帮助的。我们通过对历史交易数据中找出买家所购买商品之间的规律。这些购买行为的信息很有可能就决定该买家下一次的购买行为,甚至起到决定的作用。这个时候数据挖掘的作用就体现出来了。 我们知道频繁购买某类商品的买家 ,也是该类商品的潜在买家。那我们可以提出质疑,重复购买某件商品的买家未必会继续购买该商品。对某些商品事实确实如此,如果是这样,我们就要开动脑筋去寻找那些关联性强的商品,比如,买过牙膏的买家一般会买牙刷(直白的关联),找到所在行业的商品关联性,也能找到潜在的买家了。 漫无目的的群发只能造成大量的垃圾信息和用户的反感,而针对性的广告促销也许会给买家增加一种购买的选择。抱着和买家作朋友的心态,您会为自己的店铺增加很多人气的。 站点上页面内容的安排和链接应当和超级市场中物品在货架上的摆设一样,把具有一定支持度和信任度的相关联的物品摆放在一起有助于销售。利用在Web上的关联规则的发现,有针对性地调整网站内容,使买家购买的有关联的商品间的连接能够比较直接,让买家能够很容易地购买到想购买的商品。网站如果具有这样的便利性,能给客户留下较好的印象,给卖家带去了另一份惊喜。数据挖掘技术传统的统计方法并不能发现买家所购买的一系列不同商品之间的关系。通过数据挖掘技术,我们可以从历史交易记录中发现一些潜在的规律。运用数据挖掘技术可以从商业交易数据中获取商品推荐模型。我们可以使用 Top N 推荐或者关联规则来对商品进行促销。应该根据不同的需求和不同的数据采用不同的方法。C2C 电子商务商品推荐过程可以采用以下四个步骤。(1) 清理原始数据。此步骤的工作需要有第三方清理工具支持。因为和商品相关的数据和 Web 日志数据相比,大多数情况下清理工作的负担很轻,手工操作即可完成。(2) 数据导入数据仓库。清理好的数据需要导入到推荐系统的“数据/模型管理”负责的数据仓库中。它以容易管理的“数据集”的形式来存储这些数据。(3) 生成推荐模型。我们运用关联规则来生成推荐模型。从保存的数据集中生成“推荐模型”。(4) 部署推荐模型。通过推荐引擎管理,配置推荐策略,包括推荐算法及其推荐模型,然后启用这些策略即可。在正式使用之前,我们可以使用测试工具来测试推荐策略产生的效果。1.4价格定位及异常交易一个合理并且有竞争力的价格便是所有买家最具诱惑力的因素之一。对所有买家而言,在网上购物,当然是货比三家,希望淘到最便宜的商品了。就像菜市场买菜,对于网上的买家来讲,如何知道自己想买的商品的价格是否合理也是一个值得思考的问题。对于同一类型的商品,不同的卖家出的价钱并不一样,有的卖家并不守诚信,一件商品定位特高,卖出了人就销声匿迹。这种网络诈骗的情况还是会有发生的。为了防止这样一种情况的发生,我们可以根据历史交易记录中不同卖家的出价记录来定位出一个比较合理、更具真实的价格,也让买家买的放心,用的舒心。当然 ,对于大多数忠实的卖家也希望能够定位一个合理的价格,既能够使自己的商品卖得出去,也能获取一定的利润,让买家和卖家都能够比较满意。系统总体框架主要由数据预处理阶段、模型建立阶段、模型应用阶段三个层次组成。总体思想是先确定拟购买的商品,分析历史购买记录中成交的价格,根据分位数定位出一个单品的参考价格,运用异常检测方法分析交易是否属于异常交易。1.5用户个性化服务当用户在电子商务网站注册时,客户将会看到带有客户姓名的欢迎词。根据客户的订单纪录,系统可以向客户显示那些可能引起客户特殊兴趣的新商品。当客户注意到一件特殊的商品时,系统会建议一些在购买中可以增加的其它商品。普通的产品目录手册常常简单地按类型对商品进行分组,以简化客户挑选商品的步骤。然而对于在线商店,商品分组可能是完全不同的,它常常以针对客户的商品补充条目为基础。不仅考虑客户看到的条目,而且还考虑客户购物篮中的商品,结果就会使推荐更加个性化。2数据挖掘技术的应用2.1卖家信用级别分析2.1.1模型介绍影响卖家级别(钻石、红心和皇冠)的因素很多,除了和这个卖家销售的商品数量积累有关系外,还和其他属性是否有关系?比如地区、商品类别、注册的时间、销售商品的数量、等等。我们希望从中找出和卖家级别相关的因素的指标,帮助卖家提高信誉度,从某种程度上提高销售量。目前的数据主要是淘宝的数据。由于上许多卖家的买家信用级别和卖家信用级别都是空值,为此,我们做了相应的空值处理。去除了没有信用级别的卖家。将卖家其作为类标签属性。选择卖家开店时间,卖家所在地区,卖家拥有的商品数量,卖家的买家信用级别作为训练属性。2.1.2模型展示选取了“C2C 平台的淘宝卖家(店铺)记录表”的246990条数据作为实验数据。选取了卖家开店时间、卖家所在地区、卖家拥有的商品数量、卖家的买家信用级别、卖家的卖家信用级别作为输入字段,其中,卖家级别字段作为类别属性。 我们采用判定树作为分类算法是出于以下几点考虑:(1)与神经元网络和贝叶斯分类法相比,决策树算法的结果更容易理解;(2)训练神经元网络可能花费大量的时间,进行成千上万次的重复遍历,而演绎生成决策树则非常有效,适合训练大的数据集;(3)决策树算法无需额外的信息,且具有较高的分类准确率; 算法输入:训练集、剪枝精度、树的最大高度、节点所含记录数 结果输出:二叉判定树2.2买家细分模型如何找到我的潜在买家,该买家的信誉、购买能力、消费偏好如何?这是每个买家都十分关心的问题。为了能使卖家从多角度的了解相关买家,从而发现一些潜在的卖家,提高销售量。2.2.1买家购买行为分析物以类聚,人以群分。可以说,在网上购物的买家真是形形色色、千姿百态。当然,每个买家都具有各自不同的特点。在网上购物的千千万万买家当中,是否存在一些较相似的购买群体呢?这一点对于好的分析结果来讲是很有意义的一个结论。大家知道,每个买家的性别、年龄、职业、教育程度以及收入状况等等可以说是不同的。他们的购物习惯也自然就不同了。在我们国内,由于各种不同的原因,无法得到网上购物买家的这些真实信息。我们就很难从这些信息当中去得到什么结论了。不过从买家的购物经历来讲,还是有一些属性可以来区分买家的。从买家的所在地区、注册时间、卖家级别、买家级别以及是否拥有店铺来做一些分析。这些信息都是有用并且可靠的。买家的所在地区真实否则无法交易,注册时间、买家级别、卖家级别以及店铺信息都可以通过买家购买行为由系统获得。2.2.2模型介绍买家的细分模型可以从两个方面做分析。一是从买家本身所具有的一些基本属性来做分析,如买家所在地区、注册时间、买家级别等。我们还可以通过买家的购买行为来做一定的分析。比如买家所购买商品的类别、经常会在哪个时间段购物。2.3商品的推荐模型我们通过分析交易中所购买商品的相关性,分析该买家对哪些商品感兴趣,以了解其消费偏好,从而有效的推荐商品,并给出商品推荐模型。关联分析是寻找在同一个事件中出现的不同项的相关性,比如在一次购买活动中所买不同商品的相关性。在电子商务数据分析过程中,我们需要找出在一次购买活动中所买不同商品的相关性,从而利用商品推荐的

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论