基于淘宝网的消费者网络购物口碑的研究_第1页
基于淘宝网的消费者网络购物口碑的研究_第2页
基于淘宝网的消费者网络购物口碑的研究_第3页
基于淘宝网的消费者网络购物口碑的研究_第4页
基于淘宝网的消费者网络购物口碑的研究_第5页
已阅读5页,还剩8页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、基于淘宝网的消费者网络购物口碑的研究北京师范大学 施昀 包钰摘 要 随着网络消费的兴起,网络口碑对人们的影响也日益显著。本文先比较了网络口碑与传统口碑的异同。然后针对淘宝网买家对商铺的评分系统进行评价和分析,指出其合理性,分析消费者的网络口碑与时间变化的相关性,对消费者基于口碑选择商品和商铺的改进给出合理意见与建议,为后续的更深入更广泛的量化研究做准备。关键字词:网络口碑;淘宝网商铺;相关性分析;回归分析一、 研究背景和目的 进入21世纪,互联网已然成为人们生活的必需品,根据中国互联网络信息中心(CNNIC)的统计,截至2008 年6 月底中国网民人数已经达到2.53亿人,首次大幅度超过美国,

2、跃居世界第一位,其中有25% 的网民青睐网络购物,电子商务以其价格低廉、产品丰富、方便灵活逐步得到网民的接受,跻身十大网络应用之列 7 。网络口碑传播呈现出波及范围大、 传播速度快、 匿名性 非面对面接触等新的特点,消费者的口碑将比以往更具有影响力 (Chatterjee, 2001; Hennig2 Thurau, et al, 2004; Hoffman, et al, 1996)8。1. 网络口碑的概念和要素口碑是消费者与消费者之间关于产品或服务的特性、使用经验及提供商等的信息的交换和沟通。传统口碑是通过口耳相传的方式进行沟通的。因特网的出现,使顾客可以通过浏览网页收集其他消费者提供的产

3、品信息以及与此产品有关的讨论,并且顾客可以通过互联网针对特定产品进行自身经验、意见与相关知识的分享,这就形成了网络口碑。2. 网络口碑与传统口碑的区别表 1 网络口碑与传统口碑传播特征的比较比较项目传统口碑网络口碑传播媒介主要是人际间的面对面接触电子邮件、 新闻组、 在线论坛、 产业入口网站讨论区、 电子布告栏、 聊天室等传播形式语言、 声音和表情数字化的多媒体信息 ,包括文字、图片、 声音、 音乐等传播速度人际之间一对一的沟通 ,传播速度慢一对多甚至多对多的传播、 病毒式的速度传播传播环境人际沟通的社会环境中 ,受到时空限制 ,传播范围有限开放的虚拟社会环境中没有时空限制 ,传播范围广传播信

4、息量和结构信息数量有限 ,网络结构简单信息数量庞大 ,网络结构复杂传播双方的关系传播双方身份公开 ,强联结关系为主传播双方匿名 ,身份隐藏 ,弱联结关系为主 淘宝网作为目前国内最大的网上购物网站,其商品种类、数目和客服保障系统最能体现国内网络购物的水平与状况。本文基于淘宝网的大量数据,旨在分析淘宝网买家对于商铺的评分系统,指出其合理性,分析消费者的网络口碑与时间变化的相关性,对消费者基于口碑选择商品和商铺的改进给出合理意见与建议,为后续的更深入更广泛的量化研究做准备。二、 相关研究文献回顾传统口碑对顾客态度、购买行为的说服效果已被证实,口碑传播双方多属强联结关系,对于口碑接收者而言,口碑传者的

5、信息可信度高,说服力强。大部分研究认为网络口碑较传统口碑具有较高的说服效果。Gelb等(2002)认为网络虚拟空间里,提供意见的人基本上是匿名的,信息传播者非常愿意提供真实的意见或分享第一手经验,无论是正面或负面的评论。网络口碑与传统的口碑传播相比,具有波及范围大、传播速度快等特点,因此对消费者信息搜寻购买决策、态度的形成和变化都具有更强的影响力 (Hoffman, et al, 1996; Hel m, 2000)。Tanimoto等(2003)认为,网络不受时空地理位置的限制,加上信息的易复制性,网络口碑的能见度与传播效果远远超过传统口碑。学者对传统口碑传播机制的研究较多,关注的焦点主要是

6、口碑产生动机和口碑影响力而对网络口碑传播机制的研究非常有限,多集中于再传播意愿,其中着眼于网络购物评分系统的口碑传播研究在国内尚未发现。对于网络购物的口碑传播机制和影响,国外已经有人研究。Chevalier 和 Mayzlin(2004)就不同网上购书网站的口碑对其图书排名和销量的影响做出了讨论。Mayzlin(2004)和Yong Liu(2006)就电视和电影观众在网络上的评价进行了动态模型分析。除此以外,也有对美国著名网上购物网站eBay的详细分析和讨论。三、 研究思路淘宝网商铺评分系统商品数量收藏人气宝贝与描述相符,卖家的服务态度,卖家发货的速度最近1周,1个月,6个月,6个月前,全部

7、时期的评分回归相关性回归模型四、 网络消费者口碑的影响因素1. 考察变量我们利用程序,可以从淘宝网上得到20个左右的变量。最终根据文献和实际情况,我们选取了如下与商铺评分相关的变量:商品数量收藏人气最近6个月宝贝与描述相符评分最近6个月卖家的服务态度评分最近6个月卖家发货的速度评分卖家最近1周,1个月,6个月,6个月前的好评数卖家总计好评数卖家最近1周,1个月,6个月,6个月前的中评数卖家总计中评数卖家最近1周,1个月,6个月,6个月前的差评数卖家总计差评数卖家最近1周,1个月,6个月,6个月前的总得分卖家总计总得分2. 变量分析经过网上查找,我们得知淘宝网把店铺分为了服饰、手机/数码/办公/

8、家电、家居/母婴/食品美容护肤/个人护理、文体/汽车、珠宝/首饰、收藏/爱好、游戏/花费、生活服务,这其中共有约50类商品,各类商品的店铺数如下图所示:图1 淘宝网各类商品店铺数 由上图知,店铺数大于3%的商品种类有12类,其中女装所占比例最大,为约为10%,符合大众消费者的需求。在众多类别中,我们先选择了两类进行研究,它们分别是珠宝类和数码相机类。原因有三:一是这两类商品的店铺数都超过了2%;二是这两类商品的店铺数量比较合适,挖掘数据的消耗的时间相对较少而且较准确。三是这两类商品在性质上完全不同,有比较的价值。从挖掘得到的数据得知,淘宝网站的上给出的对商家评分项有:宝贝与描述相符评分,卖家的

9、服务态度评分,卖家发货的速度评分(简称三项评分),不同时间好评数。在分析评分的关系前,我们从这两类商品中筛选出有代表性和有意义的数据,并剔除错误数据,即商品数大于50个,总评数大于200次。(1) 三项评分之间的关系首先得到两类商品三项评分的分布:图2 珠宝类店铺三项评分的分布图3 数码相机类店铺三项评分的分布由上图知,各项评分的分布近似于正态分布。表2 三项得分的关系Kruskal-Wallis testP Value珠宝2.2e-16数码相机2.2e-16利用Kruskal-Wallis test进行相关性检验。P Value<<0.05.结论:两类商品中宝贝与描述相符评分,卖

10、家的服务态度评分,卖家发货的速度评分这三项都没有关系。说明这三项评分的设置合理,有参考价值。其次,两类品的三项评分的分别进行比较。由于各项评分接近正太分布,我们采取t检验来比较两类商铺的评分。表3 两类商铺三项评分分别比较珠宝t test 数码相机宝贝与描述相符评分卖家的服务态度评分卖家发货的速度评分宝贝与描述相符评分0.000140800卖家的服务态度评分03.306e-060卖家发货的速度评分000.3734结论:两类商铺宝贝与描述相符评分不同,珠宝小于相机;卖家的服务态度评分不同,珠宝大于相机;卖家发货的速度评分相同。用类似的方法可以比较其他不同类别的商铺。(2) 三项评分与总评分的关系

11、表4 两类商铺三项评分与总评分的关系Kruskal-Wallis testP Value珠宝2.2e-16数码相机2.2e-16利用Kruskal-Wallis test进行相关性检验。P Value<<0.05.结论:这两类商铺的三项评分与总评分关系不大。(3) 除了考虑这三项评分,我们发现收藏人气和商品数量会影响消费者初期选择店铺的判断,即收藏人气越高,进店浏览的可能性越大。在此我们讨论了收藏人气与总评分的关系,如下表:表5 两类商铺收藏人气,商品数目与总评分的关系Kruskal-Wallis testP Value珠宝2.2e-16数码相机2.2e-16利用Kruskal-W

12、allis test进行相关性检验。P Value<<0.05.结论:这两类商铺的收藏人气,商品数目与总评分关系不大。3. 变量选取由前面的分析可知,商铺的宝贝与描述相符评分,卖家的服务态度评分,卖家发货的速度评分,收藏人气,商品数目与总评分关系不大,在考虑评分的时间关系时,可以先不作考虑,而作为参考变量。下面我们就总评分代表的消费者的综合评价进行模型建立。五、 模型建立与分析(一) 商铺的评分1. 淘宝的评分规则根据以上分析结果和实际经验可知,淘宝商铺的总评分值(y)与商铺的商品总数、收藏次数关联性不大,而与各种评价等级(好评(x1)、中评(x_2)、差评(x3)的数量息息相关。

13、通过回归分析研究目前商铺的总评分与各种评价等级的数量的定量关系,可以得到淘宝网对商铺的评价体系,进而方便下面考虑其他变量对消费者心理的影响,找到对店铺的合适的描述。以数码相机的商铺为例,建立的回归模型为:y=1x1+2x2+3x3+b用SAS对模型进行估计,结果为:y=0.99965x1+0.12184x2-1.14463x3 (5400.66) (1.67) (-8.63)R2=1 F=2.64×107估计模型参数下括号中为该参数的t统计量检验值,文中以下相同。(1) 对模型以及参数的显著性检验结果如下:表6 模型及参数的显著性检验F值显著性模型2.64×107<.

14、0001 显著参数T值显著性x10.99965<.0001 显著x20.121840.0942 显著x3-1.14463<.0001 显著 可知,淘宝评分模型是显著的,并且各个自变量参数的系数也是显著的。(2) 对模型进行异方差检验图4 残差图由多元线性回归理论可知,预测值的残差图中散点应随机地分布在-2到+2的带子里,这样的残差图成为正常的残差图。从上图可看出,本模型中的残差图只有少数点落在了(-2,2)之外,拥有很好的方差齐性,说明不存在异方差的情况。(3) 对模型的参数进行自相关检验求出各个参数的方差膨胀因子如下表所示:表7 方差膨胀因子参数 VIF12.7209829.14

15、97536.08654每个参数的VIF值都小于10,说明模型的参数间并不存在自相关性,各个自变量都对总评分(y)值有很好的贡献。综上所述,我们通过好评、中评、差评数拟合出了淘宝网对商铺的评分体系。经过咨询,得知每个好评数为商铺的总评分加1,中评数加0,差评数减1,这与我们拟合出的系数十分相符。2. 建立商铺分数模型商铺的创建时间对淘宝网上的商铺评分有很大影响(创建时间越早可能得到的总评分越高),但是并不意味着创建时间越早商铺就越好。为了消除时间的影响,我们将商铺在不同时期的好评、中评、差评百分比例(px1、px2、px3)作为自变量,带入上步的线性回归模型,可以得到满分为1的评分标准下,不同时

16、期商铺的得分,这样就把商铺的评分标准统一化了。模型的定义如下:std_y=p1px1+p2px2+p3px3+b2由于有些商铺的评分很接近,为了区分,我们将评分值统一扩大5倍,变为5分制,记为wy=5×std_y.3. 判别不同商品种类的商铺之间有无评分差异判别不同商品种类之间评分分值差异是否显著,一方面可以得知是否有必要针对不同的商品的商铺建立不同的评分体系,以方便消费者准确、便捷的购物;另一方面,可以找到淘宝网上商城的薄弱环节,为淘宝网上商城的建设提供很好的建议。下面,我们以数码相机和珠宝两类商品为例,分析的步骤为:(1) 列举两种商品的所有商铺的信息;(2) 筛选出商品数大于5

17、0件,对商品的评论人数大于200人的商铺:商品数小于50的商铺很有可能因为商品数过少而经营不下去(在淘宝网上只是徒有其表,实际已经“倒闭”),评论人数过少容易产生很大的误差,为了保证数据的良好性,我们采取如上措施;(3) 利用上述模型分别计算两种商品中各店铺的分值wy;(4) 利用判别分析方法判别两类商品的的商铺之间有无评分差异。(5) 结果如下:表8 数码相机与珠宝评分后的t检验t testP Value数码相机&珠宝2.2e-16图5 数码相机与珠宝重新评分后的得分分布(6) 建立不同类商品的评分模型判别分析的结果告诉我们,不同类商品的商铺评分存在明显差异,因而,针对不同类商品,需

18、要建立不同的评分体系。评分体系的模型如下:wy=5*stdy=5*i=1nDipipxi+bDi=1取pxi因子0不取pxi因子其中,n=7,分别代表商铺标准化的一周以内的评分(x1)、一个月内的评分(x2)、六个月内的评分(x3)、六个月前的评分(x4)、商品与实际相符的打分(x5)、商家服务态度打分(x6)、商家送货速度(x7)。(以上均为5分制)以数码相机和珠宝为例,讨论不同类商品的评分模型。4. 数码相机商铺的评分模型(1) 选择参数为了探究总评分与不同时间段内的评分是否有关,我们先将原数据中不同时间段的评分值取对数,建立线性模型:logy0=1log(y01)+2logy02+3lo

19、gy03+4logy04+b.表9 用SAS软件处理结果1Parameter EstimatesVariableDFParameterEstimateStandardErrort ValuePr > |t|Intercept10.834780.0231436.08<.0001Logy0110.062760.014724.26<.0001Logy021-0.014450.01999-0.720.4701Logy0310.402800.0150726.73<.0001Logy0410.429580.0056376.26<.0001上述结果

20、说明,总评分与时间关联很大,特别是最近六个月的评分(logy03)和六个月前的评分(logy04)(这两个变量参数的t值很大),最近一周的评分(log(y01))系数虽然也显著,但是最近六个月的评分与最近一周的评分有重复的部分,因此,下面建模在找寻时间变量的时候只考虑logy03和logy04。(2) 拟合模型通过1) 中简单的分析,模型拟合采用标准化的最近六个月的评分x3、六个月前的评分x4、商品与实际相符打分x5、商家服务态度打分x6作自变量,总评分值wy为函数值,结果如下:wy=2.72622+0.31012x3+0.07605x4+0.04554x5+0.02342x6R2=0.484

21、7,F=425.87检验模型和参数的显著性:表10 用SAS软件处理结果2Parameter EstimatesVariableDFParameterEstimateStandardErrort ValuePr > |t|VarianceInflationIntercept12.726220.0553349.27<.00010X310.310120.0110827.99<.00011.24263X410.076050.0057513.24<.00011.02273X510.045540.008755.21<.00012.38644X6

22、10.023420.010632.200.02772.45169从上表可以看出,所有的参数的P-value都是小于0.05的,因而所有的参数都是显著的。即:最近六个月的评分、六个月前的评分对店铺的总评分有影响,说明消费者注意观察商家是否一直更新货品;商品是否符合实际打分、商家服务态度打对最后的总评分有影响说明消费者不仅在乎商品的质量好坏,同样也注重购物的心情,商家要提高自己的竞争力,就要从有形的商品和无形的服务两方面努力。因此,上述的模型不需要调节,即为正确的模型。并且,VIF值均小于3,说明这几个参数没有共线性,各自独立的描述总评分值。采用与上述相同的方法检验异方差,发现其很好的符合方差齐性

23、。表11 举例列出前十位商铺的评价分数如下所示ID数码相机商品与实际相符打分商家服务态度打分334146904.998254.74.7336114494.982794.74.7333632724.980244.74.8331653714.929294.84.8343552934.910244.74.8340913404.902214.74.8348027904.821034.94.9352879334.802004.64.7336130034.729424.64.7345312644.707924.84.8334146904.698414.74.75. 珠宝商铺的评分模型(1) 选择参数采用与

24、上述相同的方法挑选时间参数。结果如下:logy0=0.74985+0.34568logy03+0.52137logy04 (29.03) (22.64) (71.47)R2=0.9061,F=2873.72其中,可以验证模型是显著的,但是log(y02) 和 log(y03) 的系数的p-value均大于0.05,我们把它们看成是不显著的,因而舍去这两个参数,取最近六个月的评分(x3)和六个月前的评分(x4)作为与时间相关的自变量。(2) 拟合模型同样地,采用最近六个月的评分(x3)、六个月前的评分(x4) 、商品与实际相符打分(x5)、商家服务态度打分(x6)作自变量,总评分值wy为函数值,

25、结果如下:wy=5.13830-0.02656x4+0.3542x5+0.6649x6模型是显著的,但是x3的系数的p-value大于0.05,因此,它们是不显著的。总评分只与六个月前的评分有关。检验模型的自变量的共线性和方差齐性,发现其变量的VIF值都小于2,且方差齐性良好,所以模型还是较为合理的。6. 对两种商品评分模型的解释从以上分析可以看出,两种商品的评分模型有很大差别:数码相机的商铺评分是由最近六个月的评分、六个月前的评分、商品与实际相符打分、商家服务态度打分决定,说明消费者看重数码相机的商铺的不仅仅是以往的口碑,而且最近的口碑也十分关注,这与数码产品更新换代非常快有很大关系;珠宝的

26、商铺评分中最近六个月的评分的系数是不显著的,说明消费者更看重的是以往商家的口碑如何,珠宝相对于数码产品更新换代较慢,消费者对现在的关注就淡了些。这两个模型提醒淘宝网数码产品的店铺要时刻注意更新换代,否则就有被淘汰下去的可能,而珠宝商家要更加注重商品的质量,这样消费者才能更加光顾店铺。为了验证模型的合理性,我们还对手机,运动鞋等大众消费比较多的产品进行了分析。发现手机的回归模型与数码相机及其紧密,因为它们都是数码产品,有近似的特性和消费者满意程度。六、 模型的进一步讨论1. 本模型的创新之处在于对评分系统考虑了时间的作用。将分段时间的评分作为自变量,并与商品与实际描述相符打分、商家送货速度打分和

27、商家服务态度打分等普通变量充分结合在一起做回归分析,形成一个同时具有时间因素和空间因素的线性模型。2. 记录评分的时间有些粗糙。若能每天获得一组数据,则可以利用时间序列分析方法分析单个商铺的总评分、服务态度、商品数、收藏人气等变量随时间的变化,并作出预测,从而判断这个商铺未来的经营状况,从商铺的发展层面帮助消费者选择购物的商铺。3. 回归所用的变量若能更多一些,就能得到更全面、更系统的结果。下一步可以采用网上发行问卷的方式,并将问题分类,获得消费者的更多反馈,可以根据商铺性质将其分类,例如:注重质量的商铺、注重服务的商铺等,供消费者选择,为消费者服务。七、 结论及建议从前面的分析可知,淘宝网列

28、出的有关于反映网络口碑的变量存在不同的关系。商铺的宝贝与描述相符评分,卖家的服务态度评分,卖家发货的速度评分,是对商铺的不同方面进行打分。对卖家的总评分表示了买家的综合评价,更具有说服力。三项评分与总评分关系不大,说明了三项评分的合理性和代表性,能从具体的侧面反映商铺的品质。而收藏人气与总评分的无关性则说明了网络口碑的盲目性,人们总是浏览而不去购买,得到的收藏人气也不具有参考价值。在分析总评分时,为了避免新建立的商铺受时间和评分人数的影响。我们对数据进行标准化处理,得到了不同时期以5分为满分的总评分。在得到不同商品的总评分后,我们可以进行正态检验,比较商品的差异性。由回归结果知,总评分与前六个

29、月和六个月的总评分最相关,说明口碑长期以来好的商铺会获得更多消费者的认可,而那些短期内成立的小店,虽然评分高,但不能完全说明其口碑好。消费者在查看评分状况时,需要注意该店长久以来的评价。除了根据时间相关性得到的线性方程,我们还加入了收藏人数,商品数目等变量来讨论影响总评分的因素。对于不同种类的商品回归的方程不尽相同,主要是由于商品本身的性质和消费者行为的差异。消费者应该注意对不同类商品关注不同时期的评分。而商铺则应提高其不足的方面,如宝贝相符程度,以满足消费者的需要,获得更好的口碑。参考文献1 Judith A. Chevalier, Dina Mayzlin. “The Effect of Word on Sales: Online Book Reviews.”Journal of Marketing Research, Vol. 43 (August 2006), 345-354.2 Yong Liu. “Word of Mouth for Movies: Its Dynamics

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论