《电商销售数据分析》PPT课件.ppt_第1页
《电商销售数据分析》PPT课件.ppt_第2页
《电商销售数据分析》PPT课件.ppt_第3页
《电商销售数据分析》PPT课件.ppt_第4页
《电商销售数据分析》PPT课件.ppt_第5页
已阅读5页,还剩28页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、电商销售记录分析 严智强、贺强、刘瑞、 崔亚松、臧茹歌,Background,Contents,淘宝网作为国内第一大电商,占有近50%市场份额,而天猫商城则是所有优质店铺的集合,每月会产生大量销售数据,这里以天猫近一个月的手机销售数据进行分析,找出这些数据隐含的价值。,天猫手机销售数据分析,天猫手机销售数据分析,数据的获取与预处理,替代商品的挖掘,价格空洞的发现,数据的获取与处理,天猫销售数据分析,构建一个爬虫脚本,从天猫上获取销量前600的手机销售记录,并匹配出每条记录的机型、售价、销量。,How to get the data,爬虫脚本,#coding=gbk import urllib

2、import re f1=open(rE:tmaoshoujihtml.txt)#此处存储了销量前600的网页地址 http=f1.readlines() f1.close() f2=open(rE:tmaoshouji.txt,a) for i in http: content=urllib.urlopen(i.strip().read() f2.write(content) f2.write(n) f2.write(#*50) f2.write(n) f2.close() f3=open(rE:tmaoshouji.txt) lines= for line in f3.readlines(

3、): lines+=line.strip() f3.close() pattern=r.*?target=_blank title=(.*?).*?(.*?) result=re.findall(pattern,lines) f4=open(rE:tmaoshoujiInformation.txt,w)#该文件中存储了每件手机的记录(机型、售价、销量) for item in result: for j in range(3): f4.write(itemj) f4.write(t) f4.write(n) f4.close(),天猫销售数据分析,销量价格 散点图,天猫销售数据分析,替代商品的

4、挖掘,我们认为,如果两件手机的售价和销量十分接近,则认为这两件手机互为替代商品。从网络营销的特点来看,从店铺的角度出发,选择进价更低的手机可获得更多利润。,替代商品的挖掘,天猫销售数据分析,我们以欧氏距离小于等于2为标准 sqrt(a.price-b.price)2+(a.sales_number-b.sales_number)2)=2 将手机聚类,找出互为替代的手机。,替代商品的挖掘,天猫销售数据分析,from _future_ import division from math import sqrt #coding=gbk f1=open(rE:tmaoshoujiInformation

5、.txt) records=f1.readlines() f1.close() price= number= product= for i in range(len(records): item=recordsi.split(t) price.append(item0) product.append(item1) number.append(item2) for i in range(len(price): for j in range(i+1,len(price): distance=sqrt(pow(float(pricei)-float(pricej),2)+pow(int(number

6、i)-int(numberj),2) if distance=2: #if the distance minuse 2,we consider the two is replaced product print producti,t,productj else: pass,所得结果,结果发现,下列每一组中的手机互为替代商品 (a)UMO/优摩 w9220 Yusun/语信 T28 (b)Huawei/华为 C8812 ZTE/中兴 N807 (c)OPPO U705T TCL Y910T (d)Coolpad/酷派 8150D ZTE/中兴 V889D (e)K-Touch/天语 E800 U

7、MO/优摩 W800 七喜 TD710 (f)UMO/优摩 W800 七喜 TD710 Konka/康佳 E5680 (g)UniscopE/优思 U1201 Huawei/华为 Y300-0000 (h)Coolpad/酷派 8050 Coolpad/酷派 E239 (i)Motorola/摩托罗拉 XT800 索爱正品SA-I960 安卓4.0 (j)Coolpad/酷派 8020 Haier/海尔 HT-I600 (k)七喜 H750 Gionee/金立 C620 (l)Lenovo/联想 A790E 广信 ef58 (m)Huawei/华为 c8810 Samsung/三星 s6108

8、 (n)AUX/奥克斯 V930 TCL Y710 (o)Philips/飞利浦 W8355 ONN/欧恩 V8 16G版 (p)TCL Y710 Gionee/金立 GN705w,天猫销售数据分析,天猫销售数据分析,价格空洞的发现,经过分析,我们发现,作为中高端机营销,可选择3500-4000的价格空洞。可在较小压力下打入市场。,京东商城销售数据分析,牛仔裤销售数据分析,用户消费记录的分析,从生产厂家的角度来说,如果得到大量消费者的尺码大小及颜色偏好,则对生产和销售是非常有利的。因此,我们统计了京东女性牛仔裤的销售记录,从中得到各尺码和颜色在总的销售数据中的比例,从而指导生产。,通过用户的消

9、费记录,分析出用户的喜好品牌,从而当该品牌有新产品推出和促销活动时优先推荐给这些用户。,牛仔裤销售数据分析,用户尺码大小 颜色偏好,数据获取与预处理,以爬虫程序从京东商城获取牛仔裤销售记录,并过滤出每个用户所购买的颜色、尺码。,数据获取与预处理,京东商城销售数据分析,#coding=gbk import re import urllib page=16,16,16,16,16,16,16,16,15,15,15,15,15,15,15,14,14,14,14,14,13,13,13,13,13,13,12,12,12,12,12,12,12,12,12,12#page记录了每件商品的评论页面数

10、目 f1=open(rC:UsersYANZHIQIANGDesktopjdongNiuZaiKuAdd.txt)#goods存储商品评论地址 goodslist=f1.readlines() f1.close() s1=rE:jdongniuzaikupinglunAdd s3=.txt for i in range(0,len(goodslist): for j in range(1,pagei+1): content=urllib.urlopen(goodslisti.strip()+str(j)+-0.html).read() print goodslisti.strip()+str(

11、j)+-0.html save=s1+str(i)+s3 f2=open(save,a) f2.write(content) f2.write(goodslisti.strip()+ page + str(j) + downloaded n) f2.write(#n) f2.close() s1=rE:jdongniuzaikupinglunAdd s3=.txt,数据获取与分析,for i in range(0,35): s=s1+str(i)+s3 f=open(s) lines= for line in f.readlines(): lines+=line.strip() f.close

12、() color=r颜.*?色:(.*?) size=r尺.*?码:(.*?) date=r购买日期:(.*?) multiColor=re.findall(color,lines) print file,i,has,len(multiColor),color recordsn multiSize=re.findall(size,lines) print file,i,has,len(multiSize),size recordsn multiDate=re.findall(date,lines) print file,i,has,len(multiDate),date recordsn f1

13、=open(s1+str(i)+color+s3,w) for c in multiColor: f1.write(c) f1.write(n) f1.close() f2=open(s1+str(i)+size+s3,w) for s in multiSize: f2.write(s) f2.write(n) f2.close() f3=open(s1+str(i)+date+s3,w) for d in multiDate: f3.write(d) f3.write(n) f3.close(),京东商城销售数据分析,用户尺码大小与颜色偏好挖掘,#coding=gbk import re n

14、ame=白,黑,粉,枣红,酒红,大红,红,紫,绿,杏,黄,棕,宝蓝,彩蓝,海蓝,深蓝,浅蓝,灰蓝,中蓝,天蓝,墨兰,墨蓝,藏蓝,蓝,橙,灰 countColor=0*i for i in range(len(name) f1=open(rE:jdongallNiuZaiKuColor.txt) color=f1.readlines() f1.close() for j in color: for k in range(0,len(name): if re.search(namek,j): countColork=countColork+1 break f2=open(rE:jdongcolor

15、Summary.txt,a) d=dict(zip(name,countColor) for key in d.keys(): f2.write(str(key)+t+str(dkey) f2.write(n) f2.close() daxiao=str(i) for i in range(10,36) countSize=i*0 for i in range(len(daxiao) f3=open(rE:jdongallNiuZaiKuSize.txt) size=f3.readlines() f3.close(),用户尺码大小与颜色偏好挖掘,for a in size: for b in

16、range(0,len(daxiao): if re.search(daxiaob,a.strip(): countSizeb=countSizeb+1 break elif re.search(XS$,a.strip(): countSize14=countSize14+1 break elif re.search(S$,a.strip(): countSize15=countSize15+1 break elif re.search(M$,a.strip(): countSize16=countSize16+1 break elif re.search(L$,a.strip(): coun

17、tSize17=countSize17+1 break elif re.search(XL$,a.strip(): countSize18=countSize18+1 break elif re.search(XXL$,a.strip(): countSize19=countSize19+1 break elif re.search(XXXL$,a.strip(): countSize20=countSize20+1 break else: break f4=open(rE:jdongsizeSummary.txt,a) d2=dict(zip(daxiao,countSize) for ke

18、y in d2.keys(): f4.write(str(key)+t+str(d2key) f4.write(n) f4.close(),最后得到33,098条牛仔裤的颜色、尺码等销售信息。,用户尺码大小与颜色偏好挖掘,用户消费记录的分析,数据的获取 用户品牌偏好的分析,京东商城销售数据分析,数据的获取,利用爬虫程序,获取用户消费记录原始html代码,并过滤出记录数大于30的用户的消费消费记录。,数据的获取,京东商城销售数据分析,from _future_ import division #coding=gbk import math import urllib import re s1=r

19、E:jdonguseruser_firstpage s3=.txt f=open(rE:jdonguseruserPingLunShuDaYu30.txt,a) for i in range(1000000,1008594): yuanshifile=s1+str(i)+s3 f1=open(yuanshifile) lines= for line in f1.readlines(): lines+=line.strip() f1.close() n=r评论数:(d+)条 commentNumber=re.findall(n,lines) if commentNumber: if int(co

20、mmentNumber0) 29: f.write(id+str(i) f.write(t) f.write(commentNumber0) f.write(n) f.flush() else: pass,数据的获取,else: pass print user,i,got it f.close() f1=open(rE:jdonguseruserPingLunShuDaYu30.txt) user=f1.readlines() f1.close() h1=r h2=-0- h3=.html s1=rE:jdongusercostomer s2=consume_records.txt for c

21、on in user: sub=con.split() num=sub0 f2=open(s1+str(num)+s2,a) page=math.ceil(int(sub1)/30) for i in range(1,int(page+1): html=h1+str(num)+h2+str(i)+h3 record=urllib.urlopen(html).read() f2.write(record) f2.close(),京东商城销售数据分析,用户品牌喜好分析,京东商城销售数据分析,#coding=gbk import re import os f1=open(rC:UsersYANZHI

22、QIANGDesktopbrand.txt) brand=f1.readlines() f1.close() d= for i in brand: di.strip()=0 s1=rE:jdongkehucustmer s2=BrandStatistic.txt f3=open(s1+final+s2,w)#save the records for item in os.listdir(rE:jdonguser):,用户品牌喜好分析,for item in os.listdir(rE:jdonguser): if item.endswith(goods_records.txt): s=str(item) Id=re.search(d+,s).group() f2=open(rE:jdonguser+/+str(item),r) lines= for line in f2.readlines(): lines+=line.str

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论