




已阅读5页,还剩12页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
南京财经大学本科毕业论文 学校代码: 10327学 号: 2120120299本科毕业论文(设计) 中文题目: 基于京东商城智能手机的价格趋势分析 英文题目: Analysis of the Price Trend of Smart Phone Based on Jingdong Mall 所在院系: 国际经济与贸易学院 专业班级: 电子商务1202班 学生姓名: 指导教师: 完成时间: 2016年6月5日 15南京财经大学本科毕业论文目录中英文摘要与关键词.1一、引言2二、B2C及京东商城的介绍2(一)我国B2C的介绍2(二)京东商城的介绍2三、京东智能手机在线数据采集和整理2(一)信息抓取工具现状介绍2(二)京东商城智能手机数据采集3(三)京东商城智能手机价格数据和在线评价要素量化7四、京东商城智能手机消费者信息分析8(一)京东商城智能手机消费者购买能力和所在地的分析8(二)京东商城智能手机价格和时间数据分析9(三)京东商城智能手机消费者在线评价分析11五、京东商城智能手机价格趋势分析的总结及前景预测13(一)本文的研究结论13(二)本文研究的现实意义14(三)本文的不足之处14参考文献15基于京东商城智能手机的价格趋势分析摘要:随着20多年互联网进入中国后的迅速发展,依托互联网来搭建平台来进行各行各业的贸易行为已经随处可见,互联网平台的影响力日益增加,中国也步入了互联网+时代,网上购物已经成为消费的一种习惯。尽管我国互联网发展迅猛,但是对电子商务发展的规律等方面的研究还处于初级阶段。本论文以京东商城为目标,借助爬虫软件和人工收集数据方式进行了为期2个月的数据爬取,抓取了31429条在线商品价格和用户评价等数据,通过对收集的数据的整理和分析,得出用户在京东商城价格趋势、消费者和所在地的关系、用户评价和销售量的之间的关系。关键词:京东;智能手机;价格;销售量;用户评价 Analysis of the Price Trend of Smart Phone Based on Jingdong MallAbstract: After the 20 years rapid development of the Internet in China, The use of the Internet to build a platform for the development of the industry and every kind of behavior becomes popular. Accordingly, the increasingly strong influence of the Internet platform brings china to the Internet plus era. Online shopping has become a habit of consumption. Despite the rapid development of Internet in China, the study of the law and other aspects of e-commerce development remain in their infancy. In this dissertation, we used the reptiles software accompanied with manual data collection to crawl data for two months in Jingdong Mall. Finally, we collected 31429 users data on online commodity prices and their evaluations. After the analysis of these the collected data, we present the trend of Jingdong Mall prices, the relationship between consumers and their locations, as well as the user reviews and sales.Keywords: Jingdong;Smart Phone;Price;Sales 一、 引言据中国互联网信息中心第37次调查报告显示,截至到2015年12月,中国网民数量统计数量达到88亿,网络在中国的普及率达到50.3%;超过一半的中国公民已经步入互联网的大家庭。电子商务的迅猛发展以及物流、政策各项周边项目的发展为网上购物奠定了基础,越来越多的电子商务平台出现,却没有一套成型的理论来分析该模式的发展,本文依托京东智能手机在线数据对京东智能手机市场数据的分析,确定多种因素对手机价格以及销售量的影响,从而为商家在进行制定营销手段、价格定价等方面提供依据。二、 B2C及京东商城的介绍(一)我国B2C的介绍B2C全称是Business-to-Customer,是指商家直接面向客户。以京东为例,B即指京东商城中的各个商家,C即指京东商城中的消费者,商家直接面向消费者即为B2C, 商家以零售业生产为主,依托电子商务平台开展的一系列营销活动,借助在线平台从而从事销售的一种销售方式。消费者在电子商务平台上咨询、下单、付费、收取快递、检验质量、缴费、在线评论的一套流程从而进行线上交易。(二)京东商城的介绍京东商城是目前中国最大的B2C企业,在2015年的第一季度市场占有率调查中显示,京东的市场的占有率高达56.3%。目前,京东集团旗下设有多处企业,2014年5月,京东作为中国第一个成功赴美上市的大型综合型电商平台在美国纳斯达克证券交易所正式挂牌上市,同年,据京东2015年度报表数据显示,京东市场交易额的达到2602亿元,净收入达到1150亿元。三、 京东智能手机在线数据采集和整理本章内容主要是通过国内外信息抓取现状的分析,选取此次京东智能手机在线数据的采集方式、对京东商城智能手机的价格、评价信息和销售量数据的爬取采集,为论文后续分析和总结奠定基础。(一)信息抓取工具现状介绍在进行数据分析前,首先要进行的是对消费者在京东商城网上消费过程中的消费信息进行采集,京东商城智能手机价格、评价信息机制及销售量的信息采集。虽然我国的电子商务平台出现的较晚,对平台的在线数据的分析理论都是较新的内容,但是国家对电子商务和互联网+的大力支持,其发展速度也是相当的快。目前,网络爬虫技术作为国内主流的在线信息抓取技术,又称Spider或者Robot,在爬取时,爬取软件先从主页面或初始页面网址开始,按照预先设定的规则,打开第一个预先设定好的URL,开始抓取网页后,以首页为起点,按照网页排版选取子页面获取新的URL,将其保存为新的爬取页面,等到符合其预先设定的规则才停止爬取或进入下一个循环,中国目前爬虫现状是按照关键字和相对应的正则表达式来进行搜集页面上的符合数据,通过预先设定的网页、关键字、正则表达式来进行检索爬取数据,极大地方便了此次对于京东商城智能手机价格、在线评价、销售量等数据的爬取,因此,关于京东商城的数据经过2个月的爬取,我们抓取了6372条数据,由于京东商城的自带屏蔽follow语句,导致了无效数据占有率达到了5.2%。(二)京东商城智能手机数据采集打开集搜客网页/,使用邮箱和用户名进行注册八爪鱼,成功注册后,登录相应的邮箱点击网站发送的激活邮件链接,进行激活用户,如图1所示,下载八爪鱼爬取工具,解压安装后登录,提前定义好相关id规则,准备爬取。图1 八爪鱼注册信息1京东商城智能手机在线价格数据抓取打开八爪鱼爬取软件,打开京东官方网站,访问智能手机一级页面,将一级页面网址URL定义到爬虫软件初始打开网页上,添加点击元素,点击对应一级菜单区域,多次重复点击不同一级菜单区域,形成循环爬取多页面,点击价格区域,选取统计轨迹流程和规则,单一不重复性的爬取,如图2所示,图2 东智能手机价格爬取流程图打开八爪鱼爬取工具,将京东智能手机页面网址作为爬取的首页的URL,设定好规则表达式和爬取内容,爬取内容后保存到SQL数据库和excel宏,转化为excel数据,分类汇总统计词频和数据。预先设计好关键字有智能手机、价格(price)规则,选取页面循环,使用递增的page网页形式进行循环页面爬取,如图3所示。图3 京东商城价格爬取规则配置点击下一步,进入设置采集选项,此次所需爬取的数据均是简单数据,没有涉及到图片等超文本,所以在采集选项中勾选禁止浏览器加载图片,禁止加载图片会加快爬取的速度,定义Ajax加载数据为30s,网页的加载页面需要2-10s才能完全加载出来,点击元素的反应时间需要3-10s才能点击显示完毕,进行下一步的抓取数据,如图4所示。图4 京东商城价格数据爬取规则经过2个月的爬取,以字段价格、手机名称为主要字段的爬取数据共计6757条,其中无效数据达到5.4%,将爬取数据下载到相对应sql数据库中保存到excel表格中,按照对应标题和价格字段进行统计归纳,以递增数列标识,形成京东商城智能手机名称对应价格数据表,如图5所示。共计6543条数据爬取,由于字段爬取的丢失,如价格字段数据缺省,名称不全或指向性不明等因素导致的无效数据,在经过初步处理删减后存留数据量6217条,保存为京东商城智能手机价格V1.1 excel数据。手机名称型号价格小米 Note 白色 ¥1499.00小米5 全网通标准版 ¥2349.00荣耀 7i (ATH-TL00H) ¥1399.00Apple iPhone 6s Plus (A1699) 64G ¥6288.00华为P9 ¥3688.00三星 Galaxy S7 edge(G9350)32G版¥5688.00vivo Xplay5 全网通 4GB+128GB ¥3698.00华为 Mate 8 3GB+32GB版 ¥3199.00OPPO R9 4GB+64GB内存版 ¥2799.00图5 京东商城智能手机名称部分价格表2.京东商城智能手机在线评价信息数据抓取京东商城智能手机用户在购买后的进行在线评价,经分析得出,在线评价中可以进行简化的信息处理,可以直接进行抓取和保存,智能手机购买用户购买后的评价具体页面如图6所示,其中我们可以看出,客户的评价信息中包含了总评价数,好评数、中评数、差评数、用户名称、用户所在地区、购买日期字段。图6 京东商城智能手机评价打开八爪鱼爬取软件,点击京东官方网址,访问智能手机页面,将查询后的智能手机一级页面网址URL定义到爬虫软件初始打开网页上,添加页面点击元素,点击对应手机描述一级菜单区域,多次重复点击不同手机描述一级菜单区域,形成循环爬取多页面,点击评价区域,选取统计轨迹流程和规则,单一不重复性的爬取,提取数据字段总评价数,好评数、中评数、差评数、用户名称、用户所在地区、购买日期,禁止加载图片会加快爬取的速度,定义Ajax加载数据为60s,网页的加载页面需要5-10s才能完全加载出来,点击元素的反应时间需要5-15s才能点击显示完毕,进行下一步的数据抓取,如图7所示图7 京东商城评价信息爬取流程进入设计工作流程,循环网页,预先设计好关键字有智能手机、价格(price)规则,选取页面循环,使用递增的page网页形式进行循环页面爬取,如图8所示。图8 爬取定义递增式网页爬取目录将爬取的数据进行特征量化处理,我们发现,消费者在京东商城购买手机后的评价主要是关于“很漂亮”、“物美价廉”、“信号超级强”、“分辨率很高”四个关键词。得出来的四个关键词并不是凭空臆测出来的,通过消费者在消费并收到商品进行实际的操作和审核后再次回到京东商城智能手机购买评价页面进行评价,京东对这些评价进行归纳汇总从而得出的四个关键词。通过2个月的数据爬取,我们对象对应的字段进行数据的爬取,最终下载为xml格式转化excel表格进行保存,为下一步的量化打好基础。如图9所示。图9 京东商城在线评价信息爬取(三)京东商城智能手机价格数据和在线评价要素量化在通过八爪鱼爬取软件爬取后,京东智能手机名称和价格爬取的数据存为excel表格形式,选取了手机名称和手机价格字段作为量化要素。在线评价包括的好评数、中评数、差评数、用户名称、用户所在地区、购买日期6个字段excel表格,通过excel自带的排序功能和宏功能我们手动的将用户在消费后进行线上评价的集中的文字做了汇总统计,其中总结出了93个消费者在消费时关注的频率较高的词组,并将数据中的相关量进行了数目统计,通过汇总统计,使用频率较高的词汇作为量化的依据,最终形成了“价格”、“物流快慢”、“好评”、“售后”四个关注焦点,将爬取的数据进行一一的量化处理,为京东商城智能手机价格和在线评价的数据分析奠定基础。四、 京东商城智能手机消费者信息分析(一)京东商城智能手机消费者购买能力和所在地的分析分析数据前我们对京东智能手机消费者所在地和价格做一个假设。H1:假设京东智能手机消费者在京东商城的购买能力与消费者所在地经济发展水平成正向相关关系,即地区的经济发展水平越高,该地的用户其购买能力也就越高;相反的来说,崎岖的经济发展水平越低,则该地的用户其购买能力也就越低。分析数据中我们可以发现,特定的目标用户群体是在京东商城上进行购买智能手机的用户信息,首先我们抓取的是特定用户,所以限定了不可能将所有的京东用户包括起来,也不可能反映出所有的京东商城用户信息,我们通过爬取的数据进行比例占有的分析,以样本形式来描述全体,我们以国家统计局对各个地区标识代号数据库为依据,将爬取的数据进行区域性划分,对不同地区的不同等级的京东商城用户使得不同地方用户消费的影响。不同地区的不同等级用户数量比例是指每个地区的不同等级的用户占用户总数的比例,其指标的大小即反映了该地区在京东商城智能手机方面的消费能力。首先我们将设定出规模方程式,不同地区的不同等级用户数量比例的设计方程式为Uij=Aaj/Bbj*100%如方程式中显示,Aaj的意思为i地区j等级用户的频数,Bbj的意思为j等级用户总的频数;Uij的意思为i地区j等级用户所占的比例,其数值的大小和j等级用户在该地区所占比例成正向相关关系,即Uij数值越高,则该地区j等级用户在所有j等级用户所占比例越高。表1 京东商城会员数量占总会员数量排名前十位的省份京东商城会员数量占总会员数量排名前十位的省份会员等级北京广州上海江苏四川浙江湖北山东天津河南注册会员24.6%16.2%6.5%6.9%2.1%8.4%1.5%6.7%2.7%4.9%铜牌会员9.2%19.8%4.3%5.2%4.5%3.7%4.5%3.9%2.7%5.8%银牌会员26.5%15.4%8.0%9.5%5.3%3.9%2.7%3.7%3.7%2.9%金牌会员21.2%19.2%12.7%7.3%6.8%3.7%3.6%1.6%2.6%2.4%钻石会员26.1%18.7%12.3%9.4%4.9%1.8%2.9%2.8%1.9%2.3%总计21.5%17.9%8.8%7.7%4.7%4.3%3.0%3.7%2.7%3.7%依据京东商城划分的五个用户会员等级,分别对应的级别为注册会员、铜牌会员、银牌会员、金牌会员、钻石会员,如表1所示;经过频数分析我们可以看到,在京东商城智能手机消费者统计的总计栏目中,北京地区用户占据21.5%,位居榜首;第二名是比例达到17.9%的广东地区;上海以8.8%位居第三名;将上述结果进行和国家统计局2015年各省市GDP数据进行对比,如图10所示,我们可以得出不同地区的不同等级用户消费能力是和该地区的经济发展水平之间存有一定的关系,二者数据对比分析发现,GDP值越高的地区,其所在地的消费者的消费能力就越强得出假设是正确的,类似于数据中GDP排名前列的北京、上海、广东发达地区的消费者消费能力高,相反的,类似于西藏、内蒙等不发达地区的消费者的消费能力低。图10 2015中国人均GDP折线图(二)京东商城智能手机价格和时间数据分析京东商城智能手机消费者在线评价信息的抓取后,按照时间、价格、在线评价分类进行划分为三个excel表格,时间上按照5+1模式,周一到周五和周六日6个分类标准进行分类划分为六个excel表格数据库;价格上按照6000+高端价格、4000到5999中高端价格、2000到3999中端价格、0到1999低端价格四个分类标准进行分类划分为四个excel表格数据库;评价按照好评、中评、差评三个分类标准进行分类划分为三个excel表格数据库。分析数据前我们做一个假设:H2:智能手机价格随着时间的推移,其价格也是逐渐递减的。即随着时间的推移,京东智能手机相同款的价格是降价的,我们将从高端手机、中高端手机、低端手机三个分类来进行分析其价格随着时间的推移变化规律。在共计6402条数据中,时间序列数据中时间为6个月中分为三个分类如表2所示,我们可以发现三种手机的种类没有变化的太多,只是在3个月中中高端手机和中端手机增加了386个,在6402条基数上,我们将中高端手机和中端手机进行整合为一个单位进行分析。表2 京东智能手机价格时间序列数据京东智能手机价格时间序列数据时间高端手机中高端/中端手机低端手机2015年9月1124296423142016年1月1350267823042016年5月102521922753按照三个分类标准将时间序列数据进行加工处理,按照一个月的时间来进行设定时间变化,我们可以发现同比增长2015年9月份到2016年1月份中,京东商城智能手机高端手机平均降价254元,1月份到5月份降价306元;中高端和中端手机2015年9月份到2016年1月份降价311元,1月份到5月份降价475元;低端手机2015年9月份到2016年1月份降价150元,1月份到5月份降价73元,如图11所示。图11 京东智能手机价格时间变化高端手机的价格在2个周期3个月中下降幅度较小,平均下降300元,但是在6个月以后,高端手机新一代的出现的冲击会使得价格猛降在1000元左右,所以随着时间的推移,高端手机在出厂前几个月中价格一直居高不下,但是在6个月以后其价格下降的很快;中高端和中端手机价格在出厂3个月内有小幅度的下降,平均下降在400元,3-6个月其价格下降的很快,约在1000元以上;低端手机由于技术水平较低,其出厂价格较低,没有太多的下降空间,所以在6-8个月内其下降总幅度没有超过300元,故此验证了假设2:智能手机价格随着时间的推移,其价格也是逐渐递减的。即随着时间的推移,智能手机的价格是递减的,会有几个峰值期,高端手机在出厂时间近期不会下降的太多,当进入市场后会逐渐的小幅度的下降,但是在6-8个月后市场疲软后,随着新的技术的冲击,价格会大幅度的下降;中高端和中端手机出厂后会进行一系列的降价,同时幅度较大,中高和中端手机技术没有高端手机技术高,易被模仿,技术壁垒不高,所以新的手机冲击大,所以在3-6个月内降价的幅度尤其大;对于低端手机,技术壁垒不高,所以成本比较低廉,导致其出场价格就不是很高,所以随着时间的推移,其手机降价价格幅度并不高,通过数据分析和市场调查,验证了假设2的正确性。(三)京东商城智能手机消费者在线评价分析对于京东商城智能手机消费者在线评价对销售量的影响我们将从在线评价的好评率对销售量的影响进行分析。在进行分析前对在线评价做一个假设。H3:京东商城智能手机销售量和该店铺的消费者的在线评价好评率成正比,即该店铺的好评率越高,其手机的销售量则越高。在经过消费者在线评价数据抓取后,选择以单个店铺的手机销售情况为参考点进行分类,6402个手机数据中进行评价好评率分析,80%以上好评为高评价、40%到80%为中评价、40%以下为低评价三个分类标准进行划分,进行处理数据如图12所示。京东商城智能手机在线评价数据划分手机名称型号好评中评差评小米 Note好评(113870)中评(2862)差评(2607)小米5好评(29167)中评(435)差评(396)Apple iPhone 6s好评(194789)中评(2321)差评(3146)华为P9好评(53)中评(0)差评(2)三星 Galaxy S7 edge好评(24452)中评(305)差评(362)vivo Xplay5好评(9250)中评(143)差评(116)华为 Mate 8好评(59244)中评(557)差评(428)OPPO R9好评(28671)中评(559)差评(489)图12 京东商城智能手机在线评价数据划分对于数据的抓取中我们可以看出,选取的手机品牌和区域都是随机进行抓取,没有进行人为的限定抓取,所以以该数据作为分析样本进行预测统计全网站的智能手机的分析。对数据进行三类的划分,通过SQL数据转化为excel表格数据进行标准化分类,按照好评百分比进行统计。首先设计出在线评价比例分配区域,如表3所示,Wcd=Ycd/Zcd*100%其中Wcd的意思为c商品d评价区域中好评频数占总评价的百分比,Ycdd的意思为c商品d评价区域中好评频数的数量,Zcd的意思为c商品d评价区域中总评价数量。Wcd值越大即表示c商品的好评占比越高,则说明京东商城智能手机c商品的消费者在购买并对该商品进行使用和检测后对该商品的评价越高。表3 评价百分比区域划分评价百分比区域划分统计数据范围划分评价区域比例范围评价区域评价数占比高评价80%-100%高评价439768.7%中评价40%-80%中评价159724.9%低评价0-40%低评价4086.4%将数据进行对应评价百分比区域统计中得出,消费者在购买后进行评价中,高评价的有4397个商品,占总体67.8%;中评价的有1597个商品,占总体24.9%;低评价的有408个商品,占总体6.4%;总体来看,高评价区域占比超过50%,对三个区域的各个商品的销售量进行统计得出,如表4所示,高评价的商品平均销售量达到26807,中评价的商品平均销售量达到7691,而低评价的商品平均销售量只有863。由此可见消费者更加倾向于好评多的商品,也就验证了假设三:京东商城智能手机销售量和该店铺的消费者的在线评价好评率成正比,即该店铺的好评率越高,其手机的销售量则越高。表4 各个评价区域平均销售量各个评价区域平均销售量评价区域对应平均销售量高评价26807中评价7691低评价863五、 京东商城智能手机价格趋势分析的总结及前景预测 随着互联网的大力发展,电子商务正在进一步的冲击着传统市场,对于电子商务平台的分析也迫在眉睫,商品价格的变化对市场的影响,消费者通过对商品价格的大数据分析能获得更大的效益,商家通过数据分析更好的抓住消费者从而使得销售量极大地提高都是需要进一步进行研究的。本论文通过京东商城智能手机价格数据,在线评价数据分析,对商品销售量的影响进行了假设验证。本章节是对本论文的主要结论做一次归纳性总结、研究的现实的实际意义以及在进行分析中的不足讨论。(一)本文的研究结论1.智能手机消费者在京东商城的购买能力与消费者所在地经济发展水平成正向相关关系,即地区的经济发展水平越高,该地的用户其购买能力也就越高;相反的来说,崎岖的经济发展水平越低,则该地的用户其购买能力也就越低。2.智能手机价格随着时间的推移,其价格也是逐渐递减的,即随着时间的推移,京东智能手机的价格是降价的买。3.京东商城智能手机销售量和该店铺的消费者的在线评价好评率成正比,即该店铺的好评率越高,其手机的销售量则越高。(二)本文研究的现实意义1.消费者在进行网上购物时可以通过多种标准来判断商品是否物美价廉,从而购买到自己心仪的商品。2.消费者可以通过大数据来评判所购买的商品是否货真价实。3.在购买手机时,消费者可以根据自己选取的价位来进行购买,高端手机在出厂3-6个月为稳定价格阶段,不建议进行购买,在超过6个月可以考虑进行
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年虚拟现实行业技术创新与市场应用前景分析报告
- 2025年电子行业智能家居设备市场前景研究报告
- 2025年医疗科技行业远程医疗发展前景分析报告
- 2025年工业设计行业工业设计创新与应用前景研究报告
- 商场保洁安全作业培训总结课件
- 南京市2025江苏南京市产品质量监督检验院招聘编外工作人员11人笔试历年参考题库附带答案详解
- 云阳县2025二季度重庆云阳县事业单位考核招聘98人笔试历年参考题库附带答案详解
- 2025河北唐山瑞丰钢铁春季校园招聘招38人笔试参考题库附带答案详解
- 2025广东中山长虹电器有限公司招聘散件工艺工程师等岗位3人笔试参考题库附带答案详解
- 2025年福建福州市鼓楼区城投集团招聘18人笔试参考题库附带答案详解
- 冲压质量培训
- 2025年辽宁交投集团招聘笔试参考题库含答案解析
- 设备维护与保养手册
- 喷雾干燥塔操作规程模版(3篇)
- 《天疱疮诊断及治疗》课件
- 学校教代会代表换届选举方案
- 现代交换原理第二章
- 2024版工业润滑油销售协议范例版
- 企业级智能数据分析系统开发与服务合同
- 2024数据要素典型案例
- Unit 3 She has long hair. (教学设计)-2024-2025学年湘鲁版英语五年级上册
评论
0/150
提交评论