版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
奶茶销售助手系统的设计与实现目录1绪论 [摘要]随着我国饮料市场的快速发展,零售饮品产业市场竞争日益激烈,各大中小城市中随处可见品牌连锁奶茶饮品加盟店,凸显出巨大的市场需求。但是,并非所有奶茶饮品门店的经营与销售都表现良好,受诸多因素的影响,奶茶店的销售无法实现相对准确的预测。这对于奶茶店的加盟与扩展带来了一定的阻碍。本文的研究目标是构建一个基于大数据的奶茶销售助手系统,寻找奶茶销售的预测方法。本文从相关网站上爬去一点点奶茶的2019年11月的相关数据,包括商品配比、配料、销售数据、会员信息等作为关键特征,选取ARIMA模型作为研究模型,建立并训练相应的奶茶销售预测模型,并利用这些模型预测选取时间之后的奶茶销售情况,希望能为奶茶饮品行业的投资和发展提供一些建议和帮助。[关键词]奶茶销售预测;ARIMA模型;大数据;Python1绪论研究背景和意义1.1.1研究背景如今大数据时代里,各种智能化管理和信息技术的运用商业化,越来越多的实物用数据代为表示,能直观的显示问题。如今,各大中小城市中都遍布连锁饮品企业,一点点奶茶成为饮品市场中的重要力量。如何实现一点点奶茶进销存的科学管理,以降低运营成本,提升销售利润成为企业不断完善的重要内容。一点点奶茶店的进销存数据,可以通过爬虫技术,对这些数据进行清洗,可视化分析,能给经营者挖掘出客户的喜好,热销时段等等隐藏信息,使得运营者如虎添翼。1.1.2研究意义网络爬虫是对不同网页进行下载和分析,经过存储、相关度计算、排序,再将关键词展现到用户面前。本文以一点点奶茶销售与经营相关数据为对象,完成一个基于大数据的奶茶销售预测。通过数据的清理、集成、规约,最终实现分析结果的可视化。通过反馈回的奶茶店商品信息与解析结果,为奶茶店加盟制定个性化的营销策略提供依据。研究目标及内容1.2.1研究目标本课题的研究目标是完成一个基于大数据的奶茶销售预测,在大数据的背景下,建立奶茶销售预测模型,能够更好的帮助一点点奶茶的加盟商来预测不同时间的销量、不同品类的销量,更进一步分析影响奶茶销售影响因素来提高奶茶进销存管理质量。此次课题研究通过对目前已有的销售预测模型的现状及发展趋势进行研究,以建立模型为手段,辅以网络、文献检索等手段来完成基于大数据的奶茶销售预测。1.2.2研究内容1.分析奶茶店进销存管理现状,总结当前相关研究的趋势。2.学习并研究ARIMA模型的原理和构建过程,作为奶茶销售助手系统的理论基础。3.对数据集进行预处理,可视化分析影响奶茶销售的因素,包括宏观经济、奶茶包装、季节因素等。4.建立ARIMA模型,选取特定时间段数据来预测一点点奶茶销量,建立模型的过程中需注意参数的选择,通过模型预测结果从而选出最精准的预测模型。5.使用部分数据集作为验证分析的结果,对模型进行测试,测试其是否存在漏洞及使用逻辑错误等问题,从而进行预测模型的改正。6.对建立模型的过程中遇到的问题及自身感悟进行总结。研究方法和手段1.3.1研究方法1.文献研究法:通过查找文献来获取关于销售预测模型建立的相关资料,选出适合奶茶店销售预测的算法及预测奶茶销售模型的相关因素。2.分析比较法:通过使用不同的方法来建立奶茶销售预测模型之后进行比较[2],总结这些模型的优点以及不足之处,从而找出需要改进的方法,使模型更加的完善、精准。3.统计研究法:通过Python编程程序来对收集到的一点点奶茶店的各类数据包括商品配比、配料、销售数据、会员信息等进行统计分析,然后使用机器学习相关理论来构建模型、分析模型。1.3.2研究手段以奶茶销售预测模型为主,通过在网上收集资料,进而进行数据分析和模型建立等工作。2奶茶进销存的影响因素分析2.1奶茶店进销存管理。如今“奶茶风”盛行,不管阶级高低,男女老少都喜欢喝奶茶。而如今这个网络发达的时代,在这个奶茶行业已经普及的时代,各个投资者对于颜值和口味方面所下的功夫都很足,很难在同行竞争中拉开差距,但在进销存效率方面所下的功夫少之又少,倘若能够在进销存上比其他的同行效率高很多,就能取得竞争优势。上班前一杯奶茶提神,下班时一杯奶茶解困,熬夜时奶茶的解乏,还有各时段的学生们用奶茶来丰富自己的课余时间。不仅仅是只局限在满足物质生活,还更加在精神层面对人们影响颇深。奶茶成为了人们娱乐消费的一种方式,在空闲时间,人们通过喝奶茶来丰富自己的味蕾,喝奶茶能够放松身心,而人们对奶茶的依赖也越来越多,奶茶产业在人们的生活中越来越重要,在GDP中的占比越来越高,但是受到很多因素的影响,至今未发现有哪种模型或软件对于奶茶的产品销售能够有着相对准确的预测,所以对于投资者而言投资奶茶风险在这一块比较大,投资者会考虑到投资成本而降低了投资的积极性。从而会影响到奶茶业的发展,只有通过现代化计算机信息化进销存管理系统对企业的科学管理,在这个基础上让企业别的工作效率大幅度提升,使得企业管理得到大幅度强化。2.2影响因素分析(1)经济因素在我个人的角度,每个人消费力度的不同,都是由个个人不同的收入决定的,在如今的社会,只有当你的经济收入达到一定的水平在物品消费需求的这一方面才会有一定程度提升,社会的经济发展水平制约着如今的饮品的需求的增长,交换价格越高,市场需求的反而就会越低,反之越高。(2)奶茶包装在如今的奶茶商业背景,例如抗疲劳的功能饮料等,大多数在市场上都是成功的,只有拥有足够的吸引力,足够诱人的口感,才能吸引消费者消费,是市场发展的关键。更重要的是,一个产品的新意是否足够新颖,也会影响他是否会拥有好市场,例如包装、推广等。消费升级下的年轻消费群体大多喜好新鲜,乐于猎奇,因而一个独特的包装设计以及个性的营销将是吸引消费者的聚焦点,通常是促使产品脱颖而出第一步,只有被消费者关注了才有可能进一步实现消费。因此,有着不同需求的不同时期,会造成不同的竞争,因此我们必须改变我们的企业创新的思路。(3)季节季节的变化会影响奶茶店不同产品的销售量。例如夏季冰饮产品受到欢迎,而冬季则以热饮为主。相较而言,在夏季饮品的需求会很大,在温度较高的环境里,饮品冰凉的口感是商家必胜的主要原因,而为了保证饮料的冰凉口感,温度不能过高也不能过低,不同饮品需求的温度也不尽相同。若想销量好,口感必须摆在第一位,温度的把控对商家十分重要。因此商家需要依据不同的季节采购和销售适应季节的饮品。3奶茶销售数据获取及预处理3.1数据获取本文选取2019年11月的一点点奶茶店的销售数据,通过爬虫的技术来获取数据形成销售数据集,并运用之前得到的数据集,进行训练数据集,验证数据集,测试数据集,然后达到能预测未来销售成绩。打开cmd命令窗口,建立新的Scrapy爬虫工程再常用的文件夹下,设置爬取首页,自定义一个爬虫名称,于是就有了spiders文件夹还有它的目录结构,使用配置有python3.6的pycharm打开建立的爬虫工程,就可以开始编写爬虫。在items模块中定义字段(想要爬取的):首先我们要把房源字段确定下来,之后转到爬虫模块,在parse()方法对这些信息的源代码进行复制,并解析出他们的作用,运用FOR循环进行翻页,从第一页开始,然后再回调parse()方法,对全部信息进行采集,之后指导数据采集完成,将刚刚采集到的奶茶销售数据写入到CSV文件存储。3.2数据预处理通过各类网站爬取到的数据是复杂的、残缺的,为了能够让我们所研究的数据更加完整,因此需要对数据进行预处理的操作,包括有数据清理、数据集成、数据规约[4]。3.2.1数据清理对所爬数据进行规范操作,多余字符的删除或替换处理,对数据使用正则表达式等工具进行一致性处理的过程,就是数据清洗。虽然结果的数据很乱,不仅有字段出现错位存在缺失值异常值等情况,还会有各种换行符制表符以及空格隐藏在数据中。所以我们要将数据进行清洗补充缺失数据等操作后才能使用所得数据继续分析。为了使得多条信息的一列分成多列,我们可以使用split()和drop()方法,pandas.concat()合并数据。再由正则表达式处理数据中影响分析的字符,re.sub()删除指定字符,re.findall()提取指定字符。把一些不规范的替换掉或者不需要的数据删掉,例如时间一列中有“未定义”字段,属于字符型,我们将“未定义”这个词替换为整型。为了美观,处理完了之后,将清洗好的数据重新排放,按照列顺序。处理后的数据如图1。图1清洗后的数据(部分显示)3.2.2数据集成数据挖掘的数据的格式等方面并不一致,因为数据挖掘的原始数据从不同的数据源获取,因此,为了进行数据挖掘,要先进行异源异构数据的继承3.2.3数据规约数据规约能用来提高挖掘的速度和精度,再保证数据的完整和挖掘结果可靠性的前提下,能减少用于挖掘的数据属性和样本数量。数据归约不仅有删除列、删除行、还能减少列中的值。3.2.4可视化展示数据可视化技术将数据转换成图形图表,为决策提供依据。对一点点奶茶店销售数据进行分析,得出一点点奶茶店工作日和周末热销产品销售情况的可视化结果如图2、图3、图4所示,主要配料的销量情况可视化结果如图5所示。图2一点点奶茶店工作日和周末都热销产品销售情况从上图可知,一点点奶茶店工作日和周末都热销的产品包括乌龙拿铁(大)、冰镇乌龙茶(小)、奶茶(小)、奶绿(小)、冰淇淋红茶(大)、莓果绿茶(小)、乌龙玛奇朵。这些热销品在周末的销量要明显高于在工作日销量。图3一点点奶茶店工作日热销产品销售情况图4一点点奶茶店周末热销产品销售情况从一点点奶茶店工作日热销产品销售情况和周末热销产品销售情况来看,工作日和周末的饮品销售品类差异较大,从销量上看,工作日的品类销量相对较高。图5主要配料的销量情况4奶茶销售预测ARIMA模型的建立和验证4.1样本的选取选取南宁市一点点奶茶店2019年11月1日至2019年11月15日的日销售额、客单价、客流量进行预测分析。销量的描述性统计如下图6所示,图7为销售数据的变化趋势。图62019年11月1日至2019年11月15日销售数据统计图72019年11月1日至2019年11月15日销售变化趋势4.2研究模型基于南宁市一点点奶茶店客流量、客单价、销售额的时间序列数据对短期内的奶茶店的销售情况进行分析还有预测,依据时间序列分析的ARIMA模型,确定让其平稳的自然回归项数,滑动平均项数还有平稳序列的差分次数,找到适合的模型并给出数据未来3个月的预测销售情况,最终将其与实际值进行比较,分析其与实际值之间的误差是如何造成的,然后给出门店进销存建议。ARIMA模型是分析时间序列的一种最典型最常用的模型,其运用的主要步骤为:1.观察序列图,判断时间序列数据是否平稳,之后进行ADF检验,确定使时间序列数据成为平稳序列的差分次数;2.对时间序列数据进行平稳化处理,然后利用自相关函数和偏自相关函数对模型进行识别;3.参数估计,检验其是否具有统计意义;4.假设检验,判断(诊断)残差序列是否为白噪声序列;5.利用已通过检验的模型进行预测。其中常用的模型有:AR模型(自回归模型):Yt=β1Yt-1+β2Yt-2+…+βpYt-p+εtMA模型(移动平均模型):Yt=εt+α1εt-1+α2εt-2+…+αqεt-qARMA模型(自回归滑动平均模型):Yt=β0+β1Yt-1+β2Yt-2+…+βpYt-p+εt+α1εt-1+α2εt-2+…+αqεt-q4.3销售预测图片显示总体数据呈现上升趋势,而且没有明显的季节性波动,但是后期销售额有些下降。4.3.1ADF检验该检验假设时间序列模型存在单位根,结果显示其t统计量检验的P值为0.0496,小于0.05,拒绝原假设。说明不存在单位根,认为该时间序列平稳,所以ARIMA模型中的差分阶数为0,变为ARMA模型。4.3.2模型识别通过EViews做时间序列自相关及偏自相关图,发现自相关函数图是拖尾的;偏自相关图在2阶时迅速衰减,且整个变化趋势也没有什么规律,所以偏自相关函数是截尾的。综上,应该建立AR模型,且阶数为1阶。4.3.3模型拟合根据建立模型用EViews对模型进行拟合,如表1所示:表1模型拟合结果结果表明,模型拟合效果良好,不仅前的系数都不为0,而且通过分析误差波动几乎都在两倍置信区间,达到预期代码如下:4.3.4噪声检验为了检测残差序列是否相关,通过Eviews做出自相关图和偏自相关图,之后会发现虚线范围内如所想的可见残差序列的柱形图全被包含,Q统计量检验的P值也都表明原假设为真,因此可以得出结论,残差序列不相关,模型选择是正确的。4.3.5模型预测继续使用EViews软件对短期数据进行预测,采取静态预测方法对南宁一点点奶茶店2019年11月10日-2019年12月1日的销售情况进行预测。表2预测结果预测结果得出一些数据:方差比例为0.2547,协方差为0.6698,Theil,偏差比例为0.0014,不相等系数为0.0115,预测效果不错,模型有着较好的预测能力,可以用于对销售额进行短期预测。代码如下:图82019年11月10日-2019年12月1日预测结果可视化展示预测结果可视化实现代码:继续使用EViews软件对长期数据进行预测,采取静态预测方法对南宁一点点奶茶店2019年11月10日-2020年03月1日的销售情况进行预测,结果如下图9所示。图92019年11月10日-2020年03月1日预测结果可视化展示4.3.6误差分析用静态预测的方法获得数据的2019年11月-2019年12月短期预测情况,如图所示。短期和测试的真实值与预测值结果相互比较,可以得出一个结论:预测的结果较为准确,长期预测误差会有一些大,可能是其数据波动较大的原因。其次对于2019年11月10日-2020年03月1日销售额的预测误差表现为一个递增的情况,这合乎常理,对于越近时期的预测更加准确。对于客单价的预测可能不是满足像销售额一样的趋势。这可能是由于客单价本身基数就较小,稍微有点波动就会造成极大的误差,但是对于客单价波动在1~2元,甚至是3元的情况,这都属于正常。客流量的预测比较符合预期,很小的误差,但是随着时间差越大,预测的误差也会慢慢变大。因此我们可以对销售短期的预测采用动态的方法,不仅不用改变模型,误差也会小很多,预测的数据的规律与静态预测的结果也会类似。5结论及建议5.1结论本文通过爬虫技术爬取了一点点奶茶店2019年11月的销售额、客单价、客流量等关键特征,先进行分析的是预测变量,将文本型的数据分类后进行预测。通过用ARIMA模型对南宁一点点奶茶店销售额、客单价及客流量的预测分析以及结果讨论,发现该模型对于短期内便利店销售情况的预测具有很大的实际意义。本文对2019年11月10日-2019年12月1日以及2019年11月10日-2020年03月1日的预测结果显示,其销售额、客流量都有持续上升的趋势,所以可以通过加大便利店内商品供应量以及热销产品数量来满足顾客需求,对于奶茶店投资者,我们建立模型预测下个月的销售情况,从而对进销存和销售战略的布置,能增加商品进销存的效率,提升投资者的收益,提升客户在一点点奶茶店的购物体验,提升一点点奶茶店的经营活力。5.2建议通过参考前人研究以及实证分析,本文为奶茶店加盟商提出以下建议:消费者需求的角度思考,对市场上饮品的市场规律进行学习和掌握,能对饮品购进和顾客信息有一定了解,通过对各种饮品的了解和销量的预期,达到高效率的进销存。参考文献晋振杰,曹少中,项宏峰,等.基于python的电商书籍数据爬虫研究[J].北京印刷学院学报,2018,3(26):39-42.曾悠.大数据时代背景下的数据可视化概念研究[D].杭州:浙江大学,2014.任磊,杜一,马帅,等
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 海底管道防腐工成果转化考核试卷含答案
- 我国上市公司环境会计信息披露:现状、问题与优化路径
- 我国上市公司控制权转移价格:形成机制、影响因素与案例剖析
- 大型藻类栽培工岗前实操知识考核试卷含答案
- 烷基化装置操作工安全技能强化考核试卷含答案
- 固体树脂版制版员安全宣贯模拟考核试卷含答案
- 洗缩联合挡车工岗前风险评估考核试卷含答案
- 虚拟现实产品设计师安全培训水平考核试卷含答案
- 中药胶剂工安全规程模拟考核试卷含答案
- 老年癌痛患者的多学科管理策略-1
- JJG 291-2018溶解氧测定仪
- 《抗体偶联药物》课件
- 《肺癌的诊断与治疗》课件
- 音响质量保证措施
- 工装夹具验收单
- 循环水冷却系统安全操作及保养规程
- 神经病学教学课件:脑梗死
- HY/T 055-2001折叠筒式微孔膜过滤芯
- GB/T 21393-2008公路运输能源消耗统计及分析方法
- GB/T 20946-2007起重用短环链验收总则
- GB/T 13803.2-1999木质净水用活性炭
评论
0/150
提交评论