基于某超市的数据挖掘分析 论文_第1页
基于某超市的数据挖掘分析 论文_第2页
基于某超市的数据挖掘分析 论文_第3页
基于某超市的数据挖掘分析 论文_第4页
全文预览已结束

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

基于某超市的数据挖掘分析李春林任博雅河北经贸大学数学与统计学学院060061:;【文章摘要】“”弦喘i譬9妒一4。”鬻”本文面对超市2年的日销售数据。一根据数掘挖掘思想,对海量数据按品类进行分组,并对各品类商品的销售数据进行分析。此外还通过对各品类的销售额建立ARMA模型,探求消费者的消凳习惯,对商品的品类布局提出建议。j,i秀【关键词】。超市;数据挖掘;AEMA模型;品类管理根据通常的定义,数据挖掘就是利用数据分析工具从海量数据中提取隐含的、表面不为人们所知但又有价值的信息获取过程。数据挖掘技术是一门包括多学科知识的技术,涉及统计学、计算机数据库、计算机网络、数理逻辑等学科,近年来许多智能技术也已广泛应用于数据挖掘领域中。本文以河北省某超市8万余种商品2005年一2006年的13销售数据为分析对象,共4228521条数据记录。利用Access数据库技术,将商品归为12个品类,以7天为一个销售周期,将数据按实收金额汇总为一个73行,12列的次级数据表。12个品类分别为:熟食部门,水产部】,果蔬部门,自制部门,干性副食,粮油和调料,烟酒饮料,冷藏冷冻,日配,服装鞋帽,箱包,小家电。一总体销售分析2006年春节期间销售额严重下滑,整年销售额与2005年大体持平。根据次级数据表,计算得2年的月度数据,为消除春节,五一,十一的高销售额的影响将两年数据进行差分,得到12行数据。图l为差分后的图表。由上图可以看出,每个月的销售额数据点较均匀的分布在0线两侧,2006年同2005年的销售额大体持平。1月,2月的销售额远不如2005年,分别比2005年少1200000元和1000000元。这两个月为春节销售高峰期,然而销售量却缩水。这是超市应该重视的一个问题。3月到9月的销售额,处于正常波动,2006年与2005年大致相同,从9月开始,2006据上看,2006年的销售额比2005年少1500000元。二品类分析图2为各品类部门经差分后的销售情况。与2005年相比,每一部门在1月、2月的销售在2006年都有不同程度的下降。其中,销售缩水最为严重的是小家电部门,其次为干性副食,冷藏冷冻、日年的销售额的增长速度不断提高。从数配部门。这是很不副合逻辑的,很可能OUUU4000l12000l,。八一一。厂。蠹O陵V一yY黉-2000矿。士。口oVw“工翼卜系列1-4000蘸7000000;。一。漱。蹴。漱蕊蕊蕊。黜;馘戳。;。盈00总量数据差分数据图图2销售数据差分数据图RNBSINSSr业衄万方数据水产部门:)=一023yt_l一059yt_2+段一03l以1一O95t_2十O19y=+008y,州+O22),鲥+00缈E埔服装鞋帽部门:引入小家电部门,粮油调料部门的销售额y。和y。辫=一117yl_1一O73yt一2+以一132啤一l一099雎一2+O41ya+062),聃小家电部门:引入服装鞋帽部门,箱包部门,干性副食部门的销售额),细,)么,圪声。Yf=046yt_I一046M2+06l雠1099a卜2+O27y囱孵+042y曲+O291,赫箱包部门:引入小家电部门,服装鞋帽部门的销售额y捌,y细I。咒=O45yt一24-4一O454_l+O,85tt一2+O38y蜊+O26ytm日配部门,引入箱包部门,服装鞋帽部门,自制部门的销售额,么y南。,k。儿=167yt-l-1Olyf一2+以+182他一l+132tt-2+O50y劢+O26ym+15)72于性副食部门:引入果蔬部门,自制部门,水产部门的销售额y嚣么y韶。Yt=-0,65ytI一095Yt一2+腹+O57,-l+O97肛一2+086yF+144y4+416Jk果蔬部fl:引入烟酒饮料部门。粮油调料部门,箱包部门的销售额J,删,M州。J么。咒;O56ys_l一061yt一2+肛+O45,u,-lO94,ut一2+O22yz酬+O13y聊+018),曲自制部门:引入果蔬部门,水产部门,小家电部门的销售额y翠,J,c,y删。Yc z 045ytt+042y卜2-069y卜,+H+069#rl+03毛213钮扣,+020y-+059y:+O07y_冷藏冷冻gfl引入箱包部门,服装鞋帽部门,自制部门的销售额y曲,y正删,y。只=O90yt_2+以+095zt_2+006y州+O05y触。+017y口粮油调料部门;引入自制部门,服装鞋帽部门的销售额圪,y钿。 一乃=099yt_l一082yt_2+鸬+090,u_tO96a,_2+166J名+O62夕次热食部门;引入粮油调料部门,小家电部门的销售额),蛐,y,H。M=O26yt-l+054y卜2+乒+O95声k2+O17),f州+O22y鲫ltltitI饮料lSf-J,引入粮油调料部门,果蔬部门,千性副食部门的销售额,铷,),芦,)雄。咒=178yt_l一095yt一2+4 4-193雎_xo93A一2+014y舅n+O84y芦+O1ly荫的原因是,超市保护商品的力度不强,出现了偷盗现象。节后各部门出现了销售额的反弹,大部分部f J都比去年同期销售额高。这得利于节后促销工作,此期间的销售策略值得推广。4月,销售额最大的为粮油调料部门,果蔬,服装鞋帽,箱包和小家电部l】的销售额最低。5月,总体销售额比4月略有提高,销售额最小的仍为小家电部f1。6月到10月,各部门销售额浮动于0线附近,变化不大,此期间应推行各种促销手段,刺激消费。入秋以后,各部门销售额又有明显上升,到12月,果蔬,干性副食,粮油调料的销售额明显增加。从图2中还可以看出,整年销售额比较稳健的是熟食部门(系列1)和水产部门(系列2);销售额变动较大的是小家电(系列12),箱包(系列11),冷藏冷冻(系列8)和FI配(系列9)。三消费者行为分析通过商品的销售额,可以反映出消费者的消费行为信息。消费者在不同部门之间选购何种非急需商品,与部门的布局、促销商品的种类搭配有着密不可分的关系。本文试图对各部门的销售额建立ARMA模型,同时在模犁中引入其它部门的销售额序列。以下为各部门的销售额的ARMA模型。以上部门的拟合模型,经过模型比较和反复修改,最终都引入了其它部门的销售额来建立ARMA模犁,拟合优度均在0。450。69之间,各保留项均通过T检验,并在l的显著性水平下显著。通过反复修正,模型中引入某一部门的其它具有显著性的系数均为正,说明这些部门的销售额的变动方向与引入部门的是相同的。在模犁中的这些变量,它们的变动都是与因变奄的变动是同向而且是同时的。因此超市在制定促销计划时,可以考虑这种共同变动情况,达到降低促销成本的目的,提高利润额。此外,根据这种共同变动的特点,可以调整各部门的相对位置,方便顾客选购,最大限度的促进销售最的增加。下图为根据模型变量相互关系所做的各部门建议布局。圃严j” ;。一;+_?。?j“、i。j$ir露【参考文献】 “。l、陆召逢,郭嗣宗,关联规则在化妆品销售分析中的应用,科技和产业,2008(1 0),P1 9-2l “r一2、梁宗经,旷芸,黄晓昀,数据挖强技术在科技统计数据分析中的应用探索,经济师,2007(1),p1 4-1 55,贺玲,昊玲迭,蔡益朝,数据挖掘中的聚类算法综述,计算机应用研,究,20071),Pj O-54、周肆清,欧阳烽,数据挖掘在高校数字圈书馆应用的可行性分析,高校霉书馆工作,2007(5),p23-26【作者简介】1,李春林(1 965一),男,河北省任县人,河北经贸大学数学与统计学学院教授,管理学博士,研究方向:经;济统计分析;2、任博雅(1 983一),女,河北省廊坊市人,河北经贸大学统计学专业硕士研究生。万方数据基于某超市的数据挖掘分析作者: 李春林, 任博雅作者单位: 河北经贸大学数学与统计学学院,050061刊名: 现代商业英文刊名: MODERN BUSINESS年,卷(期): 2009,(5)引用次数: 0次参考文献(4条)1.陆召连.郭嗣宗 关联规则在化妆品销售分析中的应用期刊论文-科技和产业 2008(10)2.梁宗经.旷芸.黄晓昀 数据挖掘技术在科技统计数据分析中的应用探索期刊论文-经济师 2007(01)3.贺玲.吴玲达.蔡益朝 数据挖掘中的聚类算法综述期刊论文-计算机应用研究 2007(01)4.周肆清.欧阳烽 数据挖掘在高校数字图书馆应用的可行性分析期刊论文-高校图书馆工作 2007(05)相似文献(10条)1.会议论文 谢瑜娴.陈定方.张波.李康.刘建新 超市行业中的数据挖掘技术研究 2008介绍了数据挖掘的概念,分析了超市行业中数据来源及特点,讨论了超市行业中数据挖掘技术的应用范围,并设计了一套可应用于超市的数据挖掘系统框架,为超市行业数据挖掘系统的实现提供了参考模型.2.学位论文 耿晓中 超市管理系统及数据挖掘技术在其上的应用 2004本文主要介绍了“超市管理系统”的需求分析与具体设计,以及基于“超市管理系统”上的数据挖掘。近十几年来,数据挖掘技术有了长足的进步。数据挖掘已成为数据库研究、开发和应用最活跃的分支之一,数据挖掘(DataMining)就是从大量的、不完全的、有噪声的、模糊的、随机的数据中,提取隐含在其中的、人们事先不知道的、但又是潜在有用的信息和知识的过程。微薄的利润使零售商们比其他行业更早进入数据仓库阶段.零售商们看到提高决策支持过程就能直接提高存货管理和财政预测的效率.零售商们早期采用数据仓库让他们有更好的机会运用数据挖掘.由于零售业搜集大量的销售数据、顾客购物记录、货物运送、消费模式和服务记录等等,它是数据挖掘的主要应用领域。尤其是由于Web或电子商务实用性和流行性的增加,搜集数据的量迅速增长。如今,很多商店都有自己的Web站点,顾客可以在线购买。零售数据的大量来源和类型为数据挖掘提供了丰富的数据源。在这种情况下,零售商如何找到自己最有效的客户,如何开发有竞争力的业务,如何提高经营效率,都是需要颇费一番脑筋的。在这样的背景下,零售商纷纷求助于IT技术,希望从中找到竞争制胜的良方。本文首先介绍了“超市管理系统”的具体分析与设计,本系统分为两个子系统:后台管理员端和前台收银端。其中,前台收银系统负责超市的日常销售工作,具有界面简洁,反应快速,运行安全可靠的特征,主要功能有:支持多种付款模式;支持各种商品销售、退货,打折处理;销售数据的挂起,恢复功能;销售小票的打印功能;收银机锁定功能;销售数据查询,统计功能;更改登陆密码;严格而灵活的用户权限管理。后台管理系统对商场货物流转进行全面管理,货物的任何流转均有相应的单据。它可以实现各种单据的电脑化;销售数据的及时统计;仓库的严格管理;完备的会员管理系统储存会员的所有个人及购物信息;完善的供应商管理机制;以及完整的财务管理。后台管理系统又分为以下子系统:1.商品管理2.供应商管理3.价格管理4.库存控制5.报表6.汇总7.财务控制8.月结9.年结10.清算11.历史数据12.会员管理13.用户管理在使用的过程中,随着数据的不断增加、业务的不断发展,如何从中及时发现有用的知识,提高信息利用率,这成为目前零售商急需解决的问题。面对“数据丰富,但信息贫乏”,重要的决定常常不是基于数据库中信息丰富的数据,而是基于决策者的直觉的现状,要想使数据真正成为一个我们可利用的资源,为我们自身的业务决策和战略发展服务,我们决定通过数据挖掘对数据进行分析,以便为我们的决策服务,从而提高零售业的竞争能力。近几年来,零售超市面对的市场竞争压力日益增加。能否拥有一套迅速灵敏、功能强大的市场分析系统,有针对性地制定政策,适时根据市场需求排放货物,显得越来越重要,从而基于“超市管理系统”其上的数据挖掘应运而生。本文介绍了运用数据挖掘中的关联规则,挖掘“超市管理系统”数据库中各种货物的排放,避免了脱离市场、脱离需求,盲目排放货物所造成的损失,节省了资金,提高了效益。关联规则(AssociationRules)的挖掘是数据挖掘中一个重要的问题。关联规则可以发现交易数据库中不同商品(项)之间的联系,这些规则找出顾客购买行为模式,如购买了某一商品对购买其他商品的影响。发现这样的规则可以应用于商品货架设计、货存安排以及根据购买模式对用户进行分类。本文主要运用FP-tree方法寻找数据库中的关联规则,关联规则在数据挖掘是一个重要的研究内容,而产生频繁集则是寻找关联规则的第一步。本文分析并且实现了FP-growth算法。FP-growth算法的优点是节省时间和空间,对大规模数据采用分治的办法以避免规模巨大难以接受。FP-growth算法主要通过FP-tree来构造频繁集。FP-tree是一个数据库里跟产生频繁集有关的信息的压缩表示。在具体的实现中,我通过了一系列的从低到高的数据结构来实现它,并进而实现整个算法。3.期刊论文 谢瑜娴.陈定方.张波.李康.刘建新.XIE Yu-xian.CHEN Ding-fang.Zhang bo.LI Kang.LIU JIan-xin 超市行业中的数据挖掘技术研究 -湖北工业大学学报2008,23(3)介绍了数据挖掘的概念,分析了超市行业中数据来源及特点,讨论了超市行业中数据挖掘技术的应用范围,并设计了一套可应用于超市的数据挖掘系统框架,为超市行业数据挖掘系统的实现提供了参考模型.4.学位论文 杨春雷 数据挖掘技术在会员制超市客户关系管理中的应用研究 2008随着中国市场经济逐步发展和完善,中国零售企业将面临更多国外优秀企业的挑战,会员制超市之间的竞争也日趋激烈,人们已经逐渐认识到客户对于企业的重要性,没有优良的客户资源,企业就无法发展。因此,如何更多地了解客户的信息,并将这种信息转变成“知识”,从而更好地为客户提供高质量的个性化服务,提高客户满意度,保持和发展高价值的客户,已经成为各企业开展业务的一个紧迫课题。企业要想在日趋激烈的市场竞争中立于不败之地,就必须加快企业信息化建设步伐。客户关系管理(CRM)就是企业通过对客户的管理来提升企业市场竞争力的一种电子商务解决方案。它与企业资源计划(ERP)以及供应链管理(SCM)一起构成了企业信息化建设的基本构架,CRM中应用的核心技术就是数据挖掘技术。数据挖掘技术是一种新的信息处理技术,其主要特点是对数据库中的大量业务数据进行抽取、转换、分析,从中提取辅助商业决策的信息。能够从海量的商业类客户关系管理信息数据中发现一些未知的、有价值的规律,帮助企业向管理智能化方向发展。本文首先从客户关系管理和数据挖掘的基本概念和原理入手,阐明了在会员制超市客户关系管理中应用数据挖掘的必要性,构建了以数据挖掘为核心的CRM系统模型。对基于数据挖掘的会员制超市客户关系管理系统进行了设计,建立了会员制超市客户价值、客户关联分析和客户细分的数据挖掘模型,并运用数据挖掘工具Clernentine11.0对模型进行了验证和评价。本文的研究可以为会员制零售企业开展业务带来新的思路,为国内会员制超市提升客户关系管理水平,提升客户满意度、获取竞争优势提供一定的帮助。5.期刊论文 陶颖.刘万军.TAO Ying.LIU Wan-jun 数据挖掘在超市管理中的应用 -辽宁工程技术大学学报(自然科学版)2005,24(z2)针对当前在大型连锁超市中采购、存储、销售的庞大数据需要合理的存储、分析、查询的实际问题,采用了数据挖掘的方法,在理论上介绍了数据挖掘技术的相关知识及其在超市管理中的应用,以超市营销管理作为实例,详细描述了数据挖掘的整个分析、设计及应用过程,并对国内数据挖掘应用的现状进行了分析.结果对数据挖掘在实践应用上的一个理论指导,配合特定算法后将在实践中有着一定的应用前景.6.学位论文 赵谦 数据挖掘技术在大型超市中的应用研究 2007随着中国加入WTO,市场经济逐步发展和完善,零售行业内的竞争也越来越激烈,尤其是各个大型超市之间。在日趋激烈的市场竞争中,如何充分应用企业的各种经营信息,从而使企业更具有竞争力,成为各家超市企业关注的重点。因此,对超市经营信息、数据的整理、挖掘,从中得出对经营有用的信息,增强超市的竞争能力,已经成为各家超市企业面临的一个紧迫课题。论文介绍了我国超市行业的发展背景,分析了超市发展目前所面临的问题,提出了引入数据挖掘技术来增强大型超市市场竞争能力的思路。文章对数据仓库和数据挖掘技术进行了理论阐述,结合超市行业特点提出了超市数据特性,从商品、顾客、销售等角度对数据挖掘技术在超市中的可用性进行了分析。以超市数据特性和数据挖掘、数据仓库理论为基础,对超市中适用的数据挖掘模型进行了分析设计。文章提出建立基于数据挖掘的超市管理系统,具体分析了系统实施的总体模型、功能设计、层次模型以及数据挖掘模型在其中的应用,并针对系统的核心数据仓库的建立进行了进一步分析设计。文章最后一部分针对数据挖掘模型的应用进行实证研究,以一个大型超市的实践为背景,应用数据挖掘模型对超市数据进行分析,挖掘出一些有用的信息,为超市经营决策提供辅助支持。本课题的研究为提升大型超市市场竞争能力提供了新的思路,为数据挖掘技术在超市行业的实用化做出了有益的尝试,从而对超市数据进行更有效深层次上的挖掘。7.期刊论文 宋钰 基于关联规则算法的超市数据挖掘方法分析 -福建电脑2009,25(7)销售数据分析是关联规则数据挖掘算法的主要应用领域之一.文章基于关联规则的算法原理,提出了一种对于超市销售数据关联分析方法,可以作为超市数据挖掘的一种基本算法.8.学位论文 杨种学 LHSMDSS系统中数据挖掘模块的设计与实现 2004数据挖掘是从海量数据中提取隐含在其中的、事先未知的、但又是潜在有用的信息和知识的非平凡过程,是一门新兴的边缘学科。它汇集了来自机器学习、模式识别、数据库、统计学、人工智能以及管理信息系统等多学科的成果。本文的主要工作是基于LHSMDSS(LianHuaSupermarketDecisionSupportSystem,联华超市决策支持系统)系统中的数据挖掘模块的设计和实现所展开的。LHSMDSS系统中的数据挖掘模块是建立在数据仓库技术和OLAP技术的基础上,运用关联分析、分类、聚类分析和预测分析等数据挖掘方法,从海量的交易数据中发掘有价值的知识,为超市的决策者提供科学的决策信息和依据。本文的工作主要包括:LHSMDSS系统数据挖掘模块的设计和实现,包括运用基于FP-growth算法实现商品关联交易规则的发现、动态聚类的方法实现商品聚类、C4.5算法构造决策树实现客户分类和预测、多元线性回归和最小二乘法实现销售趋势的预测;最后,借助数据挖掘模块对超市中的历史数据进行了分析,得出了许多重要的知识,这些重要知识为超市的客户关系管理、市场营销和战略决策提供了重要的信息,并带来了较大的经济效益。9.学位论文 连欢 数据挖掘在超市客户关系管理中的应用 2008随着信息技术的发展,企业与信息系统之

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论