数据挖掘项目总报告.ppt_第1页
数据挖掘项目总报告.ppt_第2页
数据挖掘项目总报告.ppt_第3页
数据挖掘项目总报告.ppt_第4页
数据挖掘项目总报告.ppt_第5页
已阅读5页,还剩32页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

数 据 挖 掘 彩电 项 目 总 报 告,萝卜网数据分析资料之,彩电销售的盈利趋势分析与预测,一、项目概述 二、项目实施 三、数据分析 四、最终结论,一、项目概述,1.项目安排 本项目实施时间为四个星期,安排如下: 第一周(4月10日-4月16日) 寻找数据源,确定课题研究内容和方向,人员分工,完成计划书。 第二周(4月17日-4月23日) 按分工计划进行各自工作(数据清理,模型设计,程序设计等) 第三周(4月24日-4月30日) 周中完成统计结果分析,周末集中讨论报告初稿。 第四周(5月8日-5月13日) 报告定稿,1、问题的提出,家电零售业的激烈竞争 上海市场三足鼎立:国美、永乐、苏宁,三大连锁集团占据绝大多数市场份额。 其余企业如一百、华联。由于自身原因,难以进一步扩展规模。 三大连锁集团都在积极增加门店数量、加大广告投入。多年的激烈竞争,才达到今天的市场地位。 家电销售早已进入微利时代 激烈的竞争,导致家电零售企业都把市场占有率,作为首要考虑的问题,甚至优于盈利。因此,价格战成为最主要的手段,无利润,甚至亏本销售现象普遍存在。家电零售业通过扩大销售,以此来要求生产厂家提供更低的供货价格。 市场信息对家电零售业的意义 家电零售企业都采用了计算机管理进、销、存数据,因面对的是家电产品的最终消费者。因此,在海量的销售记录中,存在大量有价值的信息。若能提取这些信息,提供给管理部门作为决策时的依据,有助于提高管理部门决策的准确性。,2、目标的确定,数据资源的选取 本次项目,选用国美电器某门店的进销存系统数据作为分析对象。 该系统使用SQL Server作为数据库平台,包括财务、商品信息、销售记录等大量数据。,2、目标的确定,系统初步分析 数据库系统包含21个表。 商品分类信息存储在Item和ItemList两个表中。 商品销售信息存储在Out和OutDetail两个表中 下图为数据库关系图(部分):,2、目标的确定,作简单查询,该系统定义350种大类,共10539种家电商品信息,其中1713种为经销或代销的彩色电视机品种。是最多品种的分类,也考虑到彩色电视机在家电中占有最大比重,我们本次项目将其定为研究的对象。 系统记录的是从2001年3月15日到2002年4月27日的销售记录。,2、目标的确定,我们从系统中提取有关彩色电视机的商品品牌、规格、销售价格、销售数量、毛利等相关数据进行分析。 应用Microsoft SQL Server 2000 Enterprise 的Analysis Server OLAP/Data Mining作为分析和挖掘工具。 采用的数据挖掘的理论(聚类、决策树),目标的确定,最终目标 根据彩色电视机的品牌、规格、型号、屏幕尺寸及销售价格等特征,通过一定的数据挖掘技术和方法,找出这些特征与彩电销售是否盈利间存在的关联。,二、项目实施,1、数据清理 2、多维数据集建立 3、挖掘模型设计及决策树处理,1、数据清理,对系统原有信息的分析 原系统对商品分类采用两级分类的方式:其中,FName列存储商品大类信息,FSpecification存储商品品牌和型号信息。结构不大合理。,1、数据清理,为便于数据挖掘,将商品相关信息合理存储,采用细化分类的思想,针对本次分析的商品为彩电,将其改为4级分类,依次为: *销售类别(经销和代销两种) *屏幕尺寸 *品牌 *型号,1、数据清理,为此,在Itemlist表中加入两列:Brand和Size,存储彩电品牌和屏幕尺寸信息。新列数据从FSpecification列中提取:,1、数据清理,无关数据的清除 新建一个TV_Item表,只存储与彩电有关的商品信息:,1、数据清理,从Itemlist表中导出与彩电相关数据项到TV_Item表中:,1、数据清理,销售记录的清理 建一TV_Sales表,用于存储相关彩电的销售信息,表中只保留本次项目用到的信息:,1、数据清理,根据TV_Item表中存在的彩电编码列,将OutDetail表中与彩电相关条目倒入TV_Sales表:,1、数据清理,其余清理工作 商品编码的规范 无销售记录的彩电条目的清除(包括:北京、上海、牡丹、孔雀等品牌) 错误销售数据的清除(如因抵消价格输入错误的单据,而输入付销售数量的销售记录),1、数据清理,结果 仅将相关数据集中在仅两个表中,大大减少数据量,有利于下一阶段工作。 规范了信息存储形式,为进一步挖掘打好基础。,2、多维数据集建立,利用SQL Server企业版所带的Analysis Manager 工具建立多维数据集 事实数据表:TV_Sales 度量值: FQuanty(销售数量) FProfit (毛利),2、多维数据集建立,维度的建立 *时间维度:,2、多维数据集建立,*品牌和尺寸维度:,3、挖掘模型设计及决策树处理,采用的技术: Microsoft决策树 数据预处理: 原因:SQL Server不支持自定义挖掘模型 为适应Microsoft决策树运算要求,减小数据范围,将销售记录中每笔销售的毛利值,按其值为正、零和负,划分为盈利、无利和亏损(销售)三类。 将每笔销售记录的销售单价划归入以下几类:,3、挖掘模型设计及决策树处理,挖掘模型建立 四个挖掘模型: 时间、价格、品牌、屏幕尺寸,价格模型图片,三、数据分析,为便于观察,将挖掘结果倒入EXCEL表中分析 除2001年3月门店新开张时亏损销售幅度较大,以及2002年4月数据不完整外,其余月份波动较小,无明显变化趋势。 在2月、5月、10月进行的降价促销活动,对整体盈利情况无明显影响,彩电屏幕尺寸和销售价格间有对应关系,放在一起分析 虽然14寸彩电有非常好的盈利能力,但并非消费主流 随着彩电销售价格增加(或屏幕增大),亏损销售的比例也在增加,所以并非越高档的彩电,越能给销售企业带来利润。,盈利情况较好品牌:三洋、海尔、厦华 盈利情况较差品牌:东芝 中外品牌对比: 国产品牌以无利销售占主流,国外品牌中无利销售大多占小部分比例 。造成此现象,是因为国产彩电销售以跑量为主,达到一定销量后,可要求厂家提供返利。形成另外的利润来源。而国外品牌大多无返利提供,利润仅来自销售毛利。,四、最终结论,从能否创造正利润的角度看,中低端彩电品种比高端品种有更好的表现,并且应看到到

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论