当excel不够用时,如何利用Access进行数据分析?.doc_第1页
当excel不够用时,如何利用Access进行数据分析?.doc_第2页
当excel不够用时,如何利用Access进行数据分析?.doc_第3页
当excel不够用时,如何利用Access进行数据分析?.doc_第4页
当excel不够用时,如何利用Access进行数据分析?.doc_第5页
已阅读5页,还剩5页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

数据量太大,Excel拖不动怎么办?还有其他能取代Excel但易上手的工具么? 这个问题真是撞到枪口上了,我有收到不少的类似提问,今天就来统一解答一下。 大数据量做报表或数据分析的方案 百兆以上,几十万行excel的数据量:数据库ACCESS+SQL 数据若不是达到亿万级别,直接用BI工具分析 再大,就不是尔等表哥表姐,数据分析师能解决的了。数据量太大,Excel拖不动怎么办?还有其他能取代Excel但易上手的工具么?这个问题真是撞到枪口上了,我有收到不少的类似提问,今天就来统一解答一下。大数据量做报表或数据分析的方案百兆以上,几十万行excel的数据量:数据库ACCESS+SQL数据若不是达到亿万级别,直接用BI工具分析再大,就不是尔等表哥表姐,数据分析师能解决的了。鉴于大家都有一般日常都用Excel,本文将要主要讲第一类方案,出一篇完整教程,通用且实用,用到的工具是ACCESS数据库。关于ACCESS,它Excel的同宗兄弟,同属微软Office一门,上手不难,一周搞定基本操作。它可以解决做数据运营的小伙伴们的如下抱怨:业务上要处理的Excel数据表格存储量越来越大,超过50MB就慢如蜗牛,这时表格里要是再多个IF、VLOOKUP函数什么的,电脑就直接罢工了;要是遇到向下面这样大小的Excel表格,服务器级别的电脑都吃不消,更别谈进行数据处理和数据分析了。数据量超大的excel表格连打开都难遇到上图这么大存储量的Excel数据表格,卡是必然的,死不死机就看人品了。那遇到这样的难题,有没有能处理大存储量文件,同时又操作简单、容易上手的数据分析软件呢?答案是当然是:YES,而且还是Excel的同宗兄弟,同属微软Office派系的ACCESS。以下内容将以运营中常见的一个分析项目为案例,力求让做数据分析的小伙伴们对ACCESS有一个基本的了解,从而找到分析大批量数据的思路和方法。下图是本文使用ACCESS对原始表格进行数据分析的4大目标。这里先就ACCESS的基本情况说两句,然后用一个实际案例进行数据分析的实操。一、ACCESS数据库简介1.ACCESS和SQL语句的基本概念Access,全称“MicrosoftOfficeAccess”,是微软OFFICE中的一个成员,由微软发布的关系数据库管理系统。它结合了MicrosoftJetDatabaseEngine和图形用户界面两项特点,是MicrosoftOffice的系统程序之一。(来自百度百科)提到ACCESS,就不得不提SQL,只有掌握了SQL,才能将ACCESS的功能发挥到极致。SQL的全称是“结构化查询语言”(StructuredQueryLanguage),是一种声明式语言。首先要把这个概念记在脑中:“声明”。跟大家以往所知的编程语言相比,SQL语言是为计算机声明了一个你想从原始数据中获得什么样的结果的一个范例,而不是告诉计算机如何能够得到结果。换言之,SQL的真正核心在于对表的引用。SELECTfirst_name,last_nameFROMemployeesWHEREage=25上面的例子很容易理解,我们不用关心这些雇员记录从哪里来,我们所需要的只是那些年龄大于等于25岁的雇员的数据(age=25)。2.ACCESS的优势ACCESS最明显的好处在于,它可以在不用掌握很高深编程语言的条件下,处理Excel所不能承载的大存储量的数据原始文件,速度奇快,且易学易用。3.ACCESS的常用语句下表是ACCESS使用过程中常用的一些SQL语句,理解起来不算困难。ACCESS数据库常用的SQL语句标题要想学好数据分析工具,最重要的是用实际案例来调动各种零碎的工具使用知识点,在历经完整的案例分析后,短时间内就可以掌握这些工具的操作方法。简单介绍完了ACCESS和SQL语句后,接下来开始ACCESS数据分析实操吧!二、ACCESS数据分析实操1.数据导入下表是本文进行ACCESS数据分析的原始文件,数据量近230MB,Excel打开需等待好几分钟,而且得看电脑心情出于商业保密的目的,本文将使用其中的部分数据进行分析实操,且做一定处理。标后台导出的原始数据题先将Excel中的文件导入ACCESS中,按下图箭头路径所示:导入excel原始数据文件标题按上述步骤操作后,自动生成主键(即ID),得到如下结果:Excel原始数据文件导入到ACCESS中标题2.用户下单时间段分析进行下单时间段的分析,需要将用户下单的时间转化为小时“时点”,这里使用的SQL语句是format,功能是对所选字段进行格式设定,语法为:format(引用字段,数据格式)其中,“数据格式”在时间上一般选用H(小时)、D(天)、M(月)或Y(年)。然后,再使用count函数,将UserID进行计数,得到的结果即是订单量。注意,使用format和count之后,需要使用“AS”将其定义为新的字段,这里二者分别定义为“时段”和“订单量”。下单时间段分析操作步骤在“创建”里新建一个“查询设计”,点开右下角的“SQL”,然后在SQL会话框输入如下语句:SELECTformat(下单时间,h)AS时段,count(UserID)AS订单量FROM元数据GROUPBYformat(下单时间,h);然后,点击“设计”下的“运行”,得到如下结果:各个时段的订单量分布情况举个例子来说明上面的结果该如何解读,假如某位顾客是12:23下单,则该时间点归到“12”这个时段里了,而“12”代表的是1213时这个时间段。可以根据“运营实操如何利用微信后台数据优化微信运营”这篇文章里的方法利用函数将其变为时段显示。3.付款区间订单量分布情况分析计算付款区间需要用到一个比较牛X的函数-Switch,它是按顺序计算一系列的表达式,如果某一表达式成立,则返回其随后的值。语法:SWITCH(条件1,结果1,条件2,结果2,条件3,结果3,条件N,结果N)条件1、条件2、条件3:表示要计算的表达式,条件1成立的话,返回值结果1,条件2成立的话,返回值结果2,依次类推。按照上述的方法,在“创建”里新建一个“查询设计”,点开右下角的“SQL”后,输入如下语句:SELECTuserID,付款额,switch(付款额=10,110元,付款额=20,1120元,付款额=50,2150元,付款额=80,5180元,付款额150,151220元)AS消费区间FROM元数据;点击“运行”后,得到如下结果:标用户单次下单的消费金额所对应的消费区间题此时,关于消费区间的数据处理还未结束,因为这是每一条下单记录的付款额所对应的消费区间。我们接下来要做的是类似于excel中数据透视表的做法,将消费区间放在第一列,从而对每个消费区间有多少订单量进行统计。所以呢,跟上面一样,得新建一个查询了,名称改为“付款区间订单量统计”。这里需要输入的SQL语句是:SELECT消费区间,count(UserID)AS订单数量FROM付款区间GROUPBY消费区间;点击“运行”后,得到的结果显示如下:各消费区间订单量分布情况然后,将上述数据复制到Excel表格里,制成如下的百分比扇形图,可以直观的分析出每个消费区间的订单量占比情况,进而看到整体的用户消费水平如何,对这段时间内的运营进行合理评估。各消费区间订单量占比扇形图4.各区域订单量、用户数量及销售额分析(1)各区域用户数量这个就有点小麻烦了,用户数量用“userID”的计数间接计算出来,但是由于绝大部分的用户下单次数不小于2次,所以直接计数的话,得出来的结果就是订单量了。鉴于此种情况,我们得换个思路,先做出一个不重复的用户下单信息表,也就是每个用户ID下单的频次表。新建一个“查询设计”,命名为“用户消费频次”。在SQL对话框里输入如下语句:SELECTUserID,COUNT(UserID)AS消费次数,区域FROM元数据GROUPBYUserID,区域;点击“运行”后,得到的结果显示如下:用户下单频次表这样,我们就可以以这张用户消费频次表作为跳板,在再次新建的表里计算出每个区域的用户数量咯。新建一个“查询设计”,命名为“各区域用户数”。在SQL对话框里输入如下语句:SELECT区域,count(UserID)AS总用户数FROM用户消费频次GROUPBY区域;点击“运行”后,得到的结果显示如下:各区域用户数量(2)各区域订单量、消费金额状况新建一个“查询设计”,命名为“各区域订单情况”。在SQL对话框里输入如下语句:SELECT区域,count(UserID)AS订单总数,sum(付款额)AS总金额,avg(付款额)AS平均消费金额FROM元数据GROUPBY区域;点击“运行”后,得到的结果显示如下:各区域订单量、消费金额状况再将上面的各区域用户数量整合到这张表里,就得到了关于这三个区域完整的运营情况概览表。见下表:各区域运营情况概览5.用户价值分析这里的用户价值分析基于RFM模型,不过对其进行了进一步的完善,在原先“累计消费金额”的基础上,引入了“最低消费金额”、“最高消费金额”和“平均消费金额”这三个指标,力求全面的反映消费者的购买力。新建一个“查询设计”,命名为“用户消费情况”。在SQL对话框里输入如下语句:SELECTuserID,min(付款额)AS最低消费金额,max(付款额)AS最高消费金额,avg(付款额)AS平均消费金额,sum(付款额)AS消费总金额,count(付款额)AS消费频次,datediff(d,max(下单日期),#2015-9-15#)AS最近一次消费距离今天天数FROM元数据GROUPBYuserID;点击“运行”后,得到的结果显示如下:用户价值分析表得到该表后,可以对其进行聚类分析,按照R、F、M这三个维度对用户进行分类,详情可参看“【数据运营实操】如何运用数据分析对某个试运营项目进行“无死角”的复盘?”这篇文章。最后,我们还可以得出这三个区域总的订单情况和销售金额情况:新建一个“查询设计”,命名为“各区域销售总览”。在SQL对话框里输入如下语句:SELECTcount(userID)AS订单总数,sum(付款额)AS付款总

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论