超级菜鸟如何入门数据分析_第1页
超级菜鸟如何入门数据分析_第2页
超级菜鸟如何入门数据分析_第3页
超级菜鸟如何入门数据分析_第4页
超级菜鸟如何入门数据分析_第5页
已阅读5页,还剩19页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

超级菜鸟如何入门数据分析?

我的回答全文大致如下(全文很长,建议收藏阅

读):

经常看到很多朋友会问,入行数据分析之前我要

不要学个java,学个Tableau,然后在学个Python

会比较容易。好像是说,数据分析一定需要Python

才能做,分析变成了为某种编程语言、某种可视

化工具服务。

其实这样误区的是很不对的,按这种方式学习下

去,即使最后Python学的很好,也挺难找到一份

数据分析的工作。

01

什么是数据分析

所以在讨论这个话题之前,第一个问题可能要思

考的是什么是数据分析。为了简便,第一部分宝

器先用之前整理的几张图回答,详细文章请见:

数据分析只需要看懂一张图,附下载链接!

请先耐心看完第一部分:

七、数据分析报告

⑥述析

探索性数据分析

急证件初盼析

现状分析了为企业的■营情况及构成

,京区分析诵定业务变动笆具区原因

・M・IIIIX—・,,・—・1・1I———,・・|・,■■■・

预测分析对企业未来发展做比颈测

J—一・二II-'一…|一...

①去猊上明确分析且的和急急

②收集用于解决问会的娄医

③对收集的数套迸行颈处理

④微猊上进行具依的数据分析

⑤对分析结果进行可祖化展示

⑥针对分析结果撰写报告

为了分析而分析

一.数据冽曲魅

数据分析的误区备之也务知讶,分析结果不实沐

国行囊高级:慢堂而忘了简单就是最好

僮业务

使哲溟

僮分析

一具

僮设计

平均数

空对数、相对教

百分比、百分点

常用指标坡数、频率

比例、比率

倍数、备数

同比环比

确注分机门的利丁格(灰

观)

[I■•湫■分析月法.仑

理第宙问冢

Product(产品)

Price(价格)

4P------------------------

-------Place滦胤

Promotion(促的)

用.a认为产品

用户蒸冬产品

用户便用行为用户试用=定

用户使用产品

用户号工产品

李照:特在

字线与记录(-------------

----------------------G记录:特,二具景值

两诂数据

文本数据

导入数据———

---------数据二

其他

[单瀛g

问卷灌查I条选至

■i—-tai—

、排,字一

亓放置单专

缺失值处理

表达物k化

突二聿点

拄状图

年碧

敦.点图

参见下表6-1

1、礴定表达问题

2、确定摹种图表适合俵问题

3、选择亲索到作图表

4、险至是否有效的是不数据

六、可^«图表及美化5、检查是否表达了问霏

平均送图*曲寸比

共生身图

0折线图

裁在图

正襄光图80%的价值三达20的人责R

旋见图指标对比

人匚金字塔圮反应过去,瓯和木木石发盘状况

海二图上下指后直接的新系

电$图及发展曾留

三号三塞、支保、单位、羔兰等售息

宣为.整洁,对比

色彩塔酿字体、珞式

其他(宙达

要表达的数

饼图柱形图条形图折线图气泡图图、散点图、

据和信息

表格)

成分百分比堆积

111

整体•部分图

排序

111帕累托图

数据间比较

时间序列

11面积图

走势、越势

频率分布

111

数据频次

相关性

111散点图

数据间关系

多重数据比

雷达图

旗性

。圣玩丝圆的表述分析卫程和造果

结沦是以分析结果为,夜事;为分析结案

飨论与黑议t------------------------------------------------------

-------------i磋&星对业务现有向蓼疙已自二解,方君

附录正文二涉及而未闻述的黄料

02

数据分析职业发展不同阶段

第二部分谈的是关于数据分析这个岗位不同阶段

所需要业务能力和技能需求(这一部分来源参考

了各种大佬的解答)。

第一阶段:助理分析师,这是个使命必达的阶段,

你核心要做的是快速学习,执行配合,业务能力

上你需要做到几点:

问题识别:在一定指导卜准确识别问题

分析规划:在一定知道下完成分析规划

数据获取:提取简单数据,了解分析方法

展示演示:能够形成报告,展示分析结果

价值应用:完成业务需求,提出自己的见解

执行和管理能力:合理分配和安排,完成分析任

务即可。

影响力:这一阶段基本上是学习阶段,没什么大

的影响力。

第二阶段:数据分析师,这是个无懈可击的阶段,

你核心要做的是独立执行,小有成就,业务能力

上你需要做到几点:

问题识别:能够独立清晰的识别问题

分析规划:明确范围并做好分析规划

数据获取:熟练提取数据,应用分析方法

展示演示:展现的条理、逻辑、表达清晰

价值应用:提出建议并推动建议被采纳

执行和管理能力:作为核心成员、控制项目进度

和质量

影响力:推动建议被采纳,跨团队沟通协调

第三阶段:资深数据分析师,这是个无中生有的阶

段,你核心要做的是发掘项目,主动执行,业务

能力上你需要做到几点:

问题识别:发现问题并转化成分析目标

分析规划:提炼问题并做好分析规划

数据获取:熟练提取数据,指导员工分析

展示演示:结论突出清晰、指导员工

价值应用:提出有效建议,独立主动

执行和管理能力:领导跨部门项目、寻求资源

影响力:具备一定判断力和影响力

第四阶段:数据分析专家,这是个独当一面的阶

段,你核心要做的是推动业务,辅导团队,业务

能力上你需要做到几点:

问题识别:识别问题并推动解决问题

分析规划:提炼问题并做好分析规划

数据获取:熟练提取数据,指导员工分析

展示演示:结论突出清晰、指导员工

价值应用:提出有效建议,独立主动

执行和管理能力:完成影响力大的复杂项目

影响力:具备较强判断力和影响力

第五阶段:高级数据分析专家,这是个红杏出墙的

阶段,你核心要做的是统筹规划,名声在外,业

务能力上你需要做到几点:

问题识别:思考数据的价值并规划推进

分析规划:提炼问题并做好分析规划

数据获取:熟练提取数据,指导员工分析

展示演示:结论突出清晰、指导员工

价值应用:提出有效建议,独立主动

执行和管理能力:完成影响力大的复杂项目

影响力:分享和指导,在公司层面具有强影响力

第六阶段:资深数据分析专家,这是个诸葛连弩的

阶段,你核心要做的是参与决策、指挥有度,业

务能力上你需要做到几点:

问题识别:提出业务的前瞻性建议

分析规划:提炼问题并做好分析规划

数据获取:熟练提取数据,指导员工分析

展示演示:结论突出清晰、指导员工

价值应用:提出有效建议,独立主动

执行和管理能力:完成影响力大的复杂项目

影响力:在专业领域有一定影响力

03

你需要的技能树拆解

这一部分谈的数据从业者需要学习的一些技能,

下图后面有拆解版(图打开看更清晰)。

王成分分折

极大叔然去

I•率统计学

贝”斯学谑

知道什么是特征工n以及常用得仅工程方法

IM1H飨分析PCA

教雯科学嬴技茂朝

其■■▼力

GaussianMixtureModeK

LEJ

numpy

matplotlib

correiabon

Pythonsakit-leam

ESQpandas

m线性代收

矩阵运一皿

特征值

EBig0Notation

|QtikView

商务智能软件

[Tableau

Python用干做揖可视化H据可视化•

EEB

几钟持序工法

概括为以下内容:

1、SQL脚本取数

SQL一定要写的非常熟练,最好是熟悉Hive-sql,

可参见以下几篇文章:

数据分析招聘要求:熟练SQL!|精简版复习大

纲送给大家!

解一下TMD几道热门数据分析面试题。

2、统计学理论

统计学可分两部分学习,第一部分是描述性统计,

分别要掌握以下知识点:

♦集中趋势:均值、中位数与分位数、众数

♦离中趋势:标准差、方差

♦数据分布:偏态与峰态、正态分布与三大分布

♦抽样理论:抽样误差、抽样精度

第二部分是推断性统计,你最少要知道中心极限

定理、大数定律、置信区间、假设检验、t检验、

f检验、卡方检验、ABtest等等。(面试考这一

部分较多)可参考这篇文章:

ABtest|数据分析师面试必知!

3、机器学习理论。

这部分你需要从几点准备,第一要理解每个算法

的应用背景,优缺点(最重要的)o第二,熟悉

常见的公式推倒(不需要每个都会)O大致要掌

握的是逻辑回归、SVM、决策树、随机森林、

Adboost>XGboost等集成学习、神经网络。(DNN、

CNN、inception、ResNet、RNN、LSTM等深度

学习算法在数据分析面试中很少问,不需要准备

那么多)

4、业务分析。

这部分可以从“人人都是产品经理“社区、增长黑

客等内容学习,你最少要知道Pv、Uv、DAU等

各种指标,如何进行指标拆解、如何进行流量分

析、留存分析、用户行为分析,啥是海盗模型,

RFM模型、某个指标下降/上升如何分析等等c

宝器之前做流量分析的时候会做一个这样框架

图,其他的也可参考:

一边吃粽子,一边思考流量数据分析!

1.1.1.何为“埋点”?

1.1、数据埋点(---------------------

--------------------I1.L2、-ti点”作用?

12流国采箧核心底层表与字段

2.1.方法

(ETL)22、作用

2.3、问题(数据做科)

流量数据分析

拉新(柔道)

4.1.1、针对新用户(--------------

4、用户分析(绩效指标KPI)

用户价值评分与精准营储

澹量货币化

5、工具类

语言:非大数据类R、Python最多(比较geek的

也有用julia的,不差钱和某些公司要求的用

SAS>Ma11ab)o

可视化:Tableau>http://plot.ly>d3.js>echarts.js,

R里面的ggplot>ggvis,Python里的bokeh>

matplotlib>seaborn>Pyechart等都不错.

其他框架、类库(选学):爬虫(requests、

beautifulsoup、scrapy).

04

想好自己的发展方向

数据分析的小方向比较多,分类方法也不尽相同。

在这里根据技术要求的侧重点不同,简单的划分

为三个方向(这部分回答乘次不齐,有的是直接

简单的分技术类和业务类,这里参考广大网友作

答):

1、BI方向

BI的概念已经出现很久了,但仍然不过时。

重点在于如何设计高效的数据模型,以及如何通

过BI工具从多个角度观察数据,了解数据内部的

规律。

传统的BI工具可以满足大部分传统企业的数据

分析场景。近些年随着分析工具功能日趋强大,

大数据领域的BI平台也有了长足的发展。所以

BI仍然具有强大的生命力。

2、机器学习方向

机器学习与BI的区别在于,更多的依赖机器模拟

人类学习的过程去发现数据内在的规律,构建一

个数据模型,通过某些算法来预测未来的可能性。

机器学习和深度学习概念非常火热,但相对入门

门槛也较高,因

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论