数据分析培训.pptx_第1页
数据分析培训.pptx_第2页
数据分析培训.pptx_第3页
数据分析培训.pptx_第4页
数据分析培训.pptx_第5页
已阅读5页,还剩31页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1,2,3,4,浅谈数据分析,EXCEL使用经验,重要函数应用,学习与进阶,彼得 德鲁克,数据分析并不是一个结果,只是过程 如果你不能用指标描述业务,那么你就不能有效增长/降低它 业务指导数据,数据驱动业务 数据本身不产生价值,如何分析和利用数据对业务产生帮助才是关键 如果数据分析需要绩效指标,一定不会是分析的对错,而是最终数据提升的结果 数据分析需要反馈。分析出的结论,必须用业务结果验证它。需与运营和产品人员紧密联系,看看改进后的效果,一切以结果为准。如果结果并没有改善,则应反思分析过程 数据分析以结果为导向。只有结果的呈现和问题的暴露,没有任何跟进、改进的措施的数据分析是没有意义的,浅谈数据分析,我认为,数据证明,直觉化经验化的思维,数据导向型的思维,重在数据的应用,清晰的数据来源、统计口径、判断标准,模糊的、感性的、口语化,过去,现在,A区域,B区域,A产品,B产品,A类别,B类别,A用户,B用户,单一的数据没有分析意义,只有多个数据组合才能发挥出数据的最大价值。,对比,通过业务建立和筛选出指标,将指标作为维度,利用维度进行分析,PS:可以尝试复习一下你学过的基础统计学了,80%的业务分析用不到太高级的统计方法,业务数据分析的核心,“本周的用户转化率比上周高”显然比“转化率为2%“更有意义,代替,核心驱动指标一定能给公司和个人带来最大优势和利益,实施后的反馈结果贴合业务目标、企业使命及愿景 另外一方面,好的指标还有一个特性,它应该是比率或者比例。,核心指标都是可以付诸行动的,能指导并据此改变行为,核心指标具有比较性:如果能比较某数据指标在不同的时间段、用户群体、竞争产品之间的表现,就可以更好地洞察产品的实际走向,核心指标和虚荣指标,虚荣数据指标大多是一维的,可再细分出深层指标的,易给人产生【大规模感】和【成长感】,销售额,总店铺数,活跃用户数,下载量,激活率, ,你现在能否区分出实际业务中的虚荣指标和核心指标?,无论你觉得自己有多么的客观,这些指标都会对判断带来一些影响,维度是说明和观察事物的角度,指标是衡量数据的标准。维度是一个更大的范围,不只是数据,比如时间维度和城市维度,我们就无法用指标表示,而指标(留存率、跳出率、浏览时间等)却可以成为维度。通俗理解:维度指标。,维度和度量,理解维度和度量,也是快速理解Excel的关键功能(如数据透视表)和各类BI软件(如Tableau)的基础,数据分析的基本步骤,明确分析目的和思路/定义问题 数据收集 数据处理 数据分析 数据展现 报告撰写,学会提问,问对问准问题,AARRR模型: 获取用户(Acquisition) 提高活跃度(Activation) 提高留存率(Retention) 获取营收(Revenue) 自传播(Referral),一个常用的分析模型,以此类推还有很多思维模型可以应用于我们的工作,这也被称之为“结构化思维”,这里不一一列举,并不存在“正确”工作 大多数人没有成功绝对是事出有因。他们对世界如何运转有着错误的预设。 有一种理论假设,作为人,我们必须事先拥有需要“发现”并随后追随的雄心壮志。著名心理学家,看见成长的自己(Mindset)一书作者卡罗尔杜依可认为这是一种“固定心态”。 相对于自私地追求自己所热爱的生活,纽波特建议人们成为一名“工匠”,在这个过程中,人们可以练得难得的、有价值的技能。纽波特把这些稀有而有价值的技能称为“职业资本”。,人与人效率之间的差距十分巨大,无论你将节约出来的时间是用来“偷懒”、继续工作还是思考创新,你都比坚持蛮干的人要优秀。,“精通”的意义,挑选一条道路,然后致力于发现“如何”抵达的可能性 以下是关于发展精通能力的核心思想概括: * 不存在一种你应该“追随”的内在激情,相反,激情会跟随着你。 * 自信不是通向成功的路,相反,成功的行为才是通向自信的驱动力。 * 当你掌握了那些稀缺且有价值的技能进而获得“职业资本”的时候,你就会开始培养自信、激情和个性。 * 因此,你的个性不会影响你的行为,相反,你的行为塑造了自己的个性。 * 你是自己身份、幸福和对生活产生影响的创造者。 如果你的想法与上面这些恰恰相反,那么很有可能正处于“固定心态”里,要警惕,因为它会让你变得固步自封。,“精通”的意义,不要给自己设限,在这样一个信息时代,具备一定的数据分析思维和技能是诸多工作的基础,而非个性化、高精尖的发展方向。,掌握数据思维的重要性,1.你的Excel版本是否更新到2013版以上,对了,今年是2018年:),2.如果你经常需要进行数据处理类工作,你是否比较过WPS和Excel的区别?,3.是否经常逐行逐列处理数据?,4.能否准确描述使用表格遇到的问题,并用百度找到答案?,对于Excel,你了解多少?,5.对于提升工作效率是否有足够的渴望?,6.是否思考过表格类工作有没有更快更优的提升可能性?,7.有没有系统地整理过已掌握的Excel技巧?,一些好习惯和经验,1、没事就按按Ctrl+S,2、自动保存时间间隔设置为23min(默认是10min),3、给他人发送excel前,请尽量将光标定位在需要他人首先阅览的位置,例如Home位置(A1),例如结论sheet,长表尽量将位置定位到最顶端,4、同类型数据的行高、列宽、字体、字号,尽量一致。关爱强迫症,人人有责。 (格式刷),5、字体用微软雅黑or黑体,英文用Arial,6、有必要的时候请冻结首行;没必要但可追究的内容,可以隐藏处理,7、八月十五号、8月15号、815、8.15、8。15这些Excel都不觉得代表时间,8、基础数据表禁用合并单元格功能,9、使用合并单元格的标准:用于记录纯文本信息Or确保这张表已经是用于汇报的表格(不会再需要经人进行数据处理),10、数据量较大的时候,不要保留公式和各种引用(选择性粘贴为数值),11、数据量较大却需要用公式函数进行数据处理时,将计算模式改为【手动计算】,12、灰色是百搭色,12、数据从A1开始,不要有空行空列,13、数据矢量化、颗粒化、同类化,不要混搭(错误范式:一个单元格记录着“3个苹果”=3(度量)个(单位)苹果(名称))(推荐使用数据验证功能),14、询问一下别人的excel版本(也可能是用的WPS),必要时保存为相应兼容格式,15、表格内容禁含空格(有些内容死活匹配不出来的原因之一),16、注意半角和全角输入的各种符号(主要是括号和引号),Excel认为其是两个东西(造成公式失效或引用错误等问题),17、数据信息不要存在批注里,20、表格如果突然变大:清除格式or删除多余的行或列,21、如果数据类工作为主,选择Excel而不要选WPS (95%的相似度也无法弥补那5%的差距),22、新建一个【常用功能】的选项卡,把常用功能扔里面,23、【快速填充】(Ctrl+E)是个好功能,一些好习惯和经验,18、条件格式的【数据条】可实现简单可视化,24、百度KMS并下载,可用于激活各版本Office,19、通配符*和?可用于模糊查询/筛选,25、基础数据尽量不要留完全的空行,Ctrl+D/R,复制上行数据/左列数据还有个很好用的单元格格式转换 F4:重复上一个命令或操作,在公式中选中的单元格引用或区域,F4 循环的绝对和相对引用的各种组合。 (分号后面那个) 比如输入网址的时候,一般输入完会自动变为超链接,在网址前输入就解决 复制,选择性粘贴里面有几个非常好用的仅值,转置(个人推荐用transpose公式) Alt+D+F+F,筛选 Ctrl+1:显示“设置单元格格式”对话框 Ctrl+2/Ctrl+B:应用或取消加粗格式设置 Ctrl+N:新建excel空白工作簿 Ctrl+Shift+%:应用不带小数位的“百分比”格式 Ctrl+Shift+:应用“常规”数字格式 ,一些操作,Ctrl+C/V/X Ctrl+S Ctrl+A Ctrl+Z Ctrl+F/H Ctrl+Shift+上/下 Alt+Enter ,基本操作 不会的请自行查询,一个很神奇的快捷键,Ctrl+E 快速填充,不仅限于解决大部分【分列】功能能解决的问题,更快更强更灵活 【分列】Excel也是很重要的功能之一,用于多样化拆分信息,用法自查,快速且批量处理各类有规律的信息,可应用于:,仅限Office2013以上版本,数据处理的理想与现实,整齐有序 完整无误,残缺错乱 杂糅无序,以上均为个人常用。快捷键有很多,但由于工作内容的差异,使用的组合也会有很大差异。(比如统计财务和人资就是两个世界) 适时而变,多想想:现在的这步操作,有没有更快的可能。然后自行百度挑选对应的快捷键进行练习即可。 快捷键,就整个Excel技能树而言,并不是核心。Excel使用/进阶的核心在于:,解决问题的思路,思路和逻辑是基础也是核心,习惯、快捷键公式、功能、函数 等基础知识,对业务和工作场景的熟悉、理解程度 ,基础,VLOOKUP 函数语法具有下列参数 lookup_value必需。 要在表格或区域的第一列中搜索的值。lookup_value参数可以是值或引用。如果为lookup_value参数提供的值小于table_array参数第一列中的最小值,则VLOOKUP将返回错误值#N/A。 table_array必需。 包含数据的单元格区域。可以使用对区域(例如,A2:D8)或区域名称的引用。table_array第一列中的值是由lookup_value搜索的值。这些值可以是文本、数字或逻辑值。 文本不区分大小写。 col_index_num必需。 table_array参数中必须返回的匹配值的列号。col_index_num参数为1时,返回table_array第一列中的值;col_index_num为2时,返回table_array第二列中的值,依此类推。 匹配规则 True 近似匹配 此时table_array首列中的值必须必须以升序排列;(数字1) False 精确匹配 此时VLOOKUP只能查找精确匹配项(数字0),VLOOKUP的用法(官方解释),VLOOKUP的用法,VLOOKUP( ),作用: 在某一列中查找目标值,然后在目标值所在的行中,返回特定列的值,表达式: VLOOKUP(lookup_value,table_array,col_index_num,【range_lookup】),1.找什么?,2.在哪找?,3.第几列?,4.怎么找?,HLOOKUP( ),作用: 在某一行中查找目标值,然后在目标值所在的列中,返回特定列的值,表达式: VLOOKUP(lookup_value,table_array,col_index_num,【range_lookup】),1.找什么?,2.在哪找?,3.第几行?,4.怎么找?,常用,不常用,VLOOKUP的用法,VLOOKUP实现批量匹配(用一个主键批量匹配出所有字段内容,而不需要重复使用VLOOKUP函数),简单来说:VLOOKUP+COLUMN+$的复合使用 详见演示,再说个复杂点的用法,VLOOKUP多条件匹配,例:字段含班级、姓名、成绩、性别,其中李晓亮等几个名字有重名,且有男有女,现在你想成功匹出所有人对应的成绩,最常用场景 在一个大数据库里,找到特定的几个数据 例:在1000列名字-身份证一维表里,查找特定的5个人(已知姓名or身份证)的姓名/身份证 PS:Excel的高级筛选功能也能做到这件事,用法自查 : ) PPS:VLOOKUP的第四个参数调成1,可进行模糊匹配(长得差不多就返回结果),偶尔有奇效,提示:VLOOKUP的第一个参数本质是数据库概念中的【主键】,此例可用&合并多个独立字段(一般2个即可)创建一个新的主键用于匹配信息,VLOOKUP的局限,VLOOKUP查询数据时,只在数据区域第一列查找,然后返回右侧表格中,对应行的数据。,=,#N/A,初识数组,理清概念 不要混淆数组、数组公式。 数组,就是元素的集合,按行、列进行排列。单行或单列的数组是一维数组,多行多列(含2行2列)的数组是二维数组。 数组公式,仅仅是对按了ctrl+shift+enter结束公式的编辑方式的一种称呼,与数组完全是两码事。,输入数组公式的注意事项 l 先选择要输出结果的区域(正确的行数,列数); l 输入数组公式后,一定要按Ctrl+Shift+Enter三键结束。 总结 概括来讲,数组之间运算。遵循以下顺序: 根据数组的行列数确定运算结果的行列数参与运算的数组扩充区域填充数据进行运算。 即使是多个数组之间的运算,同样也遵循以上规则。 详见演示,初识数组,IF函数,表达式: IF(logical_test,value_if_true,value_if_false),1.条件是什么?,2.如果条件为真输出什么?,3.如果条件为假输出什么?,=IF(C2 90,“优“,IF(AND(C279,C2 59,C2 80),“良“,IF(C2 60,“差“),=IF(C2 59,“及格”,“不及格”),公式教学场景,实际应用场景(但凡涉及逻辑函数,多层套嵌是常态),OR的用法与AND相同,或与并的区别,IF的用法,常用必会的统计函数还有SUMIF(S)和COUNTIF(S),你能猜到他们怎么用吗?,这对CP的优势,INDEX+MATCH,不必调整数据列的顺序 弥补VLOOKUP单向查询缺陷 实现数据反向查询,函数的精髓不在于割裂独立使用,而在于嵌套使用。现实的工作场景的逻辑往往都是多元的复合的。,索引:根据位置参数返回结果,匹配:查找数据在区域中的所在位置,INDEX(array,row_num,column_num),MATCH(lookup_value, lookup_array, match_type),举个栗子(演示),找什么?,在哪找?,怎么找?,举个栗子(演示),此为INDEX+MATCH+数组+$(绝对引用)的复合应用 你清楚这个公式的意思吗?,思考一下:如果仅用VLOOKUP,你会怎样做出【销量】?,含数组的公式记得,用Ctrl+Shift+Enter才能输出结果,返回某日期下对应水果所在的行数,返回某日期下对应水果所在的列数(绝对引用锁定对应列),7种错误的含义: 1.#N/A 当在函数或公式中没有可用数值时,将产生错误值#N/A。 2.#VALUE! 当使用错误的参数或运算对象类型时,或者当公式自动更正功能不能更正公式时,将产生错误值#VALUE!。 3.#REF! 删除了由其他公式引用的单元格,或将移动单元格粘贴到由其他公式引用的单元格中。当单元格引用无效时将产生错误值#REF!。 4.#DIV/0! 当公式被零除时,将会产生错误值#DIV/0!。 5.#NUM! 当公式或函数中某个数字有问题时将产生错误值#NUM!。 6.#NAME? 当公式或函数无法识别公式中的文本时,将出现此错误值#NAME?。 7.#NULL! 使用了不正确的区域运算符或不正确的单元格引用。当试图为两个并不相交的区域指定交叉点时将产生错误值#NULL!。,计算得到的错误类型有:#

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论