给数据分析师的几点意见_第1页
给数据分析师的几点意见_第2页
给数据分析师的几点意见_第3页
全文预览已结束

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

愿望就这么小 安静的听你撒娇看你睡着一直到老 给数据分析师的几点意见 1 数据是有立场的 立场决定解读 数据对于业务来讲 是 KPI 的衡量标杆 也是行动指南 但一旦涉及到立场和方向性 的东西 必然有利益触发点的问题 比如同样的一次活动的网站转化率是 1 2 是好还是 坏 这是做数据分析第一步要进行的定位 也就是我们所说的下结论 好坏的区分在于比 较 如何比较呢 我们知道比较分析方法有环比 占比 定基比 横向比 纵向比等 其中 如环比可以比较昨日 上周今日 上月今日等 不同的时间对比出的结果一定有差异 甚 至是迥然不同的结果 那面对这种情况 除了分析师的经验以外 在都符合统计学规律的 前提下该如何判断活动效果好坏 第一步结果总算出来了 那么假设结果是好的 先不管对比的是什么时间 那确实是好的吗 我们知道做 活动效果肯定会好啊 尤其在中国 只要价格低 无论多么差的用户体验 无论网站 UI 多么垃圾 无论送货多么慢 订单转化率一定会起来 这就意味着 无论你的营销 运营 做的怎样 只要不是特别特别差 各个渠道 各个节点转化率都会上来 这时候 你会 怎样分析 其中有多少是归于渠道或运营本身的优化因素 而有多少是归于活动影响 假设我们能找出其中归于活动本身或渠道 运营本身的影响因素 结果出来后可能是 刨去活动影响 渠道 运营做的转化率其实变化不大 事实上通常是这样的 但我们 不能否认他们的功劳 毕竟没有流量 没有运营 网站无法正常运行 工作效果不明显 啊 你会怎样 直接告诉你的同事他们的工作没效果 可能你不会那样做 那此时你该 如何取舍 尽职尽责做好一个数据的本职工作还是考虑下其他因素 怎么做才能既让数 据价值最大化又能不打击同事的工作积极性 2 数据质量永远是数据分析立项后首先要考虑的 做过大型数据分析的同学刚开始或多或少有这样的经历 拿到数据后经过分析发现 了一个异常分析点 做了 N 多预处理 N 多牛叉的模型 N 多分析和多维钻取 最后把报 告呈现出来 跟业务沟通的时候 业务只说了一句话 哦 那个异常数据啊 那是我们 的测试数据 然后我们会不会疯掉 为什么会出现这种问题 因为拿到数据后没有进行一步必要的步骤 数据质量验 证 什么是数据质量验证 我理解的是首先要理解数据来源 数据统计和收集逻辑 数据入 库处理逻辑 其次是理解数据在数据仓库中是如何存放的 字段类型 小数点位数 取值 范围 规则约束如何定义的 第三是明确数据的取数逻辑 尤其是从数据仓库中如何用 SQL 取数的 其中特别是对数据有没有经过转换和重新定义 第四是拿到数据后必须要 有数据审查的过程 包括数据有效性验证 取值范围 空值和异常值处理等 当这些工作都做充足之后才是数据分析 但可惜的是大多数数据分析师都不关注数据 质量问题 甚至对数据的理解仅限于表现定义 当然做足了底层的工作 你会发现做起数 愿望就这么小 安静的听你撒娇看你睡着一直到老 据来事半功倍 并且你的结论和推到是经得起验证和考究的 3 缺乏落地的数据没价值 除非是市场分析 数据的价格在于对业务的驱动 不管你的业务对象是你的 BOSS还是同事 很多情况 下 我们的数据分析师是这样工作的 一天到晚闷头做事 出数据写报告 结果出来的数 据结论和建议会有这么几种情况 分析过程明显不符合业务操作实际 结论明显是错的 建议方向性很对 但是空 洞 具体执行缺乏落地点 建议方向性很明确 也有具体执行建议 但是业务不能执行 上面的问题中 第一二条会偶尔发生 第三四条会经常发生 为什么 从数据的角度来 讲没问题 但是落实到业务实际上有问题 问题出现哪 主要是这几方面 数据分析师 根本不懂业务操作流程 凭自己的理解去猜测业务流程 数据分析师根本不知道现在业 务的困难点在哪 哪些是目前最紧急的 凭自己的感觉认为 我觉得这些对他们最最有 用 数据分析师根本不知道业务能控制哪些 不能控制哪些 即使能控制又是否业务 有必要去做 导致建议不是该业务部门能执行的 4 数据解读能力和业务应用能力永远大 于工具应用能力 不要迷信算法和模型 受至于数据的普遍理论影响 很多数据分析师会认为会多少个模型 多少种算法是 一件多么牛叉的事情 诚然 数据尤其在面对海量数据时 普通的数据分析方法常常感 觉无能为力 但这并不意味着工具和方法就决定了数据分析师的层次 举例来说 通常我 们用的数据挖掘模型 业务都很难理解 假如你花很长时间作出一个关联模型 如果你 这样告诉你的业务受众 A 商品和B 商品关联程度较高 从支持度 置信度和提升度来 讲效果显著 那我们可以预想到这个挖掘的结果很难落地 并且意义不大 从业务受众实 际应用层面来讲 两个商品关联度高意味着什么 意味着用户通常会一起购买这两件商 品 也有可能是复购 具体看数据选取规则 那一起购买又怎样 我们是否可以把这 两件商品做打包促销 是否可以做关联推荐 是否可以做个性化营销 是否可以引导用 户消费倾向 甚至在活动页面设计上 是否可以将相关度高的品类 品牌摆放在一起来 促进销售 又或者这是否可以做流失挽回的参照指标 重新审视之前每次的广告 通发 这才是数据价值 无法跟业务结合的数据模型毫无价值 4 业务需求是数据分析的起点 但之前你需要培养业务的数据意识 很多时候我们希望等待我们的业务自己上门提需求 并且以需求为数据分析的起点 似乎很多教材也是这么说的 基于业务需求的数据分析目的更明确 分析结论和效果落 地也会阻力更小 但实际情况是业务通常是数据不敏感的 主要表现在 业务没有数据决策的意识 大多数业务的第一行动引导因素还是业务经验 无论是基 于事实的经验还是拍脑袋决策 数据绝对不是行动前必须参考的因素 业务不知道数据 在哪些方面能帮到他 业务很多时候只是有个想法 想让数据证明点什么 但说不清楚 通常业务的措辞是 我们想知道这次活动的效果怎么样 我们想了解广告效果为什么 不好 至于具体效果指的是什么业务自己也说不清楚 甚至是业务自己也不知道到底想 要什么 愿望就这么小 安静的听你撒娇看你睡着一直到老 业务不相信数据 如果数据结果出来时和业务设想的不同 那业务的第一反应是怀疑 数据 无论是数据的出处 分析过程还是结论 业务总想找到能证明自己观点对的东西 所以我们会感觉 业务用数据的目的只是为了证明自己当初设想的正确性 作为数据分 析师 我们不能要求业务必须要懂数据 理解数据 但是我们需要把数据能解决什么问题 怎么解决的 解决之后会给业务带来哪些改进以及效果上的优化 如果能预测出一个具 体数值或最起码有一个范围 业务会更加相信数据的真实性 准确性 如果培养业务的数 据意识 数据意识是一个不断积累的过程 需要每周至少 2 3 次专项沟通 每次沟通至少持 续半个小时 大概半年之后业务会形成一定的数据意识 最起码意识到在某些时候 数 据会解决一些问题 每次沟通时 明确告诉业务数据能给他们带来哪些好处 能实现什 么 在哪些主要业务点上能发挥作用 这样业务会认为数据会是一个能帮到自己的东西 数据不只是在业务执行之后才会发生作用的 在业务执行前的预测与计划 在业务执行 过程中及时预警与恶意数据监控都是数据能发挥作用的场合 并且这些都能在 坏数 据 坏结果 出来之前通过数据区去改善 这些将比结果出来后再去分析要更有意义 作为数

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论