




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、专注于商业智能BI和大数据的垂直社区平台第三章:定义问题、设计方案(能力三)By:接地气的陈 第一节 什么是“定义问题” 定义问题非常重要 一个说:肚子疼,你怎么办? 肚子疼 肚子疼止疼药拿去吃!治肚子的药拿去吃! 肚子?疼?哪里疼?什么感觉的疼?什么时候开始疼的? 这是一个很常见的情况 内行服务外行! 讲清楚问题是一个重要能力!是内行才有的能力! 不要轻易相信外行的要求,要去理解他们的处境,分析他们的需求 医生,我从昨天下午6点开始肚子疼 肚子疼主要为肠子绞痛,其他部位无反应 肚子疼之前2小时内有运动,之后大量喝冰可乐,之前无肠道病史ü疼疼疼疼疼ü这这这ü诶呦!
2、嗷嗷嗷嗷!更麻烦的情况,是根本不知道是什么病 所以,需要我们来帮他梳理,诊断,定义问题定义问题四步走:1.2.3.4.清晰描述问题划分问题边界区分问题类型明确输出产物 第一步:清晰描述问题 哪疼?(确认具 这些地方疼不疼?(置)只按一个部分,周边部分都确认) 这样疼的厉害些吗?(用力按,确认是肠子疼还是肌肉疼) 什么时候开始疼的?连续性疼还是周期性的?(排查 肚子疼之前有吃过什么?做过什么事情?(排查 之前有没有疼过?有没有做过手术之类的?(排查)用专业的维度描述问题,消除不确定性,剔除伪命题 第二步:划分问题边界 请听题:一个7岁的宝宝,每天7点钟准时肚子疼,其他时间吃喝跑跳完全没问题,肚子
3、疼的位置每次还不一致,按下去还疼的轻重不一。请问他肚子有什么问题? 答:肚子没问题,估计蛋子要有问题了!医学问题,医学解决;不想上学的问题,棍子解决 第三步:细分问题类型运动伤肌肉疼创口伤肚子疼肠胃疼胃疼急性胀痛肠子疼慢性绞痛要具体到一个很明确的问题,才能做性解答 第四步:明确输出产物 已诊断:喝凉水过多引起的急性肠炎,挂点滴。因为是急,所以挂完点滴不要立即走,留下观察2小时内,止疼止泄以后可离院。 万一有不良反应:送抢救,会诊。有可能需要多次跟进,每一步开始结束要有明确标准 所谓“定义问题”,就是 把一个日常发生的具体,转化为要解决的问题 用清晰的描述和具体的数据,替代随意的、口头的表达 用
4、专业的,定义问题的发生场景,问题类型 初步预判解决问题的方向,设定评价标准,管理期望值 第二节 什么是数据分析中的“定义问题” 同理,当数据分析师实际解决问题的时候“给我个数!” 更可怕的,是不懂装懂的,瞎求指挥的:我在看到一篇文章讲用户画像,给我们也画像一个呗 只有POS数据你画个哪门子的像 瞎求指挥,还指名道姓要模型的:我在看到一篇文章讲machinelearning linear regression BPNN销量 我也要这么! 你一个靠业务员跑单的生意,搞哪门子的BPNN 从专业的角度“大爷想要什么分析?说!”“大爷想要什么数据?说!”“你描述清楚你的困惑就好了,描述越详细越好,如何分
5、析我可以性设计方案。” 定义数据分析问题的四个步骤定义问题四步走:1.2.3.4.清晰描述问题(要分析的这个事情本身,是个什么样子)划分问题边界(到底是不是数据分析可以解决的问题)细分问题类型(是什么,为什么,会怎样,到底归属哪一类)明确输出产物(如何分析的准) 第一步:清晰描述问题 “我要怎么做聚类分析”对着统计学书做! 不清晰业务模式的,先整明白业务模式是什么(这就是为什么要先讲能力一,连业务是啥都不知道,分析个啥) 清晰业务模式的,描述清楚问题是哪个部门,什么时间,什么区域发生的(这就是为啥要先讲能力二,基础的取数时间,对象要搞清楚) 第二步:划分问题边界 数据分析可以解决的:是什么,为
6、什么,会怎样 数据分析不能解决的:想不想,怎么做 决策过程:设想 分析 执行 设想、执行与分析没关系!想不明白这点就弄死 为啥设想与分析没关系 你想要啊? 想要你就说啊 你不说我怎么知道你想要啊! 设想是个很的,受个人的事,想不想只是一念而已。 但设想的问题,可以转化为分析问题 原问题:我要不要买房(想买就买!不想拉倒!) 转化问题:我下不了决心买房,是因为我担心父母,筹不够首付!Ø子问题1:目前欠多少首付,是否真实需要找父母筹钱(是什么,分析问题)Ø子问题2:除了父母,是否有其他可以筹钱(执行问题,析) 输出目标:“父母决;否,不要纠结了就无法筹够首付”是否是个真命题。是
7、,想办法解 为啥执行与分析没关系 敲完200行sql后,电脑里会伸一只手出来给钱不?! 所以想要客户给钱,去跑销售! 想要客户阅读,去写文案! 想要客户活跃,搞活动! 代码没屁用! 但执行的问题,可以转化为分析问题 原问题:我要怎么买房 (第一步:去售楼处,第二步:掏钱,第三步,拿钥匙) 转化后问题:我要怎么最低融资成本的买房 子问题:有哪些融资 输出目标:在ABCDE个(执行问题)哪个成本最低(是什么问题)中选一个,估算成本数。 第三步:细分问题类型 如果不清楚现状 (描述性统计) 是多少 如果想给现状找标准(什么算好,多少算好) 是什么 如果想给现状下(好坏,多少,涨跌,类别) 是什么 如
8、果想多个方案选一个 (根据标准打分) 是什么 如果想知道问题* 为什么 如果想未来 会怎样 如果忘了分析的基本形态,回去复习下能力二 当然,问题很复杂的时候,需要多个分析层次:分析下当前的销售情况 描述现状:卖了多少,销售金额,变化趋势 树标杆:根据历史习惯/KPI达成率/期望到底算不算好 明问题:好的话,能不能持续;不好的话,为什么不好 为什么能持续:先找好的,再看能否持续 为什么不好:先找到问题点,再看 第四步:明确输出产物 是多少 数据,数据报表 是什么 为什么 标准,1 ,依据2,3,4,哪个影响最大 会怎样 预计1 ,预计2,预计3,预计4 所谓:,做的时候千万别把绕进去,紧盯目标
9、一个有意思的现象 作为一个专业分析师,陈经常被人要求分析这个分析那个 陈哥,为啥我没老婆? 老陈啊,分析下现在的房价 陈,帮我看看简历,去这个地方 之前一直啰嗦找对象,我们这次挑个买房子的例子,做详细展开。 当然,在具体展开之前,还是老生常谈一个问题 为什么定义问题很重要! 第三节 为什么“定义问题”很重要 定义问题,是业余和专业最大区分点 之前吐槽的都是不懂数据分析的人定义问题 实际上:只会跑数的“ESP师”,就是定义问题,只会跑需求单,最后就是你若安好,跑数到老 定义的表现一:脑子只有数据,没有业务问题 一提到“数据分析”就联想到一大堆指标的计算,可“分析”呢? 指标只是分析的起点,终点是
10、解决了一个具体问题 为了让平台销量打败京东,应该配多少SKU? 为了减少库存积压,应该在多少SKU以内? 只列数据,数据有了,问题怎么办? 医疗精准怎么做? “基础信息、浏览行为、搜索行为、挂号行为、体检行为” “额,” “如果做关联分析的话,只要订单数据就够了哈” “如果做慢病管理的话,只要基础信息+挂号行为就够了哈” “如果做用药的话,只要搜索行为就够了哈” 当然,还有更明显,更常见的问题 我了共享单车投放数量 我分析了如何成为知乎大V 我做了三个指标! 没有然后了 我做了BPNN模型! 没有然后了 是滴,不定义问题,只忙着搞数据,最后可能都忘了要做什么了 定义的表现二:只记得找数据,忘了
11、分析问题 看数据指标的时候,只看见指标高低,忘了去分析 最常见的,就是:“这销量又低了”Ø“凭什么这销量不能低?”Ø“多高算是高?”Ø“持续低还是偶然低?” 销量是是一个数据,销量低是一个结论,给结论之前要分析啊! 一个简单的示例 做智能设备的分析 我把做智能设备的企业分作 发现他们主打的卖点都是高科技,没有安全 我就觉得可以从安全 亲,你的“分析”过程呢?切入“为什么”,为什么安全就可以切入了三类“是什么”,凭啥可以分三类,有什么特别? 正确做法(1) 为什么分三类:ü从业务模式上看ü从销量、上看ü从未来合作前景上看 综合三个维度,
12、有三类企业特点突出,所以可以分三类。 正确做法(2) 为什么“安全”是个切入点:1:安全这个点本身很有市场2:不做安全这个点,会失去一些市场3:在非安全领取,我们很难和别人竞争4:综合测评,发现做安全可争取到XX客户,能达成目标ü ü üü 综上,安全是个很好的切入点定义的表现三:只会扒拉数据,解决问题 往往做数据的新人,脑子里只有数据,没有策略 他们区分不了什么是分析问题,什么是执行问题 遇到执行问题,要先懂怎么做,才能思考到看什么数据 否则就停留在:运营就是一句话,AARRR够啦,开场插起五根棍,高了表扬低了骂,的水平上,除了说:“XX指标低了,要搞
13、高!”以外啥都 一个很有意思的经历搞怎么搞:“(伪)数据分析”的思维 写代码,爬虫,收集各个行信息“(真)数据分析”的思维 拉群,收人,观察别人行动,总结经验在“搞”上,没有因为搞,分析什么呢? 转化到具体工作中 “这转化率低了,要搞高!”“呸!你行啊!”我不行,但是有人比你行!(数据找出)人家的陈列 VS 你的陈列人家的问诊 VS 你的问诊人家的活动 VS 你的活动人家的用药 VS 你的推荐需要懂的不光是数据,而卖药这件事! 一个很有意思的现象 推荐一波Ø我:Ø同学们:葡萄,陶瓷观察,掌柜攻略,药店经营数据分析,医疗大数据,招聘分析 区别在哪里? 纯业务 VS 数据分析
14、掌握的执行方法太少,了解的背景知识不足,最后分析无从下笔新手找模型老手找指标高手找问题所以牢记这个成长定律,努力提升档次 第四节 如何做到“清晰描述问题” 首先,思想上要破除一点 房价分析一句话! 有没有“走势模型” 21天0基础精通实分析 我们说的是什么房价 不要指望抄书,具体问题具体讨论,越细致,越容易出结果 举个简单的例子 老陈,分析下现在的房价 城市(一线,一线,二线,区域中心,净流出地) 区域(CBD,新区,老区,近郊,远郊)(交通,教育,医疗,配套)(产权,楼龄,朝向,户型,景观) 很多情况下,能描述清楚问题,就完成了八成分析 每次我这么跟别人讲完房价类型,很多人都会分析了! 为什
15、么?因为这些指标背后带有明确的业务含义! 这也是为什么描述性统计,取数占了数据分析师八成时间 因为懂业务逻辑的话,看到数据都会分析了 而数据分析师往往不懂业务逻辑,所以看到数据还是发懵 清晰描述的基本要求,4w1h When,who,where,what,how 注意!这里是没有why和how much的! 因为前边4w1h是在描述问题本身,是描述性的内容 why是问题,是分析要干的事 how much是对问题程度的,也是分析干的事 清晰描述的进阶要求,找有重要业务含义的指标 城市(一线,一线,二线,区域中心,净流出地) 区域(CBD,新区,老区,近郊,远郊)(交通,教育,医疗,配套)(产权,
16、楼龄,朝向,户型,景观) 描述影响业务的关键因素,分两层 宏观层面:行业、部门、业务模式(能力一的内容) 微观层面:流程,操作,数据(能力四的内容) 同学们可以注意我在群里回答问题的方式:先确认行业,部门再看问题细节再确认指标最后才分析问题 第五节 如何划分问题边界及转化问题 划分问题边界的标准很明确,难得是如何去识别执行分析设想 如何识别设想类问题 明显的标志:,我觉得,我要不要 潜伏的标志:在对问题做描述的时候,发现没有事实,都是个人感觉为什么许多优秀的女生找不到对象VS为什么我认为许多优秀的女生找不到对象 所以,遇到设想类问题,第一个要确认的是真实性 有事实依据 转化为分析问题 没有事实
17、依据 呵呵,你爱怎么认为怎么认为 怎么转化为分析问题房价会掉:房价会掉 目前有没有在掉的?(是多少)房价会掉 最近3年内波动幅度有多少?(是多少) 房价会掉 一般房价什么情况会掉?(为什么)房价会掉 上次房价跌的时候有什么特征?(是什么)Ø Ø ØØ 用数据替代感觉,用分析过程替代愿望 如何识别执行类问题 “怎么做”三个字的都是执行问题!执行方式执行人执行目标 举个简单的例子 陈哥,买房,帮我分析一下 执行人:我有 执行方式:什么(现金,工资)?买?什么方式融资? 执行目标:投资?自住?婚房?养娃房?房? 遇到执行问题,第一时间确认:怎么执行 转化为分析
18、问题(1) 如果还不知道可以怎么做,找样板,做描述性统计(是多少) 陈哥,我不知道我这个收入该怎么买房 小A和你收入差不多,他工资 小B和你收入差不多,他工资现金现金,买的XX地方的房,买的XX地方的房 不知道执行方式的,先找执行方式 转化为分析问题(2) 如果知道可以怎么做,有选项,可以评估优劣(是什么) 陈哥,我看中两套房,不知道怎么挑 A房 VS目标 B房 VS目标 做评估先定标准,这是个两阶段分析,不是一步到位 转化为分析问题(3) 如果知道可以怎么做,但执行出现问题,可以找(为什么) 陈哥,我不知道为啥我爸不肯出钱,首付不够咋办? 搞掂老爸 分析老爸不给钱的 搞不掂老爸 还有哪些融资
19、晓之以情动之以理? 找别的融资找,向着推动执行的方向找,本身不重要,能执行下去最重要 转化为分析问题(4) 一个隐藏的分析:目标和现状不匹配 陈哥,为啥我同学都买房了我却买不起 羡慕互联网企业高薪,忽视福利,就是这样的呀 你才毕业一年,家里非官非富,买不起很正常啊 推倒目标和现状匹配程度,还是要先立标杆。 第六节 如何细分问题,构建思路 构建思路的基本过程会怎样为什么是什么是多少执行分析设想 细分到什么程度?细分到可以有一个明确输出的时候 我要怎么卖房 ? 想怎么买,就怎么买! 我收入低,要怎么买房? 多低算低?买哪里的房? 我要不要承担高房价? 对你来说多高算高? 没有经过梳理的问题,大部分
20、达不到分析所要求的细致程度 一张描述性统计表就能搞掂(又解释了为啥描述性统计这么广泛使用) 如果问题复杂,可能需要分步骤提供输出物 我目前月收入10000,家里可以出30万,想在广州离珠江新城地铁1 小时以内的区域买房,可以怎么买? 评估财力(可以承担多少房价 找房源,范围内有多少可承担的起的房 确认标准(主要哪些指标,是否有必选项 综合评估(价格,距离,户型,配套)分析)分析子 执行)分析 设想类问题 - 完整分析思路我有个不成想法,不知道当讲不当讲找办法不知道怎么办找事实支撑感觉会怎样不知道未来会怎样找数据支撑事实为什么不清楚是什么不敢确认状况想法中纠结点是什么数据想法来源 分析类问题 -
21、 完整分析思路分析一下现状是否清楚找方案找找标准下用数据描述现状事态效果不知道咋干不知道没不清楚评估方案提出建议知道如何知道“好/坏” 的对现状是否有现状清楚 执行类问题 - 完整分析思路要做一个事,你来分析下怎么做做找方案先找先定目标执行总结执行预计成果不知道方案不知道无目标执行评估方案知道方案知道有目标 最重要的一点 分析要一步步来,不要急着一口吃成个胖子 特别涉及标准的问题,需要争取/业务方认可。 第七节 如何确认输出形式,投入 只要前三步做好,最后一步就是水到渠成的事 是多少 数据,数据报表 是什么 为什么 标准,1 ,依据2,3,4,哪个影响最大 会怎样 预计1 ,预计2,预计3,预
22、计4 所谓:,做的时候千万别把绕进去,紧盯目标 提示坑点(1):报表格式确认清 忘了的可以回顾能力二 提示坑点(2):提前统一标准 事前:为什么销量下降了,分析下 事后:说了,这点下降幅度属于正常波动,不纠结 这种亏吃一次就好了,到底标准是同比,环比,KPI完成率还是中一个数字一定要提前搞清楚心 提示坑点(3):多个分析需求一次讲清楚 事前:帮忙分析下这活跃率下降的 事后:哦,是这几个,那我要怎么做呢?啥?不分析怎么做那光有有什么用! 事前就说清楚:我们分析的就是有1,2,3满足需求否? 如果你想知道怎么做,你先告诉我运营部门有什么权力 提示坑点(4):注意区分时间状态 口头:看一下过去XX时
23、间内有消费的用户,他们的消费习惯 心里:未来这批人还一样会消费吧 事前就说清楚:过去的消费行为就是过去的,不代表未来也是这样 想未来,先给个具体的场景先 “我看人家不掂?”文章一个模型也就几十个英文单词,给你10分钟搞 当然搞不掂,而且没有数据,没有积累的半吊子模型做多错多。 与其强行弄死起做,为搞“模型”,不如积攒需求,把类似的需求合并一争取一个建模项目的机会。提示坑点(5):需求要提前说 面对包含若干步骤的复杂问题,每一步结束后有个小总结 比如做一个会员制度优化项目 既然叫优化,那么肯定有:现状有什么问题(为什么未来准备达到什么目标有哪些优化方案每个方案预计带来的效益(会怎样综合评估,最后
24、选哪个方案(是什汇么报)节点)汇报节点) 汇报节点 切记憋大招,一定憋死掉 特别是专题分析,很多同学喜欢憋一个前无古人后无来者的 特别是模型项目,很多同学醉心建模,忘了时间进度和待解决的问题 在企业里,解决问题的时间是有限的,有可能过几问题都变了! 越是复杂问题,汇报的次数一定 要多,阶段性成果每2次,至少! 第八节 实战指南:如何在日常工作中锻炼定义问题的能力 定义问题是新人们最弱一环取数多,思考少,不知道数据啥用 偶尔做专题,没有清晰思路,往往喜欢一锅炖 知识积累少,分不清是否是真实问题,想不到该做什么 不想,不敢,和需求部门,更不敢主动提议分析思路 最好的方法是复盘,不是学现成的套路 去
25、年我在业务知识课程里讲了消费贷的套路,从业务逻辑,用户画像,报表,讲到精准 没屁用模型 大部分同学又不是做互联网金融的,这些背景听起来都费劲,又的工作不到 所以,最好的办法是复盘。你学别人的套路,怎么都和的实际差一截 复盘的关键,是理清“数据”与“用途”之间的关系 如果只是看分析类型,那就只能泛泛的说:“我做的销售报表” “那说说行业的销售有什么规律?”一句问死一大片 要找的是用途,比如XX部门的XX人,看了 专题分析的用途比较清晰,容易讲清数据,有XX用途总结用途 然而大部分同学还是在跑数,所以得 两类复盘内容 专题类、模型类工作:目标集中,容易总结经验 报表类、取数类工作:目标不明,需要提
26、炼 专题类、模型类复盘相对容易 专题类本身有个题目,比如用户流失分析,销售下降问题分析,促销活动响应分析等等,因此容易归类到是什么,为什么,会怎样里 模型类一般有明确方向,比问题,也容易归类指导无指导分类问题,综合评分问题, 因此,复盘这两类工作,关键是抓主线,抓思路,先把方向整明白 专题类复盘基本格式 分析目标:找到销量下降 分析思路:,并提出提升销量建议清晰描述问题(描述性统计)问题严重性(是什么)寻找问题(为什么)评估提升策略(是什么) 分析结论:销售下降有X条,最大的是XX,策略评估中X策略更优 模型类复盘基本格式 分析目标: 分析思路:用户促销响应率模型类型(二分类问题,逻辑回归)制
27、作与选择特征构建模型检验效果 分析结论:准确率为X%,模型可稳定使用 报表类复盘就麻烦一些 因为只有报表,是不知道有啥用处的 解读报表的方法在能力四会讲,这里先开个头 想知道报表的用途,得干三件事: 了解业务流程(为什么这几个指标,了有什么用) 了解常规趋势(老业务看三年比,新业务看环比增速) 了解异常波动(多大范围算波动,异动时会再看那些指标来检验) 我是XX行业的XX企业 我服务XX部门 他们指标一般看五个维度 这五个维度的用处是 先明确报表的基础用途报表类复盘基本格式指标构建问题 我们的销售一般是1,3月高,春节低,4,5月有个小走,9月开始提升,11,12冲业绩,6,7,8平着 我们的
28、用户结构是埃菲尔铁塔型的,TOP10%提供60%收入 我们的3留存率是5% 掌握了规律,才能更快速定义新问题,这是分析的知识积累报表类复盘基本格式规律问题 一般销量波动大于X%算是不正常 波动大于X%的时候需要找到,一般从X各方面找 最快速提升销量的方法有三种,分别是ABC 有了标准,初步的假设,解决问题的,定义问题的时候就得心应手了,哪里不清晰做哪里。报表类复盘基本格式波动问题 最终输出产物 有一个完整的故事: XX行业销售一般看5各维度,一般规律是,可以从X个方面关注。,如果波动大于X%就要 所以现在您的问题是什么?我们可以解决。 能力三作业 同学们准备至少1个专题分析的分析思路,1个报表的思路 参考上文中的格式,写下来,发来给陈点评 如果能讲清楚一个案例没有
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 解除婚外情赔偿协议书
- 女职工产假协议书
- 弟弟争房产协议书
- 积分转干股协议书
- 上海市2023-2024学年七年级下学期期中语文试题汇编-现代文2记叙文(答案版)
- 上海市2023-2024学年六年级下学期期中语文试题汇编-综合运用(答案版)
- 弟兄分田地协议书
- 高科技家纺技术行业跨境出海项目商业计划书
- 高精度温湿度传感器网络行业深度调研及发展项目商业计划书
- 高蛋白增肌食品套装行业跨境出海项目商业计划书
- 服饰搭配艺术(山东联盟)智慧树知到期末考试答案章节答案2024年德州学院
- 2024山东财经大学东方学院教师招聘考试笔试试题
- 工作餐配送合同范本
- 水污染治理微波技术研究
- 安全生产检查咨询服务安全生产隐患检查服务方案
- 异常产程的识别和处理
- 中国普通食物营养成分表一览
- 2024年甘肃省临夏州永靖县部分学校中考物理一模试卷+
- 传染病孕妇的管理与预防
- 机织产品工艺设计与计算改样本
- 梅陇镇永联村未来规划方案
评论
0/150
提交评论