【大数据】数据分析方法、数据处理流程实战案例_第1页
【大数据】数据分析方法、数据处理流程实战案例_第2页
【大数据】数据分析方法、数据处理流程实战案例_第3页
【大数据】数据分析方法、数据处理流程实战案例_第4页
【大数据】数据分析方法、数据处理流程实战案例_第5页
已阅读5页,还剩34页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

【大数据】数据分析方法、数据处理流程实战案例分析方法、数据处理流程实战案例人人都逐渐开始用数据的眼光来瞧待每一个事确实,数据的直观明了传达出来的信息让人一下子就能领。让大家对于数据分析师这个岗位的工作内容有更多的理解与认识,了解了解咱们平时瞧似轻松便捷的数据可视化的背后都【大数据】数据分析方法、数据处理流程实战案例,互联网企业也好,都把自己的业务给大数据靠一靠,并且思维就是怎么回事?我们来瞧两个例子:案例1:输入法BC音,还有五笔。那时候的输入法比现在来说要慢的很多,许多时个词都要选好几次,去选词还就是调整才能把这个字打出来,效【大数据】数据分析方法、数据处理流程实战案例盘没有按下去字就已经跳出来了。但就是,后来很快发现紫输入法也有它的问题,比如当时互联网发展已经比较快了,会经【大数据】数据分析方法、数据处理流程实战案例,就很难敲出来索,它积累了一些用户输入的检索词这些数据,用户用输入法的这些词的信息,将它们进行统计分析,把一些新的词汇逐步如果用传统的,因为它就是一个重新构造的词,在输入法就是没办法通过拼音ranbingluan”直接把它找出来的。然而,在大数据思维下那就不一样了,换句话说,我们先不知道有这么一个词汇,但就是我们发现有多人在输入了这个词汇,于就是,我们可以通过统计发现最近新出现频词汇,把它加到司库里面并更新给所有人,大家在使用的时案例2:地图【大数据】数据分析方法、数据处理流程实战案例案例,在这种电脑地图、手机地图出现之前,我纸质的地图。这种地图差不多就就是一年要换一版,因为了,并且在纸质地图上肯定就是瞧不出来,从一个地方走就是最好的?中间就是不就是堵车?这些都有了百度地图这样的产品就要好很多,比如:它能告诉您这条路?或者说能告诉您半个小时之后它就是不就是【大数据】数据分析方法、数据处理流程实战案例地方它可以给您规划另一条路线,这些就就是因为置的移动信息,就可以知道路的拥堵情况。另外,她可以用的情况,可以跟交管局或者其她部门来采集一些面的传感器采集的车辆的数量的数据,就可以做这样【大数据】数据分析方法、数据处理流程实战案例就引来了一念——数据驱动。有了这些数据,基于数据上统计也好,做其她挖也好,把一个产品做的更加智能,变得更加好,这个跟它对应的就就能没有数据的情况,可能就是拍脑袋的方式,或者说我们用过楚为什么然后再去做这个事情。这些相比之下数据驱效率就要高很多,并且有许多以前解决不了的问题它就能【大数据】数据分析方法、数据处理流程实战案例这一点,可能有些人从没有瞧数的习惯到了瞧数的里来说一下什么就是数据驱动?或者现有的创业公司在进行数据驱动这件事情上存在的一些问题。公司里面有一个数据工程师,她的工作职责就就管就是市场也好,产品也好,运营也好,老板也好,大家都会有各的,她的【大数据】数据分析方法、数据处理流程实战案例的,只能一个一个需求去处理,她本身工作很忙,需求,一方面她可能数据准备的不全,她需要去采集一升级,她要把数据拿过来。拿过来之后又在这个数据,这个过程本身可能两三天时间就过去了,如果加上等说,这个等待周期太长,整个时机可能就错过了。比要的就就是考察一个节日或者一个开学这样一个时间点,然后想搞一些运营相关的事情,这个时机可能就错过去了,许多人等不到了,就干脆还就是拍脑袋,就不等待这个数据了。这个过程【大数据】数据分析方法、数据处理流程实战案例就就是说效率就是非常低的,并不就是说拿不到这个数据,而就是些公司来说,之前可能连个数都没有,现在有了一个仪表盘可以瞧到公司上个季度、昨天总体的这些数据,还就定还就是比较高兴,但就是,对于市场、运营这些同要查一查这个问题出在哪。这个时候,只瞧一个宏观的数那就【大数据】数据分析方法、数据处理流程实战案例、按渠道,按不方式去追查,瞧到底就是哪少了,就是整体少了,还就是某一个特独特的地方它这个数据少了,这个时候单单靠一个仪表盘就数据驱动应该就是怎么样的?就就是一个自助式的让业务人员每一个人都能自己去进行数据分析,掌握这个数我们源头就是一堆杂乱的数据,中间有一个跑这个数据,然后右边就是接各种业务同学提了需求,然后处理,这种方式效率就是非常低的。理想状态来说,我们现数据源本身整好,整全整细了,中间提供强大的分析工具,让每一能直接进行操作,大家并发的去做一些业务上的数据需求,就要高非常多。【大数据】数据分析方法、数据处理流程实战案例件事用一种非技术的角度来瞧的话,就可以分成金集在百度干了有七年就是数据相关的事大的心得——数据这个事情如果想要更好,最重要的就就是【大数据】数据分析方法、数据处理流程实战案例消,但就是数据源如果就是差的话,后面用再复杂的算法可能的数据处理流程有两个基本的原则,一个就是全,一个就全:要拿多种数据源,不能说只拿一个客户端的数据源,没有拿,数据库的数据源没有拿,做分析的时候没有这就是搞歪了。另外,大数据里面讲的就是全量,而不就是殊,比如新疆、西藏这些地方客户端跟内地可能有细:替补下来,后面分析的时候就跳不出这些能够所选的这个维度,而后面真正有一个新的需求来的时候,又要采集新的数据,这个时候代周期就会慢很多,效率就会差很多,尽量从源头抓的数据去做集。【大数据】数据分析方法、数据处理流程实战案例数据建模之后,就要对数据进行加工,不能把原始的数据直接报告析人员,它可能本身就是杂乱的,没有经过很好的逻辑就牵扯到数据建框,首先,提一个概念就就是数据模型。许多模型这个词产生一种畏惧感,觉得模型这个东西就是什【大数据】数据分析方法、数据处理流程实战案例家干过一件事情,我自己家里面家谱在文革的时候后来家里的长辈说一定要把家谱这些东西给存档一下,因为我就帮着用电脑去理了一下这些家族的数据这些关系,整个族谱就是一个个的人,家谱里面的人,通过一个树型的结构,还据关系,就能把现实实体的东西用几个简单图给表示出们这就是这么一个情况,我们现在这种业务,一般前端做一后对请求经过处理,再更新到数据库里面去,数据库里面建【大数据】数据分析方法、数据处理流程实战案例项发展差不多牵扯到几十张甚至上百张数据表,然后把这个表直型就是用于满足您正常的业务运转,为产品正常的运个数据模型。但就是,它并不就是一个针对分析人员使用。如果,非要把它用于数据分析那就带来了很多问题。比如:它数据分析很依赖表之间的这种格子,比如:某一天我们为了提,这个调整影响到您分析的逻辑。【大数据】数据分析方法、数据处理流程实战案例要针对分析的需求对数据重新进行解码,它内容可能就是我们的组织方式改变了一下。就拿用户行为这块数的一系列的操作,比如浏览一个商品,然后谁浏,什么时间浏览的,她用的什么操作系统,用的什么浏览器版本,还操作瞧了什么商品,这个商品的一些属性就是什么,这个东西行了一个很好的抽象。这种抽样的很大的好处很容易理解,【大数据】数据分析方法、数据处理流程实战案例维数据模型,在线分析处理这个模型,它里面有这个城市,然后北京、上海这些一个维度,维度西面一些属性,IOS是一些维度,然后维度里面的叉,就可以瞧一些指标问题,比如用户量、销售额,这些是举了两个维度,可能还有很多个维度。总之,通过维度些指标的数,大家可以回忆一下,大家常用的这些业务是不就是许多都能通过这种简单的模式给抽样出【大数据】数据分析方法、数据处理流程实战案例产品常用的用户消费分析来说,有四种:•留存分析,用户来了之后我们希望她不断的来,不断的进••第四种回访,回访就是留存的一种特别的形式,可以瞧她一段时方法1:多维事件分析法分情况都就是能用多维事件分析,然后对它进行一个数【大数据】数据分析方法、数据处理流程实战案例实就就是由三个关键的概念,一个就就是事件,一个就是•互联网产品,都可以把它抽象成一系列•••wifi些东西,或者用户次数做成一个指标,提交订单的人数就是个指标,运费这也就是一个指标,统计一个数后就【大数据】数据分析方法、数据处理流程实战案例的成交额这条曲线,会发现它一路在下跌。但下跌的时候,不能眼睁睁的原因呢?常用的方式就就是对维度进行一个拆解,些维度进行拆分,比如我们按照地域,或者按照渠道,或者式去拆开,按照年龄段、按照性别去拆开,瞧这些数据【大数据】数据分析方法、数据处理流程实战案例假想的例子——按照支付方式进行拆开之后,支付方沉稳的一个跌到非常出了什么问题,导方法2:漏斗分析会瞧,因为数据,一个用户从做第一步操作到后面每一步能一部分人就,还有一部分人可能去点击到一个商品里面去,点击到商品可多人跑了,接下来可能有一部分人就真的购买了,这其实就就【大数据】数据分析方法、数据处理流程实战案例漏斗,就能分析一步步的转化情况,然后每一步都有流失,其转化情况如何。比如,打广告的时候发现来自就可能在广告投放上就在百度上多投一方法3:留存分析下来瞧它的关键行为上面操作的特征,比如当天它有操作,第二天有多少人会关键操作,【大数据】数据分析方法、数据处理流程实战案例方法4:回访分析说,在一周之内至少有一天购买黄金的人有多少人,至少有两就要比只就是瞧一个宏观的访问量或者活跃用户数实践案例1:UGC产品【大数据】数据分析方法、数据处理流程实战案例很多数据指标,可以从某一个角度去观察这个产品的情题就来了——这么多的指标,到底要关注什么?不同的阶么指标?这里,就牵扯到一个本身指标的处理,还有关键案例2:百度知道【大数据】数据分析方法、数据处理流程实战案例RB也收到一系列报表邮件,这些报表里面有很多统计的一些数么多的指标,不能说这也提高,那也提高吧?每个阶段键的,重点要提高哪些指标。开始的时候其实慢有一些感触与认识,就发现其实对于访问量、减少量这度知道需要流量都就是来自于大搜索,把它展现做,但就是它很受渠道的影响——大搜索这个渠道的影【大数据】数据分析方法、数据处理流程实战案例时候,我认为非常重要,怎么提升提问量,那么整个百道平台的这个问题就多了。提升回答量,让这些问题得到回答,高质量的内容就非常多了,又提升提问量,而后再提升回答量——其实等惑,有一些矛盾,产品会,每一个季度都有一个产品会。那个时候,整个部门是孙云丰,可能在百度待过的或者说对百度产品体系知道这么一个人,非常厉害的一个产品经理。我当时就【大数据】数据分析方法、数据处理流程实战案例说了一点,其实提问量不就是一个关键的问题,为什么?我们索去找,如果一个用户在大搜索里面进行搜索,发现这个的答案,那就可以引导她进行一个提问,这样其实这个就解决了这个困惑,最关键的就就是一个回答量,我所【大数据】数据分析方法、数据处理流程实战案例度知道这个产品抽样成了最关键的一个提升——那,在这个问题上当时做了一个事情就就是进行用户,这些用户就喜欢回答问题。于就是,我能不能把一些她们可以回答问题推荐给她们,让她们回答各种也很简单,现在个性化推荐都就是比较正常的,大家默认非常简单的,我们就瞧一个用户历史的回答记录,瞧【大数据】数据分析方法、数据处理流程实战案例兴趣的话题,然后把待解的问题,与该问题相关话题。答量比较高行一个抽取,对她们训练一个模式——就就是对每个用户有兴趣点,然后每个点都有一个程度,这就就是一个用户的这样的,现在我已经找了我们当年做的图片,整个样一段时间截的图,大体类似。比如,我对数据分析相能差不多做了有三个月,把它推上线我们其实就是满总的回答量没有变化。于就是,我们又下原因。当时,最开始这些核心用户在回答问题的时【大数据】数据分析方法、数据处理流程实战案例相关的问题,有兴做了一个体验:在个人中心里面加了一个猜她喜欢的那题,然后推给她,结果用户从分类页回答这个问题转到了个人中,这些核原因,有一个原因她可能本身的回答量就就是这么天在哪里源源不断的回复问题。还有一个同事就分析苦的地方,因为我们就是源源不断地推荐,然后她就发还有几个,回答了几次就感觉要崩溃了,就不想再这么知乎在问题推荐上也做了不少功夫,做了许多测试。。后来,发是,我们调转了矛头,从另一个角度——能不能去广撒网,吸引更多的【大数据】数据分析方法、数据处理流程实战案例度不管用户就是否登录,会在用户的库里面去一个用户标识。通过这个标识能够对这个用户进行一个跟踪,虽不知道用户就是谁,但就是,起码能把同一个用户这个行为给它检起她流量的各种页。好处,能够覆盖的用户量非常大,前面讲的核心用户推一次用户登录之后或者访问百度知道之后我们就基于她后走一次检索,在解决问题里面检索一下跟她匹配的就给【大数据】数据分析方法、数据处理流程实战案例是会瞧马尔克马尔克斯的作品,我当时搜了马尔克斯的一些相关的取出来我对马尔克斯什么感兴趣,就给我推荐了马尔克了之后效果还就是很不错的,让整体的回答量提升了就案例3:流失用户召回式可能对其她产品就很有效,但就是对我们这个产品来说,相对来说目标比较明确并且比较小众一点的差投放的效果可能就没那么明显。【大数据】数据分析方法、数据处理流程实战案例时候,因为之前申请试用我们那个产品已经有很多是这里面有一万人我们给她发了帐号她也并没有回

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论