


下载本文档
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、张溪梦:数据分析如何定义 Linkedln非常感谢 !不好意思,稍微晚了一些,我叫张溪梦,现在在Linkedln 任职,负责整个商业数据分析, 我们的数据分析组织支持所有的与营收有关的业务。 今天想 跟大家分享一下在 Linkedln 过去的将近五年的过程中学习到的一些经验,希望 大家多提珍贵意见。在讲数据之前想跟大家简单介绍一下我自己, 我在美国大约工作了十来年, 一直 在数据分析领域里面, 在此之前, 我在中国做了两年医生, 但是因为特别喜欢电 脑,特别喜欢电脑所以跑到美国来学了一个商学院, 不知道为什么, 今天就突然 间变成做大数据了。所以大家如果听见我讲了很多不靠谱的东西希望多多指导。
2、首先,Linkedln是世界上最大的职业社交网站。到今天为止,有亿用户,LinkedIn 的商业模式是 2003 年就已经确定了,非常非常简单三个最主要的步骤: 第一步, 用户使用和增长产生了大量的数据 ;第二步,通过这些海量的数据我们又开发了 新的产品效劳,还有解决方案,为下一轮的增长做更好的准备;第三步,这些新的产品新的效劳新的解决方案, 进一步刺激了用户的继续增长。 所以大家可以看 到在左边的,数据是 LinkedIn 业务里面非常非常重要的一环,整个 Linkedln 的 产品都可以说是从数据里面迭代出来的。 举一个例子, LinkedIn 在用户增长上我 们有三种不同的产品关注点,
3、第一个就是每个人用的简历, 第二局部是用户的社 交关系、社会关系,因为我们的创始人 Reid Hoffman 非常坚信社会关系就是最 重要的生产力。 第三局部也是我们最近在几年之内慢慢的引入的, 就是关于职业 的各种知识,这种产品表达在,比方每天在 Linkedln 上如果大家使用的话可以 看到很多人在发不同的信息, 很多的非常有名的资深专业人士在分享他们的职业 开展经验, 这三块组成了我们的针对于非付费用户的主要的主打产品。 很多人都 问我说 LinkedIn 怎么赚钱呢 ?LinkedIn 主要的营收主要来自三大块业务,人力、 市场推广、销售,人力资源局部为 LinkedIn 创造 61%
4、的营收,市场推广也就是 广告还有现在越来越多的移动端的广告位 LinkedIn 产生 19%的营收。其余的销 售和个人的订阅效劳为 LinkedIn 产生剩余的 20%的营收,到今天为止的话大约 每年 LinkedIn 的业务营收在接近 20 亿美元区间左右。下面我讲一下我们这个团队,从我个人来讲,我觉得非常幸运能为 LinkedIn 这 样的公司工作,大约四年半以前,我参加 LinkedIn 数据科学团队,三年半之前 转到新的组开始建立商业分析团队, 当时就我一个人, 到今天为止我开展出来了 大约 70 人左右的团队,明年我们这个团队会增长到百人左右。想和大家分享的 是,我们的团队增长速度是
5、超过了整体公司的增长速度的,为什么呢?就是因为我们不断的为不同的部门,通过数据产生了很大的价值,包括销售、市场推广、 产品、运营、客户效劳、风控,各个不同的部门,直接间接的我们支持 5000 以 上的 Linkedln 内部的职工。首先一个数据根底设施,其次商业智能也就是报表 开发,再次数据科学和数据挖掘以及统计分析, 加上假设干分析的小组还有另外 一个就是软件的研发。 为什么我们要把五个部门完全做在一个组织里边, 我下面 就跟大家分享一下在过去的四年中我们学到了一个最重要的知识就是叫做端对 端的数据分析。 讲数据之前我想跟大家先分享一下什么是分析, 因为如果我们只 有数据不做分析的话根本上没
6、有任何价值, 数据分析其实很简单就是了解历史预 测未来,以前李世民讲过一句话叫做以史为镜可以知兴替, 以人为镜可以明得失, 以铜为镜可以正衣冠, 分析就是这样理解历史。 比方说过去发生了什么事情为什 么发生了。 现在正在发生什么, 未来会发生什么, 前面这四步就是他们的关于用 历史数据来预测未来但是只预测未来没有任何的就是相关的剩余价值的产生, 我 们必须在预测未来以后能够改变未来。 真正的改变未来, 这个过程就是我们产生 很大的价值的一个过程。 讲完了分析咱们看一看什么是大数据, 实际上大局部人 看到大数据是海平面以上的冰山,记得以前大约在三四个月以前我回过一次国, 其中有几个朋友问我大数据
7、是不是就是欺诈纯忽悠, 根本没有看到什么价值。 实 际上大局部人看到大数据还不是海平面上面的这一块大局部人看到的大数据是 下面的,比方说 LinkedIn 来说,我们 LinkedIn 的数据源是包含了全世界根本上 很多公司的信息。 Salesforce 这个是我们的 CRM 的一个系统,然后我们还有内部 的数据仓库,等等。在这张图上,我还可以再往上放 100 个以上在数据源的图 标。它不是一个虚构的,这是事实。大家可以看到,这么杂乱那么巨大,但是复 杂却并没有表现直接商业价值。 真正的大家唯一感兴趣不是这个数据分析的大冰 川,大家希望得到是冰茶、冰激凌、冰水。也就是分析的结果 ! 下面来讲讲
8、我们的商业分析部门的根本战略和原那么。 大约在四年半之前我参加 Linkedln 的时候,每天我根本上工作到每天一点到晚上一两点甚至四点钟, 在第 一年大约完成了 500 个左右不同的大的小的工程包括建模、报表,用数据答复 以下问题, 但是我们发现这个过程是非常缓慢和冗长的, 但是当时我作为一个内 部职工来说我支持大约 200 个内部职工,大家想一想一年做 500 个工程 200 个 职工需要数据平均每年每个人只会被答复两次, 这个不是数据驱动, 甚至可以说 完全非数据驱动, 所以说我们建立了一个新的数据开展战略, 这套战略的在三年 半之前设好,然后一步步实施。 第一步就是打造一个非常坚实的数
9、据分析平台和根底,这一步是最重要的一环。 第二步把整个的数据分析解决方案化, 也就是我们内部有一个口号就是让所有的 职工都能做到数据辅助决策驱动。第三步我们不但要帮助内部的销售市场产品经理各种不同的人员我们还要把我 们的数据分析做成数据产品让所有 Linkedln 的用户也能得到好处。 第四步我们发现我们要建造大量的数据分析的产品让他们之间产生很多的迭代。 这也是我们讲的一个数据分析产品的生态圈的构建。 当时我们设置的这个是四步在今天来说的话我们根本上完成了前三步, 现在正在 建造第四步。这个金字塔理论, 我每次演讲我都要讲,不是实在没什么事可说 而反复重复,这是我在过去的十年的职业生涯里做数
10、据分析中学到看到最重要的 一个结构。 我们来讲讲第个开展周期,也是其中最重要的一环。建造一个有效的根底。 传统的数据分析五个层面,第一步数据存储也就是数据仓库 ETL 等等这些系统 的建造,第二步就是说传统企业它需要做各种不同的数据分析比方说答复内部的 市场推广人员产品经理还有销售人员各种各样的问题, 用数据来答复他们的问题, 然后你再上面一步的话就是报表 BI。 深度分析的话一般来说在现在为止分成三 个不同的流派,第一个流派就是总传统的统计的流派,比方说银行、保险、零售 在美国的话已经开展了接近 20 年甚至超过 30 年了一个时间段,而且非常成熟 就是用来预测比方说哪个客户会买哪个客户会买
11、多少, 他的风险是多少这是第一 个流派。第二个流派就是管理咨询, 他们生产了很多的新的方法论。 在过去的起 码几十年之内,特别是战后,就是比方说这个战略性分析、策略性分析、竞争分 析这个是管理咨询公司他们非常注重强调的。 第三个流派也就是最近新兴的一个 流派,即不是传统的统计方法, 而是用大规模的迭代运算或用机器来模拟。 比方 说社交网络模型背后就要很多迭代的算法。 我想跟大家讲一下, 首先,这个传统 5 层结构忽略的最重要的一点就是业务根底。 分析师或者数据科学家他必须要 对产品对客户对业务有一个非常深刻的理解, 如果他对业务不理解的话很难做成 有价值的分析这是第一步, 就是必须要明白我们自
12、己的客户和我们的产品, 第二 步在生产数据之前我们必须要做正确的数据标记和数据采集, 如果没有正确的数 据采集和数据标记,收集来的东西也就不会有太多的价值。 第三步,就是说好 的数据分析师数据科学家他必须对硬件软件各种架构有非常深刻的理解, 同时他 能很有效的利用各种的工具这是我们要求我们内部的职工做到, 再上一步是传统 的分析师要做的工作,比方说做报表做分析,然后建模。 在 Linkedln 商业分析 部有的一个不成文的规定, 或者说是一个死的规定, 生产出来的分析结果我们必 须要确认分析的结果具有可执行性和可决策性。 当然最后的目的不是为了做决策 而做决策, 而决策是要为了产生价值而效劳。
13、 这就是我们内部一个金字塔的一个 结构。第二环:“金字塔到“菱形的转变。 以前在大约四年之前我们做了一个内部的调研, 我们问每一个内部数据科学家我 是当时的可能是第 14 个 Linkedln 的数据科学家。我们问了所有的做数据的 Linkedln 分析师和数据科学家。 问你大局部的时间花在哪里, 所有的人的答复是 非常非常的一致,大约是 85%和 95%的时间花在金字塔的最下面的四层也就是 说产品理解、 数据标记、数据存储加上一些分析。 但是大家都认为真正的价值是 在决策这一块, 改变才产生更多的价值, 如果我们的时间全花在了数据的清洗和 数据的整理上那么在很多时候不能为业务带来大规模的价值
14、。 如何解决呢 ?我们 想像出来一个新的模型, 就是把金字塔不断变成一个菱形的结构的一个模式, 这 个模式并不表示我们不做以下的那些脏活累活。 这个模型最重要的一点就是我 们要把大量的科技的技术不断的把金字塔的底部收缩和做小, 做小的同时让人有 更多的时间做更重要的工作, 举一个例子大家可能刚刚记得我们刚刚说的第一年 九个月,如果我今天跟大家说每天我们内部的分析系统大约有三千个职工平均每 天答复十次以上的问题, 那么它这个系统每天的工作已经超过了一年工作的几十 甚至一百多倍,这就是我们今天在 Linkedln 内部为什么它能够大幅度的用数据 来驱动业务的过程。 很多人可能不太相信, 大约需要一
15、两个月的工作, 今天来说 在 Linkedln 内部也许只需要几十秒钟。一会儿我给大家举个例子我们怎么做到 的。第三个重要环节:就是数据产品化的过程。 比方说我们内部的话我们产生很多比方说针对销售针对市场推广很多的分析解 决方案今天来说的话已经变成 Linkedln 的一个新的业务,这个功能就是我们在 过去三年半左右的一个时间里边产生了一个叫魔术师的一个系统, 我们的工程和 产品团队采取了 5% 的功能放在网站上,目前已经开始销售了。在今天为止的话 大约 1% 的营收来自这个新产品线。 第四环:数据产品化之后的话我们要建立什么呢, 数据产品的生态圈, 我们发现 当开发第一个数据产品的时候需要花
16、百分之百的努力, 第二个第三个第四个, 会 相对来说越来越少, 但它的价值会产生越来越多我给大家举个例子用明显的数据 举个例子。好咱们讲一讲社交网络吧, 大家认为社交网络纯粹就是忽悠的请举一下手, 没有 人认为社交网络是忽悠那就太好了。 笑 。过去 Linkedln 从 2022 年 到今天我 们营收大约增长了不到 20 倍,这个过程大家可以看到是从 2022 年开始的是成 倍的增长而且速度慢慢在加快, 其中一个原因就是因为我们在大量运用 Linkedln 内部的基于职业的社交关系数据驱动营收。 大家可以看到这个社交网络图谱。 在这个里面有绿色、 紫色还有中间的浅粉色, 如果我跟大家说这个模型
17、只用了一 个变量就是人与人之间的关系,紫色的就是中间的是他们的 CEO,紫色下面的就 是他们的运维和 HR 大家相信不相信这是真的, 再下一步我们通过这张社交图我 们迭代出来他们内部可能的组织结构, 当我们明白了一个公司的组织结构之后话 我们就开始做下一个产品, 数据驱动的销售方案, 传统的销售人员会问传统的几 个问题,很简单,第一个问题我需要向哪个公司销售 Linkedln 的产品,它会花 多少钱?我得到一个名单 400 个公司到底哪个公司价值多少钱是第一个问题。 第 二个问题这个公司里谁是决策人, 谁能让我把这个产品销售给他。 第三步, 这个 决策人我知道了如何我才能和他接洽呢 ?比方说我
18、在 LinkedIn 认识的人中几百个 人都认识这个主管,谁是和他关系最近的人 ?第四个问题,我们 Linkedln 内部以 前的话我们大约 200 个销售人员,今天的话大约几千人以上,哪个销售职工和 这个客户和这个公司的关系最近 ?第五步我们到了那里讲一个什么样的故事 ? 以 往的话需要准备这样的数据,大家拍脑子、拍胸脯、拍大腿、拍键盘,也大约得 拍两个星期到八个星期才能准备一个分析,今天来说再 Linkedln 的话我们可以 很简单,就是用 Linkedln 的数据我们知道这个公司的人员增长是多少,流失率 是多少他招的人从哪儿来他的人都到哪里去了,同时我们通过分析 Linkedln 职 业网络,找到真正的决策人。我们发现真正买 Linkedln 的产品的人不是他们那 边的 HR 的老大,一般来说的话是他的一线的经理同时还在用 Linkedln 的人,这 个是我们当时增加了好几倍转化率的一个原因。下一步的话我们分析整个的 Linkedln 内部的销售人员谁和这个人的关系最近, 谁和这个人通过他的介绍的关 系来和这个人进行接洽, 这是另外
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 关+于建立我国公众参与科学技术决策制度的探讨
- 餐饮品牌直营店承包经营合同范本
- 仓储安全管理员综合责任履行合同
- 生态修复工程拆迁房买卖及环境补偿协议
- 校园食堂餐饮茶点供应与承包管理合同
- 厂房拆迁及后续发展用地规划合作协议
- 高端厨电品牌厂商与经销商协同发展协议
- 能源企业财务记账代理与能源交易合同
- 房屋拆除安全责任及施工管理协议
- 急诊护理院感防控体系构建
- 五年级数学应用题练习-小数除法应用题
- 管培生轮岗总结汇报
- 康复科护理的患者安全和风险管理
- 检验科工作环境清洁、消毒记录表
- 国开《Windows网络操作系统管理》形考任务4-配置故障转移群集服务实训
- 神奇的塑料袋-脑洞大开的运动 教案
- 《铸造用增碳剂》
- 解读《2023年中国血脂管理指南》
- 运用PDCA提高影像诊断与手术符合率演示文稿
- 公司声誉风险管理办法(2022年修订)
- 700水平轧机主传动系统设计
评论
0/150
提交评论