大数据数据分析方法数据处理流程实战案例_第1页
大数据数据分析方法数据处理流程实战案例_第2页
大数据数据分析方法数据处理流程实战案例_第3页
大数据数据分析方法数据处理流程实战案例_第4页
大数据数据分析方法数据处理流程实战案例_第5页
已阅读5页,还剩29页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

大数据数据分析方法数据处理流程实战案例

一、大数据思维

在2011年、2012年大数据概念火了之后,能够说这几年许多传

统企业也好,互联网企业也好,都把自己的业务给大数据靠一靠,同

时提的比较多的大数据思维。

那么大数据思维是怎么回事?我们来看两个例子:

案例1:输入法

首先,我们来看一下输入法的例子。

我2001年上大学,那时用的输入法比较多的是智能ABC,还有

微软拼音,还有五笔。那时候的输入法比现在来说要慢的很多,许多

时候输一个词都要选好几次,去选词还是调整才能把这个字打出来,

效率是非常低的。

到了2002年,2003年出了一种新的输出法——紫光拼音,感

受确实很快,键盘没有按下去字就已经跳出来了。但是,后来很快发

现紫光拼音输入法也有它的问题,比如当时互联网进展已经比较快了,

会经常出现一些新的词汇,这些词汇在它的词库里没有的话,就很难

敲出来这个词。

在2006年左右,搜狗输入法出现了。搜狗输入法基于搜狗本身

是一个搜索,它积存了一些用户输入的检索词这些数据,用户用输入

法时候产生的这些词的信息,将它们进行统计分析,把一些新的词汇

逐步添加到词库里去,通过云的方式进行管理。

大数据思维

怛圈目BB愚|vs.ran'binbluan

.然井.染病.热.柒

1F2345.»v

比如,去年流行一个词叫"然并卵",这样的一个词假如用传统

的方式,由于它是一个重新构造的词,在输入法是没办法通过拼音

"ranbingluan"直接把它找出来的。然而,在大数据思维下那就

不一样了,换句话说,我们先不明白有这么一个词汇,但是我们发现

有许多人在输入了这个词汇,因此,我们能够通过统计发现最近新出

现的一个高频词汇,把它加到司库里面并更新给所有人,大家在使用

的时候能够直接找到这个词了。

案例2:地图

再来看一个地图的案例,在这种电脑地图、手机地图出现之前,

我们都是用纸质的地图。这种地图差不多就是一年要换一版,由于许

多地址可能变了,同时在纸质地图上确信是看不出来,从一个地方到

另外一个地方怎么走是最好的?中间是不是堵车?这些都是有需要

有经验的各类司机才能推断出来。

在有了百度地图这样的产品就要好很多,比如:它能告诉你这条

路当前是不是堵的?或者者说能告诉你半个小时之后它是不是堵的?

它是不是能够预测路况情况?

此外,你去一个地方它能够给你规划另一条路线,这些就是由于

它采集到许多数据。比如:大家在用百度地图的时候,有GPS地位

信息,基于你这个位置的移动信息,就能够明白路的拥堵情况。另外,

他能够收集到很多用户使用的情况,能够跟交管局或者者其他部门来

采集一些其他摄像头、地面的传感器采集的车辆的数量的数据,就能

够做这样的推断了。

SENSORS

大数据思维

•数据驱动Vs.因果驱动Vs.拍脑袋

这里,我们来看一看纸质的地图跟新的手机地图之间,智能ABC

输入法跟搜狗输入法都有什么区别?

这里面最大的差异就是是否具有用上新的数据。这里就引来了一

个概念——数据驱动。有了这些数据,基于数据上统计也好,做其他

挖掘也好,把一个产品做的更加智能,变得更加好,这个跟它对应的

就是之前可能没有数据的情况,可能是拍脑袋的方式,或者者说我们

用过去的,我们想清晰为什么然后再去做这个情况。这些相比之下数

据驱动这种方式效率就要高很多,同时有许多往常解决不了的问题它

就能解决的非常好。

二、数据驱动

关于数据驱动这一点,可能有些人从没有看数的习惯到了看数的

习惯那是一大进步,是不是能看几个数这就叫数据驱动了呢?这还远

远不够,这里来说一下什么是数据驱动?或者者现有的创业公司在进

行数据驱动这件情况上存在的一些问题。

如果现状是…

一种情况大家在公司里面有一个数据工程师,他的工作职责就是

跑数据。

不管是市场也好,产品也好,运营也好,老板也好,大家都会有

各类各样的数据需求,但都会提给他。然而,这个资源也是有限的,

他的工作时间也是有限的,只能一个一个需求去处理,他本身工作很

忙,大家提的需求之后可能并不可能马上就处理,可能需要等待一段

时间。即使处理了这个需求,一方面他可能数据准备的不全,他需要

去采集一些数据,或者做一些升级,他要把数据拿过来。拿过来之后

又在这个数据上进行一些分析,这个过程本身可能两三天时间就过去

了,假如加上等待的时间更长。

关于有些人来说,这个等待周期太长,整个时机可能就错过了。

比如,你重要的就是考察一个节日或者者一个开学这样一个时间点,

然后想搞一些运营有关的情况,这个时机可能就错过去了,许多人等

不到了,有些同学可能就干脆还是拍脑袋,就不等待这个数据了。这

个过程事实上就是说效率是非常低的,并不是说拿不到这个数据,而

是说效率低的情况下我们错过了很多机会。

关于还有一些公司来说,之前可能连个数都没有,现在有了一个

仪表盘,有了仪表盘能够看到公司上个季度、昨天总体的这些数据,

还是很不错的。

对老板来说确信还是比较高兴,但是,关于市场、运营这些同学

来说可能就还不够。

比如,我们发现某一天的用户量跌了20%,这个时候确信不能放

着不管,需要查一查这个问题出在哪。这个时候,只看一个宏观的数

那是远远不够的,我们通常要对这个数据进行切分按地域、按渠道,

按不一致的方式去追查,看到底是哪少了,是整体少了,还是某一个

特殊的渠道特殊的地方它这个数据少了,这个时候单单靠一个仪表盘

是不够的。

自助式数据分析

Self-serviceDataAnalytics

理想状态的数据驱动应该是怎么样的?就是一个自助式的数据

分析,让业务人员每一个人都能自己去进行数据分析,掌握这个数据。

前面我讲到一个模式,我们源头是一堆杂乱的数据,中间有一个

工程师用来跑这个数据,然后右边是接各类业务同学提了需求,然后

排队等待被处理,这种方式效率是非常低的。理想状态来说,我们现

象大数据源本身整好,整全整细了,中间提供强大的分析工具,让每

一个业务员都能直接进行操作,大家并发的去做一些业务上的数据需

求,这个效率就要高非常多。

三、数据处理的流程

数据金字塔

▼数据分析

二I

❷数据建模

❶数据采集

大数据分析这件事用一种非技术的角度来看的话,就能够分成金

字塔,自底向上的是三个部分,第一个部分是数据采集,第二个部分

是数据建模,第三个部分是数据分析,我们来分别看一下。

数据采集

❶数据采集

基本原则

>全:多种源(客户端、服务端、数据库等),全量而非抽样

,细:Who、When、Where、How,What

首先来说一下数据采集,我在百度干了有七年是数据有关的情况。

我最大的心得——数据这个情况假如想要更好,最重要的就是数据源,

数据源这个整好了之后,后面的情况都很轻松。

用一个好的查询引擎、一个慢的查询引擎无非是时间上可能消耗

不大一样,但是数据源假如是差的话,后面用再复杂的算法可能都解

决不了这个问题,可能都是很难得到正确的结论。

我觉得好的数据处理流程有两个基本的原则,一个是全,一个是

细。

全:

就是说我们要拿多种数据源,不能说只拿一个客户端的数据源,

服务端的数据源没有拿,数据库的数据源没有拿,做分析的时候没有

这些数据你可能是搞歪了。另外,大数据里面讲的是全量,而不是抽

样。不能说只抽了某些省的数据,然后就开始说全国是怎么样。可能

有些省非常特殊,比如新疆、西藏这些地方客户端跟内地可能有很大

差异的。

细:

事实上就是强调多维度,在采集数据的时候尽量把每一个的维度、

属性、字段都给它采集过来。比如:像where,who、how这些东

西给它替补下来,后面分析的时候就跳不出这些能够所选的这个维度,

而不是说开始的时候也围着需求。根据这个需求确定了产生某些数据,

到了后面真正有一个新的需求来的时候,又要采集新的数据,这个时

候整个迭代周期就会慢很多,效率就会差很多,尽量从源头抓的数据

去做好采集。

数据建模

有了数据之后,就要对数据进行加工,不能把原始的数据直接报

告给上面的业务分析人员,它可能本身是杂乱的,没有通过很好的逻

辑的。

这里就牵扯到数据建框,首先,提一个概念就是数据模型。许多

人可能对数据模型这个词产生一种恐惧感,觉得模型这个东西是什么

高深的东西,很复杂,但事实上这个情况非常简单。

堂SEKSORS

。数据建模

AMR

❷桑化臣OA«S

|

&

❷***_______________________________.AW(♦)年

««*

£®®®%

■.•作贡❷*作种❷«nma0•作仁B爰彳

我春节期间在家干过一件情况,我自己家里面家谱在文革的时候

被烧了,后来家里的长辈说一定要把家谱这些东西给存档一下,由于

我会电脑,就帮着用电脑去理了一下这些家族的数据这些关系,整个

族谱这个信息。

我们现实是一个个的人,家谱里面的人,通过一个树型的结构,

还有它们之间数据关系,就能把现实实体的东西用几个简单图给表示

出来,这里就是一个数据模型。

数据模型就是对现实世界的一个抽象化的数据的表示。我们这些

创业公司经常是这么一个情况,我们现在这种业务,通常前端做一个

请求,然后对请求通过处理,再更新到数据库里面去,数据库里面建

了一系列的数据表,数据表之间都是很多的依靠关系。

O数据建模

比如,就像我图片里面展示的这样,这些表一个业务项进展差不

多一年以上它可能就牵扯到几十张甚至上百张数据表,然后把这个表

直接提供给业务分析人员去使用,懂得起来难度是非常大的。

这个数据模型是用于满足你正常的业务运转,为产品正常的运行

而建的一个数据模型。但是,它并不是一个针对分析人员使用的模型。

假如,非要把它用于数据分析那就带来了很多问题。比如:它懂得起

来非常烦恼。

另外,数据分析很依靠表之间的这种格子,比如:某一天我们为

了提升性能,对某一表进行了拆分,或者者加了字段、删了某个字短,

这个调整都会影响到你分析的逻辑。

o数据建模

eventuser_MtimeSmodelSosSos一versionSprovlnceProductNameProductPriceProductType

ViewProduct6623362015-11-1704:12:30.775iPhone6PlusiOS8.1甘常省小米平板1999平板电脑

ViewProduct6623362015-11-1703:56:52775iPhone6PlusiOS8.1甘JR省华为荣1«71999共

ViewProduct8383362015-11-1722:39:40.103iPhone6PlusiOS8.1江苏省魅族移动电源99手机配件

ViewProduct4545282015-11-1717:34:02.491iPhone6PlusiOS8.1湖南省iPadAir23399平板电脑

ViewProduct44545282015-11-1717:04:19,49iPhone6PlusiOS8.1湖南省ThinkPadT4508800笔记本

这里,最好要针对分析的需求对数据重新进行解码,它内容可能

是一致的,但是我们的组织方式改变了一下。就拿用户行为这块数据

来说,就能够对它进行一个抽象,然后重新把它作为一个推断表。

用户在产品上进行的一系列的操作,比如浏览一个商品,然后谁

浏览的,什么时间浏览的,他用的什么操作系统,用的什么浏览器版

本,还有他这个操作看了什么商品,这个商品的一些属性是什么,这

个东西都给它进行了一个很好的抽象。这种抽样的很大的好处很容易

懂得,看过去一眼就明白这表是什么,对分析来说也更加方便。

在数据分析方,特别是针对用户行为分析方面,目前比较有效的

一个模型就是多维数据模型,在线分析处理这个模型,它里面有这个

关键的概念,一个是维度,一个是指标。

维度比如城市,然后北京、上海这些一个维度,维度西面一些属

性,然后操作系统,还有IOS,安卓这些就是一些维度,然后维度里

面的属性。

通过维度交叉,就能够看一些指标问题,比如用户量、销售额,

这些就是指标。比如,通过这个模型就能够看来自北京,使用IOS

的,他们的整体销售额是怎么样的。

这里只是举了两个维度,可能还有很多个维度。总之,通过维度

组合就能够看一些指标的数,大家能够回忆一下,大家常用的这些业

务的数据分析需求是不是许多都能通过这种简单的模式给抽样出来。

四、数据分析方法

接下来看一下互联网产品使用的数据分析方法。

SENSORS

o数据分析

•多维事件分析

­漏斗分析

•留存分析

•回访分析

关于互联网产品常用的用户消费分析来说,有四种:

・第一种是多维事件的分析,分析维度之间的组合、关系。

・第二种是漏斗分析,关于电商、订单有关的这种行为的产品来

说非常重要,要看不一致的渠道转化这些东西。

・第三种留存分析,用户来了之后我们希望他不断的来,不断的

进行购买,这就是留存。

・第四种回访,回访是留存的一种特别的形式,能够看他一段时

间内访问的频次,或者者访问的时间段的情况

方法1:多维事件分析法

首先来看多维事件的分析,这块常见的运营、产品改进这种效果

分析。事实上,大部分情况都是能用多维事件分析,然后对它进行一

个数据上的统计。

1.三个关键概念

O数据分析-多维事件分析

取消订单

•事件总次数▼+

SSMAFI

取消订单的商品详情

,市

总次数

•维度售后服务■查看

触发用户数

,指标坦交订单

提交订单的商品细节a■文号人均次数

naio

搜索商品订单总价总和

订・融侨

[运>]均值

支付订单£9

支付订单的商品细节

最大值

姓名

收到商品

最小值

注掰

人均值

这里面事实上就是由三个关键的概念,一个就是事件,一个是维

度,一个是指标构成。

・事件就是说任^一个互联网产品,都能够把它抽象成一系列事

件,比如针对电商产品来说,可抽象到提交、订单、注册、收

到商品一系列事件用户行为。

・每一个事件里面都包含一系列属性。比如,他用操作系统版本

是否连Wifi;比如,订单有关的运费,订单总价这些东西,或

者者用户的一些职能属性,这些就是一系列维度。

・基于这些维度看一些指标的情况。比如,关于提交订单来说,

可能是他总提交订单的次数做成一个指标,提交订单的人数是

一个指标,平均的人均次数这也是一个指标;订单的总与、总

价这些也是一个指标,运费这也是一个指标,统计一个数后就

能把它抽样成一个指标。

2.多维分析的价值

来看一个例子,看看多维分析它的价值。

SENSORS

。数据分析-多维事件分析

O4

arKirextt•n<naK«n•+

*9.9•1•

+.M#

SuQmtI订单支付的成交陂天皆■e:MU.E。

比如,关于订单支付这个事件来说,针对整个总的成交额这条曲

线,按照时间的曲线会发现它一路在下跌。但下跌的时候,不能眼睁

睁的看着它,一定要分析原因。

怎么分析这个原因呢?常用的方式就是对维度进行一个拆解,能

够按照某些维度进行拆分,比如我们按照地域,或者者按照渠道,或

者者按照其他一些方式去拆开,按照年龄段、按照性别去拆开,看这

些数据到底是不是整体在下跌,还是说某一类数据在下跌。

C,SENSORS

.士丫*3

O数据分析-多维事件分析

会*・方,答oi

3c”•支付•杓成交MtMD•+

»•«•+

+刖8"

0JOISu订单支忖的成交18的做ID,按天.&支付方式叠♦上M天,

这是一个假想的例子——按照支付方式进行拆开之后,支付方式

有三种,有用支付宝、阿里PAY,或者者用微信支付,或者者用银

行看内的支付这三种方式。

通过数据能够看到支付宝、银行支付基本上是一个沉稳的一个状

态。但是,假如看微信支付,会发现从最开始最多,一路下跌到非常

少,通过这个分析就明白微信这种支付方式,确信存在某些问题。

比如:是不是升级了这个接口或者者微信本身出了什么问题,导

致了它量下降下去了?

方法2:漏斗分析

漏斗分析会看,由于数据,一个用户从做第一步操作到后面每一

步操作,可能是一个杂的过程。

SENSORS

O数据分析-漏斗分析

比如,一批用户先浏览了你的首页,浏览首页之后可能一部分人

就直接跑了,还有一部分人可能去点击到一个商品里面去,点击到商

品可能又有很多人跑了,接下来可能有一部分人就确实购买了,这事

实上就是一个漏斗。

O数据分析-漏斗分析

分谡通辑化情况

0.35%

通过这个漏斗,就能分析一步步的转化情况,然后每一步都有流

失,能够分析不一致的渠道其转化情况如何。比如,打广告的时候发

现来自百度的用户漏斗转化效果好,就可能在广告投放上就在百度上

多投一些。

方法3:留存分析

O数据分析-留存分析

ae-aax

EBaaw*

gj-用户先通行注册,后遗行支付”"的T天・存分析,及・律•

■4-AAB1X21*1・成■卓■«%IB真■(天・承

比如,搞一个地推活动,然后来了一批注册用户,接下来看它的

关键行为上面操作的特征,比如当天它有操作,第二天有多少人会关

键操作,第N天有多少操作,这就是看它留下来这个情况。

方法4:回访分析

O数据分析-回访分析

B用户一角网38行支忖订"的蟆次

・..axaHtxx<xtx*xrx

回访就是看进行某个行为的一些中度特征,如关于购买黄金这个

行为来说,在一周之内至少有一天购买黄金的人有多少人,至少有两

天的有多少人,至少有7天的有多少人,或者者说购买多少次数这么

一个分布,就是回访回购这方面的分析。

上面说的四种分析结合起来去使用,对一个产品的数据支撑、数

据驱动的这种深度就要比只是看一个宏观的访问量或者者活跃用户

数就要深入很多。

五、运营分析实践

下面结合个人在运营与分析方面的实践,给大家分享一下。

案例1:UGC产品

SENSORS

UGC产品数据分析

,访问量

・新增用户数

•活跃用户数

•发帖量

,检索量

首先,来看UGC产品的数据分析的例子。可能会分析它的访问

量是多少,新增用户数是多少,获得用户数多少,发帖量、减少量。

诸如贴吧、百度明白,还有知乎都属于这一类的产品。关于这样

一个产品,会有很多数据指标,能够从某一个角度去观察这个产品的

情况。那么,问题就来了一一这么多的指标,到底要关注什么?不一

致的阶段应该关注什么指标?这里,就牵扯到一个本身指标的处理,

还有关键指标的问题。

案例2:百度明白

百度知道案例分析

•访问量

・检索量

•独立IP数

•Session数

•提问量

•回答量

•设置最佳答案31

2007年我加入百度明白之后开始刚进去就写东西了。作为RB,

我每天也收到一系列报表邮件,这些报表里面有很多统计的一些数据。

比如,百度明白的访问量、减少量IP数、申请数、提问量、回答量,

设置追加答案,答案的数量,这一系列指标。当时,看的事实上感受

很反感。

我在思考:这么多的指标,不能说这也提高,那也提高吧?每个

阶段确信要思考哪个事最关键的,重点要提高什么指标。开始的时候

事实上是没有任何区分的,不明白什么是重要、什么是不重要。

后来,慢慢有一些感触与认识,就发现事实上关于访问量、减少

量这些有关的。由于百度明白需要流量都是来自于大搜索,把它展现

做一下调整或者者引导,对量的影响非常大。尽管,跟百度明白本身

做的好坏也有直接关系,但是它很受渠道的影响一大搜索这个渠道

的影响。

提问量开始的时候,我认为非常重要,怎么提升提问量,那么整

个百度明白平台的这个问题就多了。提升回答量,让这些问题得到回

答,高质量的内容就非常多了又提升提问量而后再提升回答量——

事实上等因此两类人了。而怎么把它做上去,我当时有一些困惑,有

一些矛盾,到底什么东西是最关键的。

有一次产品会,每一个季度都有一个产品会。那个时候,整个部

门的产品负责人是孙云丰,可能在百度待过的或者者说对百度产品体

系有熟悉的都会明白这么一个人,非常厉害的一个产品经理。我当时

就问了他这个问题,我对提问量、回答量都要提升这个困惑。

百度知道案例分析

•访问量

•检索量

•独立IP数

,Session数

•提问量

•设置最佳答案

他就说了一点,事实上提问量不是一个关键的问题,为什么?我

们能够通过大搜索去找,假如一个用户在大搜索里面进行搜索,发现

这个搜索没有一个好的答案,那就能够引导他进行一个提问,这样事

实上这个提问量就能够迅速提升上去。

我一听一下就解决了这个困惑,最关键的就是一个回答量,我所

做的情况事实上怎么去提升回答量就能够了。

SCNSOAS

提升回答量

•核心用户问题推荐:根据历史回答记录,给核心用户推荐待解

决问题

•35万核心用户模型训练

这里面把百度明白这个产品抽样成了最关键的一个提升——那

就是如何提升回答量,在这个问题上当时做了一个情况就是进行问题

推荐。

百度明白有一批活跃用户,这些用户就喜欢回答问题。因此,我

们思考:能不能把一些他们能够回答问题推荐给他们,让他们回答各

类各样的问题一一这个怎么去做呢?

这个思路也很简单,现在个性化推荐都是比较正常的,大家默认

明白这么一回事。但是,2008年做推荐这个情况事实上还是比较领

先的,从我熟悉的情况来看,国内的是2010年个性化推荐引擎这块

技术火了,但后来有些公司做这方面后来都倒掉了。

实现策略是非常简单的,我们就看一个用户历史的回答记录,看

他回答的这些问题开头是什么、内容是什么。

由于百度很擅长做自然语言的处理,基于这些,通过这里面的抽

取用户的兴趣词,感兴趣的话题,然后把待解的问题,与该问题有关

话题的有关用户进行一个匹配,匹配上了就把这个问题推荐给这个用

户。

当时,我们做的一个情况就是:把推荐几个月有过回答量比较高

的用户进行一个抽取对他们训练一个模式一一就是对每个用户有一

系列的话题兴趣点,然后每个点都有一个程度,这就是一个用户的模

型项量,就是一个兴趣项量,当时抽了35万个用户。

这个效果是这样的,现在我已经找了我们当年做的图片,整个样

式事实上这是我前一段时间截的图,大体类似。比如,我对数据分析

有关的问题回答了很多,它就会给我推荐数据分析有关的问题。

我们这个功能差不多做了有三个月,把它推上线我们事实上是满

怀期待的,结果效果如何呢?

K«v«n

■“尸'V«

'EM

线上效果MVTWir.

,心Xna-MQQKXC,

MaiM-f-a仟6

•总回答量0增

长,用户回答的

位置从分类页变

到个人中心。

上线之后很悲剧,我们发现总的回答量没有变化。因此,我们又

进一步分析了一下原因。当时,最开始这些核心用户在回答问题的时

候都是找分类页。比如:电脑这个分类,然后看电脑有关的问题,有

兴趣的就回答。

后来,我们做了一个体验:在个人中心里面加了一个猜他喜欢的

那个问题,然后推给他,结果用户从分类页回答这个问题转到了个人

中心。但是,平均一个人回答量并没有变化,当时做的这些统计,这

些核心用户就回答六个问题,超过六个他就没动力回答了。

我们事后分析原因,有一个原因他可能本身的回答量就是这么一

条线,谁能天天在哪里源源不断的回复问题。还有一个同事就分析当

时让他一个痛苦的地方,由于我们是源源不断地推荐,然后他就发现

回答几个之后还有几个,回答了几次就感受要崩溃了,就不想再这么

回答下去了。

事实上,年前时知乎在问题推荐上也做了很多功夫,做了许多测

试。年前有一段时间,它天天给我推一些新的问题,然后我去回答。

后来,发现推的太多了,就没回答的动力了。

针对这些核心用户会发现从他们上面榨取不了新的价值了。因此,

我们调转了矛头,从另一个角度—能不能去广撒网,吸引更多的用

户来回答问题,这个做的就是一个库里推荐。

提升回答量

•Cookie用户问题推荐:根据历史检索和浏览记录,给Cookie

用户推荐待解决问题

•覆盖数亿百度用户

访问百度的时候,百度不管用户是否登录,会在用户的库里面去

设置一个用户标识。通过这个标识能够对这个用户进行一个跟踪,尽

管不明白用户是谁,但是,起码能把同一个用户这个行为给它检起来。

这样,就能够基于他历史的检索,各类搜索词,还有他流量的各类页

面的记录,然后去提取一些证据,然后给这些库题建一个模型。

这样有一个好处,能够覆盖的用户量非常大,前面讲的核心用户

推荐只覆盖了只有35万的核心用户,但是通过这种方式能够覆盖几

亿百度用户,每一次用户登录之后或者者访问百度明白之后我们就基

于他本身兴趣然后走一次检索,在解决问题里面检索一下跟他匹配的

就给他推荐出来。

C,SENS0W5

.一^Aru族C

提升回答量

等待您来回答

英自黑霭克纳.马尔克斯比.疆个水平高OBI*

停大的亘■,到底深鼠♦多少马尔克斯的给做。同答

八月的整就是马尔克斯的还是博尔赫斯的□os«

调敕马尔克斯作品名字的⑨译何短0B«

与马尔克斯主义社会学有♦原则区别的西方社会学的开创者是雄

马尔克新什么作品让人们■新认识了拉美这片土量20S

更多等待您来回答的问题>>

比如前一段,我自己在没有登录的时候,事实上我是会看马尔克

斯。我比较喜欢马尔克斯的作品,我当时搜了马尔克斯的一些有关的

内容。它就抽取出来我对马尔克斯什么感兴趣,就给我推荐了马尔克

斯有关的问题,可能我明白我不可能就会点进去回答。

这个功能上了之后效果还是很不错的,让整体的回答量提升了

要明白,百度明白产品从年开始做,做至」年、

7.5%O2005I20072008

年的时间这个产品已经很成熟了。在一些关键指标进行大的提升还是

非常有挑战的,这种情况下我们通过

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论