微信朋友圈里一些有趣的数据统计和科学规律_第1页
微信朋友圈里一些有趣的数据统计和科学规律_第2页
微信朋友圈里一些有趣的数据统计和科学规律_第3页
微信朋友圈里一些有趣的数据统计和科学规律_第4页
微信朋友圈里一些有趣的数据统计和科学规律_第5页
全文预览已结束

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

微信朋友圈里一些有趣的数据统计和科学规律

最近,清华大学的科学家钳究了一下我们的朋友圈,然后得出了一些比拟有意思的规律,还

创立了一套预测模型,可以预测一个人在朋友圈转发一篇文章后谁会点开、谁会点赞,预测的精

度超过80%。下面我们就具体来看一下这些研究结果。

年龄与被激活的概率

首先,这个研究是和微信一起搞的,所以能拿到准确的后台数据c它一共使用了4800万个

用户、6125万篇微信文章和75亿次互动的数据,包括是谁提供的文章、提供者的年龄、性别、

提供者好友的年龄、点击文章的好友是谁、谁又在点击文章后点了赞或者点击文章页面里的“在

看”0

当然,微信给出的供研究的数据都是把其他个人信息抹去的,并没有泄露隐私的风险。然后,

科学家们发文章描述了那个预测的数学模型是怎么建立的.这并不是本文的重点,如果你对这局部

学术内容感兴趣,可以找这篇文章来看。论文的链接如下——s:///abs/2103.02930O

这里,我们只看看他们通过模型分析出的结果。

TABLE1Useractivityw.r.t.gender.

Gender"Wow”prob.Clickprob.

Male1.17%10.62%

Female1.19%9.86%

203040506070Age

Fig.2.-Wow"anddickprobabilityw.r.t.userage.

首先是在微信“看一看”里点击文章的概率,和额外又点了“在看”按钮的概率,这个概率

又按年龄和性别做了细化。有的人可能不知道“看一看”在哪儿,你只要翻开微信,点下侧的

“发现”按钮,里面就能看到“看一看”了。当然,这个是要开启的,如果没有的话,你可以去

设置-通用-发现页管理去手动开启。在这个地方看文章,比朋友圈里看文章有更好的互动体验,

因为你可以知道一篇你喜欢的文章,你的朋友是谁看了、谁喜欢了。

结果是这样的:在“看一看”里出现的文章,被点击的概率大约是10%,而不但点击了文章,

又去点了“在看“按钮,也就是说,我不但看了,我还希望别人知道我看了这篇文章的,这个概

率大约是1虬也就是说,10篇文章中有1篇会引起好奇,10篇引起好奇的文章里有1篇会引发

认同。

如果按年龄看,25岁这个看似是互联网中坚力量、最活跃的人群,其实反而是最不愿

意点击文章和点击“在看”的;而70岁以上的人是最愿意点击文章和点击“在看”的。这一头

一尾的概率相差大约1倍,比方,年轻人只有双的会点击“在看”,而老年人的概率就能提升到

2%0

01

-4

01

-2

0

-0-

0020

0.01$

0.010

00X

(a)“Wow”Behavior(b)ClickBehavior

Fig.3.User“wow”andclickprobabilityw.r.t.users*genderandage.

如果按年龄和性别两个维度去筛选,结果是这样的:最爱点击“在看”的人是70岁以上的

男性,比例高达3.5%,最不爱点击“在看”的是25岁左右的男女青年,比例只有不到0.5%。而最

爱点开文章的是70岁以上的女性,比例高达15%,最不爱点开文章的是25岁的年轻女性,低到

了8%0由此可见,老年人具有纯读者的属性,早已“训练有素”的编辑们起的文章标题,对他

们确实更受用。

0.10000.09230.08940.10160.10030.0.1143

0.15

z0.08810.08420.07880.07770.08390.09280.0996

・0.14

0

0

E0.09000.08770.09260,09270X)9370.10080.10480.13

2J

(

O0.12

OJO.O95S0.09X30.10890.11380.11650.1193

S

导0.11

二().131110.14060.1426

00.11280.11060.1052

9

0

2-0.10

0

卜0.12520.11550.1184|0.l353|0.14721().1563

.

-0.09

10.12600.1262|0.13570.15340.1581

-0.08

(10.20)[20.30)[30.40)[40.50)[50.60)[60.70)[70.80)

Friend'sace

Fig.4.Users,uwow"probabilityw.r.t.userageandfriendage.

接下来这张图,建议你仔细看一看,它说的是一个用户被激活的概率。这个概念是这样的,

翻开“在看”后,你会看到里面有一篇篇的文章,除了题目外,下侧还显示人名,这些人名就是

看了这篇文章并且点过“在看”的人。而我们决定是不是要点开这篇文章,其实不光文章标题影

响着我们的判断,下面出现的人名也会影响我们是不是要点开。如果那个人对我很重要,比方说

是我的领导、我的家人,或者我的对手,那这些属性会影响我看完后要不要也点一下“在看”。

当然,微信是不会把这些亲属关系、工作职位之类的信息透露给科学家的,科学家只能从年

龄、性别等普通的属性,来统计一个人点过“在看”对另外一个人也点“在看”的影响,这就是被

激活的意思。之后为了表述简洁,我们都使用“被激活”这个词。

这张表格我们可以这么看:

先找最低的,也就是黄得都发白的区域,有2个方格,用户年龄都是20-30岁,他们是最不

容易被激活的一群人。尽管如此,不同年龄段的人对他们的激活还是有差异的,年龄在30-50岁

的人最不能激活20-30岁的人。

我们再从这张图里找激活率最高的区域,有4个方格,就是深得发紫的区域。其中3个出现

在老年人与老年人之间,最容易受到激活的人群是70-80岁的人,他们最容易受到GOTO岁、

70-80岁的人的影响。而另外一个深紫色,也就是激活率最高的地方,很有意思,那就是十几岁

的年轻人最容易激活七八十岁的老人。而且这里也可以看出,对各年龄层影响最大的,就是七八

十岁的人。

这些规律对应到现实中的场景,可能是这样的:七八十岁的老人对社会事件发表的观点,只要

不过时,就都会受到大家的赞扬。而七八十岁的老人在接纳新事物、新观点上,已经比较弱了,

但刚上初二的孙子、孙女跟他说的东西,他们却很愿意听取。

最后就是,六十岁以上的人之间的互相影响力最大。

2.性别与被激活的关系

下面一个有意思的结果就是,按性别来看,人们互相影响的规律,但这次是统计2个好友对

他本人的影响。

可以发现,如果用户本人是男性,那么另外两个出现的好友也都是男性的时候,他被激活的

概率最高。用户本人是女性也是如此,当另外2个好友也都是女性时,用户被激活概率最高。我

猜,这可能和文章内容与性别相关有关,同一性别关注的问题更倾向于一致。

010S

0100

0W5

-0090

difTprmMimejwovtamecitytamediM

DistancewithFriendI

Fig.7.User“wow”andclickprobabilityw.r.t.thedistancebetweentheegouserand

thefriends.Hereudiff_provMmeansdifferentprovinces,**same_provnmeansthe

sameprovinces,Hsame_citynmeansthesamecities,andusame_distMmeansthe

samedistricts.

3,其他因素与被激活概率的关系

然后,是物理距离对被激活概率的影响。当然,这里的距离只能精确到同一省份或者同一城

市,精确不到公里数。

有人会以为,离得近的人互相影响多。但实际上,在■看一看”这里的激活率完全表达不出距

离的特质。这也可以想到,你翻开常用的微信群,看看最近发言的5个人,你能说出他在哪个城

市吗?估计不能。所以,我们在“看一看”中看到那些只是在微信里熟悉的朋友时,也不会首先

被他的地理位置影响。

接着,是意见领袖和普通用户的比照。这个也很有意思。首先,什么算意见领袖呢?这是研

究团队根据微信后台数据,主要是互动的次数,使用搜索引擎给结果页面排序的方法,给每个用

户算出的一个分值。分最高的前1%的人,被定义为意见领袖。结果发现,意见领袖激活普通人

的概率反而不如普通人激活普通人的概率高。

TABLE4

Dyadiccorrelationsw.r.t.users*andfriends*socialroles.OU:ordinaryuser;

_____OL:opinionleader.______________

UserFriendnWownprob.Clickprob.

OUOU1.06%10.65%

OUn0IT0.66%8.11%

OLOU0.92%8.57%

OLOL0.64%7.49%

不管是激起普通人点击文章,还是点“在看”.都是普通人点的“在看”对别人的激活率更高,

一个10.65%,一个是1.06%。而在这两项统计中,意见领袖激活普通人的概率只有8.11%和

0.66%o当然,最低的是意见领袖对意见领袖的激活率,这两项是7.49%和0.64虬

我觉得这个结果很容易被误解。在意见领袖这个词的定义上,那些得分高的人未必是我们理

解的在微信公众号和微博上写爆款文章的人,那些是我们定义的大V,而这篇研究中的意见领袖,

更接近于朋友圈里非常活跃的人,联系人多、见什么点什么、转发文章也不怎么慎重,他们会在

互动次数上凸显出来。但正因为他们在不管重要还是不重要的文章里都冒头,于是拉低了影响别

人的概率。

p15

O

5O1

0

o.PC

A0

三O.90

q

e

qO

o

i

d

0.050.090

0.085

0.81.00.81.0

TheratioofactivefriendsTheratioofactivefriends

(a)"Wow"Behavior(b)ClickBehavior

Fig.8.User“wow”andclickprobabilityvs.theratioofactivefriends

下一个研究是朋友圈的属性。这里用到了一个定义一活跃朋友数,指的是一个人的朋友圈

人数除以朋友圈可

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论