新浪微博的用户画像是怎样构建的_第1页
新浪微博的用户画像是怎样构建的_第2页
新浪微博的用户画像是怎样构建的_第3页
新浪微博的用户画像是怎样构建的_第4页
全文预览已结束

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、新浪微博的用户画像是如何建立的?1.概括从上一篇认识每一个“你”:微博中的用户模型里面对用户模型维度的划分能够看出,属性和兴趣维度的用户模型都能够纳入用户画像(UserProfile)的范围。而所谓用户画像,简单来说就是对用户的信息进行标签化。如图1所示。一方面,标签化是对用户信息进行构造化,方便计算机的辨别和办理;另一方面,标签自己也拥有正确性和非二义性,也有益于人工的整理、剖析和统计。用户属性指相对静态和稳固的人口属性,比如:性别、年纪区间、地区、受教育程度、学校、企业这些信息的采集和成立主要依赖产品自己的指引、调查、第三方供给等。微博自己就有比较完好的用户注册指引、用户信息完美任务、认证

2、用户审查、以及大批的合作对象等,在采集和冲洗用户属性的过程中,需要注意的主假如标签的规范化以及不同根源信息的交错考证。用户兴趣则是更为动向和易变化的特点,第一兴趣遇到人群、环境、热门事件、行业等方面的影响,一旦这些要素发生变化,用户的兴趣简单产生迁徙;其次,用户的行为(特指在互联网上的行为)多样且碎片化,不同行为反应出来的兴趣差别较大。接下来主要介绍一下微博画像中兴趣维度的建立方法。微博用户兴趣剖析标签根源用户自标签、达人或认证标签、企业、学校、微群标签、星座、微博重点词这些根源都可能成为用户的标签。而针对每个特定的用户采集标签除了其自己之外,他关注用户的标签也会传达到该用户身上。如图2所示(

3、蓝色实线代表关注关系,橙色虚线代表兴趣标签根源)。权重计算在采集到一个用户可能存在的标签后,还需要给标签赋必定的权重,用来划分不同标签关于该用户的重要程度。不同标签的根源用户质量,标签的传达路径,转发关系,标签的自己,以及标签与用户之间的共现关系都会考虑在内。不同质量的用户自己产生的标签权重不同样,质量越高,以为该标签的可信度越高,不论是将该标签赋给自己仍是传达出去的时候其权重值越高。标签的传达路径主假如针对鉴于关注关系的标签传达,亲近度比较高的关注用户传达过来的标签权重值会比较高。标签是来自于用户的原创仍是其转发的微博,权重值会有差别,一般来说原创的权重会高于转发权重。假如标签自己是一个非常

4、常有的词,那么它用于刻画用户的兴趣的划分性是比较差的,相反假如是一个长尾词,则划分性较强。出于这样的考虑,越是长尾词,标签的权重值会越高。标签与用户的共现关系是指用户和该标签能否常常共同出现,评论的是二者的关系性。关系性越高,则标签的权重值越高。综合上述的要素,一个标签关于特定用户的权重值能够大概表示为:标签权重(根源因子+亲近度因子+转发因子+长尾因子)共现因子。时效性跟着时间的变化,用户的兴趣会发生转移,时间越长远,标签的权重应当相应的降落,距离目前时间越近的兴趣标签应当获得适合突出。出于这样的考虑,一般会在标签权重值上叠加一个时间衰减函数,这个时间衰减函数被设计成如图3所示的指数衰减的形

5、式,经过定义衰减幅度和半衰期,调理衰减的程度,表现不同的时效性。别的,针对用户的兴趣,还会设定一个较小的时间窗口来获得用户的短期兴趣。经过用户在短时间内的原创、转发和关注行为采集兴趣标签,并计算标签的权重。短期兴趣更新周期会较长久兴趣更短,兴趣更集中,可是能够比较实时地反响用户兴趣的变化。从兴趣到能力但是,用户拥有某方面的兴趣,只代表了他愿意接受这方面的信息,其实不可以代表他拥有产生有关内容的能力。所以,在发掘了用户兴趣标签的基础上,还需要发掘哪些用户能够针对特定的标签拥有必定的内容生产能力。微博中的关注关系能够以为是一种认证,拥有同样兴趣的用户之间的关注则有可能是兴趣相投(自然也可能不是,但毕竟有必定的指导性),那么将拥有

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论