已阅读5页,还剩55页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
学校代码基于网络分析的微博用户特性研究疌生姓名叠歪蓬学科究湖南师范大学学位评定委员会办公室二零一四年五月 阐述微博网络的研究背景、发展现状和研究意义。介绍复杂网络的基本参数,度分布、聚类系数、平均路径长度;介绍复杂网络的三个网络模型,即小世界模型、无标度模型、适应度模型;介绍社会网络分析法的基本概念,重点介绍中心度的概念。 关键词:复杂网络;微博网络;无标度;适应度;中心度 疭、籌 瓸, 目吕宋绲奶氐恪本文主要工作及结构安排复杂网络拓扑模型无标度网络模型 社会网络的相关理论 论文工作总结研究展望参考文献攻读硕士学位期间参与的科研项目致谢湖南师范大学学位论文原创性声明湖南师范大学学位论文版权使用授权书 基于网络分析的微博用户特性研究第一章绪论微博网络的研究背景科研合作网络、社会关系网络等均为复杂网络。复杂网络是对现实世界的一个抽象】,它具有错综复杂的网络结构,节点复杂多样。世纪末崛起的复杂网络,渗透到诸多不同的学科如数学、工程、生物等,许多研究人员着手考虑节点个数繁多、组织繁杂的现实网络的总体特性。物理、生物、经济等诸多学科涌现了一大批学者探讨复杂网络,至此,复杂网络成为现代社会网络研究的一个十分热门的课题,被称之为“网络新科学。近几年来,随着人们生活水平的提高,因特网用户的普及化,聚友网、人人网、开心网、微博等社交网络飞速发展,用户数呈爆发式的 空间人人网起源于高校,注册用户多为大学生注册用户以白领群体为主注册用户以用户为主用户数力推名人圈,舆论领袖效应明显紧紧抓住用户资源与客户端绑定草根微博,产品整和每天诙嗵跆刻亿次搜索请求微博是一种可以基于有线和无线因特网的终端平台发表简短 基于网络分析的徽博用户特性研究微博网络的研究意义 的政策和提案提出质疑和攻击,在这个过程中,奥巴马就是使用帮助他引导竞选。微博上的贵州流浪儿事件发起的互助行动,微博引爆的殴打空姐事件等等都表明了微博网络在应急救援、推动立法、民间互助、引导竞选、社会监督等方面都发挥了重大的作用。人们现实生活中的行为。社交网络成为信息的传播和共享的新平台,是人们展示自我、表达自我的便捷的重要途径,因此,掌握微博网络的用户特性及其行为,有效的分析微博网络信息扩散机制和特点,扩散模式及反映,有利于深入了解信息扩散的内在机理,引领社会事件发展趋势,具有重要的应用价值。研究微博中复杂的用户关系可引领现实生活中社会事件的发展趋势,也能够精准有效为拥有相同兴趣爱好的人们进行个性化推荐,而且对 基于网络分析的微博用户特性研究微博网络的国内外研究现状月的岣。年上半年我国互联网的普及率保持稳 目前,微博数据挖掘代表性的研究主要包括话题事件分析、究了网页浏览、点击影片等。文献【】研究了天涯论坛上用户回复行为,对选好的几个帖子进行追踪,研究表明用户对发表评论的时间间隔是服从幂律分布。文献【】对用户数据分析,该研究揭示用户对电影点击的时间间隙也是服从幂律分布。影响力的研究是各领域热点研究,国内外研究人员也致力于社交网络影响力的研究。文献【】运用用户之间话题的相似度来评估各用户影响力大小。文献【】是将用户的影响力划分为消极和积极两者,提出算法来评估用户的影响力大小。在社会学,政治学,广告投放中,社会网络信息传播中影响力的分析研究已经展开。以前的影响力研究主要是针对用户的邻居数目,将邻居多的用户在信息传播过程 基于网络分析的微博用户特性研究 博已经从影响个人生活扩展到有利于信息的传播,得到了史无前 基于网络分析的微博用户特性研究据统计,微博用户中男女均衡,后是支柱,及后占,后占,后占罢。用户可以自由的根据自己的兴趣爱好随机地关注他人,用户未经他人授权,不征得他人同意就可以自由关注他人,建立连接关系,并且能实时地跟踪所关注人发布的信息。因此,微博这种在线社交网络不再是以朋友交往为基础,它是一种陌生人社交平台,这个平台上陌生人可以分享和传播理念,不再是狭隘的基于朋友的社交圈,是一种稀疏的社交关系,它的开放性更广,信息传播范围也就更为广阔,基本上达到了社会信息和人际交往关系的最大化酬。 本文主要工作及结构安排全文组织结构如下: 率为颐前裵就记录为网络的度分布函数。累积度分布函数 聚类系数删存在于生物网、因特网、经济网络等众多实际复 复杂网络拓扑模型为了更好地研究复杂网络,了解网络结构和网络行动之间的关联,学者们提出了各种网络模型,下面针对三种网络模型进行介绍。 个人之间的平均距离约为瓷缁嵘厦扛鋈酥屑渲恍柰个人畔攘樱阂桓鲂绿砑拥慕诘悖溆胍桓鱿钟械慕诘鉰链 从式可以看出无标度网络中顶点的度分布函数是遵循较旧的顶点具备较大的度。但是在诸多真实生活网络系统中,节点的度及节点的增长速率并不是仅仅与该节点加入时间有关联。比如一篇很优秀的论文发表之后,它能马上就受到学者的广泛关注,故而这篇文章就会被后来研究者多次引用。所以,节点的增长速率可能与节点的内在本质有关,例如文章的优秀度,个人的结交能力等等。和对此引入节点的适应度模型视饶凸乖焖惴缦律尽宽鸌: 基于网络分析的微博用户特性研究风。蒜。通吃”局面。世纪三四十年代,社会网络理论才刚刚开始。年, 社会网络与复杂网络的联系和区别 新浪微博网络构建谛吕宋的爬虫算法实际数据中提炼出为我们所用的数据信息过程旧。用户在使用微博的过程中,他们之间的信息传播基于机制而产生,通过以及的使得信息层层传递,形成错综复杂的交流网络。任意用户发布一条微博在网络中有可能呈现瀑布式的发散效应,这是经过用户问不停的互动才形成的。为了获取最真实的数据,让分析结果具有说服力,专门针对新浪微博编写了网络爬虫程序。新浪微博为每个注册的用户分配了一个,本文以作者本人作为起始用户,获取,然后获取朋友的,再以朋友的作为起始点,获取朋友的朋友的。爬虫算法伪代码如下:根据指定用户获得其朋友的列表 在微博网络中体现在相互关注等关系中,而弱关系体现为单向的关注关系。用户发表微博,既可以是用户自己创作的文字,也可以是转发或者是对其它用户的微博发表评论等。微博网络中有关注关系、转发关系、评论关系、引用关系、提及关系、收藏关系。有研究者指出尽管这几种关系有不同的结构形态,但它们同时又拥有某些共性特质及联系。其中关注关系是弱关系,本文就是基于弱关系的研究。 基于网络分析的微博用户特性研究图没的关系示例图 自自婺驹壮祡首先分析所获得新浪微博数据中粉丝数目与互粉数目在所有用户中的比值,从图很容易看出,大多数微博用户的互粉数与粉丝数比值很小,小于,粉丝数远大于互粉数,消息的传播过程中,粉丝数传播得更广更快,故而我们选取研究的网络是以粉丝数为边构成的网络。新浪微博网络的小世界特性得到平均路径长度为。结合 新浪微博网络的无标度特性 累积度分析 基于网络分析的微博用户特性研究 年在爬取到的数据中,名人明星都为这里聚集了大批的粉丝。新浪微博中有一位女影星以最高点击率被封“围脖女王”。微博网络中,分为名人和草根,名人即为关注数很多的用户,草根为相对来说关注数少的用户。新浪微博网络数据中,微博网络中的用户的关注数各不相同,大部分节点关注数少,只有少部分节点关图中给出了在年期间注册用户的粉丝数的分布多。也就是说,就单个用户来说,随注册时间的变化,他们的粉用户虽然加入的时间晚,但是它却比年注册的用户的粉丝数 ,耍图随注册时间粉丝数分布图我们从数据中选取出粉丝数目大于的微博用户,如图早的,与“年相比,我们发现年注册的用户的粉丝数有大于万的,说明年注册的这些用户在年是很受人们所关注的,故而能在很短的时间内增加粉丝数,使得它们的粉丝数比先注册的有些用户的要多很多,即表明它们适应性比较强。 图隽曜嵊没姆鬯渴莘植纪肌油可以发现,用户注册时间为相同的时候,即同时加进网络时,他们的粉丝数也是不同的。当后加进网络时,因某些原因,后加进网络的用户可能比先加进的用户的粉丝数要多。这个我们也称为是各用户适应性不同。匣亘圜,注册的用户的粉丝数分布图通过以上分析,我们可以假设新添加的节点具备较强的适应 第四章基于新浪微博的网络中心度分析社会网络中心度研究构及节点在网络中具体位置决定。 本章利用新浪微博用户之间朋友关系建立的网络来研究分析微博网络中用户的中心度,用各个不同中心度指标来权衡网络中用户的重要性,寻找出哪些用户在网络中是中心点,我们说是中心点的用户处于中枢地位,即在微博用户通信进程中的职权相当大,甚至是说它们的一举一动都能在较大水平上对整个网络的消息扩散起作用都不为过。因而,找到这样具有中心性质的顶点有至关重要的应用价值。大可能的邻居笥个数。那么节点中心度定义为: 基于新浪微博网络用户的中心度研究的邻居数笥咽的一个统计。邻居数多的用户我们称它行动权力 基于网络分析的微博用户特性研究根据顶点编号计算该顶点的度 将顶点的度越诘阕苁齨获得该顶点的度中心度 在微博网络的信息传播中,哪些节点在信息传播的过程中有 博网络中用户进行了中间中心度探讨,计算出每个用户中间中心该用户在这个网络中对信息的传递起到了一定的控制作用。紧随着的是、,这几个节点的中问中心度比较高。在信息传播过程中,其它的用户想接收信息对这几个用户的依靠程度相当大,这样的用户在网络上的权力就比其它用户大,它们能够在相当大的程度上控制消息在整个网络中的传播和扩散。在数据中,有些闹屑渲行亩戎档扔,即该节点并非在最近路线上。获得两个节点之间的最近路线条数,!籧,琲, 的条数 紧密中心度权衡的是某个用户不受其余用户制约的程度。紧密中心度值越大,表明该顶点到其余项点的总距离或间隔越小,表明该顶点受其余顶点制约少,就越处于中央位置,自立性强。值越小,说明该节点到其它节点的总距离越大,说明该节点受其它节点制约的程度大,就越远离核心位置,在接收信息时越容易、的这五个用户的紧密中心度最高,其中以为最高。用户到其它用户的总距离最短,它最不受其它节点的制约,即发布消息更容易传递到网络中的其它用户。紧密中心度值越大,越容易获取消息,不太易受其它用户制约,也就是相对来说独立性强。一个顶点到网络中其余所有顶点的最近路径的总和 基于网络分析的微博用户特性研究 本章小结本章主要通过运用社会网络的分析方法,打破了传统的基于单一的度大的节点就对信息的传播作用大的这一思想。通过点度 基于网络分析的微博用户特性研究
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2026年劳务员之劳务员基础知识考试题库200道及完整答案(必刷)
- 2026年设备监理师之质量投资进度控制考试题库200道及一套答案
- 2025江苏省灌南县教育局所属学校冬季赴高校招聘高层次人才66人备考公基题库附答案解析
- 2026重庆市地质矿产勘查开发集团有限公司毕业生校园招聘46人历年真题汇编带答案解析
- 2025福建海峡银行董事会办公室社会招聘参考题库附答案解析
- 2026北京天玛智控科技股份有限公司全球校园招聘笔试模拟试卷附答案解析
- 2025四川成都市泡桐树中学同文分校教师招聘历年真题汇编带答案解析
- 2025年滁州市第一人民医院公开招聘编外工作人员5人备考题库带答案解析
- 2025贵州黔南州粮油储备库主任选聘备考题库附答案解析
- 2026天津医科大学口腔医院人事代理制(第一批)招聘12人备考题库附答案解析
- 护士执业注册健康体检表
- 糖尿病肾病诊治进展 课件
- MoldFlow实例分析报告-中英文对照课件
- 被巡察单位组织人事工作汇报集合5篇
- 商务英语常用单词
- 泸定桥的资料
- 建设工程施工合同(GF-2017-0201) 专用条款模板
- 现代设备管理课程教学大纲
- 工业硅项目可行性研究报告
- 《设计心理学》课件5-审美心理学
- 电子束曝光技术页PPT课件
评论
0/150
提交评论