(计算机应用技术专业论文)网络即时通讯中的信息传播的仿真研究.pdf_第1页
(计算机应用技术专业论文)网络即时通讯中的信息传播的仿真研究.pdf_第2页
(计算机应用技术专业论文)网络即时通讯中的信息传播的仿真研究.pdf_第3页
(计算机应用技术专业论文)网络即时通讯中的信息传播的仿真研究.pdf_第4页
(计算机应用技术专业论文)网络即时通讯中的信息传播的仿真研究.pdf_第5页
已阅读5页,还剩41页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

独创性声明 籼i | i | i l | l | i i i | | i i i | | | i i | | i i | | 删 y 18 2 4 7 7 0 本人声明所呈交的学位论文是本人在导师指导下进行的研究工作及取得的研 究成果。据我所知,除了文中特别加以标注和致谢的地方外,论文中不包含其他 人已经发表或撰写过的研究成果,也不包含为获得重废自g 史 太堂或其他教育 机构的学位或证书而使用过的材料。与我一同工作的同志对本研究所做的任何贡 献均已在论文中作了明确的说明并表示谢意。 学位论文作者签名桫拯鬼签字眺劫口7 年朋力日 学位论文版权使用授权书 本学位论文作者完全了解 重麽由g 虫 太堂有关保留、使用学位论文的规 定,有权保留并向国家有关部门或机构送交论文的复印件和磁盘,允许论文被查 阅和借阅。本人授权重麽邮血太堂可以将学位论文的全部或部分内容编入 有关数据库进行检索,可以采用影印、缩印或扫描等复制手段保存、汇编学位论 文。 ( 保密的学位论文在解密后适用本授权书) 学位论文作者签名: 栖耘秦 导师签名: 签字日期:多刃7 年r 月) 2 日 签字日期: f砌产门拥 重庆邮电大学硕士论文摘要 摘要 在信息时代,信息传播的地位与作用日益突出,深刻影响着国际社会 的政治、经济、科技和文化等各个领域。即时通讯网络已成为大众信息传 播的主要途径,有必要研究即时通讯网络信息传播的性质、规律以及预测、 引导等方法和手段。 目前,国内外对信息传播的研究主要是基于复杂网络的研究,包括基 于小世界网络模型和无标度网络模型的信息传播。由于即时通讯网络既表 现出小世界网络的特性,同时又具有无标度网络的特征,这就要求建立的 即时通讯网络模型具有较高的聚类系数,同时又要服从幂律分布。可变聚 类系数无标度网络模型的提出,正好解决了小世界网络模型和无标度网络 模型各自的缺陷,符合较高聚类系数同时又服从幂律分布。但是仅仅利用 该模型建立即时通讯网络,还不足以体现当前即时通讯网络的特性,即具 有群网络的特性。 本文采用分层的思想,提出了一种新的即时通讯网络的两层模型。其 中,第一层网络利用可变聚类系数无标度网络模型来构建,用于表示用户 与联系人列表的人际关系网络;第二层网络则用于构建群网络,是用户与 群网络的关系。群中的用户来自第一层网络,并且群中所有节点构成完全 图,即群中所有用户都互为联系人。在构建好即时通讯网络的基础上,制 定了信息传播规则。通过实验仿真对群数、聚类系数、传播者和免疫者人 数的变化观察,发现有群网络时,聚类系数比没有群网络时大,并且随着 群网络数的增大,传播者峰值越高,以及最终免疫者数量也相应地有所提 高,对信息传播的影响越大。在信息传播过程中,群网络用户与群网络断 开连接时,传播者峰值以及最终免疫者数量都比群网络用户与群网络连接 时高。同时,以信息为对象,研究在传播过程中用户突然断开群网络对信 息传播的广度和速度的影响。实验仿真发现,断开群网络确实对信息传播 的广度和速度产生了一定的影响。 关键词s 即时通讯,信息传播,聚类,无标度网络 a b s t r a c t i nt h ei n f l o m a t i o na g e ,i n f o n n a t i o np r o p a g a t i o np l a y sa ni n c r e a s i n g l y p r o m i n e n tr 0 1 e ,w h i c hi m p a c t so ni n t e r n a t i o n a lc o m m u n i t y sp 0 1 i t i c s ,e c o n o m y , t e c h n 0 1 0 9 ya n dc u l t u r e ,e t c s i n c ei n s t a n tm e s s a g i n gn e t w o r ki so n eo ft h e m o s ti m p o r t a n tw a y st o p r o p a g a t ei n f o r m a t io n , i no r d e rt om o n i t o ra n d f 0 r e c a s tt h e p r o p a g a t i o nb e h a v i o r so ni n s t a n tm e s s a g i n gn e t w o r k ,i ti s n e c e s s a r yt os t u d yi n f b n n a t i o np r o p a g a t i o nn a t u r e ,d i s c i p l i n ea n dm e t h o d 8 a tp r e s e n t ,t h er e s e a r c ho ni n f 0 瑚a t i o np r o p a g a t i o ni sb a s e do nc o m p l e x n e t w o r ka th o m ea n d a b r o a d , i n c l u d i n gs m a l l w o r l dn e t w o r km o d e la n d s c a l e f r e en e t w o r km o d e l h o w e v e r ,i n s t a n tm e s s a 百n gn e t w o r ke x h i b i t sa l l t h ec h a r a c t e r i s t i c so fas c a l e - f r e en e t w o r k ; m o r e o v e r , i th a st h ee v i d e n t c h a r a c t e r i s t i co fas m a l l - w o r l dn e t w o r ka sw e n s o ,t h em o d e lo ft h ei n s t a n t m e s s a g i n gn e t w o r km u s th a v e h i g h e rc l u s t e r i n g c o e f j f i c i e n ta n d o b e y p o w e r 1 a wd i s t r i b u t i o n s c a l e - f r e en e t w o r kw i t ht u n a b l ec l u s t e “n gs o l v e st h e s m a l l - w o 订dn e t w o r km o d e la n ds c a l e - f r e en e t w o r km o d e lf o rt h e i rr e s p e c t i v e d e 疗c i e n c i e si n c l u d i n gl o w e rc l u s t e r i n gc o e f f i c i e n ta n dd on o to b e yp o w e 卜l a w d i s t r i b u t i o n h o w e v e r ,i fo n l yu s i n gt h i sm o d e lt ob u i l ti n s t a n tm e s s a g i n g n e t w o r k ,i td o e sn o tp r e s e n tt h ec h a r a c t e r i s t i co fi n s t a n tm e s s a g i n gn e t w o r k , t h a ti s ,t h ec h a r a c t e r i s t i co fg r o u pn e t w o r k an e w t w o - l a y e rm o d e lo fi n s t a n tm e s s a g i n gn e t w o r ki sp r o p o s e du s i n g l a y e r e di d e a t h ef i r s ti a y e rn e t w o r ku s e ss c a l e f r e en e t w o r k sw i t ht u n a b l e c l u s t e r i n gt ob u i l d i tp r e s e n t st h er e l a t i o n s h i pb e t w e e nu s e r sa n do t h e ru s e r s i nb u d d yl i s t a l lt h eu s e r sa r ei nt h en e t w o r k ,a n dt h eu s e rn o d e sl i n k e de d g e c a n1 i a i s et oe a c ho t h e r - t h es e c o n dl a y e rn e t w o r ki sag r o u pn e t w o r kr e l a t e d t ou s e r sf r o mt h ef i r s tl a y e ra n da l lt h eu s e rn o d e sc o m p o s eac o m p l e t eg r a p h , t h a ti s ,a l lt h eu s e r sc a nc o n t a c te a c ho t h e r o nt h eb a s eo f b u i l d i n gt h em o d e l , i n f o r m a t i o np r o p a g a t i o nr u l e sa r ef o r m u l a t e d w eh a v es i m u l a t e dt h i sm o d e l a n do b s e r v e dt h ed i v e r s i f i c a t i o no fg r o u pn u m b e r s ,c l u s t e r i n g c o e f 6 c i e n t , s p r e a d e ra n ds t i f l e r r e s u l t ss h o wt h a tt h ec l u s t e r i n gc o e f j f i c i e n ti sl a r g e rw h e n t h e r ee x i s t sg r o u pn e t w o r k ,t h em o r eg r o u pn u m b e ri s ,t h eh i g h e rm a x i m u m a m o u n to fs p r e a d e ra n dt h ef i n a la m o u n to fs t i f l e ra r e t h u st h eg r o u pn u m b e r a n dc l u s t e r i n gc o e f n c i e n te f f e c tt h ei n f 6 珊a t i o np r o p a g a t i o n i nt h e p r o c e s so f n i n f o r m a t i o np r o p a g a t i o n ,t h em a x i m u ma m o u n to fs p r e a d e ra n dt h e6 n a l a m o u n to fs t i n e ra r eh i g h e rw h e nt h eu s e r sa r el i n k e dt og r o u pn e t w o r k m e a n w h i l e ,w es t u d yt h ei m p a c to ft h eg r o u pn e t w o r kt ot h es c o p ea n ds p e e d o fi n f o m a t i o np r o p a g a t i o nt h r o u g hd i s c o n n e c t i n gt h el i n kb e t w e e nt h eu s e r a n d g r o u pn e t w o r k i nt h e p r o c e s s i n g o fi n f b m a t i o np r o p a g a t i o n t h e s i m u l a t i o n s h o w st h a td i s c o n n e c t i n gt h el i n kb e t w e e nt h eu s e ra n dg r o u p n e t w o r kh a sa ni m p a c to nt h es c o p ea n ds p e e do fi n f b m a t i o np r o p a g a t i o n k e y w o r d s : i n s t a n tm e s s a g i n g ,i n f b 咖a t i o np r o p a g a t i o n ,c 1 u s t e r i n g , s c a l e f r e en e t w o r k n i 重庆邮电大学硕士论文目录 目录 摘要i a b s t r a c t i i 第一章绪论1 1 1 网络舆情传播的研究背景及意义1 1 2 网络舆情传播的研究进展2 1 3 即时通讯网络现状3 1 4 论文的主要工作5 1 5 论文组织结构5 第二章网络模型及舆情传播相关理论基础6 2 1 引言6 2 2 可变聚类系数无标度网络6 2 2 1 聚类系数7 2 2 2 度与度分布7 2 2 3 无标度网络模型8 2 2 4 可变聚类系数无标度网络模型1 0 2 3 信息传播模型l l 2 3 1 谣言传播模型1 1 2 3 2 可变聚类系数的无标度网络上的谣言传播模型”13 2 4 本章小结1 4 第三章基于两层可变聚类系数无标度网络的即时信息传播模型1 5 3 1 引言l5 3 2 即时通讯网络信息传播流程1 5 3 3 即时通讯网络结构16 3 3 1 即时通讯网络信息传播过程1 6 3 3 2 信息传播模式”17 3 4 两层即时通讯网络模型描述l8 3 5 本文信息传播规则1 9 3 6 本文即时信息传播模型算法一2 0 3 6 1 算法流程2 0 3 6 2 算法具体描述2 1 3 7 本章小结2 2 i v 重庆邮电大学硕士论文目录 第四章模型仿真及分析2 3 4 1 引言2 3 4 2 实验1 :可变聚类系数无标度网络模型仿真2 3 4 3 实验2 :一层网络信息传播仿真”2 4 4 4 实验3 :本文两层即时通讯网络信息传播仿真一2 6 4 5 实验4 :在两层信息传播模型中断开用户与群网络的连接仿真2 7 4 6 实验5 :在两层即时通讯网络中信息传播广度和速度仿真”2 8 4 7 实验结果分析:2 9 4 7 1 实验2 和实验3 结果分析2 9 4 7 2 实验4 结果分析31 4 7 3 实验5 结果分析3 2 4 8 本章小结3 3 第五章总结及未来工作3 4 5 1 全文工作总结3 4 5 2 未来工作3 4 致谢3 6 攻读硕士学位期间从事的科研工作及取得的研究成果3 7 参考文献3 8 v 重庆邮电大学硕士论文第一章绪论 第一章绪论 1 1 网络舆情传播的研究背景及意义 互联网技术的出现及网络媒体作为第四媒体逐渐在日趋激烈的媒介 竞争中,无可争议地获得了自身的地位,其影响已经全面地渗入到人们的 政治、经济、文化和生活等各个方面,成为舆情信息传播不可须臾离弃的 手段和方式。从一开始就表现出了对社会产生正负两方面的影响。一方面, 它对信息的传播,特别是一些重大新闻事件和突发性事件的报道中,表现 出传统媒体无法与其相比的优势:快捷、信息的多源、互动,让网民可以 参与对事件的评论,发表自己的意见,引导和影响社会舆情的发展。另一 方面,由于绕过了传统媒体运作的“议程设置”、“把关人”等程序,分散 了舆论,特别是一些低俗恶俗消息的充斥及一些流言、谣言和虚假信息的 蔓延又影响了社会的进步和稳定。 据中国互联网络信息中心( c n n i c ) 2 0 0 8 年7 月发布的“第2 2 次中 国互联网络发展状况统计报告 显示,中国网民数量达到2 5 3 亿人,已跃 居世界第一位,而中国网民对即时通信的使用率已经非常高,2 0 0 8 年6 月 达到7 7 2 。由于网络传播的自由性、交互性和开放性,使以往在传统媒 介上无法实现的个人表达自由和言论得到空前的展现,任何人只要进入网 络便可无所不言,畅所欲言,形成了言论的“自由市场 。也正是这种前 所未有的相对自由、极度自如的表达平台和表达方式,因此如何因势利导, 保证正确的舆论导向,是网络媒体面临的一个严肃课题和挑战。 网络舆情形成与信息传播中的群体影响密不可分,包括群体压力、极 化、无意识、互动、技术条件屏障等。要想缓解网络信息传播造成的巨大 冲击,有效管理网络公共空间,应当建立网络舆情传播监测预警机制,建 立舆情响应机制和整体协调机制,提高应急指挥能力,掌握舆情引导和信 息传播的主动权。因此,研究万维网上的信息传播模型及其机理是基础性 的技术工作。 即时通讯网络作为舆情传播的一个重要途径,有必要研究即时通讯网 络信息传播的性质、规律以及预测、引导等方法和手段。在现实生活中, 网民通过即时通讯工具进行信息传播时,由于即时通讯工具中群的组建, 使得信息更快捷地传播,所以本文从群网络的角度出发,研究其对信息传播 重庆邮电大学硕士论文第一章绪论 的影响。 1 2 网络舆情传播的研究进展 随着计算机技术及网络技术的不断发展,万维网上涌现出各种行为模 式,而这些网络行为是指网络运行的动态变化规律,包括网络流量特征的 动态变化规律、网络拓扑结构的动态演化规律、网络性能的动态变化规律 以及网络用户与应用的行为、网络在故障状态下的行为和网络在遭受恶意 攻击下的行为等。网络舆情传播是典型的网络行为,信息由网络空间中各 个智能体通过复杂的巨系统【2 】万维网传播给其他智能体,最终突现出智 能行为模式。 网络舆情的传播是一种通过万维网实现的集体行为,依靠各种传播工 具或者平台进行传播。在传播过程中没有中心控制点,由一些感兴趣的网 民自发传播。在传播过程当中,网民之间通过互动以及其他因素的影响, 最终形成网络舆情。从目前来看,网络信息的传播主要通过电子邮件、新 闻组、即时通讯工具、电子公告板( b b s ) 、博客( b l o g ) 和维客( w i k i ) 等,而每种传播途径又有各自的特点,突现出的行为模式不尽相同。 目前舆论研究的重点工作主要是如何有效地对舆论进行引导,尽管国 内外学者对网络舆情都做了大量研究,但是大部分都是围绕传播学、社会 学以及心理学等角度进行展开,分析手段的限制使得大部分研究仍停留在 定性阶段【3 ,4 ,5 6 1 。而其他有关网络信息传播的控制技术,也是针对法律、 道德和自律等控制方法而言的,例如文献r 7 】在网络信息传播监督和管理的 技术极致的论述中之设计到了认证和授权、密码技术、病毒防治等3 个方 面的网络安全技术。文献【8 】中指出目前网络信息传播的把关,处于一种事 后不久的被动状态,通常都是要在信息发布之后,把关人对此信息进行判 断,决定是否让这些信息继续在网上存在和流传。目前市场上出现一些相 关产品,如方正智思网络舆情分析系统、中讯数网公司的互联网舆情分析 系统以及邦富互联网舆情采集分析系统等,都是属于事后围堵的方式来控 制信息的传播。 d a l e y 和k e n d a l l 【8 】于2 0 世纪6 0 年代最早研究了谣言传播现象,提出 了谣言传播的数学模型,早期的关于谣言传播的研究基本上集中于理论分 析。传统的数学模型往往用一组确定性的微分方程描述传播行为。例如文 献【9 】利用平均场方程来刻画出复杂网络中的谣言传播过程,该模型指出最 终免疫者的人数与感染概率有着紧密的关系,而与传播源的度七f 无关,这 2 重庆邮电大学硕士论文 第一章绪论 点与一般的病毒传播过程迥然不同,因为在病毒传播过程中最重的个体恢 复数量与传染源的连接度是密切相关的,可见,谣言传播在复杂网络中的 传播过程与病毒传播过程既有类似之处,又有明显不同。 近年来,随着复杂网络研究的兴起【1 0 11 1 ,谣言传播的研究也有了新的 进展。由w a t t s 和s t r o g a t z 提。出的小世界( s m a l l w o r l d ) 网络模型【1 2 】( 简 称w s ) 以及b a r a b a s i 和a l b e r t 提出的无标度( s c a l e f r e e ) 模型【1 3 1 4 】( 简 称b a 模型) 是复杂网络研究中的两个基本模型。z a n e t t e 【” 1 6 】首先将复杂 网络理论应用于谣言传播的研究,在小世界网络上建立谣言传播临界值在 内的结论。m o r e n o 【3 6 】等人又在无标度网络上建立了谣言传播模型,同时由 计算机仿真和通过随机分析的方法的得出的结论进行了比较。复杂系统理 论的研究确实提供了一种崭新的超越还原论思想的建模方法:为系统设定 一些规则,让系统在一定的环境下自发的演化,然后考察系统演化过程中 涌现出来的若干性质。这种基于局部个体空间相互作用的微观离散动力学 模型代替宏观的整体模型的方法,成为研究复杂系统整体行为非常有效的 手段,已经在计算机病毒传播、传染病传播、危机传播研究中取得了不少 成果【1 7 1 8 ,19 1 。在此基础上,刘常昱、胡晓峰【2 0 】等人利用w a t t s 和s t r o g a t z 的小世界网络模型,对人际关系网络的舆论传播模型进行了研究,初步建 立了舆论传播的随机演化仿真模型,在这个模型中,每个个体根据其领域 个体、媒体以及其心理因素的影响,按照一定的策略更新状态。这一模型 只是研究的开始,许多被简化了的假设和规则,都需要深入的细化研究。 由于经典的小世界网络模型和无标度网络模型具有各自的缺陷,如 s w 小世界网络模型具有高聚类( h i g hc l u s t e r i n g ) 性质,但是网络的度分 布却不服从幂律分布( p o w e r 1 a w ) ;而b a 无标度网络模型虽具有幂律度 分布,但是它的聚类系数很低。针对在现实世界的网络的统计分析表明, 许多现实网络不但具有幂律分布,而且具有高聚类性质,而最近,h o l m e 和k i m 【2 i 】引入可变聚类系数的无标度网络模型,可以得到具有幂律度分布 和较高聚类系数的网络模型,文献【2 2 】研究了在可变聚类系数无标度网络上 的谣言传播,该文将网络中的所有用户定义为三种状态,包括无知者、传 播者和免疫者,在制定传播规则过程中,只考虑传播者对其他节点的影响, 而未考虑免疫者传播者的影响。 1 3 即时通讯网络现状 目前,中国即时通讯市场的产品,除了市场占有率第一的腾讯q q 以 重庆邮电大学硕士论文第一章绪论 外,还有微软的m s nm e s s e n g e r 、y a h o om e s s a g e r 、i c q ,以及国内的网易 p o p o 、朗玛u c 、新浪6 6 8 、搜狐搜q 、i m u 等,他们都是面向个人的即 时通讯软件,除了m s n 和腾讯的t e n c e n tm e s s e n g e r ( 腾讯t m ) 定位为商务 办公用户使用的即时通讯软件外,其余的即时通讯产品与腾讯q q 类似, 多属于娱乐交流的即时通讯软件。在众多即时通讯厂商中,腾讯q q 占有 显著的领先优势。 据易观国际发布的2 0 0 8 年第二季度中国即时通讯市场季度监测报 告显示,二季度中国即时通讯市场活跃账户数达到4 2 6 亿,同比增长13 , 其中腾讯q q 活跃账户数达到3 4 l 亿,以8 0 2 的市场份额排名首位,市场 份额较第一季度略有提高,如图1 1 所示。 2 0 0 8 年第二季度即时通讯市场 活跃账户数市场份额 磊菊i 百订厂溺面i 亘两 曩他o 五疆魔矗0 4 喇磊汜灌11 素曩:易鹿嗣豫 图1 12 0 0 8 年第二季度及时通讯市场份额( 来源易观国际2 0 0 8 ) 即时通讯作为网络舆论传播的一个重要途径,因此,对即时通讯网络 的研究也成为目前研究的一个热点。s m i t h 【2 3 】对一个从法语即时消息数据 库( n i o k i c o m 数据库) 中得到的社会网络进行了分析,该网络包括5 0 15 8 个节点和5 0 0 0 0 0 条有向边,被建模为有向图。在有向图中可能一个用户 知道另外一个用户,而反之未必,因此联系列表中的数据并不要求两个用 户之间对称。当用户a 的联系列表中存在用户b 的时候,即认为存在一条 从a 指向b 的有向边。通过测试表明n i o k i c o m 即时消息网络中大约有8 2 的连接时双向的,即是说a 的联系列表中有8 2 的联系人在他们的各自的 联系列表中也存在a ,所以可以把即时消息网络简化为一个无向图来考虑。 通过对n i o k i c o m 网络中得到的统计数据的研究,即时消息网络表现了所 有无标度网络的特征( 幂律度分布) ,同时也具有明显的小世界特性( 较 高聚类系数) 。 以上即时通讯网络并未考虑即时通讯工具中具有建群的功能,只考虑 了联系人列表中用户之间的网络拓扑结构。 因此,本文在此基础上,利用可变聚类系数无标度网络模型建立即时 4 重庆邮电大学硕士论文第一章绪论 通讯网络的两层网络模型,第一层网络利用可变聚类系数无标度网络模型 建立联系人列表之间的网络拓扑结构,第二层网络为群网络,建立成每个 用户都是互联的完全图。在构建好网络拓扑图之后,设定用户状态,制定 信息传播规则,按照传播规则进行交互,观察群网络对信息传播的影响。 1 4 论文的主要工作 本文主要就是研究即时通讯网络中的信息传播,主要研究内容包括: 即时通讯网络信息传播的特征;建立基于可变聚类系数的无标度网络的两 层网络模型;制定即时通讯网络的信息传播规则;最后在此模型上进行信 息传播,统计其最大的传播者的人数和免疫者人数,最终得出结论。 本论文工作得到以下项目基金的资助:9 7 3 计划前期研究专项课题面 向网络智能的突现计算模型及算法研究( 2 0 0 8 c b 317 1 11 ) :国家自然科学 基金项目网络突现智能的突现计算模型研究( 6 0 8 7 3 0 7 9 ) ;重庆市自然 科学基金项目基于数据挖掘的s w a 嘲突现行为分析( 2 0 0 8 b b 2 2 4 1 ) 。 本人主要在该项目中负责即时通讯方面的研究。 1 5 论文组织结构 本文共分五章,各章的内容安排如下: 第一章:绪论。介绍了研究的背景及意义、网络舆情和信息传播现状。 第二章:网络模型及舆情传播相关理论基础。介绍了可变聚类系数无 标度网络模型和谣言传播模型及在可变聚类系数无标度网络上的谣言传 播。 第三章:基于两层可变聚类系数无标度网络的即时信息传播模型研 究。首先,给出了即时通讯网络结构及信息传播模式。其次,提出基于无 标度网络的即时通讯网络两层模型,并描述了信息传播规则,最后给出了 本文基于两层可变聚类系数无标度网络即时信息传播算法。 第四章:模型仿真及分析。对可变聚类系数无标度网络模型进行仿真; 一层网络信息传播模型仿真和本文提出的基于两层可变聚类系数无标度 网络的即时信息传播模型仿真,并以信息传播为对象,研究了群网络对信 息传播的广度和速度的影响,最后并对其结果进行分析。 第五章:结论及未来的工作。总结了本文所做工作,并探讨了进一步 的研究内容。 5 重庆邮电大学硕士论文第二章网络模型及舆情传播相关理论基础 第二章网络模型及舆情传播相关理论基础 2 1 引言 近年来,复杂网络引起了国际科学界的广泛重视,已经成为统计物理 学、学术、计算机科学、系统科学、生命科学以及社会学等多个学科的研 究热点,科学家们致力于探索复杂网络的演化规律、结构功能和动力学行 为【2 4 】【2 5 】【2 6 】【2 7 】。 复杂网络的发展是现实世界网络的客观要求。事实上,在许多自然和 人造系统中都存在着大规模的复杂网络。例如,在生态系统中,物种之间 的相互关联可以描述为复杂的食物链网络;在科技领域中,因特网和万维 网是自组织网络的典型代表;在我们的现代社会中,许多庞大的基础系统, 如能源网和航空运输网,都是不可缺少的网络系统;具有活力的细胞也不 例外,基因、蛋白质和其他分子之间的相互作用形成了一个复杂的网络, 从而产生了细胞的组织和功能;社会系统也可以抽象成描述个体间多种相 互作用的网络。 大多数复杂网络的研究始于人们想要了解各种实际网络的愿望。研究 网络最初和最主要的原因之一是为了了解疾病和其它事物( 如信息、计算机 病毒和谣言等) 在网络上的传播机制。研究复杂网络,对于防备黑客攻击、 防治流行病、提高复杂性计算速度、控制信息传播等,都具有重要的实际 意义。 2 2 可变聚类系数无标度网络 具有高聚类系数的网络通常用w s 小世界网络模型来建立,而具有幂 律度分布的网络则通常由b a 无标度网络模型来建立,但是w s 小世界网 络模型虽然具有高聚类性质,但是其度不服从幂律分布,b a 无标度网络 模型虽然度分布服从幂律分布,但是其聚类系数较低。可变聚类系数无标 度网络模型则可以解决以上两种网络各自的缺陷,通过调整参数来达到较 高的聚类系数,并且其度分布服从幂律分布。可变聚类系数无标度网络模 型的这个特点正好可以用于构建即时通讯网络。 6 重庆邮电大学硕士论文第二章网络模型及舆情传播相关理论基础 2 2 1 聚类系数 在很多真实网络的拓扑结构中,存在下述的情况,即如果顶点a 与 顶点b 相连,并且顶点b 与顶点c 相连,那么顶点a 也极有可能与顶点c 相连。以社会网络为例,你的朋友的朋友也很可能是你的朋友。这一现象 在物理学界被称为网络的聚类性。刻画网络的聚类性通常采用图论中的聚 类系数( c 1 u s t e r i n gc o e 衔c i e n t ) 这一特征量来刻画。 。 聚类系数【2 8 】体现了节点的聚集程度,属于复杂网络理论的基本统计特 性之一。其具体描述为【2 9 】:假设一个节点f 有毛个邻近节点( 从拓扑结构看 就是这些邻近点与节点f 建立有连接关系) ,那么这些邻居节点最多存在的 总边数为岛( 岛1 ) 2 ,若其中这些岛个节点之间实际存在的边数为日,聚类 系数c ,被定义为易与总边数的比值: r 一 2 蜀 c :_ 二竺l 一 毛( 毛一1 ) r 21 、 从几何特点看,上式的一个等价定义为: 。 与节点i 相连的三角形的数量 ,。 乙,2 写丽爵丽甄匠瓦西丽 u _ 其中,与节点f 相连的三元组是指包括节点f 的三个节点,并且至少存在 从节点f 到其他两个节点的两条边。 整个网络的聚类系数可以定义为: c :吾羔g , ( 2 3 ) 以= 。 显然o scs 1 ,当聚类系数c = o 当且仅当所有节点均为孤立节点,即 没有任何节点被连接;聚类系数c = 1 当且仅当网络是全局耦合的,即网络 中任意两个节点都是直接相连接的。 2 2 2 度与度分布 度( d e g r e e ) 是单个节点的属性中简单而又重要的概念。网络中某个节点 f 的度七,被定义为与该节点连接的其他节点的数目。网络中所有节点的度的 平均值称为网络的节点平均度,用 的节点,因此这类网络被称为同质网络( h o m o g e n e o u sn e t w o r k ) 。近 年来大量实验结果表明【2 5 】【2 4 】【2 6 】【3 1 1 ,许多真实网络的度分布明显不同于 p o i s s o n 分布。特别地,许多网络的度分布可用幂律形式p ( 七) 矿丫来更好地 描述。幂律型分布也称无标度分布,具有幂律型度分布的网络称为无标度 网络。在这类网络中,绝大部分节点的度相对很低,但存在少量度值相对 很大的节点,因此它们被称为异质网络( h e t e r o g e n e o u sn e t w o r k ) 。 2 2 3 无标度网络模型 除了小世界特性外,大量实际网络还存在着另一个突出的结构特征一 一幂律度分布,我们常常称这些网络为无标度网络。无标度网络中的大部 分节点度值都很低,但存在着度数非常高的中枢节点。无标度网络的幂律 型度分布使这类网络在小世界特征的基础上又具有了许多新的性质。如不 存在传染病传播的临界阈值等。对网络攻击的研究结果表明,随机攻击基 本上不会破坏无标度网络的连通性,但在有目的的最大度攻击下,很小比 例的节点移除就会对网络的连通性造成根本性的破坏。这与现实世界中许 多复杂系统的表现完全类似。 19 9 9 年,b a r a b a s i 和a l b e r t 提出了一个经典的无标度网络演化模型, 指出网络增长和优先连接机制是产生幂律度分布的根本原因。该模型后来 被命名为b a 模型【3 2 1 ,其定义如下。 在初始状态,网络包含聊d 个点,且没有任何的边存在。 ( 1 ) 在每一个时间步,一个新的点被加入到网络中来,并与聊( 小s 所d , 且为常数) 个网络中已经存在的点建立连接。 ( 2 ) 新增加的点与网络中某点f 进行连接的概率p ,被假定为正比于点 f 的度值: = ; ( 2 4 ) 2 一托j 根据以上的规则,在经过,时间之后,可以得到一个具有肛f + 朋d 个点 以及所f 条边的网络。 不难看出,小世界网络的形成机制是从规则网络开始,加入某些随机 性;而在无标度网络的b a 模型形成机制中,则是在完全随机的基础上加 上一些确定性一一不平权的优先连接概率。因此,这与小世界网络一样, 为规则性和随机性之间可能产生复杂现象提供了例证。b a 模型具有如下 8 重庆邮电大学硕士论文第二章网络模型及舆情传播相关理论基础 ( 1 ) 具有幂律型度分布 对b a 模型而言,从网络中某一点f 的度值后,随时间变化的角度出发, 假设其度值连续,我们有如下方程: 鲁一枷轰 亿5 , 钟 后, 、。 每一时间步,我们加入朋条边,即网络总度值增加2 所。于是 勺= 2 肌,+ 所口。当f 很大时,有 t 鲁= 鲁 6 , t-=of 7 1 研2 r 、 节点f 是在岛时刻进入网络,且满足初始条件七如f ) = 朋,于是 。 啪胁j 亿7 , 上式2 7 给出了单个点度值的演化方程,利用上式2 7 ,可以将p ( 七, ,其中y 是网络中所有节点的集合,e 为边的集合,节点之间没 有重复边。 可变聚类系数无标度网络模型算法有以下几个主要步骤【2 1 1 。 ( 1 ) 初始化网络:网络由肌d 个孤立节点组成; ( 2 ) 网络增长:每个时步加入具有朋条边的新节点v ; ( 3 ) 优先连接( p r e f e r e n t i a la t t a c h m e n t ) :新加入的节点1 ,的每一条边以 概率p w 连接到已经存在的节点上,节点,连接到节点w 的概率为: 乞= 芸! ! :- ( 2 1 1 ) 厶尼v v 皇矿 ( 4 ) 三角形成( t r i a df o m a t i o n ) :如果节点1 ,和节点w 在之前的优先连 接步骤中已经加入了一条边,那么随机选择节点w 的一个邻居节点,从节 1 0 重庆邮电大学硕士论文第二章网络模型及舆情传播相关理论基础 点1 ,到该邻居节点连接一条边,如果节点w 的所有邻居节点已经连接到节 点,或者无邻居节点,那么就执行优先连接。 具体构建过程如下:在网络中加入一个有历条边的节点1 ,首先执行 一次优先连接步骤,然后以概率尸,执行一次三角形成步骤或者以概率1 只 执行优先连接。每次加入节点时执行三角形成的平均次数为聊,_ ( 肌一j ) p , 当m ,_ o 时,即为原始的b a 模型。图2 1 为优先连接和三角形成,其中图 2 1 a 表示优先连接步骤,新加入节点,以一定的概率与节点“进行连接; 图2 1 b 表示三角形成步骤,节点1 ,与在优先连接步骤中连接的节点的邻 居节点w 连接,表示不允许连接。 2 3 信息传播模型 2 3 1 谣言传播模型 ( a )( b ) 图2 1 优先连接和三角形成 m o r e n o l 3 6 】等人利用平均场方程来刻画出复杂网络中的谣言传播过程, 谣言传播模型定义如下:网络中的个节点被定义成三种状态中的一种, 借用病毒传播的术语进行定义,分别是无知者,传播者和免疫者三种状态。 无知者就是那些未曾接触过谣言,一旦接触谣言,必定会受到谣言的影响; 传播者即为散播谣言的活跃个体组成;免疫者则为曾经接触过谣言,但是 不再传播谣言,具有免疫功能的个体。传播过程的演化是由传播者与它直 接接触的节点开始传播的。其传播规则为:当传播者遇到一个无知者,那 么该无知者就以概率a 成为传播者。当传播者遇到了传播者或免疫者,那 么传播者以概率a 成为免疫者。 定义f ( ,) 为无知者在整个网络中所占的比重,s ( ,) 为传播者在整个网络 中所占的比重,俐免疫者在整个网络中所占的比重。 重庆邮电大学硕士论文第二章网络模型及舆情传播相关理论基础 f ( f ) + s ( ,) + ,【,) 2 l( 2 1 2 ) 显然,f ( ,) o ,( f ) 1 。 平均场方程如下: 掣:一名 砸) s ( ,) ( 2 1 3 ) 一= 一l l i j i l 厶l j l 口f 望墨2 :旯 f o ) s o ) 一口 j o ) j ( ,) + ,( f ) 】 ( 2 1 4 ) 口i 掣:口 s ( f ) s ( f ) + ,( f ) 】 ( 2 1 5 ) 口l 上述方程2 1 3 - 2 1 5 初始条件f ( o ) = ( 1 ) ms ( o ) = 1 m 并且,( 0 ) = o 。传播 者以传播概率a 进行增长, 胗为个体的平均连通度,f ( f ) 和s ( ,) 分别为无 知者个体和传播者个体密度即无知者和传播者占整个体统的比重。另一方 面,消失机制认为传播者消失成为免疫者是以传播者密度和非无知者1 f ( f ) = s ( f ) + ,( f ) 的a 胗倍消失。 当j ( ) = o ,微分方程( 2 1 3 ) - ( 2 1 5 ) 能够从无穷极限来分析解决。利用 方程( 2 1 2 ) ,可以得到s ( f ) 出= k = l i m ,一,( f ) ,引入一个新的变量= 1 + a a , 可以得到先验方程 名= 1 一p 一,( 2 1 6 ) 以上平均场方程适用于均匀网络。 如果网络不是均匀的,而是非均匀网络,上述方程不能直接应用而必 须做相应的修改。 为了描述不同度的节点的关系,考虑到不同度的节点的性质,引进 “( f ) 、s 七( f ) 、,七( ,) 代表不同度的节点无知者,传播者以及处于免疫状态的 免疫者各占的比例,它们应满足的条件为“( f ) + & ( f ) + ,t ( f ) = j 。通过平均场 方法的处理,“( ,) ,乳( f ) 、“( ,) 的演化方程应变为 掣一,丢笔掣 掣吨

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论