版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
多关系社交网络中网络舆情传播模型研究摘要随着互联网新媒体的蓬勃发展和网民规模的不断扩大,网络舆情在现实社会中的重要性日趋受到大众的关注。在对网络舆情事态识别、评估、处置的工作中,第一步就是科学建立起尽可能全面反映网络舆情的传播模型。该文着重对网络舆情传播模型的研究进行较为全面的梳理和回顾,其关注点主要集中在传播模型的生成演化机制、网络结构影响力研究及其相关应用上。针对信息传播模型的宏观分析和微观观测,前人的研究积累了不少令人瞩目的成果,但是也存在传播基础理论与量化实践分析结合不紧密的问题。仿真模拟舆情传播结果表明:与传统社交网络舆情传播模型相比,该舆情传播模型可以更好地描述真实互联网环境中的舆情传播规律。一种基于综合集成研讨人机结合的信息传播模型建模,既具备了具体问题具体分析的微观专用属性,也具备适用于多种不同关注视角的广泛通用性,因此我们将对网络舆情全方位建模、综合分析并提供新的方法,使得正面信息能够快速高效地传播,不良恶意信息的传播得到控制或遏制,这一项工作具有非常重要的理论价值和现实意义。关键词:复杂网络;舆情传播模型;大数据分析;多关系社交网络
AbstractWiththerapiddevelopmentofnewInternetmediaandthecontinuousexpansionofthescaleofInternetusers,theimportanceofonlinepublicopinionintherealsocietyisincreasinglyconcernedbythepublic.Intheworkofidentifying,evaluatinganddealingwiththesituationofonlinepublicopinions,thefirststepistoestablishacommunicationmodelscientificallythatreflectstheonlinepublicopinionsascomprehensivelyaspossible.Thispaperfocusesonacomprehensivereviewoftheresearchonthenetworkpublicopinioncommunicationmodel,focusingonthegenerationandevolutionmechanismofthecommunicationmodel,theinfluenceofthenetworkstructureanditsrelatedapplications.Regardingthemacroanalysisandmicroobservationofinformationtransmissionmodel,thepreviousresearcheshaveaccumulatedmanyremarkableachievements,butthereisalsoaproblemthatthebasictheoryofcommunicationisnotcloselycombinedwiththequantitativepracticalanalysis.Thesimulationresultsofpublicopinioncommunicationshowthatcomparedwiththetraditionalsocialnetworkpublicopinioncommunicationmodel,thepublicopinioncommunicationmodelcanbetterdescribethelawofpublicopinioncommunicationintherealInternetenvironment.Basedonanintegratedcombinationofhumanandinformationdisseminationmodelmodeling,itisspecialwiththespecificanalysisofmicroscopicproperties,alsohavesuitableforavarietyofdifferentviews,widegenerality,sowewillhaveanoverallmodeling,comprehensiveanalysisonnetworkpublicopinionandprovideanewmethod,makesthepositiveinformationcanspreadquicklyandefficiently,badcontrolledorcontainedthespreadofmaliciousinformation,thisworkhasveryimportanttheoryvalueandpracticalsignificance.Keywords:Complexnetwork;publicopinioncommunicationmodel;bigdataanalysis;multi-relationshipsocialnetwork
目录TOC\o"1-3"\h\u摘要 -10-引言为了真实再现舆情在多关系社交网络中的传播过程,将通过对爬取到的新浪微博数据进行大数据分析,从中得到社交网络中多种关系对网络舆情传播的影响,基于复杂网络理论讨论了一种适用于多关系社交网络的舆情传播模型,该模型根据多种关系对舆情传播的影响界定传播模型中各状态之间的转移过程和转移概率.仿真实验结果表明:与其他传统社交网络舆情传播模型相比,该舆情传播模型可以更好地描述真实互联网环境中的舆情传播规律。第一章绪论研究背景在web2.0时代,网络与现实社会进入到相互关联越来越紧密的时代,现实社会的人际关系被映射到网络空间。社会关系被映射到网络,从而网络可以对现实产生更大的影响。公众发表的言论在社交网络上的传播很可能形成“病毒传播”,而在“后真相”时代,谣言和流言的传播更“值得信赖”。失实的舆论和谣言的传播是对社会稳定的重大挑战。秘书长习近平同志在全国网络信访工作会议上的讲话说到:“建立线上线下同心圆,更好地融合社会共识,统一全党全国人民团结奋斗的共同思想基础。在议程设置上,当网络社会上的信息不对称时,尤其是当人们媒介素养还未达到相应水平,区分信息真实性的能力还是有限时,信息可能会演变成谣言并迅速传播[1]”。舆论通过各种各样的网络作为平台,并以(信息)接触的形式传播和扩散。当舆论在联系网络和信息网络之间传播时,必定受制于该网络的结构和传播规律,从而具有一定的可预测性和可控性[2]。这就为治理网络空间、监控网络舆论提供了可能性与可操作性。在研究社会网络中舆论的扩散发展时,我们首先要准确而深入地研究舆论的传播模型,建立起一个能够科学反映网络舆情传播的模型,这才能有助于网络治理的工作发展和相关研究进行。因此,考虑到现有研究的不足,本文提出了“多关系社会网络中网络舆情传播模型的研究”主题,主要研究互联网环境下当地信息和舆论的传播问题。现今社会中,人们的现实社会关系已经深深映射到了网络空间中,虚拟的网络社会已变得不在“虚无缥缈”,而成为了现实社会的一部分。这一部分也深刻地揭示出社会中的种种问题,在一定程度上更为激烈的反映着社会现实,由于互联网的“虚拟性真实”的特点导致网民在网络空间中的言论表达更为随意与自由,网民在现实社会关系中碍于人情关系而选择性表达的内容可能在网络空间中就会“肆无忌惮”地袒露出来。对于信息的接受者来说也是同样,当某些敏感言论在面对面交流的情况下会难以接受,但在网络空间(比如:微博、朋友圈、SNS等)看到好友发表“不入耳”的言论时反而会表现出更强的包容性。针对此种情况,在对网络舆论的发展进行研究时就要将网络用户的网络关系考虑到研究中。一个热门话题是如何通过网民的网络关系传播出去形成舆论,在网络社会中网民的多重关系是如何影响到网民对特定事件的看法并形成舆论的?这些问题都对此次研究至关重要,因为在当今社会,信息在互联网中的流动绝大多数仍是依靠网民之间的关系网络来进行了,网民关系的多重性与复杂化往往决定了个人的视野广度和信息使用范围。因此,此次研究将题目定为“多关系社交网络中网络舆情传播模型研究”,将重点放在多关系网络对网络舆情传播的影响上。1.2研究意义网络的无限性和开放性以及网络个体的自由性等特点,使社交网络为我们的生活带来了极大的便利,在它服务我们生活、带给我们诸多益处的同时,也在恶意发布虚假信息、破坏社会秩序、泄露个人信息,并为社会的不法分子也提供条件。尤其在web2.0时代,人们的现实社会关系映射到互联网空间中,网络不再是虚拟的社会。若不法分子通过网民的社会关系网络来操控网络舆情的发展,其产生的后果难以想象,以至于可能带来现实社会的解构和权力的更迭。因此,建立起有效的网络舆情传播模型,对政府有关部门进行舆论监控与治理工作提供了必要的保证,这是此次研究在宏观社会中存在的意义。从个人网络化生存来看,人类语义的丰富性与个体表达的差异性决定了在舆情分析中对信息本质需要进行深层次的分析。网民的情绪化表达与以“段子”为代表的网络文化表现出舆情的呈现具有隐蔽性和含义多重性,在网络中发表的言论的直面含义可能并非传播者的核心观点,而是其内核的“伪装外套”,此时挖掘文本中蕴含的真实情感和态度才能提供真实的舆情表达。一词多意、反讽、幽默段子、恶搞等网络文化和语言修辞表达就成为研究的题中之意。以网络用语“呵呵”为例,“呵呵”的原意本为“开心地笑”,但在网络文化的影响下,网络中的“呵呵”已变为“不屑”和辱骂他人的用语。但由于网民年龄和意识空间的差异性,在不同人群中对这个词的理解往往呈现出不同的景观,正如老年人认为“呵呵”是“礼貌地微笑”的意思,而对于年轻人来说“呵呵”是“你就是个傻子”的意思。由此看来,共通意义空间的代际差异深刻地影响着人们对同一事物的不同看法。因此,在研究网络舆情传播时,将网民的个人关系网络纳入研究范围内,就能更为清晰地展现出相近关系人群对某一事件的相似舆论,以至于解决了在某一舆论状态下,不同人群对同一事物“面和心不合”的尴尬局面。对社交网络的研究,实质上是对人们在社交网络中的心理和行为的研究。只有了解网民的行为定律和行为方式,才能构建出多关系社交网络并创建一个良好的网络环境,以便更好地了解社交信息在关系网络中的状态。通过引导正确的信息行为,社交网络中的信息行为模式将成为学者,尤其是社交网络中群体行为研究的主要研究方向。从舆论的体量角度来看,简单地研究社交网络中的个体行为是没有意义的,许多个体行为在关系网络的影响下的结果就是形成群体性行为,或者由此产生群体性事件,这也成为近年来学术研究的热门话题。群体是社会网络中最重要的结构性组织,是许多人的社会关系和行为选择的结果。关系网络中的每一个节点(人)都是一个看似松散其实互相影响极为深刻的群体,往往一个节点的行为将导致该关系网络中所有节点发生变化,在关系网络中,强关系与弱关系、强连接与弱连接的区分已不再“泾渭分明”,而是“牵一发而动全身”的关系。社交网络中的群体作为个体某种社会关系的集合,对其中的个体行为具有显著的影响。因此以群体视角作为社交网络信息传播研究的切入点,研究个体的信息行为和心理变化具有重要的意义,也为我们准确地认识网络舆情提供了可借鉴的模型。1.3研究目标XE"1.3研究目标"XE"1.3研究目标"本文拟通过分析前期研究中已提出的舆情传播模型的优缺点,在前人的研究模型中加入适当变量对模型进行一定的优化与改进,重点研究传播过程中信息本质上所反映出的态度、观点,以及信息在网络传播中的扩散演化机制。而对信息本质的研究则主要聚焦在关系网络中认知相似性上,重点研究传播过程中信息本质上所反映的态度、观点,以及信息在网络传播中的扩散演化,研究语义倾向性、意见挖掘、观点抽取、情感分析等。其中一方面是因为,在对舆情的分析研判中,诸如词云分析等的方式未必是准确的,在涉及词语感情、一词多意、反讽等具有个人语义情感的词汇时,舆情舆论的真实性需要进行进一步验证。另外一方面,则是传播模型的建立不应仅仅是基于大数据分析的,而应该更加关注人类语言与文字表达灵活性的若干表现上,以建立起科学有效的研究模型,进而对传播学、语言学、信息科学等领域的研究工作提供帮助。此外,本文研究的具体目标是通过对多关系社交网络中网络舆情模型的分析,结合网络舆情传播中的网络结构特点、心理学特点和传播学特点,构建包含个体社会属性的单层网络和双层耦合网络中的舆情演化动力学模型,进而分析网络舆情中的重要影响因素,完善和把握网络舆情形成、演化的机理及其规律,目的是为政府和企业的舆情监控和引导提供依据,丰富网络舆情管理的理论与方法。该研究将有助于认识在关系网络中的区域性舆情的演化本质特征,同时以期为线上线下耦合网络中的舆情演化动力学研究提供一些具有探索性的成果。无论是网络舆情研究还是社会网络分析,其作为各个学科继往开来发展所交汇的一个领域,各学科应努力相互借鉴相互吸收其他学科的理论研究成果、研究方法和研究思路,以本学科理论为基础展开研究[3]。正如架构在复杂关系网络中的网络舆情这样集成了大量复杂的社会、经济、政治、技术要素的复杂系统,仅仅以一个学科为主的解构角度是很难观测和诠释问题全貌的,需要在研究层面上使各个学科研究角度共融,在系统层面汇聚各个学科的方法论进行综合分析。钱学森在上世纪90年代提出的“从定性到定量的综合集成法”为我们提供了一种逻辑框架严密、研究路线清晰的系统方法论[3][3][3]传播模型的主要研究现状关于舆情舆论的研究远在古代就有研究记载。随着技术迅速发展,网络舆论的影响力爆发式增长,不仅是社会科学中新闻传播学政治学的关注重点,也不断吸引着计算机科学、系统工程学、心理学的广泛关注。作为一个跨学科的复杂问题,各个学科都立足于自有的理论基础和研究方法开展了大量的研究,其总体思路基本都是用可量化的方式去把握舆情传播的状态的,科学划分要素并建模分析传播的机制和路径。在谈及何为网络舆情时,不如先从“何为舆情”入手,在我们了解到舆情的定义时再来认识网络舆情将更有助于我们把握其深层含义。根据现有文字记载,“舆情”一词的使用最早在我国唐代出现——“格论思名士,舆情渴直臣”出自李中所作的《献乔侍郎》一诗,从这句诗中可见最早出现的“舆情”一词的含义并非等同于现今使用的含义。“舆”与“情”两字的连用,最初是指百姓的情感、情绪。在《新华字典》中,也采用了这个解释,认为是老百姓的情感和社会情绪1。在了解了舆情的定义后再来认识网络舆情可能就容易得多,“网络舆情”顾名思义就是架构于互联网络中的舆情信息。网络舆情是在高兴互联网技术的刺激下产生的既联系于又区别于传统舆情学的一个新型交叉学科。网络舆情联系与传统舆情之处在于:舆情的八要素一个也不少的契合与网络舆情;一是舆情的主体依旧是公众本身,公众是自由的、对外部社会有一定的共同知觉,或者对具体的社会现象和问题有相近看法的人群;二是舆情的客体依旧是各种社会问题与现象;三是舆情的本体体现的仍是主体对客体的态度、意见和情绪的总和;四是舆情的数量,即表现为舆情的一致性程度;五是舆情的强烈程度;六是舆情的持续性表现依旧为存在的时间长度;最后是舆情的功能表现和质量。这把八要素在网络舆情研究中仍是基础性要素,决定了舆情研究发展的基底。网络舆情又有区别于传统舆情的一面,从主体上来看,网络舆情的主体是使用互联网的网民,而互联网的准入门槛必定限制了一部分普通公民对特定事件的意见表达,由此可以猜想,网络舆情是否真正能够代表民意?网络舆情的价值是否能够为现实社会治理提供有效信息?从环境来看,互联网看似是一个开放的大环境,但在大环境下依旧是由用户的各种社会关系组成的子网络构成,在各种关系网络中,网民必定受到群体压力的影响,意见表达也并非完全服从于本人的内心,正如德国学者诺依曼所提出的“沉默的螺旋”一样——一种声音的大声疾呼将导致另一种声音的沉默,这种关系如同螺旋一般发展。从对比来看,网络舆情是传统舆情的发展,但又在很大程度上区别于传播的舆情,充满了更多和不确定因素。2.1生成和演化机制的模型在研究网络舆情的理论基础层面上,传播学、社会学和政治学的学者主要对网络舆情内涵的界定进行了相关的讨论,以及舆情生成及其演变的特征规律进行了较为细致的研究。时至今日,对舆情和网络舆情含义的具体界定学界依旧无法给出同一的答复。在中国,舆论和舆情是有所不同的,舆论是人们公开表达并得到绝大多数人赞同的言论;而舆情更加强调的是“情”,是否公开表达是不一定的,“舆论”是外化的“舆情”,是舆情的一部分。而在美国,舆论和舆情基本是没有界限的,统称为“publicopinion”,强调的是“公众的意见”。2.1.1传播演变的变化阶段研究社会科学研究的重点是在线舆论传播模型的分析和传播。它从不同的角度划分了在线舆论传播阶段,并提出了“潜伏期、扩散期和回归期”这三个阶段[3]、“起伏、跌落、顺序变化、冲突和衰退”这四个阶段、[4]“潜伏期、萌动期、加速期、成熟期、衰退期”的五个阶段”[5]“潜伏期、成长、扩散、爆发、衰退和死亡的六个阶段[6]模型。多阶段模型[7]描述了舆论传播的演变特征并调查了可能的背景原因,但未能解决识别里程碑信号的问题,在每个阶段通过现有状态以及背景问题很难分析和预测下一个状态以及在此阶段可能的趋势。2.1.2传播演化的内在研究在风险社会理论、社会燃烧理论以及群体性极化理论等一些理论支持下,学者试图总结网络舆论的传播特征[8],包括羊群效应,蝴蝶效应,六维空间理论、长尾效应等。有针对性的着眼于网络危机事件、网络群体事件和网络谣言的产生和演变机制[9-11],文件[12]定义了群体的概念内涵,典型构成要素和阶段特征突发事件文献[13]从网络舆论的角度解释了群体事件的构成要素,特征和类型。文献[14]定义了网络谣言的概念并分散了其原因。文献[15]列出并分析了互联网谣言的盲目主题分类、生成机制、沟通机制和社会危害。2.2信息传播模型为了网络舆论的未来发展趋势的掌握和预测,在传播机制和兴趣衰减等规律的基础上,一些以计算机科学和管理学为代表的研究人员开始沿着网络走社会研究的道路。网络分析舆论,从微观上观察它,着眼于在通信过程中反映在信息本质中的态度和见解,以及网络传播中信息的扩散和演化。对信息本质的研究主要是语义分析,语义趋势研究、观点挖掘、观点提取、情感分析等。在扩散和演化的研究中,我们主要使用复杂网络分析、动力学模型和传染病模型来量化多个影响因素,并将其与信息集成以分析网络结构。涉及的多个影响因素包括网络拓扑特征和信息可信度,主题属性,信息提供者的权限和影响,受众的关注度和兴趣度等。现今研究复杂网络上的传播模型主要集中在仓室模型(也称为流行病传播模型)和阈值模型等。通常研究此类问题是为了达到这两个目的:(1)研究复杂网络拓扑结构对网络上的传播过程的典型特征,如传播临界阈值,传播速度,规模等的理论影响;(2)通过理解复杂网络上的传播过程,设计目的性驱动的控制策略。比如最小化网络上流言的传播或最大化传播的范围。这些研究的基础性结论在《网络科学导论》等介绍复杂网络理论的中外著作中都会有相应的介绍。2.2.1社会网络分析的基本理论社会网络的概念早在1954年就有相关学者提出过,在最初这一概念是用于解释文化是如何规范有限群体内部成员在群体压力和社会化心理作用下的行为的。社会网络是由个体之间的社会关系构成的,形成相对稳定的网络系统,有许多不同的节点(包括个人或组织),反映着社会关系的基本结构[16]。由此将社会网络的概念投射到网络社交平台上,社交网络能真实地反映社交媒体中信息共享与传播的人际关系结构,其中每个用户都可能是关键节点,这些“节点”对后续信息传播的影响力与其自身社会网络的广泛性以及夹杂在该网络上的其他节点的影响力高度正相关。据此来看,不同“个体节点"之间的相互连接共同组建而成的网络,共同支撑了整个网络的行动。每个节点既可是内容的创造者接受者与传播者,也可以藉由共同兴趣爱好,联系到更多的相似网络用户群,从而形成更大的网络节点,使信息传播更广泛[17]。社会网络分析3.1基于复杂网络的社交网络分析复杂网络理论是理解和分析大规模社会系统的有效工具,被广泛用于理解和解释复杂系统的结构和动力学。在复杂网络理论中,节点代表个体,边缘代表个人之间的某种社交关系(例如朋友,敌人,合作等),如图1所示。因此,在线社交网络可以用无向图表示(例如微信,Facebook,人人网等SNS网络)或有向(例如Twitter,新浪微博等媒体偏向网络)。其中,无方向性社会网络的结构相对简单,相关研究相对成熟,表征其特征的指标定义相对全面。常用的是节点中心性、模块性、异构性等[17]。相对而言,有向社交网络的结构更为复杂。除了需要重新定义无向图中的指标外,还有许多指标专门描述了有向社交网络的宏观特征的指标,如影响力和互惠性等其他。这些用于刻画社交网络特征的指标体系共同构成了研究社交网络结构的基础。胡海波[18]对大型社会系统的拓扑结构进行了深入研究。Doerr等[19]发现社交网络上谣言的传播和传播明显高于其他拓扑特征。方锦消等[20]评论了“博客-微博”网络的特征,并分析了其对网络通信的各种影响。Huang[21]发现个体问题在社交网络中的影响不是一成不变的,而是随着个体之间互动的沉默时间间隔的增加,幂律衰减,以及一种更有效的信息传播预测算法。Yang等[22]分析了微博签到数据,以进一步证明个体和群体空间行为模式之间的差异。图1网络结构表示方式示意图(a)表示一部分图,图中只有一类节点;(b)表示二部分图,包含了两类节点:用户节点和对象节点,连边只存在于用户节点和对象节点之间:(c)表示一般意义上的超图,每条超边可以包含不同数目和种类的节点。3.2基于社会网络的信息传播动力学社会网络中的信息传播动力学过程是在线社交网络研究的核心问题之一。近年来,基于社会网络的疾病和信息的耦合传播、商品信息发布与扩散、谣言传播、舆情控制、情绪和行为扩散等问题吸引了学界和工业界的广泛关注,这类问题的研究綦础就是传播动力学机制分析网络拓扑结构被认为是影响网络传播过程的关键因素引。同样,网络传播也可以反映其结构特征(如图2所示)图2真实事件的传播网络和社交网络结构对比~(c)分别为某真实事件传播链网络结构;(d)-(f)分别为对应的社交网络结构。其中,(a)与(d)为同--事件,(b)与(e)为同一事件,(c)与(f)为同一事件(a)目前,大多数网络传播动力学相关研究主要基于经典的流行病传播动力学模型9.以比较流行的SIR模型为例,其基本思想是于随机马尔科夫随机过程。即每个节点存网络中任意时刻处于三种状态之一:易感态(Susceptible)、感染态Infected)、恢复态(Recovered)。在流行病传播的任意时刻,一个易感节点(S)可以被任意一个感染态节点(I)以概率a感染,一个感染态节点(I)以概率u康复且变成终生免疫的恢复态(R)。在SIR模型。节点状态演化过程为S->I->R或一直保持S状态。当传播过程结束(即稳态)后,网络中只存在S和R两种状态节点。那么,在随机规则网络(所有节点度均相等)或者均匀网络(节点度分布服从泊松或正态分布)可以用微分方程形式来表达这一动力学过程。其中,S(t),I(t),R(t)分别为t时刻网络中分别处于S,I,R三种状态的点比例。(k)为网络所有点的平均度。研究结果表明,信息存小世界网络上的传播存在临界值,且传播速度和广度都远远高于规则网络。而在社交网络中,高影响力节点的存在可以大大提高信息传播效率。潘灶峰等[23]通过在可变聚类系数的无标度网络上研究谣言传播,发现可以通过增大网络聚类系数来有效地抑制谣言传播。网络中适当的社团结构可以提高信息传播范围。但随着社团强度的增大,信息传播却会受到一定程度的抑制。耦合网络结构在刻画社会网络上的独特优势,使得耦合网络上的传播动力学的相关研究也得到了广泛关注。此外,在信息传播过程中,此外,在信息传播过程中,关键节点的影响力挖掘研究具有很强的理论和现实意义,单源乃至多源传播过程中的关键节点的识别,都引起了学界的极大关注。“信息”的特征和属性是信息传播疾病传播研究的最大区别,这很大程度上丰富了信息传播的研究内容,同时也增加了信息传播动力学研究的难度。3.3信息传播的预测和控制信息传播动力学研究的一个重要目的,是对真实系统的信息传播行为进行预测和控制。目前这方面的研究,主要是围绕着基于社交网络结构的信息传播过程预测和基于信息扩散的网络结构反演这两个问题展开。学者们基于对真实社交数据的分析和挖掘,通过构建基于信息路径的概率模型和对用户偏好、属性等特征提取,提出了一系列研究大规模在线社交网络信息传播的方法,如信息传播级联预测模型,基于广义泊松过程的转发动力学模型,基于用户相似性的推文转发模型。同时,新闻的来源、所属类别、作者的观点对其传播也会起到关键作用。利用机器学习中的支.持向量机(SVM)回归模型对新闻流行度可以达到84%的预测准确率。Zhang等发现在用户的自我关注网络(egonetwork)中,如果有6个社交好友转发了某博文,那么该用户转发此博文的可能性强依赖于这6个好友之间的拓扑结构一-即当这6个好友相互认识时,该用户转发此微博的可能性要低于当他们相互不认识时。Myers等发现在Twitter网络中,重要事件的传播可以导致其对应社交网络的爆炸性改变,并提出预警模型用于预测某事件的传播是否会造成网络拓扑结构的巨变。第四章模型建立4.1微博网络中的信息互动模式该建模以新浪微博()作为研究对象。新浪微博是目前我国规模较大的微博网站之一,其大部分特征与Twitter类似,但在评论模式、图片转发模式、审查制度以及媒体资源等方面,与Twitter相比也存在一些差异。因此对新浪微博的分析更能反映我国微博用户的群体特点。图3微博网络中的信息互动模式在新浪微博中,每个用户都拥有“关注者”和“被关注者”两种角色,“关注者”也称为“被关注者”的“粉丝”(如图3)。如果将每-个注册用户看作是微博网络中的一一个节点,则网络中的边表示用户之间的关注关系。新浪微博的信息互动模式如图1所示,其中“实线”表示节点之间的关注关系,“虚线”表示话题信息的传播方向。由图中可知,用户B、C.D关注用户A,用户B
.D关注用户C,用户E关注用户D。当用户A发表一则舆情话题后,用户B、C、D会同时接收到该微博信息,并根据对话题内容的兴趣程度、个人信息偏好及用户A对各自的影响程度,来决定是否对该条微博进行转发。如果用户C转发了该条微博,则用户B、D将再次接收到该条微博信息,而用户E也因为用户D的分享,获知了该条微博信息。此外,一旦某个微博用户发表了话题信息,除非强制删除,否则该话题会在其微博个人社区内长期显示,即该用户的发帖状态是无法改变的。因此,即使该用户已经不再关注此话题,其所有的“粉丝”却仍旧有机会阅读到其所转发的话题信息。4.2SIR模型
传染病动力学是通过建立传染病的数学模型,来模拟传染病的传播过程,进而预测传染病的爆发及传播规律。在传染病动力学研究中,SIR模型是最为经典、应用最广泛的“仓室”模型之一,其演化规则可以描述为:
.
(1)易感个体以传染率(也称为日接触率)
λ被某个感染个体所感染,并从易感状态转变成为感染状态。(2)处于感染状态的个体以免疫率(也称为日治愈率)y被治愈,并获得免疫能力。
(3)设S(t),I(t),R(t)分别为t时刻易感个体。感染个体以及免疫个体在种群总人口中所占的比例,即三类不同状态个体的密度,则S(t)+
I(t)+
R(t)=1。SIR模型可以用以下微分方程组(1)进行描述:(1)4.3微博网络中的舆情话题传播模型
本文基于SIR模型,构建了微博网络中的舆情话题传播模型,并在模型中引入了一个新的状态一接触状态,以描述通过与其他微博用户的接触而获知某个目标舆情话题,但还未对该话题进行转发时的用户状态。因此针对某个目标舆情话题,可以将全部的网络节点分为以下四种状态:易感状态s
(Susceptible),接触状态C
(Contracted),传播状态I
(Infected
)和免疫状态R(Recovered)。易感状态是指用户从未通过任何渠道获知目标舆情话题,即对该话题信息处于完全未知时的状态;接触状态表示用户已经通过其他用户的转发而获知了目标舆情话题信息,但还未转发该话题信息时所处的状态;传播状态是指用户已将目标輿情话题转发给了自已的“粉丝”时所处的状态;免疫状态是指用户已经完全对目标舆情话题失去兴趣,并且将永远不会对其进行转发时所处的状态。
基于4.1节描述的微博网络信息互动模式,可以得到上述四类节点的状态转变过程,如图4所示。图4微博网络中的舆情话题传播状态转变图当易感节点s接触到一个传播节点I,则该易感节点以概率Poe转变为接触节点C,pse称为内部接触概率。
(2)易感节点S可以通过某种外部渠道,如新闻媒体、虚拟社区、即时通信以及现实社会网络等获知目标舆情话题,并以概率a转变为传播节点I,
a称为外部影响概率。
(3)接触节点C以概率Pa转变为传播节点I,pa称为接触节点C对目标舆情话题的转发概率。
(4)接触节点C以概率Pa转变为兔疫节点R,per称为接触节点C对目标舆情话题的直接免疫概率。
(5)传播节点I以概率Pr转变为免疫节点R,pi称为传播节点I对目标舆情话题的免疫概率。
(6)免疫状态为网络中的吸收状态,即进入免疫状态的节点,其状态不再发生改变。
(7)假设话题传播过程中,不考虑微博网络中用户的迁入及迁出,即网络中的总人口数不变。
研究表明,社交网络上的信息传播动态过程与节点的度密切相关凹。因此,本文定义N(k,
1)为t时刻网络中出度为k的节点总数,则S(k,
t).C(k,t).
I(k,
t).
R(k,t)
.分别表示t时刻网络中出度为k的易感节点、接触节点、传播节点及免疫节点的密度,即上述四类节点的数量分别在N(k,t)中所占的比例,则S(k,t)+C(k,t)+I(k,t)+
R(k,t)=1。因此,本文以SIR模型为基础,构建了基于SCIR(Susceptible
Contacted
Infected
Removed)的微博网络舆情话题传播模型,如式(2)所示:(2)其中θ(t)表示t时刻网络中任意一条随机边与传播个体相连接的概率,设P(k)为微博网络的度分布函数,
<k>为微博网络的节点平均度,则(3)假设微博用户一旦发布了舆情话题信息,其所有的“粉丝”用户均可以看见该信息,即忽略了由于网络的意外情况及用户的个人行为而造成的信息遗漏,则上述第-一个规则中的概率ρsc=1。
结论本文从传播学的角度,考虑社交网络中传播主体间存在的多种关系对舆情传播的影响,建立与实际情况更为符合的网络舆情传播模型,重现网络舆情在真实互联网上的传播过程链。对从社会网络软件取到的数据集进行大数据分析,从中得到用户间不同关系对于舆情传播的影响参数估值.基于此,本文基于一个复杂的多子网复杂网络模型构建了一个多关系的社会舆论传播模型,并分析了各种模型参数的变化对传播过程的影响,信息传播模型的仿真,并发现网络的舆论的规律以及影响舆情传播的主要因素,从而为社交网络中的舆情预测与危机管理提供理论支撑.针对现实互联网中,舆情信息传播往往是在多个社交网络中同时进行的这一现象,应该研究舆情信息在多个社交网络中的传播规律,建立起多个社交网络中的舆情传播模型.这些都是下一-步的研究方向。此外,通过这次研究也发现了这些舆情传播模型甚至与信息科学在发展中存在的一些问题。以舆情传播模型来说,我们提出与建立的模型在很大程度上都是基于“完美”数据下分析得出的,而这样“理想”且“完美”的数据在日常生活和网络世界并不是一以贯之的。很多文字数据和网民情绪反应都存在不确定性与突发性。以本次研究的一次数据抓取为例,在今年4月初时,本人通过采集器对去年十月的热点事件——“李心草溺亡事件”进行抓取与分析。对抓取后获取到的进15000条相关微博进行筛选与过滤,排除“吃人血馒头”和其他杂质性内容后获得12365条较为有效的数据内容,在对清洗过的数据进行模型建立分析后所得结论与其他作者研究结论大相径庭。通过后期的检查得出,造成此次问题的原因就是新闻学中常常论及的“舆论搭车效应”,即某一重大舆情聚集了大量公众注意力,举报人借机寻求自身问题的解决,因此与此地域相关的、以往不被关注的隐形问题集中爆发在公众视野。在四月初时“山东国企高管鲍毓明性侵养女案”登上新浪微博热搜榜单,并一连几天“霸占热搜榜”。当“年轻女生”、“性侵”、“国企高管”等敏感字眼出现在公众面前时,必定会引爆舆论,成为网民讨论的热门话题。由此,在此次的抓取中“李心草事件”的相关记忆又一次被牵扯出来,相关热度也出现了反弹迹象,即使在事件发生半年过后依旧处于“反复期”。在此次数据处理出现问题后,本人又于四月下旬对“李心草事件”相关舆情舆论再次进行了抓取与处理。由于“鲍毓明性侵案”所引起的“关于提高性自愿年龄”、“年轻女性自我防卫”和“女性主义的崛起”等相关热门讨论又再一次带起了“李心草事件”的热度,网民发表的相关新微博数量再一次爆发式增长,相关舆情出现了新的“病毒式传播”。在“李心草事件”发生半年后的一个月内舆情就出现了两次反复。因此,在当今互联网高速发展的时代,仅仅依靠理论传播模型来描述与治理网络社会必定会显得力不从心。在这样的情况下,若想要治理好互联网,就要更多的从社会科学的研究方法中汲取思想,比如将信息科学研究中常用的定量分析与社会科学研究中常用的定性分析相结合。简单地只利用一种方法做研究就会陷入“不全面”的泥潭之中。因此,在网络舆情这样更多涉及到社会人文的课题时,引入定性分析可以更好的反应人类社会学中的复杂之处。研究方法的融合也是各个学科跨学科发展的源头,促进学科间的良性发展和竞争。谢辞经过导师的热情帮助以及耐心指导,我才得以顺利完成本文。在此过程中,导师对我产生了很大影响,不仅是因为其渊博庞大的知识储备,还有其一丝不苟的学术精神以及平易近人的态度等等。这些使得我能够快速确立论文写作目标以及研究方式,并且有条不紊地完成所有工作。不管是论文题目的最终确立还是写作流程的拟定等等,都离不开导师的指导和帮助,这些工作也消耗了导师较多精力,在此我向导师表达最真诚以及最深挚的谢意。
另外,本论文能够顺利完成,不仅要感谢我的导师,还应当感谢我的室友,不管是论文开题阶段,还是之后的实验开展与写作阶段,室友都给予我诸多帮助,比如在与同学的讨论中,我能够快速打开论文的写作思路,在我对实验步骤一直不明确的时候及时与我沟通,给我讲解他们对此次实验的想法和见解。最后,我向本专业的全体老师表达最真挚的谢意,感谢老师对我的指导和帮助,使我能够顺利完成毕业,并且进入新的世界,站上新的平台。
参考文献[1]张子柯.在线社交网络信息传播机制与动力学研究综述[J],
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025至2030盲盒玩具商业模式创新与消费者心理分析报告
- 为白血病幼儿捐款倡议书
- 2026中国小品种维生素市场竞争态势与营销趋势预测报告
- 纳米传感器阵列
- 2026-2030中国免动力涡轮换气扇行业市场发展现状及发展趋势与投资前景研究报告
- 代理销售产品合同
- 2026全球及中国超声波热量计行业现状动态与投资前景预测报告
- 2025-2030智慧加油站服务升级运营方案与客户忠诚度提升分析
- 2025-2030智慧农业装备行业市场现状供需分析及投资评估规划分析研究报告
- 2025-2030智慧农业行业市场现状需求分析投资评估规划发展研究报告
- (高清版)DZT 0214-2020 矿产地质勘查规范 铜、铅、锌、银、镍、钼
- 有关锂离子电池安全的基础研究课件
- 人工智能与计算机视觉
- 口腔材料学课件
- 盐酸凯普拉生片-临床用药解读
- 中建综合支架专项施工方案
- 医院财务制度专家讲座
- 2023年北京市中国互联网投资基金管理有限公司招聘笔试题库含答案解析
- 中控ECS-700学习课件
- 2023年上海市杨浦区中考一模(暨上学期期末)语文试题(含答案解析)
- 甲状腺病变的CT诊断
评论
0/150
提交评论