微博的数学建模作品.doc_第1页
微博的数学建模作品.doc_第2页
微博的数学建模作品.doc_第3页
微博的数学建模作品.doc_第4页
微博的数学建模作品.doc_第5页
已阅读5页,还剩5页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

微博网络结构模型及其对应的微博传播形态 摘要微博作为一种新兴的交流工具,以简单快捷的操作方式、随时随地发布信息的互动形式,在各类网络社交服务中独树一帜。微博在人与人之间是如何传播的,微博在微博网络中的扩散速度和扩散形式是怎样的,微博的发展对我们提出了新的问题。本文通过建立简单树模型对微博网络进行局部建模,通过复杂树模型对微博网络进行整体建模,通过微分方程模型从微博人数角度预测微博传播趋势,最后建立了三元模型精确模拟微博在微博网络中的传播。通过转发次数对时间的导数表征微博的“火”的程度,最终通过这些模型,可以根据一条微博初期转发情况,预测这条微博在未来的传播情况。关键词:微博网络结构、微博传播形态、树模型、微分方程模型、三元模型问题的重述总体来看,一个社会对应着一个相对稳定的微博网络,这个微博网络的结构不会在短时间内发生巨大的变动。将微博网络结构当做黑盒,输入一条微博,输出这条微博在t时刻之前的转发次数,由于黑盒结构较为稳定,所以对于同一个微博网络,一条微博的内容是决定了这条微博在这个网络中的传播形态的最主要因素,而其他因素大多是个体差异,对微博传播形态影响不大。在一条微博开始传播的一小段时间内,我们可以利用统计学原理求出这条微博的转发率,即当微博网络中的一个节点见到这条微博后转发它的概率。根据微博初期的转发率,结合微波网络结构本身的特性,我们可以预测出这条微博的传播形态。 模型假设(1) 可以由人们对这条微博在单位时间内的转发次数表征。在短时间内,微博网络结构不会发生巨大的变化,即不会有大量节点突然消失或突然出现,也不会出现大量节点突然与同一个节点相关联或失去关联的情况。(2) 一条微博“火”的程度由人们的关注度决定,而人们的关注度由人们转发速度来体现。(3) 人们对一条微博是否转发取决于人们对这条微博内容的关注,而与名人效应、随大流、恶作剧等其他心理作用无关。(4) 一条微博对应着一个事件,微博网络中的各个节点都有与这个事件相对应的转发率,即这个节点见到这条微博后转发的概率。(5) 在微博网络中,节点与节点之间是单向的。在一个人转发微博后,这个人的全体粉丝都能看到这条微博并决定是否转发,而非粉丝无法通过他来看这条微博。(6) 在一个人转发过某条微博后,再次见到该微博时他将不会转发它。(7) 由于一条微博转发之后,其粉丝会在较为相近的时间内决定是否转发它,所以可近似认为其粉丝会同时决定是否转发。(8) 转发次数可以是浮点型数据,如某人转发了0.8条微博,表示这个人转发这条微博的概率是0.8.由于微博网络结构中节点众多,根据大数定律,大量的节点最终总体上会表现出统计学的行为,所以这条假设在微博网络巨大的条件下是很合理的。变量说明 A,B,C:微博对应的确定事件,也可以说是微博本身; 1 ,2:微博网络结构1,微博网络结构2; p1(A),p2(B),p3(C):第一个人第一次见到A事件后转发它的概率,第二个人见到B后转发它的概率,第三个人见到C后转发它的概率,p1(A)0,1; iA=f(t):对于微博A,整个微博网络从0时刻到t时刻转发的次数之和,每当网络中发生一次转发,iA=iA +1;hA=f(t):对于微博A,在t时刻附近,单位时间内f(t)的变化率,它表征这条微博“火”的程度,也就是在t时刻人们对它的关注度,h取汉字“火”的首字母;s:微博网络中节点的总数;m:微分方程模型中微博临界转发数m=rs,r为系数。建模准备微博传播分成两大块:微博本身的内容及微博网络结构。为了刻画微博的传播,我们定义微博传播形态的概念:把微博单位时间内转发的次数对应的函数hA(t)叫做微博的传播形态,它表征了微博在微博网络中的流行程度、人们对这条微博的关注程度。用图论知识描述微博网络,每个人相当于一个节点,节点A是节点B的粉丝,则以一个从B指向A的有向线段将二者连接。这样就得到了一个有向连通图,人与人之间的信息传递通过节点与节点之间的有向边传播。模型的建立和求解一、简单树模型的建立和求解微博网络结构是一个复杂的结构,要想简化问题,必须从简化微博网络结构入手。在微博网络结构中,存在大量的节点密集区,并且这些节点密集区围绕着某个中心展开,比如某个名人的微博、某体育论坛、政治论坛等信息中心。我们选定一个中心及其周围节点群作为研究对象,把这个局部网络简化为树模型,用图论知识简化微博网络。每个人相当于一个节点,节点A是节点B的粉丝,则以一个从B指向A的有向线段将二者连接。这样就得到了一个有向连通图,由生成树定理知,任意一个连通图至少对应一个最小生成树。树是最简单的图,所以我们将微博网络结构抽象为树。为了便于计算,假设树模型中每个节点有相同的出度且入度为一,即每个节点有相同的粉丝数且这个节点是一个节点的粉丝,每个节点是等价的。若树中每个节点都有3个粉丝则称这个简单网络为3度树,每个节点至多一条路径从一个节点到达特定节点,称从节点A到节点B所经过的边数叫做A与B之间的距离。从中心信息源开始,微博会在节点之间传播,像涟漪一样一圈一圈荡开去。第一次传播,与信源节点距离为1的节点收到微博,记这次传播过程中转发微博次数之和为g(0)=1;第一轮传播,与信源距离为1的节点作为新的信源以一定的概率转发微博,记第一轮传播中转发次数之和为g(1)=p1(A)+p2(A)+p3(A).+pn(A),n表示该网络是n度网络,p1(A)表示节点1对于事件A转发的概率,这个概率可以通过小样本空间求出。对于一个节点群,他们通常有类似的性质,即这个节点群中每个节点转发这条微博的概率趋于一致,p1(A)=p2(A)=p3(A)=.=pn(A),那么g(1)=np。类似的,g(2)=n2p(A)2,第二轮传播有n2个人决定转发还是不转发,这些人能收到微博A的概率为p(A),这些人转发这条微博的概率为p(A),故g(2)=n2p(A)2;第三轮传播g(3)=n3p(A)3.从第一轮到第k-1轮转发过的次数 式中,np1.n表示这是一个n度网络结构,p表示p(A),即每个节点第一次转发它的概率,k表示从微博出现开始到微博传播的第k-1轮,f(k)表示这条微博被转发的次数。h(k)=f(k)=结合图像及对式子1,2的分析知,当np1时,微博的流行程度指数级上升,迅速的扩散出去。如图转发率为4%的一条微博在30度树中迅速传播,在传播80轮后就已经有成千上万的人转发过这条微博,然而这个树中的人数却未必就有这么多,这是这种模型所忽视的情况。通过这个模型可以初步看出,n和p两个变量决定了微博的传播形态。n表征微博网络结构,p表征微博事件本身,这种结果正好和假设相符:微博的传播形态取决于微博网络结构本身和微博本身的性质。但是,这个模型是对微博网络局部的模拟,所以,为改进之,我们建立了复杂微博网络模型。二、复杂树模型 以上简单树模型是对微博网络局部结构的建模,而在实际中,微波网络结构是由一个又一个的节点群构成的,这可以看做是许多简单树的拼接、组合,它的各个局部子网度数各异,各个子网之间联系相对较少,但这些联系足以使信息得以在子网之间传播。根据两个网络之间联系的紧密程度,可以乘以一个系数表示初始时传入该网络的微博信息强度。下式中,f1(k)为n1度简单树1的传播函数,f2(k)为2的传播函数,。 f1(k) 当kk0时f(k)= t1f1(k)+t2f2(k) 当k0kk1时 t3f1(k)+t4f2(k)+t5f3(k) 当k1kk2时 . 上式中,实际意义是:在一条微博传播的初始阶段,此微博在它的简单树中传播。传播到一定阶段时,这条微博以一定的初始强度系数t2传播到其相邻的树结构中,同时考虑到简单树中节点个数有限,微博在原树中也乘以系数t1进行传播。求导即得微博“火”的程度函数。 h(k) 当kk0时h(k)= t1h1(k)+t2h2(k) 当k0kk1时 t3h1(k)+t4h2(k)+t5h3(k) 当k1kk2时 . 为了便于说明问题,下面以9度树和4度树组合而成的网络为例进行微博传播形态分析。假设微博从4度树中发出,传播50轮后进入9度树,进入时信号强度为t2=0.6,之后t1=0.1。 当k50时f(k)= 当50k时三、微分方程模型的建立与求解 在上述模型中,是通过建立微博网络来实现的初步模拟。在这个微分方程模型中,只是从总体上估计微博的传播形态。显而易见,微博中节点的个数是有限的。当转发这条微博的人数小于某个数值时,这条微博“火”的程度与转发过这条微博的人数呈正比;当转发过这条微博的人数小于某值时,这条微博“火”的程度与转发过这条微博的人数成反比。 s表示节点总数,即人的个数,rs为转发临界值。则当f(t)rs时,h(t)=f(t)随f(t)增大而减小。描述这一现象最简单的函数就是二次函数。所以,我们构造了如下方程: 在这个方程中,f(t)表示已经转发过的人数,rs表示临界值。因为转发这条微博的人数f(t)不会超过节点总数,微博单位时间内转发次数f(t)不会比0小。所以这个方程只在f(t)0且f(t)1,mm-1.在式中,把h(0)=1,f(0)=1带入,得k=/rs-11/rs=1/m.故得方程: 下图为m=1000,p=0.4时微博转发次数随时间的关系。求导即得微博传播形态函数:类似于从简单树模型到复杂树模型的过渡,我们不难得出多个群体、多个信息中心情况下微博传播形态公式: 其中,m1、m2为微博网络局部子网的节点个数,求导得h(t)。四、三元模型 综合以上全部讨论,可以明确思路:微博的传播形态取决于微博网络结构和微博本身的内容(人们转发这条微博的概率)。以上模型都是局部的、片面的刻画微博结构,下面用矩阵和向量来用计算机模拟微博传播过程。对于一个微博网络结构,假设它有s个节点,对这些节点从1到s进行编号。用图论中节点对节点的表示法来刻画图,这个矩阵有s行s列,记这个矩阵为aij,称之为微博矩阵。同时用aij表示这个矩阵第i行,第j列元素。这个矩阵的建立通过如下公式求得: aij= 1 i是j的粉丝(i是可以直接看见j的) 0 i不是j的粉丝构造s维向量(p1,p2.pn-1,pn).这个向量中,pi表示第i个人见到这条微博时转发它的情况: 1 只要i见到这条微博,就一定会转发它 pi= 0 i不可能转发此微博这个向量叫做此微博网络的概率向量,由于现实中人的行为是离散的,不会以概率的形式去转发微博,在这个模型中,i是根据对每个节点长期分析得出每个节点的兴趣爱好,从而估测节点i是否会转发这条微博;再构造s维向量(1,0,1.0,1),若i=0,表示节点i没有见到过这条微博,若i=1,表示节点i见到过这条微博,把这个向量叫做此微博网络的传播向量。微博在整个网络中的传播可以用这一个矩阵和两个向量计算模拟,对三大表征量进行运算,每次运算后向量的各元素之和或者说|2就是微博转发次数,也就是f(k)=|2.在这三个0-1序列中,微博矩阵是对微博网络结构的刻画;概率向量是对微博用户群(每个节点)的刻画;传播向量是对微博动态传播的刻画。定义这三者之间的运算:(1)aij:j:表示从微博矩阵中提取第j列元素构成一个含有s个元素的行向量。意义在于:如果第j个人转发了微博,i= 0 第i个人通过j可见这条微博 1 第i个人无法直接通过j见这条微博 (2) =&:用于求这一次运算此人是否可转发此微博,实际上就是两个向量运算得到第三个含有s个元素向量,运算方式如下: i= 1,令i=0. 当i为1且i为1 0 当i不为1或i不为1i表示i节点i节点对此微博的可见性,i表示i节点见到后会不会转发这条微博。当且仅当,见到微博并且i节点想转发此微博时,i=1,表示i节点转发过这条微博。根据假设,同一个人不会对同一条微博转发两次,所以一旦i=1,就必须将i置零,表示i再次见到这条微博时转发它的概率为0.(3) +=:表示这次运算中各个节点对这条微博的转发情况,表示过去各个节点对这条微博的转发情况,为了更新转发向量,需要此运算。这个运算就是向量加法:=+。(4) -f(k):k表示第k轮运算,也就是微博转发的第k轮。根据转发矩阵得出f(k)=|2即转发过这条微博的人数。这三大部分以下述步骤进行运算:(1) 确定微博矩阵aij,也就是确定微博网络结构,确定粉丝关系。将传播矩阵置零,意思是现在无人转发过微博。(2) 某个人(对应第j个节点)写了一条微博,则j=1.(3) 根据统计学,结合每个节点过去一段时间的兴趣爱好,估计概率矩阵。(4) k=1;(5) i=1.(6) 若i=1,则执行(6);否则执行(7)。(7) 执行三步自定义运算aij:i;=&;+=;转向(7)。(8) i=i+1,如果if(k)。导出微博传播形态,第k轮转发结束。(10) 如果f(k)s,程序结束;否则,执行下一步。(11) k=k+1;转向第(5)步。 通过三元模型用计算机模拟微博转发极具可行性,运算简单,只需要通过迭代,就能得到函数f(k),其精确程度要优于以上模型。通过绘制f(k)的图像,便可得到微博转发过程中转发次数上升状况。用统计学知识求出相邻两轮转发之间的时间差t,便得到f(kt),用插值法得到f(t),求导便得h(t),可以预测这条微博的传播“火”的程度。 模型的评价在本文中,指导思想只有一个:微博网络结构和微博内容二者是影响微博

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论