(通信与信息系统专业论文)基于bosam的科学家合作网络拓扑分析与建模.pdf_第1页
(通信与信息系统专业论文)基于bosam的科学家合作网络拓扑分析与建模.pdf_第2页
(通信与信息系统专业论文)基于bosam的科学家合作网络拓扑分析与建模.pdf_第3页
(通信与信息系统专业论文)基于bosam的科学家合作网络拓扑分析与建模.pdf_第4页
(通信与信息系统专业论文)基于bosam的科学家合作网络拓扑分析与建模.pdf_第5页
已阅读5页,还剩49页未读 继续免费阅读

(通信与信息系统专业论文)基于bosam的科学家合作网络拓扑分析与建模.pdf.pdf 免费下载

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

中文摘要 摘要:科学家合作网络属于复杂网络中社会网络的一种。目自订对其拓扑结构的研 究还停留在统计特征的层面上,所建模型通常都集中于讨论如何更好地描述科学 家之间的合作行为。但直到现在,尚未对科学家的合作行为做出明确说明。 本文的研究成果如下: 1 ) 对目前针对科学家合作网络拓扑的相关研究成果做了分析,并以s k i t t e r 数 据和e r 模型为例说明了利用b o s a m 可观察到的网络拓扑特征。 2 ) 基于b o s a m 对凝聚态物理学科学家合作网络的拓扑特征进行了分析,从 静态的b o s a m 位图出发,发现了该网络节点合作行为的两个重要特征: i “择弱”规则:新节点在加入网络时,往往只能找到较弱的节点作为其 合作伙伴,而直接获得与较强的节点合作的机会非常小。该发现纠f 了以前人们 普遍认为该网络增长机制的“择强”规则的观点。 i i “门当户对”特征:即科学家合作网络中节点的合作行为不f 哩与节点本 身强弱有关,同时,这种合作行为也携带了节点的“背景”因素:节点“背景” 的强弱恰恰对应于其最强邻点的强弱,而且,“背景”强的: 了点,其合作者也往往 强于那些“背景”弱的节点的合作者。这种发现明确了科学家合作关系的潜在因 素,因而是对科学家合作行为更加清晰的说明。 3 ) 基于对科学家合作网络拓扑特征的分析,对科学家合作网络进行了拓扑建 模:本文的模型为一动态增长阿网络拓扑模型,在网络规模的增长过程中融合了 节点资历的变化。基于网络规模的动念增长,发现了科学家合作网络增长机制的 三个特征: i 新节点通过与某节点的合作,也间接获得了与该节点的合作圈子内最强 节点的合作机会; i i 新节点选择了较弱的合作者,而且这些合作者往往都非常弱,可以认为, 新节点根本无法获得与很强的节点直接合作的机会; i i i 与较强节点存在合作关系的节点,在其寻找其他的伙伴的过程中,往 往选择那些比自己强,但却与自己实力最为接近的节点进行合作。 该模型较好地模拟了科学家合作网络的增长机制和科学家的合作行为,证实 了本文在这些方面的相关推断,揭示了科学家合作网络和科学家合作行为的一些 基本规律。 关键词:b o s a m ;科学家合作网络;拓扑建模 分类号:0 1 8 :匕塞銮堑厶堂亟:堂位论塞垦墨i 基i a bs t r a c t a b s t r a c t :s c i e n t i f i cc o l l a b o r a t i o nn e t w o r k s ( s c n ) i so n eo fs o c i a ln e t w o r k so f c o m p l e xn e t w o r k s t h es t u d yo fi t st o p o l o g yn o wi ss t i l lo ns t a t i s t i c a ll e v e la n dp e o p l e a r ea l w a y sc o n c e n t r a t i n go nd e s c r i b i n gt h ec o l l a b o r a t i o nb e h a v i o ro fs c i e n t i s t s h o w e v e r , h o wd os c i e n t i s t sc o l l a b o r a t ew i t he a c ho t h e ri ss t i l lu n k n o w n t h e p r i m a r ya c h i e v e m e n t so ft h i sp a p e ra r ea sf o l l o w s : 1 ) t h er e s e a r c ho nt o p o l o g yo fs c ni sa n a l y z e d ,a n dt h et o p o l o g yc h a r a c t e r i s t i c s w h i c hc a nb eo b s e r v e df r o mb o s a mb i t m a pi si l l u s t r a t e db ys k i t t e rd a t aa n de r m o d e l 2 ) t h et o p o l o g yc h a r a c t e r i s t i c so fc o n d e n s e dm a t t e rc o l l a b o r a t i o n sa r es t u d i e d b a s e do nb o s a m ,a n dt w o i m p o r t a n tc h a r a c t e r i s t i c so fs c i e n t i s tc o l l a b o r a t i o nb e h a v i o r a r ed e s c r i b e db a s e do ns t a t i cb o s a m b i t m a p : i n e wn o d e sd on o tt e n dt oc o n n e c tw i t hs t r o n gn o d e sb u tt ow e a ko n e sw h e n j o i n i n gt h en e t w o r k i i a n i n t e r e s t i n gp h e n o m e n o n c a l l e d b y u s “c o m b i n a t i o no fs i m i l a r b a c k g r o u n d s ”i sd i s c o v e r e d i tr e f l e c t st h a tt h ec o l l a b o r a t i o nb e h a v i o ro fs c i e n t i s t si s c o n c e r n e dw i t hp o w e ra sw e l la sb a c k g r o u n d s ,t h a ti sn o d e sw i t hs t r o n g e rb a c k g r o u n d s t e n dt oh a v es t r o n g e rc o l l a b o r a t o r st h a nw i t hw e a k e rb a c k g r o u n d si nd e t a i l s i ti sam o r e c l e a re x p l a n a t i o no fs c i e n t i s tc o l l a b o r a t i o nr e l a t i o n s h i p 3 ) b a s e do nt h ea n a l y s i so ft o p o l o g yc h a r a c t e r i s t i c so fs c n ,w eh a v ec o n s t r u c t e d t h et o p o l o g ym o d e lo fs c n t h em o d e li n t h i s p a p e ri s ad y n a m i cg r o w i n ga n d e v o l u t i o n a r ym o d e l ,w h i c hw e l lc o n c e r n st h en o d e sp o w e rg r o w i n ga st h en e t w o r k g r o w s ,a n dt h r e ei m p o r t a n tc h a r a c t e r i s t i c so fs c ne v o l u t i o na r ed e s c r i b e db a s e do n d y n a m i cg r o w t ho ft h en e t w o r ks c a l e : i an e wn o d ec o n n e c t sw i t hs o m en o d ea sw e l la st h en o d e ss t r o n g e s t n e i g h b o r i i an e wn o d ep r e f e r st oc o n n e c tw i t haw e a kn o d e ,a n di td o e sn o th a v ea n y o p p o r t u n i t yt oc o n n e c tw i t hav e r ys t r o n gn o d e i i i t h en o d ew h i c hh a sa l r e a d yas t r o n gc o l l a b o r a t o rt e n d st oc o n n e c tw i t ht h e n o d ew h i c hi ss t r o n g e rt h a ni tb u t h a ss i m i l a rs t r e n g t ha si t t h em o d e lw e l ls i m u l a t e st h em e c h a n i s mo fs c ng r o w i n ga n ds c i e n t i s t c o l l a b o r a t i o nb e h a v i o r , s oi tm a k e si tc l e a ro nt h e s ea s p e c t sa n dt e s t if ys o m ec o n c l u s i o n o f u sa b o u ts c n k e y w o r d s :b o s a m ;s c i e n t i f i cc o l l a b o r a t i o nn e t w o r k s ( s c n ) ;t o p o l o g ym o d e l i n g c l a s s n 0 :0 18 v 学位论文版权使用授权书 本学位论文作者完全了解北京交通大学有关保留、使用学位论文的规定。特 授权北京交通大学可以将学位论文的全部或部分内容编入有关数据库进行检索, 并采用影印、缩印或扫描等复制手段保存、汇编以供查阅和借阅。同意学校向国 家有关部门或机构送交论文的复印件和磁盘。 ( 保密的学位论文在解密后适用本授权说明) 学位论文作者签名:盅协础 签字同期:加2 年月f 同 导师虢藏运。 签字同期:五溺年占月f pr 独创性声明 本人声明所呈交的学位论文是本人在导师指导下进行的研究工作和取得的研 究成果,除了文中特别加以标注和致谢之处外,论文中不包含其他人已经发表或 撰写过的研究成果,也不包含为获得北京交通大学或其他教育机构的学位或证书 而使用过的材料。与我一同工作的同志对本研究所做的任何贡献均已在论文中作 了明确的说明并表示了谢意。 学位论文作者签名:蓬他融 签字同期:如诺年月歹同 4 9 致谢 本论文的 :作是在我的导师郭宇春老师的悉心指导下完成的,郭宇春老师严 谨的治学念度和科学的工作方法给了我极大的帮助和影响。在此衷心感酣两年来 郭宇春老师对我的关心和指导。 陈常嘉教授对于我的科研工作和论文都提出了许多的宝贵意见,在此表示衷 心的感谢。 胡师舜老师在学习上和生活上都给予了我很大的关心和帮助,在此向胡老师 表示衷心的谢意。 在实验室工作及撰写论文期间,石慧珠等同学对我论文中的复杂网络研究工 作给予了热情帮助,在此向他们表达我的感激之情。 另外也感谢我的家人,他们的理解和支持使我能够在学校专心完成我的学业。 1 绪论 1 1研究背景及现状 1 1 1科学合作的兴起 2 0 世纪,科学合作活动的规模和范围随着科学的迅速发展而迅猛增长。合著 论文是科学合作的重要表现形式之一。科学合作的迅猛增长首先引起了敏锐科学 家们的注意。p r i c e 是最早关注科学合作增长状况的研究者之一。2 0 世纪6 0 年代, 科学计量学之父p r i c e 敏感地觉察到了科学合作的增长念势,并对科学合作的发展 进行科学计量学研刭1 1 。他考察1 9 1 0 1 9 6 0 年问化学文摘的统计数据发现,从2 0 世纪开始,化学领域早的合作研究呈稳步、迅速的增长趋势。1 9 1 0 年单人独著论 文占论文总数的8 0 以上,只有不足2 0 的论文足山两位及以上作者完成的。到 1 9 6 0 年,多著者论文数增至6 0 以上。其中三人及三人以上合著的论文比例已高 达3 0 。m e a d o w s 研究了物理学领域的合作状况【2 】,发现在2 0 年代只有2 5 左右 的论文是通过合作完成的,5 0 年代则上升为6 1 。 进入9 0 年代,科学合作现象更进一步引起人们的重视。g l a n z e l 和c z e r w o n 从1 9 9 2 年出版的s c i 中随机抽取了4 5 3 4 篇论文进行分析,结果9 0 以上的论文 是通过合作研究完成的,每篇论文平均拥有著者4 5 人【引。 以上考察说明,2 0 世纪以来,正如科学的迅速发展一样,科学合作j 下在以异 常迅猛的态势向前发展着。科学研究中的合作关系同益成为影响科学生产能力发 挥的巨大力量,并且随着科学社会化程度的提高愈来愈成为不可忽视的社会力量。 科学合作的迅猛增长及其对科学生产能力产生的巨大推动作用引起科学家、科技 政策制定者以及科技管理人士的同益关注。特别是当今大科学时代,在科学发展 的新形势下,科学合作尤其是国际科学合作己成为发展大科学和解决全球化问题 的主要途径。新时期科学合作同益增加的重要性吸引着许多科学家把科学合作作 为新的研究领域,对科学合作产生的根源,科学合作的模式,科学合作的运行机 理、影响科学合作的因素,以及科学合作产生的影响等诸多现实问题进行多维度 多层面的探讨,以期发现科学合作的规律,用以指导科学研究活动,使科学合作 结构达到最佳,产生1 + 1 2 的效能,最大限度地推动科研生产力的发展。 科学合作作为一种社会过程,是一个很复杂的社会问题,横跨科学学、社会 学、管理学、心理学、经济学、系统科学、行为科学和科学计量学等领域。各学 科领域运用不同的研究方法对科学合作进行估评和测度。 1 1 2科学家合作网络的研究 自然界或人类社会中存在的大量复杂系统都可以通过复杂网络的研究方法对 其进行研究。如果用节点代表某个系统的个体,用节点问的连接表示系统中个体 的关系,就可以得到一个网络。 复杂网络研究所涉及的学科领域有:i n t e r n e t w o r l dw i d ew e b 网络、生命科学 领域的各种网络( 如细胞网络、蛋白质作用网络、神经网络、生态网络) 、社会网络 ( 如科学家合作网络、语言学网络、流行性疾病传播网络) 等。山于网络现象的涵盖 面极其广泛,因此,对网络的研究极具现实意义。 1 7 3 6 年,当时伟大的数学家欧拉致力于著名的“哥尼斯堡七桥问题”的研究, 由此萌芽的图形理论在随后的几个世纪罩慢慢发展起来。1 9 6 0 年,数学家e r d 6 s 和称r b n y i 提出了随机图理论【4 】,开创了研究复杂网络的新纪元。随机图的思想主 宰复杂网络研究长达四十年之久;直剑近儿年,科学家们对大鼍的现实网络的实 际数据进行计算研究后得到的许多结果都与随机图理论相背离,因此需要新的复 杂网络模型来更合理地描述这些实际网络中所显现出来的特性。其中之一就是由 w a t t s 和s t r o g a t z 于1 9 9 8 年提出的w s 小世界网络模型5 i ,其刻画了现实世界中的 网络所兼具的大的凝聚系数和短的平均路径长度的小世界特性。但却无法刻画实 际网络中被发现普适地具有“富者更富”的现象。因此在1 9 9 9 年,b a r a b a s i 和 a l b e r t 提出了无标度模型【6 】。目前对各种复杂网络的研究发现了它们同时都具有的 3 个主要特征:小世界、无标度性和高聚集度。 1 9 6 7 年,美国著名社会心理学家m i l g r a m 想要描绘一个连结人与社区的人际 关系网。做过一次连锁信实验,结果发现了“六度分隔”现象。简单地说:“你和任 何一个陌生人之间所间隔的人不会超过六个,也就是说,最多通过六个人你就能 够认识任何一个陌生人。”【7 j 。这被称为六度分隔理论( s i x d e g r e e so f s e p a r a t i o n ) 。“六 度分隔”说明了社会中普遍存在的“弱纽带”,但是却发挥着非常强大的作用。有很 多人在找工作时会体会到这种弱纽带的效果。通过弱纽带人与人之间的距离变得 非常“相近”。m i l g r a m 的工作对社会网络的研究有非常重要的启迪作用。 之后,针社会网络的研究主要集中于对网络拓扑结构特征以及信息、疾病等 的传播机制的研究。例如,f o s t e r 等人、f a r a r o 和s u n s h i n e 、m o o d y 和w h i t e 都以中 学生的友谊关系网络作为对象,研究该网络的拓扑特征和相关性质8 】【9 】【10 1 。b e r n a r d 等人研究了犹他州的当地人和密克罗尼西亚岛上居民的社会关系网l l 。 虽然这些研究直接针对社会网络的结构,但其具有以下不足:网络规模较小 2 以及对人们存在“认识”关系的界定上各个学者有所不同。为了克服这些局限性, 随后,有学者对电力网络、i n t e m e t 网、航空网络等进行了研究。例如,b a r r a t 研究 了2 0 0 2 年的全球的国际航空网,该网络包括n = 3 8 8 0 个机场和e = l8 ,8l0 条航线, 整个网络的平均度值为 = 2 e n = 9 7 ,而最大度值为3 l8 。全球的国际航空网 同时具有小世界网络和无标度叫络的特点,用两机场f n j 平均的边数计算的平均最 短路径长度为d = 4 3 7 ,度分布符合p ( 尼) = k - r f ( k k z ) ,其中厂兰2 0 i l 引。b a g l e r 分 析了印度航空网,包括7 9 个机场和4 4 2 条有向的航线,并得出了印度航空网的度分 布以及边权分布均具有幂律分布的特征,并且具有小世界网络的特征,平均最短 路径长度为d = 2 2 5 9 3 ,聚集系数为c = 0 6 5 7 4 1 3 】。然而,这些研究存在的局限性 是,这些网络并不能代表人们之间直接的联系关系。 之后,有学者对电影演员的合作进行了研究【5 1 【m 】两位演员共同参与演出了一部 电影,他们则认为这两人存在联系。显然,这种做法也有其不足:两位演员在一 部电影中的合作并不能说明他们实际上存在联系关系,或许他们的这种联系只存 在电影的拍摄过程中,而之后可视之为陌生人。 相比之卜,科学家合作例络中,两位科学家合著一篇文章则两个节点之f a j 有 边相连,即两人之间存在相互合作关系。这种科学家之间的合作关系显然是比较 可靠和真实的。 n e w m a n 致力于科学家合作网络的研究,他研究了若干个数据库,涉及生物医 学,高能物理学、天体物理学、量子物理学、数学、核能理论和计算机科学领域。 基于这些数据库,他统计了科学家合作网络的一些信息【l 引,如:作者的数目、合 作者的数目、平均度、聚集系数、平均路径等。所有这些网络都显示出平均路径 长度小,但聚集系数大的特性。高能物理学合作网络的度分布几乎完全符合幂律 分布,而其他领域的度分布在其尾部具有较大指数的幂律分布。通过对科学家合 作网络聚集系数的研究,n e w m a n 指出:与一个科学家有合作关系的任意两个科学 家,他们之间存在合作关系的几率有3 0 甚至更大。这说明了节点的邻点之间存 在大量的合作关系,但是,还不能反映科学家合作的具体细节规律。 n e w m a n 还提出了计算科学家合作网络的最短路径的方法【l6 1 。在科学家合作 网中如何区分科学家之间合作紧密程度的方法,即区分科学家之间的了解程度的 方法:第一,他认为一篇文章中著者的数量和著者之间的合作紧密程度成反比, 比如,只有两人合作完成的论文,他们之间的了解程度要较三人或三人以上的多。 这样,假定在一篇文章中共有n 个作者,则一个著者就有n 1 个合作者,并假定该 著者和每个合作者的合作次数为1 ( n 1 ) ,即在n 一1 个合作者之间平均分配他的 工作时间;第二,有过多次合作的科学家之间比只有少量合作次数的科学家之间 更加了解,为了描述科学家之间的熟悉程度把每对科学家在不同的文章中的合作 3 强度累加到一起,规定当著者i 为论文k 的著者之一,则万i 为1 。最后,n e w m a n 指出,文章中的边权w ,代表了科学家f 和科学家,之问的合作强度: = 莩筹 m , 上式中,刀。是论文k 的著者数目。n e w m a n 在此肇础上定义任意两个科学家之 间的距离为d 。= 1 w ,这样,就可以计算含权的科学家网络的平均最短距离。 n e w m a n 还研究了节点之l 、f j j 的连接倾向性,并引入了a s s o r t a t i v em i x i n g 和 d i s s o r t a t i v e 埘反f 煨的概斜 】。他发现,社会关系网络包括科学家合作网络通常具有 a s s o r t a t i v em 扛砌措性,即节点倾向于和他属性差不多的节点相连接,在本文中, 我们称这种特性为“同型匹配”特性。而信息网络和神经网络则呈现d i s s o r t a t i v e m i x i n g 特性,即低度节点倾向于和高度节点相连接。 b a r a b a s i 等人选择了数学和神经科学领域的科学家网络作为研究对象,以年为 单位,研究了1 9 9 1 年至1 9 9 8 年的合作者网络的动念演化性剧博j 。在他们的文章 中指出,节点数量的增长接近线性,度分和服从p o w e r - l a w 的规律,随着时问的推 移,网络平均路径艮度、聚集系数减小,富人组系数、平均度增大。并且,他们 摒弃了传统建模中节点之问互相连接的随机性,根据度分命的p o w e r - l a w 的特性, 他们在节点选择连接的过程使用“择强”连接的规则。在以上分析的基础上,他 们对科学家合作网络的动态增长进行了建模。该模型的规模以单位时间增长,着 重于模拟网络演化过程中拓扑特征的变化。建立模型的规则如下: 1 ) 新节点以固定概率加入网络,每次加入的节点数量与时间间隔成正比。 2 ) 新节点加入网络时,以“择强”连接的规则与老节点相连。 3 ) 网络内现存节点( 老节点) 以“择强”连接的规则形成新的连边。 “择强”的过程中,通过节点度的大小衡量节点的优劣。需要注意的是,在 建立模型的过程中,b a r a b d s i 等人采取了几个近似策略:例如,他们忽略了节点的 老化,并且假设每篇论文均具有相同且恒定数量的著者等。在模型与实际的比较 中,由于模型算法的缺陷,无法形成规模较大的网络模型,因而他们只考察了规 模远小于实际的网络模型,即节点数n d e g ( i ) ,则 d n i 2 d n i 。扫 列o e g n ( j ) 得到d e g n ( j ) = d n j , ,t i n j 2 ,d n j ) ,使 t i n j , d n j 2 d n j 。若d n j , d n i i , 则j d e g ( i ) ,则j f 。若d e g o ) f 。 若d e g o ) = d e g ( i ) ,排列d e g n ( i ) 得到d e g n ( i ) = d n i , ,砌之,d n i ) ,使 d n i , 幽之 d n i 。排列d e g n ( j ) 得到o e g n ( j ) = d n j , ,慨,d n j ) ,使 d n j , d n j 2 f 。若d n j , d n i l ,则j d e g ( i ) , 则 m n d j ,则 f 。若岫 m n d j ,则 m n d i 。对于图4 1 中所示的位图,属于同一个分片的节点具有 相同的度数,也就是说,分片的宽度代表了分片所对应度数的节点的多少。因此, 分片宽度越宽,说明该度数的节点数量越多;反之,分片宽度越窄,说明该度数 的节点数量越少。 在图4 1 中,我们可以看到,l 度点对应的是一条边缘线,从2 度点之后,分 片呈规则的花瓣形状。从分片的宽度上我们可以看到,2 度点的数量最多,其次是 1 度点、3 度点、4 度点等。 显然,如果剀络某个度值所对应的节点数目为o 或非常小,则陔度值所对应 的分片是不存在的或在位图中无法看清其形状。因此,分片数量的多少,一定程 度上说明了度的丰富程度。从图4 1 中我们能较清晰地看到的分片大约有1 5 个左 右,我们不能看到对应于大度值的分片的形状,因此,我们能推断出科学合作网 络中度数大的节点数量不多。 图4 2 为科学家合作网络的度分布图示,网络内最大度为9 7 ,最小度为l 。该 图证实了由b o s a m 位图,针对度分布所做出的上述相关推断。 图4 2 科学家合作网络的厦分布 f i g 4 2d e g r e ed i s t r i b u t i o no fs c n 从图4 1 中,我们还能得到科学家合作网络的以下结论: b o s a m 位图是由邻接矩阵得到的,因此,位图中的位点分御特征反映了节点 之间的邻接关系。观察图4 1 中位点的分布,我们看到,随着节点序号的增大,位 点的密集程度加大,变得越来越稠密。观察位图中横纵坐标均大于1 0 0 0 0 的区域, 我们看到该区域内的节点有“抱团”的现象,这些节点之间的邻接关系非常多。 因此,科学家合作网络中,是存在“富人俱乐部”( r i c h c l u b ) 现象的。 图3 6 所示的s k i t t e r 的b o s a m 位图中,上方和右方的边缘处位点分布比较密 集,这部分区域是节点序号大的区域。对于序号小的节点,他们之间的邻接关系 就少得多,图3 6 中节点序号小的区域中,位点非常稀疏,在较大范围内还出现了 位点的空白区域。上述现象体现了s k i t t e r 数据中节点在选择邻点的时候的“择强” 规则。 而观察图4 1 ,总体来说,位点分布比较均匀,度值小的节点之间也存在较多 邻接关系。从这一点上来讲,科学家合作网络内的节点在选择邻点的时候,并非 按照“择强 的规则。再观察图4 2 ,科学家合作网络的度分布并不符合p o w e r - l a w 规律。结合上述观察到的特征,我们推断亦科学家合作网络内节点在选择邻点的 时候,按照“择弱”的规则。 因此,我们认为科学家合作网络存在下述特征:“择弱一规则,即新节点在加 入网络时,往往只能找到较弱的节点作为其合作伙伴,而直接获得与较强的节点 合作的机会非常小。 4 2分形特征分析 在3 2 2 节中已经以e r 模型为例,讨论了e r 模型的b o s a m 位图中最大邻 点度的分形特性。 基于图4 1 ,对于节点i ,将其邻点集合记为m ,并记邻点中最大序号的节点 为m n i ,m n i 因而也是邻点中具有最大度m n d 的节点。将这些m n i 提取出来, 得到b o s a m 位图的包络线形状如图4 3 所示。我们可以看到,科学家合作网络的 b o s a m 位图的包络线也具有类似的形状。 图4 4 为基于b o s a m 的科学家合作网络最大邻点度的分形图形。蓝色曲线为 原始包络线。红色曲线为由分形规则绘制的生成包络线。这里,选取的原始包络 是度为2 的节点包络,由原始包络一共产生了1 0 条生成包络。图中,生成包络很 好地与实际包络相吻合。因此,科学家合作网络的最大邻点度的条件概率分布也 是满足分形特征的。 图4 3 科学家合作网络的b o s a m 位图的包络线 f i g 4 3e n v e l o p e so fb o s a mo fs c n 02 0 0 04 0 0 06 0 0 0 8 0 0 0 1 0 0 0 01 2 0 0 0 n o d e 图4 4 科学家合作网络最人邻点度条件概率的分形图形 f i g 4 4f r a c t a lc u r v e so fd e g r e ec o n d i t i o n a lp r o b a b i l i t yi ns c nb o s a m 4 3 相关特征分析 n e w m a n 已经指出,科学家合作网络中,存在“同型匹配”的规律。即科学家 在寻找伙伴进行合作的时候,倾向于选择与自己能力差不多的伙伴。这里的“能 力通过节点度的大小来衡量。度大的节点,我们认为其能力越强,反之,能力 越弱。在依照r u l e3 规则进行排序的b o s a m 位图中,很显然,序号越大的节点, 度也越大。在我们的研究过程中,我们以b o s a m 位图中的节点序号作为衡量节 点之间差异的特征值。 在科学家合作网络的b o s a m 位图( 图4 1 ) 中,我们能看到一个明显的不同 于其他网络位图的现象:该位图中从2 度节点开始,存在一条对角线。在科学家 的合作关系中,并不存在自己和自己合作的情况。因此,这条对角线说明了科学 家在合作的时候,往往会找到与自己差不多的科学家,即体现了n e w m a n 指出的 “同型匹配 ( a s s o r t a f i v em i x i n g ) 规律【i 。 另外,在图4 1 中,我们看到,每个分片中,均有规则的呈弧形的小斜纹。如 图4 5 所示,以度为2 的分片中的一段小斜纹为例,初步说明小斜纹的含义。图中, 2 7 f重=f;flf 帅 。 砌 鲫 嬲 节点序号a b ,且磊= 以,则能推出:最大邻点度( m n d ) m n d a m n d b ,即最 大邻点序号m n ,且小斜纹上与 、口相邻的两个节点 。上述现象说om n b bcd 明了,能力相同的节点,由于其对应的最大邻点度的强弱差异,使得各自的邻点 也出现了与最大邻点度强弱所对应的差异。 上述基于b o s a m 位图的分析,反映了科学家合作网络中节点合作行为的一 个有趣的现象,节点的合作行为不但与节点本身强弱有关,同时,这种合作行为 也携带了节点的“背景”因素。我们将这种“背景 因素归结为其最大邻点度的 大小。实际的网络中,我们将这种“背景”归结为该节点的最强邻点的强弱。 因此,我们认为科学家合作网络存在下述特征:“门当户对 特征,即科学家 合作网络中节点的合作行为不但与节点本身强弱有关,同时,这种合作行为也携 带了节点的“背景 因素:节点“背景 的强弱恰恰对应于其最强邻点的强弱, 而且,搿背景 强的节点,其合作者也往往强于那些“背景”弱的节点的合作者。 4 4本章小结 图4 5 科学家合作网络b o s a m 斜纹含义示意图 f i g 4 5e x p l a n a t i o n so ft h ed i a g o n a l so fs c nb o s a m 本章基于网络拓扑可视化工具b o s a m ,分析了科学家合作网络的一维特征、 分形特征,发现并解释了相关特征。基于静态的b o s a m 位图,本章发现了科学家 合作网络中节点合作行为的如下特征: 1 )“择弱弦规则:新节点在加入网络时,往往只能找到较弱的节点作为其合 2 8 作伙伴,而直接获得与较强的节点合作的机会非常小。 2 )“门当户对一特征:即科学家合作网络中节点的合作行为不但与节点本身 强弱有关,同时,这种合作行为也携带了节点的“背景”因素:节点“背景”的 强弱恰恰对应于其最强邻点的强弱,而且,“背景”强的节点,其合作者也往往 强于那些“背景”弱的节点的合作者。 以上特征是建立科学家合作网络拓扑模型的基本关键点。 2 9 5 科学家合作网络拓扑建模 科学家合作网络属于社会网络的一种。其增长机制比较复杂。新的科学家在 进入网络的同时,网络内原有的科学家之间由于互相介绍,又会形成新的合作关 系。 b o s a m 网络拓扑可视化工具为我们提供了一种很好的分析网络拓扑结构的 方法。在第四章中,我们基于b o s a m 分析了科学家合作网络的若干拓扑特征, 并且发现了该网络内节点合作的基本特征,即“择弱”行为和“背景”因素。 本章中,我们基于上述分析,建立了科学家合作网络的模型。该模型为一动 态增长的网络拓扑模型,在网络规模的增长过程中融合了节点资历的变化。模型 规定,新节点加入网络时,往往选择与“较弱”的节点进行合作;老节点的邻点 间存在频繁的合作关系:邻点集合中的所有节点都与最强邻节点保持着合作关系。 通过与实际网络的b o s a m 位图的比对,我们又引入了新的参数和机制,从 而优化了模型。通过对科学家合作刚络的拓扑建模,本章又提出了针对该网络的 增长机制以及科学家合作行为的一些新的结论。 5 1模型的建立 目前网络建模有静念、动态两种主要方法,静态建模可以描述系统的组织和 结构,而动态建模则可描述系统的行为和动作。为了模拟科学家合作网络的增长 机制及科学家的合作行为,我们采用了动态建模。 5 1 1新节点的加入 模型基于b o s a m ,采用动态增长的方式建立。模型由两个节点的连边开始, 即由一对科学家的合作开始,用邻接矩阵的形式表达即为图5 1 所示: 獬? 12 图5 1 科学家合作网络模型的开始状态 f i g 5 1t h e s t a r to fs c nm o d e l 图5 1 中标出了邻接矩阵的序号。该序号是程序中对矩阵的默认编号。则处在 邻接矩阵右下方的是序号大的节点。模型中,新节点加入后,将会在邻接矩阵的 上方新增一行,在邻接矩阵的左方新增- - n 。这样,新节点始终是以序号为l 的 身份加入,保证了序号越人的节点,存在于网络的时间越久,资历也越老,其度 值也会比较大。因此,在模型的建立过程中,节点的序号值代表了该节点存在于 网络内时问的长短,显然,存在越久的节点,获得与其他节点相连的机会也越多。 因而,节点序号代表了该科学家的资历,资历越老的科学家,其度值很可能就越 大。本文中提出的模型,依据节点序号的大小来衡量节点的“强弱

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论