




已阅读5页,还剩64页未读, 继续免费阅读
(计算机软件与理论专业论文)因子蛋白的网络模型.pdf.pdf 免费下载
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
摘要 近年来复杂网络研究已经成为当前研究的一个热门。研究表明:真实 世界中的复杂网络有很多共同特征:小世界性、无标度性、社团结构以及 网络的结构和功能关系等。网络由顶点和边组成。以网络的方式出现的系 统到处可见,如i n t e r n e t 、社会网络、神经网络、交通网络、铁路网络, 还有很多其它类型的网络。 我们人体内免疫系统也是个复杂的系统,其中因子蛋白之间的调控关 系是网状的,从数学、非线性的角度已有相关的研究,但其中的结构和功 能特性还未能完全阐述清楚,所以我们对其复杂网络的结构和功能关系进 行了研究。 目前关于网络结构和功能之间关系的研究工作也很多,基于前面的分 析,本文提出了利用复杂网络度相关性需求获取和集群系数相关性需求获 取的方法,以因子蛋白网络为例,详细分析了这两种方法并用类似于因子 蛋白双层网络的交通网络作实证对比。 本文做了以下几方面的工作: ( 1 ) 对复杂网络的相关知识和形式化b 方法、u m l 作了简单地介绍。 ( 2 ) 介绍了因子蛋白网络的度一度相关特性以及一些统计结果,并用中 国大陆铁路网络、北京公交网络、杭州公交网络以及扬州公交网络进行对 比。 ( 3 ) 介绍了因子蛋白网络的集群系数相关特性以及一些统计结果,同样 也利用中国大陆铁路网络、北京公交网络、杭州公交网络以及扬州公交网 络进行对比。同时,我们还推导了类似“物理基础设施”的物理层和类似 “交通流的功能层度一度相关性和集群系数相关性之间的关系。 基于m k u r a n t 和p t h i r a n ( p h y s r e v l e t t 9 6 ( 2 0 0 6 ) 13 8 7 0 1a n d p h y s r e v e7 6 ( 2 0 0 7 ) 0 2 6 1 0 3 ) 的双层描述,我们分析的是普通站点的 “物理基础设施层”“交通流层 的度和集群系数的功能关系。我们实证 统计了中国大陆铁路网和3 个公交网络。结果较好地反映了它们之间的关 系。该工作表明,物理基础组织和交通流之间存在一般拓扑关系,因此, 我们设计这样的多层系统是合理的。 最后我们从面向对象分析的角度建立了因子蛋白网络的对象模型、功 能模型以及用例模型来分析该因子蛋白网络。紧接着利用已得到的相关需 求获取信息,用形式化b 方法对因子蛋白网络进行形式化描述,最后详细 设计了因子蛋白网络并用j a v a 程序进行了模拟仿真。 关键词:因子蛋白;复杂网络;网络结构和功能;b 方法;j a 、,a a bs t r a c t c o m p l e xn e t w o r kh a sb e c o m ear e s e a r c hf o c u si nr e c e n ty e a r s t h e r e s u l t ss h o wt h a tt h e r ea r em a n yc o m m o nf e a t u r e so fc o m p l e xn e t w o r k si nt h e r e a lw o r l ds u c ha ss m a l lw o r l d ,s c a l e - f r e e ,c o m m u n i t ys t r u c t u r ea n dt h e n e t w o r kr e l a t i o n so fs t r u c t u r ea n df u n c t i o n n e t w o r ki sf o r m e db yt h ev e r t i c e s a n de d g e s s y s t e ma p p e a r e db yw a yo fan e t w o r ke v e r y w h e r e ,s u c ha si n t e r n e t , s o c i a ln e t w o r k s ,n e u r a ln e t w o r k ,t r a n s p o r t n e t w o r k ,r a i l w a yn e t w o r ka n d m a n yo t h e rt y p e so fn e t w o r k s f i r s to fa u t h eb o d yi m m u n es y s t e mi sac o m p l e xs y s t e mi nw h i c ht h e r e g u l a t i o no fr e l a t i o n si st h ep r o t e i nn e t w o r k t h e r ea r es o m er e l a t e dr e s e a r c h i nm a t h e m a t i c s ,n o n l i n e a rp o i n to fv i e w , b u tt h ep r o p e r t i e so fs t r u c t u r a la n d f u n c t i o n a lh a sn o tf u l l y e x p o u n d e d t h e r e f o r e ,s t r u c t u r ea n df u n c t i o no f c o m p l e xn e t w o r k sh a v eb e e ns t u d i e d t h e r ea r eal o to fr e s e a r c hw o r ka b o u tt h er e l a t i o n s h i pb e t w e e nn e t w o r k s t r u c t u r ea n df u n c t i o nc u r r e n t l y b a s e do np r e v i o u s a n a l y s i s ,t h ep a p e r p r e s e n t s ak i n do fs o f t w a r ea c q u i s i t i o nb y d e g r e er e l e v a n c ea n dc l u s t e r r e l e v a n c ei n c o m p l e xn e t w o r k t a k i n gc y t o k i n e p r o t e i n n e t w o r kf o r e x a m p l e ,w ed e t a i l l ya n a l y z et w om e t h o d sa n dt a k ea ne m p i r i c a lc o m p a r i s o n w i t hc y t o k i n e p r o t e i nn e t w o r k t h i sp a p e rm a d et h ef o l l o w i n gs e v e r a la s p e c t s f i r s t l y ,w ei n t r o d u c es i m p l yt h er e l e v a n tk n o w l e d g eo ft h ec o m p l e xn e t w o r k a n dbm e t h o da n du m l s e c o n d l y ,w ea n a l y z ed e g r e er e l a t i o n s h i pa n ds o m e s t a t i s t i c a lr e s u l t sa b o u tc y t o k i n e p r o t e i nn e t w o r ka n dt a k eac o m p a r i s o nw i t h t h e r a i l w a ys y s t e ma n dt h r e eb u ss y s t e m si nc h i n a t h i r d l y ,w ea n a l y z e c l u s t e r i n g c o e f f i c i e n t s r e l a t i o n s h i p a n ds o m es t a t i s t i c a lr e s u l t sa b o u t c y t o k i n e p r o t e i nn e t w o r ka n dt a k eac o m p a r i s o nw i t ht h er a i l w a ys y s t e ma n d t h r e eb u ss y s t e m si nc h i n a a tt h es a m et i m e ,w ea l s od e r i v et h er e l a t i o n s h i p b e t w e e np h y s i c a li n f r a s t r u c t u r el a y e ra n dt h ef l o wl a y e r b a s e do nt h eb i l a y e rd e s c r i p t i o np r o p o s e db ym k u r a n ta n dp t h i r a n ( p h y s r e v l e t t 9 6 ( 2 0 0 6 ) 1 38 7 01a n dp h y s r e v e7 6 ( 2 0 0 7 ) 0 2 610 3 ) ,i n t h i sa r t i c l ew ep r e s e n ta n a l y t i c a l l yt h er e l a t i o n s h i pf u n c t i o n sb e t w e e nd e g r e e s a n dc l u s t e r i n gc o e f f i c i e n t so fac o m m o ns t a t i o ni nt h ep h y s i c a li n f r a s t r u c t u r e l a y e ra n dt h ef l o wl a y e r t h ea p p r o x i m a t i o n sa r et h e nc o m p a r e dw i t h t h e e m p i r i c a li n v e s t i g a t i o n si nt h er a i l w a ys y s t e ma n dt h r e eb u ss y s t e m si nc h i n a ar a t h e rg o o da g r e e m e n th a sb e e no b s e r v e d t h i si n v e s t i g a t i o ns u g g e s t st h a t t h e g e n e r a lr e l a t i o n s h i p s b e t w e e nt o p o l o g i c a lp r o p e r t i e si nt h ep h y s i c a l i n f r a s t r u c t u r el a y e ra n dt h ef l o wl a y e rc a nb ea n a l y t i c a l l yu n d e r s t o o da n d t h e r e f o r ed e s i g no ft h eb i l a y e rs y s t e m ss h o u l db ep o s s i b l e t h e nw ea n a l y z e c y t o k i n ea n dp r o t e i nn e t w o r kb ye s t a b l i n go b j e c tm o d e l ,f u n c t i o n a lm o d e l a n d u s ec a s em o d e li nt h e p e r s p e c t i v eo fo b je c t o r i e n t e d t h e n t h er e l e v a n t r e q u i r e m e n t sh a v eb e e n u s e dt o o b t a i ni n f o r m a t i o n ,w eu s et h ef o r m a lb m e t h o df o r m a l l yd e s c r i b e dc y t o k i n ep r o t e i nn e t w o r k s ,f i n a l l yw eh a sd e t a i l l y d e s i g n e dt h ee y t o k i n ep r o t e i nn e t w o r ka n ds i m u l a t e ds y s t e mb y 】斟入 k e y w o r d s :c y t o k i n ea n dp r o t e i n ;c o m p l e xn e t w o r k ;s t r u c t u r a la n df u n c t i o n a l ; bm e t h o d ;j a v a 周塔:因子蛋白的网络模型 6 7 扬州大学学位论文原创性声明和版权使用授权书 学位论文原创性声明 本人声明:所呈交的学位论文是在导师指导下独立进行研究工作所取 得的研究成果。除文中已经标明引用的内容外,本论文不包含其他个人或 集体已经发表的研究成果。对本文的研究做出贡献的个人和集体,均已在 文中以明确方式标明。本声明的法律结果由本人承担。 学位论文作者签名: 7 贸兹 , u 签字日期:知【口年,月夕日 学位论文版权使用授权书 本人完全了解学校有关保留、使用学位论文的规定,即:学校有权保 留并向国家有关部门或机构送交学位论文的复印件和电子文档,允许论文 被查阅和借阅。本人授权扬州大学可以将学位论文的全部或部分内容编入 有关数据库进行检索,可以采用影印、缩印或扫描等复制手段保存、汇编 学位论文。同时授权中国科学技术信息研究所将本学位论文收录到 则表现在图中为: 国o 瑁 ( 5 ) 合成( c o m p o s i t i o n ) 合成则是聚合的一种特殊的形式,表示“局部 在“整体 内的“职 责”。因为合成关系是不能被共享的。所以,局部不一定要随着整体的销 毁而销毁,但是整体或者负责局部的生存和活动状态,或者负责将它销毁。 局部不可能与其他整体共享。可是,整体可以将所有权转让给另一个对象, 后者立即将承担职责。 例:人和人的腿就是这样一个例子。 p u b l i cc l a s sm a n p r i v a t el e g sl e g s ; 周塔:因子蛋白的网络模型 1 5 p u b l i cc l a s sl e g s 则表现在图中为: ( 6 ) 依赖( d e p e n d e n c y ) 依赖同样也是类与类之间的关联,且依赖是单向的。实体之间的“使 用 关系表示实体的规范发生改变后,会影响依赖于其他实例。具体地, 它可以转变为对不在实例作用域内的某个类或对象的任何类型的引用。其 中包括局部变量,对利用方法调用而获得的对象的引用( 如下例) ,或对 类的静态方法的引用( 同时不存在某个类的实例) 。也可用“依赖”表示 包与包之间的关系。由于包中有类,因此可根据包中的类与类之间的关系 来表示包与包之间的关系。 例:我们给某个雇员计算薪水,要使用计算器: p u b l i cc l a s se m p l o y e e p u b l i cv o i ds a l a r y ( c a l c u l a t o rs a l a r i e s ) 则表现在图中为: 1 6 扬州大学硕士学位论文 2 5 本章小结 本章首先简单地介绍了复杂网络的知识,包括复杂网络的定义、表现、 目前研究的内容以及研究的意义;其次介绍了什么是形式化方法、研究形 式化方法有什么目的和意义;最后介绍了b 方法和u m l 的一些知识。 周塔:因子蛋白的网络模型 1 7 3 度特性研究 3 1 因子蛋白网络的复杂网络的描述 3 1 1 因子和蛋白 免疫( i m m u n i t y ) 即通常所指的免除疫病及抵抗多种疾病的发生 21 。 免疫系统是由免疫器官( 胸腺、骨髓、脾、淋巴结等) 、免疫组织( 有关 淋巴组织) 、免疫细胞( 吞噬细胞、自然杀伤细胞、t 及b 淋巴细胞) 及 免疫分子( 细胞表面分子、抗体、细胞因子、补体等等) 组成。体内的免 疫细胞通常处于静止状态,细胞必须被活化,经免疫应答过程,产生免疫 效应细胞,释放免疫效应分子,才能执行免疫功能。细胞因子( e y t o k i n e ) 是由机体多种细胞分泌的小分子蛋白质,通过结合细胞表面的相应受体发 挥生物学作用。细胞因子具有多效性、重叠性、拮抗性和协同性。( 1 ) 多 效性:一种细胞因子作用于多种靶细胞,产生多种生物学效应的细胞因子 ( 或蛋白) 表现多效性,如干扰素y 上有核细胞表达m h ci 类分子, 也激活巨噬细胞。( 2 ) 重叠性:几种不同的细胞因子作用于同一种靶细胞, 产生相同或相似的生物学效应的细胞因子( 蛋白) 表现重叠性,如i l 一6 和i l 1 3 均可刺激b 淋巴细胞增殖。( 3 ) 拮抗性:一种细胞因子抑制其他 细胞因子的功能表现出拮抗性,如i l 一4 抑制干扰素y 刺激t h 细胞向t h l 细胞分化的功能。( 4 ) 协同性:一种细胞因子强化另种细胞因子或蛋白 的功能,两者表现协同性,如i l 一3 和i l - 11 共同刺激造血干细胞的分化 成熟。众多细胞因子在机体内存在,相互促进或相互抑制,形成十分复杂 的细胞因子蛋白调节网络 2 2 。 3 1 2 因子蛋白网络的构成 因子一蛋白网络实证数据来自于s t r i n g数据库 ( h t t p :s t r i n g e m b l d e ) 。用二分图 15 来定义因子一蛋白网络。把因子定义 为项目,把和因子发生交互作用的蛋白看作参与者。因此,节点之间的边 则可描述为:如果有两个因子和某个蛋白发生作用,该两个因子之间就连 一条边。本实证研究我们共收集了4 0 3 7 个蛋白( 即参与者的节点数) ,14 6 个因子( 即项目数) 。如图3 1 所示。 扬州大学硕士学位论文 图3 1 描述二分图及其投影的草图 其中上排小方点表示成项目节点也就是因子,下排小圆点表示成参与 者也就是蛋白,不是同一类的节点与节点之间的边则属于二分图范围,而 同一类节点与节点之间的边则表示向参与者节点的投影图。黑色的小圆点 表示多个项目共用的一些节点。 因为蛋白质是功能性大分子。每一种蛋白质都有特定的一级结构和空 间结构,这些特定的结构是蛋白质行使蛋白质功能的物质基础,蛋白质的 各种功能又是其结构的表现。所以,蛋白质的一级结构一旦确定,蛋白质 的可能功能也就确定了。不同的蛋白质,由于结构不同而具有不同的生物 学功能。蛋白质的生物学功能是蛋白质分子的天然构象所具有的性质,功 能与结构密切相关 2 1 。所以我们有必要通过两层网来研究蛋白( 因子) 的结构和功能的关系。 关于两层网之间我们只是分别研究了两层中的因子和蛋白发生作用 的对应关系。我们构造的因子一蛋白两层网:在s t r i n g 数据库中,把通 过实验的方法( 即e x p e r i m e n t ) 得到的数据作为物理层的数据( 没有用共 表达等其他四种方法) , 检测蛋白质之间相互作用的实验数据库:1 、b i o g r i d 3 1 2 、 b i n d 3 2 3 、d i p 3 3 3 ;把通过数据库查询( d a t a b a s e ) 和文本挖掘 ( t e x t m i n i n g ) 功能预测得到的数据作为功能层的数据。k e g g 数据库 3 4 就是关于蛋白质之间的p a t h w a y 功能文本挖掘只是很少地补充。 3 2 网络的度特性 3 2 。1 度特性 度是对节点互相连接统计特性的最重要描述,也反映重要的网络演化 周塔:因子蛋白的网络模型 1 9 毛= a o = 口 特征 1 5 。度定义为节点的邻边数,可记为: j 。在因子一蛋 白网络中,节点的度表示与该蛋白( 参与者) 连接其他的蛋白数( 参与者) , 因此越多的蛋白与其发生作用,其值就越大。我们统计得因子一蛋白网络 中度值较大的11 个节点如下:p d g f r b ( 度为5 8 ) ,c d l2 0 a ( 度为4 7 ) , n g f r ( 度为3 4 ) ,t g f b r 2 ( 度为3 0 ) ,i l l 6 ( 度为2 5 ) ,p e c a f 1 ( 度为 2 3 ) ,c d 2 5 ( 度为2 2 ) ,c d 2 8 ( 度为2 0 ) ,r a n t e s r ( 度为1 9 ) ,r a n t e s ( 度为1 8 ) ,t n f r s t - 1 0 a ( 度为17 ) 。这些节点的度值都比较大,这也反 映了这些节点相比其他节点要重要一些,而在实际中正是如此,和这些节 点发生作用的蛋白要远远多于和其他蛋白发生作用,它们在人体免疫系统 中起到枢纽作用。我们同时还得出因子蛋白网络的平均度为 = 2 6 1 2l , 也就是说一个蛋白平均和2 6 个蛋白直接相连。 图3 2 是因子一蛋白网络的度分布图。图中,横坐标对应为节点度的 对数,纵坐标则对应为相应累计概率的对数。 图3 2 因子一蛋白网络的度分布图 3 2 2 其他统计特性 3 2 2 1 项目度分布 每个节点参与的项目数定义为节点项目度,也就是在二分图中参与者 节点与项目节点之间的连边数 3 5 。定义式为j j i2 手,其中,是二分 扬州大学硕士学位论文 图邻接矩阵的矩阵元,它定义为6 j ,:l ,如果一类节点中的t 和另一类节点 中的咒连边;矩阵元定义为包,:o ,如果节点蕾和以没有边。项目度分布 则为网络中项目度为h 的节点的概率p ( h ) 随节点项目度h 的变化的规律。 在本文中项目度是指该蛋白( 节点) 中共有多少个因子参与( 项目) 。它 的分布如图3 3 所示。 ,_ 、 j c 人i c 、_ _ , 乱 c 图3 3 单对数坐标上的累计项目度分布 3 2 2 2 项目大小( t ) 分布 项目大小是个项目中含有的参与者数,常用t 表示,也就是二分图 z :y 6 。 中项目节点与参与者节点之间的连边数 3 6 。定义式为 7 9 。在本文 中是指一个因子参与了多少个蛋白。项目大小( t ) 分布( 如图3 4 ) 即网络中 顶点数为t 的项目的概率p ( t ) 随项目大小为k 的变化规律。在因子一蛋白 网中指一个因子参与发生作用的蛋白数的分布规律。 周塔:因子蛋白的网络模型 2 l 图3 4 线性坐标上的累计项目大小分布 3 2 2 3 网络的平均距离 最短路径表示:图中一个节点到另一个节点的路径可能有很多条,如 何去找这样一条路径使得这条路径上的权重最小。平均路径是指网络中所 j 一y d 有节点之间的路径的平均值即: = n ( n 1 ) 匀9 。( 其中n :网络节点数, j “v 表示节点i 节点j 之间的距离。) 15 经统计因子一蛋白网络的平均路 径是3 5 8 。这就是说人体内每个因子平均经过不到4 个因子就能和别的因 子发生作用。即为复杂网络中的小世界特征。 3 3 因子蛋白网络的度一度相关性 3 3 1 别人已有的工作 关于两层网以至更多层网研究的建议和报道已经不少。其中最引起我 们注意的是k u r a n t ,t h i r a na n dh a g m a n n 建议的双层交通网描述和研究 1 6 3 17 他们建议的双层网下层表示交通的“物理基础组织 ( 例如行车的 道路) ,而上层表示在此基础上的“交通流 ( 例如行车的车次) 。不过上 下层中的节点是一一对应的,节点之间的边的意义也是不同的,但是有确 定的对应关系。 1 6 1 7 除了这样的“道路一车次双层网外,他们还指出了其它一些表示物 理基础和其上物理流的双层网,例如:因特网和p 2 p 网构成的双层网( 上 2 2 扬州大学硕士学位论文 层p 2 p 网中用户为节点,他们之间的p 2 p 通讯关系为边,下层的因特网中 i p 路由器为节点,它们之间的光缆等物理连接为边) ; 还有不同功能区域构成的大脑功能双层网:大脑功能网:不同功能区 域构成的双层网( 下层节点定义为大脑灰质和白质区域,它们之间的边表 示这些区域在大脑中的地理位置邻接关系;上层节点只定义为灰质区域, 它们之间的边表示神经轴突( 信息传递手段) ) 。 所以我们有必要通过两层网来研究蛋白( 因子) 的结构和功能的关系。 3 3 2 我们的工作 关于蛋白网的研究已有一些,但都是一些静态的网络而且没有涉及到 具体某个细胞、因子的功能。关于免疫细胞相关的因子及蛋白是如何在体 内发生作用的? 哪些因子和蛋白经常在一起发生作用? 目前这些问题还 没有涉及。 为此,我们从s t r i n g 数据库中收集了关于相关因子和蛋白的数据并 建立了因子一蛋白交互作用网络。s t r i n g 是关于蛋白和蛋白交互作用的 数据库,这种交互作用包括实验的( 物理的) 和预测的( 功能的) 结合。 我们研究的因子一蛋白网有两类节点组成,一类是免疫因子,另一类 是与因子发生作用的蛋白。我们构造的因子一蛋白两层网:在s t r i n g 数 据库中,把通过实验的方法( 即e x p e r i m e n t ) 得到的数据作为物理层的数 据。其中物理层有1 4 6 个因子节点,6 8 5 个蛋白节点,l1 5 4 条边;把通过 数据库查询( d a t a b a s e ) 和文本挖掘( t e x t m i n i n g ) 功能预测得到的数据作为 功能层的数据。其中功能层有1 4 6 个因子节点,4 0 3 7 个蛋白节点,2 1 6 0 4 条边。 而关于两层网之间的关系我们没有研究,只是分别研究了两层中的因 子和蛋白发生作用的对应关系。进而用节点度相关性和集群系数相关性两 个方面来分析物理层和功能层之间的关系。 3 3 3 因子蛋白网络中物理层、功能层度一度的相关性 l 口 首先,我们分别统计了物理层中各因子的度厅i 和功能层中各因子的度 髟,然后再得出矽与k f2 _ l 日- 的关系,如图3 5 : 周塔:因子蛋白的网络模型 图3 5 因子蛋白网络中物理层、功能层度一度的相关性 图中x ,y 坐标分别代表因子在物理层中的度和功能层中的度。这里 我们以因子c d l 2 0 a 为例,它的主要功能是介导溶解靶细胞活性。它在物 理层中的度数为5 8 ,在物理层中是度数比较大的一个因子,它在功能层中 度数为2 4 4 ,同样也是度数比较大的。 我们在研究分析物理层上节点的度和功能层上节点的度的关系时,主 要是想找出物理层上节点的度和功能层上节点的度它们之间的某种相关 性关系。 通过研究分析在物理层上重要的结点( 即度大的结点) ,分析该结点 在功能层上是否也重要。下图表明了物理层中度大的因子,功能层该因子 的度也是大的,即它们呈现正相关性。 在k u r a n t 和t h i r a n 如此发人深省的文章中,k u r a n t 和t h i r a n 指出, 虽然广泛研究的网络( 如生物,社会,基础设施,或技术网络) “通常被 视为不同的对象,但是他们往往是复杂的大型系统的一部分,在这些系统 里许多拓扑性质相互作用和相互依存 1 6 1 7 。“一些科学家表示为“网 络的网络 这样类似的想法。i o a n n i d i s 等建议建立一个网络,其中包括收 集人类基因组流行病学的研究资料 1 8 。a n d e r s o n 用“网络的网络来描述 伙伴关系 这些关系涉及到数字信息基础设施和保护计划 3 7 。乔杜里和 斯托弗通过网络的网络发展了进化生态学模型 3 8 。由于理解如此复杂的 系统,k u r a n t 和t h i r a n 第一个重要步骤提出了一个双层的描述,并选择交 通运输网络为例。k u r a n t ,t h i r a na n dh a g m a n n 建议的双层交通网描述和研 2 4 扬州大学硕士学位论文 究他们建议的双层网下层表示交通的“物理基础组织( 例如行车的道 路) ,而上层表示在此基础上的“交通流 ( 例如行车的车次) 。上下层中 的节点是对应的,节点之间的边的意义不同,但是有确定的对应关系。“每 边连接的第一站和特定列车路线 的最后一站。 16 ,l7 讨论了一些两层 拓扑关系。例如,交通流中的每条边被映射到物理基础设施层的节点。结 果显示,多层的描述对理解基础设施和交通流特性和它们之间的相关性很 有帮助。多层介绍适合多种复杂的系统,例如,通讯系统,交通系统和生 物系统 17 。 3 4 交通网络的度特性 3 4 1 交通网络的构成思想和方式 我们感兴趣的是多层的描述方法和思想,我们认为对这方面应该做更 多的研究。例如,我们应该对基础设施和交通流的公共节点的拓扑性质引 起广泛的兴趣。有人可能会问以下问题。 有某种共同属性值节点的拓扑关系是什么? 我们能获得节点度和集 群系数的功能关系的描述么? 分析的结论如何适应实证结果? 我们将在 本文中解决这些问题。同样,我们采取交通网络( 一个铁路系统和3 个城 市公交系统网络的例子) 。该结论应适用于许多现实世界的复杂系统。考 虑以前研究交通网络的观点,我们定义的边有点不同于【16 ,l7 中描述的。 传统上,城市公共汽车运输系统和铁路系统可以映射到网络拓扑空间中 去。有些出版物解释了两个网络空间:空间p 和空间l ( 参考【3 9 4 5 公交, 【16 17 】和【4 6 4 8 】列车, 4 9 5 0 】公交和列车) 。在这两个空间中一个节点 代表一个公交车站或一个火车站。在p 空间中如果至少有一条公交线路停 靠两个公交车站或者至少有一个火车车次停靠两个车站,则这两个车站之 间连接一条边。换句话说,一条边就意味着,乘客可以乘至少一条公交路 线或者一列火车可以在两个站点之间直接到达。如果乘客换乘路线或火车 则这对站点之间连接了很多条边。在空间l ,其中节点仍旧为公交车站, 但是边的意义不同,如果两个公交车站在至少一条公交路线中作为相邻的 两个节点,则这两个车站之间连接一条边。据我们所知,虽然研究这些拓 扑性质的空间【16 17 ,4 6 5 0 】,但是没有任何出版物表示p 空间和l 空间的 拓扑关系。很明显,我们可以定义p 空间为交通流层,l 空间为基础设施 周塔:因子蛋白的网络模型 层。这个定义的基本思想应该参考【16 ,17 】。下面的分析讨论将类似和简单 得多。 3 4 2 有关交通网络的数据节点和边 通过课题组收集,我们得到了有关交通网络的数据节点和边如下表4 1 : 表4 。i 交通网络的数据 中国铁路网北京公交网杭州公交网扬州公交网 物理层节点数 3 0 6 94 2 0 08 2 86 0 2 物理层边数2 7 3 6 21 5 8 3 82 1 6 41 4 7 功能层节点数 3 0 6 94 2 0 0 8 2 86 0 2 功能层边数 2 7 4 7 5 52 8 2 8 4 i1 8 4 9 22 1 6 0 3 4 3 有关交通网络的的统计特性 通过分析我们得到有关交通网络的的统计特性如下表4 2 : 表4 2 交通网络的的统计特性 平均路径长平均效率平均集群系数 物理层 功能层物理层功能层物理层功能层 中国铁路 2 3 3 16 0 6o 0 1 0 20 1 5 6 9o 2 3 0 6 0 5 7 6 9 网 北京公交 2 3 1 94 9 50 0 0 4 8 30 0 1 2 3 2 0 0 6 5 10 4 7 2 8 网 杭州公交 1 2 5 53 3 90 0 0 2 2 70 0 2 2 1 90 0 4 3 3 70 4 4 1 3 7 网 3 4 4 项目大小分布 l o g ( t + 5 0 0 0 0 0 ) 图3 6图3 7 扬州大学硕士学位论文 图3 8图3 9 ( 图3 6 、图3 7 、图3 8 、图3 9 分别为:中国铁路网、北京公交、杭州公交和扬 州公交网项目大小分布)( 注:铁路用s p l 拟合的) 3 4 5 平均项目大小 通过计算得到交通网络的平均项目大小如下表4 3 : 表4 3 交通网络的平均项目大小 中国铁路网 北京公交网杭州公交网 平均项目大小( t ) 1 3 3 52 8 7 01 5 4 2 3 5 物理层和功能层度一度相关性 在“交通流层”,节点的度的定义为停站的数目,即从一个节点不换乘公 交或火车能直接到达的站点数目【1 6 1 7 ,5 1 6 4 】。,如果我们定义通过节点f 公交路线或火车的数量h ,通过公交路线或火车的站停f 的数目乃,交通 h 流层节点f 的度表示为: 巧= 芝( 一1 ) ( 式3 1 ) l = l 对于物理基础设施层,节点的度定义为停站的数目,即一个站点在至少一 条公交或火车路线上到达第一站 1 6 1 7 ,5 1 6 4 】。由于一个公交或者一列火 车经常在很长站点停车,作个近似,我们可以忽略公共汽车或火车路线的 第一站和最后一站,只考虑中间站,其中每个站点只有2 个邻居站点。所 以,在基础物理设施层节点f 的度可以表示为舻d2 鸟( 式3 ,2 ) 实证研究表明,乃的分布通常服从单峰函数“不对称的正态分布 5 3 5 6 ,5 9 】。这意味着大多数乃数据是随机地分布在一个平均值附近,从而乃可 近似为常数,t 【5 4 ,5 6 】。我们可以得到掣和矽近似之间的关系= 掣( r 1 ) 2 ( 式3 3 ) 周塔:因子蛋白的网络模型 图3 1 0 1 5 0 l o o 0 图3 11 o246 8 旷1 0 1 21 41 61 82 0 扬州大学硕士学位论文 图3 1 2 图3 1 3 ( 图3 1 0 一3 1 3 :物理基础设施层节点度托? 和交通流层节点度杉之间的 功能关系。其中:图3 10 中国大陆的铁路系统;图3 1l 北京的公交系统; 图3 1 2 杭州公交系统;图3 13 扬州公交系统。) ,n 在图3 1o 一3 13 中,我们绘制了现实世界的四个交通网络的彰的 关系。图3 1 0 展示了在中国内地的铁路网络的关系。它包括( 数据收集 h t t p :w w w c h i n a m o r c n n e t2 0 0 7 年) 2 2 5 2 条边和3 0 6 9 个站点。图3 1 1 显 示,北京公交5 7 1 路线4 2 0 0 公交站组成的网络关系( 数据收集 h t t p :w w w b i b u s t o m 2 0 0 6 年1 1 月) 。杭州公交网络的关系表现为图3 1 2 所示,杭州公交包括l5 0 条边和8 2 8 个站点( 数据收集 h t t p :w w w h z b u s c o m c n 2 0 0 6 年1 1 月) 。图3 1 3 反映了一个中小城市扬州 市的公交系统。它仅包括6 0 2 站和5 7 条公交路线( 数据收集 h t t p :w w w y z r e n c o m l i f e b u s s t a t i o n a s p2 0 0 6 年1 1 月) 。人们可以看到,虽 然随着数据量的变小波动越来越大,但是这种关系的确近似于线性关系。 为了用理论结果( t - 1 ) 2 和实证线性关系的斜率作对比,我们计算了4 个系 统的t i 的平均值,并且我们认为这个值能被看作t 。中国铁路网、北京公 交网、杭州公交网和扬州公交网的结果分别是2 7 3 、3 6 6 、15 4 和2 0 1 。 相应的( 互1 ) 2 值分别为1 3 2 ,1 7 8 ,7 2 ,9 5 5 。对于这三个公交系统,值 周塔:因子蛋白的网络模型 相当接近图3 1 1 ,图3 1 2 ,图3 1 3 用最小二乘拟合线的斜率( 1 8 8 1 ,9 5 4 , 1 1 2 9 ) 。事实上,实证统计结果的值要比( t - 1 ) 2 稍微大点,因为在基础设 施层一部分的站点的度是1 而不是2 。这就是由结论所反映出来的。对大 陆铁路系统出现较大偏差( 13 2 和18 7 5 ) 的原因很可能是t 分布表现出指 数衰减而不是随机分布。这一指数衰减的结论是不同于印度的铁路系统 【5 9 】,但结论还是和 6 5 】中所报道的比较吻合的。 附:度一度相关性( 物理层) 部分主要代码: f o r ( i = 0 ;i c ;) t = i ; p = t + l ; f o r ( p = o ;p c ;p + + ) i f ( s t r l p o 】_ = s t r l t 儿0 】+ 1 ) t 2 p ; b r e a k ; ) f o r ( j 2 0 j c ;j + + ) i f ( s t r ld 】【0 】= - - s t r l 【i 】【0 】& & s t r ld + 1 】 o 】! = 0 ) s u m i = s u m i + 1 ; ) s y s t e m o u t p r i n t l n ( s t r l i 【o 】+ 1 ”+ s u m i 】) ; b w w r i t e ( ”n ”+ s t r l 【i 】 0 】+ + s u m i 】+ ”r ”) ; s u m i - - o ; i _ p ; 度度相关性( 功能层) 部分主要代码: f o r ( i = 0 ;i c ;) s u m l = o ; f o r ( j 2 i 妇 c j + + ) i f ( s t r ld 儿o 】= = 0 ) 3 0 扬州大学硕士学位论文 b r e a k ; e l s e s u m l = s u m l + 1 ; f o r ( t = i ;t j ;t + + ) s t r l 【t 】 1 】= s u m l - 1 ; i = j + 1 ; ) f o r ( m = 0 ;m c ;) s u m m = 0 ; f o r ( n = m ;n i , 表示网络中缺少一条边的三角形的个数,口l ,表示矩阵元 15 。 对于因子一蛋白网络,集群系数的分布情况则反映了每个因子附近的 蛋白之间密集的程度,而集群系数的平均值则刻画了因子蛋白网络中因子 蛋白间密集的程度。图4 1 反映了因子一蛋白网络中的因子的集群系数分 布情况。其中的7 8 个因子,这些因子的集群系数为0 ,集群系数为1 的因 子也只有8 个,这也反映了因子一蛋白网络中的绝大部分因子的邻居蛋白 之间是互相不连通的。我们计算得到因子一蛋白网络的平均集群系数是: = 0 4 由此我们可知,因子一蛋白网的集团化密集的程度是不高的。 图4 1 因子的集群系数分布 图4 1 中纵坐标为每个因子的集群系数,横坐标为对应因子集群系数 的个数。 3 2 扬州大学硕士学位论文 4 1 2 因子蛋白网络的物理层和功能层集群系数相关性 c ( p ) 图4 2 因子蛋白网的集群系数相关性 图4 2 中横坐标为每个因子在物理层中的集群系数,纵坐标为对应的 因子在功能层中的集群系数,其中在x 方向上作了累计。 4 2 交通网络的物理层和功能层集群系数相关性 对集群
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 酒店中餐摆台培训
- 重卡销售培训
- 痛风病人饮食护理
- 职业安全健康管理
- 财会合规培训
- 肿瘤护理专家共识
- 销售业绩分解培训
- 加油站全流程诊断体系构建
- 稽核监察财务培训
- 互联网+教育精准扶贫:2025年实践案例分析报告
- 2025年食品安全管理员考试试题及答案
- 2025-2030骨科植入器材产业市场深度分析及发展趋势与投资战略研究报告
- T/SHPTA 071.1-2023高压电缆附件用橡胶材料第1部分:绝缘橡胶材料
- 湖北省浠水县联考2025年七下数学期末质量检测试题含解析
- 生产基层管理培训课程
- 2025年春季《中华民族共同体概论》第一次平时作业-国开(XJ)-参考资料
- 联想电脑展厅设计方案
- 保安考试试题及答案
- Arduino智能小车避障系统设计与实现
- 2025-2030中国高纯氧市场竞争态势与未来营销战略分析研究报告
- 国开电大软件工程形考作业3参考答案 (一)
评论
0/150
提交评论