




已阅读5页,还剩37页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
摘要曼曼! ! 曼曼! ! ! ! ! ! ! ! ! ii ! 曼! ! ! 曼! 曼曼! ! 皇皇! ! 曼曼苎! ! ! ! 曼摘要随着“人类基因组计划”提出以后,人们完成对多基因组( 呈现基因组序列的多态性) 测序计划之后,又开始转向对这些基因和他们相互关系的功能理解的研究。在最近几年人们采用微阵列技术找到基因在不同状态下的表达水平。人们想从分子水平上理解生物体功能,需要知道生物体中的基因相互依赖关系,知道生物体中哪些基因被表达、在哪里被表达、什么时候表达,以及表达的程度如何等,这样我们就需要建立基因表达调控网络( g e n er e g u l a t o r yn e t w o r k s ) 。基因表达调控是通过基因调控系统实现的,而该系统的结构又由d n a 、r n a 、蛋白质以及小分子之间的相互关系网络决定的。我们所感兴趣的大多基因调控网络都含有多个成分,这些成分都是由正的或负的反馈回路连接组合而成的,我们很难从直观上理解他们的行为。因此,我们可以通过采用一些方法和计算机工具来模拟和推测基因调控网络,构建基因调控网络关系。从表达谱数据出发,可以建立基因或蛋白质相互作用的网络模型,这种方法也称反向工程( r e v e r s ee n g i n e e r i n g ) 。然后做一些生物方面的研究工作,使构建和模拟的基因调控网络更有应用价值。本文主要做了以下几方面的研究:第一,回顾已有的描述基因调控网络的方法。本文回顾了已经在生物学中采用的用于描述基因调控系统的一些方法。如有向图、线性微分方程模型、加权矩阵模型、贝叶斯模型、布尔网络以及互信息关联模型等。并且介绍这些模型各自的优缺点。第二,由互信息理论和布尔网络共同建立基因调控网络模型。本文首先采用的方法是由互信息理论和布尔网络共同建立基因调控网络模型,并且通过举例说明该方法,用此方法相应地可推导出多个基因决定某个或多个基因的表达值的逻辑规则,根据得到的逻辑规则建立基因电路网络,再对得到的基因逻辑电路网络,依据分析逻辑电路网络的方法建立基因调控网络动态转换,从而分析基因间的调控关系。第三,利用基因数据噪音建立基因调控布尔网络。本文采用另一种在利用互信息理论研究布尔网络时,用离散函数学习( d i s c r e t ef u n c t i o nl e a r n i n g ,d f l ) 算法进行搜索,建立布尔网络模型,可以使运算量得到相应减少。重点说明了用d f l 算法建立搜索时,如果出现噪音,依据基因或蛋白质数据中出现的噪音构建含有噪音的卡诺图( k a r n a u g hm a p s ) ,在卡诺图中找到基因或蛋白质间的布尔逻辑关系,然后由得到的逻辑关系建立布尔网络模型。并在文中给出依据表达谱数据噪音建立基因或蛋白质调控布尔网络的例子。第四,设想建立肿瘤基因网络。北京工业火学工学硕士毕业论文本文在最后介绍将此方法用在建立肿瘤基因网络。主要通过研究w n t 信号通路的构成及其与肿瘤的关系,建立w n t 5 a 调控布尔网络。由于目前生物信息学,尤其是基因调控网络分析该研究领域的很多方面还不健全,所以当前获得的实验数据不可能对所推测出的网络的生物学准确性进行评价。最好足把得到的网络可以用实验证明。相信在未来,可以建立很好的评价网络的方法。关键词:基因调控网络;d f l 算法;布尔网络;数据噪音;卡诺图a b s t r c ta b s t r c ta f t e rw h i l et h e ”h u m a ng e n o m ep r o j e c t ”p r o p o s e s ,t h ep e o p l ec o m p l e t em e a s u r e st h ef o r e w o r dp l a na f t e rt h em u l t i g e n eg e n o m et e a m ,a l s os t a r t st oc h a n g et ot h e s eg e n e sa n dt h e i rr e c i p r o c i t yf u n c t i o nu n d e r s t a n d i n gr e s e a r c h u s e st h em i c r o a r r a yt e c h n o l o g yi nt h er e c e n ts e v e r a ly e a rp e o p l et of i n dt h eg e n eu n d e rd i f f e r e n tc o n d i t i o ne x p r e s s i o nl e v e l t h ep e o p l ew a n tf r o mt h em o l e c u l a rl e v e lt ou n d e r s t a n do r g a n i s mf u n c t i o n ,n e e d st ok n o wi ng e n et h ei n t e r d e p e n d e n c e ,k n e wi no r g a n i s mt h e s eg e n e sa r ee x p r e s s e d ,a r ee x p r e s s e di nw h e r e ,w h e ne x p r e s s ,a sw e l la st h ee x p r e s s i o nd e g r e eh o wa n ds oo n ,d ow en e e dt oe s t a b l i s ht h eg e n ee x p r e s s i o nr e g u l a t i o nn e t w o r kl i k et h i s n l eg e n ee x p r e s s i o nr e g u l a t i o ni st h r o u g ht h eg e n er e g u l a t i o ns y s t e mr e a l i z a t i o n ,b u tt h i ss y s t e ms t r u c t u r eb yb e t w e e nd n a ,r n a ,p r o t e i na sw e l la ss m a l lm o l e c u l a rr e c i p r o c i t yn e t w o r kd e c i s i o n w ea r ei n t e r e s t e dm o s t l yt h eg e n er e g u l a t i o nn e t w o r ka l lt oi n c l u d em a n yi n g r e d i e n t s ,t h e s ei n g r e d i e n t sa l la r eb yo rt h en e g a t i v ef e e d b a c kl o o pc o n n e c t i o nc o m b i n a t i o nb e c o m e s ,w ev e r yd i f f i c u l tt ou n d e r s t a n dt h e i rb e h a v i o ri n t u i t i v e l y e m b a r k sf r o mt h ee x p r e s s i o ns p e c t r u md a t a , m a ye s t a b l i s h 也en e t w o r km o d e lw h i c ht h eg e n eo rt h ep r o t e i na f f e c tm u t u a l l y t h i sm e t h o da l s oc a l l st h er e v e r s ee n g i n e e r i n g t h e r e f o r e ,w em a yt h r o u g hu s es o m em e t h o d sa n dt h ec o m p u t e rt o o ls i m u l a t ea n dt h ee x t r a p o l a t i o ng e n er e g u l a t i o nn e t w o r k 硒ec o n s t r u c t i o ng e n er e g u l a t i o nn e t w o r kr e l a t i o n s ,t h e nm a k e ss o m el i v i n gt h i n ga s p e c tt h er e s e a r c hw o r k ,c a u s e st h ec o n s t r u c t i o na n dt h es i m u l a i o ng e n er e g u l a t i o nn e t w o r kh a st h ea p p l i c a t i o nv a l u e t h i sa r t i c l eh a sm a i n l yd o n ef o l l o w i n gs e v e r a la s p e c t sr e s e a r c h :f i r s t ,t h er e v i e wh a dd e s c r i b e st h eg e n er e g u l a t i o nn e t w o r km e t h o d t h i sa r t i c l er e v i e w e dh a sa l r e a d yu s e di nt h eb i o l o g yu s e si nd e s c r i p t i o ng e n er e g u l a t i o ns y s t e ms o m em e t h o d s i th a st ot h ec h a r t ,t h el i n e a rc o m b i n a t i o nm o l d ,t h ew e i g h t i n gm a t r i xm o d e l ,s h e l ly et h es im o d e l ,t h eb o o l e a nn e t w o r ka sw e l la sm u t u a l l yt h em u t u a li n f o r m a t i o nm o d e la n ds oo n a n di n t r o d u c e st h e s em o d e lr e s p e c t i v eg o o da n d b a dp o i n t s s e c o n d ,e s t a b l i s h e st h eg e n er e g u l a i o nn e t w o r km o d e lt o g e t h e rb ym u t u a l l yt h em u t u a li n f o r m a t i o nt h e o r ya n dt h eb o o l e a nn e t w o r k t h i sa r t i c l ef i r s tu s e st h em e t h o di se s t a b l i s h e st h eg e n er e g u l a t i o nn e t w o r km o d e lt o g e t h e rb ym u t u a l l yt h ei n f o r m a t i o nt h e o r ya n dt h eb o o l e a nn e t w o r k ,a n dt h r o u g he x p l a i n sw i t he x a m p l e st h i sm e t h o d ,c o r r e s p o n d i n g l ym a yi n f e rm a n yg e n e sw i t ht h i sm e t h o dt od e c i d es o m eo rm a n yg e n e se x p r e s s i o nv a l u el o g i c a lr u l e ,a c c o r d i n gt ot h el o g i c a lr u l ee s t a b l i s h m e n tg e n ee l e c t r i cn e t w o r kw h i c ho b t a i n s ,a g a i nt og e n el o g i cc i r c u i tn e t w o r kb a s i sa n a l y s i sl o g i cc i r c u i tn e t w o r km e t h o de s t a b l i s h m e n tg e n er e g u l a t i o nn e t w o r kd y n a m i ct r a n s f o r m a t i o n ,t h u sr e g u l a t i v er e l a t i o n sb e t w e e na n a l y s i sg e n e t h j r d u s eg e n ed a t an o i s ee s t a b l i s h m e n tg e n er e g u l a t i o nb o o l e a nn e t w o r k t i l i sa r t i c l eu s e sa n o t h e rk i n do fd i s c r e t ef u n c t i o nl e a m i n g ( d f l ) t h ea l g o r i t h mc a r r i e so nt h es e a r c hu s em u t u a l l yi n f o r m a t i o nt h e o r ye s t a b l i s h m e n tb o o l e a nn e t w o r km o d e l m a ye n a b l et h eo p e r a n dt oo b t a i nt h ec o r r e s p o n d i n gr e d u c t i o n 晒e ne x p l a i n ew i t he m p h a s i sw i t ht h ed f la l g o r i t h me s t a b l i s h m e n ts e a r c h ,i fa p p e a r st h en o i s e ,i nt h eb a s i sg e n eo rt h ep r o t e i nd a t aa p p e a r st h en o i s ec o n s t r u c t si n c l u d e st h en o i s et h ei i i 北京工业火学 :学硕士毕业论文k a m a u g hm a p ,f o u n db o o l e a nl o g i c a lr e l a t i o n sb e t w e e nt h eg e n eo rt h ep r o t e i ni nt h ek a m a u g l lm a p ,t h e nb yt h el o g i c a lr e l a t i o n se s t a b l i s h m e n tb o o l e a nn e t w o r km o d e lw h i c ha r r i v e s a n dp r o d u c e st h eb a s i se x p r e s s i o n sp e c t r u md a t an o i s ee s t a b l i s h m e n tg e n er e g u l a t i o nb o o l e a nn e t w o r ki nt h ea r t i c l et h ee x a m p l e f o u r t h ,c o n c e i v e st h ee s t a b l i s h m e n tt u m o rg e n en e t w o r k t h i sa r t i c l ei nf i n a l l yu s e st h i sm e t h o dt oe s t a b l i s ht h et u m o rg e n en e t w o r k m a i n l yt h r o u g ht h ew n ts i g n a l i n gp a t h w a yo nt h ec o m p o s i t i o na n dt h er e l a t i o n s h i pb e t w e e nt h et u m o ra n dt oe s t a b l i s hc o n t r o lw n t 5 ab o o l e a nn e t w o r k s a sar e s u l to ft h ep r e s e n tb i o l o g yi n f o r m a t i o ns t u d y ,t h eg e n er e g u l a t i o nn e t w o r ka n a l y z e st h i sr e s e a r c ha r e av e r yv a r i o u s l yn o tt ob ep e r f e c ti np a r t i c u l a r , t h e r e f o r ec u r r e n to b t a i n st h ee m p i r i c a ld a t u mi si m p o s s i b l et oe x t r a p o l a t et h en e t w o r kb i o l o g ya c c u r a c yc a r r i e so nt h ea p p r a i s a l s h o u l db e t t e rb et h en e t w o r kw h i c ho b t a i n sm a yr i s et o t e s tt h ec e r t i f i c a t e b e l i e v e di nt h ef u t u r e ,w i l lb ea l l o w e dt oe s t a b l i s ht h ev e r yg o o da p p r a i s a ln e t w o r kt h em e t h o d k e yw o r d s :g e n er e g u l a t i o nn e t w o r k ;d f la l g o r i t h m ;b o o l e a nn e t w o r k ;d a t an o i s e ;k a m a u g hm a p1 v 独创性声明本人声明所呈交的论文是我个人在导师指导下进行的研究工作及取得的研究成果。尽我所知,除了文中特别加以标注和致谢的地方外,论文中不包含其他人已经发表或撰写过的研究成果,也不包含为获得北京工业大学或其它教育机构的学位或证书而使用过的材料。与我一同工作的同志对本研究所做的任何贡献均已在论文中作了明确的说明并表示了谢意。关于论文使用授权的说明本人完全了解北京工业大学有关保留、使用学位论文的规定,即:学校有权保留送交论文的复印件,允许论文被查阅和借阅;学校可以公布论文的全部或部分内容,可以采用影印、缩印或其他复制手段保存论文。( 保密的论文在解密后应遵守此规定)签名:攀导师签名:三弭日期:二业口第一章绪论第一章绪论弟一早三百y 匕1 1 论文背景1 9 8 6 年,著名的生物学家、诺贝尔奖获得者r e n a t od u l b e c c o 在s c i e n c e 上首次提出“人类基因组计划”( h u m a ng e n o m i cp r o j e c t 简称h g p ) “人类基因组计划”于1 9 9 0 年l o 月正式启动。h g p 旨在阐明人类基因组3 0 亿个碱基序列对的序列,发现所有人类基因并搞清其在染色体上的位置,破译人类全部遗传信息,使人类第一次在分子水平上全面地认识自我。该计划从最初的美国政府资助美国科学家开展d n a 沏u 序工作,到多国科学家、政府的主动参与,到私人企业从人类基因组计划可能带来的巨额利润考虑而竞相投入,己经经历了十多年的历程。在这短短的十多年的时间里,我们不但提前完成了整个人类基因组的全部测序,同时还完成了许多模式生物的全基因组测序,如4 0 多种微生物、线虫、拟南荞等。计划的内容也从最初的结构基因组学,发展产生了功能基因组学、蛋白质组学、转录组学等等。有关基因组的研究己经成为目前最为热门的科学话题。2 0 世纪5 0 年代生物信息学开始孕育,2 0 世纪6 0 年代生物分子信息在概念上将计算生物学和计算机科学联系起来,2 0 世纪7 0 年代生物信息学的真正开端,2 0世纪7 0 年代n s o 年代初期出现了一系列著名的序列比较方法和生物信息分析方法,2 0 世纪8 0 年代以后出现一批生物信息服务机构和生物信息数据库,2 0 世纪9 0年代后h g p 促进生物信息学的迅速发展,分子生物学研究核酸、蛋白质等生物大分子的结构、功能和相互关系研究生物大分子在生命活动中的重要性、规律性,从分子水平上真正揭开生物世界的奥秘。1 1 1 论文所属范畴该研究属于比较前沿的生物信息学研究范畴,是用电路理论中的逻辑关系及离散函数学习( d i s c r e t ef u n c t i o nl e a r n i n g ) 算法和计算机解决生物学中的基因相互关系的问题。而该课题研究的则是生物信息学中基因或蛋白质调控关系的模型,重点在于关注于基因内在的相互作用,建立基因相互作用的数学网络模型。参照此模型,可以对肿瘤基因网络做进一步的分析和研究。1 1 2 生物信息学1 、概念生物信息学乜1 ( b i o i n f o r m a t i c s ) 是一门数学、物理、计算机与生物医学交叉结合的新兴学科,它已广泛地渗透到医学的各个研究领域中,成为生物医学发展不可缺少的重要工具。生物信息学自产生以来,大致经历了前基因组时代、基因组时代和后基因组时代三个发展阶段口1 。随着人类基因组计划的快速发展,生物信息学技术在人类疾病与功能基因的发现与识别、基因与蛋白质的表达与功能研北京工业大学工学硕士毕业论文究方面都发挥着关键的作用。生物信息学技术在基于基因与蛋白质功能缺陷的合理化药物设计方面电有着巨大的潜力。它是当今生命科学和自然科学的重大前沿领域之一,同时也将是2 l 世纪自然科学的核心领域之一。其研究重点主要体现在基因组学( g e n o m i c s ) 和蛋白组学( p r o t e o m i e s ) 两方面,具体说就是从核酸和蛋白质序列出发,分析序列中表达的结构功能的生物信息。基因组信息学的关键是“读懂”基因组的核苷酸顺序,即全部基因在染色体上的确切位置以及各d n a 片段的功能;了解基因表达的调控机理。生物信息学研究意义:l 、认识生物本质了解生物分子信息的组织和结构,破译基因组信息,阐明生物信息之间的关系。2 、改变生物学的研究方式改变传统研究方式,引进现代信息学方法。3 、在医学上的重要意义为疾病的诊断和治疗提供依据,为设计新药提供依据。1 1 3 分子生物信息学研究基因调控网络需要了解一些与基因调控系统相关的生物学知识。其中包括d n a 、染色体、蛋白质、基因以及基因调控系统等。1 、d n ad n a 又称脱氧核糖核酸( d e o x y m o n u c l e i c ) 简称a c i d ,是一种高分子化合物,基本单元是脱氧核苷酸f 4 l ,在所有的d n a 分子中,主要有四种:a 、g 、c 、t ,分别代表的是腺嘌呤( a d e n i n e ) 、鸟尿素( g u a n i n e ) 、胞核嘧啶( c y t o s i n e ) 及胸腺嘧啶( t h y m i n e ) 。在细胞中,d n a 一般以双股形式出现,一股中的a 与另一股中的t 相对,而g 则与c 成对。d n a 中包括了细胞活动的许多信息1 5 1 。2 、染色体染色体( c h r o m o s o m e ) 在遗传上起主要作用,染色体主要包括d n a 和蛋白质两大部分,同一物种内每条染色体所带d n a 的量是一定的,但不同染色体或不同物种之间变化很大。3 、蛋白质蛋白质( p r o t e i n ) 是由2 0 种氨基酸组成,蛋白质执行了人体的生理功能,从而控制了整个生命现象的发生。4 、基因基因( g e n e ) 是具有特定生理功能的d n a 序列,基因作为唯一能够自主复制、永久存在的单位,其生理学功能是以蛋白质的形式表达出来的,d n a 序列是遗传信息的储存者,它通过自主复制到永久,并通过转录生成m r n a ,翻译生成蛋白质的过程来控制生命现象。d n a 中表现出的整个信息集称为基因组( g e n o m e ) ,基因组是指含有一个生物体生存、发育、活动和繁殖所需要的全部遗传信息的整套核酸。但生物基因组的遗传信息并不是同时全部都表达出来的,即使极简单的生物( o n 最简单的病毒) ,其基因组所含的全部基因也不是以同样的强度同时表达第一章绪论的。大肠4 = f :菌基因组含有约4 0 0 0 个基因,一般情况下只有5 1 0 在高水平转录状态,其它基因有的处于较低水平的表达,有的就暂时不表达。哺乳类基因组更复杂,人的基因组约含有1 0 万个基因,但在一个组织细胞中通常只有一部分基因表达,多数基因处在沉静状态,典型的哺乳类细胞中开放转录的基因约在1 万个上下,即使蛋白质合成量比较多、基因丌放比例较高的肝细胞,一般也只有不超过2 0 的基因处于表达状态。不同组织细胞中不仅表达的基因数量不相同,而且基因表达的强度和种类也各不相同,这就是基因表达的组织特异性。5 、基因调控系统基因调控系统( 如图1 1 所示) 是细胞中若干互相作用的基因的集合,网络中的基因彼此之间互相作用并且与细胞内的其它物质互相作用,从而调节网络中的基因被转录成m r n a ( 信使核糖核酸) 的比率,基本规则:一个体系在需要时被打开,不( ;。1 粥曩砑n需要时被关闭。这种“开关”( o n o f f ) 活性是通过调节转录来建立的,也就是说m r n a 的合成是可以被调节的。当我们说一个系统处于“o f f 状态时,也有较底水平的基因表达,常常是每世代每个细胞只合成l 或2 个m r n a 分子。所谓“关”实际的意思是基因表达量特别低,很难甚至无法检测。科学家把从d n a 到蛋白质的过程称为基因表达( g e n ee x p r e s s i o n ) ,对这个过程的调节就称为基因表达调控( g e n er e g u l a t i o n 或g e n ec o n t r 0 1 ) 。基因表达调控主要表现在以下几个方面:( 1 ) 转录水平上的调控,( 2 ) 翻译水平上的调控,( 3 ) m r n a ) j i 工成熟水平上的调控。1 2 基因表达调控网络研究进展基因调控网络( 通常简称为基因网络) ,建立在分子生物学、非线性数学和计算机科学等多学科交叉的基础之上,由于它具有系统和定量的特点而受到广泛的重视。一个基因的表达受其它基因的表达,这种相互影响、相互制约的关系构成了复杂的基因调控网络。一个细胞就是一个复杂的动力学系统,其中每个基因相当于系统的一个变量,各个变量之间的相互影响,基因转录调控网络分析的目的就是要建立调控网络的数学模型。通过数学模型来分析基因之间的相互作用关系。对基因网络的研究是生物信息学研究的重要内容。1 2 1 基因表达调控网络的研究现状基因网络研究的主要内容是对实验中获得的大规模基因表达数据进行分析,理解相应基因表达调控系统的性质和功能,在国外关于基因调控网络的研究已经被许多学者所关注,在我国虽然在该方面刚刚起步,目前已有的基因调控网络研北京工业人学工学硕士毕业论文究模型有很多种,主要有线性组合模型、贝叶斯模型、布尔网络模型、加权矩阵模型、互信息关联网络模型、神经网络模型、微分方程模型等。基因电路是一种将基因网络和电子电路作类比的研究方法,在这种类比之下成熟的电路分析可以被用来分析基因网络的功能和结构,还可以将电子电路的一些设计技术借鉴到基因网络的人工合成当中,该方法在理沦和应用中都取得了巨大的成功,也是基因网络的一种重要研究方法。而且有更多的人参与到该方向的研究。1 2 2 肿瘤基因表达调控网络的研究现状2 0 0 0 年在美国举行的“国际肿瘤生物治疗及基因治疗年会 会议总结报告中指出:生物治疗是目前知道的唯一一种有望完全消灭癌细胞的治疗手段,2 1 世纪是肿瘤生物治疗的世纪。肿瘤生物治疗主要包括肿瘤免疫治疗和基因治疗两大方面,但主要方向足基因治疗。随着人们的研究不断深入,人们可以从基因调控网络中了解很多知识,利用计算机技术进行肿瘤特异性启动子的识别,是功能基因组时代的必然趋势,对于加速生物信息学的发展、研究基因表达的调控网络,都具有非常重要的意义。1 3 本文的主要工作生物系统由静态和动态两部分构成。静态部分由基因组中所有基因组成,这些基因是生物系统的基本构造元件。随着大规模基因组测序、基因预测以及注释的完成,生物学研究更加关注动态部分即基因调控网络。基因调控网络结构的改变是细胞分化和肿瘤生成等生物现象的深层原因。本文采用两种方法建立基因调控网络模型,一种是由互信息理论和布尔网络共同确定基因之间的逻辑规则,根据得到的逻辑规则建立基因电路网络,再建立基因调控网络动态转换,从而分析基因间的调控关系。另一种采用离散函数学习( d i s c r e t ef u n c t i o nl e a m i n g ,d f l )算法结合互信息理论进行搜索建立布尔网络模型,由于采用了启发式搜索使运算量得到减少。重点说明了用d f l 算法建立搜索时,如果出现噪音,依据基因或蛋白质数据中出现的噪音构建含有噪音的卡诺图( k a m a u g hm a p s ) ,在卡诺图中找到基因或蛋白质问的布尔逻辑关系,然后由得到的逻辑关系建立布尔网络模型。并在文中给出依据表达谱数据噪音建立基因调控布尔网络的例子。最后将此方法用在建立肿瘤基因网络。1 4 本文的主要贡献本文的研究成果主要体现在以下几个方面:1 、对当前基因调控网络的研究工作进行了比较系统全面的总结和分析。2 、利用互信息与布尔网络共同建立基因调控网络。3 、利用基因或蛋白质数据中的噪音建立基因调控网络。第一章绪论4 、构想把上述提到的方法用到肿瘤基因调控网络。1 5 论文的结构安排论文共分五章,结构安排如下:第一章绪论,主要包括生物信息学的基本概念、研究目的、意义及介绍目前的研究状况以及所要完成的工作。第二章基因调控网络,介绍了基因调控网络的基本概念,生物学背景、基因网络的表达情况,以及肿瘤基因网络的概念、目前的研究情况。第三章基因调控网络的模型,在本章介绍目前国际上已提出的几种基因调控网络模型,包括早期的有向图和无向图、线性组合模型、布尔网络模型、加权矩阵模型和互信息关联网络模型。第四章利用互信息和布尔网络建立基因调控网络模型,在本章介绍采用互信息理论与布尔函数理论联合建立基因调控网络模型。介绍利用d f l 算法建立基因调控网络且在基因数据出现噪音时,利用基因或蛋白质数据中的噪音建立基因调控网络。构想把上述提到的方法建立肿瘤基因调控网络第五章总结与展望,对本文进行总结,并对未来基因调控网络进一步发展提出展望。1 6 本章小结本章主要给出了生物学的基本概念,以及研究背景,目前国内外的研究现状。并且给出研究基因调控网络需要了解一些与基因调控系统相关的生物学知识。其中包括d n a 、染色体、蛋白质、基因以及基因调控系统等。另外对本文的工作以及贡献作出了概括性的介绍。麓裟嚣国篙ki 一现都是通过蛋白质w 7i 一了嚣笳晃雷“痢冒步溢与核酸的相互作用iq 。黑一。j ,! 一冉来实现的。因此,! ,! 一,:”一”舭。第二章基因调控网络解细胞的基因表达调控过程,必须尉细胞内的各类物质进行全面和系统的测量,根据各种物质的变化来构建复杂的调控网络。但是,就目前的生物大分子测量技术而占,尚不能得到所有生物大分子和相关物质的这些数据。因此,要对生物学分子网络进行研究,在现阶段还存在数据缺乏的问题;同时,细胞内的基因、蛋白质等物质的数量非常大,要构建如此庞大的网络对于网络理论和计算性能也提出了挑战。总的来说表达调控网络有如下特点:1 、网络结构复杂网络中节点和边的数目庞大。在人体中总共有3 万到4 万左右的基因,而且真核生物中大多数的基因会同时被两个和两个以上的基因调控,这就使网络形成了一个非常高维的结构。2 、网络结构变化生物学的实验表明,相同的基因在人和动物的细胞周期中可以参加不同的生理过程,实现不同的生理功能。还有一些基因只在某些时刻和特定的外界条件下是有相互作用的,在其他条件下不会发生作用。简单的说就是两个基因间的那条边是否存在、作用的方向在不同时期可能是不一样的。3 、相互作用类型多变在生物体中,基因间相互作用可以有很多类型( 如图2 - 1 ) ,包括了很多作用的特征:两个基因间谁影响谁、影响的方式、增强的作用还是抑制的作用、影响产生的条件、影响的强弱量级、被调控基因的表达量和调控基因的表达量直接的关系等。目前的研究表明,基因间的相互作用可能是一种非线形的作用关系。在多因子调控模式中还要考虑不同的调控因子对同一个目标调控基因产生作用时的某种逻辑关系,这种逻辑关系是由调控模式中各调控因子的相互关系决定。4 、节点类型多样网络节点的元素可以是d n a 、m r n a 、蛋白质、分子、大分子、外界环境等等。5 、节点状态变化在细胞周期过程中,每一个基因的表达量不是固定的,会随着条件的变化而变化、蛋白质在不断的合成,同时也在不断的被降解。在不同的调控模式下,蛋白质合成和降解的比率会发生变化,从而会使蛋白质处在不同的水平上。基因的表达量的变化会影响到相互作用的变化,会引起网络结构的变化。6 、有向循环结构在生物体中各种生理上的周期现象,我们很容易理解生物体中的相互作用存在周期性。至少在网络的局部上是循环的。在已经研究的比较多的低等生物e c o l i 的表达调控网络阳1 中已经发现了循环的结构。北京工业大学工学硕士毕业论文2 4 肿瘤基因网络癌基因( o n c o g e n e ) 一般可定义为某种基因,它的异常表达或表达产物的异常直接决定细胞恶性表型的产生。抑癌基因或称抗癌基因( a n t i o n c o g e n e ) 与肿瘤抑制基因( t u m o rs u p p r e s s o rg e n e ) 属同义词,是指某种基因当其受阻抑、失活、丢失、或其表达产物丧失功能可导致细胞恶性转化;反之,在实验条件下,若导入或激活它则可抑制细胞的恶性表型。( 1 ) 癌基因的发现现已知道在肿瘤发生中,作为坏境因素的病毒、化学致癌物和射线,它们作用于机体内的靶分子都是d n a ,在研究肿瘤病毒如何使宿主细胞转化和研究肿瘤d n a 能否使培养的经两条实验途径中,殊途同归,发现了癌基因。病毒癌基因对病毒本身无关紧要,却可使宿主细胞转化,引起肿瘤,而细胞癌基因对细胞的生长、分化和功能活动却是至关紧要的。正常的细胞癌基因并不致癌,只是当它们异常表达或其表达产物异常时才会导致细胞的恶性转化,迄今发现的细胞癌基因都是一些有十分重要的功能“看家基因”,而且是高度保守的,例如人与小鼠的k r a s 基因产物k r a s 的氨基酸序列相差仅为l ,入与大鼠的h r a s 基因产物h r a s 的氨基酸序列完全相同。不同的癌基因有不同的激活方式,一种癌基因也可有几种激活方式。例如c m y c 的激活就有基因扩增和基因重排两种方式,很少见c m y c 的突变;而 a s 的激活方式则主要足突变,细胞转化实验证明,各种癌基因之间存在协同作用。w e i n g e r g 按转染细胞表型的变化将癌基因分为碣个类,一类是核内作用的能使细胞永生化的癌基因,例如m y c ,f o s 等,另一类是引起细胞恶性表型变化的定位于质膜和胞浆的癌基因,例如r a s 、e r b b 、s r c 等。事实表明肿瘤的发生是多步骤,多因素的,不同的癌基因作用于肿瘤发生的不同阶段。( 2 ) 细胞癌基因的激活a 、插入激活;b 、突变激活;c 、基因扩增;d 、基因重排染色体易位( 3 ) 抑癌基因抑癌基因又称肿瘤抑制基因,它的发现较癌基因晚,迄今克隆到的抑癌基因的数目亦较少,这并不意味着客观存在的抑癌基因就一定比癌基因少,只是由于技术上的原因,要想分离、鉴定、确认一个抑癌基因比较困难。早在六十年代,有人将癌细胞与同种正常双倍体成纤维细胞融合,所获杂种细胞的后代只要保留某些正常亲本染色体时就可表现为正常表型。然而,随着染色体的丢失又可重新出现恶变细胞。这一现象表明,正常染色体内可能存在某些抑制肿瘤发生的基因,它们的丢失、突变或失去功能,可使潜在的致癌因素如激活的癌基因发挥作用而致癌。人们用了( 如图2 2 ) 的方法将癌细胞与正常细胞相融合变为正常细胞,说第二章基因调控网络明正常细胞中有抑癌基因。基因表达渊控的研究是后基因组时代的核心内容,是系统生物学的主要研究内容。肿瘤基因网络的研究将给未来带来很多有价值的研究,为人类攻克肿瘤,取得成功带来很多帮助。2 5 肿瘤基因网络构建基因调控网络结构的改变是细胞分化和肿瘤生成等生物现象的深层原因。基因调控网络本质上是一个连续而复杂的动态系统,即复杂的动力系统网络。w n t 信号传导通路是调控细胞生长发育和分化的重要通路,不仅在胚胎发育过程中起着至关重要的作用,而且与许多人类肿瘤的发生发展也具有密切关系。w n t=癌细胞融合_ l 一,正常细胞正常细胞图2 2 抑癌基因作用模拟图f i 醇一2d a m p st h ec a n c e rg e n ef u n c t i o ns i m u l a t i o nc h a r t一信号通路在胚胎发育过程中具有重要的作用,w n t 通路异常将导致多种发育缺陷。研究结果表明:w n t 通路与一些人类常见恶性肿瘤如大肠癌、黑色素瘤、乳腺癌、小细胞肝癌的发生发展密切相关。细胞信号传导途径异常与肿瘤发生、发展密切相关。细胞外各种刺激通过相应介质与细胞膜上相应受体结合后诱发细胞内一系列级联反应,使细胞增殖分化或周期停滞等,由此构成细胞信号传导系统。在此系统中,癌基因激活和抑癌基因的失活刺激细胞加速增殖与无限生长或凋亡抑制,导致肿瘤发生。w n t 途径参与肿瘤发生的机制涉及信号传导、细胞周期、细胞增殖、凋亡以及细胞勃附等多方面。w n t 途径的失灵会导致许多细胞活动产生灾难性变化。其异常情况大致分为3 类:l 、组成w n t 信号途径的蛋白、转录因子或基因被破坏或变异,导致该途径关闭或局部途径异常活跃;2 、过多的w r i t信号使整个途径都异常活跃,细胞进行不必要的增殖;3 、在没有w n t 信号时,细胞内其它的活动也会通过w r i t 途径来刺激或诱发细胞乃至机体不正常的反应。w n t 信号传导通路是调控细胞生长发育和分化的重要通路,不仅在胚胎发育过程中起着至关重要的作用,而且与许多人类肿瘤的发生发展也具有密切关系。最早对w n t 通路的了解来自对致癌病毒和果蝇发育机制的研究。随后该通路中一系列重要成员相继被发现:w n t 特异性跨膜受体卷曲蛋白基因( f r i z z l e dg e n ef z ) 口1 ,其编码蛋白可与w n t 1 结合调节w n t 的信号传导;r u b i n f e l d 等和s u等发现肿瘤抑制基因大肠腺瘤样息肉基因( a d e n o m a t o u sp o l y p o s i sc o l i ,a p c ) ,北京工业大学工学硕士毕业论文也是w n t 途径的成员:随后人们又发现w n t 途径的其他组分:散乱蛋白d i s h e v e l l e d 、糖原合成酶激酶3a ( g l y c o g e ns y n t h a s ek i n a s e30 ,g s k 3o ) 和轴蛋白a x i n ;1 9 9 8 年h e 等和1 9 9 9 年t e t s u 等分别证实了c m y c 和c y c l i n d l 是w n t 途径的靶基因;新近发现c i u n 、环氧合酶2 ( c o x 2 ) 也是r c a t e n i ntc f f l e f 复合体诱导转录的基因1 。由于w n t 通路的多种组份在肿瘤的发生中起了重要作用,因而目前对w n t 信号转导通路的研究越来越引起肿瘤学家的注意。w n t 5 a 是在肿瘤发生中起重要作用的因子,在人类许多类型肿瘤中上调w n t 5 a 和w m 5 b 使其受体f r i z z l e d 5 高表达从而通过激活a c a t e n i n t c f 途径使肿瘤恶性程度增高阳1 ,如大肠癌、肺癌、前列腺癌均有w n t 5 a 的存在。,因此w n t 5 a 具有癌基因的某些特性,但是在大多数人类白血病患例中有w n t 5 a 基因的全部或部分缺失或蛋白表达缺失,说明w n t 5 a 具有抑制造血系统恶性肿瘤的功能h 刚,在扩散型导管乳腺癌中,w n t 5 a 与组织分型关系密切,其表达缺失将引起肿瘤早期扩散及高死亡率。在缺失w n t 一5 a 的膀胱癌细胞系及肾癌细胞系中导入w n t 5 a 基因可使恶性转化细胞表型逆转,w n t 5 a 在某些肿瘤中很可能又是一个抑癌基因。综上所述我们要利用d f l 算法和噪音数据建立布尔网络,利用建立的布尔网络研究蛋白质通路,从而,去研究肿瘤基因调控网络中一些特殊蛋白质所
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
评论
0/150
提交评论