




已阅读5页,还剩39页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
摘要 摘要 功能基因组学的主要研究内容就是研究基因的表达调控机制,研究基因在生物体代 谢途径中的地位,分析基因、基因产物之间的相互作用关系、绘制基因调控网络图。近 几年发展起来的d n a 微阵列技术可以得到大量的时序基因表达数据,这就为这些研究奠 定了基础。另外,为了从分子水平上理解生物体功能,需要知道生物体中有哪些基因被 表达、在哪里被表达、什么时候表达,以及表达的程度如何等。基因表达的调控是通过 基因调控系统实现的,而该系统的结构又由d n a 、r n a 、蛋白质及小分子之间的关系 网络决定。这个网络含有多类成分,调控关系较为复杂,因此引入有效的模型和高效的 计算方法来进行研究就显得必不可少。 本文回顾了基因表达调控的原理以及现有的一些基因调控网络模型,比如布尔网络 模型、线性微分方程模型、贝叶斯网络模型及递归神经网络模型等。本文同时回顾了软 计算理论的基本概念,并重点介绍了两类进化计算的方法,即遗传算法和粒群优化算法。 在两个基因调控网络( 一个是人造基因调控网络,另一个是d n a 修复网络) 的时序 基因表达数据的基础上,本文结合软计算方法对两个模型展开了一系列的研究。一个是 稳态系统模型( s - s y s t e m ) ,本文使用粒群优化算法结合稳态系统模型来确定基因间调 控关系,实验证明该方法具有快速收敛性,准确度也较高;另一个是基于惯性法则的微 分动力学模型。由于基因调控网络本身具有高度非线性的特征,本文对该模型加以改进, 将非线性函数引入到该模型,并且证明该模型具有递归神经网络的特征。实验表明改进 的方法有效的减少了模型本身的震荡特性,仿真效果较为理想。 由于目前生物信息学,尤其是基因调控网络分析和重建这个研究领域的很多方面尚 不成熟,所以从当前获得的实验数据不可能对我们所推测出的网络的生物学准确性进行 评价。最好的评价方法就是产生一系列可得的网络,然后交给生物学家用实验证明。科 学技术的发展是十分快速的,相信在不久的将来,我们能建立很好的评价网络的方法。 关键词:基因调控网络,软计算,稳态系统模型,惯性法则,粒群优化算法 a b s t r a c t a b s tr a c t m a i nr e s e a r c ho ff u n c t i o n a lg e n o m i c ss u c ha sg e n ee x p r e s s i o nm e c h a n i s m ,g e n e ss t a t u s i no r g a n i s m sm e t a b o l i s mw a y , e f f e c to fg e n ea n dg e n ep r o d u c t i o na n dd e s c r i b i n gt h eg e n e r e g u l a t o r yn e t w o r ka r ei m p o r t a n t w bh a v eg o ts 0m a n yt i m es e r i e sg e n ee x p r e s s i o nd a t ab y d n a m i c r o a r r a yt e c h n o l o g i e s t h e s ed a t as u s t a i nt h er e s e a r c ho nf u n c t i o n a lg e n o m i c s i n a d d i t i o n , i no r d e r t ou n d e r s t a n dt h ef u n c t i o no fo r g a n i s mo nm o l e c u l a rl e v e l ,w en e e dt ok n o w w h i c hg e n ei se x p r e s s e d ,w h e na n dw h e r ei nt h eo r g a n i s m , a n dt ow h i c he x t e n t , a n ds oo n t h er e g u l a t i o no fg e n ee x p r e s s i o ni sr e a l i z e dt h r o u g hg e n e t i cr e g u l a t o r ys y s t e m ,w h i c hi s s t r u c t u r e db yi n t e r a c t i o n sb e t w e e nd n a ,r n a ,p r o t e i n s ,a n ds m a l lm o l e c u l e s t h e s e n e t w o r k sh a v em a n ye l e m e n t sa n dc o m p l e xr e g u l a t o r yr e l a t i o n s h i p s ,s oe f f e c t i v em o d e l sa n d c o m p u t a t i o n a lt o o l sa r ei n d i s p e n s a b l e t l l i sp a p e rr e v i e w st h ep r i n c i p l eo fg e n ee x p r e s s i o nr e g u l a t i o na n ds o m eg e n er e g u l a t o r y n e t w o r k sm o d e l ,s u c ha sb o o l e a nn e t w o r km o d e l ,l i n e a rd i f f e r e n t i a le g u a t i o nm o d e l ,b a y e s i a n n e t w o r k sa n dr e c u r r e n tn e u r a ln e t w o r k sm o d e l n ec o n c e p to fs o f tc o m p u t i n gi sa l s o r e v i e w e d t w oe v o l u t i o n a r yc o m p u t a t i o nm e t h o d s ,g e n e t i ca l g o r i t h ma n dp a r t i c l es w a r m o p t i m i z a t i o na l g o r i t h ma r ei n t r o d u c e d b a s e do nt i m es e r i e sg e n ee x p r e s s i o nd a t ao ft w og e n e t i cn e t w o r k s ( aa r t i f i c a lg e n e t i c n e t w o r ka n ds o sd n a r e p a i rn e t w o r k ) ,t h i sa r t i c l ed os o m er e s e a r c ho nt w om o d e l sb ys o f t c o m p u t i n g m e t h o d s o n em o d e l i s s - s y s t e m t h i s a r t i c l eu s e s p a r t i c l e s w a r m o p t i m i z a t i o n ( p s o ) t oo p t i m i z e t h em o d e l s p a r a m e t e r s a n dc o n f i r m st h er e g u l a t o r y r e l a t i o n s h i p sb e t w e e ng e n e s t h ee x p e r i m e n t sp r o v e d t h a tt h i sm e t h o dc o u l dc o n v e r g e p a r a m e t e r sr a p i d l ya n db ee f f e c t i v e ;a n o t h e ro n ei sa nd i f f e r e n t i a ld y n a m i c a lm o d e lb a s e d o n a ni n e r t i ap r i n c i p l e b e c a u s eo fh i 。g hn o n l i n e a rc h a r a c t e r so fg e n er e g u l a t o r yn e t w o r k s ,t h i s a r t i c l eb r o u g h tt h en o n l i n e a rf u n c t i o nt ot h i sm o d e la n dp r o v e di th a dt h ec h a r a c t e r sl i k e r e c u r r e n tn e u r a ln e t w o r k s t h ee x p e r i r n e n t ss h o w e dt h a tt h i si n p r o v e m e n td e p r e s s e dt h e m o d e l ss h a k ea n de m u l a t e dw e l l b e c a u s eo ft h ec u r r e n tb i o i n f o r m a t i c s ,e s p e c i a l l yt h eg e n er e g u l a t o r yn e t w o r k sa n a l y s i s a n dr e c o n s t r u c t i o na r en o tm a t u r e ,a n de v a l u a t i n gt h eb i o l o g i c a la c c u r a c yo fp r e d i c t e d n e t w o r k sf r o mc u r r e n t l ya v a i l a b l et e s td a t ai sn o tp o s s i b l e t h eb e s tt h a tc a nb ea c h i e v e di st o p r o d u c eas e to fp o s s i b l en e t w o r k st op a s st oab i o l o g i s tf o re x p e r i m e n t a lv e r i f i c a t i o n w j n l t h ed e v e l o p m e n to fs c i e n t i f i ct e c h n o l o g y , s c i e n t i s t sm u s tb ea b l et of o r mp e r f e c tm e t h o dt o e v a l u a t et h eg e n er e g u l a t o r yn e w o r k sw eb u i l d k e y w o r d s :g e n er e g u l a t o r yn e t 、0 i k ,s o f tc o m p u t i n g ,s - s y s t e m ,i n e r t i ap r i n c i p l e ,p s o u 独创性:声明 本人声明所呈交的学位论文是本人在导师指导下进行的研究工作及取 得的研究成果。尽我所知,除了文中特别加以标注和致谢的地方外,论文 中不包含其他人已经发表或撰写过的研究成果,也不包含本人为获得江南 大学或其它教育机构的学位或证书而使用过的材料。与我一同工作的同志 对本研究所做的任何贡献均已在论文中作了明确的说明并表示谢意。 签名: 丕垒耄 日 期: 丝堂:z = ! ! 关于论文使用授权的说明 本学位论文作者完全了解江南大学有关保留、使用学位论文的规定: 江南大学有权保留并向国家有关部门或机构送交论文的复印件和磁盘,允 许论文被查阅和借阅,可以将学位论文的全部或部分内容编入有关数据库 进行检索,可以采用影印、缩印或扫描等复制手段保存、汇编学位论文, 并且本人电子文档的内容和纸质论文的内容相一致。 保密的学位论文在解密后也遵守此规定。 签名: 导师签名:期:勿m 毋7 p 第一章绪论 第一章绪论 基因组d n a 测序是人类对自身基因组认识的第一步。随着测序的完成,功能基因组 学研究成为研究的主流,它从基因组信息与外界环境相互作用的高度,阐明基因组的功 能。功能基因组学将不仅推动生命科学和生物技术的发展,而且对整个国民经济、社会 以及人类本身产生重大和深远的影响。 1 1 选题背景和研究意义 1 1 1 功能基因组学 基因组学研究重心已开始从揭示生命的所有遗传信息转移到在分子整体水平对功能 的研究上,这种转向的一个标志是产生了功能基因组学( f u n c t i o n a lg e n o m i c s ) 这一新学 科。基因组学实际上是为功能基因组学做准备,一旦功能基因组学进入实质性的发展阶 段,人类将可以从中获得更大的利益。功能基因组的任务是进行基因组功能注释( g e n o m e a n n o t a t i o n ) ,了解基因的功能,认识基因与疾病的关系,掌握基因的产物及其在生命活 动中的作用。在使用全局方法进行研究时,研究人员同时检测大量基因的表达水平,从 而在整体水平上获得关于基因功能及基因之间相互作用的信息。如果说生物信息学在人 类基因组计戈i j ( h g p ) 中的着重点是基因组序列的话,那么在功能基因组中,生物信息学 的着重点则是序列的生物学意义,基因组编码序列的转录、翻译的过程和结果,着重分 析基因表达调控信息,分析基因及其产物的功能。在功能基因组时代,应用生物信息学 方法,高通量地注释基因组所有编码产物的生物学功能是一个重要的特征。功能基因组 学的研究主要包括以下几个方面的内容,并且这几方面都与生物信息学密切相关。( 1 ) 进一步识别基因,识别基因转录调控信息,分析遗传语言。( 2 ) 注释所有基因产物的功能, 这是目前基因组功能注释的主要层次。序列同源性分析、生物信息关联分析、生物数据 挖掘是进行功能注释的主要生物信息学手段。( 3 ) 研究基因的表达调控机制,研究基因在 生物体代谢途径中的地位,分析基因、基因产物之间的相互作用关系,绘制基因调控网 络图;( 4 ) 比较基因组学研究,在基因组水平对各个生物进行对照比较,可以揭示生命的 起源和进化、发现蛋白质功能。 区别于以往分子生物学就单个基因或蛋白质分子在某一孤立时间点进行实验和采集 信息,功能基因组学就是利用结构基因组学提供的信息,从全局范围( 即基因组范围) 内去评定基因的功能。 生物学过去是一门数据量十分匮乏的学科,相关数据的收集都是建立在一些假设和 些针对性的生物学实验上。但随着当前高通量功能基因组实验技术,主要是d n a 微 阵列( d n am i c r o a r r a y ) 技术的发展,我们已经可以观察基因和蛋白质的表达水平,这中 间产生了大量的时序基因表达数据。因此,生物学已经由过去靠假设驱动研究转变为由 大量数据驱动研究。然而非常遗憾的是,虽然得到了大量的实验数据,但我们并没有足 够丰富且高性能的计算技术来处理这些庞大的数据。因此相关计算技术的发展也直接关 系到生物学领域的研究水平,软计算理论被广泛地应用于该领域,因而下面介绍选题的 江南人学硕十学位论文 另一大背景,即软计算方法。 1 1 2 软计算方法 作为一种创建计算智能系统的新方法的软计算,其概念最早由模糊逻辑的创始人 l o 纯a z a d e h t l 】教授提出。在1 9 9 2 年加州大学伯克利分校的课程 o n e p a g e a n n o u n c e m e n t 中,他就提出了软计算的概念方法等问题。 软计算是方法的集合体,其成员是不断发展的,由最早的模糊逻辑或模糊计算( f l 或f c ,神经计算( n c ) ,概率推理( p r ) 到后来的进化计算( e c ) ,混沌系统( c s ) ,序数优化 ( o o ) ,模拟退火( s a ) ,都是软计算这一体系的不可或缺的有机组成。软计算的这一看似 杂乱的体系结构蕴涵了其存在的必然性和重要性:对于不确定环境下纷繁复杂系统的问 题求解,用任一方法都无法解决问题的表里始末,在这样的客观背景下只有应用类似于 生物医学领域里的“鸡尾酒疗法 才能对于如此困难的人类命题给出满意的回答。另一 方面,虽然它们各不相同,但在软计算目标层次上又高度一致,在此意义上又显示出统 一性。同时,它们相互的集成及与基于微积分方法体系的互补对不确定环境下复杂问题 ( 决策、控制等) 的分析与预测提供了有力支持。 ( 1 ) 模糊逻辑或模糊计算 自然和人工系统中存在着三种复杂性:随机性,模糊性和不确知。上世纪六十年代, l az a d e h 教授系统的提出了刻画和处理模糊不确定性的理论基础:模糊集合论。模糊 集合论是处理模糊信息的有效方法,其特点是用严格的数学方法分析模糊的系统信息, 它铺设了经典的定量化方法和“模糊 世界的桥梁。而模糊逻辑则是建立在模糊集合 论基础上的处理不确定知识和近似推理的主要方法。 b o n i s s o n e 等指出,狭义上讲,f l 可被看作是l u k a s i e w i c za l e p h 1 多值逻辑的模糊 化。然而从广义来看,这个狭义的解释仅能表达f l 四个方面中的一个。具体来讲,f l 有逻辑的方面,源于多值逻辑系统:集合论的方面,源于难以定义边界结合的表达;推理 的方面,注重模糊关系的表达与应用;认识论的方面,包含了f l 在基于知识的模糊系 统和数据库上的应用。 自模糊集的概念提出以来,以模糊逻辑为核心的模糊计算( 模糊推理) 就获得了广泛 的应用,在自动控制,决策分析,智能系统等领域取得了一大批成果。模糊计算与其它 技术的有机结合( 本章后面的部分将作详细介绍) ,更使其可解问题域大为延拓,问题求 解的质量显著提高,从而逐渐成为软计算中不可或缺的重要组成。 ( 2 ) 神经计算 人类在探索未知的进程中,从自然界得到启发获取灵感是一条行之有效的问题解决 之道。无机界和有机界芸芸万物的诸多几近完美的天成品性,使人类学到丰富的经验知 识并成功移植到科学研究、社会生活的方方面面。仿生学也由此孕育而生。本小节所论 述的神经计算以及后面涉及的一些方法就是这方面的成功范例。 人工神经网络( a n n ) 是简单模拟脑神经元组织结构特征而构造的新型计算工具。关 于a n n 最早的工作可追溯到1 9 4 3 年m c c u l l o c h 和p i t t s 在b u l lm a t hb i o p h y s 上的文献。 a n n 是并行分布式信息处理网络,由神经元及神经元之间的连接组合而成。从拓扑结 2 第一章绪论 构来看,a n n 可被分为前向网络和回归网络两大类。前向网络包括单层或多层感知器 以及径向基函数( r a f ) 网络;回归网络包括竞争网络、自组织映射( s o m s ) 。h o p f i e l d 网络以及自适应共振理论( a r t ) 模型。如果说前向网络采用的都是监督模式的话,那么 回归网络更多使用的是非监督学习、联想记忆或者自组织等方式。就本文而言,我们仅 使用到了递归神经网络的一些理论。 需强调指出的是,神经计算在多个领域受到重视是因为a n n 有如下的突出特点: _ 分布性:a n n 的分布特性使得它在信息处理过程中常常呈现出“整体大于部分之和 的特性,为成功解决复杂问题奠定了结构基础。 一 容错性:a n n 的结构特征直接导致它有良好的容错性:局部结构的破坏或局部的功能 丧失在许多情形下并不会对全局造成较大的影响。这一点是仿生学的成功范例。 - 自适应性:a n n 的联结和输入输出特性决定了它有较强的自适应能力,其权值、结 构可较容易的随着环境的变化而变化。 ( 3 ) 进化计算 受生物界的自然选择和自然遗传机制启发,上世纪后半叶以来,一类模拟生物界“物 竞天择,适者生存”的思想用以分析、设计、控制和优化人工系统计算方法一进化计算 在几乎相互隔离的情形下分别相继提出。这类计算方法由遗传算法( g a ,g e n e t i c a l g o r i t h m s ,h o l l a n d 等提出) 、进化策略( e s ,e v o l u t i o ns t r a t e g i e s ,r e c h e n b e r g 和s c h w e f e l 等提出) 和进化规划( e p e v o l u t i o n a r yp r o g r a m m i n g ,l j f o g e l ,等提出) 等组成。 直到九十年代初期,遗传算法、进化规划和进化策略才进行了实质性交流。通过交 流,他们发现彼此在研究中所依赖的源于d a r w e n 进化理论的基本思想十分相似,即“每 种方法都是保持一群试探解,并对这些解强加一些随机变化,而且引入选择机制来决定 可存留到下一代中的解 。于是人们将这类方法统称为“进化计算( e c ) 。 同时,它们之间的区别是强调遗传算子( 如自然界中观察到的) 的建模,如交叉、倒置 和单点变异等,并将它们作用到抽象的染色体上,而e s 和e p 则“侧重于变异,通过 变异来维持父代和子代间行为的联系 。 e c 的重要优势在于其具有良好的自适应性,从而能处理非线性高维问题,而不需要 可微性或者关于问题结构的明确知识。因此,这种算法对时变行为具有很高的鲁棒性。 e c 的这一优势使得它在相当广阔的领域中都取得了令人满意的应用效果。 ( 4 ) 模拟退火 如果说神经网络和进化计算是模拟有机界产生的计算方法,那么模拟退火( s a ) 贝j j 是 成功模拟无机界自然规律的结晶。 作为一种非导数的优化方法,s a 基于这样的原理:能量最低原理。原子的稳定状态 取决于其所在的能级:能级越高,越不稳定:反之则越稳定。如果将目标函数的最小化视 作寻求原子的最小能级,则可巧妙的应用诸如金属原子由高能级( 宏观上反映为高温金 属) 到小低能级状态变化( 即金属冷却) 时的物理性质一如高能级时,原子有较高概率跃 迁到更不稳定的状态,而随着温度的降低,这种概率越来越小,进行优化,从而使得处 于局部极小的解能够得以跃迁出去,这种问题求解策略与进化计算一样很好的克服了许 多传统方法面临的局部极小困难。 3 江南大学硕+ 学位论文 s a 提出的初衷是解决组合优化问题,后来的应用证明它在连续优化问题中仍然十分 有效。 ( 4 ) 序数优化 序数优化是哈佛大学何毓琦教授于1 9 9 2 年提出的新型软计算方法。序数优化处理的 是所谓“大海捞针问题一解空间十分庞大,无法一一枚举。其思想是:通过设计一套 计算程序,使得在比解空间小得多的搜索域中利用序数寻优得到的优化解,能以较大概 率搜索到属于整个解空间中原问题的满意解集。 序数优化提出以来,在机器人、资源分配、社会选择等多个研究和应用领域取得了 满意的应用效果,显示出蓬勃的生命力。 1 1 3 研究意义 基因调控网络是功能基因组学研究的重要内容,它反映了基因与基因之间的互相关 系,互相作用。通过对基因调控网络的研究,我们可以理解支配基因表达和功能的基本 规则。理解决定哪个基因什么时候表达的机制是许多基因操作的关键。 目前致力于发现联合调控的基因的研究,实际上是用生物信息学的方法揭示基因的 潜在调控机制;通过对基因调控网络的研究,有助于揭示基因表达过程中的信息传输规 律及基因通过表达传输的遗传信息。基因调控网络的研究可以用量化的方法从一个侧面 对基因表达过程中的信息进行挖掘。通过信息提取、分析,了解基因功能,理解遗传网 络,弄清疾病发病机制;通过对基因调控网络的研究,更有助于从整体的框架下研究基 因的功能。不仅要从结构层次上研究基因的功能,更要从网络层次上发掘和认识基因的 功能。 基因在错综复杂的网络关系中互相影响,协同工作,这必然蕴含着d n a 序列无法完 全揭示的新功能。基因从表达中展示其功能,但基因的表达是一个彼此相互作用和调控 的过程。利用d n a 微阵列在系统的层次上理解基因调控是目前生物信息学中最富挑战 性的工作。 1 2 研究现状 基因调控网络的研究始于2 0 世纪6 0 年代,r a t e r 描述了控制原核生物的分子基因 系统组织的特点,随之k a u f r n a n 通过简单的逻辑规则研究基因网络动力学,构造了自主 的随机布尔网络模型。2 0 世纪9 0 年代实验数据的增加加速了基因网络理论的研究,到目 前为止,已发展了大量的研究基因网络的方法。 生物网络的构建根据不同的研究对象可分为3 类:代谢网络、蛋白质作用网络和调 控网络。其中代谢网络最基础、最保守,蛋白质相互作用网络构建较为复杂,调控网络 成为目前研究的热点。这3 种生物网络并不是相互独立的,而是相互重叠、相互作用影 响的。调控网络可在分子水平上分为3 个层次:d n a 水平、r n a 水平和蛋白质水平。d n a 水 平主要是研究基因在空间上的关系影响基因的表达;r n a 水平上,也就是转录水平上的 调控,主要研究代谢或者是信号转导过程决定转录因子浓度的调控过程;蛋白质水平主 要研究蛋白质翻译后修饰,从而影响基因产物的活性和种类的过程。目前在没有确切明 4 第一章绪论 白基因间的相互作用关系时,网络调控研究的进行是建立在一定的假设前提下的。 通常基因网络调控的研究方法主要有:( 1 ) 通过聚类分析建立模型;( 2 ) 进行反复的 微扰分析重构模型;( 3 ) 通过“反向技术 来推断网络。聚类分析建立模型是一种常用 的构建基因调控网络,探索未知功能基因的方法。聚类分析是一种常用的构建基因调控 网络、探索未知功能基因的方法,常用的聚类方法有:层次聚类、k m e a n s 聚类、自组 织图聚类、人工神经网络等。目前各种算法都广泛运用于基因芯片的数据分析中,但是 算法间尚缺乏系统性,需要从数据出发,进行系统的理论探讨。“微扰分析 主要通过 反复的微扰试验来实现网络重构( n e t w o r kr e c o n s t r u c t i o n ) 。它根据已经建立的基因调控 网络指导实验设计,获得高通量实验数据,然后根据实验结果优化网络模型的结构和参 数。但是目前成功建立的网络调控模型比较少,很难做进一步的调控网络模型研究。通 过“反向技术 来推断网络,就是从基因表达的数据反向推断未知的或隐含的基因网络 拓扑结构的技术,它需要选定合适的参数模型,并用适当的算法推断网络参数,确定输 入输出规则,预测网络随时间的变化规律,这也是目前研究较多的构建基因调控网络模 型的方法。 1 3 研究内容 本文所描述的研究工作主要是集中在细胞水平上的基因调控网络推断。这中间忽略 了一些外部细胞和网络内部细胞的相互作用,但是对细胞生物学的研究还是具有很重要 的意义。一个生物学系统可以被看作是一个状态机,系统内部状态的变化依赖于当前系 统内部的状态和一些外部的输入。我们研究的目标就是要在不同的环境下观察细胞的变 化情况,结合软计算方法推出一个模型,使这个模型可以描述细胞状态的变化情况。 有向图可以简单地描述这类生物学系统,图中节点表示一些关键元素,比如基因、 蛋白质、代谢物等等。弧线则表示这些要素之间的相互作用,即调控关系。为了量化这 些调控关系,我们给这些弧线加上权值。权值有正负之分,可以用来表示激励和抑制的 调控关系。图l l 描述了一个简单的基因调控网络,虽然它只包含六个节点,但这个 网络的动力学行为并非显而易见。 图1 - 1 一个简单的基因调控网络 f i g 1 1 as i m p l eg e n er e g u l a t o r yn e t w o r k 从图1 1 中我们可以看到基因间相互的调控关系。箭头弧线表示激励的调控关系, 平头弧线表示抑制的调控关系,a 节点和e 节点接受外部输入,a 节点和c 节点将对自身 产生抑制。我们还可以观察a 对e 有两条不同的调控路径。如何确认这些调控关系便是 江南大学硕+ 学位论文 本文研究的中心。 1 4 论文结构 本文由5 章组成,各章的主要内容安排如下: 第l 章为绪论,分为4 个小节。第l 小节介绍了课题研究的背景和研究意义;第2 小节简要介绍了课题的研究现状;第3 小节则介绍课题的主要研究内容;第4 小节则介 绍了本文的章节安排。 第2 章是基因调控网络概述。这二章主要内容是全面的介绍基因调控网络的基本知 识。第1 小节主要介绍了与基因调控网络相关的生物学知识;第2 小节介绍了基因表达 调控的生物学知识;第3 小节则介绍了两个真实的基因调控网络,在后续的实验中将会 用到其中的一个;最后简要的介绍了基因调控网络的研究方法。 第3 章是基因调控网络模型概要。在这一章中介绍了一些常用的基因调控网络模型 及其研究现状。第1 小节简要介绍了布尔网络模型的相关内容;第2 小节简要介绍了线 性微分方程模型的相关知识;第3 小节主要介绍了贝叶斯网络模型的相关内容;第4 小 节介绍了递归神经网络模型。 第4 章是结合软计算方法来推断基因调控网络模型。在第1 小节里,主要阐述软计 算里常用的进化计算方法,主要介绍了遗传算法和粒群优化两类进化算法;第2 小节中, 介绍了使用进化算法结合稳态系统模型( s s y s t e m ) 来重构基因调控网络,给出了详细的 实验过程及结果;第3 小节介绍了使用进化算法结合基于惯性法则的微分动力学模型推 断基因调控网络,对以往的模型进行了有效的改进,给出了详细的实验和结果。 第5 章为总结与展望。在这一章里,主要是对本文进行了回顾总结,并对以后的工 作和方向进行了展望。 6 第二章基因调控网络概述 第二章基因调控网络概述 本章主要介绍与基因调控网络相关的生物学知识及基因调控网络的具体概念,详细 介绍了几个已被生物学家确定的基因调控网络的调控机理,在后面的实验中将会用这些 网络的时序基因表达数据来验证模型有效性。 2 1 与基因调控网络有关的生物学知识 为了更好的理解基因调控网络,先来介绍一些与基因调控网络有关的生物学知识。 ( 1 ) d n a d n a ,又称脱氧核糖核酸,是d e o x y r i b o n u c l e i ea c i d 的简称,是一种高分子化合物, 其基本单元是脱氧核苷酸。d n a 是染色体的主要化学成分,同时也是组成基因的材料。 有时被称为“遗传微粒 ,因为在繁殖过程中,父代把它们自己d n a 的一部分复制传递 到子代中,从而完成性状的传播。d n a 是由核酸的单体聚合而成的聚合体,每一种核 酸由三个部分所组成:含氮盐基+ 五碳糖+ 磷酸根。核酸的含氮盐基又可分为四类:鸟嘌 呤( g ) 、胸嘧啶( t ) 、腺嘌呤( a ) 、胞嘧啶( c ) 。d n a 的四种含氮盐基组成具有物种特异性。 即四种含氮盐基的比例在同物种不同个体间是一致的,但再不同物种间则有差异。d n a 的四种含氮沿基比例具有奇特的规律性,每一种生物体d n a 中a tc g 即加卡夫 法则。 ( 2 ) r n a r n a ,又称核糖核酸,是r i b o n u c l e i ca c i d 的简称,是以核糖和磷酸二酯键为骨架链, a 、g 、c 、u ( u r a c i l ,尿嘧啶) 四种碱基连接其上,并以某种特定顺序排列而成的一条多 核苷酸序列。在细胞中,根据结构功能的不同,r n a 主要分三类,即t r n a ( 转运l 矾a ) , r r n a ( 核糖体i a ) ,m r n a ( 信使r n a ) 。m r n a 是合成蛋白质的模板,内容按照细 胞核中的d n a 所转录;t r n a 是m r n a 上碱基序列( 即遗传密码子) 的识别者和氨基 酸的转运者;r r n a 是组成核糖体的组分,是蛋白质合成的工作场所。 ( 3 ) 蛋白质 蛋白质是含氮的有机化合物,是由氨基酸构成的生物大分子。构成蛋白质的氨基酸 有2 0 种,这些氨基酸可以任意顺序出现,蛋白质执行了人体的生理功能,从而控制了 整个生命现象的发生。 ( 4 ) 基因 基因是d n a 分子上具有遗传效应的特定核苷酸序列的总称,是具有遗传信息功能 的d n a 片断。d n a 中表现出的整个信息集称为基因组( g e n o m e ) 。基因是决定一个生物 物种的所有生命现象的最基本因子,是生命的密码。基因在染色体上呈线性排列。基因 通过复制把遗传信息传给下一代,也可使遗传信息得到表达。 ( 5 ) 染色体 染色体实质上就是含有千百个基因组成的一个d n a 分子链。染色体存在于细胞核 中。在真核生物中,当细胞进行分裂期间染色体呈棒状结构,很像油条的形状。染色体 的数目是随物种而异,但对每一物种而言,染色体的数目是固定的。染色体是由线性双 7 江南人学硕十学位论文 链d n a 分子同蛋白质形成的复合物,真核生物的核基因就分藏在每条染色体中,所以, 染色体是基因的载体,也就是遗传信息的载体。一个细胞里的全部染色体也就包含了这 个生物的全部遗传信息。人类的细胞核中含有染色体4 6 条,配成2 3 对,其中2 2 对为 常染色体,另一对为性染色体。这2 3 对染色体包含了某个个体的全部遗传信息。 2 2 基因表达调控 基因表达是指细胞在生命过程中,把储存在d n a i 页序中遗传信息经过转录和翻译, 转变成具有生物活性的蛋白质分子。生物体内的各种功能蛋白质和酶都是同相应的结构 基因编码的。 转录是指在r n a 聚合酶的催化下,以d n a 为模板,根据碱基配对原则合成r n a 的过 程。由此产生两类r n a ,一类是信使r n a ( m r n a ) ,另一类是转运r n a ( t r n a ) 。m r n a 是r n a 的一种,其作用是把d n a 的某一区段( 即一个或几个基因) 的遗传信息转录下来, 从细胞核带到细胞质里的核糖体上,并作为模板控制蛋白质的合成,如图2 一l 。t r n a 是 另外一种r n a ,能在核糖体合成蛋白质时运载氨基酸。各种氨基酸都有它专用的t r n a , 各种t r n a 一方面依靠酶把特定的氨基酸装载在它的氨基酸臂上,另一方面又有反密码 子和结合在核糖体上的m r n a 的密码子相对应,能按m r n a 确定的顺序合成蛋白质。 图2 - 1 转录原理及其产物信使r n a f i g 2 - 1 t h er u l eo ft r a n s c r i p t i o na n di t sp r o d u c tm r n a 翻译是指以m r n a 为模板,使氨基酸按一定顺序合成为蛋白质的多肽链的过程。细 胞核中d n a 某一区段转录出来的m r n a ,从核孔穿出进入细胞质后,能跟细胞质罩的核 糖体结合起来。游离在细胞质中的t r n a ,又可把氨基酸带到核糖体上,装配成为蛋白 质的多肽链。在核糖体上,一个由t r n a 运载来的氨基酸,按照m r n a 的密码相互连接不 断装配起来,形成中的多肽链便不断伸长。当某一氨基酸从t r n a 转到肽链上以后,相 应的t r n a 就退出核糖体,再去搬运新的氨基酸。直到碰上m r n a 的终止密码时,因为终 止密码不能决定任何氨基酸,肽链合成便告结束。核糖体能沿着m r n a 向前移动,或者 说删r n a 能穿过核糖体向前移动。当个核糖体搭到i i l 】f 喇a 上,开始向f ; 移动后不久, 另一个核糖体又可搭上去。这样,个m r n a 分子上可以有几个核糖体连续地进行流水 作业,翻译出相同的蛋白质多肽链,当翻译成的多肽链离开了核糖体,便一个个盘曲、 8 第二章基冈调控网络概述 折迭形成具有一定的空间结构的蛋白质分子。见图2 2 a 近;厂“4 ,7 * 口m ,_ 名式 删 图2 - 2 翻译过程 f i g2 - 2 t h ep r o c e sso f l r 8 1 1 5 l a t i o n 由此可见,在蛋白质的合成过程中,基因表达是一个相当复杂的过程,并且在各个 阶段都要被合理地调控吼除t d n a 转录调控外,在r n a 加工、r n a 转运、r n a 翻译、 翻译后的蛋白质修饰的过程中也都存在着调控关系( 如图2 3 ) 。因此,这就构成了一个 复杂的基因调控网络,网络中的元素有d n a 、r n a 、蛋白质,还有一些其它的分子,这 些元素之阃具有相互的调控作用。 d n a i t n a m r n a l p r o l c j n l m o d i f i e d p r o t e i n 图2 - 3 蛋白质合成过程中不同阶段都存在调控关系 f ig2 - 3r e g u l 川叽t i e x is t $ i ne a c hp h a s eo fp r o t e i ns y n t h e s is 2 3 基因调控网络 基因调控网络即分子组成,如基因、蛋白质、其他分子、以及共同执行某些细胞功 能的分子之间关系的集合。基因网络描述的是给定细胞或组织内的功能路径,表达一些 过程如新陈代谢、基因调控、传输和信号转换。以下提供了两个真实的基因调控网络。 江南大学硕士学位论文 2 3 1 细胞周期调控 细胞生长和分裂是在高度的调控机制下完成的。如果调控失败的话会导致细胞病变, 比如癌症。为了使细胞从g l 状态转至s 状态,当基因物质d n a 被复制后,细胞周期蛋白 e ( c y c l i ne ) ,周期素依赖性蛋白激酶2 ( c y c l i nd e p e n d e n tk i n a s e2 s j i c d k2 ) 等一系列分子会 协同工作,使成视网膜细胞瘤( r e t i n o b l a s t o m ap r o t e i n 或r b ) 蛋白磷酸化,并使其不被 激活。从而细胞到达s 状态。c d k 2 和c y c l i ne 又被两个调控者调控,第一个调控者称之为 c d k 激酶( c d ka c t i v a t i n gk i n a s e 或c a k ) ,第二个调控者为p 2 1 w a f l 。c a k 又由两个基 因产物组成:c y c l i nh 和c d k 7 。当c y c l i nh 和c d k 7 出现,c a k 可以激活c d k 2 c y c l i ne 。另 外有一个调控者会抑帛w j c d k 2 c y c l i ne ,它就是p 2 1 w a f l 。p 2 1 w a f l 又可以被p 5 3 激活。 当p 2 1 w a f l 绑定至l j c d k 2 c y c l i ne 上时,c d k 2 c y c l i n 将被抑制。另外,p 5 3 可以抑隹j l j c y c l i nh , 而c y c l i nh 可以激活c y c l i ne c d k 2 。在细胞中抑制的调控是一个非常重要的防御系统。举 一个例子,当细胞处于诱导有机体突变的物质中时,d n a 损害将会发生。最好在d n a 复制前修复d n a 损害,这样才能阻止损害的基因物质往下传递。在以往的研究中,我们 发现d n a 损害将会激发p 5 3 ,而后p 5 3 会激发p 2 1 w a f l 。p 2 1 w a f l 紧接着抑s f j c d k 2 c y c l i n e ,最终r b 被激活,d n a 合成中止p j 。 图2 - 4 细胞周期调控示意图 f i g 2 - 4ad i a g r a mi1l u s t r a ti n g t h ec e i1 c y c l er e g u l a ti o n 图2 4 展示t c d k 7 c y c l i nh ,c d k 2 c y c l i ne ,p 2 1 w a f 等对r b 的作用。p 5 3 和一些其它 的调控者没有被引入图。图形象的表明了基因之间的调控路径,箭头弧线表示激励的调 控关系,平头弧线表示抑制的调控关系。如果能够人为的干预这些调控路径,那么人类 攻克癌症的难题应该为时不远了。 2 3 2 埃希氏茵属大肠杆菌s o sd n a 修复网络 环境和生物体内的因素都经常会导致d n a 的结构发生改变。这些改变可能影响生物 细胞的功能和遗传特性,导致三种独立的结果:( 1 ) 细胞死亡;( 2 ) 使细胞获得新的功能 或进化;( 3 ) 使细胞只有d n a 结构的遗传性改变而没有表型变化。这些变化的结果因d n a 结构变化的部位、类型和范围不同而异。生物在进化过程中获得的d n a 修复功能,对生 物的生存和维持遗传的稳定性是至关重要的。 r o n e n l 4 等提出的埃希氏菌属大肠杆菌s o sd n a 修复网络包含8 个主要基因:u v r d , l o 第二章基冈调控网络概述 l e x a ,u m u d ,r e c a ,u v r a ,u w y , m v a 和p o l b 。当破坏发生时,蛋白质r e c a 变得很活跃, 它引起l e x a 绑定到单链d n a 分子,从而使l e x a 产生分裂。当没有破坏发生时,l e 】a 一 直强有力地压制着所有的基因。一k ll e x a 的表达水平下降,便会激活s o s 基因。当破坏 被修复后,r e c a 的表达水平下降,促使l e x a 开始积聚。当l e x a 积累到一定水平时,它 又开始约束那些s o s 基因,从而抑制压制他们的表达,细胞又恢复到初始的状态。如图 2 - - 5 ,图
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025兵器装备集团陵川工业春季招聘开启笔试题库历年考点版附带答案详解
- 2025中电建电力投资集团有限公司社会招聘16人笔试题库历年考点版附带答案详解
- 2025中国能建国际集团春季社招36人笔试题库历年考点版附带答案详解
- 2025中国南水北调集团水网水务投资有限公司本部及下属单位秋季招聘20人笔试题库历年考点版附带答案详解
- 2025年区块链行业技术应用案例解析研究报告
- 2025年临床检验学临床应用技术考核模拟试卷答案及解析
- 2025年化妆品行业个性化美妆品牌定位与市场推广研究报告
- 2025年大数据行业数据隐私与数据安全研究报告
- 2025年区块链行业数字资产交易市场概况报告
- 2025年清洁能源行业市场前景与政策解读研究报告
- 消防员心理测试题库及答案解析
- 2025小升初租房合同模板
- 放射科造影剂过敏反应应急处理预案
- 《大嘴巴纸玩偶》名师课件
- 2025年上海市高考英语热点复习:阅读理解说明文
- 国家管网集团合同范本
- 中医全科学科
- Unit 1 Teenage life单词变形-学生背诵与默写清单-2024-2025学年高中英语人教版(2019)必修第一册
- 铁路技术规章:018铁路军事运输管理办法
- 生物发酵安全培训
- 2024-2025学年广东省深圳市九年级上学期期中数学试题及答案
评论
0/150
提交评论