已阅读5页,还剩73页未读, 继续免费阅读
(生物医学工程专业论文)基因表达调控信息的获取、集成和可视化.pdf.pdf 免费下载
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
东南人学硕f 学位论文 界面和良好的设计,能够真正的在数据库的层次上为用户提供不同数据间的关系夯询,卉且 还具备一定的数据可视化和分析的能力。可以说,g r i d 真正的能够存储基冈转录以及翻译 的整个调控过程,并且为生物学专业用户提供研究所需的所有材料。 关键词:基冈调控信息数据库集成可视化基冈表达 东南人学硕士学位论文 a b s t r a c t t i t l e :a c q u i s j t i o n ,i n t e g r a t i o na n dv i s u a l j z a t i o no fg e n ee x p r c s s i o na n dr e 删l a t j o ni n f o n n a “o n a u t h o r :j u n ,u t h e s i ss u p e r v i r :p r o f e s s o rx i a os u n s c h o o l :s o u 【h e a s lu n i v e r s i t v w i l h 山ea c c o m p l i s h m e n to ft h es e q u c n c i n gs t a g eo fm e h u m a ng c n o m ep r o i e c lf h g p ) a n dt h e d e v c l o p m e n lo fb i o j n f o r m a t j c s ,a1 a r g ea m o u n to r 窖e n o m ed a t ah a sb e e na c h i e v c dn o w a d a v s ,t h e r e s e a r c ho fg e n er c g u 】a t i o na n de x p r e s s i o nh a s 窟o t t e nm o r ea n dm o r ea t t e n t j o n t h er e g u l a t i o no n g e n et r a n s cr i p t i o n1 e v e li so n co fl h em o s ti m p o r 七a n tp a r t sa l s o ,t h er a p i dd e v e l o p m e n to fg e n c c h i pt e c h n o l o g ym a k e si tr e a l z a b l ct oi n s p e c tt h eg e n et r a n s c p t j o n1 e v e lc o s m i c a 】1 va n da n a l y z e 山ec o 丌c l a “o no rg e n e s t be s t a b l i s hac o m p r e h e n s i v ca n ds y s t e m i ci n t o r m a t i o np 】a t f 0 丌1 1o f 窖e n er e 窖u l a t i o n ,w ea n a l v z e t h ef a m o u si n t e m a t i o na lb i o l o 窑i c a ld a t a b a s e ss u c ha sg e n e b a n k ,1 y a n s f a c ,e p d ,s c p da n dd b s n p e t c w eh a v ca c c o m p l i s h e dt h ed e s i g no fg r i d ,m ea c q u n ga n ds y n c r e t j z i n go fd a t a ,t h e c o m p l e xq u e r y ,v i s u a 】i z a “o na n dd a t a b a s ea d m i n i s t r a t j o n a 1 l h o u 譬hj t sd a t as o u r c ec o m e sf m m t h o s ef a m o u sb i 0 1 0 9 i c a ld a t a b a s e s ,w ed on o ti m p o r tt h e s ed a t at og i u ds i m p l v w em a k ea1 0 co f w o r ko na n a l y z i n 2a n dp r o c e s s i n gt h e s ed a t aa n ds y n c r e t i z et h e mi n t ot h eg r t ds v s l e m n eg e n er e g u l a t i o nd a t aa r c 1 em a i nb o d yo fg r i da n dt h e yi n c l u d ea 1 ir e l a t i n gr e g u l a t i o n j n f o n n a t i o no r 【r a n s cr i p n o n a ss a y i n gi nd a t at y p e ,t h e ym a i n l yi n c l u d ep r 。m o l e lg e n e ,e l e m e n t , f a c t o r ,e l e m e n t ,c o n s e n s u s ,m a t r i x ,d o w n s t r e a ma n ds n pd a t a a l lt h e s ed a t ah a v em u “j p l ea n d o 昭a n i cr e l a c i o n s h i p w a l s og i v es o m el i n k st oo t h e rr e l a t i v ed a t a b a s e g r ) n o to n l yc o n t a i n sa 1 ik j n d so fr e g u l a t j o nd 砒ab u ta l s oa c c o m p l i s ht h ea n a i y s e sa n df u s i o n o f 【h e s ed a t aw ea l s od c s j g nt h en e wt a b l e sa n da p p e n dt h cn e wd a e at y p e s t o 训y ,g r i di sa s y s t e mo fk e e p i n gd e v e l o p s b e s j d c st h e s e ,w em u s ta d m i n i s t r a 七ea | | u s e r so fd a t a b a s ea n dw ea l s o n e e da d j u s lm ep h y s i c a ls m j c t u r eo fd a t a b a s es om a li tc a nw o r km o r ee 仟e c t j v c a f t e ra c c o m p l i s h i n gt h ed c s i g no rg r ,i ti sav e 叮j m p o n a n tw o r kt oj m p o na l lk i n d so fd a t a t od a t a b a s e b e c a u s ei th a sh g hc o n l j n u i l yi nt h e s ec o u r s e s ,f o r “a m p l e ,i rap i e c eo rd a t ai s j m p o r t e di n t od a t a b a s ef a l s e l yi lw 川m a k ea l | t h cf 0 1 1 0 w i n gd a t aa r ei m p o r t e df a 】s c l y :w em u s t g u a r a n t e et h ec o 丌c t n e s sa n ds e c ur i t yo ft h e s ed a t a w ea c c o m p l i s han e ws a f ea n de x a c tj m p o r l a n du p d a t ep r o g r a m b a s e do nt h e s ed a t ai ng r ,w ed e v e i o pc o m p l e xw e bq u e r yf u n c t i o n w ea l s oa 1 1 a l y z et h e s n pd a t aa n da c c o m d l i s hl h ev i s u a l i z a t i o no ft h e s ec o r r c l a t e dd a t a t h e s ev j s u a l i z a t i o n sm a k c u s e r sh a v ea ni n t u i t j o n s t cr c a l i z i n go ft h i si n f o r m a t i o n t h cu s e r sa l s om a k ean e x tq u e 眦 d o w n l o a d ,a n a l v s e sa n dg e to t h e rr e 窖u la t i o ni n f o r m a t i o na c c o r d i n gt h e i rn e e d s w ea d v a n c ean e w m e t h o dv i s u a l i z a “o nw h i c hs a v e st h er e s o u r c eo fs e r v e ra n di sm o r er a p l da n ds a f c rb yu s i n 譬 s e r v l e t + a p p l c t g r i ds y s t e mi sd e v e l o p e db ys o m ea d v a n c e dr rt 0 0 1 s i tu s eo r a c l ep r o d u c ta sd b m s ,a n d j a v a ,j s pl on n i s hw e ba p p l j c a t i o n t h e s et 0 0 1 sa r en o to n l yp o w e r f u lb u ta l s oc o m p a t i b l e ,s o g r i dc a nr u no nb o mw i n d o w sa n du n p l a t f o m s i ns u m m a r y ,g r i dd a t a b a s es y s 【e mi sag e n er e g u l a t i o ni n f o n t l a t i 。nd a t a b a s es y s t e mb yo u r o w nd e s i g n i ti sn o tam i m ) ro fa “yi n t e l l l a 【i o n a lg e n ed a t a b a s e ,b u ts u c has y s t e ma sw h i c hc a n d o w n l o a da n du p d a t ev a r i o u st y p c so rg e n er e g u l a t i o nj n f o r m a t j o nd a t a i lh a sf r i e n d l yu s e r i n t e r f a c e ,a n dc a nr e a l i z ed a t ar e l a t i o n s h i pq u e r y nd b m s f u n h e r m o r e ,g r mc a na l s od os o m e d a t av i s u a l i z a “o na n da n a l y s i sw o r k 1 1 东南大学硕+ 学位论文 k e y w o r d s :g e n er e g u i a t i o ni n f o r m a t i o n ,d a t a b a s ei n t e g r a t e d ,s u a l i z a t i 。n ,g e n ce x p r e s s i o n i n f o r m a t i o n 第一章绪论 1 1 研究背景 1 1 1 基因组研究的发展 第一章绪论 1 9 8 6 年美国科学家t h o m a sr o d e r i c k 提出了基因组学( g e n o m i c s ) ,基冈组学是指对所有 基冈进行基因组作图( 包括遗传图谱、物理图谱、转录图谱) ,核苷酸序列分析,基冈定位 和基i 天i 功能分析的一门科学。因此,基因组研究应该包括两个方面的内容:以全基因组测序 为目标的结构基冈组学( s t r u c t u r eg e n o m i c s ) 和以基因功能鉴定为目标的功能基冈组学 ( f u n c t i o n a lg e n o m i c s ) 。结构基因组学代表基因分析的早期阶段,以建立生物体高分辨遗传、 物理和转录图谱为主。功能基因组学代表基因组分析的新阶段,是利川结构基冈组学提供的 信息系统的研究基因功能,他以高通量、大规模实验方法以及统计与计算机分析为特征。 1 9 9 0 年1 0 月被誉为生命科学“阿波罗登月计划”的国际人类基冈组计划启动,人类开始 了在深层次真正了解自己的历程。1 9 9 9 年9 月我国获准加入人类基冈组计划,负责测定人类 基冈组全部序列的1 ,也就是3 号染色体上的3 0 0 0 万个碱基对,使中国成为继美、英、日、 德、法之后第六个国际人类基因组计划参与国,也是参与这一计划的唯一发展中国家。2 0 0 3 年4 月1 4 日,中、美、日、德、法、英等6 国科学家宣布人类基冈组序列图绘制成功,人类基 因组计划的所有目标全部实现。已完成的序列图覆盖人类基冈组所含基冈区域的9 9 ,精 确率达到9 9 9 9 ,这一进度比原计划提前两年多。至此,人类基i 天l 组计划:宣告完成。这也 正是沃森和克里克在s c n c e 上发表论文提出d n a 结构和自我复制机制发表5 0 周年, 可以看到5 0 年来,基冈组研究得到了令人不可思议的飞速发展。 如上所述,尽管这些关于人类基因组的结构和组成的研究得到了非凡的和迅速的发展, 但是如何解析基冈组的功能这个问题依然没有被很好的解决。冈此,解开基冈调控的秘密就 成为分子生物学研究和发展的一个热点。在后续几:1 j ,我们将分别从基冈序列、基闪的功能、 基冈表达调控这儿个方面进行论述。 1 1 2 基因序列的研究 基因组大致可以分为编码区和非编码区u j ,编码区就是能够编码蛋白质的基冈片段。在 刚刚完成的人类基因组测序计划中发现,人类d n a 中只有1 1 左朽为编码区,而剩余的大 约9 9 都是非编码区。一般来说,生物体的功能是通过多种具有一定功能的蛋白质来实现的, 而遗传物质,d n a 和r n a 就像是生物体中的指挥棒,他们决定了生物体需要合成什么样的 蛋白质,多少蛋白质,以及在什么样的时间和场合合成蛋白质,冈此遗传物质和蛋白质可以 说是生物体具有生命并且能够完成一定生物功能的载体。 d n a 是遗传信息的载体。d n a 的核苷酸序列上存在着蛋白质氨基酸序列编码信息,生 命的信息存储在d n a 四种字符组成的序列中,生物体生长发育的本质就是遗传信息的传递 和表达,d n a 序列包含着最基本的生命信息。人们已经认识到遗传信息的载体主要是d n a ( 在少数情况下r n a 也充当遗传信息载体) ,控制生物体性状的基因是一系列d n a 片段。 一方面,d n a 通过自我复制,在生物体的繁衍过程中传递遗传信息。另一方面,基冈通过 转录和翻译,使遗传信息在生物个体中得以表达,并使后代表现出与亲代相似的生物性状。 在基冈表达过程中,基因上的遗传信息首先通过转录从d n a 传到r n a ,然后再通过翻译从 r n a 传递到蛋白质。基冈控制着蛋白质的合成,基冈的d n a 序列到蛋白质序列存在着一种 明确的对应关系,而这种对应关系就是我们所知道的遗传密码。 疾病与基因直接或间接相关,通过生物学、医学等技术对相关基冈进行抑制或调控,即 东南人学硕:i :学位论文 可达到治疗某一疾病的效果。如果掌握了与某种疾病相关的基冈及突变,则可以对该疾病进 行预测、诊断,甚至治疗。人类基冈组计划的实现将对医学事业( 陈竺等,2 0 0 1 ) 、生物学 的研究乃至人类生活的各个领域产生不可估量的影响,这一点已不容置疑。人类的任何疾病 都与人类的基冈有关,都是人类基冈组与病原基因组中的有关基因相互作用的结果。例如, 所有癌症都是由于d n a 序列的变化引起的,在人的一生中,细胞中的d n a 不断受到癌诱 导物质的侵扰,同时也处于自身复制错误的危险之中,每个细胞中d n a 都可能发生变化, 在人部分情况下这些变化不会对人体产生太大的影响,但是在极端的情况下,d n a 序列的 变化可能会导致关键基冈功能的变化,引起细胞增殖的失控。上个世纪中叶,特别是7 0 年 代,人类组织的攻克肿瘤的尝试,建立了“基冈病”的概念,即不仅疾病与基冈相关,而旦 所有药物都是通过基因起作用的,都是通过修饰基冈的本身结构、改变基冈的表达调控、影 响基因产物的功能而起作刚的。要认识疾病,就一定要认识致病基冈。例如,比较正常细胞 的基因组利癌细胞基因组可以发现引发癌症的基因突变、基因组紊乱;又如,通过家系寻找 与疾病相关的基因。对疾病基冈按产物功能分类,并进行统计分析,可以发现酶或者调控蛋 白影响疾病的可能性最人。粗略估计,大约1 0 的人体基冈是可能的药靶,这3 0 0 0 个候选 基冈具有重要的社会经济价值,国际上每个大的制药公司只能掌握其中的几个,制药业面临 着新的挑战。 人类基因组计划得到的是人类基冈组的蓝图,但是个体基因组之间并非完全相同,存在 着人约o 1 的差距,这就是所谓的基冈多态性。这种基因组之间的差异规定了人与人的不 同,利用基冈多态性可以进行亲子分析,实现个人身份鉴别。对基冈多态性的分析将会使我 们能够揭示个人能力的遗传学基础,这些个人能力包括计算能力,记忆能力,身体协调性, 甚至可能是创造力。基冈多态性在医学上表现为不同的人对基冈的易感性或抵抗性,同时也 表现为针对同样疾病同样治疗的效果不一样,有的人病愈,有的人则治疗效果不明显。基因 组计划( 特别是即将进行的人类基冈变异图谱计划) 将促进个体化治疗的发展,在不久的将 来,我们可以根据不同患者的致病基冈,研制出适合于他们的治疗药物。如果真能做到“因 人施药”,可能是基冈组研究给患者带来的最大福音。 要想真正认识基冈序列及它们的功能,我们必然要研究基冈的表达和调控。在一个生物 体中,任何细胞都带有同样的d n a ,带有同样的基因,但是一个基因在不同组织、不同细 胞中的表现不一样,这是由基冈调控机制所决定的。遗传信息从d n a 传到蛋白质的过程称 为基冈表达,对这个过程的调节即为基冈表达调控。一个细胞在特定的时刻仅产生很少一部 分蛋白质,也就是说,基冈组中只有很少一部分基冈得以表达。基冈调控机制根据各个细胞 的功能要求,精确地控制每种蛋白质的生产数量。生物体完整的生命过程是基冈组中的各个 基冈按照一定的时空次序开关的结果。原核生物和真核单细胞生物直接暴露在生存环境之 中,根据环境条件的改变合成各种不同的蛋白质,使代谢过程适应环境的变化。高等真核生 物是多细胞有机体,在个体发育过程中出现细胞分化,形成各种不同的组织和器官,而不同 类型的细胞所合成的蛋白质在质和量上都是不同的。冈而,无论是原核还是真核细胞都有一 套精确的基因表达和蛋白质合成的调控机制。 细胞要维持其功能,有些蛋白质在任何时候都是必需的,这些蛋白质所对应的基因称为 管家基因,它们随时都要表达。编码细胞特化蛋白质的基冈叫诱导基冈,这些基冈在需要对 应蛋白质的时间和地点才表达。虽然生物体内的每一个细胞都有完整的基冈组,但各种细胞 基冈表达的规律是不一样的。要了解生物的生i 炙发育的规律、形态结构特征和生物学功能, 就必须要研究基冈表达调控的时间和空间规律,掌握基因表达调控的秘密。 1 1 3 基因表达与调控 1 起源及介绍 分子遗传学基本理论建立者j a c o b 和m o n o d 最早提出的操纵元学说打开了人类认识基 冈表达调控的窗口,在分子遗传学基本理论建立的6 0 年代,人们主要认识了原核生物基冈 表达调控的一些规律,7 0 年代以后才逐渐认识了真核基冈组结构和调控的复杂性。1 9 7 7 年 最先发现猴s v 4 0 病毒和腺病毒中编码蛋白质的基冈序列是不连续的,这种基冈内部的间隔 | 又:( 内含子) 在真核基冈组中是普遍存在的,揭开了认识真核基冈组结构和调控的序幕。1 9 8 1 2 第一章绪论 年c e c h 等发现四膜虫r r n a 的自我剪接,从而发现核酶( r i b o z y m e ) 。8 0 一9 0 年代,使人们 逐步认识到真核基冈的顺式调控元佴:与反式转录冈子、核酸与蛋白质问的分子识别与相互作 用是基冈表达调控根本所在。 基冈表达( g e n ee x p r e s s i o n ) 是指存储遗传信息的基冈经过一系列步骤表现出其生物功 能的整个过程。典型的基冈表达是基冈经过转录、翻译,产生有生物活性的蛋白质的过程。 这是从基冈到蛋白质的过程。目前基冈表达调控是分子生物学研究的一个重点,基冈转录水 平上的调控是最重要的环:15 。人类基冈组计划的顺利实施和其它模式生物基冈组测序工作逐 步的进行,为研究人类基冈及基冈表达打下了坚实的基础。而基冈芯片技术的迅速发展,已 使人规模检测基冈转录水平、研究基冈表达时时空规律、分析基冈之间的相互作用关系成为 现实。 基l 天l 转录调控信息隐藏在基因组序列中,基冈表达数据代表基冈转录调控的结果,是转 录调控信息的实际体现。如果能将基冈表达数据与基冈调控| 又:域的核酸序列结合起来,可望 发现基因转录调控信息,揭示基冈调控信息组成的规律。通过分析基冈表达数据,在基冈组 中寻找共调控基冈,即表达水平上调或下调趋势一致的基因,这些基冈具有相同的转录调控 信息。然后通过信息化的方法,分析隐藏在基冈组序列中的转录调控信息。具体说就是通过 聚类分析,将共调控基因聚焦成类,分析和识别同类基因所共同拥有的转录调控元件。这里, 转录调控元件是转录调控信息的载体。接下米,我们将简单介绍一些与基因调控表达发挥作 用的过程以及主要的调控信息。 2 主要的调控信息 冈为生物体的遗传信息全部编写在d n a 上( 低等生物在r n a 上) ,在进行基冈表达的时 候,首先基因信息被转录到m r n a 上,然后再翻译成蛋白质。这是生物学中最基本的规律。 这种转录和翻译是忠实的,从而保证了生物的遗传特性。但是基冈表达的程序、时间和位置 义是受不同层次的调控信息控制的,这种调控机制不仅决定了基闪的产物的数量,而且也决 定了基冈表达的时空秩序性。生物的止常生长、发育和分化都是基冈受控表达的结果。一旦 这种调控机制由- 丁种种原冈出现了差错,就会导致各种各样的病变。同时,基冈转录受调控 因子以及调控元件以及它们相互作用的控制;此外,d n a 序列与蛋白质序列的对应关系, 还有很多目前不确定的因素,例如真核基冈的不连续性,转录后的剪接;翻泽过程中m r n a 的再次程序化的遗传译码,以及翻泽后蛋白质的多肽剪切等等。这些都说明了遗传信息的传 递方式是多种多样的,而且控制机制十分复杂。 从d n a 到蛋白质要经历两个过程,转录和翻译。基冈调控机制始终贳穿在这两个过程 中,首先我们介绍一下主要的调控信息: ( 1 ) 基冈:d n a 上面的某些片断,是整个转录利翻译过程中的主角之一,转录的目的 就是把d n a 上的基因片断按照碱基互补的原则“拷贝”到m r n a 上,而翻译则是按照基冈片 断上记录的信息合成相应的蛋白质。调控机制就是作用i 丁基冈的。 ( 2 ) 启动子区域:一般是位于基冈的上游的某一个d n a 区域,这个区域被认为和转录 调控有着直接的关系,调控机制一般是通过转录冈子同启动子区域中的某一些特定的片断相 结合,从而开启、加速、延缓转录的过程。 ( 3 ) 调控元件:启动予区域中与转录冈子结合的片断就叫做调控元件或者n l 做结合位点, 转录的过程正是通过不同的结合位点和转录冈子相结合而得到调控的。 ( 4 ) 蛋白质转录冈子:实现生物体功能的主体,是d n a 遗传信息实现的途径,也是转 录和翻译过程中另外一个主角。同时它还有另外一项和调控直接相关的功能,转录因子功能。 转录冈子就是具有某些特异性的蛋白质,他们通过和特定的调控元件结合而达到不同的调控 结果。 基因转录是指d n a 双链解旋后,按照碱基互补原则把基冈信息转录到r n a 上,再由r n a 翻译成具有一定功能的蛋白质。基冈调控的作用是激发或者抑制转录过程中的基因表达,每 个细胞都有一定的基冈调控系统,使各种蛋白质只有在需要的时候才被合成,这样才能使生 物适应多变的环境,防止生命活动中浪费和有害后果的发生,保持体内新陈代谢的正常进行。 而这种调控往往是由某些特异性的蛋白质和基因相结合而发生的作川。我们可以认为这个过 程是由蛋白质影响基冈的过程。 3 基冈表达调控的层次 基冈表达调控主要表现在几个方面,第一是染色质水平上的调控。基冈转录前染色质结 3 东南大学硕士学位论文 构发生一系列重要变化是基因转录的前提,活化的基冈处丁染色质的伸展状态之中,可以被 转录,而1 f 活化的染色质d n a 不能被转录。第二是转录水平上的表达调控,这是最主要的 基冈调控方式。转录水平凋控的重点是在特定组织或细胞中、在特定的生k 发育阶段、在特 定的体内外条件f ,选择特定基因进行转录表达。第三是转录后调控,指基因转录起始后对 转录产物进行的一系列修饰、加i 一等调控行为,主要包括提前终j l 转录过程,对m r n a 前体 进行加。i :剪切,m r n a 通过核孔和细胞质内定位,r n a 编辑。第四是翻译水平上的调控,这 是基冈表达调控的重要环节,翻译的速率和细胞生长的速度之间是密切协调的。在肽链合成 的起始、延伸和终止三个阶段中,翻泽起始速率的调控是重要的,而在翻泽的延伸和终e 阶 段也存在着调控因素。最后一个方面的调控是蛋白质活性的调节。来白m r n a 遗传信息翻译 成蛋白质后,这些蛋白质如何活化并发挥其生物学功能,涉及到蛋向质合成后的加工问题。 从i n r n a 翻洋产生的多肽中,经过正常折叠有些已经具有生物活性,然而对丁真核生物中人 部分蛋f 1 质来说,还需要进一步加t :、修饰和活化,才具有生理功能。这种修饰有时还是不 可逆转的过程。接着我们要简单介绍一r 主要研究且较复杂的真核生物调控机制。 4 真核生物调控 在真核细胞中,调控机制要比原核细胞复杂的多,真核基吲的表达调控主要钉三种形式: ( 1 ) 结构基因的内部或其附近存在对基闪表达起调控的d n a 序列:( 2 ) 基因中某段富含c g 的序列的甲基化对基因表达起调控作用;( 3 ) 通过染色体结构的变化控制基冈的表达。一般 认为,在真核基因的基冈上游有一个启动子区域,这个区域一般包含有许多的调控元什,对 转录过程起到促进作用的增强于、对转录过群具有多重复杂作用的其他调控元件、以及对开 启转录有很大影响的“1 k r a 盒”等等,如图1 1 所示;下游则是由一些外显子和内含子的基 冈片段组成。 图l 一1 基冈转录调控1 对转录具有很火影响的启动子区域是我们研究的重点,再这个区域中包含了一个个的凋 控元件( e l e n l e n t ) ,或者叫做结合位点( b j n d i n gs i t e ) ,这些调控元件和一些特定的转录因子相 结合就能对基冈的转录起到调控的作用。值得注意的是,在启动子区域中有一个很特殊的结 台位点:t a t a 盒,一口它和相应的转录冈于相结合就会启动整个d n a 到m r n a 的转录过程, 转录酶就会从转录起始点开始转录,如图1 ,2 所示: 4 第一章绪论 图l 一2 基冈转录调控2 5 中心法则 通过前面的论述我们已经知道蛋白质是细胞内的重要成分,它主要存在丁细胞质中。田 为d n a 分子较大,难以穿透过细胞核膜,所以细胞要如何接收核内的d n a 密码讯息米启 动合成过程一直凼扰着人们。】9 5 7 年,英国的一位生物物理学家克里兜( f r a n c i s c r i c k ) 提 山一个假设,他认为d n a 会先将讯息传递给r n a ,而r n a 在将讯息传递给蛋向质,这就 是最早的中心法则。接着在1 9 6 1 年,法围的分子生物学家莫诺以及生物化学家雅各布义提 出了“信使r n a ”的概念,他们认为d n a 经由转录作川后会形成信使r n a ,而信使r n a 会携带处理斤的讯息去合成蛋白质。1 9 7 0 年,荚国病毒学家特明、巴尔的摩发现了“逆转 录酶”n ,揭示了生物遗传中存在着由r n a 形成d n a 的过科,使得中心法则的思想更为 完善。 d n a 是遗传物质,是携带遗传信息的载体。生物体的遗传信息以密码形式编玛在d n a 分子上,表现为特定的核茁酸排列顺序,并通过d n a 的复制( r e d l c a “o n ) 使遗传信息从亲 代传向子代。在;彳代的生k 发育过程中,d n a 分子中的遗传信息转录( t r a n s c r i d t i o n ) 到r n a 分子中( 即以d n a 为模板合成r n a ) ,再由r n a 翻译( t r a n s l a t i o n ) 生成体l 勺各种蛋白质, 行使特定的生物功能。这样,通过遗传信息从亲代传向子代,并在于代表达,使得子代获得 了亲代的遗传性状。另外,科学家还发现一些病毒中存在着由r n a 转录为d n a 的逆转录 酶,并且r n a 能进行 j 我复制。另外,某些特异性蚩白质会以转录冈子的形式在d n a 向 r n a 的转录过程中起到调控的作心。中心法则如幽1 3 所示: 髓p p 沁n 洲m r n 会( p r o t e i 二裂慈器|d n a 、t p e d 【e is y n 【i i e s l 5 , i、 一。;享乏一、。 熬= 赢一叼r k j 二一一i ,j 夕 。c i j 0 占 , 。一、一 i :;= 3 t r a n s c r i p t i o n r i b o s o m e ( r n as y n t h e s i s ) p r o t e i n a 譬竺。卜一。竺卜一二竺_ 目目蚶- _ _ 一- 。j 图1 3 中心法则 中心法则说明了遗传信息由d n a 分子到r n a ,再到蛋白质的传递过程,其中包括d n a 的复制、转录、翻译、m r n a 的反转录等方面。 6 研究方向 东南大学硕士学位论文 诚然,人们对基因调控的认识的发展主要由实验数据所驱动。但是,基冈表达实验并不 像基因组序列那样“干净”,下面我们会详细的进行说明。一些数据库,比如e s t 的数据是 出了名的凌乱,并且基因芯片实验的数据难以进行有价值的分析【5 】。此外,尽管在其他的生 物体上有一些通过试验确定的转录因子结合位点,但是在人类基冈组方面只有非常少的从试 验上确定的转录因子结合位点。目前,学者们正在对大量基冈表达数据进行分析研究,虽然 因为有非常多的基因芯片数据需要分析导致人们还没有获得满意的结果,但是这也为我们提 供了到调控结构的第一层次的认识。 随着基冈芯片的发展,我们能够通过芯片技术能够检测到被转录的r n a 产物的情况或 者最终的蛋白质产物,也就是基因受控表达的结果,我们称之为基因表达谱,这些表达谱受 到调控信息的影响,同时又能够反映调控信息。我们要研究调控信息,就要同时研究基因表 达,可以说基冈表达谱是我们研究基冈调控机制的一把钥匙。 1 2 基因调控信息相关数据库 1 2 1 生物学数据库的特点 国际上已经建立起许多公共分子信息数据库,包括基因图谱数据库、核酸序列数据库、 蛋白序列数据库、大分子结构数据库等。这些数据库已经成为研究人员的重要:r 具,并且成 为生物基冈各方面研究进行交流的重要平台。尤其是生物分子的三人核心数据库:p d b 、 s w i s s p r o t 和g e n b a n k ,不仅是全世界分子生物学研究者获取序列、结构以及其他研究 数据的重要来源还是他们发布自己研究成果的重要平台。国际生物分子数据库发展具有如一卜 特点: 1 )数据量火 目前基冈数据库的数据呈指数增长,以g e n b a n k 7 】为例,1 9 8 2 年只有6 8 0 ,3 3 8 个碱基对、 6 0 6 条序列,到了1 9 9 2 年增加到1 0 1 ,0 0 8 ,4 8 6 个碱基对、7 8 ,6 0 8 条序列,而2 0 0 2 年则剧增 到2 8 ,5 0 7 ,9 9 0 ,1 6 6 个碱基对、2 2 ,3 1 8 ,8 8 3 条序列。如图1 4 所示: 6 第一章绪论 g r o w t ho i fg e n b a n k ( 1 9 8 2 2 0 0 4 ) 幽1 - 4g e n b a n k 数据增k 示意图 2 ) 数据及时 对于新发表的数据,廊该能够在很短的时间内( 几个小时至儿天) 通过国际互联网访问。 去年s a r s 流行期间,g e n b a n k 在4 月份就公布了s a r s 的基冈序列,为s a r s 的研究提供 了重要的第一手资料,并且还不断公布研究的新成果。 3 ) 数据质量高 数据库管理机构对数据来源进行检查,并且关注数据库用户和专家提出的意见。 4 )数据种类众多 目前分_ j 二数据库的数据种类1 r 常多,除了核酸序列、蛋白质序列、核酸结构、蛋白质结 构这些基本的数据以外,还有表达数据,调控信息数据,甚至是一些分析数据。另夕 注释信 息也是一个重要的组成部分。 5 )数据之间的联系紧密 三种基本生物分子数据( 核酸序列、蛋向质序列、蛋向质结构) 的联系对于_ | _ j 户来说是 非常重要的。对于数据库中的每一个数据对象,必须与其它数据库中的相关数据联系起米, 这样可以从某些分子数据山发得到一系列的相关信息。例如,从某个核酸序列出发,通过交 义索引,可进一步得到对应的基冈、蛋向质序列、蛋白质结构,甚至得到蛋白质功能的信息。 6 )数据库数攮众多 目前国际上的生物分子数据库1 f 常多,除了我们上述提到的,还有很多同绕着三人核心 数据库还有上百个衍生数据库,如p i r ,s c op c 御,p d bs u m m a r y ,p r o s 兀e ,p r t , e n z y m e ,s w i s s 一3 d ,m m ,n d b 等等。如果再算上镜像数据库的话,数量将是非常惊人的。 数据量增长速度很快知名的生物分子数据库中也有很多与基网表达帚l 基囡调控信息相关的 数据库,以r 列出儿个重要的数据库。 r 面我们将简单介绍一下本数据库系统基冈和单核蔚酸多态性的两个数据源m a p v i e w e r 雨jd b s n p 。 7 东南大学硕:i 二学位论文 1 2 2 基因组相关数据库 m a pv i e w e r ( h t t p :w w w n c b i n l m n i h g o v m a p v i e w ) 提供浏览与搜索1 7 种生物完整基 冈体的功能,呈献染色体图谱,并且更进一步查询特定染色体区域的序列资料。m a pv i e w e r 从染色体为单位,提供染色体上的基冈序列,该序列在染色体上的起始和终止位置:基冈上 游启动子区域的序列、基冈下游区域序列以及它们在染色体上的起始和终j :位置,这些信息 在g r d 数据库系统中都有存档,用来生成基冈、启动子和一卜游序列的虚拟联接。另外, m a pv i e w e r 可鉴定和定位基冈,因此对疾病基冈的发现具有重要的意义。同时它还是检索 所有或单一染色体图谱的:| = 具,可用米查询基因的位置、序列资料与基因间的记录,并可整 合每一条染色体的图谱或染色体特定区域的序列资料。整合染色体图谱的方式是比对共同的 标记或基因明;而序列图谱的整合是利用共通的序列坐标系统。目前m a pv i e w e r 提供的生 物图谱包括阿拉伯芥( a r a b i d o p s i st h a l i a n a ) 、果蝇、人类、小鼠和玉米等。 e n s e m b l ( h t t p :w w w e n s e m b l o 噜) 是由e b i 和w t s i ( w 色l l c o m e1 s ts a n g e r ) 的一个 合作计划,其目的是建立一个保存大型真核生物基冈组自动注释的系统,产生、呈现并维护 其注释所得的结果。并且为大规模基冈组序列分析提供生物信息学方法。e n s e m b l 现在包括 了9 种生物的基冈组,分别为五种脊柱动物h u m a n ,m o u s e ,r a t ,f u g u ,z e b r a f i s h ,两种蠕虫 c a e n o r h a b d i t i sb r i g g s a ea n dc a e n o r h a b d i t i se l e g a n s , 两种昆虫d r o s o p h i l am e l a n o g a s t e r 、 a n o p h e l e sg a m b i a e 。e n s e m b l 提供9 0 以上的人类已知基闪在染色体上的位置,预测额外的 约10 0 0 0 个基冈和支持这些基冈存在的证据,并提供索引使它和互联网上其他的相关资料库 能互相索引。e n s e m b l 还开发了人量的软件,所有软件和数据都是免费的且无任何限制,而 且数据比较全。 地球上的人部分物种各自都具有其特定的稳定的基冈组序列,但对于一个物种群体中的 每一个个体,在其d n a 序列上的某些特定的位置会出现不同的碱基,这就是s n p ( s i n g l e n u c l e o t i d ep o l y m o 印h i s m s ) ,它们被认为在疾病的易患病体质,对药物具有抗药性或药物过 敏体质以及在临床上的个体差异现象扮演了及其重要的角色。冈此对s n p 和突变的发现成 为当今的生命科学领域研究的热点。不同的人群( 种) 有不同的s n p ( 单核苛酸多态性) 分布 特征,这是他们的种族起源、各种遗传疾病易感性、外貌和生理特征等方面的差异在基冈组 水平上的表现。人类在基冈上的相似率达到9 9 9 6 】单核苷酸多态性( s n p ) 是人类基冈变 化的一种最常见形式。s n p 是指在基冈组的一个特异和定位的位点出现两个或多个的核苷 酸可能性,s n p 出现的频率估计是每1 ,2 0 0 1 ,5 0 0 0 b p 之一。作为基冈变异的起冈,s n p 在对 疾病的认识、治疗利防治方面有着巨人的潜力。s n p 还可以揭示遗传冈素对人的行为和个 性的多方面影响。s n p 是遗传上最常见的基冈变异,两个s n p 间的平均间隔人约是1 0 0 至 3 0 0 b p 。 我们估计,s n p 位点在启动子区域或者基i 天i 下游序列上山现的位置和频率可能存在某 种规律。我们希望把与s n p 位点相关的数据直观的显示给g r d 数据库系统的用户。与s n p 位点相关的数据有启动子区域数据、基冈数据、基l 天| 下游区域数据以及s n p 自身数据。而 出现s n p 位点本身可能就是表达调控的一个结果,虽然现在研究人员并不是非常清楚s n p 位点出现的原冈。目前国际上有比较成熟的单核苛酸多态性数据库d b s n p 。 d b s n p( h t t p :,w w w n c b i n l m n i h g o v p r o j e c t s s n p ) 建立于19 9 8 年l2 月,所收录的资 料内容为各类生物物种的s n p 位点数据,其资料米源于白世界各地的实验室及研究机构, 其中包含一些生物科技公司所提交的s n p 资料库的内容。资料内容包括:s n p 在基冈体 上的位置,s n p 附近的序列,a l l e l e l 在不同人类族群中存在的比例以及这些s n p 资料中的 相关联接,包括在g e n b a n k ,d b s t s 等资料库的相关联接。目前资料库的更新速度约为每2 个月作一次更新。 1 2 3 转录因子数据库 1 、 t r a n s f a c ( h t t p :w w w g e n e r e g u l a t i o n c o m p u b d a t a b a s e s _ h t m l 撤r a n s f a c ) 德国生物:r 程研究所开发的t r a n s f a c 数据库8 】 9 1 是关于转录冈子、它们在基因组上 8 第一章绪论 的结合位点和与d n a 结合的p r o f i l e s 的数据库。由s i t e 、g e n e 、f a c l l o r 、c l a s s 、m a t r 、 c
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 函数的单调性课件2025-2026学年高二上学期数学人教A版选择性必修第二册
- 2025年下半年嘉兴电影集团有限公司(含下属单位)公开招聘工作人员9人笔试考试备考题库及答案解析
- 2026浙江宁波市北仑区教育局招聘事业编制教师195人笔试考试备考题库及答案解析
- 2025贵州凉都能源有限责任公司招聘10人考试笔试备考试题及答案解析
- 2025年河北顺德城市运营管理有限公司邢台高新区商管分公司公开招聘劳务派遣人员2名笔试考试备考试题及答案解析
- 2025江苏盐城市城市资产投资集团有限公司招聘18人笔试考试备考试题及答案解析
- 2025黑龙江大庆市人力资源和社会保障局所属事业单位选调1人笔试考试备考题库及答案解析
- 2025泗泾镇公开招聘镇属企业、城运中心合同制人员8人笔试考试备考题库及答案解析
- 2025中国人民保险集团股份有限公司楚雄州分公司招聘30人笔试考试参考题库及答案解析
- 2025年新能源物流车辆新能源应用案例分析报告
- 并购居间协议书范本
- Unit5Whatanadventure!StartingoutListening课件-高中英语外研版
- 2025国家外汇管理局中央外汇业务中心校园招聘笔试历年参考题库附带答案详解
- 2025吉林吉林市舒兰市总工会招聘工会社会工作者8人考试笔试参考题库附答案解析
- 大学生职业生涯规划与就业创业指导教学教案
- 杜城村道路施工方案
- 2025及未来5年渗水砖项目投资价值分析报告
- 2024南京交通职业技术学院辅导员招聘笔试真题
- 工业机器人离线编程与仿真【项目五 】教案
- 【2025年】宪法知识竞赛题库及答案
- 1.2复杂多变的关系教案 2024-2025学年统编版道德与法治九年级下册
评论
0/150
提交评论