生物信息学概论第一章分子生物学和生物化学_第1页
生物信息学概论第一章分子生物学和生物化学_第2页
生物信息学概论第一章分子生物学和生物化学_第3页
生物信息学概论第一章分子生物学和生物化学_第4页
生物信息学概论第一章分子生物学和生物化学_第5页
已阅读5页,还剩82页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第1章 分子生物学和生物化学 1.1 遗传物质DNA1.2 基因结构和遗传信息1.3 蛋白质的结构和功能1.4 化学键的本质1.5 分子生物学工具1.6 基因组信息本章内容DNA(脱氧核糖核酸)是遗传物质,存储在DNA中的信息,使无活力的分子组织成为有功能的活细胞,进而构成能够进行新陈代谢、生长繁殖的生物体染色体(chromosome)是DNA的载体,基因(Genes)是具有遗传效应的DNA片段第1节 遗传物质核苷酸是构成核酸分子(DNA和RNA)的基本单位 磷酸基团 核苷酸 核糖 戊糖 脱氧核糖 碱基(A、G、T、C)1.1 核苷酸(nucleotide)四种脱氧核苷酸(deoxyribon

2、ucleic acid)AGTC腺嘌呤鸟嘌呤胸腺嘧啶胞嘧啶碳原子编号:有机化学家用数字15标明脱氧核糖的5个碳原子核苷酸连接:核苷酸只能结合在生长中的DNA或RNA分子的3上,两个核苷酸之间通常是通过3,5-磷酸二酯键(phosphodiester bond)连接的 5端未结合的磷酸基团 3端未结合的(脱氧)核糖 1.2 连接及取向54321磷酸二酯键的建立+ H2O磷酸二酯键5端的序列为上游,3端的序列为下游 上游下游 DNA分子的两条链是反向互补的 互补:G C A T G与C,A与T的配对是特异的、稳定的 反向: 5-CCCGTT-3 3-GGGCAA-5 5端的序列为上游,3端的序列为

3、下游 1.3 碱基配对(Base pairing)DNA分子中的碱基配对DNA RNA 新生肽DNA CDNA 蛋白质1.4 中心法则转录翻译RNA聚合酶核糖体复制逆转录折叠生物学中心法则:信息从基因的核苷酸序列中被提取出,以用来指导蛋白质合成的过程,这个过程对地球上所有生物都是相同的A、G、T、CA、G、U、C氨基酸链互补DNA真核生物信息传递翻译基因( Gene )是产生一条多肽链或功能RNA所必需的全部核苷酸序列。它是一种DNA序列,在有些病毒中则是一种RNA序列。基因表达(Gene expression)按照生物学的中心法则,利用存储在DNA/基因中的信息转录为RNA分子,然后再合成相

4、应蛋白质的过程基因调控:所有细胞将调控的重点放在基因表达的最开始,必须具有两种辨别能力:必须正确区别生物体基因组中与基因起点相关的部分和不相关的部分基因识别必须能确定那些基因编码在特定的时空下所必需的蛋白质第2节 基因结构与遗传信息法国生化学家F.Jacob和J.Monod最先发现细胞是如何区分应该转录的基因和不应该转录的基因。由于他们在原核生物基因调控方面的出色工作,获得了1965年的诺贝尔奖由调控基因编码的蛋白质结合在DNA上靠近其所控制的基因的启动子区域附近,由此来控制这些基因在一定条件下的表达。这些调控蛋白感知细胞的化学环境,并决定是否结合在特定的核苷酸序列上,正是这种能力使生物体能恰

5、当地对外界环境做出反应若这些调控蛋白的结合使RNA聚合酶更容易启动转录,则发生正调控若这些调控蛋白的结合阻碍RNA聚合酶启动转录,则发生负调控第2节 基因结构与遗传信息原核生物中,基因的转录和翻译同时进行;真核生物中,基因表达的两个步骤被核膜在空间上隔开.第2节 基因结构与遗传信息RNA聚合酶在基因表达起始阶段负责合成基因的RNA拷贝,因此由它们负责以上两个辨别任务第2节 基因结构与遗传信息原核生物的 RNA 聚合酶扫描整个DNA,寻找标记基因起点的约为13个核苷酸长度的特定核苷酸序列。 1个核苷酸是转录的起始点, 6个核苷酸位于距起始点上游10个碱基处, 6个核苷酸位于距起始点上游35个碱基

6、处,这些核苷酸作为一个整体,称为启动子序列。这些启动子序列结合在一起的几率大约为七千万分之一(413 = 67,108,864),这足以让RNA聚合酶可靠地、唯一地识别基因的起始位置相应的,真核生物的RNA聚合酶要识别更为复杂和更长的启动子序列2.1 启动子序列 (promoter sequences)原核与真核生物启动子转录起始位点结构基因原核生物真核生物RNA聚合酶特定结合核苷酸序列蛋白质在改变细胞化学环境方面起主要的作用,而氨基酸是构成蛋白质的基本单位。蛋白质的功能取决于翻译过程中核糖体装配的氨基酸序列,而该序列取决于翻译RNA聚合酶转录成RNA分子中的编码指令只有4种不同的核苷酸构成R

7、NA和DNA分子,而蛋白质构造中却有20种不同的氨基酸mRNA上每三个连续核苷酸对应一个氨基酸,这三个核苷酸就称为一个密码子,或三联体密码(triplet code)核糖体利用三联密码将DNA和RNA的信息翻译成蛋白质中的氨基酸序列2.2 遗传密码(genetic code)遗传密码表5端碱基3端碱基终止密码子:引起翻译的终止密码子中间位碱基终止密码子起始密码子1连续性。mRNA的读码方向从5端至3端方向,两个密码子之间无任何核苷酸隔开。2简并性。指一个氨基酸具有两个或两个以上的密码子。密码子的第三位碱基改变往往不影响氨基酸翻译。3通用性。蛋白质生物合成的整套密码,从原核生物到人类都通用。但已

8、发现少数例外,如动物细胞的线粒体、植物细胞的叶绿体。遗传密码的特点 翻译从mRNA的翻译起始位点开始,遇到终止密码子(stop codon)结束开放阅读框:一长串未被终止密码子打断的密码子串,它是许多原核生物和真核生物的明显特征核糖体只有在正确的相位或阅读框中阅读才能准确的翻译,而阅读框是由起始密码子决定的,基因阅读框的变化会产生提前的终止密码子2.3 开放阅读框(ORF)一段5-UCUAAAGGUCCA-3序列。此序列共有3种读取法: -UCUAAAGGUCCA -CUAAAGGUC -UAA AGGUCC 由于UAA为终止编码,因此第三种读取法不具编译出蛋白质的潜力,故只有前两者为开放阅读

9、框。举例基因编码区又划分为内含子和外显子.2.4 内含子(intro)和外显子(exon)剪接(splicing)真核生物转录的mRNA在接触到核糖体之前需要被修饰最重要的修饰作用剪接剪接:将mRNA中内含子的内部序列精确剪切掉并将其两侧的外显子重新连接不正确的剪切内含子将导致移码突变或提前产生终止密码子,翻译出无用的蛋白质最常见的内含子是所谓的GT-AG内含子。它以GT开头并以AG结尾。这样成对的核苷酸偶然发生率很高,对于真核生物中负责剪接的酶复合体剪接体,不足以形成可靠的信号内含子5端和3端各有大约6个核苷酸作为识别信号可变剪接(alternative splicing):不同类型的细胞中

10、,剪切结果有所不同。由识别内含子/外显子边界的剪接体及附属蛋白的精巧机制实现的。它大大增强了真核生物体蛋白质的多样性。剪接(splicing)人体的所有组织器官都会有蛋白质,蛋白质是生命的物质基础。蛋白质是人体的主要“建筑材料”。没有蛋白质的供给,人就不可能从34千克的新生儿长成5060千克重的成年人。一般说,蛋白质约占人体全部质量的18,最重要的还是其与生命现象有关。蛋白质和核酸是生命存在的主要形式。 第3节 蛋白质的结构和功能蛋白质(protein)是信息转化成生物结构和功能的表达者,是调控和实现所有生物功能的分子机器。例如: 结构蛋白/胶原酶-维持和增强结缔组织 机械酶/肌浆球蛋白-实现

11、宏观和微观上的运动 各种酶-参与生理功能 某些蛋白质与DNA或RNA相互作用产生新的蛋白质第3节 蛋白质的结构和功能蛋白质是线性的氨基酸合成的结果在生物体内会迅速折叠成一个紧密的球状结构。大多数蛋白质只有在折叠成天然球状结构的时候才能具有完全的生物活性。去折叠(变性)蛋白质在允许重新折叠的实验条件下可以折叠到原来的结构。 第3节 蛋白质的结构和功能氨基羧基侧链20种标准氨基酸具有相似的化学结构,其特征为:氨基酸分子中的碳(分子中第2个碳)结合着一个碱性的氨基和一个酸性的羧基,此外C还结合着一个H原子和一个侧链基团(用R表示)。每一种氨基酸的R都是不同的,侧链上的碳依次是第3、4、5和6位碳。每

12、个氨基酸都相同的区域叫做骨架,而可变的R基团叫做侧链氨基酸几个氨基酸组成的氨基酸链称作肽,一条较长的氨基酸链通常称为多肽(10个)或者蛋白质(50个)。当两个氨基酸实现共价结合的时候,一个氨基酸的氨基丢失一个氢,同时另一个氨基酸丢失一个氧和一个氢,脱水生成肽键。 3.1 蛋白质结构 一级结构(primary structure)不同氨基酸装配形成蛋白质的次序称为蛋白质的序列,也叫蛋白质的一级结构多肽链中氨基酸残基的排列序列,开始于氨基端(amino terminus),结束于羧基端 (carboxy terminus)。氨基酸的顺序很大程度上决定了蛋白质的折叠方式。蛋白质骨架的化学特性使骨架的

13、大多数保持平面状态。蛋白质骨架中唯一可转动的部位是碳与氮原子之间的键碳与羰基碳(与氧原子以双键相连的碳)之间的键3.1 蛋白质结构蛋白质骨架的刚性区域和可动区域(肽平面围绕N1-C旋转地角度)(肽平面围绕C-C1旋转地角度)CC11C1C1仔细观察结构已知的蛋白质,可以发现在局部结构中只有很少的几种共同模式,这种由规则的分子内氢键形成的结构,几乎在已知的蛋白质中都可以发现。这些规则结构的位置和方向形成蛋白质的二级结构两种最常见种类为-螺旋和-折叠 -螺旋:肽链主链骨架围绕中心轴盘旋成螺旋状的结构。 -折叠:在多肽链之间或一条肽链的肽段之间靠氢 键联结而成的锯齿状片层结构。包括平行折叠和反 平行

14、折叠二级结构(secondary structure)-螺旋:绝大多数为右手螺旋,角和角大约是 -60,每3.6个氨基酸残基螺旋上升一圈。 -折叠: 角和角分别为-135和135反向平行:相邻的氨基酸链方向相反平行:相邻的氨基酸链方向相同三级结构(tertiary structure)蛋白质二级结构聚集在一起并与蛋白质骨架中别的非规则结构区域结合形成整体的三维形状(球状结构)四级结构(quaternary structure)活性酶通常是由2个或更多个蛋白质链组合在一起而形成的一种复合体,这种由相互作用的蛋白质形成的整体结构被称为酶的四级结构两条以上多肽链聚集第4节 化学键的本质 许多生命基本

15、过程可以还原为一系列的化学反应和控制反应速度的酶(催化剂)的特性。化学键和氢键理论有助于深刻认识酶的作用和大分子之间的相互作用。例如:疏水作用和亲水作用的不同对酶的功能起着重要的作用;氨基酸的极性及蛋白质中的一些化学键决定着蛋白质的折叠方式;二硫键的数目决定着蛋白质的稳定性等L.Pauling写了一本书,在亚原子水平上分析这些差异及其影响,并因此获得1962年诺贝尔奖原子是化学变化中的最小单位。原子由更小的亚原子粒子构成。这些更小的亚原子粒子及原子只能由物理的方法分解,而不能用化学方法分解核物理学家已经发现几百种亚原子粒子,然而只有3种是稳定的,并对生物的化学特性非常重要,即:质子、中子和电子

16、 质子 原子核 中子原子 电子4.1 原子结构电子需要很高的能量才能脱离原子核的束缚。具有动量较大的电子在离核越远的地方运动,而动量较小的则在离核较近的地方运动在原子水平上,能量多以光量子的形式传递出去。电子吸收光后,可跃迁到更高能量级的轨道上运动由于原子的能量是量子化的,所以原子核外电子运动的轨道是不连续的原子轨道是指电子在90%时间中所占据的三维空间电子排布由于电子的负电荷互斥,所以在任一给定时间,只有两个电子能共用一个轨道。具有最低能量的电子位于最靠近原子核的轨道称为1s轨道,该轨道是球形轨道电子的第二层轨道具有较高能量水平,它具有4个轨道(2s和2p,一个2s轨道也是球形的,3个2p轨

17、道是哑铃形的)4.2 化合价(valence)原子最外层轨道中未成对电子的数目,称做该原子的化合价原子的化学性质依赖于其最外层电子。由于原子内部大部分空间是空的,在正常的化学反应中原子核永远不会相遇。质子数是不变的,但电子的位置(有时甚至是数量)会有所改变虽然保持电荷平衡在自然界具有最高优先权,但也存在着一种要保持原子最外层轨道全满或全空的强烈趋势。这些潜在的对立趋势可以通过允许电子轨道相互重叠而得到解决。由于电子轨道重叠而导致共用电子的出现,是使两个原子长期结合的典型情况,也是形成共价键的基础4.2 化合价(valence)有些元素(如He、Ne、Ar等),外层轨道没有未成对电子,所以这类元

18、素在化学性质上不活泼,不会与别的原子以共价键结合具有相似化合价的原子具有相似的化学性质(如碳C、硅Si的四个外层轨道都只有一个电子,它们的化学性质十分相似,都能形成四个共价键)因而,原子最外层轨道中未成对电子的数目,即化合价具有非常特殊的意义,并代表了它的成键能力4.2 化合价(valence)元素原子核在分子中对成键电子的吸引能力,称为电负性;不同原子核对电子的亲和力不同原子相对电负性是指为了填满或清空最外层轨道所需要或提供的电子数目键的极性与元素的电负性有关,通过元素的相对 电负性,可以大致判断两种原子生成化合物分子时, 形成的电子对的偏移程度。4.3 电负性(electronegativ

19、ity)鲍林标度电负性表电负性值较大的元素在形成化合物时,由于对成键电子吸引较强,往往带有负电;而电负性值较小者带有正电。在形成共价键时,共用电子对偏移向电负性较强的原子而使键带有极性。例如:H和C最外层电子都是半充满的,电负性本 质上相同;而O必须获得2个电子或失去6个电子, 电负性相对较高。因而CH4和H2O原子键的极性不 同氢键(hydrogen bonding)极性共价键导致电荷的轻微分离有助于形成一种重要的分子间相互作用,即氢键。由于水分子中氢原子轻微的正电荷与相邻水分子中氧原子轻微的负电荷的相互吸引作用,使每一个水分子都处于水分子网络中并与别的水分子以较弱的力相联系。氢键的键能一般

20、在42kJmol-1以下,比共价键的键能(一般在200kJmol-1 以上)小得多,而与分子间力更为接近些,但这是维持蛋白质二级结构重要的化学键。打破氢键所需要的能量比打破共价键要低得多,这是因为氢键中没有共用电子4.4 亲水性和疏水性化学家发现,多数化学物质可以轻易地分成两类:极性分子:具有极性键的分子,表 面具有能与水形成氢键的带电荷区 域,因而具有亲水性(hydrophilic)非极性分子:原子间仅以非极性共价 键相连的分子,妨碍水分子间相互 作用且阻碍它们抵消部分电荷, 因而具有疏水性(hydrophobic)疏水作用及疏水和亲水的平衡在蛋白质结构与功能的方方面面都起着重要的作用。乙醇

21、甲烷生物信息学的源泉是生物分子数据,生物学研究人员不断从他们观察到的大量序列数据中归纳出一些模式,并由此不断地去认识这些规则分子生物学家通过利用很少几种常用工具产生所要分析的原始数据,一套大约6种不同的实验室技术组合代表了分子生物学目前的全部内容。限制性酶消化凝胶电泳印迹和杂交克隆聚合酶链式反应DNA测序第5节 分子生物学工具 20世纪60年代末,在大肠杆菌中首先发现了一种酶 (EcoR),它能准确识别外来的DNA,并且在遇到特定核苷酸片段时,就将其打断。 EcoR 是应用最广泛的限制性内切酶,酶切位点和切割位点如下: 5.1 限制性内切酶 (restriction enzyme)限制性酶识别

22、的序列大多数为回文对称结构,切割位点在 DNA 两条链相对称的位置。识别序列的长度一般为 4-8 个碱基,最常见的为 6 个碱基。切割后产生粘性末端或平末端。 粘性末端:切割双链DNA分子后,在片段末端留下一小段单链DNA,这些单链区域的核苷酸序列相互之间自然互补。这种具有配对潜能的末端叫粘性末端。 平末端:不产生粘性末端的限制酶将产生平末端。(可与别的平末端的DNA分子相连接)限制性内切酶的特点DNA序列分析,将庞大的DNA分子切割成小片段便于序列分析;DNA重组;建立DNA的物理图谱等。酶切分析应用EcoR的酶切作用对于几百万个碱基对(如大肠杆菌基因组)甚至几十亿个碱基对(如人类基因组)的

23、基因组,如果用特定的限制酶完全消化,将产生成千上万条DNA片段。通常采用分子生物学的另一种工具凝胶电泳方法来将这些片段分开 5.2 凝胶电泳(gel electrophoresis)凝胶电泳通常用于分离不同物理性质(如大小、形状、等电点等)的分子,既可用做分析用途,但也可以作为制备技术。原理: 迁移速率与分子量对数、凝胶浓度成反比,分子越大则所受阻力越大,也越难于在凝胶孔隙中蠕行,因而迁移得越慢。操作:DNA(或RNA、蛋白质)片段被加到多孔凝胶一端的加样孔中,多孔凝胶通常由琼脂糖或丙酰胺制成。当在凝胶加上电场时,带电荷分子自然向电场两极之一移动。小分子比大分子更容易通过凝胶,因而可以根据分子

24、大小而分离分子。5.2 凝胶电泳(gel electrophoresis)核酸样品经琼脂糖凝胶电泳标准样品目的:在成百上千个DNA片段中寻找含有某一特定基因的片段无异于大海捞针,即使这些DNA片段已按大小分开。分子生物学家通常运用另一种技术印迹和杂交来寻找他们所要研究的目的片段印迹:将多核苷酸从脆弱的分离胶中转移到更为结实的支持物(如硝酸纤维素膜或尼龙膜)上。印迹的机制很简单,先使膜与胶接触,然后通过毛细作用将胶上的的DNA牵拉到膜上,并保持电泳过程中所形成的相对位置不变。再用紫外光照射或简单火烤,就可永久地将DNA片段结合在膜上。5.3 印迹杂交 (blotting and hybridiz

25、ation)杂交:经过标记的单链DNA片段称为探针(probe),当探针与转移到膜上的核苷酸配对时,杂交开始。探针长度通常为20多个核苷酸,它们是能与膜上的目的DNA片段唯一互补的序列。探针可以通过化学合成而得到,或者来自别的实验中分离出的DNA片段,甚至来自不同生物体的相关基因。许多方法可用来标记探针,从放射性标记到荧光标记,甚至催化特定反应的酶都可用来标记探针可以包括盐、pH缓冲液和去污剂的探针溶液在膜上冲洗(经常是几个小时甚至过夜)。可以通过控制反应条件尤其是盐浓度来控制杂交最后再冲洗去未结合的探针,检测膜上哪些序列与探针形成了结合5.3 印迹杂交 (blotting and hybri

26、dization)northern印迹法RNA片段凝胶电泳将RNA从凝胶上印迹到支持物上带有RNA片段的支持物放射性标记探针杂交目标RNA片段目的:细胞是按次序从单个DNA分子中提取并处理信息。而分子生物学家通常需要大量的裸眼可见的研究材料(几百万个分子)。DNA测序反应,需要比来自与基因组DNA的限制酶消化和凝胶电泳更高纯度的和更大量的DNA片段解决此类问题的简单方法是通过细胞的帮助产生足够数量和质量的特定DNA分子。本质上,克隆涉及将特定DNA片段插入类似于染色体的载体(vector)中,载体使它们能在活细胞内进行复制(并分离出)。由于所有片段的拷贝都是相同的,所以也叫分子克隆。5.4 分

27、子克隆(molecular clone)三要素:目的基因、载体(vector)、宿主细胞一旦用以上方法产生包含目的序列的限制性片段,其粘性末端可用于连接到用限制性内切酶切割后具有互补粘性末端的载体最早用病毒和质粒(原核细胞中染色体外DNA小片段)作为载体。这些载体在实验室易于操纵,对于克隆相对较小的DNA片段(25000个核苷酸)尤其有用后来发展到从细菌和酵母的染色体中获得载体,这类载体更适合较大的DNA片段(10万100万个核苷酸),但不易操作载体的共同特征允许自身在活细胞内复制有利于证明它们存在在宿主细胞的特征序列有益于将它们从宿主细胞的DNA分子分离出来的明显物理特征5.4 分子克隆(m

28、olecular clone)目的基因获得基因文库:所有克隆到载体上的基因集合形成基因文库。一个理想的基因文库应包括一个生物体DNA中每个片段的拷贝。cDNA文库:是建立基因组文库的另一个选择。对基因组最感兴趣的部分往往是与蛋白质编码区相关的部分。所有蛋白质编码区共有的特征是它们被核糖体翻译之前全转化为mRNA。逆转录酶可将这些mRNA与细胞内其他多核苷酸分开,并将它们转化为互补DNA(cDNA),然后克隆成为文库的一部分cDNA文库优点在于抓住了基因组的关键部分cDNA文库缺点是忽视了重要的调控序列和内含子,而它们是与基因密切相关的 5.4 分子克隆(molecular clone)分子克隆

29、方法质粒限制性酶切割质粒目的基因带有粘性末端的线性质粒限制性酶切割目的基因退火带有目的基因的质粒连接不稳定的重组体1985年由K.Mullis创建,代替克隆的一种方法。该方法依赖于DNA聚合酶的两种特性,方向性:所有DNA聚合酶在DNA合成时都将新的核苷酸加到DNA的3端互补性:DNA聚合酶的工作是利用单链DNA分子的固有信息合成双链DNA分子,并且DNA聚合酶只能通过将核苷酸添加到已存在的DNA链末端来开始DNA合成要素:少量DNA模板、引物、DNA聚合酶理论上经n次循环后,DNA链可达2n5.5 聚合酶链式反应(PCR)PCR步骤由于扩增开始时加到反应混合物中特定引物只结合到特定位点,所以

30、DNA的合成只发生在基因组特定片段如同杂交试验中的探针,PCR引物的长度通常为20或更多个核苷酸,以保证每一条引物都能唯一与基因组的目标序列结合最初合成引物的特定序列通常来自对亲缘关系较近生物体的相似区域的DNA分析,有时需要经过克隆和筛选这样繁琐的过程虽然扩增与克隆的用途相似,但是,扩增产生DNA分子的速度和效率比克隆方法更快、更有效。PCR扩增的一个突出优点是只需要使用少量的样品就可以开始扩增,而克隆需要更多的样品量5.5 聚合酶链式反应(PCR)研究核酸结构和功能的关系寻找基因和改造基因疾病诊断推断蛋白质氨基酸序列所有DNA测序策略都包括相同的3步:产生一整套相应于待研究区域只相差一个核

31、苷酸的小片段用4种不同的标签标记每一个片段,标签取决于片段末端的核苷酸利用片段间的大小差别分离那些片段(凝胶电泳),通过检测不同标签出现的顺序读出核苷酸的排列顺序5.6 DNA测序20世纪70年代末期,A.M.Maxam和W.Gilbert发展了第一种成功的测序策略,依靠化学降解来产生测序所需的小片段几年后,F.Sanger发展出一种更安全有效的基于DNA聚合酶的测序方法(称为链终止法),逐步替代了Maxam方法测序所需的小片段集合是通过修饰过的核苷酸加入链中而产生的,而该核苷酸能阻止DNA聚合酶进一步加入碱基。这些链终止核苷酸与正常核苷酸的不同点就在于缺乏3羟基,而该位置正是新核苷酸连接到D

32、NA链上的结合位点理想的测序反应中,修饰过的核苷酸与正常核苷酸以1:500左右的比例混合,该比例可是DNA聚合酶随机终止链的延伸,因此一组不超过1000个核苷酸大小的片段可以被一次测完。5.6 DNA测序F. Sanger末端终止法模板链引物双脱氧核苷酸放射自显影凝胶电泳互补链序列DNA全自动测序仪每一个测序片段(小于1000个碱基)相对于整个基因组是很小的,因而,组装序列片段是一项具有挑战性的工作基因组 (Genome): 一个生物体、细胞器或病毒的整套基因;例如,细胞核基因组,叶绿体基因组,噬菌体基因组。生物体的基因组长度可达到几百万或几十亿个碱基对,如何在获得其核苷酸序列之前就能对基因组

33、信息的数量和复杂度有所了解?第6节 基因组信息一个生物体的任何一个细胞中的DNA数量相同,这种细胞DNA总数量的量度称为C值C值悖论:物种的C值与其进化复杂性之间无严格对应关系相似物种间DNA总含量的差别经常高达100倍或更多,这清楚的表明,在某些生物体中大部分DNA是可以忽略的,它们对生物体的复杂度并不起重要作用在比较简单的生物中,C值大体与物种在形态学上的复杂度相一致,在更为复杂的生物中,C值相差很大。例如:人类的C值为3.3 10 9bp ,而最大的两栖动物C值达10 11 bp。难道两栖动物的结构和功能会比哺乳动物更为复杂?6.1 C值悖论(C-value paradox)不同种类的生

34、物的单倍体基因组中包含的DNA总量在一定意义上说,生物类群中C值变化范围宽就意味着在某些生物中有些DNA是冗余的,对生物体的复杂度不起重要作用。DNA总量变化范围的产生至少有一个原因,即在染色体上存在着不同数目的重复序列,这些重复序列是不表达的。 双链DNA的互补链经过加热或碱处理而分开(变性),当条件适宜(恢复到细胞内的条件)时,分开的双链很容易重新缔合(复性,也叫退火)通过检测变性DNA的复性过程可获得很多关于基因组结构的信息。简而言之,基因组中的序列越特异,每一条链找到它的互补链的时间就越长,因此与其互补链杂交所需的时间也越长6.2 复性动力学20世纪60年代,R.Britten揭示DNA复性过程可通过cot方程来描述。Cot方程将复性后剩余的单链DNA比例(c/c0)做为复性时间t的函数C/C0值代表了仍为单链DNA的部分,Cot则依赖于DNA浓度和复性时间的关系,它又依赖于基因组的大小C0t1/2为复性进行到一半时浓度和时间的乘积,与生物体中DNA非重复序列中的核苷酸数量直接成比例较大的C0t1/2意味着较慢的反应速度,从而反应在给定的DNA中任一特定序列可能含有较少的拷贝cot方程 C0t1/2值是基因组中不同序列(单拷贝)总长度的度量,可用来描述基因组

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论