工学分子生物学-复习资料_第1页
工学分子生物学-复习资料_第2页
工学分子生物学-复习资料_第3页
工学分子生物学-复习资料_第4页
工学分子生物学-复习资料_第5页
已阅读5页,还剩17页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、 分子生物学第一章绪论分子生物学在含义上有两种划分:一种是广义的分子生物学:蛋白质及核酸等生物大分子结构和功能的研究都属于分子生物学的范畴,即从分子水平阐明生命现象和生物学规律。一种是狭义的分子生物学:偏重于核酸(基因)的分子生物学主要研究基因或DNA的复制、转录、表达和调控等过程,当然也涉及与这些过程相关的蛋白质和酶的结构与功能的研究基因的分子生物学。分子生物学发展的三大支撑学科CellbiologyGeneticsBiochemistry理论上的三大发现40年代,Avery发现了生物遗传物质的化学本质是DNA50年代,Walson-crick提出了DNA结构的双螺旋模型,搞清楚了生物遗传的

2、分子机制3.60年代,确定了遗传信息的传递方式:DNAfRNAfprotein技术上的3大发明“基因剪刀”限制性核酸内切酶发明载体(“车子”)基因工程(技术)诞生的第2个技术准备1970年,Baltimore和Temin等同时各自发现了逆转录酶,打破了遗传学的中心法则,使真核基因的制备成为可能。第二章核酸的结构和功能作为遗传物质必须具有以下的特性:一是能够储存并表达遗传信息二是能够把遗传信息传给子代三是物理化学性质稳定四是有遗传变化的能力第一节细胞中的遗传物质细胞核与细胞质中都存在DNA细胞核遗传的遗传物质在细胞核中的染色体上,细胞质遗传的遗传物质在细胞质中的线粒体和叶绿体中。细胞核遗传雌雄配

3、子的核遗传物质相等,而细胞质遗传物质主要存在于雌配子中。细胞核和细胞质的性状表达主要通过体细胞进行的。细胞核遗传物质的载体(染色体)有均分机制,遵循三大遗传定律;细胞质遗传物质的载体(具有DNA的细胞器如线粒体、叶绿体等)没有均分机制,而是随机的。细胞核遗传时,正反交相同,即子一代均表现显性亲本的性状;细胞质遗传时,子一代的性状均与母本相同,即母系遗传,正反交不同。RNA作为遗传物质一些病毒采用RNA作为遗传物质,通过复制其互补链来遗传,利用宿主细胞为其合成包装外壳蛋白。除了传统意义上的遗传物质外,还有一种朊病毒蛋白,开创了蛋白本身作为遗传物质的新领域一、细胞核内的遗传物质染色质是遗传物质存在

4、形式,染色质以两种状态存在,按其形态表现和染色质性能区分为常染色质(euchromatin)和异染色质(heterochromatin)。核酸(nucleicacid)是构成染色质的基本化学成分之一,它的结构单元是核苷酸(nucleotide),由于核苷酸中戊糖种类的不同,天然存在的核酸可分为脱氧核糖核酸(deoxyribonucleicacid,DNA)和核糖核酸(ribonucleicacid,RNA)两类。二、细胞质内的遗传物质细胞质(cytoplasm)是细胞质膜以内、细胞核以外的部分。由均质半透明的胞质溶胶(cytosol)和细胞器及内含物组成。细胞器包括:线粒体、内质网、内网器(高

5、尔基体)、溶酶体、微丝、微管、中心粒等。这些细胞器均是互相分隔的封闭性区室,各具备一套独特的酶系,执行着专一的生理功能。1、线粒体(mitochondria)线粒体是真核细胞内的一种重要和独特的细胞器,它是细胞的“能量转换站”,可以合成一些蛋白质,被称为半自主的细胞器。线粒体DNA(mtDNA)有两条单链,由重链和轻链之分。重链复制起点为OriH,轻链复制起点为OriL,两者相距llkb。重链和轻链之间碱基的取代比例不同。2、叶绿体(chloroplast)高等植物不同物种叶绿体基因组的大小相差不大,约在130-150kb之间,细胞中叶绿体基因组的拷贝数与叶绿体数目及每个叶绿体中基因组拷贝数有

6、关。也能合成蛋白质。叶绿体DNA(ctDNA)高等植物叶绿体的DNA为双联共价闭合环状分子,通常一个叶绿体含有1050个DNA分子。3、核糖体(ribosme)核糖体是由核糖体RNA(rRNA)和蛋白质组成的椭圆形致密颗粒,并非膜性结构,是合成蛋白质的场所。4、质粒(plasmid)质粒是染色体外能够进行自主复制的遗传单位,包括真核生物的细胞器和细菌细胞中染色体以外的脱氧核糖核酸(DNA)分子。现在习惯上用来专指细菌(主要是大肠杆菌)、酵母菌和放线菌等生物中染色体以外的DNA分子。在基因工程中质粒常被用做基因的载体。第二节DNA的组成DNA的一级结构DNA分子中各脱氧核苷酸之间的连接方式(3-

7、5磷酸二酯键)和排列顺序叫做DNA的一级结构,简称为碱基序列。一级结构的走向的规定为5f3。不同的DNA分子具有不同的核苷酸排列顺序,因此携带有不同的遗传信息。主链是亲水的,侧链(碱基)是疏水的.主链的脱氧核糖的羟基能与水形成氢键,而磷酸基团在生理条件下离解为负离子.磷酸呈四面体构型,脱氧核糖呈折叠的五元环,碱基是平面的.第三节DNA的二级结构(双螺旋结构)一、双螺旋结构提出的前期重要工作1,DNA碱基组成的Chargaff规则腺嘌呤和胸腺嘧啶的摩尔数相等,即A=T。鸟嘌吟和胞腺嘧啶的摩尔数也相等,即G=C。嘌呤的总数等于嘧啶的总数,即A+G=C+T。二、B-DNA双螺旋结构1953年Wats

8、on和Crick提出DNA双螺旋结构模型。DNA是由两条反向平行的多核苷酸链组成的,分子的主链位于螺旋的外侧,碱基则堆积于螺旋的内部,两条多核苷酸链通过碱基间的氢键相结合。双螺旋模型参数直径20A螺距为34A(任一条链绕轴一周所升降的距离每圈有10个核苷酸(碱基)两个碱基之间的垂直距离是3.4A。螺旋转角是36度有大沟和小沟配对碱基并不充满双螺旋空间,且碱基对占据的空间不对称4、大沟和小沟和结构参数大沟中碱基差异容易识别,往往是蛋白质因子结合特异DAN序列的位点四、DNA的双螺旋结构稳定因素氢键碱基堆集力,碱基处于疏水环境中磷酸基上负电荷被胞内组蛋白或正离子中和,离子键范德华力氢键(Hydro

9、genbond46kc/mol)磷酸酯键(phosphoesterbond8090kc/mol)0.2mol/LNa+生理盐条件,消除DNA单链上磷酸基团间的静电斥力碱基堆积力(非特异性结合力)疏水作用力(Hydrophobicinteraction)不溶于水的非极性分子在水中相互联合,成串结合的趋势力.范德华力(Vandewaalsforce)(1kc/mol0.6kc/mol)Xn五、DNA的双螺旋结构的意义该模型揭示了DNA作为遗传物质的稳定性特征,最有价值的是确认了碱基配对原则,这是是DNA复制、转录和反转录的分子基础,亦是遗传信息传递和表达的分子基础。该模型的提出是本世纪生命科学的重

10、大突破之一,它奠定了生物化学和分子生物学乃至整个生命科学飞速发展的基石。第四节A-DNA,B-DNA,Z-DNAB-DNA此外人们还发现了A、C、D、E等右手双螺旋和左手双螺旋,Z构象等形式在溶液中,DNA一般为B型。但在水的活度降低时,就转变为A型。自然状态下,A-DNA可能存在于DNA-RNA的杂交分子,和双链RNA分子中。与B-DNA相比,Z-DNA更为细长。有证据表明,Z-DNA存在于天然DNA中,但量极微小,有些证据表明,Z-DNA的存在与基因表达的调控有关。三种DNA双螺旋构象比较外型螺旋方向螺旋直径碱基直径每圈碱基数碱基倾角(度)大沟小沟A粗短右手B适中右手2.55nm2.37n

11、m0.23nm1119很窄很深很宽、浅0.34nm10.41很宽较深窄、深Z细长左手1.84nm0.38nm129平坦较窄很深第五节DNA的变性和复性DNA的紫外吸收性天然DNA变性DNA单核苷酸总吸收值当浓度都为50ugml时,双螺旋DNA的A260=1.00,单链DNA的A260=1.37.单核苷酸的的A260=1.60一、DNA的变性变性danaturation:在物理、化学因素影响下,DNA碱基对间的氢键断裂,双螺旋解开,伴有A260增加(增色效应),DNA的功能丧失。常用的DNA变性方法主要是热变性方法和碱变性方法。热变性使用得十分广泛,特别是用于变性动力学的研究。碱变性方法在pH=

12、11.3时,全部氢键都被淘汰,DNA完全变成单链的变性DNA。在制备单链DNA时,优先采取这种方法。或者盐浓度低于0.01mo1L。在这样低盐浓度时,由于磷酸基的静电斥力,可以配对的碱基无法相互靠近,碱基堆集作用也仍然保持在最低水平。熔解曲线与Tm值缓慢而均匀地增加DNA溶液的温度(现可做到0.1C/分)可根据各点的A260值绘制成DNA的熔解曲线Tm:熔解温度(meltingtemperature)DNA的变性发生在一个很窄的温度范围内,通常把热变性过程中A260达到最大值一半时的温度称为该DNA的熔解温度,用Tm表示。Tm的大小与DNA分子中(G+C)的百分含量成正相关,测定Tm值可推算核

13、酸碱基组成及判断DNA纯度。同时,溶液的离子强度和环境条件也会影响Tm值影响Tm值的因素在A,T,C,G随机分布的情况下,决定于GC含量GC%含量相同的情况下,碱基排列对Tm值具有明显影响.即嘌呤嘧啶的排列顺序对双螺旋结构(稳定性)的影响.氢键数目相同,但相邻碱基的堆积力不同从嘌呤到嘧啶方向的碱基堆积力作用显著地大于同样组成的嘧啶到嘌呤方向的碱基堆积作用.有变性剂存在时尿素,甲酰胺与碱基间形成氢键,改变碱基对间的氢键,Tm值可降至40C左右.极端pH条件的影响PH=12时酮基一烯醇基PH=2时NH2NH2+(质子化)改变氢键的形成与结合力,使Tm值降低.二、DNA的复性renaturation

14、复性:在一定条件下,变性DNA单链间碱基重新配对恢复双螺旋结构,伴有A260减小(减色效应),DNA的功能恢复。不完全变性的DNA的复性只是已分开部分的双股链间碱基的重新配对,它犹如拉链的扣合。完全变性的DNA,两条分开的互补链只有在正确位点上形成氢键才能导致全面复性复性条件:1,有足够的盐浓度以消除磷酸基的静电斥力,常用的盐浓度为0.15至0.50mo1/L的NaCI。2,有足够高的温度以破坏无规则的链内氢键,但又不能太高否则配对碱基之间的氢键又难以形成的。一般使用比Tm低20C-25C的温度。复性机制复性并不是两条单链重新缠绕这样的简单过程。它首先从单链分子的无规则碰撞运动开始,这种碰撞过

15、程是随机的,与DNA的浓度,溶液的温度和离子强度有关。有时两条单链之间非对应的某一小段碱基之间也能形成氢键,但总的来说,这样的安排使链上的大部分碱基都不能互补。这样的碰撞可能多次发生,但所形成的氢键都是短命的,很快会被分子的热运动所瓦解。只有当应该配对的一部分碱基相互靠近时,一般认为需要10个一20个碱基对特别是富含GC的节段首先形成氢键,产生一个(或几个)双螺旋核心然后,两条单链的其余部分就会像拉拉链那样迅速形成双螺旋结构。完全变性DNA一般需要几个小时才能复性。如DNA仅部分变性,它的复性表现为快速的一级反应。影响DNA复性过程的因素:阳离子浓度复性反应的温度低于Tm值25C左右(60-6

16、5C)S.S,DNA的初始浓度C0S.S.DNA分子的长度(片段的大小)DNA分子中,dNt的排列状况(随机排列,重复排列)Cot曲线DNA复性是一种双分子二级反应,单链消失的速度可用下面公式表示:dC/dt=kC02其中C为单链DNA的浓度,单位是每升的核苷酸摩尔数;t是时间,单位为秒;k是二级反应常数,单位是升/mol秒,k值取决于阳离子浓度、温度,片断大小和DNA分子序列的复杂性。CO为单链DNA的总浓度。重排成C/CO=l/(l+kCot)。复性的分数C/C。是起始浓度和经过时间的乘积Cot的函数,这样的函数可以绘成下面的图,称为Cot曲线。三、分子杂交不同来源的DNA单链间或单链DN

17、A与RNA之间只要有碱基配对的区域,在复性时可形成局部双螺旋区,称核酸分子杂交(hybridization)制备特定的探针(probe)通过杂交技术可进行基因的检测和定位研究。基因芯片(GeneChip)基因芯片又称DNA芯片(DNAChip)或生物芯片(Biologicalchip),是指将大量探针分子固定于支持物上,然后与标记的样品进行杂交,通过检测杂交信号的强度及分布进而对靶分子的序列和数量进行分析。芯片技术的应用1.DNA序列测定建立在特定序列的DNA与特定长度的寡核苷酸集合的杂交的基础之上。未知DNA序列可以通过鉴定与靶DNA序列形成完整的双链体寡核苷酸的重叠区域来确定;65536个

18、八核苷酸点阵可测定约200个核苷酸的序列;一百万个十二核苷酸点阵可测定约1000个碱基对;蛋白质芯片基因组计划后的另一项重要计划:蛋白组计划;正常与癌变细胞蛋白谱的差异分析。基因突变检测与遗传病和肿瘤诊断点突变,基因缺失、扩增、插入、重复、倒位等。药物筛选在基因水平上寻找药物靶标,毒性对基因的影响。微型化分析仪器快速、平行、重复性检测。第八节超螺旋DNA超螺旋结构的方向性超螺旋状态的定量描述公式1:L=T+WL连环数(linkingnumber),DNA双螺旋中一条链以右手螺旋与另一条链缠绕的次数。TDNA分子中的螺旋数(twistingnumber)W超螺旋数或缠绕数(writhingnum

19、ber)公式2:入=(L-L0)/L0入一一超螺旋度(degreeofsupercoiling)L0松驰态DNA连环数超螺旋是DNA三级结构的一种普遍形式,主要是负超螺旋。DNA的变化情况:超螺旋是DNA三级结构的一种普遍形式,主要是负超螺旋。DNA的变化情况:DNA在水溶液中,构型偏B型状态DNA以10.5bp/helix为最稳定构型小于10.5bp/helix向正超螺旋发展(紧缩态)大于10.5bp/helix向负超螺旋发展(松弛态)天然的DNA都是负超螺旋但一些生命活动过程中存在正超螺旋二、拓朴异构酶除连环数(L)不同外其他性质均相同的DNA分子称为拓扑异构体(topoisomerase

20、)只在连接数上有差别的同种DAN分子称为这种DNA的拓扑异构体.DNA拓扑异构酶(topoisomerase)通过改变DNA的L值而影响其拓扑结构。催化DNA由一种拓扑异构体转变成另一种拓扑异构体的酶类拓朴异构酶可分I型和II型两类拓扑异构酶I通过使DNA的一条链发生断裂和再连接,能使超螺旋DNA转变成松弛型环状DNA,每催化一次可消除一个负超螺旋,即使L增加1,反应无需供给能量。拓扑异构酶II则刚好相反,可使松弛型环状DNA转变成负超螺旋DNA,每催化一次,L减少2,可引入负超螺旋。拓扑异构酶II亦称促旋酶,它可以使DNA的两条链同时断裂和再连接,当它引入超螺旋时需要ATP提供能量。拓扑异构

21、酶的类别和特性第九节染色质的结构染色体原来是指真核细胞染色后存在于核内的着色物体。它只存在于分裂中的真核细胞内。在非分裂细胞内,它是无定形的,并弥漫于核内,只是在有丝分裂前才形成确定的形状。核小体(Polynucleosome)是DNA在细胞内存在的形态生物体内的核酸通常都与蛋白质结合形成复合物,以核蛋白(nucleoprotein)的形式存在。DNA分子十分巨大,与蛋白质结合后被组装到有限的空间中。人类最小的染色体(Y):DNA拉直约为1.4cm,在有丝分裂最致密状态下,这条染色体长度约为2“m,因此包装比可以大到7000。组蛋白(Histones)在染色质中,与DNA相结合的蛋白质为组蛋白

22、。组蛋白是一类较小,带正电荷,富含精氨酸和赖氨酸的蛋白质。组蛋白是已知最为保守的蛋白质中的一种。组蛋白可以分为5种基本类型,分别称为Hl,H2A,H2B,H3,H4。DNA中的一些不寻常结构(了解)DNA的有些序列会形成特定的结构,这些不寻常的结构不是完全独立于B-DNA之外的,有些以B-DNA为基础,有些由B-DNA转变而来。现已发现的DNA不寻常结构有:Z-DNA结构,单链臌泡,三链DNA,四链DNA等。反向重复序列(invertedrepeatitivesequenceorinvertedrepeatsIR)又称回文序列(廻文):指两段同样的核苷酸序列同时存在于一个分子中,但具有相反的方

23、向有时也有不完全相同的情况RNA和DNA中都可能存在此外还可有directedrepeatitivesequence正向重复序列第十节限制性内切酶(restrictionendonuclease)切断特定核酸序列中的磷酸二酯键。当一种外来DNA进入细菌的细胞,它们就会被其中的核酸酶破坏,但细菌自身的核酸却不会受到这些酶的作用。这是细菌对入侵DNA可能干扰其遗传信息的一种防卫。这一过程涉及到外来和自身DNA的降解,这称做限制-修饰系统(restriction-modificationsystem)限制性内切酶大致分为两大类类型II的限制-修饰系统由两种酶组成,限制酶仅使DNA降解,而DNA的修饰

24、由另一种甲基化酶承担。类型I的这两种活力存在于同一酶分子中。这两类酶的产物,辅助因子等也都相同。狭义限制酶指类型II的限制酶限制性内切酶的命名限制酶由三部分构成,即菌种名、菌系编号、分离顺序。例如:Hindlll前三个字母来自于菌种名称H.influenzae,“d”表示菌系为d型血清型;“III”表示分离到的第三个限制酶。EcoRIEscherichiacoliRIHindIHaemophilusinfluensaedISacI(II)StreptomycesachromagenesI(II)限制酶的特点识别顺序和酶切位点2)富含GC3)对称性一双对称4)切点大多数在识别顺序之内,也有例外5

25、)限制酶切后产生两个末端,末端结构是5-P和3-0H限制酶的用途1.DNA重组2.限制酶(物理)图谱绘制3.突变分析(RFLP分析)4.限制酶的部分酶切与完全酶切二、DNA的序列分析化学法(Maxam-Gilbert)测序原理化学法是用化学试剂在A、G、C、T处特定地裂解DNA片段,产生一簇各种长度的短链(等差数列n=1),经过PAGE和放射自显影后,可以直接读出DNA的顺序。1、用放射性核素标记待测DNA一侧末端2、将标记DNA分为G、A+G、C+T、C4个反应体系3、用不同的化学试剂处理不同反应体系,随机断裂DNA片段某种碱基中的任何一个,产生一组一端为放射线标记的末端,另一端为不同大小的

26、DNA片段的混合物4、电泳分离,放射自显影得到互相错落的梯形图谱,即可读出DNA序列嘌吟(A和G)序列测定G反应:硫酸二甲酯处理DNA链时,G的7位和A的3位氮原子被甲基化,甲基化后的卩票吟环可被哌啶取代,从而导致链断裂。由于G比A更易甲基化(5倍),且mG比mA更不稳定,因而易发生链断裂。控制好反应温度与时间,只使G反应而A不反应,从而可测出G序列。G+A反应:若用甲酯代替硫酸二甲酯,A与G均会发生反应。比较两反应系统电泳结果,就可知道A的序列。嘧啶(C和T)序列的测定T+C反应:用肼处理ss-DNA时,可使嘧啶开环,被哌啶取代后而导致磷酸二酯键断裂。C反应:若反应在高盐浓度下进行,T与肼的

27、反应受抑制,因而可测得C的序列。该法的一大优点是不需要模板,引物和DNA聚合酶。待测DNA链的检测用32p末端标记。该法测序对250bp的序列效果最佳。第三章基因与基因组模糊基因(cryptogene):这类基因在转录后通过一种特殊的加工方式即RNA编辑,对RNA进行加工,将转录子变成可翻译的mRNA,这类基因称为隐密基因或模糊基因。假基因pseudogene:一些基因的核苷酸与相应的正常基因有75%80%是同源的,但由于在某些特殊位置上的突变使其基因功能丧失。一、基因的概念基因指一段制造功能产物的完整的染色体片段,编码RNA或一条多肽链的DNA片段。结构基因(structuralgenes)

28、与调节基因(regulatorygenes)核糖体RNA基因(rDNA)与转移RNA基因(tRNA)启动子(promotor)与操纵基因(operator)都是不转录的DNA区段,确切说,它们不能称为基因。但关系到结构基因的活化或钝化。原核生物的结构基因是连续的。真核生物结构基因由外显子(编码序列)和内含子(非编码序列)两部分组成,编码序列不连续,称为断裂基因(interruptedgene)二、基因组genome基因组:一个细胞或病毒的全部遗传信息。一套完整的单倍体的遗传物质的总合;含有一种生物的一整套遗传信息的遗传物质;更确切些,核基因组是单倍体细胞核内的全部DNA分子;线粒体基因组则是一

29、个线粒体所包含的全部DNA分子;叶绿体基因组则是一个叶绿体所包含的全部DNA分子。C值(C-value):单倍体基因组中的全部DNA量(bp)将基因组DNA的核苷酸数定义为大C值,将受中心法则限定,结构基因的核苷酸数定义为小c值。C值是每种生物的一个特征,不同生物之间差别很大.低等真核生物中与形态学复杂程度相关,但高等真核生物中变化很大C值矛盾/C值悖论:C值和生物结构或组成的复杂性不一致的现象。C值变化范围宽意味着在某些生物中有DNA是不编码的从人类基因组计划的研究结果看,人类每个基因组内最高估计也仅有3万到4万个基因,即人类基因组中c值仅占C值得10%。其余90%的核苷酸序列的功能至今还未

30、能全部解码。噬菌体eX174,其基因组DNA的C值为5378bp,但其功能基因有11个,如按编码基因的最低核苷酸数2000bp估算,其c值也超过22000bp,eX174的C值远远小于c值第二节病毒基因和基因组病毒在生物学上的分化程度,比细菌、植物、动物各类群的总和还要高。因此不同类型的病毒,其基因组具有很大的差异。从核酸的类型上看,构成病毒的遗传物有些是DNA,有些是RNA,从核酸的结构看有些是环型,有些是线型,有些是双链分子,有些是单链分子,单链病毒基因组可能是正链的也可能负链的。病毒的特点:(1)病毒粒子是由蛋白质和核酸构成,其中的核酸只为DNA或RNA中的一种;(2)病毒粒子是由预先形

31、成的组分装配而成,自身不进行“生长”或发生分裂;(3)病毒自身不具备进行能量代谢和产生蛋白质合成所需核糖体的遗传信息,在能量代谢上绝对的依赖于宿主细胞一、病毒核酸的类型根据基因组核酸的类型,可以分为DNA病毒和RNA病毒。DNA病毒的DNA分子多数为双链线型结构,也有单链DNA和双链环状DNA。RNA病毒的RNA分子多数单链线状,也有双链RNA。RNA病毒的核酸有正链和负链之分。如果病毒的RNA分子直接可以作为翻译成蛋白质的模板,即mRNA分子,就是正链RNA,这些病毒就称为正链RNA病毒。如果病毒RNA本身不能作为mRNA,而是以互补的RNA链作为mRNA,病毒本身的RNA就称为负链RNA,

32、这些病毒就称为负链RNA病毒。以下介绍几种病毒的核酸类型单股正链RNA、不分节段,5端有甲基化帽,3端有poly(A)结构。脊髓灰质炎病毒、鼻病毒、多数RNA噬菌体、冠状病毒单股负链RNA、8节段,均编码蛋白质,5端由相同的13个核苷酸组成,3端有12个保守的核苷酸序列。流感病毒、滤泡性口腔炎病毒、狂犬病毒正负双链RNA,1012节段、每段编码一个蛋白质呼肠孤病毒、轮状病毒、噬菌体6单股正链RNA,有三个基本的结构基因:gag、pol(逆转录酶)、env5端有甲基化帽,3端有poly(A),另有多个基因表达调控位点。白血病病毒、肉瘤病毒、人类免疫缺陷病毒基因组:线性双链DNA,编码两大类蛋白早

33、期蛋白(E)、晚期蛋白(L)反向末端重复序列(invertedterminalrepeat,ITR)AT丰富区保守序列:ATAATATACCGC丰富区保守序列:GGGCGG,TGACGT在病毒复制过程有重要作用基因组:双链环状DNA,可分为早期区(E)、晚期区(L)、上游调节区(upstreamregulatoryregion,URR)调节转录与复制二、病毒基因与基因组的特点(1)重叠基因的概念:指两个或两个以上的基因共有一段DNA序列。重叠基因的发现:1978年,Sanger,虽X174DNA全长:5386核苷酸编码的9种蛋白全长:2000个氨基酸;3X2000=6000核苷酸根据密码子的起

34、始位置,一个DNA顺序可能有3种阅读框例如,序列ATTCGATCGCAA1)ATTCGATCGCAAATTCGATCGCAA(3)ATTCGATCGCAA但只有一种具有编码的作用,称为开放阅读框(openreadingframe,ORF)。开放阅读框:基因序列的一部分,包含一段可以编码蛋白的碱基序列,不能被终止子打断。基因重叠的方式1)大基因内包含小基因:女口:B基因包含在A基因内,E基因完全包含在D基因内。2)前后两基因首尾重叠:例1:如:基因D终止序列:5TAATG3重叠一个碱基X174DNA甘用丫土井厶基因J起始例2:如:基因A终止序列5ATGA3重叠4个碱基XSDN绘因c起始(2)噬菌

35、体(细胞病毒)的基因是连续的;而真核细胞病毒的基因是不连续的,具有内含子,果蝇蛹上皮蛋白质基因位于另一个基因的内含子之中人I型神经纤维瘤(NF1)基因的第一个内含子中有三个编码蛋白质的基因,其转录方向与NF1的相反。线虫基因组中每个基因平均有5个内含子,有的内含子中包含tRNA基因,其转录方向不一定与包含它的基因的转录方向一致。(3)除了反转录病毒以外,一切病毒基因组都是单倍体,每个基因在病毒颗粒中只出现一次。反转录病毒基因组有两个拷贝。(4)病毒基因组DNA序列中功能上相关的蛋白质的基因或rRNA的基因往往丛集在基因组的一个或几个特定的部位,形成一个功能单位或转录单元。它们可被一起转录成为含

36、有多个mRNA的分子,称为多顺反子mRNA。(5)病毒基因组的大部分是用来编码蛋白质的,只有非常小的一份不被翻译。第三节原核生物基因与基因组原核生物中我们对于E.coli的生物学的了解比任何生物都多。以E.coli为例,介绍原核生物基因及基因组结构的特点。一、原核生物核基因和核基因组的特点E.coli的遗传物质主要是染色体DNA,另外还有质粒DNA。大肠杆菌的染色体DNA是由4.2X106个碱基对组成的双链环状DNA分子。(1)操纵子功能上相关的几个结构基因前后相连,再加上一个共同的调节基因和一组共同控制的位点即启动子和操纵基因,即形成操纵子(operon)结构。这些功能相关的位于一个操纵元内

37、的若干个蛋白基因在转录时产生一个多基因的mRNAo(2)细菌基因组编码顺序一般不会重叠,不编码的DNA部份所占比例比真核细胞基因组少得多。(3)结构基因在细菌染色体基因组中除了rRNA基因为多拷贝,一般都是单拷贝,结构基因没有内含子。二、质粒质粒是染色体外能够进行自主复制的遗传单位,包括真核生物的细胞器和细菌细胞中染色体以外的脱氧核糖核酸(DNA)分子。现在习惯上用来专指细菌(主要是大肠杆菌)、酵母菌和放线菌等生物中染色体以外的DNA分子。在基因工程中质粒常被用做基因的载体。质粒是共价、封闭、环状双链DNA分子(covalentlyclosedcircularDNA),也称为cccDNA,少数

38、质粒DNA呈线状,不同种质粒大小差别较大,其大小通常在1-500kb范围内。质粒并不是细菌生长所必需的,但赋于细菌某些抵御外界环境因素不利影响的能力,如抗生素的抗性、重金属离子的抗性,细菌毒素的分泌以及复杂化合物的降解等,上述性状均由质粒上相应的基因编码。(1)自主复制性(2)可扩增性(3)可转移性(4)不相容性质粒在分子生物学研究中因其以下几个方面的特点而常常作为载体:1、体积小,便于DNA的分离与操作;2、呈环状,使其在化学分离过程中能保持性能稳定;3、有不受核基因组控制的独立复制起始点;4、拷贝数多,使外源DNA可很快扩增;5、存在抗药性基因等选择性标记。第四节真核生物基因与基因组与原核

39、生物比较,真核生物具有细胞分化、组织特化和个体发育等明显的差异。一、真核生物基因和基因组的特点真核基因组比原核基因组大得多真核生物的主要的遗传物质DNA与组蛋白等构成染色体,被包裹在核膜内,核外还有与核基因组发生互作的线粒体基因组、叶绿体基因组等真核基因组主要是二倍体,真核生物一个结构基因转录成一条mRNA,即mRNA是单顺反子,基本上没有操纵子的结构。真核细胞中许多来源相同、结构相似、功能相关的基因往往成套组合成一个基因家族(genefamily)。(5)非编码序列多于编码序列。原核生物编码蛋白质的基因序列绝大多数是连续的,而真核生物编码蛋白质的基因绝大多数是不连续的,是被一些称作内含子(i

40、ntron)的序列隔开,为间隔基因。原核基因组中除了rDNA、tDNA基因有多个拷贝外,重复序列不多。高等动植物基因组中存在大量的重复序列。原核生物基因组一般是一个复制子,而真核生物基因组的复制起始点很多,有多个复制子。二、间隔基因割裂基因:基因的编码序列在DNA上不是连续的,而是被不编码的序列隔开。外显子Exon:基因中编码的序列,与mRNA的序列相对应。内含子Intron:基因中不编码的序列。发现:1977美Sharp&Roberts同时发现了断裂基因。通过成熟mRNA(或cDNA)与编码基因的DNA杂交试验而发现。割裂基因的分布真核生物中:绝大部分结构基因,tDNA,rDNA,mtDNA

41、,cpDNA原核生物中:SV40大T抗原gene,小t抗原geneT4噬菌体的胸苷合成酶gene所以,Splittinggene并非真核生物所特有间隔基因都有共同的性质内含子DNA序列结构有一定的特征,内含子的5,末端(即供体位点)核苷酸全部为GT(G90T90);内含子的3末端核苷酸中有85个AG(A85G85),提出了“GT-AG规律”间隔基因的外显子在基因中的排列顺序和它在成熟mRNA产物中的排列顺序是相同的。某种间隔基因在所有组织中都具有相同的内含子成分。核基因的内含子通常在所有的可读框中都含有无义密码子(nonsensecodon),因此一般没有编码功能。大多数内含子上发生的突变不影

42、响蛋白质的结构。但也有例外,例如一些发生在内含子上的突变可通过抑制外显子的相互剪接阻止信使RNA的产生。间隔基因的存在对生物有什么意义呢?有利于储存较多的信息,增加信息量。一些断裂基因以不同的剪接方式可以产生两种以至多种mRNA,于是编码不同功能的多肽。有利于变异和进化。增加重组机率。可能是基因调控装置。三、细胞器基因组叶绿体和线粒体是半自主的细胞器,虽然具有独立的遗传系统,其DNA可编码自身所需的蛋白质及tRNA和rRNA,但其自身的基因产物还不能完全满足功能上的需要,必须有核基因的产物的协同作用,核基因编码的蛋白质和酶合成后可输入叶绿体和线粒体中,但是这两种细胞器的膜不允许核酸分子通过,因

43、此二者基因表达所需的RNA均由自身提供,同样细胞器内的mRNA不能透过细胞器进入细胞质中,所以必须含有自己的蛋白质合成系统。(1)叶绿体基因组叶绿体基因组DNA(chloroplastgenomeDNA,cpDNA)般较大,不同植物的叶绿体DNA分子大小各不相同。在叶绿体基因组上一般都含有两个反向重复序列(invertedrepeat,IR;IRA和IRB,大小在1070kb之间。不同植物cpDNA大小的差异主要是由于反向重复序列大小的不同而引起的。叶绿体的基因表达类似于原核生物,cpDNA与核DNA不同,不含有5-甲基胞嘧啶,而且不与组蛋白结合,类似于原核生物DNA,比如,具有相同或相关功能

44、的基因组成操纵子结构,转录物为多顺反子的形式。(2)线粒体基因组线粒体基因组DNA大小在真核生物中差别较大,动物界物种的线粒体基因组DNA大小大多在15kb左右,植物界物种线粒体基因组DNA大小变化很大,编码的蛋白质主要是与能量代谢相关的酶。哺乳动物的线粒体基因DNA没有内含子,几乎每一对核苷酸都参与一个基因的组成,有许多基因的序列是重叠的。与细胞核DNA相比,mtDNA作为生物体种系发生的“分子钟”(molecularclock)有其自身的优点:突变率高,是核DNA的10倍左右因为精子的细胞质极少,子代的mtDNA基本上都是来自卵细胞,所以mtDNA是母性遗传(maternalinherit

45、ance),且不发生DNA重组,因此,具有相同mtDNA序列的个体必定是来自一位共同的雌性祖先。四、真核生物基因组DNA序列组织真核基因组中DNA含大量不编码的重复序列,那么基因的数目就不一定与C值成比例增加。为此可通过复性动力学来检测基因组DNA序列的复杂性。(一)DNA复性的动力学dCt/dt=-kCt2反应起始时,当t=0时,Ct=C0,表明所有DNA都是单链,C0为DNA总浓度。在反应进程中,测定不同的反应时间(t)的单链DNA浓度(Ct),并求其积分,绘制C0t值得对数函数图(图)将有50%的单链DNA分子复性成双链分子的反应时间与初始单链DNA浓度的乘积定义为C0t(1/2)值C0

46、t1/2的位置除了决定于基因组的大小以外,还取决于每个基因的核苷酸序列的重复次数和复杂性,重复次数愈少则复性愈慢,C0t1/2的位置愈后,重复次数愈多,C0t1/2位置愈前。复杂性的含义是DNA分子中无重复顺序核酸的长度,如(ATAT)n的复杂性为2,(ATGC)n的复杂性为4,若有105不重复核苷酸(对)构成的DNA分子,其复杂性为105,通常我们以E.coli的DNA为标准,任何DNA的复杂性都可以与标准DNA的复杂性比较确定。(二)真核生物重复序列的类型真核生物基因组的复性曲线往往出现两个或3个明显不同的C0t1/2位置,说明这类基因组中包含着重复次数显然不同的几个成分。图中第一部分,即

47、复性最慢的部分是单拷贝DNA序列,第二部分为少量重复或中度重复DNA序列,第三部分为高度重复DNA序列。单拷贝序列uniquesequence重复数为一个到几个大多数结构基因即编码各种蛋白质的基因存在于单一序列中真核生物的结构基因是割裂基因,包括内含子和外显子单拷贝基因的表达能力很高。当然也不是所有的单拷贝序列都是编码多肽链的结构基因,因为真核生物基因组中编码的序列不过只有百分之几。中度重复序列moderatelyrepetitivesequence中度重复(10010000)多为串联重复拷贝.这些基因的产物往往机体需求量很大.如rRNA基因,组蛋白基因.rDNA结构Alu序列家族在人类基因组

48、中有约50万个拷贝,占基因组5%6%,平均每6kb的DNA出现一段约300bp的重复序列。一般在每个重复单位的第170为核苷酸附近都有AGCT的序列,它是限制性核酸内切酶Alul的识别与切割位点,Alu序列家族也因此得名。高度重复序列(highlyrepetitivesequence)重复频率(105107)通常序列较短通常集中在染色体的中心粒和端粒处.在密度梯度离心时,在主带旁形成伴随带,因此这些重复序列也称卫星DNAsateHiteDNA功能不详,可能与染色体稳定有关,也有种属的特异性.5-ATAAACTATAAACTAAAACT33,_TATTTGATATTTGATATTGA-5ACAA

49、ACT,1.1x107bp,25%genomeATAAACT,3.6x106bp,8%genomeACAAATT,3.6x106bp,8%genomeAATATAG,crypticSatellitescomprisemorethan40%ofthegenome果蝇DrosophilasatelliteDNArepeat(severalmillioncopies)原核生物DNA的碱基组成是均匀的,即使DNA被破碎成较小的片段后,氯化铯密度梯度仍只能形成单一的峰。但真核生物则显示出很大的不均匀性,这反映为DNA复性曲线的复杂性和其剪切片段在浮力密度中的不对称分布。这两方面的实验证据都表明DNA中存

50、在着一些独特的序列。真核生物的DNA一般含有30%50%GC含量,在DNA的不同区段,GC含量约相差10%。对一个物种来说,当基因组DNA切断成数百个碱基对的片段进行超离心时,其浮力密度曲线是覆盖一定浮力密度范围的一条宽带,但是有些DNA片段都含有异常高或低的GC含量,常在主要DNA带的前面或后面有一个次要的DNA带相伴随,这些小的区带就像卫星一样围绕着DNA主带,故称卫星DNA。并非所有的高度重复序列都能形成卫星DNA。卫星DNA依照其重复单位的的大小分为卫星序列、小卫星序列(minisatellitesequence)、微卫星序列(microsatellitesequenc)。小卫星序列的

51、重复单位一般在15bp的范围内,微卫星序列指重复单位仅在25bp,如(CA)n,(GT)n,(GAA)n,它遍布于基因组中,是重复序列中的主要组成部分之一,呈现共显性遗传。微卫星序列的拷贝数在个体间呈现高度变异,因而具有高度的多态性,已成为真核生物基因组绘制遗传图谱的重要分子标记五、基因家族(genefamily)真核生物基因组中有许多来源相同、结构相关、功能相似的基因,这样一组基因称之为基因家族(genefamily)。基因家族的成员在染色体上的分布形式是不同的,基因家族的成员可分散在不同的染色体上,也可分布于一条染色体上,也可能紧密的集中在一起。基因簇(genecluster)基因家族的各

52、个成员紧密成簇排列成大段的串联重复单位,分布在某一条染色体的特殊区域;它们可同时发挥作用,合成某些蛋白质。如组蛋白基因家族聚集在第7号染色体长臂3区内。rDNA基因家族根据基因家族成员序列的相似程度分类:A经典的基因家族,家族成员序列有高度的同源性,序列一致,拷贝数高,非转录间隔区短而一致。B基因家族各成员的编码产物保守(大段的高度保守氨基酸序列);只是DNA序列的相似性低。C基因家族各成员的编码产物之间只有很短的保守氨基酸序列,DNA序列的相似性更低。D超基因家族,各基因序列之间无同源性,但其基因产物的功能相似。编码产物之间也无明显的保守氨基酸序列,但也有一些共同特征。原核生物的基因多以操纵

53、子的形式存在,由同一个启动子发起转录,由一个终止子终止,转录出一条多顺反子,而真核基因簇中的各成员虽然位于相对集中的位置,并且在遗传上紧密连锁,各个成员在自己的启动子和终止子的作用下,自主转录,以单顺反子的形式存在。第五节基因组学1986年美国科学家TomasRoderick提出了基因组学(genomics)的概念,是指对所有基因进行基因组作图,包括遗传图谱、物理图谱、转录图谱,核苷酸序列分析,基因定位和基因功能分析的一门科学。是研究生物基因组和如何利用基因的一门学问。基因组学出现于1980年代,1990年代随着几个物种基因组计划的启动,基因组学取得长足发展。相关领域是遗传学,其研究基因以及在

54、遗传中的功能。1980年,噬菌体-X174;(5,368碱基对)完全测序,成为第一个测定的基因组。1995年,嗜血流感菌(Haemophilusinfluenzae,1.8Mb)测序完成,是第一个测定的自由生活物种。从这时起,基因组测序工作迅速展开。完成了酵母、线虫、拟南芥和水稻等几种模式生物(modelorganisms)的基因组测序工作2001年,人类基因组计划公布了人类基因组草图,为基因组学研究揭开新的一页。基因组学研究包括两个方面的内容:以全基因组测序为目标的结构基因组学(structuralgenomics)和以基因功能鉴定为目标的功能基因组学(functionalgenomics)

55、。在20世纪初,遗传学刚刚诞生的时候,遗传学家的工作主要是鉴别感兴趣的基因,确定这些基因在染色体上的位置。第一个环节:寻找自发突变体,或者利用物理、化学因素诱发突变。第二个环节:通过连锁分析确定新基因与已知基因的相互关系,绘制遗传连锁图。钓基因的方式,单基因或基因组一、结构基因组学(structuralgenomics)基因定位基因组作图测定核苷酸序列遗传图谱(geneticmap)物理图谱(physicalmap)(1)遗传图谱(geneticmap)采用遗传分析的方法将基因或其它DNA序列标定在染色体上构建连锁图。有可以识别的标记,才能确定目标的方位及彼此之间的相对位置。构建遗传图谱就是寻

56、找基因组不同位置上的特征标记。包括:形态标记、细胞学标记、生化标记、DNA分子标记最早建立的果蝇连锁图,就是利用控制果蝇眼睛的形状、颜色,躯体的颜色、翅膀的形状等形态性状作为标记,分析它们连锁关系及遗传距离,绘制而成的。控制性状的其实是基因,所以形态标记实质上就是基因标记。分子标记以DNA序列的多态性作为遗传标记优点:不受时间和环境的限制遍布整个基因组,数量无限不影响性状表达自然存在的变异丰富,多态性好共显性,能鉴别纯合体和杂合体限制性片段长度多态性(restrictionfragmentlengthpolymorphism,RFLP)DNA序列能或不能被某一酶酶切,相当于一对等位基因的差异。

57、如有两个DNA分子(一对染色体),一个具有某一种酶的酶切位点,而另一个没有这个位点,酶切后形成的DNA片段长度就有差异,即多态性。可将RFLP作为标记,定位在基因组中某一位置上。人类基因组中有105个RFLP位点,每一位点只有两个等位基因。植物遗传图谱的构建选择研究材料(亲本)构建分离群体遗传标记检测标记间的连锁分析标记间的连锁分析利用在两个亲本间有多态性的标记分析分离群体中所有个体的基因型根据连锁交换的情况,确定标记之间的连锁关系和遗传距离有计算机软件可以应用(2)物理图谱的构建用分子生物学方法直接检测DNA标记在染色体上的实际位置绘制成的图谱称为物理图谱。遗传图谱的缺陷:分别率有限人类只能

58、研究少数减数分裂事件,不能获得大量子代个体测序要求每个标记的间隔小于100kb实际是599kb物理图谱作图的方法1、限制酶作图2、依靠克隆的基因组作图3、荧光原位杂交4、序列标签位点作图限制酶作图(restrictionmapping)荧光原位杂交(fluorescentinsituhybridization,FISH)遗传图与物理图的整合有些标记既是遗传标记,又是物理标记RFLP标记SSR标记某些基因序列借助这些标记可以将遗传图和物理图整合起来基因组测序策略测序的策略有两个:鸟枪法克隆重叠群法鸟枪法的优缺点优点:不需要高密度的图谱速度快、简单、成本低缺点:拼接组装困难,尤其在重复序列多的区域

59、主要用于重复序列少、相对简单的原核生物基因组克隆重叠群法(clonecontig)将基因组DNA切割长度为0.1Mb1Mb的大片段,克隆到YAC或BAC载体上然后再进行亚克隆,分别测定单个亚克隆的序列再装配、连接成连续的DNA分子。这是一种自上而下(uptodown)的测序策略clone-by-clonemethod二、功能基因组学利用结构基因组所提供的信息和产物,发展和利用新的实验手段,通过在基因组或系统水平上全面分析基因的功能,使得生物学研究从以基因或蛋白质的研究转向多个基因或蛋白质同时进行系统的研究。基因组序列中所包含的全部遗传信息是什么;基因组作为一个整体如何行使功能。基因功能研究1、

60、计算机预测基因功能依据仍然是同源性比较。同源基因拥有一个共同的祖先基因,它们之间有许多相似的序列。种间同源基因种内同源基因2、实验确认基因功能基因克隆基因敲除(knock-out)基因的超表达反义RNA技术RNAi转座子插入突变转录水平上进行的基因表达差异分析1、差异显示反转录PCR技术2、基因芯片技术3、表达序列标签4、基因表达的系列分析第四章DNA的复制和修复第一节DNA复制概貌DNA的半保留复制DNA在复制时,两条链解开分别作为模板,在DNA聚合酶的催化下按碱基互补的原则合成两条与模板链互补的新链,以组成新的DNA分子。这样新形成的两个DNA分子与亲代DNA分子的碱基顺序完全一样。由于子

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论