分子遗传学要点总结_第1页
分子遗传学要点总结_第2页
分子遗传学要点总结_第3页
分子遗传学要点总结_第4页
分子遗传学要点总结_第5页
已阅读5页,还剩25页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第一章1.理解 Genomes, Transcriptomes 和 Proteomes三个名词,并阐明它们在基因组表达过程中是如何联系在一起的;Genomes:基因组(Genome):由德国汉堡大学威克勒教授于1920年首创,指生物的整套染色体所含有的全部DNA或RNA序列。基因组是地球上每一物种具有的生物学信息的存储库。 基因组学(Genomics):由罗德里克于1986年首创,指研究生物的整个基因组,涉及基因组作图、测序和功能分析的一门学科。 Transcriptomes:基因组表达的最初产物是转录组,即那些含有细胞在特定时间所需生物信息、编码蛋白质的基因衍生而来的RNA分子的集合。 转录

2、组中的RNA分子以及其他来自非编码基因的RNA都由转录过程产生。 Proteomes:基因组表达的第二个产物是蛋白质组,即细胞中那些决定细胞能够进行生化反应的所有蛋白质组分。 这些蛋白质是通过翻译那些组成转录组的mRNA分子而合成的。 蛋白质组包括了在特定时间存在于细胞中的所有蛋白质。 阐明三者在基因组表达过程中是如何联系在一起的? 基因组所包含的生物信息的利用需要酶及其他参与基因组表达过程中一系列复杂生化反应的蛋白质的协同活性。 基因组表达的最初产物是转录组,即那些含有细胞在特定时间所需生物信息、编码蛋白质的基因衍生而来的RNA分子的集合。转录组由转录过程来维持。 基因组表达的第二个产物是蛋

3、白质组,即细胞中那些决定细胞能够进行生化反应的所有蛋白质组分。这是通过翻译过程来完成的。 The genome tells you what could be happened theoretically in the cell. Transcriptome tells you what might be happened. And the proteome tells you what is happening. 2.掌握双螺旋结构的关键特征;Watson and Crick (1953) 提出的DNA双螺旋结构模型: Ø DNA分子通常以右手双螺旋形式存在,两条核苷酸链反向平行,

4、且互为互补链; Ø 戊糖磷酸骨架在分子的外铡,在分子表面形成大沟和小沟,碱基堆积于螺旋内部;Ø 碱基间通过氢键相互连接,A和T以2个氢键配对,G和C以3个氢键配对;Ø 螺旋中相邻碱基间相隔0.34nm,每10个碱基对螺旋上升一圈,螺距为3.4nm,直径为2.37 nm。 3.正确区分编码RNA和功能性RNA;4.描述蛋白质结构的不同层次;蛋白质和DNA分子一样,是一个线性的无分支的多聚体。 蛋白质中的单体亚单位称为氨基酸。氨基酸形成的多聚体或多肽在长度上很少超过2000个单位。 a. primary structure氨基酸通过肽键连接成一条多肽链。 b. sec

5、ondary structure指多肽采取的不同构象,由不同氨基酸之间形成的氢键所稳定。a螺旋;b片层 c. tertiary structure是将多肽链的二级结构组分折叠成为三维构型而形成的。 d. quaternary structure两条或更多已形成三级结构的多肽链组合在一起形成一个多亚基蛋白质。 不是所有蛋白质都有四级结构5.掌握转录组学和蛋白质组学的一般研究方法,特别是SAGE技术、微阵列和基因芯片技术以及鉴定蛋白质相互作用的技术(噬菌体展示、酵母双杂交等)。转录组研究的方法 A. 通过序列分析研究转录组 研究转录组最直接的方法是将其中的mRNA转变为cDNA,并对所有cDNA克

6、隆进行测序,再与基因组序列进行比较分析。还可以借助第二、三代测序技术直接对RNA进行测序。 基因表达系列分析(Serial analysis of gene expresion, SAGE) SAGE技术不是研究完整的cDNA,它产生长度12bp的短序列,每一条都代表了转录组中存在的一种mRNA。技术基础:412=16,777,216 bp,真核mRNA平均1500 bp,412相当于11,000个转录物,这比最复杂的转录组中存在转录物数目还多,因此12bp序列能够代表某一种mRNA。BsmF1是一种不常见的限制性内切酶,它不在其识别序列内部,而是在识别位点下游10-14个nt处切割。 切下来

7、的片段被收集起来,头尾相连以产生一个串联体,进行测序分析。串联体中的各个标签序列信息被读取并与基因组中的基因序列比对,从而可以分析哪些基因被转录,表达水平如何。 B. 通过微阵列或芯片分析来研究转录组 构成转录组的mRNA总体被反转录成一个cDNA的混合物,然后被标记,用于和芯片或微阵列杂交。优点:可用于快速评估两个或多个转录组间的差异。Microarray:玻璃片,尼龙膜 (PCR产物或cDNA ) DNA chip:玻璃片,硅片 ( 原位合成并固化的寡聚核苷酸 )用不同的荧光来标记cDNA样品,微阵列与两个样品同时杂交,可以减少由于试验误差引起的差异。 蛋白质组研究的方法 A. 蛋白谱(表

8、达蛋白质组学) 用来研究一个蛋白质组组成的特定技术。 蛋白谱基于两项技术:蛋白电泳和质谱 a. 双向电泳: 等电点 :蛋白质的净电荷为零时溶液的PH值。 b. MALDI-TOF (基质辅助激光解吸电离飞行时间质谱) 用于鉴定蛋白组中的蛋白质,最多可以分析出50个氨基酸长度的多肽,因此一个蛋白质可以通过胰酶将其消化后进行测定。 一旦多肽片段被离子化,多肽的质量/电荷比就可以通过它在质谱仪中从电离源到检测器的“飞行时间”来确定。通过质荷比能够确认多肽片段的分子质量。 计算机中含有一个由所研究的物种基因组编码的每一个蛋白质经胰酶消化后各个片段的预计相对分子质量的数据库,计算机通过比较数据库与检测到

9、的多肽片段的分子质量来确认最可能的初始蛋白质。 B. 蛋白质印迹法(Western杂交) Western杂交是将蛋白质电泳、印迹、免疫测定融为一体的特异性蛋白质的检测方法。 其原理是:生物中含有一定量的目标蛋白。先从生物细胞中提取总蛋白或目标蛋白,将蛋白质样品溶解于含有去污剂和还原剂的溶液中,经SDS-PAGE电泳将蛋白质按分子量大小分离,再把分离的各蛋白质条带原位转移到固相膜(硝酸纤维素膜或尼龙膜)上,接着将膜浸泡在高浓度的蛋白质溶液中温育,以封闭其非特异性位点。 然后加入特异性抗体(一抗),膜上的目的蛋白(抗原)与一抗结合后,再加入能与一抗专一性结合的带标记的二抗(通常一抗用兔来源的抗体时

10、,二抗常用羊抗兔免疫球蛋白抗体),最后通过二抗上带标记化合物(一般为辣根过氧化物酶或碱性磷酸酶,或用同位素或生物素标记)的特异性反应进行检测。 根据检测结果,从而可得知被检生物细胞内目的蛋白的表达与否、表达量及分子量等情况。 C. 鉴定与某一蛋白质相互作用的蛋白质 通过鉴定有相互作用的成对或成组的蛋白质能够获得基因组活性相关的重要数据。构建蛋白质相互作用图谱被视为是连接蛋白质组学与细胞生物化学过程的一个重要步骤。 a. 噬菌体展示 该技术采用了一种基于l噬菌体或某种丝状噬菌体的独特的克隆载体。待测基因被插入载体后,它的蛋白质产物能与噬菌体外壳蛋白以融合形式表达。使用噬菌体展示库来寻找与待测蛋白

11、质相互作用的蛋白质的噬菌体。 b. 酵母双杂交 激活因子(转录因子):一类控制基因表达的蛋白质,包含DNA结合结构域和转录激活结构域。双杂交系统使用缺乏某一报告基因相应激活因子的酿酒酵母菌株,此时报告基因是不表达的。 D. 蛋白质相互作用图谱 也叫蛋白质相互作用网络,能展现一个蛋白质组中各成员间发生的相互作用。 第二章1.列举用于DNA操作的不同类型酶的特征及主要作用;(1)末端修饰酶:改变DNA分子末端,为连接实验的设计增加可操作空间。A. 末端脱氧核糖核苷酸转移酶:属于模板非依赖的DNA聚合酶。 B. 碱性磷酸酶:去掉DNA分子5端磷酸基团,从而阻止这些分子连接到其他分子上。 C. T4多

12、聚核苷酸激酶:向DNA分子 5端添加磷酸基团,主要用于DNA分子的末端标记。(2)DNA聚合酶:以现有DNA或RNA分子为模板合成DNA的酶,称为(依赖模板的)DNA聚合酶。DNA聚合酶I (Kornberg聚合酶) : 53聚合酶功能 53外切功能 35外切功能 Klenow聚合酶 :用枯草杆菌蛋白酶处理DNA聚合酶I,可获得两个片段,大片段的分子质量约76 kDa,保留聚合酶活性和35外切核酸酶活性,又叫Klenow片段。小片段的分子质量约34 kDa,具有 53外切核酸酶活性。 (3)核酸酶:外切核酸酶和内切核酸酶 (4)DNA连接酶:通过DNA连接酶可以将限制性内切核酸酶消化产生的DN

13、A片段重新连接起来,或者连接到一个新的分子上。 T4 DNA连接酶:从T4噬菌体感染后的大肠杆菌细胞中提取。 2.说明三种类型的限制性内切酶切割DNA的方式;限制性内切核酸酶在特定的位置切割DNA分子:按限制性内切酶的组成、是否具有修饰酶活性以及切断核酸的情况不同,限制酶可分为三类:I型,II型和III型。 a. I和III型限制性内切酶既能催化宿主DNA的甲基化,又催化非甲基化的DNA的降解,但切割位置不固定。 b. II型限制性内切酶只催化非甲基化的DNA的降解(无修饰酶活性),且具有识别位点的专一性和切割位点的专一性,一般在识别序列内切割,不需要ATP提供能量,是重组DNA技术中常用的限

14、制性内切酶。细菌中三种不同类型的限制-修饰酶 IIIIII酶分子 双功能不同酶双功能识别位点 两部分/不对称 4-8 bp 回文结构5-7bp不对称切割位点 非专化 >1000 bp from RS与识别位点同/附近识别位点下游 24-26 bp R & M 相互排斥不在同一个分子中 同时竞争 ATP 需要 不需要 需要 3.区分平端与粘端连接,并说明如何提高平端连接的效率;粘性末端连接的高效率推动了将钝末端转变成粘性末端方法的发展。 一种方法是将称为连接子(linker)或接头(adaptor)的小双链分子连接到钝末端。 另一种方法是利用末端脱氧核糖核苷酸转移酶进行同聚物加尾,

15、即在钝末端的3末尾一个接一个地添加核苷酸。 4.详述克隆载体的主要特征;质粒,噬菌体,人工染色体等 ,它们都含有复制起始位点。 A. 以大肠杆菌质粒为基础的载体 pUC系列:pUC8,2.7kb,除了起始位点外,还携带氨苄青霉素抗性基因( pUC8的选择性标记)和lacZ基因(编码b-半乳糖苷酶的一部分)。某些大肠杆菌菌株具有一个修饰的lacZ基因,该基因中缺失lacZ部分。 B. 建立在大肠杆菌噬菌体基因组基础上的克隆载体 最初尝试着发展能操作大片段DNA分子的载体集中在l噬菌体上。 l噬菌体存在两种感染周期:裂解性感染周期 ;溶源性感染周期l噬菌体基因组大小为48.5 kb,其中有15 k

16、b为随意区域,可以被删除而不影响噬菌体感染细菌的能力。 据此,目前发明了两种类型的载体: 插入型载体:该载体中部分或全部随意DNA被删除,并在删切后的基因组内部的某些位点引入一个单一的限制性酶切位点。用插入型载体进行克隆 : l噬菌体基因组是一个线性分子,但其两个末端具有12个核苷酸的单链突出,称为cos位点。cos位点序列与 l噬菌体的体外包装密切相关。 替代型载体:该载体中随意DNA位于一填充片段内,两侧有一对限制性酶切位点,当要克隆的DNA连接到该载体时,这个区段就被取代。C. 用于更长DNA片段的载体 a. 考斯质粒(cosmid)、黏粒 具有 l cos位点的质粒,与l噬菌体一样具有

17、感染性。插入片段可高达44 kb。b. 酵母人工染色体(YAC) 在YAC中,构成这些染色体组件的DNA序列与一个或多个选择性标记物,至少一个限制性酶切位点连接起来,酶切位点是为了插入新的DNA,可用来克隆600-1400 kb的片段。 一些类型的YAC载体有插入不稳定的问题,即克隆的DNA重排形成新的序列组合。c. 细菌人工染色体(BAC) 是基于天然的大肠杆菌F质粒构建的;能够克隆300kb及更长的片段,并且插入的片段很稳定;可以通过Lac筛选来鉴定重组体,是目前克隆大片段DNA最常用的载体。 d. P1噬菌体载体 与l载体相似,以天然噬菌体基因组的缺失形式为基础;P1基因组比l基因组大,

18、因此能克隆的DNA片段比l载体大;运用目前的技术可以克隆长达125kb的片段。 e. P1衍生的人工染色体(PAC) 综合了P1载体和BAC的特点,具有克隆长达300kb片段的容量。 f. Fosmids 包含F质粒的复制起始位点和l载体的cos位点,有出现不稳定问题的倾向。 5.列举用于克隆长片段DNA的载体,并评价每种载体的优缺点;a. 考斯质粒(cosmid)、黏粒 具有 l cos位点的质粒,与l噬菌体一样具有感染性。插入片段可高达44 kbb. 酵母人工染色体(YAC) 在YAC中,构成这些染色体组件的DNA序列与一个或多个选择性标记物,至少一个限制性酶切位点连接起来,酶切位点是为了

19、插入新的DNA,可用来克隆600-1400 kb的片段。 一些类型的YAC载体有插入不稳定的问题,即克隆的DNA重排形成新的序列组合。 c. 细菌人工染色体(BAC) 是基于天然的大肠杆菌F质粒构建的;能够克隆300kb及更长的片段,并且插入的片段很稳定;可以通过Lac筛选来鉴定重组体,是目前克隆大片段DNA最常用的载体。 d. P1噬菌体载体 与l载体相似,以天然噬菌体基因组的缺失形式为基础;P1基因组比l基因组大,因此能克隆的DNA片段比l载体大;运用目前的技术可以克隆长达125kb的片段。 e. P1衍生的人工染色体(PAC) 综合了P1载体和BAC的特点,具有克隆长达300kb片段的容

20、量。 f. Fosmids 包含F质粒的复制起始位点和l载体的cos位点,有出现不稳定问题的倾向。 6.描述如何进行PCR反应。PCR是一种在体外借助于DNA聚合酶实现特定基因或DNA序列扩增的方法。 1983年,由美国西特斯公司穆利斯发明了该技术。 参与PCR反应体系的因素 模板核酸:基因组DNA(genomic DNA, gDNA),互补DNA(complementary DNA, cDNA)。 引物:16-30 bp,四种碱基随机发布,G+C%=40-60%,引物3端不能错配。 Taq DNA聚合酶:来自嗜热水生古细菌,耐高温,不具3 5外切酶活性。 缓冲液 Mg2+:与Taq酶的活性有

21、关。 dNTP(脱氧核糖核苷三磷酸) PCR仪:自动升降温,程序化。 30个循环后能将目标序列扩增10亿倍以上。PCR的局限性和应用 局限性:a. 必需知道被扩增DNA的边界序列才能PCR,因此不能用来纯化从未被研究过的基因片段。 b. 扩增片段的长度。一般扩增长达5 kb的片段不会有太大困难,但要扩增更长片段存在麻烦。c. 存在非特异性扩增的问题。主要是由于Taq酶缺少3 5外切酶的功能。 应用:基于PCR的分子标记;临床诊断;考古研究;基因表达分析(RT-PCR、实时定量PCR)等。 第三章1.遗传图谱和物理图谱的区别; 遗传图谱:指应用遗传学技术(遗传重组)构建的能在基因组上显示基因和其

22、它序列特征位置的线性排列图,反映了基因或标记间的相对距离和顺序。cM 物理图谱:指应用分子生物学技术直接分析DNA分子,从而构建的能显示包括基因在内的序列特征位置的图谱,它反映了基因或标记间的实际距离。bp,kb,Mb2.描述用于构建遗传图谱的分子标记,以及每种标记是如何检测的; DNA分子标记 :简称分子标记,指在DNA水平,具有相对差异的等位基因的DNA多态性标记,是DNA水平上遗传变异的直接反映。 A. 限制性片段长度多态性(restriction fragment length polymorphism,RFLP)用限制性内切酶酶切基因组DNA时,在同一种生物的不同个体间出现含同源序列

23、的酶切片段长度的差异。人的基因组中大约有105个RFLP。确定RFLP的两种方法 酶切扩增多态性序列(C1eaved Amplified Polymorphic Sequences,CAPS) B. 简单重复序列 Simple sequence repeat, SSR, Microsatellite (微卫星) 指重复单位相对较小(2-6bp的基序),由于重复单位数目的变化而形成的多态性。 人的基因组中大约有5x105个SSR。SSR的检测方法PCR+平板PAGE电泳 PCR+毛细管电泳:引物需要荧光标记,可获得片段的准确长度。C. 单核苷酸多态性(Simple nucleotide poly

24、morphism, SNP) 基因组中的某些位点上,有些个体只有一个核苷酸与其它个体不同,这种分散在基因组中的单个碱基的差异就称为SNP。人的基因组中大约有4x106个SNP;绝大多数SNP是双等位基因;有的能形成RFLP,绝大多数不能。 a. 通过寡核苷酸杂交分析检测SNP寡核苷酸是在试管中合成的长度小于50 bp的DNA分子,在高严谨杂交条件下,寡核苷酸只有与待测DNA分子形成完全的碱基配对时,二者才能杂交;如果有一个碱基错配,杂交体会非常不稳定,不能形成杂交信号。 (1) DNA芯片技术:应用面积为2 cm2或更小的玻璃或硅质晶片,在上面高密度的排列着许多寡核苷酸,待测DNA用荧光标记后

25、与芯片杂交,再用荧光显微镜检测,发出荧光的表明寡核苷酸与待测DNA杂交上了。此方法在一次实验中可以检测许多个SNP。(2) 液相杂交技术:在微量滴定板的孔中进行,每个孔中含有一种不同的寡核苷酸;寡核苷酸的一端与荧光染料连接,另一端与荧光淬灭复合物连接,且其两个末端可以形成碱基配对;当淬灭复合物与荧光染料相邻时,无荧光发出;如果寡核苷酸与待测DNA能够杂交,则会破坏环形结构,此时淬灭复合物远离荧光染料,有荧光发出。b. 通过耐扩增突变系统检测SNP(Amplification Refractory Mutation System, ARMS) 将SNP位点引入PCR引物3端的最后一个碱基,直接进

26、行PCR扩增。在严谨的PCR条件下,存在SNP的引物对不能扩增出目的条带。3.描述用于遗传作图的群体,以及它们是如何构建的;分离群体和收集的品种群体4.掌握构建物理图谱的三种方法,特别是限制酶切图谱的构建方法和STS图谱的构建方法,并评价三种方法的优缺点;物理作图的常用方法: 1) 限制性作图(Restriction mapping):在DNA分子上定位限制性内切酶酶切位点的相对位置; A. 限制性作图的基本方法1) 双酶解(double digest) Key:分析重叠片段 2) 部分酶解+完全酶解:比较分析这两种情况下的片段大小。 3)末端标记+部分酶解 i. 利用放射性的同位素标记DNA

27、的3端或5端 ii. 部分酶解 iii. 放射自显影 多克隆位点(multiple cloning sites, MCS):指多个限制性内切酶的单一切点簇,由许多限制酶切位点组成。MCS往往是人工合成的一段外源基因的插入部位的DNA序列。 B. 限制性作图的规模受限于限制性片段的大小如果使用的限制酶在DNA上切点相对较少,构建限制性图谱就比较容易。限制性作图更适用于小分子。如果DNA分子小于50 kb,通常选用6碱基识别序列的限制性酶来构建限制图谱。对于大于50 kb的DNA分子,可以选用“稀有酶”进行构建。 稀有酶:选用识别序列为7或8碱基的限制性内切酶进行切割。如:Sap I (7);Sg

28、f I (8)。选用识别序列所含基序在靶DNA分子中稀少的酶。如人类基因组中,5-CG-3序列就比较稀少,如果选用Not I(5-GCGGCCGC-3)进行消化,平均约10 Mb才有一个切点。 可用该技术构建原核生物和低等真核生物(酵母和真菌)等染色体较小的生物的限制图谱。限制性作图不能用于大型基因组。如果用普通琼脂糖凝胶电泳来分离大片段DNA分子,电泳分辨率会大大降低。交变脉冲场凝胶电泳(PFGE):1984年,Schwartz和Centor发明;这项技术采用定时改变电场方向的交变电源,每次电流方向改变后持续1s到5min左右,然后再改变电流方向,反复循环,所以称之为脉冲式交变电场。 正交变

29、电场凝胶电泳(OFAGE) 电场转换凝胶电泳(FIGE) 等高加压均匀电场(CHEF) 两对电极间的电场可以改变,每对电极与凝胶长度方向成45度角; 电场的每次改变都迫使DNA分子重新排列,从而提高分辨率。2)荧光原位杂交(FISH):将分子标记与完整染色体杂交来确定标记的位置; A用荧光探针进行原位杂交原位杂交是以标记的DNA分子为探针,检测完整染色体的一种杂交分析方法。用于原位杂交的探针的标记要同时满足高灵敏度和高分辨率两个条件,非放射性的DNA荧光标记技术能满足这一要求。现已设计出具有不同发光特性的荧光标记物,可以将一组不同的探针与单个染色体杂交,并分辨出每种杂交信号,从而检测出各探针的

30、相对位置。在过去,探针必须是相当长的DNA的分子,通常至少是40kb的克隆片段;随着荧光信号放大技术的应用,现在最小可以检测500bp的DNA片段。如果探针中含有一些重复序列,它可能会和染色体上的多个位点发生非特异性杂交;因此,探针在使用前要和来自被研究组织中的未标记DNA混合;用于混合的未标记 DNA可以是总的核DNA,但最好是富含重复序列的DNA片段。B. FISH应用的局限性 中期染色体是高度凝聚的,每条染色体都具有可识别的形态。 使用中期染色体的缺点在于,由于它的高度浓缩的性质,只能进行低分辨率作图,两个标记间至少相隔1 Mb才能分辨出来。 因此,中期染色体FISH主要用于确定新标记在

31、染色体上的大概位置,为更精细的作图做准备。 操作较繁琐,数据积累速度太慢。 更精细作图的两种途径: 机械伸展的染色体:通过离心产生的剪切力可将染色体伸展到正常长度的20倍,这样分辨率可明显提高,能够区分出相隔200-300 kb的标记。 非中期染色体:相比之下,分裂间期的染色体更为有用,因为此时的染色体包装程度最低,分辨率有可能达到25 kb以下。但染色体形态特征消失,失去了定位探针位置所必需的外部参照位点。因此,一般在获得粗略图谱后,用该技术来确定染色体一小段区域内一系列标记间的顺序。3) 序列标签位点(STS)作图:通过对批量的基因组片段进行PCR和(或)杂交分析,来对短序列进行定位作图。

32、 用STS技术绘制物理图是到目前为止最为有效的方法。 STS其实只是基因组中任何单拷贝的短DNA序列,长度在100-500bp,但要求序列已知且在染色体上有唯一的定位。 要得到至少5套包含相关染色体或整个基因组的DNA片段(染色体上每一点平均有5个片段相对应),然后用各个DNA片段做模板,用不同STS标签上的序列做引物进行PCR扩增,筛选阳性克隆。 如果某两个STS标签在基因组上靠的很近,它们同时出现在一个DNA大片段上的概率就会很大,反之就会很小。因此,可以根据两个STS的分离频率来计算它们间的图距。 只要有一定数量的STS标签,所有DNA大片段在染色体上的位置就能被确定下来,从而构建由DN

33、A大片段(YAC/BAC克隆)重叠群组成的物理图谱。 现在已有包含22,582个STS的人类基因组物理图,分辨率达到每136kb有一个STS标签。A. 任何一个唯一的DNA序列均可作为STS 一个DNA序列要成为STS,要满足两个条件: 它的序列必须是已知的,以便于用RCR方法检测该STS在不同DNA片段中存在与否; STS必须在拟研究的染色体或基因组上有唯一的定位。因此,需要确保STS不位于重复DNA区域。 可以通过以下途径获得STS: 表达序列标签(EST):通过对cDNA克隆测序获得的短序列,代表了表达的基因的一部分。如果EST来自单一序列DNA,不是基因家族中的某一成员,可以被用作ST

34、S; 简单序列长度多态性(SSLP):如果将被遗传定位的SSLP用作STS进行物理定位,会很有价值,因为它们可以在遗传图谱和物理图谱间提供直接联系; 随机基因组序列:通过对克隆的基因组DNA随机小片段测序获得。 B. 用于STS作图的DNA片段群 STS作图必需的第二个要素是覆盖拟研究的染色体或基因组5倍以上的DNA片段群(作图试剂)。 作图试剂可以来自克隆文库和放射杂交体组。a. 克隆文库可用于STS分析 基因组计划进入测序阶段的前提是将基因组或分离的染色体断裂成片段,并将每个片段克隆到高容量载体中,这样产生的一个克隆文库,即DNA片段的集合,它可用于STS分析。 利用流式细胞计数仪分离染色

35、体荧光染色的染色体混合物通过一个小孔,使产生的每一个液滴只含有一条染色体;荧光探测器检测到含有目标染色体的液滴发出的信号,并将一个电荷加到液滴上;当液滴到达偏转电板时,带电荷的液滴偏转进入收集器中。 克隆文库用于STS作图有一个明显的优势,就是单个克隆即为可提供测序的DNA; 来自STS分析的数据既可用作STS作图,又可用于构建克隆重叠群(clone contig); 如果STS也包括已遗传定位的SSLP,那么DNA序列、物理图谱和遗传图谱就可以有机结合在一起。b. 放射杂交体组可用于STS分析 放射杂交体:利用高剂量的射线将供体细胞染色体打断成若干小片段,再与近缘物种的受体细胞融合,形成放射

36、杂交体; 该方法由Goss and Harris(1975, 1977)最先提出,后又经Benham et al.(1989)逐步完善,早期主要被用于人类及其它哺乳动物高通量染色体图谱的构建。 目前,放射杂交作图已从最初仅适用于单条染色体作图发展到全基因组作图。 放射杂交作图是基于染色体上的两个STS相距越近其通过断裂分开的频率越低的原理,通过PCR方法研究细胞中供体的STS的分布,利用统计学的手段计算STS间的断裂分离频率,从而可以推算出STS间的距离和在染色体上的排列顺序。 使用PCR方法鉴定STS时,必需保证其只能从供体,而不能从受体基因组中扩增出相应片段。 目前,在大麦、小麦、玉米、棉

37、花中都有构建放射杂交图谱的报道。5.描述放射杂交体是如何产生的?放射杂交体:利用高剂量的射线将供体细胞染色体打断成若干小片段,再与近缘物种的受体细胞融合,形成放射杂交体; 该方法由Goss and Harris(1975, 1977)最先提出,后又经Benham et al.(1989)逐步完善,早期主要被用于人类及其它哺乳动物高通量染色体图谱的构建。 目前,放射杂交作图已从最初仅适用于单条染色体作图发展到全基因组作图。 放射杂交作图是基于染色体上的两个STS相距越近其通过断裂分开的频率越低的原理,通过PCR方法研究细胞中供体的STS的分布,利用统计学的手段计算STS间的断裂分离频率,从而可以

38、推算出STS间的距离和在染色体上的排列顺序。 使用PCR方法鉴定STS时,必需保证其只能从供体,而不能从受体基因组中扩增出相应片段。 目前,在大麦、小麦、玉米、棉花中都有构建放射杂交图谱的报道。第四章1.掌握链终止DNA测序法、化学降解测序法和焦磷酸测序法;链终止DNA测序法 基本依据:聚丙烯酰胺凝胶电泳(PAGE)能够把长度只差一个核苷酸的单链DNA分子区分开。 10-1500 bp 链终止法测序的起始材料是均一的单链DNA分子。首先由短寡聚核苷酸在每个分子的相同位置上退火,并充当引物合成与模板互补的新DNA链。在测序反应体系中加入少量的被不同荧光标记物标记的双脱氧核糖核苷三磷酸(ddNTP

39、)后,合成的互补链可在不同位置随机终止反应,产生一系列只差一个核苷酸的DNA分子。 通过PAGE电泳可以读出待测DNA分子的序列。 技术路线与要求 制备单链模板 将单链模板与一小段引物退火 加入DNA聚合酶 (4种脱氧核苷酸 )分别加入少量4种双脱氧核苷酸 将4种反应产物分别在4条泳道电泳 根据4个碱基在4条泳道的终止位置读出DNA序列 A. 克隆于质粒中的DNA用碱或热变性 B. M13克隆单链DNA C. 噬菌粒克隆DNA A. 高酶活性( 53´聚合酶活性) B. 无53´外切酶活性 C. 无3´5´外切酶活性 ddATP/ddCTP/ddGTP/

40、ddTTP 的3碳原子连接的是氢原子,不是羟基。 制备单链DNA的方法: (1)把DNA克隆到质粒载体中,再通过碱或煮沸变性形成单链DNA。缺点是质粒DNA会被少量的细菌DNA或RNA污染。 (2)把DNA克隆到M13噬菌体载体中。在噬菌体颗粒中,DNA分子以单链形式存在。缺点是该系统只能用于短片段DNA,大于3kb的片段被克隆到M13载体后会发生缺失和重排。通过在M13噬菌体载体中克隆获得单链DNA。M13载体有两种形式:双链复制型分子和在噬菌体颗粒中发现的单链型。 (3)把DNA克隆到噬菌粒中。噬菌粒是一种质粒克隆载体,除含有自身的复制起点外,还包含来源于M13噬菌体的起始位点。如果大肠杆

41、菌中既有噬菌粒又有噬菌体,噬菌粒上的噬菌体起始位点就会被激活,产生含有噬菌粒单链形式的噬菌体颗粒,双链质粒DNA就被转变为单链DNA。这一系统避免了M13克隆的不稳定性,可用于克隆10kb或更长的片段。 化学降解法测序 链终止法测序的一个局限性是:如果模板DNA能形成链内碱基配对的话,那么它就可能不会提供正确序列。 化学降解法也是通过检查末端核苷酸已知的分子长度来确定序列的。这些不同长度的分子是通过能在特定的核苷酸处进行特异切割的化学试剂的处理而产生的。利用化学降解法测序,至少需要进行4个单独的测序反应,每种核苷酸对应一个反应。起始材料是双链DNA。每条链的5端连接一个放射性的磷基团对DNA进

42、行标记。双链中的一条链可能比另一条链含有更多的嘌呤核苷酸,因此就稍微重一些,电泳过程中就迁移得慢。从凝胶中纯化出一条链后,分成4份样品,每份样品都用一种切割试剂进行处理。 有限量: 保证每条链上平均只有一个G残基被甲基化修饰。 每个反应所产生的分子上样到PAGE平板凝胶的一个泳道上,电泳后条带在凝胶上的位置通过放射自显影来观察。移动最远的条带代表最小的DNA片段。 焦磷酸测序:边合成边测序 (Sequencing by synthesis) 每种核苷酸分别依此加入;如果核苷酸未渗入到正在合成的链中,就会被反应体系中的核苷酸酶降解;如果核苷酸渗入到正在合成的链中,释放的焦磷酸盐会引起化学发光,发

43、出的荧光信号可以被检测到。在6.4cm2的芯片上可以同时进行160万个反应,4h内可以获得包含2500万个核苷酸的序列。 2.掌握鸟枪法、全基因组鸟枪法和克隆重叠群法等基因组测序方法及其优缺点;鸟枪法对于相对较小的原核生物基因组,可以通过鸟枪法直接进行测序。测序实验中得到的短序列可通过检查重叠区而直接叠加成主要序列。现在普遍认为,任何小于5Mb的基因组序列,即使在计划开始前不知道基因组的任何信息,几个月的时间足够获得它的全部序列。因此,鸟枪法的优点在于测序速度快,并且能够在遗传图谱和物理图谱不存在的情况下进行工作。 全基因组鸟枪法该方法最早由Craig Venter和他的同事提出。经验表明,如

44、果所获得的序列总长度是所研究基因组长度的6.5-8倍,那么所得到的序列重叠群就覆盖了99.8%以上的基因组序列。对于一个3500Mb的哺乳动物基因组而言,就要测7000万个左右的独立序列。如此多的序列能借助计算机正确组装起来吗?如果用传统的鸟枪法而不借助基因组图谱信息,答案肯定是不可能。鸟枪法测序中最费时的地方是将单个序列重叠群通过封闭序列间隙和物理间隙而连在一起的阶段。 通过使用两种或两种以上的不同载体中所克隆的片段产生的序列能够有效提高基因组的整体覆盖面。解决由于重复序列引起的组装问题的有效策略是确保其中一个克隆文库中插入片段的长度大于所研究基因组中最长的重复序列。序列组装的最初结果是一系

45、列骨架(scaffold),每个骨架包括一组被序列间隙分开的序列重叠群,骨架与骨架间被物理间隙分开。序列间隙位于成对端点序列之间,通过成对端点序列筛选文库,获得阳性克隆并测序,可以封闭间隙。全基因组鸟枪法在果蝇和人类基因组中的应用已经证明了它的可行性,但得到的基因组序列的准确性方面仍存在问题。部分问题是序列产生的随机性,基因组的某些部分被微小片段覆盖许多次,而其他部分只被覆盖一两次。基因组的某些部分比其他部分有更多的微小序列所覆盖。 克隆重叠群法克隆重叠群方法被看作是获得真核生物基因组序列的传统方法。在该方法中,基因组通常经部分酶切而产生较长的DNA片段,再把这些片段克隆到高容量载体,如BAC

46、中。借助基因组图谱的信息,建立BAC克隆重叠群,然后通过鸟枪法对克隆群进行分别测序再组装。 3.说明建立克隆重叠群的方法; A. 可以通过染色体步移来建立克隆重叠群,但该方法费力 最简单的构建克隆重叠群的方法是从基因组文库的一个克隆开始,鉴定出与第一个克隆中的插入片段重叠的第二个克隆,依此类推。这就是染色体步移法。 该方法的存在问题是,如果用作探针的插入片段含有重复序列,那么它不仅能与重叠的克隆杂交,还能与含有重复序列拷贝的非重叠克隆杂交。 如果用插入片段末端的一个片段作为探针,出现重复序列的机会就回减少。还可对末端序列进行测序来确保不存在重复DNA。 如果末端片段序列已知,可以通过PCR而不

47、是杂交来筛选,这样可以加速步移的速度。 B. 更快的克隆重叠群组装方法 染色体步移是一个比较慢的过程,几乎不可能用该方法拼接出多于15-20个克隆的重叠群。 一个改进的方法是使用克隆指纹图谱技术。该技术提供了待克隆DNA片段的物理结构信息,将这些物理结构信息和其它克隆的相关信息做一些比较分析,就能鉴定出重叠序列。 克隆指纹图谱技术 限制性图谱:通过用多种限制性内切酶消化克隆,并在琼脂糖凝胶上分离消化产物而得到。 重复DNA指纹图谱:通过对利用一类或多类重复序列特异的探针进行Southern杂交所得到的一系列限制性片段进行分析而获得的。 重复DNA的PCR或散步重复元件的PCR:运用在重复序列内

48、退火的引物,能够扩增出两相邻重复序列之间的单拷贝DNA。为了鉴定出可能的重叠区,重复DNA进行PCR之后获得的产物大小可以作为与其他克隆相比较的指纹。 STS作图:非常有用,因为它能够产生一个定位于STS物理图谱上的克隆重叠群。 4.说明利用鸟枪法进行基因组测序如何保证所获序列的准确性和完整性。“序列间隙”:可以通过对文库中已经存在的克隆进一步筛选和测序来封闭。 物理间隙:指克隆文库中不存在的序列,可能是因为这些序列在所使用的克隆载体中不稳定造成的。 两种解决策略: a. 用噬菌体载体重新构建一个克隆文库,用与重叠群末端相对应的寡聚核苷酸与该文库进行杂交。 b. 用成对的寡聚核苷酸为引物进行P

49、CR扩增。 5.描述ORF扫描的原理,并解释该方法在真核生物基因组中定位基因不一定成功的原因以及改进方法;基因不是核苷酸的随机排列,而是具有明显的特征: A. 基因的编码区是可读框 编码蛋白质的基因含有可读框(ORF),可读框包含一系列能规定基因编码蛋白质中氨基酸序列的密码子,并开始于起始密码子(通常是ATG),结束于终止密码子(TAA, TAG, TGA)。因此,可以通过寻找ORF序列的方法来寻找基因。成功寻找ORF的关键在于终止密码子在DNA序列中出现的频率。如果一段DNA具有随机序列且GC含量为50%,三个终止密码子中的每一个将平均64bp出现一次。假定每100-200bp会出现一次终止

50、密码子,那么随机DNA不会出现许多长度超过50个密码子的ORF。另一方面,大多数基因的长度都大于50个密码子,比如大肠杆菌:317个密码子,酿酒酵母:483,人平均为450个密码子 。 因此,最简单的寻找ORF的方式是将100个密码子作为一个假定基因长度的下限,并记录所有大于此值的ORF的阳性数据。 B. 单纯的ORF扫描对高等真核生物DNA效果不佳 虽然ORF扫描对细菌基因组很有效,但在高等真核生物的DNA序列中定位基因的效果不佳。 原因之一是真核生物基因组中基因间的间隔很大,发现假ORF的概率就会增加。 原因之二是真核生物的ORF是不连续的,经常被内含子所隔开,而且单个外显子的长度一般小于

51、100个密码子。内含子使ORF扫描复杂化 对ORF扫描的基本程序已经作了三项改良: 密码子偏倚(codon bias)被考虑在内。 密码子偏倚:指特定生物体的基因中,并不是所有密码子的使用频率都是平等的。如亮氨酸可由6种密码子编码,但在人类基因组中,亮氨酸大多由CTG编码。 外显子-内含子边界。 GU-AG规则:核mRNA的剪接点一般都为 GU.AG 。 上游调控序列可用来定位基因起始区。 上游调控序列也具有显著的序列特征,它们作为识别信号在参与基因表达的DNA结合蛋白中起重要作用。但调控序列是易于变化的,对于真核生物尤为明显,因此通过该方法定位基因也存在很大局限性。 尽管上述三种ORF扫描方

52、法都有局限性,但普遍适用于所有高等真核生物基因组。 另外的可能适用于单个生物体的策略: 脊椎动物基因组中,许多基因的上游都有CpG岛。 CpG岛一般位于基因上游区域,大约有1kb长,其中GC含量比整个基因组的平均含量要高。人类基因中40-50%的基因上游都含有CpG岛。 C. 为功能性RNA定位基因 功能RNA基因不包含ORF,所以不能用前面讲的方法进行定位。这些功能RNA分子具有它们自己的特征,其中最重要的是它们能折叠形成二级结构。 如tRNA分子具有三叶草结构。tRNA的特征有助于为这些功能RNA定位基因 对于其他一些功能RNA可用如下方法进行定位: 大多数功能RNA都包含一个或多个茎环或

53、发夹结构,搜寻DNA序列中这样结构的程序就能鉴别出功能RNA基因可能的存在区域。 搜寻与功能RNA基因相关的调控序列(前面/内部)。 在基因组较小的基因组中,仔细检查蛋白质编码基因广泛搜寻之后留下的“空位置”区域,可能会发现一个或多个功能RNA基因的存在。 D. 同源性搜索和比较基因组学为序列筛查提供了一个特殊的方向 同源性搜索:通过查询DNA数据库来判断所检测序列是否与已知基因的序列相同或相似。通过同源性搜索可以来检验一系列三联体密码子是真正外显子还是随机序列,一定程度上可以弥补ORF识别的局限性。 同源性搜索的另一个主要用途是为新基因确定功能。 比较基因组学:相关种属的基因组序列既具有从它

54、们的共同祖先继承过来的相似性,又具有由于物种开始单独进化而产生的种属特异性。由于自然选择,序列相似性在基因内部最大,而在基因间区域最小,当相关基因组进行比较时,同源基因由于它们的序列相似性很高,就很容易被鉴定出来。可以通过比较基因组学来检测ORF的真实性,如果某一个新定位的ORF在相关基因组中都不存在,那么它很有可能不是一个真正基因。 E. 自动标注基因组序列 运用计算机方法进行基因组标注是从序列分析开始的,运用能扫描ORF、外显子-内含子边界及上游调控区并能在数据库中检测同源基因ORF的程序进行序列分析,这些程序同时也用于寻找重复序列及功能RNA基因的特异性特征。 运用这些程序还可以扫描cD

55、NA序列数据库,以寻找与基因组序列中任何相匹配的片段,任何这样的匹配都表明是一段能转录成mRNA的区域。 6.掌握运用同源性搜索和比较基因组学以及扫描cDNA序列数据库等定位基因的方法;D. 同源性搜索和比较基因组学为序列筛查提供了一个特殊的方向 同源性搜索:通过查询DNA数据库来判断所检测序列是否与已知基因的序列相同或相似。通过同源性搜索可以来检验一系列三联体密码子是真正外显子还是随机序列,一定程度上可以弥补ORF识别的局限性。 同源性搜索的另一个主要用途是为新基因确定功能。 比较基因组学:相关种属的基因组序列既具有从它们的共同祖先继承过来的相似性,又具有由于物种开始单独进化而产生的种属特异

56、性。由于自然选择,序列相似性在基因内部最大,而在基因间区域最小,当相关基因组进行比较时,同源基因由于它们的序列相似性很高,就很容易被鉴定出来。可以通过比较基因组学来检测ORF的真实性,如果某一个新定位的ORF在相关基因组中都不存在,那么它很有可能不是一个真正基因。 E. 自动标注基因组序列 运用计算机方法进行基因组标注是从序列分析开始的,运用能扫描ORF、外显子-内含子边界及上游调控区并能在数据库中检测同源基因ORF的程序进行序列分析,这些程序同时也用于寻找重复序列及功能RNA基因的特异性特征。 运用这些程序还可以扫描cDNA序列数据库,以寻找与基因组序列中任何相匹配的片段,任何这样的匹配都表明是一段能转录成mRNA的区域。 7.掌握基因定位的实验方法特别是定位基因转录起始位点的方法以及定位外显子-内含子边界的方法;大多数基因定位的实验方法不是直接检测DNA分子,而是检测由基因转录成的mRNA分子。转录物通常比基因编码部分要长,因为转录物中包含5-UTR区和3-UTR区。因此,转录物分析不能准确定位基因编码区的起始和终止点,但能告诉你一个基因确实存在于某特定区域中,并且可以定位外显子-

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论