基因组的结构和功能_第1页
基因组的结构和功能_第2页
基因组的结构和功能_第3页
基因组的结构和功能_第4页
基因组的结构和功能_第5页
已阅读5页,还剩81页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第三章第三章 基因组的结构和功能基因组的结构和功能 基因(基因(genegene) 是核酸的中贮存遗传信息的遗传单位,是贮存有功能的蛋白 质多肽链或RNA序列信息及表达这些信息所必需的全部核苷酸序 列(P27)。 从生化学上来说指的是一段DNA或RNA(病毒)顺序,该顺序 可以产生或影响某种表型,可以由于突变生成等位基因变异体 。 从遗传学上来说代表1个遗传单位、1个功能单位、1个交换单 位或1个突变单位。 表型和基因型表型和基因型 某一机体可以观察到的特征称为表型( phenotype),与表型相应的基因组成称为基因型(genotype) 。如细菌能否合成亮氨酸记为Leu+和Leu-,相应的基因型为 Leu+和Leu-。 等位基因等位基因 (1)二倍体细胞有2套基因,一套来自父本,另 一套来自母本,每个细胞的全部基因均由2套基因组成,每一对 基因称做等位基因。 (2)由于突变作用引起DNA结构变异,所以某一 基因可具有若干种不同的形式,这种同一基因不同的形式互称 等信基因(allele)。 基因的基本结构基因的基本结构 5、AGCCGACTATGTCGAAGCTT、GCTTGACTATAAGACA、 、3 3、TCGGCTGATACAGCTTCTAA、CGAACTGATATTCTGT、 、5 转录调控区 贮存RNA或蛋白质结构信息区 转录终止区 基因组(基因组(gencmegencme) 细胞或生物中,一套完整单倍体遗传特质的总和(包括一种细胞或生物中,一套完整单倍体遗传特质的总和(包括一种 生物所需的全套基因及间隔序列)称为基因组(生物所需的全套基因及间隔序列)称为基因组(P27P27)。)。 基因组的结构主要指不同的基因功能区域在核酸分列中的分 布和排布情况,基因组的功能是贮存和表达遗传信息。 人类基因组包含多染色体和XY两条性染色体上的全部遗传物 质(核基因组)以及胞线粒体上的遗传物质(线粒体基因组 )。(X X免疫基因,男免疫基因,男XY XY,女,女XXXX)。)。 * * 1 1个配对(精子或卵子),个配对(精子或卵子),1 1个单倍体细胞或个单倍体细胞或1 1个病毒所包个病毒所包 含的全套基因,称为基因组含的全套基因,称为基因组。 第一节 原核基因组 Prokaryotic genome 以细菌为代表讲述,有称bacteria genome。细菌对 医学分子生物学有重要贡献,是基因工程研究的主要材料之一。因为: 1.1.构造相对简单,基因结构也不复杂,取材便利,易于培养构造相对简单,基因结构也不复杂,取材便利,易于培养,可选择突变 株进行研究,实验结果容易重复。(如选择DDDPI缺乏的Ecoli突变株, Ecoli仍可合成DNA,说明酸I对EcoliDNA合成不起作用。) 2.2.与人类有共同的要子生物学规律可,如与人类有共同的要子生物学规律可,如: (1)遗传物质都是DNA; (2)主要的功能分子都是蛋白质; (3)基因密码是通用的,等等。 3.3.尤其是尤其是E.coli,E.coli,是分子克隆是是分子克隆是“明星明星“, ,基因工程主要原因的工程菌,因基因工程主要原因的工程菌,因 为基因工程的主要工作是克隆克核基因在原核系统中表达。为基因工程的主要工作是克隆克核基因在原核系统中表达。 一、原核生物基因组结构与功能的特点一、原核生物基因组结构与功能的特点 1.基因组通常仅由一条环状双链一条环状双链DNADNA分子组成。分子组成。 其DNA是与蛋白质结合,但并不形成染色体结构,只是习惯上将之称 为染色体。细菌染色体DNA在胞内形成一个致密区域,即类核( nucleoid),类核无核膜将之与胞浆分开。 2.基因组中只有只有1 1个复制起点个复制起点。 3.具有操纵子结构。具有操纵子结构。 操纵子(operon) 是指数个功能相关的结构基因串联在一起, 构成信息区,连同其上游的调控区(包括启动和操纵区)及其下游的 转录终止信号构成的基因表达单位。(见第六章) 4.结构基因无重叠现象,结构基因无重叠现象,基因组中任何一段DNA不会用于编码2种蛋白 质。 5.基因序列是连续的,无内含子结构。基因序列是连续的,无内含子结构。 6.编码区和非编码区编码区和非编码区(主要是调控序列)在基因组中约各占在基因组中约各占50% 50%。(5%, 95%) 7.基因组中的重复序列很少。编码蛋白质结构基因多为单拷贝,但编码 rRNA的基因往往是多拷贝的,这有利于核糖体的快速组装。(15AA/秒, 2AA/秒) 8.具有编码同功酶的基因(具有编码同功酶的基因(isogeneisogene) 这是一类结构不完全相同,而功 能相同的基因。如E.coli含有2个编码乙酸乳酸合成酶的基因和2个编码 分支酸变位酶同工酶的基因。 9.9.细菌基因组中存在可移动的细菌基因组中存在可移动的DNADNA序列,包括插入序列和转座子。序列,包括插入序列和转座子。 10.原核基因的基本结构特点:原核基因的基本结构特点: 启动子(promoter)、操纵基因(operator)、调控序列、结构 基因(structure gene)、终止子(terminator)。(见第六章) 二、染色体外的遗传物质二、染色体外的遗传物质质粒质粒 (一)概念 1 1. .质粒(质粒(plasmidplasmid) 是独立于许多细菌及某些真核细胞染 色体外共价闭合环状的DNA分子(covalant closed circnlar,cccDNA),能独立复制的最小遗传单位。(P35-6) 2.2.质粒是双链的质粒是双链的DNA DNA分子,大小在分子,大小在1200kb1200kb之间,和病毒不同之间,和病毒不同 ,它们没有衣壳蛋白(裸,它们没有衣壳蛋白(裸DNADNA)。)。 从生化学来说,从生化学来说,除酵母的杀伤质粒(killer plasmid) 是RNA外,其余质粒是染色体外的cccDNA分子。 从遗传学来说,从遗传学来说,质粒是与宿主染色体有别的复制子(真 核细胞分裂过程中,DNA纤维分成许多复制单位,该单位称 为复制子)。在细胞分裂时能恒定传递给交代细胞的独立遗 传因子或能在胞内寄生和复制的复制子。 3.质粒与宿主细胞的关系 (1)质粒对宿主的生存不是必需的,只是“友好”的“借居”宿主 细胞中,既不杀伤细胞,对宿主的代谢活动也无影响,宿主离开质粒 照样的生存下去。 (2 2)质粒离开宿主就无法生存,只有依赖宿主细胞的)质粒离开宿主就无法生存,只有依赖宿主细胞的(酶和蛋白质 )帮助,才能完成自身的复制(扩增)、转录。 (3 3)质粒经常为宿主执行一些适当的遗传功能)质粒经常为宿主执行一些适当的遗传功能,作为对宿主细胞的 补偿(“交房租”)。 (4 4)质粒赋于宿主各种有利的表型(质粒编码蛋白质或酶),)质粒赋于宿主各种有利的表型(质粒编码蛋白质或酶),使宿 主获得生存优势,与我们基因工程实验紧密相关的,如抗生素抗性基 因: Ampr 酶,水解-内酰胺环,解除氨关毒性,使细菌抗氨关。 Tetr 膜蛋白,可阻止四环素进入细胞,使细菌抗四环素。 4.质粒发现和研究意义 1 1)理论意义)理论意义 质粒能够复制、传递和表达遗传信息,从分子 遗传学观点来看是一种有机体,是比病毒更原始的生命形式, 是生命起源研究的起一块体重要基石。是生命起源研究的起一块体重要基石。 2 2)实践意义)实践意义 是基因工程的重要载体(是基因工程的重要载体(vector vector),能把外源),能把外源 基因基因(目的基因)送到宿主细胞中去克隆扩增或克隆表达(见目的基因)送到宿主细胞中去克隆扩增或克隆表达(见 第八章)。第八章)。 质粒是可以改造的,可以剪切、剪接的,质粒是可以改造的,可以剪切、剪接的,基因工程的重要 任务之一就是严格改造质粒的同时,控制质粒不传递,若一个 致癌质粒可以传递就会传到外都是。 作为基因工程载体的作为基因工程载体的3 3个特点:个特点: A.都能独立自主的复制; B.都能便利的加以检测(抗生素抗性); C.都能容易引进宿主细胞中去,也易从宿主细胞中分离纯 化(提质粒)。 质粒符合上述3个条件。 基因工程中主要使用人工构建的质粒。 (二)质粒的分类 1.1.按质粒的复制机理,分为按质粒的复制机理,分为2 2类 类: 1 1)严谨控制型()严谨控制型(stringent stringent contrdcontrd type type) 2 2)松弛控制型()松弛控制型(relaxed control typerelaxed control type) (1)拷贝数少,一般15kb15kb 小型质粒,无接合和自传递能力,在按 多属接合型或自传递型,大型质粒只 合质粒协助也能转移,也可心通过转化 能通过细菌的接合作用人一个细菌 作用进入受体细胞,这类质粒种类较多, 传到另一个细菌。(如F质粒)。 几乎每种细菌都可以含有2种以上,基因基因 工程一般用小型质粒。工程一般用小型质粒。 3.3.按质粒转移方式,分为按质粒转移方式,分为3 3类类 1 1)接合型质粒)接合型质粒(conjugaative plasmid)带有效接触基因质粒,只能使细菌接合只能使细菌接合,本身 不被传递. 2 2)可移动质粒)可移动质粒(mobiliableplasmid)可以被传递,但不能使细菌接合可以被传递,但不能使细菌接合型与可移动性共存 时,能传递可移动质粒。 3)3)自传递质粒自传递质粒(selftran missible plasmid)兼具兼具1 1)2 2)两种功能因而可以自传递)两种功能因而可以自传递,如F 质粒。 *转化作用(transformation)这是涉及细菌摄入外源DNA而实现基因转移一种机制。( 见第八章) (三)质粒的功能 质粒的功能主要通过质粒本身携带的基因偏码蛋白质表现出来 。携带质粒的宿主细胞可表现出相应表型。 1.1.性质粒性质粒 即雄性细菌F质粒,它本身转到F-宿主细胞时,使后 者变成F+,改变宿主细菌性别。 2.2.抗生素抗性抗生素抗性 抗药性(R)质粒使细菌产生抗生素抗性,这种 抗药性抗性基因也可以转移到缺乏这种抗药基因的细菌体内,使 之产生抗药性。 3.3.产生毒素的质粒产生毒素的质粒 如col质粒能产生大肠杆菌素因子(colicin ),杀死不合该毒素的亲缘细菌。 4.4.降解复杂的有机化合物作为能源质粒。降解复杂的有机化合物作为能源质粒。 5.5.产生限制和修饰酶。(见第八章)产生限制和修饰酶。(见第八章) (四)质粒的基本特性 1.1.自主复制自主复制 质粒的复制是自主调节的,不受染色体复制调节因素的影响质粒的复制是自主调节的,不受染色体复制调节因素的影响。 复制调控系统由质粒上的复制起点(ori),质粒的rep基因和cop基因组成 。 Rep蛋白启动质粒的复制,cop基因本身或其表达产物可抑制复制作用,从 而控制质的拷贝数。 2.2.质粒的不相容性质粒的不相容性 利用相同复制系统的质粒不能共存于同一个细胞内利用相同复制系统的质粒不能共存于同一个细胞内。 PMB和COLEI是两个密切相关的复制调控系统,带有PMB和COLEI复制调控系统 的质粒是不相容的。但它们与带有PSC101或P15A复制调控系统是完全相容的, 可以共存于一个细胞内。不相容性使质粒能够很容易被克隆。 3.3.质粒的转移性质粒的转移性 在自然条件下,在些质粒可以通过细菌接合作用在细菌 细胞向传递。基因工程中常用的质粒载体缺乏转移所需的基因(mob基因), 不能通过接合作用在细胞间传递,但可采用人工方法转化到细菌细胞中。 三三. .转位因子转位因子 转位因子(转位因子(transposable elementtransposable element) 即可移动的 基因成分(可移动基因,movable gene mob),是指能够 在一个DNA分子内部或两上DNA分子之间移动的DNA片段。在 细菌中指在质粒和染色体之间或在质粒和质粒之间移动的 DNA片段(文献上有时形象地称其为是跳跃基因,jumping gene)。转位也是DNA重组的一种形式。 移动基因最早由美国冷泉港实验室(cold spring Harbor Laboratory)的女科学家B.MClintock于上个世纪40年代晚期 在玉米中首次发现的。60年代,为J.A.Shapirc研究大肠杆菌 高效突变实验证实。1983年荣获诺贝尔生物学医学奖。 (一)转位因子的种类及特征 细菌的转位因子包插入序列,转座子及可转座的噬菌体。 1.插入序列(insertion sequence,IS) IS的形体图 TSTranspcsase geneTSIRIR TS target site靶位点 Transposase gene 转位酶基因 IR inverted repeated 反向(倒 转重复顺序) (1)ISIS是一类较小的转位因子是一类较小的转位因子,长度约700-2000bp,按发现顺 序IS1、IS2命名, 只携带转移的必需基因,不含有其它偏码蛋白质结构基因, 本身没有表型效应。 (2)ISIS两侧为反向(倒转)重复顺序(两侧为反向(倒转)重复顺序(16-41bp 16-41bp),中间为转),中间为转 位酶基因位酶基因,在插入新的位点侧有3116p顺向重复顺序(directw repeated sequencedk),DR是靶位点序列复制的产物。 (3)ISIS到处活动,到处活动,可以插入到E.coli染色体的各个位置上,也 可以插入到质粒和某些噬菌体基因组上,甚至同一基因不同位 点上。这种插入作用可以双向进行,可以是正向,也可以是反 向插入IS这种移动方式称为转位作用(transposition)。 (4)在一个世代的在一个世代的107107细菌中有细菌中有1 1次插入。次插入。 *TR(反向倒转重复序列):GGAAGGT、ACCTTC CCTTCCA、TGGAAGG *DR(正同向重复序列):TACGTTACGT 2.转座子(transposon,Tn) (1)Tn是一类较大的可移动成分,除mob gene外,尚含有其它基因 ,如抗药基因等。Tn是在研究抗药基因中发现的,由此知道抗药 基因可在质粒之间,质粒与染色体之间或质粒与可转座的噬菌体 之间来回移动,Tn的转位原理和Is基本相同,转位频率为10-310 -6/拷贝。 (2)根据结构特征的不同,Tn可以分为2个亚类: 复合型Tn:转座酶由IS编码,IS可以是反 向(或正向)重复构型。 TnA:数个结构基因(mob、mdr等)十IR 组成。 Structural genesIRIR Structural geneIS1IS1 3.可转座的噬菌体(transposable phage) (1)包括包括MuMu和和D108D108两种噬菌体,是一类温和噬菌体*。 (2)感染细菌后,可以整合到细菌染色体中,插入位点是随 机的(而入phage插入位点是专一的),可以插到结构基因 内部,引起突变,Mu即Mutator(突变子)因此得名。 (3)插入部位的2侧有短的DR,插入时,一个拷贝留在原位, 新合成的拷贝插入新的部位。 (4)和IS,Tn相比,Mu末端不含IR,这是可转座成分的一个 例外。 *噬菌体(phage)是侵袭细菌的病毒,主要由蛋白质和核酸 组成。噬菌的生活周期分为溶菌周期和溶原周期。 溶原性噬菌体(温和噬菌体)宿主菌将自身DNA整合到细 菌染色体中和细菌染色体一起复制随细菌增殖传到细菌子 代中去,不产生子代Phage. (二)转位作用的机理 1.复制性转位机理 共联体生成和解离,靶序列的切割与复制。 2.非复制型转位作用 转位将供体DNA转座因子两侧各切断一条单链并与靶序列的两个游 离末端连接, 随后并没有复制过程,而是由转座酶将供体DNA转座因子的另一端 也切断,因此在供体DNA留下一个致死性缺口。 转座子的两条游离单链在靶位点退火接合,DNA聚合酶项平缺口。 (三)转位的遗传效应 1.基因重排 可能产生1个新的蛋白分子等,基因重排是进化 的动力。 2.基因突变 插入到基因内部,可引起插入失活。 3.插入位点引入新的基因 如引进抗药基因。 (四)细菌有限制修饰系统 细菌的限制修饰系统是分别由特定的基因编码的限制酶 和修饰酶组成的二元系统。 1.防御外源性DNA入侵。 2.构成细菌种属和菌株之间交叉繁殖屏障,但又允许外源 DNA有某些遗漏,利于物种进化。 3.基因工程重要的工具酶。(350/400) 甲基化酶 1.保护自身DNA不受限制酶切割(限制)。 2.影响DNA分子构象,利于基因表达调控。 限制酶和甲基化酶辩证关系。 第二节第二节 真核生物基因组真核生物基因组 一一. .真核生物基因组的结构真核生物基因组的结构 (一)真核基因的基本结构 1.结构基因、内含和外显子、断裂基因。 (1)结构基因(结构基因(structural genestructural gene)指能转录成为mRNA、rRNA或tRNA 的DNA顺序。 (2)内含子和外显子内含子和外显子 真核生物的结构基因是不连续的,编码序列 被非编码序列打断,在编码序列之间的序列称为内含子(intron ),编码序列称为外显子(extron)。 (3)断裂基因(断裂基因(split genesplit gene) 在真核类结构基因组中,编码顺序被 许多称为内含子的非编码区分割成几段称之。 2.顺式调控元件 顺式调控元件(顺式调控元件(ciscisacting elementsacting elements) 指与结构基因 表达调控相关,能够被基因调控蛋白特异性识别和结合的 DNA序列。能与顺式作用元件结合调节基因转录活性的蛋白 质因子称为反式作用因子反式作用因子(transacting factors)。顺 式调控元件有: (1)启动子(promoter) 概念:概念:启动子是促进DNA转录的DNA序列,是DNA分子上可 与RNA pol 特异性识别结合并使之转录的部位,但启动子本 身不被转录。 功能特点:功能特点:启动子位于结构基因上游启动子有方向性 启动子位于结构基因上游启动子有方向性决决 定转录方向及那一条定转录方向及那一条DNADNA链作模板转录链作模板转录(以信息链的互补链 作模板转录,转录的mRNA与信息链一致)。 真核生物的启动子元件是真核生物的启动子元件是TATA box TATA box TATA盒与TATA因子 的转录因子结合后即成为完整的启动子。(见第六章) (2)上游启动子元件(upstream promoter elements ups) UPS是TATA盒上游的一些特定的DNA序列。 反式作用因子可与这些元件结合,通过调节TATA因 子与TATA box的结合、RNA pol与启动子结合及转录起始 复合物形式来调控基因转录效率。 (3)反应元件(response elements) 一些信息分子的受体被细胞外信息分子激活后,能 与特异的DNA序列结合,调控基因的表达。 这种这种DNADNA序列实际上也是顺式元件序列实际上也是顺式元件,由于能介导基 因对细胞外的某种信号产生反应,被称为反应元件。 反应元件都具有较短的保守序列。这些无件通常位 于启动子附近和增强子内,有不少是回文序列。 (4)增强子(enhancer)和沉默子(silencer) 增强子是一段DNA序列,其中含有多个能被反式作 用因子识别与结合的顺式作用元件。反式作用因子与这 些元件结合后,通常为增强邻近基因的转录。增强子一 般位于转录起始点上游-100-300bp处,但在基因之外 或某些内含子中也有增强子序列(P42)。 增强子作用特点:可在5端或3端发挥作用; 不受序列方向制约;通过增强启动子发挥作用。沉 默子 负调控序列、负增强子; (5)加尾信号 在结构基因的最后一个外显子中有一个保守的AATAAA 序列,此位点下游有一段GT丰富区或T丰富区,这两部分 序列共同构成poly(A)加尾信号。 mRNA转录到此部位后,产生AAUAAA和随后的GU(或U) 丰富区。与RNApol结合的延长因子可以识别这种结构并 与之结合,然后在AAuAAA下游10-30个碱基的部位切断 RNA,并加上poly(A)尾. (二)基因家族(gene family) 基因家族 是指核苷酸序列或编码产物具有一定程度同源性 的一组基因. 基因家族 中各个基因之间的关系: 1.家族中各基因的核苷酸序列相同基因的核苷酸序列相同这些基因族也被称为单纯单纯 多基因家庭多基因家庭(如rRNA,tRNA家族)和复合多基因家族(如组蛋白基 因家族). tRNA基因: 人类基因约有1300个tRNA基因,编码50多种tRNA。每种 tRNA可有10-几百个基因拷贝。同种tRNA往往串联在一起形成基 因簇,但基因间有非转录间隔区分隔,常常比结构基因长近10 倍。 2.家族中各基因核苷酸序列高度同源核苷酸序列高度同源 (1)人类生长激素基因家族 包括人生长激素(hGh)、人胎盘促乳素和催乳素(prolactin) 。它们之间的同源性很高,尤其是hGh和hcs之间,蛋白质氨基酸序列 有85%的同源性,mRNA上序列上有92%的同源性,说明它们是来自一个 共同祖先基因。3种基因并不都排列在一起,hGh和hcs基因位于第17 号染色体长臂,催乳素基因位于第6号染色体。 (2)-株蛋白和-株蛋白基因家族 这些基因家族的各个成员在DNA分子上的排列顺序按照发育的不同 阶段先后次序排列,故也称“发育控制复合多基因家族”。 3.家族中各基因编码的蛋白质有高度的同源性,但基因的核苷酸序但基因的核苷酸序 列可能不同。列可能不同。 如src癌基因家族 src,abl,fes,fgr,fps,fym,kck,lyn,ros,tkl,yes 此家族中各基因的DNA序列没有明显的同源性。 但每个基因产物都含有250个氨基酸顺序的同源蛋白激酶结构域。 4.家族各基因编码的蛋白质中具有很小的保守基序蛋白质中具有很小的保守基序(conserved motif)。 如DEAD box基因家族。DEAD box:Asp-Glu-Ala-Asp. 此家族中各基因的DNA序列没有明显的同源性,但所有的表达产物 都具有解旋酶的功能,都具有同样的保守基序(DEAD盒),DEAD是 酶活性的关键结构。 5.基因超家族(gene superfamily) 基因超家族 是指一组由多基因家族及单基因家族组成的更大的基因是指一组由多基因家族及单基因家族组成的更大的基因 家族。家族。它们的结构有程度不等的同源性,因此它们可能起源于相同的祖先 基因,但是它们的功能并不一定相同,这一点正是与多基因家族的差别所 在。这些基因在进化上也有亲缘关系,但亲缘关系较远,故将其称为基因 超家族。如: (1 1)免疫球蛋白超基因家族)免疫球蛋白超基因家族 表达产物都有免疫球蛋白样的结构域结 构。有2个微球蛋白、MHCI类抗原的链,类抗原的链和链,Thy1、 CD4、CD8等与免疫有关的分子。 在后又陆续发现了许多免疫系统内以及与免疫无关的家族成员。 (2 2)丝氨酸蛋白酶基因超家族)丝氨酸蛋白酶基因超家族 其基因产物都有一个特殊 的功能区,具有酶的功能。功能区中丝氨酸是活性中心瓣关键 氨基酸残基。 现有很多新成员加进去,如载脂蛋白(apolipoprotein ),它们只是转移胆因醇蛋白颗粒中的成分而不具备任何水解 蛋白质的酶功能。 (3)信号传递途径中的小GTP接合蛋白,现在称为ras超家族 ,包括ras家族、rho家族、rab家族,大约已有30个蛋白质基 因被确定为该家族成员。 (三)假基因(pseudogene) 1.1.假基因假基因 在多基因家族中某些与正常功能基因在核苷酸 在多基因家族中某些与正常功能基因在核苷酸 序列上相似,但不能转录或转录后生成无功能基因产物的序列上相似,但不能转录或转录后生成无功能基因产物的DNADNA序序 列,被称为假基因。列,被称为假基因。 DNADNA序列,被称为假基因序列,被称为假基因。 2.假基因常用符号表示,如1 表示与1 相似的假基 因. 3.假基因与有功能的基因同源,原来也可以是有功能的基因, 由于发生缺失(deletion)、例位(inversion)或点突变(point mutaion)等,成为无功能的基因,即形成了假基因,哺乳动物 基因组中的1/4基因为假基因,可能为进化的痕迹。 (四)编码序列 真核生物基因组编码序列只占DNA总 量的5%,但由于其基因组非常大,故其基因数量就原核生 物基因组要大得多(几十倍)。 (五)真核基因组中的转座子 在真核基因组中,编码序列在染色体中的位置相对比较稳定,在真核基因组中,编码序列在染色体中的位置相对比较稳定, 但一些中度重复序列往往是可移动的但一些中度重复序列往往是可移动的。 在些可移动成分的结构与原核基因组的转位因子相似,是通过是通过 DNADNA介导的。介导的。 而另外一些中度重复序列的转移成分,要先转录成而另外一些中度重复序列的转移成分,要先转录成RNARNA,再逆,再逆 转录生成转录生成cDNAcDNA, ,然后重新整合到基因组中,这种逆转录旁路的转移然后重新整合到基因组中,这种逆转录旁路的转移 成分称为逆转录座子(成分称为逆转录座子(retroposonretroposon),是),是RNARNA介导的。介导的。 (六)重复序列(repeat sequence) 重复序列中,除了编码重复序列中,除了编码rRNArRNA 、tRNAtRNA 、组蛋白及免、组蛋白及免 疫球蛋白的结构基因外,大部分是非编码序列。疫球蛋白的结构基因外,大部分是非编码序列。 它们的功能 主要与基因组的结构稳定性,组织形 式以及基因表达调控有关。 目前已发现一些重复目前已发现一些重复序列的特征与遗传有密切联系, 因此可以通过测定重复次数而协助遗传病的诊断。 据出现的频率不同可将DNA序列分为3类: 1.高度重复序列 在基因组中的重复次数 105 2.中度重复序列 在基因组中的重复次数为 101-105 3.单拷贝序列 在整个基因组中出现1次或少数几次 (100-101)。 (七)端粒(telommere) 以线性染色体形式存在的真核基因组以线性染色体形式存在的真核基因组DNADNA的末端都有一种特殊的结构,的末端都有一种特殊的结构, 称为端粒。称为端粒。(形式上膨大成粒状而得名)。 结构结构 1.是染色体末端DNA和蛋白质构成复合体。仅在真核细胞染色体末端 存在。 2.其DNA序列相当保守,一般由多个串联在一起的短寡核苷酸(5- 86p)序列构成。 3.碱基成分因种属而异,重复次数在不同生物中变化较大,如小鼠 的端粒DNA达150kb,人类的端粒DNA约515kb。 功能功能 1.保护线性DNA的完整复制 2.保护染色体末端及决定细胞的寿命等。 二.人类基因组中的重复顺序 (一)反向重复顺序(inverted repeats,IR) ATTAGC GCTAAT ATTAGC GGAT GCTAAT TAATCG CGATTA TAATCG CCTA CGATTA 1.连续的反向重复顺序,这种结构又称回文结构(回文结构(palindrome)palindrome),是指 一段DNA顺序,在两条链上,正读与反读意义相同。 2.不连续的反向重复顺序之间含有间隔顺序。 1.2占人类基因组5%,可能与复制、转录调控有关。 (二)串联重复顺序(tandem repeats) 1.1.编码区串联重复顺序编码区串联重复顺序 如组蛋白基因、5srRNA基因等。 其意义在于快速大量合成相应基因的mRNA. 2.2.非编码区串联重复顺序非编码区串联重复顺序 通常存在于间隔通常存在于间隔DNADNA*和内含子内 ,是组成卫得DNA*的基础。卫星DNA可分为三类,大卫星DNA 、小卫星DNA和微卫星DNA。 *间隔DNA(spacer DNA)真核基因组中,在基因之间也有一 些非编码顺序将它们隔开,一般称为间隔称为间隔DNA,是和内含子 性质不同的插入顺序。 *卫星DNA(satellite DNA sat -DNAsat -DNA)又称随体DNA。 这部分DNA是在用cscl密度梯度离心时发现的。 大肠杆菌DNA剪切成若干片段后离心只得到1个峰,而 蟹DNA在主峰旁边还有1个小峰,其中所含DAN称sat-DNA. Sat-DNA的A+T/G+C比值不同于主峰DNA的比值,因而其密 度也不同于主峰DNA。比值改变原因是它们含有大量的重 复顺序而使某段DNA分子(A+T)或(G+C) 偏低或偏高。 (下图因比值远远大于主峰DNA,导致密度较低所致)。 (三)散在重复顺序(intersprersed repeats) 散在重复顺序是人类基因组中非串联非反向的重复顺序是人类基因组中非串联非反向的重复顺序,包括少数活跃的转包括少数活跃的转 位因子位因子,根据重复序列的长度可将该家族分为2 2个主要类型个主要类型,短散在核元件和长 散在核元件。 1.SINEs1.SINEs(shat interspersed nuclear elements) 2.LINES2.LINES( (long interspersed nuclear elements) 代表 AluAlu家族家族( (逆转录转座子逆转录转座子) ) KpnIKpnI家族家族 (1)序列中含Alu限制酶位点 (1)序列中含Kpn限制酶位点 (2)基因组中重复数3-5105 (2)全长6-7kb (3)Alu顺序之间间隔:3-5kb (3)Knp 消化后可见4条带 (4)相对集中在染色体R带 (4)集中分布在染色体G或Q带 逆转来转座子 RNA介导转座 ,合成cDNA基因组 三.人类基因组DNA多态性 某一机体可以观察到的特征,称为表现称为表现(phenotype),(phenotype),与 表型相应的基因组成称为基因型基因型(genotype).(genotype).人类个体之间 所以表现为千差万别,其物质基础在于基因组DNA的差异. DNA序列的多态性就是这些差异中十分重要的1种,DNA序 列多态性可分为位点的多态性和串联重复顺序多态性,前者 又可造成限制性长段长度多态性. (一)DNA位点多态性(DNA site polymorphism) DNADNA位点多态性位点多态性 是由于等位基因间在特定位点上DNA 序列存在差异造成的.在各种DNA位点多态性系统中,HLA(HLA(人人 类白细胞抗原类白细胞抗原) )是最复杂的一种是最复杂的一种. . 就其表型而言,从理论上来说,已远远超过了现有地球人 口,人类为远交群体,因此要在无血缘关系人群找到HLA表型 完全相同的个体几乎是不可能的.(见分子免疫学). (二)限制性中段长度多态性(restiction fragment length polymorplism,RFLP) 1.DNA1.DNA位点的多态性可影响限制酶的切割位点,造成限制片段位点的多态性可影响限制酶的切割位点,造成限制片段 长度多态性,即用同一种限制酶消化不同个体长度多态性,即用同一种限制酶消化不同个体DNADNA时,会得到时,会得到 长度各不相同的限片段类型长度各不相同的限片段类型。 是DNA多态性的一种特别有用的形式,当DNA分子由于中分子由于中 性突变,使某种限制酶切点数增加,减少或移位,导致限制性突变,使某种限制酶切点数增加,减少或移位,导致限制 性片段长度发生改变(也称为性片段长度发生改变(也称为RFLPRFLP),),就会得到不同限制性 片段类型,这样的位点称为多态性位点。 (三)重复顺序长度多态性 1.小卫星DNA多态性很复杂,个体之间的差异极高。 2.微卫星DNA多态性,功能不太清楚. ( (四四) DNA) DNA位点的多态性可以作为遗传标记,用于基因诊位点的多态性可以作为遗传标记,用于基因诊 断或个体鉴定,其与疾病的相关研究正在进行之中断或个体鉴定,其与疾病的相关研究正在进行之中。 本节概要地介绍了对人类基因组研究和认识,但显然 还有大量的未知,比如仅弄清楚了极有限的功能基因,一 小部分基因序列,距离彻底了解人类自身遗传背景还很遥 远。正是存在这种科学内在的驱动力,人类在20世纪末开 始了的探索自身为主要目的的伟大科学计划人类基因组 计划,其重要意义完全可以与原子弹计划和阿波罗登月计 划相比。 第三节 病毒基因组 基因组(genome) 1个配(精子或卵子),1个单倍体 细胞或1个病毒所包含的全套基因。病毒核酸或为DNA或为 RNA,可以统称为病毒染色体。 完整的病毒颗粒具有蛋白质外壳,以保护病毒核酸不受 核酸酶的破坏,并能识别和侵袭特定的宿主。类病毒例外, 它是一类植物病毒,为很小的单链闭环RNA(250-400碱基) 。 病毒核酸与所有的原、真核生物的核酸组比较,最为最为 突出的特点是每种病毒颗粒只含突出的特点是每种病毒颗粒只含1 1种核酸种核酸,或DNA或RNA, 两者不共存于1种病毒颗粒中,据此,病毒可以分成两组 ,即DNA病毒和RNA病毒。 病毒核酸分子量大小:RNA病毒小106-107D,DNA病毒 大;107-108D 基因数:3-几百个 一切一切烈性病毒(烈性病毒(virulent virusvirulent virus)都具备参下几个时相的生活周期)都具备参下几个时相的生活周期:(:( 1)吸附;(2)核酸进入细胞;(3)转录、翻译和复制;(4)病毒颗 粒成熟;(5)释放病毒颗粒。 典型的生活周期为6-48小时,噬菌体为20-60分钟。 病毒对细胞功能的干予,最典型的是噬菌体(最典型的是噬菌体(phagephage),当其入菌后 ,立即接管了细菌的各种主要功能,细菌自身的DNA复制RNA转录,蛋白 质合成,能量代谢等都停顿下来转变成合成病毒的机器变成合成病毒的机器。有些动物病毒 也有类似的情况,但非普通规律。相对而言,动物病毒和宿主细胞可以 共存一段时间至病毒生活周期的后期才造成宿主细胞的严重损害,这些这些 损害有如下损害有如下3 3个类型:个类型: (1)抑制宿主RNA和DNA的合成。 (2)核糖体合成受损。 (3)蛋白质合成受抑制是普遍现象。 与人类疾病有关的病毒属于动物病毒与人类疾病有关的病毒属于动物病毒,它包括8个DNADNA病毒病毒科和科和1212个个 RNARNA病毒病毒科,科,这些病毒基因组结构和功能已基本清楚(见分子病毒学HIV 、没办法)。 (二)病毒有(十)链RNA和(一)链RNA之分。 (十)(十)RNARNA病毒病毒 (一)(一)RNA RNA 概念概念 极性和mRNA极性相同, 与mRNA极性相反或与(十)RNA 碱基顺序也相同。 互补的RNA。 作用作用 1.作为模板(与mRNA一样) 必须依赖 翻译出病毒多肽或蛋白质。 RNA的RNA 2.作为模板,合成(一)RNA, pol合成(十) 可以以(一)RNA为模板 RNA(mRNA) 合成子代病毒RNA。 才能翻译出 3.作为模板合成cDNA. 病毒 (即以mRNA为模板反转录合成DNA)。 蛋白质。 二二. .病毒基因组结构功能特点(病毒基因组结构功能特点(P28P28) (一)病毒核酸可以是(一)病毒核酸可以是ssDNAssDNA、dsDNAdsDNA或或RNARNA分子分子,分子结构有发 夹、环状、线型、节段型。以SSDNA,dsRNA最为突出。 (二)基因重叠(二)基因重叠 即同一段基因可以编码即同一段基因可以编码2 2种或以上的基因产种或以上的基因产 物物这种现象在其它生物细胞仅见于线粒体和质体DNA.所以是病 毒核酸较为独特结构能使小小病毒携带较多的遗传信息,原因 是病毒基因阅读框可以错位(SV40)。 (三)连续的和不连续的基因连续的和不连续的基因 病毒基因结构特征往往与其病毒基因结构特征往往与其 宿主细胞基因结构相似。宿主细胞基因结构相似。 原核病毒(如噬菌体)基因是连续的,没有内含子; 真核病毒(如多瘤病毒)基因是不连续的,有内含子。 有意思的是,有些真核病毒的内含子或其中的一部分对 某一基因来说是内含子,对另一基因却是外显子。 如SV40和多瘤病毒的早期区域就是这样的。 除了(+)RNA病毒外,真核病毒基因都是先转成mRNA前 体,再经过剪接等步骤能成为成熟的mRNA. ( (四四) )节段性基因节段性基因 大部分病毒核酸都是由一条双链或单链 构成,少数病毒核酸由数个片段构成。这类病毒一般度RNA病 毒。如flu-v由6-7个片段构成,各段在天然状态下不连接, 而且可以转录成6-7个片段相应的 mRNA。单独的片段没有感 染性,感染要一起感染才发挥作用。 ( (五五) )除了除了retro-vretro-v外,所有的病毒基因都是单倍体基因外,所有的病毒基因都是单倍体基因。即每 个基因在某个病毒颗粒中只出现一次,即只有1套基因。 ( (六六) )编码区编码区 非编码区(非编码区(95%/5%95%/5%)。)。病毒核酸大多数顺序都用 来编码蛋白质。 ( (七七) )基因常常成簇排列基因常常成簇排列,没有间隔序列或间隔序列很小。功 能相关蛋白质基因在基因组的1个或几个特定部位,丛集成 簇被转录成多顺反子,然后加工成各种蛋白质的mRNA模板。 如腺病毒晚期基因。 ( (八八) )不规则的结构基因不规则的结构基因 1.几个结构基因的编码区不规则,因此有些结构基因无翻译 起始序列。 2.有的mRNA(=gene)没有5帽子,但有翻译增强子。 ( (九九)DNA)DNA或或RNA 1RNA 1种病毒基因组只是种病毒基因组只是1 1种核酸。种核酸。 三、典型病毒基因组三、典型病毒基因组 (一)SV40病毒基因组 SV40(simian sarcom avirus40 猴肉瘤病毒)属乳 多空病毒类,是最小的DNA病毒之一。它可长期潜伏于猴肾 细胞,对新生仓鼠有致癌性,体外试验还可使多种属细胞 恶性转化。 1、基因组结构特点 (1 1)双链环状)双链环状DNA DNA分子、分子、MW3103KD,长52436p,与4种组蛋 白(H2A、H2B、H3及H4)综合综合,与真核染色质区别在于不含与真核染色质区别在于不含H1H1 。 (2 2)基因组由早期基因、调控区和晚期基因构成)基因组由早期基因、调控区和晚期基因构成。 早期基因含有2个重叠基因,编码T和t(T=tumor)抗原 晚期基因含3个重叠基因,编码VP1(主),VP2和VP3( 次)3种衣壳蛋白 调控区位早、晚期基因之间,长约4006p包括复制起点 ,启动子和增强子,可调节基因组的复制及早、晚期基因的转 录。 2、SV40病毒基因的表达 (1 1)启动子位于调控区复制起点上游)启动子位于调控区复制起点上游,其中含有RNA pdII 识别位点位于-21-26bp之间的TATA盒可启动可启动RNARNA转录转录起始准确位 置,一般不相差10个核苷酸。 (2 2)增强子)增强子 在106-250位是2个串联的含有72bp的完全重 复顺序,即为增强子,能增强能增强SV40SV40及异源基因的表达及异源基因的表达。 (3)早期基因转录的mRNA前体选择剪接形成不同的mRNA( TmRNA、t-mRNA) 3、病毒基因组的复制及基因表达调控 T T抗原控制病毒的复制,启动晚期基因转录抗原控制病毒的复制,启动晚期基因转录。 (1)早期基因T及t的表达受T抗原的反馈阻遇,表现一 种自我调节作用。 (2)晚期基因表达需要T抗原及SV40DNA本身的复制。 一般过程是,感染早期合成T、t抗原T-方面抑制早 期mRNA进一步合成;另一方激活多种与DNA复制有关的酶, 引发病毒的复制进而推动晚期RNA的合成,产生Vp蛋白( 12h)V-DNA+VP123病毒颗粒。 (二)HBV基因组 HBV是乙肝的病原体,它可造成持续性感染,引起急、慢 性肝炎,部分患者可发生肝硬化,HBV原发性肝癌发生密切相关 ,我国我国HBSAgHBSAg携带者高达携带者高达10% 10%,因而我国特别重视HBV的研究。 1、HBV基本结构 (1 1)电镜下观察)电镜下观察 呈园球形,直径约42nm,称Dane颗粒(以发现者命名) ; 中间含1个致密的内核(core),直径约27nm; 外为1层约14nm外壳(capsid)。 (2)表面有表面有HBsAgHBsAg(hepatitis B virhs surface antigen); 核心有核心有HBcAgHBcAg和和HBeAgHBeAg; 含含DNA DNA polpol、prorein kinase( (蛋白激酶) 蛋白激酶)和 reverse transcriptasereverse transcriptase(逆转录酶),(逆转录酶),后者与病毒复制特点 有关。 2、HBV基因组结构 (1 1) dsds()DNA()DNA组成的环状结构,开环不封闭。侵入细胞 组成的环状结构,开环不封闭。侵入细胞 后借助胞内后借助胞内DNADNA修复机制转变成修复机制转变成cccDNAcccDNA分子分子(共价闭合环状超 螺旋)。 (2 2)基因组双链)基因组双链DNA DNA长短不一长短不一,外长内短,长负(链)短正 (链),长链2/3是双链,1/3是单链。两链间隙由DNApol填充 (上(1)述)。 (3 3)长链(负链)基因重叠是转录)长链(负链)基因重叠是转录mRNA mRNA的模板链的模板链. 不同毒株均含有4个开放性阅读框(openreading frame, ORF见第五章)S.C.P.X,其中P区与S.C.X.互相重叠50%以上 ,故多个ORF可读码2次以上,编码2个以上蛋白质。其中: S区 编码主要蛋白为HBsAg C区 编码HBcAg等。 P区 编码DNApol是依赖RNA的DNApol(逆转录酶)。 X蛋白功能不详。 4、HBV与肝癌的关系 现在普遍认为,HBV感染与原发性肝癌关系密切,流行病 学及分子病毒学的证据如下: (1)原发性肝癌(肝细胞性肝癌)HBSAg高达85%,其他肿瘤 患者仅为15%; (2)培养肝癌细胞株,不断释放出HBsAg(+); (3)cDNA 探针检查到HBV已整合到肝癌细胞DNA中去; (4)肝癌病人的癌基因,如Ki-ras、Ha-ra

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论