生物化学与分子生物学:第十三章 真核基因与基因组_第1页
生物化学与分子生物学:第十三章 真核基因与基因组_第2页
生物化学与分子生物学:第十三章 真核基因与基因组_第3页
生物化学与分子生物学:第十三章 真核基因与基因组_第4页
生物化学与分子生物学:第十三章 真核基因与基因组_第5页
已阅读5页,还剩34页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、Eukaryotic Gene and Genome 基因(基因(gene):):DNA上的功能单位,能够编码蛋白质或者上的功能单位,能够编码蛋白质或者RNA。 基因组(基因组(genome):):包含了所有编码包含了所有编码RNA和蛋白质的序列和蛋白质的序列 及所有的非编码序列,也就是及所有的非编码序列,也就是DNA分子的全序列。分子的全序列。 生物:生物: 简单简单 复杂复杂 基因组:基因组: 小小 大大 人类基因组计划人类基因组计划 HGP 1990-2001.2 20亿美元亿美元 第第 一一 节节 真核基因的结构与功能真核基因的结构与功能 Structure and Function

2、of Eukaryotic Gene 真核生物结构基因,由若干个编码区和非编码区真核生物结构基因,由若干个编码区和非编码区 互相间隔开但又连续镶嵌而成,去除非编码区再连接互相间隔开但又连续镶嵌而成,去除非编码区再连接 后,可翻译出由连续氨基酸组成的完整蛋白质,这些后,可翻译出由连续氨基酸组成的完整蛋白质,这些 基因称为断裂基因。基因称为断裂基因。 断裂基因断裂基因(splite gene) CABD 编码区编码区 A、B、C、D 非编码区非编码区 *外显子(外显子(exon) 结构基因中有表达结构基因中有表达 活性的编码区活性的编码区 *内含子(内含子(intron) 结构基因中无表达结构基因

3、中无表达 活性的非编码区。活性的非编码区。 一、真核基因的基本结构一、真核基因的基本结构 真核生物和原核生物基因表达的对比真核生物和原核生物基因表达的对比 电镜照片电镜照片 解释图解释图 鸡卵清蛋白基因中外显子和鸡卵清蛋白基因中外显子和 内含子的排列顺序及大小内含子的排列顺序及大小 RNA编辑作用说明,基因的编码序列经过转录编辑作用说明,基因的编码序列经过转录 后加工,是可有多用途分化的,因此也称为分后加工,是可有多用途分化的,因此也称为分 化加工化加工(differential RNA processing)。 二、二、 mRNA的编辑的编辑(mRNA editing) 人类人类apo B基

4、因基因 mRNA(14500个核苷酸)个核苷酸) 肝脏肝脏 apo B100 (分子量为(分子量为500 000) 肠道细胞肠道细胞 apo B48 (分子量为(分子量为240 000) mRNA编辑编辑 三、调控序列参与真核基因表达调控三、调控序列参与真核基因表达调控 顺式作用元件顺式作用元件 1.启动子启动子(promotor ) 2. 增强子增强子(enhancer) 3. 沉默子沉默子(silencer) 顺式作用元件:顺式作用元件:启动子、增强子、沉默子启动子、增强子、沉默子 1. 启动子启动子 真核基因启动子是真核基因启动子是RNA聚合酶结合聚合酶结合 位点位点周围的一组转录控制组

5、件,至少包括周围的一组转录控制组件,至少包括 一个一个转录起始点转录起始点以及一个以上的以及一个以上的功能组件功能组件。 TATA盒盒 -25bp RNA聚合酶结合位点聚合酶结合位点 GC盒盒 CAAT盒盒 -70bp 反式作用因子结合位点 反式作用因子结合位点 -25bp RNA聚合酶结合位点 聚合酶结合位点 控制转录起始的精确性控制转录起始的精确性 上游启动子序列上游启动子序列 (UPE) 控制着转录起始的频率控制着转录起始的频率 真核基因的顺式作用元件真核基因的顺式作用元件 启动子启动子 结构基因结构基因 顺式作用元件顺式作用元件 2. 增强子增强子(enhancer) 指指远离远离转录

6、起始点、决定基因的时间、空转录起始点、决定基因的时间、空 间特异性、间特异性、增强启动子转录活性的增强启动子转录活性的DNA序列序列。 发挥作用的方式通常与发挥作用的方式通常与方向、距离无关方向、距离无关。 TATA盒盒 TF IID RNA聚合酶聚合酶II 通用转录因子通用转录因子 转录方向转录方向 中介子中介子 活化蛋白活化蛋白 活化蛋白活化蛋白 增强子增强子 增强子增强子 DNA TF IIA 增强子增强子 promoter gene 5 3 GCGAGCT ACGT.ACG enhancer gene 5 3 TCG.AGCG GCA.TGCA 发挥作用的方式通常与发挥作用的方式通常与

7、方向、距离无关方向、距离无关。 SilentSilent Expressed 沉默子沉默子 沉默子沉默子 3. 沉默子沉默子(silencer) 某些基因的负性调节元件,当其结合特异某些基因的负性调节元件,当其结合特异 蛋白因子时,对基因转录起蛋白因子时,对基因转录起阻遏作用阻遏作用。 第第 二二 节节 真核基因组的结构与功能真核基因组的结构与功能 Structure and Function of Eukaryotic Genome 总体特征总体特征 1真核生物基因组远大于原核生物,结构复杂,基因数庞大。真核生物基因组远大于原核生物,结构复杂,基因数庞大。 2基因组中有大量低度(重复频率基因

8、组中有大量低度(重复频率103)、中度(重复频率)、中度(重复频率105)和高度)和高度 重复序列。重复序列。 3基因是不连续的,由外显子和内含子镶嵌排列而成。基因转录的初级产基因是不连续的,由外显子和内含子镶嵌排列而成。基因转录的初级产 物需经一定的加工,切除内含子使外显子拼接,才能形成成熟的物需经一定的加工,切除内含子使外显子拼接,才能形成成熟的mRNA。 4非编码区远大于编码区。非编码区远大于编码区。 5基因不存在操纵子结构,功能相关基因分散在不同的染色体上,转录产基因不存在操纵子结构,功能相关基因分散在不同的染色体上,转录产 物为单顺反子。物为单顺反子。 6真核生物基因组的化学本质为真

9、核生物基因组的化学本质为DNA,大多与蛋白质结合形成染色质,基,大多与蛋白质结合形成染色质,基 本结构单位为核小体。本结构单位为核小体。 一、真核基因组具有独特的结一、真核基因组具有独特的结 构构 (一)真核基因组结构庞大一)真核基因组结构庞大 哺乳类动哺乳类动 物基因组物基因组 DNA 约约 3 10 9 碱基对碱基对 编码基因编码基因约约 有有 40000 个个,占总长的占总长的6 % rDNA等重复基因等重复基因约约 占占 5% 10% (二)单顺反子二)单顺反子 单顺反子单顺反子(monocistron) :即一个编码基因转录生即一个编码基因转录生 成一个成一个mRNA分子,经翻译生成

10、一条多肽链。分子,经翻译生成一条多肽链。 (三)重复序列三)重复序列 单拷贝序列(一次或数次)单拷贝序列(一次或数次) 高度重复序列(高度重复序列(106 次)次) 中度重复序列(中度重复序列(103 104次)次) 多拷贝序列多拷贝序列 二二 、真核基因组中存在大量重复序列、真核基因组中存在大量重复序列 C C0 0t t1/2 1/2 高度重复序列 中度重复序列 单一序列 (一)高度重复序列(一)高度重复序列 1. 卫星卫星DNA 5-10个个bp,大多位于着丝粒和端粒、表达基因的间隔区、内含子。,大多位于着丝粒和端粒、表达基因的间隔区、内含子。 人的卫星人的卫星DNA可分为可分为I、II

11、、III、IV四种,个类型由不同的重复顺序家族构四种,个类型由不同的重复顺序家族构 成。分子杂交研究表明,同一类型中不同家族成员之间不能进行杂交,成。分子杂交研究表明,同一类型中不同家族成员之间不能进行杂交, 说明卫星说明卫星DNA具有多态性。具有多态性。 2. 微卫星微卫星DNA 又称简单重复序列(又称简单重复序列(SRS)。)。 6bp为重复单位,为重复单位,10-60次拷贝串联。最常见是次拷贝串联。最常见是2bp串联,散在分布在基因串联,散在分布在基因 组中,多位于编码区附近,也存在于卫星序列中及中度重复序列中。组中,多位于编码区附近,也存在于卫星序列中及中度重复序列中。 功能:参与遗传

12、物质结构的改变、基因调控及细胞分化等过程。功能:参与遗传物质结构的改变、基因调控及细胞分化等过程。 卫星卫星DNA与微卫星与微卫星DNA的比较的比较 卫星卫星DNA 微卫星微卫星DNA 存在部位存在部位 染色体近端粒和着丝粒区染色体近端粒和着丝粒区 染色体任何部位染色体任何部位 重复单位长度重复单位长度 6-70bp,常富含,常富含GC 1-6bp 重复次数重复次数 几次到几百次几次到几百次 10-60次次 总序列长度总序列长度 0.5-30kb 约约200bp 重复单位的差异重复单位的差异 重复单位组成稍有差异,重复单位组成稍有差异, 重复单位的变异性低重复单位的变异性低 如单个碱基置换如单

13、个碱基置换 存在数量存在数量 有限,有些染色体尚未见到有限,有些染色体尚未见到 很多很多 (二)中等重复序列(二)中等重复序列 特征:特征: 一般是不编码的序列,在基因调控中起重要作用,一般是不编码的序列,在基因调控中起重要作用, 包括开启或关闭基因的活性、包括开启或关闭基因的活性、DNA复制的起始、其转录复制的起始、其转录 产物参与产物参与hnRNA的处理等;的处理等; 重复单位的序列相似,不完全一样,分散在基因组重复单位的序列相似,不完全一样,分散在基因组 中,序列的长度和拷贝数不均一;具有种属特异性。中,序列的长度和拷贝数不均一;具有种属特异性。 (1)Alu family 哺乳动物中含

14、量最丰富的中度重复序列家族。哺乳动物中含量最丰富的中度重复序列家族。 重复单位中带有限制性内切酶重复单位中带有限制性内切酶Alu的酶切位点:的酶切位点: AGCT TCGA 主要集中在细胞分裂晚期的主要集中在细胞分裂晚期的R R带,大部分属于非编码带,大部分属于非编码 DNADNA,但也有一部分位于,但也有一部分位于mRNAmRNA的非翻译区,甚至位于编的非翻译区,甚至位于编 码区内。码区内。 可能是由可能是由7S RNA降解形成并反转录后整合于降解形成并反转录后整合于 基因组中,从而在体外对许多启动子发挥正性基因组中,从而在体外对许多启动子发挥正性 或负性转录调节作用,但这些序列在体内条件或

15、负性转录调节作用,但这些序列在体内条件 下可能由于下可能由于DNA甲基化和甲基化和/或处于核糖体部位而或处于核糖体部位而 不能转录。不能转录。Alu序列在体细胞中几乎完全甲基序列在体细胞中几乎完全甲基 化而在精子中处于低甲基化状态。化而在精子中处于低甲基化状态。 (2)Kpn I family (3)Hinf family 仅次于Alu家族的第二大家族。 人Kpn I顺序长6.4kb,散在分布,拷贝数约为3000-4800个,占人体 基因组的1%。 限制性内切酶Hinf I 约有50-100个拷贝分散在基因组的不同区域。 (三)单拷贝序列(三)单拷贝序列(低度重复序列)低度重复序列) 也称为单

16、拷贝序列。也称为单拷贝序列。 真核生物一般为二倍体细胞,因此不重复的单一序列真核生物一般为二倍体细胞,因此不重复的单一序列 存在存在2个拷贝。个拷贝。 大多数结构基因都是单一序列。大多数结构基因都是单一序列。 80%左右的左右的mRNA来自单一序列来自单一序列DNA。 结构基因的突变容易引起遗传性状的改变或产生遗传结构基因的突变容易引起遗传性状的改变或产生遗传 性疾病。性疾病。 多基因家族(多基因家族(multigene family) 真核生物基因组中真核生物基因组中一组一组来源相同、结构相似、功能相关的基因,有来源相同、结构相似、功能相关的基因,有 的编码蛋白质,有的编码的编码蛋白质,有的

17、编码RNA。 根据分布不同,可分为两大类:根据分布不同,可分为两大类: (1)基因成簇地分布在一条染色体上,呈串联排列,产生多个拷贝,)基因成簇地分布在一条染色体上,呈串联排列,产生多个拷贝, 具有几乎相同的序列,同时发挥作用,如具有几乎相同的序列,同时发挥作用,如rRNA、tRNA、组蛋白、组蛋白等。等。 (2)各家族成员分布在不同的染色体上,序列虽然不相同,但编码的)各家族成员分布在不同的染色体上,序列虽然不相同,但编码的 是一组紧密相关的蛋白,如是一组紧密相关的蛋白,如干扰素、生长激素、珠蛋白干扰素、生长激素、珠蛋白等。等。 三三 、真核基因组中存在大量的多基因、真核基因组中存在大量的多

18、基因 家族与假基因家族与假基因 假基因(假基因(pseudogene) 在基因家族中,有些成员的序列于相关功能基因的序在基因家族中,有些成员的序列于相关功能基因的序 列相似,但不能被转录或转录后生成无功能的基因产列相似,但不能被转录或转录后生成无功能的基因产 物。物。 一个假基因常常有多个有害的突变,可能因为作为一一个假基因常常有多个有害的突变,可能因为作为一 种活性基因一旦停止,就再没有适当机制阻止进一步种活性基因一旦停止,就再没有适当机制阻止进一步 突变的聚积。假基因数目一般较少,往往只占基因总突变的聚积。假基因数目一般较少,往往只占基因总 数的一小部分。数的一小部分。 人人-珠蛋白基因簇

19、及各个功能珠蛋白基因簇及各个功能-类珠蛋白基因的结构类珠蛋白基因的结构 典型的前典型的前rRNA基因(转录单位)结构示意图基因(转录单位)结构示意图 组蛋白基因簇组蛋白基因簇 三种动物中的组蛋白基因簇 黑色方框:组蛋白基因黑色方框:组蛋白基因 空心方框:基因间的间隔区空心方框:基因间的间隔区 箭头:基因的转录方向箭头:基因的转录方向 假基因主要有两种类型假基因主要有两种类型 (1)由于一种基因的加倍而失活。这种类型假基因保留原)由于一种基因的加倍而失活。这种类型假基因保留原 来亲本基因的外显子及内含子组织并常与亲本基因密切联来亲本基因的外显子及内含子组织并常与亲本基因密切联 系,如系,如、球蛋白基因簇的假基因。它们可能是由于失去球蛋白基因簇的假基因。它们可能是由于失去 起始转录信号,或外显子起始转录信号,或外显子内含子连接处不能剪接或翻译内含子连接处不能剪接或翻译 不能终止。不能终止。 (2)第二种假基因仅含有亲本基因的外显子,常常拥有)第二种假基因仅含有亲本基因的外显子,常常拥有3 端端polyA尾,并随机分布于基因组中。这些假基因是源于尾,并随机分布于基因组中。这些假基因是源于 m

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论