3基因组的结构与功能ppt课件_第1页
3基因组的结构与功能ppt课件_第2页
3基因组的结构与功能ppt课件_第3页
3基因组的结构与功能ppt课件_第4页
3基因组的结构与功能ppt课件_第5页
已阅读5页,还剩89页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、l重点:基因组的概念,各类生物基因组的特重点:基因组的概念,各类生物基因组的特点。点。l难点:各类生物基因组的结构特点。难点:各类生物基因组的结构特点。l基本要求:基本要求:l掌握基因组的概念、各类生物基因组的结构掌握基因组的概念、各类生物基因组的结构特点;特点;l熟悉基因的转位与插入;熟悉基因的转位与插入;l比较和了解各类生物基因组的差异。比较和了解各类生物基因组的差异。 l从简单的病毒到复杂的高等动植物细胞,都有一套从简单的病毒到复杂的高等动植物细胞,都有一套决定于生物基本特征和功能的遗传信息,贮存于病决定于生物基本特征和功能的遗传信息,贮存于病毒或细胞的核酸中;毒或细胞的核酸中;lRNA

2、RNA和蛋白质的结构信息都以基因的形式贮存于和蛋白质的结构信息都以基因的形式贮存于DNADNA或或RNARNA中;中;lDNADNA中有大量非编码序列,在真核生物中高达中有大量非编码序列,在真核生物中高达95%95%以以上;上;l含有一种生物的一整套遗传信息的遗传物质,称为含有一种生物的一整套遗传信息的遗传物质,称为基因组。基因组。l病毒、原核生物及真核生物所贮存的遗传信息量有病毒、原核生物及真核生物所贮存的遗传信息量有巨大的差别,其基因组的结构与组织形式上也各有巨大的差别,其基因组的结构与组织形式上也各有特点。特点。l第一节第一节 基因组的概念基因组的概念l第二节第二节 病毒基因组的结构特点

3、病毒基因组的结构特点l第三节第三节 原核生物的基因组原核生物的基因组l第四节第四节 真核生物基因组真核生物基因组l第五节第五节 基因组变异的意义基因组变异的意义l第六节第六节 人类基因组学简介人类基因组学简介 一、基因组储存了生物体整套的遗传信息一、基因组储存了生物体整套的遗传信息基因组基因组genomegenome泛指一个细胞或病毒的全部遗泛指一个细胞或病毒的全部遗传信息。在真核生物体中,基因组是指一套完传信息。在真核生物体中,基因组是指一套完整单倍体整单倍体DNA(DNA(染色体染色体DNA)DNA)和线粒体和线粒体DNADNA的全部的全部序列,既包括编码序列,也包括大量存在的非序列,既包

4、括编码序列,也包括大量存在的非编码序列。编码序列。人类基因组包含人类基因组包含2222条常染色体和条常染色体和X X、Y Y两条性染色两条性染色体上的全部遗传物质核基因组以及胞浆线体上的全部遗传物质核基因组以及胞浆线粒体上的遗传物质线粒体基因组)。某些病粒体上的遗传物质线粒体基因组)。某些病毒的基因组由毒的基因组由RNARNA组成。组成。l基因组的大小通常以其基因组的大小通常以其DNA含量来表示,单倍体含量来表示,单倍体基因组中的全部基因组中的全部DNA量称为量称为C值值C-value););l不同生物的基因组大小差异很大。基因组大小和不同生物的基因组大小差异很大。基因组大小和DNA含量随着生

5、物进化复杂程度的增加以及生物含量随着生物进化复杂程度的增加以及生物结构和功能复杂程度的增加而逐步上升;结构和功能复杂程度的增加而逐步上升;lC值矛盾:如人的值矛盾:如人的C值只有值只有109bp,肺鱼的,肺鱼的C值为值为1011bp;l基因组的大小与基因的数目没有直接的线性关系。基因组的大小与基因的数目没有直接的线性关系。 类别类别基因组(基因组(bp)基因数目基因数目数量级数量级乙肝病毒乙肝病毒 3125(部分单链)(部分单链) 5 103 噬菌体噬菌体 48531 60 104 EB病毒病毒 172282 80 105 大肠杆菌大肠杆菌 4.2106 3000 106 人人 类类 3109

6、 3万万4万万 109 l原核生物的基因组一般较小,结构比较简单;原核生物的基因组一般较小,结构比较简单;l病毒基因组的大小和结构差异较大;病毒基因组的大小和结构差异较大;l真核生物基因组一般较庞大,但结构基因在真核生物基因组一般较庞大,但结构基因在基因组中所占的比例较小,其中编码序列更基因组中所占的比例较小,其中编码序列更小,且存在大量重复序列;小,且存在大量重复序列;l人的基因组中只有人的基因组中只有23% 的的DNA序列是编码序列是编码序列。序列。基因组信息基因组信息人类基因组:人类基因组: 编码区域只占编码区域只占2%-3%对于非编码序列,尚不清楚其含义或对于非编码序列,尚不清楚其含义

7、或功能功能非编码区域对于生命活动具有重要的非编码区域对于生命活动具有重要的意义意义 包括内含子、简单重复序列、移动包括内含子、简单重复序列、移动元件、假基因元件、假基因 重复序列重复序列: 大卫星大卫星macro-satelliteDNA小卫星小卫星mini-satelliteDNA微卫星微卫星micro-satelliteDNA 顺式调控元件顺式调控元件:启动子、增强子、沉默子启动子、增强子、沉默子l病毒病毒virus是最简单的生命形式,遗传信是最简单的生命形式,遗传信息的延续构成了生命活动的主要内容。息的延续构成了生命活动的主要内容。l病毒基因组的主要功能就是保证基因组的复病毒基因组的主要

8、功能就是保证基因组的复制及其向子代传递,整套基因组所编码的蛋制及其向子代传递,整套基因组所编码的蛋白质都是与基因复制、病毒颗粒包装以及向白质都是与基因复制、病毒颗粒包装以及向其它宿主细胞传递密切相关,有些蛋白质可其它宿主细胞传递密切相关,有些蛋白质可影响宿主细胞基因表达和增殖,通过促进细影响宿主细胞基因表达和增殖,通过促进细胞的增殖而有利于病毒复制繁衍。胞的增殖而有利于病毒复制繁衍。 l病毒基因组病毒基因组virus genome的核酸有的核酸有DNA,也有,也有RNA,但不会二者共存。,但不会二者共存。l按照核酸的性质、基因组结构及复制的特点,可以按照核酸的性质、基因组结构及复制的特点,可以

9、将病毒基因组分为以下几类:将病毒基因组分为以下几类:l 双链双链DNA如腺病毒是线状双链,乳头瘤病毒是如腺病毒是线状双链,乳头瘤病毒是环状双链;环状双链;l 单链单链DNA:如:如X174;l 双链双链RNA如轮状病毒含有正负两条如轮状病毒含有正负两条RNA链;链;l 单链负股单链负股RNA如流感病毒需要先合成与其互补的如流感病毒需要先合成与其互补的mRNA;l 单链正股单链正股RNA如如SARS;逆转录病毒通常引起人;逆转录病毒通常引起人和动物的肿瘤,如和动物的肿瘤,如HIV可作为可作为mRNA行使模板功能。行使模板功能。lSARS冠状病毒属于单股正链冠状病毒属于单股正链RNA病毒;病毒;l

10、RNA分子不分节段,分子不分节段,5端有甲基化帽,端有甲基化帽,3端有端有polyA结结构,基因组长度在构,基因组长度在2700030000碱基之间;碱基之间;l5端约端约2/3的区域编码病毒的区域编码病毒RNA聚合酶蛋白,后聚合酶蛋白,后1/3的区的区域编码结构蛋白,依次为域编码结构蛋白,依次为S蛋白蛋白(spike protein),E蛋白蛋白(envelop protein),M蛋白蛋白(membrane protein),N蛋白蛋白(nucleocapsid protein)等等;l在结构蛋白编码区可能的在结构蛋白编码区可能的ORF中,能编码在已知蛋白中,能编码在已知蛋白质序列数据库中

11、未找到任何同源序列的未知蛋白质序列数据库中未找到任何同源序列的未知蛋白PUP (predicted unknown protein) 。l逆转录病毒是一类特殊的单股正链逆转录病毒是一类特殊的单股正链RNARNA病病毒,通常引起人和动物的肿瘤;毒,通常引起人和动物的肿瘤;l逆转录病毒基因组一般包括逆转录病毒基因组一般包括3 3个基本的结个基本的结构基因,即构基因,即gaggag、polpol、l envenv,分别编码核心蛋,分别编码核心蛋l 白、逆转录酶和膜蛋白。白、逆转录酶和膜蛋白。 逆转录病毒的基因组结构逆转录病毒的基因组结构l 不同病毒基因组大小相差较大不同病毒基因组大小相差较大l乙肝病

12、毒乙肝病毒HBVHBVDNADNA为为3.2kb3.2kb,所含信息量,所含信息量较少,只能编码几种蛋白质;而痘病毒基因较少,只能编码几种蛋白质;而痘病毒基因组组DNADNA长达长达300kb300kb,可编码几百种蛋白质。,可编码几百种蛋白质。l 不同病毒基因组可以是不同结构的核酸不同病毒基因组可以是不同结构的核酸l病毒基因组的核酸可能是病毒基因组的核酸可能是DNADNA,也可能是,也可能是RNARNA;可能是单链,也可能是双链;可能是闭合环可能是单链,也可能是双链;可能是闭合环状分子,也可能是线性分子。状分子,也可能是线性分子。l 病毒基因组有连续的也有不连续的病毒基因组有连续的也有不连续

13、的lDNA DNA 病毒基因组均由连续的病毒基因组均由连续的DNADNA分子组成;多分子组成;多数数RNARNA病毒基因组也由连续的核糖核酸链组成,病毒基因组也由连续的核糖核酸链组成,但有些则以不连续的核糖核酸链组成。但有些则以不连续的核糖核酸链组成。l 病毒基因组的编码序列大于病毒基因组的编码序列大于9090 l病毒基因组的大部分是用来编码蛋白质的,病毒基因组的大部分是用来编码蛋白质的,只有很小部分不编码蛋白质。只有很小部分不编码蛋白质。l 单倍体基因组单倍体基因组 除逆转录病毒基因组有除逆转录病毒基因组有两个拷贝外,至今发现的病毒基因组都是单两个拷贝外,至今发现的病毒基因组都是单倍体,每个

14、基因在病毒颗粒中只出现一次。倍体,每个基因在病毒颗粒中只出现一次。 l 基因有连续的和间断的基因有连续的和间断的 感染细菌的病感染细菌的病毒噬菌体基因组与细菌基因组结构特点毒噬菌体基因组与细菌基因组结构特点相似,基因是连续的;而感染真核细胞的病相似,基因是连续的;而感染真核细胞的病毒基因组与真核生物基因组结构相似,有内毒基因组与真核生物基因组结构相似,有内含子,基因是间断的。含子,基因是间断的。 l 相关基因丛集排列相关基因丛集排列 病毒基因组核酸序病毒基因组核酸序列中功能相关的几个蛋白质基因丛集在基因列中功能相关的几个蛋白质基因丛集在基因组的一个或几个特定部位,形成一个功能单组的一个或几个特

15、定部位,形成一个功能单位或转录单元,受同一个转录调控机制调节,位或转录单元,受同一个转录调控机制调节,它们可被一起转录成为多顺反子它们可被一起转录成为多顺反子mRNAmRNA,然后,然后加工成为各种蛋白质的模板。加工成为各种蛋白质的模板。 l 基因重叠基因重叠 有些病毒在进化过程中形成有些病毒在进化过程中形成重叠基因,即同一段核酸序列能编码重叠基因,即同一段核酸序列能编码2 2种或种或2 2种以上蛋白质。这些重叠基因虽然共用一段种以上蛋白质。这些重叠基因虽然共用一段核酸序列,但转录出的核酸序列,但转录出的mRNAmRNA链阅读框不同。链阅读框不同。lX174X174噬菌体的基因结构噬菌体的基因

16、结构 l Ala Glu Gly Ala Glu Gly Val Met Val Met 终止终止l - G C G- G C GG A A G A A G G A G G A G T GG T GA T G A T G T T A AA A T G TT G T C T- C T- l Arg Lys Arg Lys Glu Glu 终止终止 起始起始 SerSer噬菌体噬菌体x174基因图谱基因图谱lSV40病毒的基因组是双链环状病毒的基因组是双链环状DNA,全长,全长5243bp,基因组复制通过,基因组复制通过DNA复制过程而完成;复制过程而完成;l基因组中含有早期转录基因和晚期转录基因

17、两基因组中含有早期转录基因和晚期转录基因两部分,早晚期转录的两部分基因大约等长,但部分,早晚期转录的两部分基因大约等长,但转录方向相反;转录方向相反;l在早期和晚期转录区之间是调控区约在早期和晚期转录区之间是调控区约400bp),主要包括复制起点、启动子和增强),主要包括复制起点、启动子和增强子,可调节基因组的复制及早期和晚期基因的子,可调节基因组的复制及早期和晚期基因的转录。转录。典型病毒基因组介绍典型病毒基因组介绍l原核生物一般只有一个染色体,即一个核酸原核生物一般只有一个染色体,即一个核酸分子,大多数为双螺旋结构,少数为单链形分子,大多数为双螺旋结构,少数为单链形式存在。原核生物基因组较

18、小,结构简单。式存在。原核生物基因组较小,结构简单。l原核生物需要根据外界环境的变化,调节自原核生物需要根据外界环境的变化,调节自身的酶系统的组成及功能,利用不同的营养身的酶系统的组成及功能,利用不同的营养物质,调整细胞内某些蛋白质的数量;物质,调整细胞内某些蛋白质的数量;l原核基因组中存在操纵子结构,一个调控区原核基因组中存在操纵子结构,一个调控区控制数个结构基因,结构基因是成套表达的,控制数个结构基因,结构基因是成套表达的,从而可以有效地利用核酸序列。从而可以有效地利用核酸序列。原核生物转录后的原核生物转录后的mRNA结构图结构图1.基因组通常由一条基因组通常由一条环状环状DNA分子组成。

19、分子组成。没有明显的核结构,没有明显的核结构,在细胞内相对集中在细胞内相对集中在一个区域,形成在一个区域,形成类 核 结 构 。 其 中类 核 结 构 。 其 中DNA占占80,其余,其余为为RNA和蛋白质。和蛋白质。Nucleoid (类核类核,拟核拟核) Bacterial chromosome 细菌染色体细菌染色体l2.基因组中只有基因组中只有1个复制起始点。个复制起始点。 l3.基因操纵子结构。操纵子基因操纵子结构。操纵子operon是指数是指数个功能相关的结构基因个功能相关的结构基因sructure gene串联串联在一起,构成信息区,连同上游的调控区在一起,构成信息区,连同上游的调

20、控区包括启动子和操纵基因以及下游的转录包括启动子和操纵基因以及下游的转录终止信号所构成的基因表达单位,所转录出终止信号所构成的基因表达单位,所转录出的的RNA为多顺反子。为多顺反子。l4. 编码序列一般不重叠。编码序列一般不重叠。l5.基因是连续的,无内含子,转录后不需要剪基因是连续的,无内含子,转录后不需要剪接切)。接切)。l6.编码区在基因组中所占的比例约占编码区在基因组中所占的比例约占50)远远大于真核基因组,但小于病毒基因组。远远大于真核基因组,但小于病毒基因组。非编码区主要是一些调控序列。非编码区主要是一些调控序列。l7.基因组中很少有重复序列。编码蛋白质的基因组中很少有重复序列。编

21、码蛋白质的结构基因多为单拷贝,而编码结构基因多为单拷贝,而编码rRNA的基因往的基因往往是多拷贝的。往是多拷贝的。l8.细菌基因组中存在有可移动的细菌基因组中存在有可移动的DNA序列,序列,包括插入序列和转座子。包括插入序列和转座子。l9.具有编码同工酶的基因。具有编码同工酶的基因。l10.在在DNA分子中具有多种功能的识别区域,分子中具有多种功能的识别区域,如复制的起始区、复制终止区、转录启动区如复制的起始区、复制终止区、转录启动区转录终止区等。这些区域往往具有特殊的序转录终止区等。这些区域往往具有特殊的序列,并且含有反向重复序列。列,并且含有反向重复序列。l转座因子转座因子transpos

22、able element是能在一是能在一个个DNA分子内部或两个分子内部或两个DNA分子之间移动的分子之间移动的DNA片段。在细菌中,则指可在质粒和染色片段。在细菌中,则指可在质粒和染色体之间或在质粒与质粒之间移动的体之间或在质粒与质粒之间移动的DNA片段。片段。转位也是转位也是DNA重组的一种形式。重组的一种形式。l 插入顺序插入顺序 插入顺序插入顺序insertion sequence , IS是一类较小的没有表型效应的转位因子,是一类较小的没有表型效应的转位因子,长度约长度约7002000bp,由一个转位酶基因及两,由一个转位酶基因及两侧的反向重复序列侧的反向重复序列inverted r

23、epeat sequence , IR组成。组成。 lIR的对称结构使的对称结构使IS可以双向插入靶位点,并可以双向插入靶位点,并在插入后于两侧形成一定长度在插入后于两侧形成一定长度311bp的的顺向重复序列(顺向重复序列( direct repeat sequence , DR ),),DR是靶位点序列复制的产物。是靶位点序列复制的产物。l 转座子转座子 转座子转座子transposon , Tn是一类是一类较大的可移动成分,除有关转座的基因外,较大的可移动成分,除有关转座的基因外,至少带有一个与转座作用无关并决定宿主细至少带有一个与转座作用无关并决定宿主细胞菌遗传性状的基因。转座子中的转位

24、胞菌遗传性状的基因。转座子中的转位酶常称为转座酶,其功能是介导转座子插入酶常称为转座酶,其功能是介导转座子插入到到DNA的其他部位。的其他部位。l 可 转 座 的 噬 菌 体可 转 座 的 噬 菌 体 可 转 座 的 噬 菌 体可 转 座 的 噬 菌 体transposable phage是一类具有转座功能是一类具有转座功能的溶源性噬菌体,包括的溶源性噬菌体,包括Mu和和D108等。等。简化的转座过程简化的转座过程l由转座因子复制出一个新拷贝转移到基因组中的新由转座因子复制出一个新拷贝转移到基因组中的新位置;位置;l新的转座因子转到靶点后,靶点序列倍增成为新的转座因子转到靶点后,靶点序列倍增成

25、为2个个靶点序列,并分别排列在转座因子两侧,形成同向靶点序列,并分别排列在转座因子两侧,形成同向重复序列见图重复序列见图 ););l在转座过程中能形成共合体;在转座过程中能形成共合体;l转座因子转座后能促使染色体畸变;转座因子转座后能促使染色体畸变;l转座因子从原来位置上切除切离,转座因子从原来位置上切除切离,excision););l转座可引起插入突变;转座可引起插入突变;l由于携带有标志基因如由于携带有标志基因如ampR、terR、smR,使受,使受体基因组增添了新的基因。体基因组增添了新的基因。转座子具有反转座子具有反向末端重复序向末端重复序列以及在靶部列以及在靶部位两侧产生的位两侧产生

26、的同向重复序列。同向重复序列。在该例中靶序在该例中靶序列为列为5bp,转,转座子末端由座子末端由9bp反向重复反向重复序列组成,数序列组成,数字字1-9指序列重指序列重复碱基对。复碱基对。l是存在于细菌染色体外的具有自主复制能力的共价是存在于细菌染色体外的具有自主复制能力的共价闭合环状双链闭合环状双链DNA分子。分子。l分子量一般为分子量一般为106108,小型质粒的长度一般为,小型质粒的长度一般为1.515kb。l其基因组的结构特点类似于细菌基因组。其基因组的结构特点类似于细菌基因组。l通常质粒对于宿主细胞的生存不是必需的,但质粒通常质粒对于宿主细胞的生存不是必需的,但质粒含有的某些基因,可

27、对宿主细胞的生物特性产生影含有的某些基因,可对宿主细胞的生物特性产生影响。响。l因质粒是一个完整、独立的复制子,并能转化细胞,因质粒是一个完整、独立的复制子,并能转化细胞,即把它的一个复本从供体细胞转移给受体细胞,而即把它的一个复本从供体细胞转移给受体细胞,而且能给转化细胞带来特殊标记,故在基因工程技术且能给转化细胞带来特殊标记,故在基因工程技术中作为目的基因的载体被广泛应用。中作为目的基因的载体被广泛应用。 AmproripUC18(3 kb)MCS (Multiple cloning sites,多克隆位点)Lac promoterlacZACGAATTCGAGCTCGGTACCCGGGG

28、ATCCTCTAGAGTCGACCTGCAGGCATGCA. T h rA s n S er S e r Val Pro Gly Asp Pro Leu Glu Ser Thr Cys Arg His Ala SerEcoRI SacI KpnISmaIXmaIBamHIXbaISalIHincIIAccIPstISphILac Z The ORF of the inserted gene has to be in the same direction as that of the lacZ A fusion protein contains the N-terminal sequence o

29、f lacZ and the inserted ORF will be produced AmproripUC18(3 kb)MCS (Multiple cloning sites,多克隆位点)Lac promoterlacZACGAATTCGAGCTCGGTACCCGGGGATCCTCTAGAGTCGACCTGCAGGCATGCA. T h rA s n S er S e r Val Pro Gly Asp Pro Leu Glu Ser Thr Cys Arg His Ala SerEcoRI SacI KpnISmaIXmaIBamHIXbaISalIHincIIAccIPstISphI

30、Lac Z The ORF of the inserted gene has to be in the same direction as that of the lacZ A fusion protein contains the N-terminal sequence of lacZ and the inserted ORF will be produced Ampicillin resistant? yes yesTetracycline resistant? No yesB X BBBXAmproriAmprTcroriAmprTcroripBR322B抗性基因的插入失活以筛选重组质粒

31、抗性基因的插入失活以筛选重组质粒l复制调控系统:由复制起点复制调控系统:由复制起点ori)、rep基因、基因、cop基因组成,控制质粒的拷贝数;基因组成,控制质粒的拷贝数;l分配系统分配系统:使质粒在细菌分裂过程中精确分配到子使质粒在细菌分裂过程中精确分配到子细胞中;细胞中;l细胞分裂系统:抑制细胞分裂,使细胞分裂与质细胞分裂系统:抑制细胞分裂,使细胞分裂与质粒复制协调;粒复制协调;l位点特异重组系统:由质粒位点特异重组系统:由质粒att位点、质粒编码的位点、质粒编码的Int和和Xis酶、宿主酶、宿主FIS组成,将高拷贝质粒形成的组成,将高拷贝质粒形成的多聚体拆开成单体,便于平均分配;多聚体拆

32、开成单体,便于平均分配;l质粒的不相容性:具有相同复制起始位点和分配质粒的不相容性:具有相同复制起始位点和分配区的两种质粒不能共存于一个宿主菌。区的两种质粒不能共存于一个宿主菌。l接合型质粒、可移动型质粒和自传递质粒:接接合型质粒、可移动型质粒和自传递质粒:接合型质粒只能使细菌接合;可移动型质粒可被合型质粒只能使细菌接合;可移动型质粒可被传递;自传递型质粒兼具上述两种质粒的功能传递;自传递型质粒兼具上述两种质粒的功能如如F质粒)。质粒)。l严谨型和松弛型质粒:分别为低拷贝数和高拷严谨型和松弛型质粒:分别为低拷贝数和高拷贝数质粒。贝数质粒。l窄宿主谱及广宿主谱质粒:窄宿主谱质粒存在窄宿主谱及广宿

33、主谱质粒:窄宿主谱质粒存在于一种或数种密切相关的宿主如于一种或数种密切相关的宿主如ColE);广);广宿主谱质粒可在不同科、属、种细菌间传递宿主谱质粒可在不同科、属、种细菌间传递如如pC194)。)。l细菌基因组学是测定细菌全基因组序列,把细细菌基因组学是测定细菌全基因组序列,把细菌全基因组序列的知识和分析序列的情报工具菌全基因组序列的知识和分析序列的情报工具结合起来,研究细菌的毒力和致病性的一门科结合起来,研究细菌的毒力和致病性的一门科学。学。l更好地了解病原微生物的致病机制;更好地了解病原微生物的致病机制;l加快重要致病基因的发现速度;加快重要致病基因的发现速度;l寻找病原菌特异的寻找病原

34、菌特异的DNA序列,提高临床诊断的序列,提高临床诊断的效率和准确性;效率和准确性;l为筛选有效药物及发展疫苗提供参考。为筛选有效药物及发展疫苗提供参考。一、真核生物基因组远大于原核生物基因组一、真核生物基因组远大于原核生物基因组真核生物真核生物eukaryote基因组的容量远远大于基因组的容量远远大于原核生物基因组,真核基因组的结构与功能原核生物基因组,真核基因组的结构与功能更为复杂。更为复杂。人的单倍体基因组人的单倍体基因组DNA约为约为3.3x109bp,大肠,大肠杆菌的基因组只有杆菌的基因组只有4.6x106bp。l真核生物细胞具有细胞核,真核生物细胞具有细胞核,DNA为线状,为线状,与

35、组蛋白、非组蛋白结合成染色质。与组蛋白、非组蛋白结合成染色质。l除细胞核基因组外,真核生物还具有线除细胞核基因组外,真核生物还具有线粒体基因组,在植物细胞中的叶绿体内粒体基因组,在植物细胞中的叶绿体内也有遗传物质。也有遗传物质。 l1、每一种真核生物都有一定的染色体数目,、每一种真核生物都有一定的染色体数目,除配子精子和卵子为单倍体外,体细胞一除配子精子和卵子为单倍体外,体细胞一般为双倍体,即含有两份同源的基因组。般为双倍体,即含有两份同源的基因组。l2、真核基因组远远大于原核生物基因组,结、真核基因组远远大于原核生物基因组,结构复杂,基因数庞大,具有许多复制起始点,构复杂,基因数庞大,具有许

36、多复制起始点,每个复制子大小不一。每个复制子大小不一。l3、真核基因都由一个结构基因与相关的调控、真核基因都由一个结构基因与相关的调控区 组 成 , 转 录 产 物 为 单 顺 反 子区 组 成 , 转 录 产 物 为 单 顺 反 子monocistron),即一分子),即一分子mRNA只能翻译只能翻译成一种蛋白质。成一种蛋白质。l4、真核生物含有大量重复顺序。、真核生物含有大量重复顺序。 l5、真核生物基因组内非编码序列、真核生物基因组内非编码序列non-coding sequence ,NCS占占90以上。以上。l6、真核基因是断裂基因、真核基因是断裂基因split gene),即编),即

37、编码序列被非编码序列分割开来,基因与基因间码序列被非编码序列分割开来,基因与基因间的非编码序列为间隔的非编码序列为间隔DNAspacer DNA),),基因内非编码序列为内含子,被内含子隔开的基因内非编码序列为内含子,被内含子隔开的编码序列则为外显子。编码序列则为外显子。l7、功能相关的基因构成各种基因家族,它们、功能相关的基因构成各种基因家族,它们可以串联在一起,亦可相距很远,但即使串联可以串联在一起,亦可相距很远,但即使串联在一起的成簇的基因也是分别转录的。在一起的成簇的基因也是分别转录的。l8、真核生物基因组中也存在有一些可移动的、真核生物基因组中也存在有一些可移动的遗传因素遗传因素mo

38、bile genetic elements)。)。 内含子、启动子内含子、启动子假基因假基因基因片段基因片段非编码序列非编码序列 90 编码序列编码序列105105的的DNADNA序列称为高序列称为高度重复序列。典型的高度重复序列有卫度重复序列。典型的高度重复序列有卫星星DNADNA和反向重复序列两类。和反向重复序列两类。 中度重复序列中度重复序列 中度重复序列是在基中度重复序列是在基因组中的重复次数为因组中的重复次数为101101105105。中度重。中度重复序列约占基因组复序列约占基因组DNADNA总量的总量的3535。 单拷贝序列单拷贝序列 在整个基因组中仅出现在整个基因组中仅出现一次或

39、少数几次。大多数编码蛋白质的一次或少数几次。大多数编码蛋白质的基因都属于这一类。基因都属于这一类。(一高重复序列(一高重复序列DNA:可集中在某一区域串:可集中在某一区域串联排列,典型的高重复序列有卫星联排列,典型的高重复序列有卫星DNA和反和反向重复序列。向重复序列。1.卫星卫星DNA是出现在非编码区的串联重复序列,是出现在非编码区的串联重复序列,通常存在于间隔通常存在于间隔DNA和内含子中,分为:和内含子中,分为:大卫星大卫星DNA:也称经典卫星:也称经典卫星DNA;小卫星小卫星DNA:由中等大小的串联重复顺序组成,:由中等大小的串联重复顺序组成,有高度可变的小卫星有高度可变的小卫星DNA

40、和端粒和端粒DNA;微卫星微卫星DNA:一类更简单的寡核苷酸串联重复:一类更简单的寡核苷酸串联重复序列。序列。Satellite DNAMouse genome DNA30% GC in satellite DNACsCl centrifugation卫星卫星 DNAs 经常存经常存在于异染色质在于异染色质鼠卫星位于着丝粒2.反向重复序列反向重复序列两个顺序相同的拷贝在两个顺序相同的拷贝在DNA链上呈反向排列。人链上呈反向排列。人类基因组约含类基因组约含5的反向重复序列,散布于整的反向重复序列,散布于整个基因组中,常见于基因组调控区内,可能个基因组中,常见于基因组调控区内,可能与复制、转录的调

41、控有关。与复制、转录的调控有关。两个反向排列的拷贝之间隔着一段间隔顺序;两个反向排列的拷贝之间隔着一段间隔顺序;两个拷贝反向串联在一起,中间没有间隔顺序,两个拷贝反向串联在一起,中间没有间隔顺序,形成回文结构形成回文结构palindrome)。)。l中度重复序列散在分布于基因组中;中度重复序列散在分布于基因组中;l中重复序列常与单拷贝序列间隔排列,有一部中重复序列常与单拷贝序列间隔排列,有一部分是编码分是编码rRNA、tRNA、组蛋白和免疫球蛋白、组蛋白和免疫球蛋白的结构基因,另外一些可能与基因的调控有关;的结构基因,另外一些可能与基因的调控有关;l典型的典型的Alu家族是一种散在重复顺序,由

42、于序家族是一种散在重复顺序,由于序列中有限制性内切酶列中有限制性内切酶Alu的酶切位点而得名;的酶切位点而得名;l重复单位是重复单位是300bp,由,由2个个130bp的重复序列组的重复序列组成,中间有成,中间有31bp间隔序列,重复间隔序列,重复3050万次;万次;l为灵长类基因组所特有,可作为天然标记。为灵长类基因组所特有,可作为天然标记。lDNA位点多态性:由于等位基因间在特位点多态性:由于等位基因间在特定位点上的定位点上的DNA序列存在差异造成;序列存在差异造成;l限制性片段长度多态性限制性片段长度多态性RFLP):用同):用同一种限制酶消化不同个体的一种限制酶消化不同个体的DNA时,

43、会时,会得到长度各不相同的限制性片段类型;得到长度各不相同的限制性片段类型;l串联重复顺序多态性:可变数目的串联串联重复顺序多态性:可变数目的串联重复序列重复序列VNTRs),有小卫星),有小卫星DNA多多态性,微卫星态性,微卫星DNA多态性。多态性。l基因家族基因家族gene family是指核苷酸序列或是指核苷酸序列或编码产物的结构具有一定程度同源性的一组编码产物的结构具有一定程度同源性的一组基因。同一个家族的基因成员是由同一祖先基因。同一个家族的基因成员是由同一祖先基因进化而来,同源性最高可达基因进化而来,同源性最高可达100(多拷(多拷贝基因)。贝基因)。l多基因家族中的基因,其编码产

44、物常具有相多基因家族中的基因,其编码产物常具有相似的功能;而在基因超家族中,许多基因的似的功能;而在基因超家族中,许多基因的编码产物在功能上却毫无相同之处。编码产物在功能上却毫无相同之处。l根据家族内各成员同源性的程度,基因家族根据家族内各成员同源性的程度,基因家族主要有以下几种类型:主要有以下几种类型:l 核酸序列相同核酸序列相同 实际上是多拷贝基因。如实际上是多拷贝基因。如rRNArRNA基因家族,基因家族,tRNAtRNA基因家族,组蛋白基因基因家族,组蛋白基因家族等。家族等。l 核酸序列高度同源核酸序列高度同源 如人类生长激素基因如人类生长激素基因家族。包括家族。包括3 3种激素的基因

45、:人生长激素种激素的基因:人生长激素hGHhGH)、人胎盘促乳素)、人胎盘促乳素hCShCS和催乳素和催乳素prolactinprolactin)。它们之间的同源性很高,尤)。它们之间的同源性很高,尤其是其是hGHhGH与与hCShCS,蛋白质氨基酸序列有,蛋白质氨基酸序列有8585的的同源性,同源性,mRNAmRNA序列有序列有9292的同源性。的同源性。l 编码产物具有同源功能区编码产物具有同源功能区 如如srcsrc癌基因癌基因家族,各成员基因结构虽无明显的同源性,家族,各成员基因结构虽无明显的同源性,但每个基因产物都含有但每个基因产物都含有250250个氨基酸顺序的同个氨基酸顺序的同源

46、蛋白激酶结构域。源蛋白激酶结构域。l 编码产物具有小段保守基序编码产物具有小段保守基序 如如DEADDEAD盒基盒基因家族含有几个不同的基因,它们的产物都因家族含有几个不同的基因,它们的产物都具有解旋酶的功能,其结构特征是具有解旋酶的功能,其结构特征是8 8个氨基酸个氨基酸基序,内含基序,内含DEADDEAD盒序列:盒序列:AspAspGluGluAlaAlaAspAsp。 l基因超家族基因超家族 基因超家族基因超家族gene gene superfamilysuperfamily是指一组由多基因家族及单基是指一组由多基因家族及单基因组成的更大的基因家族。它们的结构有程因组成的更大的基因家族。

47、它们的结构有程度不等的同源性,可能都起源于相同的祖先度不等的同源性,可能都起源于相同的祖先基因,但是它们的功能并不一定相同。最典基因,但是它们的功能并不一定相同。最典型的基因超家族是免疫球蛋白基因超家族。型的基因超家族是免疫球蛋白基因超家族。l通过应用计算机分析基因结构序列,使通过应用计算机分析基因结构序列,使越来越多的基因归为一类,使原来的多越来越多的基因归为一类,使原来的多基因家族成为基因超家族。基因家族成为基因超家族。l如丝氨酸蛋白酶基因超家族,原来是多如丝氨酸蛋白酶基因超家族,原来是多基因家族,具有酶活性;现已有很多新基因家族,具有酶活性;现已有很多新成 员 加 入 进 去 , 特 别

48、 是 载 脂 蛋 白成 员 加 入 进 去 , 特 别 是 载 脂 蛋 白apolipoprotein),只是转移胆固醇蛋),只是转移胆固醇蛋白颗粒中的成分,不具有酶活性。白颗粒中的成分,不具有酶活性。l是与某些有功能的基因结构相似,但不能表达基因是与某些有功能的基因结构相似,但不能表达基因产物的基因;产物的基因;l假基因起初可能是有功能的,但在复制时编码序列假基因起初可能是有功能的,但在复制时编码序列或调控元件发生突变,或是插入了或调控元件发生突变,或是插入了mRNA逆转录的逆转录的cDNA,缺少基因表达所需要的启动子序列;,缺少基因表达所需要的启动子序列;l传统假基因通常是在编码区引入了终

49、止密码子,如传统假基因通常是在编码区引入了终止密码子,如;l加工的假基因加工的假基因是插入了由是插入了由mRNA逆转录的逆转录的cDNA;l假基因在高等哺乳动物基因组中是一种普遍现象。假基因在高等哺乳动物基因组中是一种普遍现象。假基因:类似于基因但不表达的假基因:类似于基因但不表达的DNA序列。序列。不表现任何功能,是基因的退化形式。不表现任何功能,是基因的退化形式。假基因在基因组中形成稳定的和无活性的拷贝,由活化的假基因在基因组中形成稳定的和无活性的拷贝,由活化的原始基因突变而来,原始基因突变而来,存在着在某个阶段伤及基因表达的一种或多种缺陷入启存在着在某个阶段伤及基因表达的一种或多种缺陷入

50、启动子错误、有缺陷的剪接信号、框架中有终止信号等之动子错误、有缺陷的剪接信号、框架中有终止信号等之故。故。一旦不能产生正常的基因产物,就失去了对发生进一步突一旦不能产生正常的基因产物,就失去了对发生进一步突变的选择性屏障作用,因此典型的假基因都有很多缺陷。变的选择性屏障作用,因此典型的假基因都有很多缺陷。某些假基因有某些假基因有3-多聚多聚A尾巴及准确地切掉了内含子,因而尾巴及准确地切掉了内含子,因而与与mRNA类似,被认为是源自插入基因组的逆转录体可类似,被认为是源自插入基因组的逆转录体可能由某些病毒携带)。能由某些病毒携带)。 真核生物基因组中的转座子真核生物基因组中的转座子在真核生物基因

51、组中,编码序列在染色体在真核生物基因组中,编码序列在染色体中的位置相对比较稳定,但一些中度重中的位置相对比较稳定,但一些中度重复序列往往可以移动。复序列往往可以移动。 端粒端粒以线性染色体形式存在的真核基因组以线性染色体形式存在的真核基因组DNADNA末端都有一种特殊的结构,称为端粒末端都有一种特殊的结构,称为端粒telomeretelomere)。)。该结构是一段该结构是一段DNADNA序列和蛋白质形成的复序列和蛋白质形成的复合体,仅在真核细胞染色体末端存在。合体,仅在真核细胞染色体末端存在。其功能主要有保护线性其功能主要有保护线性DNADNA的完整复制、的完整复制、保护染色体末端及决定细胞

52、的寿命等。保护染色体末端及决定细胞的寿命等。l基因组在进化过程中发生了各种形式的变异,如突变、插入、缺失、不同数目串联重复和单核苷酸多态性);l染色体变异可导致疾病的发生;l线粒体基因病受到越来越多的重视;l易感基因与环境的相互作用。基因组学包括基因组学包括3个不同的亚领域个不同的亚领域结构基因组学结构基因组学(structural genomics) 功能基因组学功能基因组学(functional genomics)比较基因组学比较基因组学(comparative genomics) 基因组学概念基因组学概念第六节基因组学是一门新的科学第六节基因组学是一门新的科学l人类基因组计划的直接动因是

53、要解决包人类基因组计划的直接动因是要解决包括肿瘤在内的人类疾病的分子遗传学问括肿瘤在内的人类疾病的分子遗传学问题。题。l60006000多个单基因遗传病和多种大面积危多个单基因遗传病和多种大面积危害人类健康的多基因遗传病的致病基因害人类健康的多基因遗传病的致病基因及相关基因,代表了对人类基因中结构及相关基因,代表了对人类基因中结构和功能完整性至关重要的组成部分。和功能完整性至关重要的组成部分。l疾病基因的克隆在疾病基因的克隆在HGPHGP中占据着核心位置,中占据着核心位置,也是计划实施以来成果最显著的部分。也是计划实施以来成果最显著的部分。人类基因组人类基因组DNA的奥秘的奥秘 遗传信息存贮在

54、遗传信息存贮在4种字符组成的核酸序列中种字符组成的核酸序列中 “天书天书”用遗传语言书写的人类遗传蓝本用遗传语言书写的人类遗传蓝本包含的信息量巨大包含的信息量巨大更重要的是目前人类对它了解甚少更重要的是目前人类对它了解甚少天书中只有天书中只有4个字符碱基个字符碱基A、T、G、C)既没有段落,也没有标点符号既没有段落,也没有标点符号是一个长度为是一个长度为3109的一维序列。的一维序列。 一、人类基因组的四张图谱:遗传图,物一、人类基因组的四张图谱:遗传图,物理图,转录图,序列图;理图,转录图,序列图;二、人类基因组计划的完成向人们提出了二、人类基因组计划的完成向人们提出了更高的挑战更高的挑战

55、人类基因组计划简介人类基因组计划简介Craig Venter (head of Celera Genomics), Ari Patrinos (director of DOE HumanGenome Program and Biological and Environmental Research Program), and Francis Collins (director, NIH National Human Genome Research Institute) (May) Robert Sinsheimer (pictured) hosts a meeting at the Unive

56、rsity of California (UC), Santa Cruz, to discuss the feasibility of sequencing the human genome.(December) Kary Mullis and colleagues at Cetus Corp. develop PCR, a technique to replicate vast amounts of DNA (Science).(August) NIH (National Institutes of Health) begins large-scale sequencing trials o

57、n four model organisms: Mycoplasma capricolum (支原体), Escherichia coli (大肠杆菌)(up, pink), Caenorhabditis elegans (线虫 ) (up, rainbow), and Saccharomyces cerevisiae (啤酒酵母) (up, ovals). Each research group agrees to sequence 3 Mb at 75 cents a base within 3 years.(June) NIH biologist J. Craig Venter anno

58、unces a strategy to find expressed genes, using ESTs (Science). A fight erupts at a congressional hearing 1 month later, when Venter reveals that NIH is filing patent applications on thousands of these partial genes.(October) The Japanese rice genome sequencing effort begins.The HGP consortium publi

59、shes its working draft in Nature (15 February), and Celera publishes its draft in Science (16 February).For more details,we can refer the web:/feature/plus/sfg/human/timeline.shtmlRefer Science Online:/cgi/content/abstract/296/5565/79 2019年2月中旬,Nature与分别发表了人类基因组工作框架图(the draft genome),这是人类基因组计划(human genome project,HGP)实施以来所取得的最重大进展,也是生命科学领域中的一个里程碑。自HGP提出以来,到现在一共16年。这16年来科学家们所走过的是一条充满艰辛的路,同时也是一条谱写辉煌的路。回顾这段将在人类历史上永载史册

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论