研究课现代分子生物学基因基因组和基因组学(1)_第1页
研究课现代分子生物学基因基因组和基因组学(1)_第2页
研究课现代分子生物学基因基因组和基因组学(1)_第3页
研究课现代分子生物学基因基因组和基因组学(1)_第4页
研究课现代分子生物学基因基因组和基因组学(1)_第5页
已阅读5页,还剩57页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、 一、基因一、基因 1. 基因的研究简史基因的研究简史 孟德尔(孟德尔(Mendel)的颗粒因子:一个因子决定一个性状)的颗粒因子:一个因子决定一个性状 (1865年年)。 约翰森(约翰森(Johannsen):首先提出基因一词():首先提出基因一词(1909年)年) 摩尔根(摩尔根(Morgan)的基因论:一个基因控制一个性状)的基因论:一个基因控制一个性状 (1926年),明确了基因存在于染色体上。年),明确了基因存在于染色体上。 Beadle 和和Tatum:一个基因一个酶学说(:一个基因一个酶学说(1941年)。年)。 Avery肺炎双球菌转化实验:证实了遗传物质的本质是肺炎双球菌转化

2、实验:证实了遗传物质的本质是DNA (1944年)。年)。 Herhey Herhey 和和 ChaseChase :噬菌体大肠杆菌感染实验,只有:噬菌体大肠杆菌感染实验,只有DNA 能进入大肠杆菌(能进入大肠杆菌(1952年)。年)。 Benzer:提出一个顺反子,一条多肽链的概念(:提出一个顺反子,一条多肽链的概念(1955年)。年)。 Watson 和和Crick:提出:提出DNA右手双螺旋理论(右手双螺旋理论(1953年)。年)。 Crick:提出中心法则(:提出中心法则(1957年)。年)。 Jacob和和Monod:提出了操纵子模型(:提出了操纵子模型(1961年)。年)。 Nir

3、enberg:三联密码子学说将:三联密码子学说将DNA结构与生物功能结合起来结构与生物功能结合起来 (1966年)年) 。 Mc-Clintock:在玉米中发现了遗传因子可以转移位置(:在玉米中发现了遗传因子可以转移位置(1951 年代)年代)(1983年年诺贝尔生理学奖)诺贝尔生理学奖)。 Sharp等:真核生物基因中的断裂现象(等:真核生物基因中的断裂现象(1977年)。年)。 Feir等:等:发现噬菌体中重叠基因(发现噬菌体中重叠基因(1978年)。年)。 2. 基因的分子定义基因的分子定义 DNA分子中含有特定遗传信息的核苷酸序列,是遗传物质分子中含有特定遗传信息的核苷酸序列,是遗传物

4、质 的最小功能单位的最小功能单位。合成有功能的蛋白质多肽链或。合成有功能的蛋白质多肽链或RNA所必需的所必需的 全部核酸序列(通常是全部核酸序列(通常是DNA序列)。故一个基因应包含不仅是序列)。故一个基因应包含不仅是 编码蛋白质肽链或编码蛋白质肽链或RNA的核酸序列,还的核酸序列,还包括为保证转录所必需包括为保证转录所必需 的调控序列、的调控序列、5非翻译序列、内含子以及非翻译序列、内含子以及3非翻译序列等所有的非翻译序列等所有的 核酸序列核酸序列(蛋白质基因和(蛋白质基因和RNA基因)。基因)。 2.0 nm 小小 沟沟 大大 沟沟 泛指一个有生命体、病毒或细胞器的全部遗泛指一个有生命体、

5、病毒或细胞器的全部遗 传物质;在真核生物,基因组是指一套染色体传物质;在真核生物,基因组是指一套染色体 (单倍体)(单倍体)DNADNA,即细胞中基因以及,即细胞中基因以及非基因的非基因的 DNADNA序列的总称。序列的总称。 二、基因组二、基因组( (genome) ) 一)概念一)概念 二)基因组的特点二)基因组的特点 1、病毒基因组的特点、病毒基因组的特点 1) 每种病毒中只有一种核酸,或为每种病毒中只有一种核酸,或为DNA,或为,或为RNA。 2) 病毒核酸大小差别很大。最小的病毒核酸大小差别很大。最小的3kb(乙肝病毒),仅编(乙肝病毒),仅编 码码4种蛋白质,最大的可达种蛋白质,最

6、大的可达300kb以上(痘病毒),有几百个以上(痘病毒),有几百个 基因。一般基因。一般DNA病毒较大,病毒较大,RNA病毒较小。病毒较小。 3) 大部分病毒核酸是单倍体(除反转录)。大部分病毒核酸是单倍体(除反转录)。 4) 病毒基因组中也具有操纵子结构。如病毒基因组中也具有操纵子结构。如X174从从PD启动子开启动子开 始转录生成的始转录生成的mRNA包含包含D,(,(E),),J,F,G和和H结构基因。结构基因。 5. 噬菌体基因组中无内含子,但感染真核细胞的病毒基因组噬菌体基因组中无内含子,但感染真核细胞的病毒基因组 中具有内含子(中具有内含子(SV40早期基因早期基因T和和t) 6.

7、 有基因重叠(同有基因重叠(同ORF重叠、异重叠、异ORF重叠和反重叠和反ORF重叠)。重叠)。 7.大部分大部分DNA用于编码蛋白质,只有一小部分是不翻译的。用于编码蛋白质,只有一小部分是不翻译的。 不翻译区通常是基因表达的调控序列。不翻译区通常是基因表达的调控序列。 8. 调控序列可以被宿主细胞所识别,其遗传密码和基因组的调控序列可以被宿主细胞所识别,其遗传密码和基因组的 结构必须与宿主体系相匹配。结构必须与宿主体系相匹配。 HBV 基因基因 结构结构 2、细菌的基因组及特点、细菌的基因组及特点 1)组成:细菌染色体和质粒)组成:细菌染色体和质粒 2)细菌基因组的特征)细菌基因组的特征 (

8、1) 基因组相对较小(基因组相对较小(E.coli 4.6106bp,4000个基因),只个基因),只 有一个复制启始位点。有一个复制启始位点。 (2) 具有操纵子结构:功能上相关的几个基因往往在一起组具有操纵子结构:功能上相关的几个基因往往在一起组 成操纵子结构,即几个结构基因串联在一起,受它们上游的共同成操纵子结构,即几个结构基因串联在一起,受它们上游的共同 调控区控制。当基因开放时,这几个基因转录在一条调控区控制。当基因开放时,这几个基因转录在一条mRNA链上,链上, 然后分别翻译合成各自的蛋白肽链。操纵子的末端具有特殊的终然后分别翻译合成各自的蛋白肽链。操纵子的末端具有特殊的终 止序列

9、。止序列。 (3) 基因是连续的:结构基因中没有内含子(基因是连续的:结构基因中没有内含子(intron)成分,)成分, 在转录后不需剪接加工,转录产物的寿命较短。在转录后不需剪接加工,转录产物的寿命较短。 细菌乳糖操纵子细菌乳糖操纵子 LacZ(z):): -半半 乳糖苷酶乳糖苷酶 Lac Y(y):半乳):半乳 糖苷渗透酶糖苷渗透酶 Lac A(a):半乳):半乳 糖苷转酰酶糖苷转酰酶 Lac O(o):操纵):操纵 基因基因 Lac P(p):启动):启动 基因基因 (4) 大部分大部分DNA是用于编码蛋白质的,只有一是用于编码蛋白质的,只有一 小部分是不翻译的。不翻译区中含有间隔区小部

10、分是不翻译的。不翻译区中含有间隔区 (Spacer)和基因表达的调控序列。)和基因表达的调控序列。 (5) 基因组中仅有少数基因存在基因重叠现象。基因组中仅有少数基因存在基因重叠现象。 (6) 结构基因是结构基因是单单拷贝,拷贝,rRNA基因是基因是多多拷贝。拷贝。 3)质粒)质粒(plasmid) (1)概念:是细菌染色体以外的遗传物质,是环状闭合的双)概念:是细菌染色体以外的遗传物质,是环状闭合的双 链链DNA。 (2)分类)分类 A、按复制机理分:严紧控制型质粒,松弛控制型质粒、按复制机理分:严紧控制型质粒,松弛控制型质粒 B、按功能分:、按功能分:F质粒、质粒、R质粒、质粒、Col(c

11、olicin)质粒(可产)质粒(可产 生大肠杆菌素)、生大肠杆菌素)、Ent质粒(可产生肠毒素)。质粒(可产生肠毒素)。 C、按性状分:结合性质粒,非结合性质粒、按性状分:结合性质粒,非结合性质粒 (3) 质粒的一般性质质粒的一般性质 A、多为、多为DNA分子,但酵母杀伤质粒为分子,但酵母杀伤质粒为RNA B、质粒并非细菌生存所必不可少的遗传物质,可以在细菌间、质粒并非细菌生存所必不可少的遗传物质,可以在细菌间 转移与丢失。转移与丢失。 C、质粒的传递(转移)是细菌遗传物质转移的一个重要方、质粒的传递(转移)是细菌遗传物质转移的一个重要方 式。但分子量式。但分子量2.5107的质粒可从供体细胞

12、转移一个副本给受体细胞,的质粒可从供体细胞转移一个副本给受体细胞, 如如F质粒质粒6.2107,R质粒质粒2.5107) D、质粒可自行失去或经人工处理而消失(称为消、质粒可自行失去或经人工处理而消失(称为消 除)。除)。 E、质粒复制依赖宿主细胞的复制机器,但可以独、质粒复制依赖宿主细胞的复制机器,但可以独 立复制。立复制。 F、可有几种质粒同时共存在于一个细菌内,但同、可有几种质粒同时共存在于一个细菌内,但同 群质粒有不相容性(同群质粒具有同源性,可以产群质粒有不相容性(同群质粒具有同源性,可以产 生相同的阻遏蛋白,故彼此间有相互抑制作用,不生相同的阻遏蛋白,故彼此间有相互抑制作用,不 能

13、共存于同一细胞)。能共存于同一细胞)。 大肠杆菌的基因组大肠杆菌的基因组 特点特点 其基因组大小为其基因组大小为4.7106bp,基因数为基因数为4100个,它是个,它是1997年由年由 Wisconsin大学的大学的Blattner等人完成,目前等人完成,目前62的基因功能已阐的基因功能已阐 明,明,38的基因功能尚不清楚。的基因功能尚不清楚。 1)遗传信息具有连续性;)遗传信息具有连续性; 2)功能相关的结构基因组成操纵子结构;)功能相关的结构基因组成操纵子结构; 4 )基因组的重复序列少而短。)基因组的重复序列少而短。 3)结构基因的单拷贝及)结构基因的单拷贝及 rRNA的多拷贝;的多拷

14、贝; 3、真核生物基因组的特点、真核生物基因组的特点 1) 基因组含有更大的基因组含有更大的DNA分子,以染色体形式储存于细胞分子,以染色体形式储存于细胞 核内,除配子细胞外,体细胞内的基因的基因组是双份的。但核内,除配子细胞外,体细胞内的基因的基因组是双份的。但 应注意:应注意: (1)并非生物越高等,基因组越大。即并非进化的复杂程)并非生物越高等,基因组越大。即并非进化的复杂程 度与度与DNA含量成正比。如某些含量成正比。如某些植物和两栖类植物和两栖类的的DNA含量是人的含量是人的 几十乃至上百倍(如几十乃至上百倍(如小鼠基因组大小为小鼠基因组大小为250Mb,猪基因组大小,猪基因组大小

15、为为270Mb,人类基因组为人类基因组为285Mb,而,而水稻基因组为水稻基因组为389Mb) (2)同一类复杂性差不多,形态也相似的生物,理论上其)同一类复杂性差不多,形态也相似的生物,理论上其 基因组也应比较接近,其实不然。如同是两栖类可相差十倍以基因组也应比较接近,其实不然。如同是两栖类可相差十倍以 上。上。 (3)基因组中)基因组中DNA的量远大于编码的量远大于编码蛋白质蛋白质所需要的量。所需要的量。 2) 基因组结构复杂,有多个复制启始位点,但每基因组结构复杂,有多个复制启始位点,但每 个复制子的长度较小。个复制子的长度较小。 3) 基因是不连续的。基因是不连续的。 4) 转录单位一

16、般是单顺反子的。即一个基因一种转录单位一般是单顺反子的。即一个基因一种 mRNA一种蛋白质,但蛋白质的最终产物可因剪接一种蛋白质,但蛋白质的最终产物可因剪接 方式的不同而有差异(如方式的不同而有差异(如Bcl-x: Bcl-x1 Bcl-xs ) 5) 存在重复序列存在重复序列 (1)高度重复序列()高度重复序列(105次)。次)。 A、卫星、卫星DNA: 根据长度可将其分为根据长度可将其分为3类类 卫星(卫星(satellite)DNA: 重复长度几百个重复长度几百个bp,其在人,其在人 群中多态性不强。群中多态性不强。 小卫星小卫星DNA:重复长度:重复长度15-70bp,其在人群中有高度

17、,其在人群中有高度 的特异性。的特异性。 微卫星微卫星DNA(简单串联重复序列):重复长度(简单串联重复序列):重复长度2-5bp, 其在人群中存在个体间的高度变化,是其在人群中存在个体间的高度变化,是DNA指纹的形成基指纹的形成基 础。础。 B、倒位(反向)重复序列、倒位(反向)重复序列 又称临时复性部分,重复单位约长又称临时复性部分,重复单位约长300bp,两个,两个 单位之间有一平均单位之间有一平均1.6kb的片段相隔,多数散布于基的片段相隔,多数散布于基 因组中。因组中。 C、较复杂的重复单位组成的重复顺序、较复杂的重复单位组成的重复顺序 灵长类所独有,用灵长类所独有,用Hind消化非

18、洲绿猴消化非洲绿猴DNA, 可以得到重复单位为可以得到重复单位为172bp的高度重复顺序,这种的高度重复顺序,这种 顺序大部份由交替变化的嘌呤和嘧啶组成,又称为顺序大部份由交替变化的嘌呤和嘧啶组成,又称为 卫星卫星DNA。 D、高度重复顺序的功能、高度重复顺序的功能 a.参与复制水平的调节。参与复制水平的调节。 b.参与基因表达的调控参与基因表达的调控 c.参与转位作用参与转位作用 d.与进化有关与进化有关 e. DNA指纹指纹 f.卫星卫星DNA成簇的分布在染色体着丝粒附近,成簇的分布在染色体着丝粒附近, 可能与染色体减数分裂时染色体配对有关可能与染色体减数分裂时染色体配对有关 (2)中度重

19、复序列)中度重复序列(105次)。次)。100-几千几千bp片段的重片段的重 复,其产物是细胞大量需要的。复,其产物是细胞大量需要的。 rRNA基因:可重复数百次,可作为一种遗传标志。基因:可重复数百次,可作为一种遗传标志。 tRNA基因基因 组蛋白基因组蛋白基因 Alu家族:有家族:有3万个成员,平均每万个成员,平均每6kb就有一个,长度约就有一个,长度约 300bp,因在,因在170bp处有一处有一Alu位点(位点(AG/CT)而得名。)而得名。 Alu顺序具有种的特异性,功能:目前尚不清楚,可能在顺序具有种的特异性,功能:目前尚不清楚,可能在 hnRNA(heterogeneous nu

20、clear RNA)转录和加工中起转录和加工中起 作用,也可能与遗传重组及染色体不稳定性有关。作用,也可能与遗传重组及染色体不稳定性有关。 Kpn家族:人类和灵长类家族:人类和灵长类DNA经经Kpn酶解后,产酶解后,产 生生4个片段(个片段(1.2、1.5、1.8、1.9kb),这些就被命名为),这些就被命名为 Kpn家族。人类基因组中的家族。人类基因组中的Kpn序列约在序列约在3-6%,也是,也是 散在分布的。功能尚不清楚。散在分布的。功能尚不清楚。 (3)单一序列()单一序列(unique sequence) 单拷贝顺序在基因组中占单拷贝顺序在基因组中占50-80,如人基因组中,大,如人基

21、因组中,大 约有约有60-65的顺序属于这一类。的顺序属于这一类。 6) 存在多基因家族和超基因家族存在多基因家族和超基因家族 (1)多基因家族()多基因家族(multigene family):亦称基因家族。是):亦称基因家族。是 指一组具有指一组具有类似功能类似功能,核苷酸序列又有同源性的基因。,核苷酸序列又有同源性的基因。 分类:分类: 按基因的终产物分为两类:一类编码按基因的终产物分为两类:一类编码RNA,另一类编码,另一类编码 蛋白质。蛋白质。 按在基因组中的分布分为两类:一类串联排列在一起,按在基因组中的分布分为两类:一类串联排列在一起, 形成基因簇,亦称形成基因簇,亦称串联重复基

22、因串联重复基因。另一类家族成员则可以分散。另一类家族成员则可以分散 在不同的部位上。在不同的部位上。 (2)超基因家族()超基因家族(supergene family):由多基因家族及单基):由多基因家族及单基 因组成的更大的基因家族。成员间有不同程度的因组成的更大的基因家族。成员间有不同程度的同源同源,但它们,但它们 的的功能功能并不相似,这是与多基因家族的差别所在。如并不相似,这是与多基因家族的差别所在。如Ig超家族。超家族。 免疫球蛋免疫球蛋 白超家族白超家族 7) 基因类型多样基因类型多样 (1)假基因()假基因():):在多基因家族中,不产生有功能基因在多基因家族中,不产生有功能基因

23、 产物的基因产物的基因。即序列与有功能的基因相似,但或者不能转。即序列与有功能的基因相似,但或者不能转 录,或者转录后生成无功能的基因产物。录,或者转录后生成无功能的基因产物。 原因:可能基因在进化过程中,发生突变所致(如缺失、原因:可能基因在进化过程中,发生突变所致(如缺失、 倒位、点突变等)。假基因往往缺少正常基因的内含子,倒位、点突变等)。假基因往往缺少正常基因的内含子, 两侧有顺向重复序列。两侧有顺向重复序列。 (2)分(断)裂基因(不连续基因):编码序列称外显子)分(断)裂基因(不连续基因):编码序列称外显子 (extron),非编码序列称内含子(),非编码序列称内含子(intron

24、,or intervening sequence)。)。 (3)非剪接基因(连续基因):原核和真核细胞都有。真)非剪接基因(连续基因):原核和真核细胞都有。真 核核rRNA基因也是非剪接基因。基因也是非剪接基因。 (4)跳动(跃)基因(可转移的)跳动(跃)基因(可转移的DNA成分、转座子):成分、转座子):是是 指可在指可在DNA分子间进行转移的分子间进行转移的DNA片段。片段。与一般转移概念与一般转移概念 不同,转移后仍保留原来位置上的不同,转移后仍保留原来位置上的DNA序列,只是把一个序列,只是把一个 新合成的复本插入到另外的位置上。真核和原核细胞都有。新合成的复本插入到另外的位置上。真核

25、和原核细胞都有。 可分为两类可分为两类 简单转座子(插入序列,简单转座子(插入序列,insertion sequence,IS):较小,):较小, 只有与转位有关的序列和促进转座过程所要的蛋白质如转座只有与转位有关的序列和促进转座过程所要的蛋白质如转座 酶的基因。酶的基因。 复杂转座子(复杂转座子(Tn):除转位序列和蛋白质基因外,在其):除转位序列和蛋白质基因外,在其 中心区还含有中心区还含有一个或多个基因一个或多个基因。 Transposase ABCDEFGGFEDCBA IS: 带有转座酶和带有转座酶和 反向末端重复序列。反向末端重复序列。 IS ISResistance Gene(s

26、) IS ISResistance Gene(s) Tn 5:药物抗性基药物抗性基 因位于中间,因位于中间,ISIS 提提 供转座功能供转座功能 Tn 3:二端为短的反二端为短的反 向重复序列(向重复序列(IR), IR), 中间是编码转座功中间是编码转座功 能和药物抗性的基能和药物抗性的基 因因 常见转座子 (5)重叠基因)重叠基因: 是一种转录单位,一个基因可决定多种是一种转录单位,一个基因可决定多种 mRNA和蛋白质,如和蛋白质,如 Bcl-X 基因可转录两种不同的产物。基因可转录两种不同的产物。 8) 存在自私存在自私DNA(selfish DNA) 指非编码序列,包括分散的高度、中度

27、重复序列,内含子指非编码序列,包括分散的高度、中度重复序列,内含子 和间隔序列等。这些序列极少转录成和间隔序列等。这些序列极少转录成mRNA并翻译成蛋白质,并翻译成蛋白质, 对细胞存活、代谢等不做任何贡献,它们存在的唯一目的似乎对细胞存活、代谢等不做任何贡献,它们存在的唯一目的似乎 就是复制自己。故称之为自私就是复制自己。故称之为自私DNA。而且有些成分还通过转录。而且有些成分还通过转录 成成mRNA,生成,生成cDNA,再通过转位成分插入到基因组,颇象机,再通过转位成分插入到基因组,颇象机 体内寄生虫的繁殖、生活,故也有人称之为寄生体内寄生虫的繁殖、生活,故也有人称之为寄生DNA(paras

28、ite DNA)。)。 但自私但自私DNA并非真的自私,毫无功能。如有些调控序列虽并非真的自私,毫无功能。如有些调控序列虽 不编码任何蛋白,但对细胞代谢也有很大影响。如在不编码任何蛋白,但对细胞代谢也有很大影响。如在 Ig和和MHC 基因的内含子部分发现有基因的内含子部分发现有增强子增强子的存在,可以增强该基因的转的存在,可以增强该基因的转 录。录。 9) DNA序列组织具有可变性序列组织具有可变性 DNA序列从胚胎到成人并非一成不变。如序列从胚胎到成人并非一成不变。如B细胞成熟过程细胞成熟过程 中中Ig基因结构的重排及基因结构的重排及TCR基因在分化过程中的重排。基因在分化过程中的重排。 重

29、链重链DNA重排重排 4、真核生物基因组示例、真核生物基因组示例 1)啤酒酵母基因组)啤酒酵母基因组 它是它是1997年由欧洲、美国、加拿大和日本共年由欧洲、美国、加拿大和日本共96个实验室共个实验室共 同完成的同完成的第一个完全测序的真核生物基因组第一个完全测序的真核生物基因组。 其基因组大小其基因组大小 为为13.5106bp,基因数为基因数为5800个,分布在个,分布在16个不连续的染色体个不连续的染色体 之中,其显著的特点是具有高度重复,如之中,其显著的特点是具有高度重复,如 tRNA总共有总共有250个个 拷贝。此外还有许多高同源性的重复序列。拷贝。此外还有许多高同源性的重复序列。

30、2)线虫()线虫(Caenorhabditis elegans)基因组)基因组 线虫(线虫(Caenorhabditis elegansCaenorhabditis elegans)是重要模式生物,其)是重要模式生物,其 基因组序列分析工作开始于基因组序列分析工作开始于8080年代,由英美两个实验室年代,由英美两个实验室 (st.Louis, MO, USA, and Cambridge. UK) st.Louis, MO, USA, and Cambridge. UK) 于于19981998年底完年底完 成,它是第一完成的多细胞生物和动物基因组全序列,是生成,它是第一完成的多细胞生物和动物基

31、因组全序列,是生 命科学上的又一个里程碑。命科学上的又一个里程碑。 其基因组大小其基因组大小100Mb, 100Mb, 分布于分布于6 6 条染色体条染色体, , 预测有预测有1909919099 基因存在。基因存在。 Pascal M , et alPascal M , et al,Nature, 2000; 407796Nature, 2000; 407796 3)拟南芥基因组拟南芥基因组 拟南芥拟南芥(Arabidopsis thaliana) (Arabidopsis thaliana) 是一种典型的开花植物是一种典型的开花植物, , 广泛分布于欧洲、亚洲和北美广泛分布于欧洲、亚洲和北

32、美, , 它具有它具有(1) (1) 生长周期短。从发芽生长周期短。从发芽 到种子成熟仅需到种子成熟仅需6 6 周。周。(2) (2) 体型小体型小, , 占地少。成熟植株占地少。成熟植株1515 20 20 cm cm 高高, , 莲座叶不超过莲座叶不超过5 cm5 cm。(3) (3) 后代多。每株可产生后代多。每株可产生5000 5000 粒种粒种 子。子。(4) (4) 核基因组小核基因组小, , 仅仅10 10 条染色体。它作为植物模式生物在条染色体。它作为植物模式生物在 基因组分析方面是其它植物如玉米、番茄、豌豆、水稻等遗传模基因组分析方面是其它植物如玉米、番茄、豌豆、水稻等遗传模

33、 式系统所不能及的。式系统所不能及的。1996 1996 年拟南芥基因组国际合作项目启动年拟南芥基因组国际合作项目启动, , 至至2000 2000 年年12 12 月月, , 第一个植物基因组第一个植物基因组拟南芥基因组被全部拟南芥基因组被全部 测序测序, , 遗传图谱、物理图谱建立遗传图谱、物理图谱建立, , 序列大小为序列大小为125M b125M b。基因组测。基因组测 序区段覆盖了全基因组的序区段覆盖了全基因组的115. 4M b, 115. 4M b, 分析共含有分析共含有25,498 25,498 个基因个基因, , 编码蛋白来自编码蛋白来自11, 000 11, 000 个家族

34、。个家族。 Nature 408:796-815 (2000)Nature 408:796-815 (2000) 4 4)果蝇基因组)果蝇基因组 果蝇果蝇(Drosophila melanogaster) (Drosophila melanogaster) 果蝇是经典遗传学家喜欢果蝇是经典遗传学家喜欢 的实验材料的实验材料, , 摩尔根就是根据果蝇实验而发现摩尔根就是根据果蝇实验而发现“连锁交换连锁交换” 规律的。它不仅饲养容易、繁殖快规律的。它不仅饲养容易、繁殖快, , 还是典型的还是典型的“雌雄异体雌雄异体” 生物生物, , 雌雄容易识别雌雄容易识别, , 可以有意识地安排可以有意识地安排

35、, ,“有序有序”、有目的、有目的 的交配的交配, , 得到各种性状的重组体得到各种性状的重组体, , 根据连锁关系从而揭示基根据连锁关系从而揭示基 因的位置。有趣的是因的位置。有趣的是, , 果蝇幼虫的唾液腺的染色体很大果蝇幼虫的唾液腺的染色体很大, ,大大 到人的肉眼就可以看到到人的肉眼就可以看到, , 上面还有规律的条纹上面还有规律的条纹, , 可以把一个可以把一个 基因的位点定到某一条条纹上。果蝇作为遗传研究的模型生基因的位点定到某一条条纹上。果蝇作为遗传研究的模型生 物物, , 已有已有80 80 年的历史年的历史, , 它的它的DNADNA序列序列, , 同它的形态、生理以同它的形

36、态、生理以 及行为复杂性等方面及行为复杂性等方面, , 是最贴近人类的可供研究的无脊椎生是最贴近人类的可供研究的无脊椎生 物体。物体。1998 1998 年年,Celera ,Celera 公司开始对果蝇基因组进行研究公司开始对果蝇基因组进行研究, , 用了不到两年的时间破译了果蝇的序列用了不到两年的时间破译了果蝇的序列, , 并于并于2000 2000 年年3 3 月月 宣布了基因组全序列为宣布了基因组全序列为180M b180M b。有。有13 601 13 601 基因基因, , 其中一半其中一半 的基因功能还没有搞清楚的基因功能还没有搞清楚, , 有有1600 1600 个碱基跨度区仍

37、未能完个碱基跨度区仍未能完 全测序。全测序。 Science, 287:2185-2195 (2000) Science, 287:2185-2195 (2000) 三、基因组学三、基因组学(genomics) 就是发展和应用就是发展和应用DNA制图、测序新技术以及计算机程序,分制图、测序新技术以及计算机程序,分 析生命体(包括人类)全部基因组结构及功能。析生命体(包括人类)全部基因组结构及功能。 一)概念一)概念 1. 1. 根据研究对象分:肿瘤基因组学、植物基因组学、药物基因根据研究对象分:肿瘤基因组学、植物基因组学、药物基因 组学、环境基因组学等。组学、环境基因组学等。 2. 2. 根据

38、研究的重点分:结构基因组学根据研究的重点分:结构基因组学(structural genomics) (structural genomics) 、 功能基因组学功能基因组学(functional genomics)(functional genomics)、比较基因组学、比较基因组学 (comparative genomics) (comparative genomics) 二)基因组学分类二)基因组学分类 三三) 结构基因组学结构基因组学 1、概念和目的、概念和目的 以全基因组测序为目标的基因结构研究,弄清基因组中全以全基因组测序为目标的基因结构研究,弄清基因组中全 部基因的位置和结构,为基因功能的研究奠定基础。其目的是部基因的位置和结构,为基因功能的研究奠定基础。其目的是 建立高分辨的遗传图谱、物理图谱、转录图谱和序列图谱。建立高分辨的遗传图谱、物

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论