chapter01基因组的结构_第1页
chapter01基因组的结构_第2页
chapter01基因组的结构_第3页
chapter01基因组的结构_第4页
chapter01基因组的结构_第5页
已阅读5页,还剩67页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、2015.3.19内蒙古大学生命科学学院生物系内蒙古大学生命科学学院生物系邢万金邢万金基因组基因组 3 袁建刚袁建刚 彭小忠彭小忠 强伯勤强伯勤 译译 科学出版社科学出版社 98元元(当当网当当网73.5) English version中译本中译本一一. .基因与基因家族基因与基因家族1. 1. 基因基因基因是一个表达水平的结构单位,是一段有表基因是一个表达水平的结构单位,是一段有表达产物的达产物的DNA序列。序列。它是一个受多重调控有序行使功能的单位,也它是一个受多重调控有序行使功能的单位,也是一个在选择压力下不断变化的动态结构单位。是一个在选择压力下不断变化的动态结构单位。(1)RNA基

2、因基因(2)蛋白质基因)蛋白质基因(3)基因家族)基因家族(4)异常基因和假基因)异常基因和假基因rRNA基因:编码核糖体中的基因:编码核糖体中的RNA组分。组分。tRNA基因:编码基因:编码tRNA,转运氨基酸至核糖体的,转运氨基酸至核糖体的A位。位。非编码基因非编码基因scRNA基因:位于基因:位于真核细胞质真核细胞质中的一类中的一类小小分子分子RNA。snRNA基因:位于基因:位于细胞核细胞核内的小分子内的小分子RNA.snoRNA基因:位于基因:位于核仁区核仁区的小分子的小分子RNA,用于修饰,用于修饰r RNA.miRNA基因基因: 微小微小RNA(是是由约由约22个核苷酸组成的非编

3、码的单链个核苷酸组成的非编码的单链RNAs),参与基因表达的调控。,参与基因表达的调控。编码蛋白质产物,由编码蛋白质产物,由RNA多聚酶多聚酶II转录。转录。真核生物编码序列被或长或短的真核生物编码序列被或长或短的非编码序列非编码序列隔开,隔开,因而称为因而称为断裂基因断裂基因。启动、调控区启动、调控区EIE IE5非编码区非编码区3非编码区非编码区E=exon(外显子);外显子); I=intron(内含子)(内含子)编码基因编码基因 重叠基因重叠基因 异常基因异常基因 基因套基因基因套基因 反义基因反义基因DNA单链单链重叠基因重叠基因基因套基因基因套基因反义基因反义基因表达基因表达基因基

4、因基因可分为三类:可分为三类: 第一类:由第一类:由重复重复产生的假基因产生的假基因 是指来源于功能基因而已经失去活性的是指来源于功能基因而已经失去活性的DNA序列。序列。其位置与起源的基因拷贝临近排列,保留其位置与起源的基因拷贝临近排列,保留着祖先基因的组成特点。着祖先基因的组成特点。第三类:残缺基因第三类:残缺基因它们缺失了部分基因片段,常常位于基因家族内部,它们缺失了部分基因片段,常常位于基因家族内部,由不等交换及重排产生。由不等交换及重排产生。第二类:加工的假基因第二类:加工的假基因是通过是通过RNA反转录为反转录为cDNA后再整合到基因组中后再整合到基因组中(逆转座)。(逆转座)。它

5、不含原来基因的内含子以及两侧序列,分散它不含原来基因的内含子以及两侧序列,分散在基因组中,大多为在基因组中,大多为5残缺。残缺。一群具有一群具有一致或相似一致或相似序列的基因。序列的基因。如如rRNA基因,基因,-珠蛋白基因。珠蛋白基因。基因家族的各功能成员可于基因家族的各功能成员可于不同时空不同时空选择性表达;选择性表达;有些成员在长期的选择压力下逐渐积累突变成为有些成员在长期的选择压力下逐渐积累突变成为假基因假基因。基因组基因组(Genome) : 指指单倍体单倍体细胞中包括细胞中包括编码编码序列和序列和非编码非编码序列在内序列在内的全部的全部DNA分子分子 核基因组:单倍体细胞核内的全部

6、核基因组:单倍体细胞核内的全部 DNA分子分子线粒体基因组:一个线粒体所包含的全部线粒体基因组:一个线粒体所包含的全部DNA分子分子叶绿体基因组:一个叶绿体所包含的全部叶绿体基因组:一个叶绿体所包含的全部DNA分子分子/sites/entrez?db=genome已完成:已完成:正在进行:正在进行:病毒:病毒:3982古细菌(古细菌(Archaea):):真细菌(真细菌(Bacteria):): 4753真核生物(真核生物(Eukaryotes):):物种物种基因组基因组大小大小 (Mb) 基因数目基因数目 References 真核生物真核

7、生物 拟南芥拟南芥12525 500 AGI (2000)线虫线虫9719 000CESC (1998)果蝇果蝇18013 600Adams et al. (2000)人人320030 00040 000IHGSC (2001); Venter et al. (2001) 酵母酵母12.15 800Goffeau et al. (1996) 物种物种基因组大小基因组大小 (Mb) 基因数目基因数目 References 真细菌真细菌大肠杆菌大肠杆菌K12 4.644 400 Blattner et al. (1997) 结核杆菌结核杆菌H37Rv 4.414 000Cole et al. (1

8、998)生殖道支原体生殖道支原体0.58500Fraser et al. (1995)绿脓杆菌绿脓杆菌PA01 6.265 700Stover et al. (2000)肺炎链球菌肺炎链球菌2.162 300Tettelin et al. (2001)霍乱弧菌霍乱弧菌El Tor N16961 4.034 000Heidelberg et al. (2000)鼠疫杆菌鼠疫杆菌CO92 4.564 100Parkhill et al. (2001)物种物种基因组大小基因组大小 (Mb) 基因数目基因数目 References 古细菌古细菌 Archaeoglobus fulgidus2.182

9、500Klenk et al. (1997)Methanococcus jannaschii1.661 750Bult et al. (1996)C值是指一个单倍体基因组中值是指一个单倍体基因组中DNA的总量的总量一个特定的种属具有特征的一个特定的种属具有特征的C值值SpeciesGenome size (Mb) 脊椎动物脊椎动物红鳍东方鲀红鳍东方鲀400人人3 200小鼠小鼠3 300植物植物拟南芥拟南芥125水稻水稻430玉米玉米2 500豌豆豌豆4 800小麦小麦16 000川贝母川贝母120 000内含子数目内含子数目, 基因密度基因密度, 基因组中的重复序列基因组中的重复序列, 其他

10、非编码序列其他非编码序列. 原因原因:推论:随着生物结构与功能复杂性的增加,各推论:随着生物结构与功能复杂性的增加,各分类单元中分类单元中C值随分类地位的提高而递增。值随分类地位的提高而递增。但这一推论对于高等生物并不适用。因为在高但这一推论对于高等生物并不适用。因为在高等生物中,有些鱼类和两栖类的等生物中,有些鱼类和两栖类的C值比哺乳类值比哺乳类的的C值更高。值更高。项目项目酵母酵母果蝇果蝇 人人 基因密度基因密度 (平均每平均每 Mb的基因数的基因数)4797611平均每个基因的内含子数平均每个基因的内含子数0.0439重复序列所占的比例重复序列所占的比例3.4%12%44%28 gene

11、s4 genes11 genes 1 genes 40 genes In 50kb酵母酵母人人果蝇果蝇玉米玉米大肠杆菌大肠杆菌1. 两类原核生物两类原核生物: 真细菌真细菌(Bacteria)古细菌古细菌(Archaea)2. 原核基因组的一般特点原核基因组的一般特点基因组大小基因组大小: 较小较小物理形状物理形状: 环形环形 附加的基因附加的基因: 质粒质粒 (环形,线形环形,线形)Borrelia burgdorferi B31(包柔氏螺旋体菌包柔氏螺旋体菌): 线形染色体线形染色体 911 kb, 带有带有 853个基因个基因附带附带 17 或或 18 个线形或环形个线形或环形DNA,

12、共共 533 kb,带至少,带至少 430个基因个基因原核生物原核生物真核生物真核生物基因组织基因组织操纵子操纵子基因的平均长度基因的平均长度1kb1.5kb (除去内含子除去内含子)重复序列重复序列 无无 (少数列外少数列外: IS)多多内含子内含子真细菌真细菌: 无无古细菌古细菌: 有有有有(1) 物理性状物理性状1) 大小:多数大小:多数40 genes In 50kb酵母酵母人人果蝇果蝇玉米玉米大肠杆菌大肠杆菌古细菌詹氏甲烷球菌和细菌超嗜热菌有些操纵子内古细菌詹氏甲烷球菌和细菌超嗜热菌有些操纵子内部的基因没有功能关系。部的基因没有功能关系。gatC: glutamyl-tRNA 氨基转

13、移酶亚基氨基转移酶亚基C; recA, recJ: 重组蛋白重组蛋白 RecA, RecJ; pilU, 扭曲运动蛋白扭曲运动蛋白; cmk, 胞嘧啶核苷激酶胞嘧啶核苷激酶;pgsA, 磷脂酰甘油磷酸合成酶磷脂酰甘油磷酸合成酶,(2)不同物种间的)不同物种间的“基因流基因流 ”E. coli O157:H7 和和 E. coli K12 都有自己的独都有自己的独特基因特基因, 分别占基因类型的分别占基因类型的 26% 和和 12%(1)不同的菌种具有不同的基因组)不同的菌种具有不同的基因组 细菌和古细菌之间的基因侧向转移:细菌和古细菌之间的基因侧向转移:海栖热袍菌有海栖热袍菌有 1877 个基

14、因个基因, 其中其中451 似乎是似乎是从古细菌来的从古细菌来的 红色红色DNA和数字表示和数字表示侧向侧向来的基因占基因组的比例来的基因占基因组的比例侧向基因转移使原核生物的物种进化关系模糊侧向基因转移使原核生物的物种进化关系模糊高等生物高等生物 原核生物原核生物 一个独立生存的细胞需要的最少基因数目一个独立生存的细胞需要的最少基因数目 265-350Number of genes inCategoryE. coli K12H. influenzae RdM. genitalium Total protein-coding genes42881727470Biosynthesis of am

15、ino acids131681Biosynthesis of cofactors103545Biosynthesis of nucleotides585319Cell envelope proteins2378417Energy metabolism24311231Intermediary metabolism188306Lipid metabolism48256DNA replication, recombination and repair1158732Protein folding967Regulatory proteins178647Transcription552712Transla

16、tion182141101Uptake of molecules from the environment42712334Taken from Fraser et al. (1995) and Blattner et al. (1997). 使一个物种区别于其它物种的基因使一个物种区别于其它物种的基因. 生殖道支原体基因组:生殖道支原体基因组:470个基因个基因, 其中其中350个与枯草杆菌相似个与枯草杆菌相似470-350=120120 个基因是生殖道支原体的独特基因?个基因是生殖道支原体的独特基因??(1)插入序列()插入序列(IS)IS 200 bp DNA密度梯度离心的时候,密度梯度离

17、心的时候,在主要在主要DNA带的上方有额带的上方有额外的外的DNA带带有些有些satellite DNA 分散在基因组中分散在基因组中 小卫星(小卫星(Minisatellites)重复单元达重复单元达25 bp,重复后长度重复后长度 20 kb人端粒人端粒 DNA: 数百份数百份5-TTAGGG-3 重复单元小于重复单元小于13 bp,重复后的长度重复后的长度 150 bp人类人类 二核苷酸重复二核苷酸重复: 单核苷酸重复单核苷酸重复: CACACACACACACACAAAAAAAAAAAAAA微卫星重复微卫星重复单元数目单元数目在不同的个体上不同在不同的个体上不同由于由于DNA复制的时候发

18、生了滑序,复制的时候发生了滑序,导致重复单元的插入、缺失导致重复单元的插入、缺失也称遗传指纹(也称遗传指纹(genetic fingerprinting)原理:原理:用用PCR扩增个体基因组中的微卫星扩增个体基因组中的微卫星DNA,电泳后产生的带谱电泳后产生的带谱PCR扩增人类扩增人类6号染色体短臂上的微卫星号染色体短臂上的微卫星DNA图谱图谱红色带是红色带是DNA分子量分子量Marker以单一重复单元,分散在整个基因组中以单一重复单元,分散在整个基因组中 (由于转由于转座引起)座引起)经经 RNA 中间体形中间体形成的转座成的转座 逆转座逆转座有些逆转座元件与有些逆转座元件与逆转录病毒逆转录

19、病毒的基因组结构相似的基因组结构相似. . 逆转录病毒逆转录病毒:内源性逆转录病毒内源性逆转录病毒 (ERVs) :整合在整合在脊椎动物脊椎动物染色体上的逆转录病毒基因组,染色体上的逆转录病毒基因组,但已经不能形成病毒但已经不能形成病毒逆转录转座子(逆转录转座子(retrotransposon):序列与序列与ERV相似,但位于相似,但位于无脊椎动物、植物、真无脊椎动物、植物、真菌菌染色体上。染色体上。 Ty3/gypsy family Ty1/copia family (lack env gene )如如不含不含 LTRs LINEs (长分散核元件长分散核元件)SINEs (短短分散核元件分

20、散核元件) 包含一个与逆转录酶相似的基因包含一个与逆转录酶相似的基因. 不含逆转录酶基因,但仍然能转座。不含逆转录酶基因,但仍然能转座。 如如 LINE-1 如如Alu导致原序列被多复制导致原序列被多复制复制转座复制转座保守转座保守转座原序列被切下来重新插入到基因组其他部位。原序列被切下来重新插入到基因组其他部位。真核生物真核生物:DNA转座子不如逆转座子普遍转座子不如逆转座子普遍 如玉米的如玉米的Ac/Ds 原核生物原核生物:DNA转座子比逆转座转座子重要。转座子比逆转座转座子重要。如如IS1 和和 IS186 单一或少数几份拷贝的序列单一或少数几份拷贝的序列占人类基因组的占人类基因组的 4

21、0%-70%大多数的功能基因都是单一序列大多数的功能基因都是单一序列大多数是非编码序列大多数是非编码序列人人: 估计估计 30,000 个功能基因个功能基因 5%果蝇果蝇: 5-10%海胆海胆: 90%编码序列编码序列10%内内含含子子5前前导、导、3尾尾假假基基因因基基因因片片断断启启动动子子中高度重复序列中高度重复序列20-30%单一序列单一序列70-80%分散重复分散重复40%成簇重复成簇重复60%SINELINE卫卫星星微微卫卫星星小小卫卫星星启启动动子子(1)一般特性)一般特性 不等,与生物的复杂性无关不等,与生物的复杂性无关1) 大小大小:2) 形状形状:大多数环形大多数环形, 有

22、些有些 mtDNA (如如 Paramecium, Chlamydomonas 和几种酵母和几种酵母) 线形线形3) 拷贝数拷贝数 多拷贝多拷贝物种物种生物类型生物类型基因组大小基因组大小 (kb)线粒体基因组线粒体基因组 Plasmodium falciparum 原虫原虫 (疟疾疟疾)6Chlamydomonas reinhardtii 绿藻绿藻16Mus musculus 脊椎动物脊椎动物 (小鼠小鼠)16Homo sapiens 脊椎动物脊椎动物 (人人)17Metridium senile 无脊椎动物无脊椎动物(海葵海葵)17Drosophila melanogaster 无脊椎动物

23、无脊椎动物 (果蝇果蝇)19Chondrus crispus 红藻红藻26Aspergillus nidulans 子囊真菌子囊真菌33Reclinomonas americana 原生动物原生动物69Saccharomyces cerevisiae 酵母酵母75Suillus grisellus 担子菌真菌担子菌真菌121Brassica oleracea 开花植物开花植物 (甘蓝甘蓝)160Arabidopsis thaliana 开花植物开花植物 (野豌豆野豌豆)367Zea mays 开花植物开花植物 (玉米玉米)570Cucumis melo 开花植物开花植物 (甜瓜甜瓜)2500物种物种生物类型生物类型基因组大小基因组大小 (kb)叶绿体基因组叶绿体基因组 Pisum sativum 开花

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论