




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、微生物基因组学,中科院北京基因组研究所,微生物基因组研究概况 微生物基因组的特点 微生物基因组研究的意义,微生物基因组学,一 微生物基因组研究概况,微生物基因组重要纪事 年限 事件 1994年 美国DOE启动MGP 1995年 Science发表了第一株细菌-流感嗜血杆 菌全基因组 1995年 发表了集胞藻菌株PCC6803的测序和注释 1996年 Science发表了第一个完成的古细菌-詹 氏甲烷球菌全基因组序列 1996年 酵母基因组序列发表 1997年 大肠杆菌K-12基因组序列发表,已发表微生物基因组数量图。数据由NCBI微生物基因组数据库提供,截至2009年5月9号,研究现况及内容,
2、二 微生物基因组的特点,原核生物基因组的大小 原核生物基因组的编码序列(CDS/ORF) 原核生物染色体结构 GC 含量 重复序列 DNA链组成的非对称性 最小基因组,微生物基因组的特点,1. 原核生物基因组的大小-基因组较小的原核生物,Prokaryocyte Genome(kb) ORF Mycoplasma genitalium G-37B0 580 468 Buchnera sp 640 583 Buchnera aphidicola SG 641 545 Glossina brevipalpis 679 621 Ureaplasma urealyticum serovar 3B0 7
3、51 613 Mycoplasma pneumoniae M129B0 816 677 Mycoplasma pulmonis 963 782 Borrelia burgdorferi B31B1 910 853 Treponema pallidumNichols B1 1,138 1,041 Chlamydia trachomatis serovar D 1,042 894 Chlamydia trachomatis MoPnB1 1,069 924 Chlamydia pneumoniae J138 1,228 1,070 Chlamydia pneumoniae AR39B1 1,229
4、 1,052 Chlamydia pneumoniae CWL029B1 1,230 1,052 Rickettsia conorii Malish 7 1,268 1,374 Rickettsia prowazekii Madrid EB1 1,111 834,1. 原核生物基因组的大小-基因组较大的原核生物,Prokaryocyte Genome(kb) ORF Xanthomonas campestris 5,076 4,182 Xanthomonas axonopodis 5,273 4,386 Methanosarcina acetivorans C2A 5,751 4,540 Ra
5、lstonia solanacearum GMI1000 5,810 5,120 Escherichia coli O157:H7. Sakai 5,996 5,448 Pseudomonas aeruginosa PAO1B6 6,264 5,570 Nostoc sp. PCC 7120 6,413 5,366 Sinorhizobium meliloti 6,690 6,205 Mesorhizobium loti MAFF303099 7,036 6,752 Streptomyces coelicolor A3(2) 8,667 7,825,1. 原核生物基因组的大小-真核生物基因组的
6、大小,Chr. Genome(kb) ORF Guillardia theta 3 551 464 Encephalitozoon cuniculi 1 2,500 1,997 Saccharomyces cerevisiae S288C 16 12,069 6,294 Schizosaccharomyces pombe 3 14,000 4,824 Caenorhabditis elegans 6 97,000 19,099 Arabidopsis thaliana 5 115,428 25,498 Drosophila melanogaster 6 137,000 14,100 Oryza
7、 sativa L. ssp. Indica 12 420,000 50,000 Oryza sativa ssp. Japonica 12 420,000 50,000 Homo sapiens 24 3,000,000 30,000 Dictyostelium discoideum Chr. 2 6 8,000 2,799 Leishmania major Friedlin Chr. 1 36 257 79 Plasmodium falciparum 3D7 Chr. 3 14 1,060 220 Plasmodium falciparum 3D7 Chr. 2 14 947 205,2.
8、 原核生物基因组的编码序列(Coding sequence),占原核生物基因组总序列的90 基因的平均大小为1kb,ORF,2. 原核生物基因组的编码序列 不同生物编码序列的比较,Organism Genome (kb) ORFs ORF size Coding Sequence(%) Buchnera sp 640 583 988 90 Aquifex aeolicus 1,551 1,512 956 93 Saccharomyces cerevisiae 12,069 6,294 1,092 57 Schizosaccharomyces pombe 14,000 4,820 2,033 7
9、0 Caenorhabditis elegans 97,000 19,099 1,311 27 Arabidopsis thaliana 115,428 25,498 460 29 Homo sapiens 3,000,000 30,000 1,340 87,5. 重复序列腾冲嗜热厌氧菌基因组的部分重复序列(续),Long, coding repeats Copies Repeat ID length Complete Partial Identity (%) Database match TLR028b 3,565 4 5 99 Transposase + hypothetical TLR3
10、93c 3,045 2 1 98 ABC transporters + hypothetical TLR315 2,603 2 94 ABC transporters + Permease TLR408 2,490 2 98 Ferredoxin oxidoreductases, TLR076 2,021 2 91 Hypothetical protein TLR271 2,020 2 92 ABC transporters TLR264 1,986 5 1 98 Transposase TLR294 1,851 2 98 ABC transporters + Permease TLR004
11、1,819 14 98 Transposase TLR005 1,800 7 98 Transposase TLR158 1,774 1 2 89 TPR-repeat-containing proteins TLR048 1,711 2 99 Transposase TLR223 1,629 2 97 Transposase TLR008 1,596 21 92 Hypothetical protein TLR014 1,592 14 3 87 Hypothetical protein ,重复序列 Number of repeats by type in N. meningitidis Z2
12、491(脑膜炎球菌),Type Size (bp) Frequency DNA uptake sequence: gccgtctgaa 10 1,892 RS 24161 681 dRS3: attcccnnnnnnnngggaat 20 772 Correia (full) 150159 173 Correia (internal deletion) 104 84 Correia (partial) 37145 29 ATR 183 19 REP 2 59154 26 REP 3 60 13 REP 4 26 20 REP 5 20 9 IS1016 256740 14 (including
13、 partial) IS1106 2631219 22 (including partial) IS1655 1,0741,257 7 (including partial) Prophage 2,33038,964 5 Correia elements (CEs, 156-bp sequences bounded by 26-bp inverted repeats),重复序列 Largest families of paralogous genes,Family Number of genes (total 312) (total 853) ATP-binding subunits of A
14、BC transporters 23 Reductases/dehydrogenases 12 Two-component system, regulatory proteins 12 Hypothetical proteins 10 Transcriptional regulators 9 Fimbrial proteins 9 Two-component system, sensor proteins 9,6. DNA链组成的非对称性 GC分布不对称 (GC skew) AT分布不对称(AT skew),前导链含有较多的G(A) 而后随链含有较多的C(T) 计算公式为(nG-nC)/(nG
15、+nC) (nA-nT)/(nA+nT) 累计skew (cumulative skew) 用于复制起点和终点的定位,6. DNA链组成的非对称性(真细菌) 基因方向性偏好,基因方向性偏好 (gene orientation bias) 先导链上编码的基因总是多于后随链,6. DNA链组成的非对称性(真细菌) GC skew, AT skew , gene orientation bias,Organism (34株) Gene biasc(%) GC skewd AT skewe Tten 86.7 0.192 0.075 Llact 80.7 0.099 0.034 Mgen 80.4 0
16、.045 0.045 Spneu 80.2 0.102 0.016 Spyo 79.4 0.094 0.022 Cace 79.0 0.212 0.078 Bhal 77.4 0.100 0.034 Mpneu 77.3 0.014 0.022 SaurN 74.7 0.122 0.051 Bsub 74.2 0.079 0.045 Uure 68.1 0.059 0.029 Bbur 66.2 0.182 - 0.086 . Ccre 54.3 0.016 - 0.014,GC skewd of T. tengcongensis genome,微生物基因组的特点,Jean R.Lobry M
17、icrobiology Today Vol 26,Circular representation of the genome of T. tengcongensis MB4,6. DNA链组成的非对称性 密码子使用偏好(codon usage bias),先导链和后随链密码子的不同 在先导链,以G或T开头或结尾的密码子显著地多于后随链,常见的有GTG、GCG和GAG 在后随链以C或A开头或结尾的密码子多于先导链,如CTC、GCC、CCC、ATC和ACC,6. DNA链组成的非对称性 原核生物基因组先导链和后随链密码组成的差异,Org. Bases Codon bases AA Codons -
18、 + - + - + - + Smel C G C3A3 G3G1T3 T P V E GCC CCC ACC CTC GGT GGG GTT GAG Ecoli C G C3 G3 G1 T H I V G GCC CCC ACC CTC GCG GTG CGT GGG Hinf C GT C3 G3 T3 T N P V ACC GCC CTC AAC GAG GTG CGT GCT Tacid C G C3C1 G3 H L DT V Q ACC CCC GCC CTC GGT CCG GTG CAG Nmen C G C3A3 G3 T I HP V M CTC GCC GGC CTA
19、 TTG GAG GCG GGT Ctra C G C3C1 G3G2G1 T P IL V G R CTC CGC CTA CAA GGG GAG AAG GTG Cpneu C G C3C1 G3G2G1 T I PN V R CTA ATC CAA AAC TTG GTT GTG GAT Ccre C GT A3C3 G3 T P H V G E CCC GCC CGC ACA GGG GCT GGT CGT 每一株原核生物的密码子、氨基酸及组成密码子的核苷酸等的使用情况。每组最后一位的频率大于或等于本组最大值的一半。“”表示先导链,“”表示后随链。,6. DNA链组成的非对称性 基因密
20、度和密码子使用的差别,高度表达基因: 核蛋白体蛋白基因,与翻译和转录有关的因子基因,分子伴侣基因和与主要的能量代谢相关的基因 大多编码于前导链 通常都有密码子偏好(核蛋白体蛋白基因密码子的第三位多为G ) 快速生长的细菌(大肠杆菌、霍乱弧菌、枯草芽孢杆菌和流感嗜血杆菌) 主要的糖酵解和三羧酸循环基因为高度表达基因 产甲烷菌,与甲烷代谢有关的基因为高度表达基因 高度表达基因: 那些在密码子使用上与一般基因相差很大,与核蛋白体蛋白基因,翻译和转录相关基因,伴侣-降解蛋白基因等在密码子使用上高度相似的基因为高度表达基因。,微生物测序及分析流程图,数据分析软件,序列拼接组装 Phred/Phrap/C
21、onsed, Oligo 6 基因组注释 Glimmer, BLAST, tRNAscan-SE 比较基因组分析 BLAST, MUMmer, ACT, perl script, Clustal W,Finishing阶段,Blastn 或Blastp参照序列,确定Contigs之间关系,设计引物,PCR,测序,数据添加至原有的数据,利用基因order信息,Finishing阶段,Finishing阶段,多重PCR结果,引自Tettelin H.等文章,Finishing阶段,短片段文库构建填补二级结构区示意图,摘自Amanda A等文章,Finishing阶段,基于转座子技术来完成重复序列区
22、的测序,摘自Scott E等文章,微生物基因组测序策略 -高通量测序技术,454 长reads 测序 Solexa Pair-end测序 组合长reads和短reads测序 Sanger法finish,微生物基因组测序策略,副血链球菌FW213基因组基本特征,副血链球菌FW213基因组基本特征,副血链球菌比对结果,COG分类,COG分类图,JKL编码信息加工和储存的蛋白质的基因;DVTMNUO代表细胞加工和信息处理基因;CGEFHIPQ是与代谢相关的基因;RS为功能未知的基因,代谢途径,代谢途径,728691bp 735072bp,精氨酸操纵子示意图,精氨酸脱亚氨酶(arginine deim
23、inase,arcA), 鸟氨酸氨基甲酰转移酶(ornithine carbamyltransferase,arcB), 氨甲基酶(carbamate kinase,arcC), 逆向运输蛋白 (arginine-ornithine antiporter,arcD), 二肽酶(dipeptidase,arcT)和调控蛋白(regulator,arcR),比较基因组分析,副血链球菌基因组和血链球菌基因组比对的全部MUM点阵图。横坐标,副血链球菌,2171616bp; 纵坐标, 血链球菌。对角线代表可以对齐区域,斜率-1的对角线代表大规模的染色体倒位,比较基因组分析,副血链球菌基因组和其他六株细菌
24、全基因组比对结果图。a,和肺炎链球菌CGSP14比对的结果; b,戈登氏链球菌;c,变异链球菌;d,化脓性链球菌;第e,猪链球菌;f,嗜热链球菌,比较基因组分析,进化分析,毒力基因,基因组小岛(fwislet1),基因组岛(fwisland),抗药性,二元信号转导系统,三 微生物基因组研究的意义 基因组研究在医学的应用 基因组研究的生物技术应用 微生物的进化,A 基因组研究在医学的应用,致病相关基因的鉴定 设计特异的实验诊断方法 疫苗的研究 新型抗生素的开发,1. 致病相关基因的鉴定 通过基因组比较鉴定病原相关基因,流感杆菌: 7种内毒素(脂多糖)基因25种新基因 细胞表面定居的粘附分子重复序
25、列,1. 致病相关基因的鉴定 致病相关基因的预测,致病物质多为病原体细胞壁成分、 表面蛋白和一些分泌性蛋白质 PHD预测基因组的跨膜蛋白 SIGNALP预测分泌性蛋白质,1. 致病相关基因的鉴定 致病相关基因的预测(续),功能相同的蛋白质往往相邻并受共同的调控序列调控 operon 同一菌种的致病菌株与非致病菌株的基因组进行比较 E. coli K12 MG 1655 4.1 + 0.53 M (528genes) E. coli O157:H7 EDL 933 4.1 + 1.34 M (1387genes),2. 设计特异的实验诊断方法,寻找高度特异的核酸序列 实验技术 PCR 杂交技术(
26、Microarray,DNA chip) 应用 鉴定病原种类进行临床诊断 病原分型的流行病学研究 预测疾病进展及临床疗效,3. 疫苗的研究,通过全基因组序列的同源性比较,寻找致病菌的属特异、群特异、种特异、型特异、甚至亚型特异的抗原 Pizza等和Tettelin等对血清型B脑膜炎奈瑟菌近350种抗原的研究 Wizemann等对肺炎链球菌的基因组的抗原性蛋白研究,4. 新型抗生素的开发,药靶的特征: 药靶应是病原生物必需的,在进化上是保守的 可作为药靶的微生物基因或蛋白质: 毒力基因、必需基因、菌种专一基因、独特酶类、膜转运蛋白等,毒力基因作为靶位,毒力基因的发现:非致病菌(E.coli K1
27、2)与致病菌( E.coli O157, 沙门氏菌,耶尔森氏菌)基因组的比较 致病岛(Pathogenicity islands)编码的功能已知蛋白作为药靶,必需基因作为药靶,寻找必需基因的方法: 比较基因组:在不同进化阶段保守的基因 往往是必需基因 缺失致死或转座子插入 转座子插入PCR寻找流感嗜血杆菌, 肺炎链球菌必需基因 致病菌特殊且必需的蛋白作为靶位,菌种专一基因作为药靶,寻找菌种专一基因的方法: 比较基因组方法病原生物基因组中存在但 近缘种属中缺少的基因可能是致病关键基因 幽门螺杆菌(与大肠杆菌和流感杆菌比较)找到594个特有基因,73个编码种专一蛋白,如丙酮酸:铁氧还蛋白氧化还原酶
28、,可作为靶位,独特酶类作为药靶,所有细菌独特酶类均可作为靶位: 如: 参与细胞壁合成的酶类 叶酸合成酶类 核酸合成酶类,膜转运蛋白作为靶位,衣原体和立克次体的ATP/ADP转位酶是致病菌必需,而只有植物叶绿体、线粒体具有类似酶 细菌多药运输蛋白(泵),新型抗生素的开发,药靶的种类 共有药靶 菌种或某菌种的致病菌株的特异性药靶 某一部位常见致病菌的共同药靶,新型抗生素的开发,Timothy等的研究: 肺炎链球菌,流感嗜血杆菌,脑膜炎奈瑟菌 共有基因32个 其中2个甲硫氨酸亚砜还原酶基因 疑是毒力决定子,B 基因组研究的生物技术应用,生物降解作用 酶工业 食品生物技术 抗生物质,生物降解作用,De
29、inococcus radiodurans:抵御放射性物质 Thermotoga maritima:降解单体或复合植物 聚合物, 如木聚糖和纤维素 Dehalococcoides ethenogenes:降解四氯乙烯 Pseudomonas putida:降解多种毒性有机废料, 包括多种芳香族化合物,酶工业,Thermotoga maritima:耐热 Aquifex aeolicus:耐热 Methanogenium frigidum:耐寒 Halobacterium:耐盐,降解塑料 Pseudomonas putida:降解塑料,食品生物技术,Lactococcus latis: 生产发酵
30、食品,微生物营养添加剂,抗生物质,Streptomyces coelicolor: 生产抗生素,用于人类,兽医和农业 Photorhabdus luminescens: Bacillus thuringiensis Xenorhabdus nematophilus 产生杀昆虫毒素蛋白 转基因抗昆虫植物,C 微生物的进化,基于16S rDNA的系统进化树: Woese等的生物 三域 真细菌域、古生菌域和真核生物域 单个基因的进化并不等同于物种的进化 基因的水平转移,基因的水平转移 的意义,研究微生物的进化史 研究菌种新功能的来源 研究微生物的生命过程 预测基因功能,基因水平转移的方式,转化 接合 转导,鉴定基因水平转移的方法,鉴定基因组区段的组成 比较不同基因的系统发生 最大相似性分析 基因在生物的分布谱,易被水平转移的基因,难被转移的基因:informational genes 进化核心基因 易被转移的基因:operational genes 氨酰tRNA合成酶基因 剪切因子 重组酶 DNA聚合酶,原核生物
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 农行双录管理办法
- 农险投诉管理办法
- 冶金商户管理办法
- 出境经费管理办法
- 出租账户管理办法
- 分享种植管理办法
- 分拨中心管理办法
- 分级评选管理办法
- 列车放行管理办法
- 创新园区管理办法
- 九招致胜课件完整版
- 2014年欧洲儿童急性胃肠炎诊治指南
- YS/T 617.1-2007铝、镁及其合金粉理化性能测定方法 第1部分:活性铝、活性镁、活性铝镁量的测定 气体容量法
- GB/T 1972-2005碟形弹簧
- 保育员三级理论知识考核试题题库及答案
- 画册设计工作计划模板
- 送达地址确认书(诉讼类范本)
- 东北地区玉米施肥现状、问题与对策
- 图文全文解读2022年发改委发布《电力可靠性管理办法(暂行)》PPT
- 钢铁中日材料对照表
- 涟水县高沟中学学生成长导师制《导师工作手册》(共58页)
评论
0/150
提交评论