基因组学黄学辉-bio2000_第1页
基因组学黄学辉-bio2000_第2页
基因组学黄学辉-bio2000_第3页
基因组学黄学辉-bio2000_第4页
基因组学黄学辉-bio2000_第5页
已阅读5页,还剩72页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

2016.09.21,基因组学黄学辉中国科学院上海生命科学研究院植物生理生态所/国家基因研究中心,2016年Bio2000分子生物学课,生命的奥秘蕴藏于“四字天书”中,基因组复杂度提升,第一代测序技术(Sanger法),读长能达到近1000 bp,序列高度准确(千分之一的错误);一代测序的通量低(一天几Mb数据)、费用高。,DNA测序方法的发明人Frederick Sanger,1918年8月13日2013年11月19日)是一位英國生物化學家,曾經在1958年及1980年兩度獲得諾貝爾化學獎第一次是发明了蛋白质序列测定;第二次是发明了DNA序列测定。,Wellcome Trust Sanger Institute,第二代测序技术,读长超过100 bp,序列有一定错误(百分之一的错误)通量高(Tb级数据量)、费用比一代测序低了几个数量级。,第三代测序技术,目前仍无真正意义上的、成熟的三代测序技术目标:保证高通量的同时实现长片段、单分子和测序的便捷性,,参考基因组的测序战略,基于物理图的克隆连克隆法全基因组鸟枪法 (Craig Venter),染色体,克隆连克隆测序战略示意图,人类基因组计划,人类基因组计划(human genome project, HGP) 于1990年正式启动的。美国、英国、法国、德国、日本和我国科学家共同参与了这一预算达30亿美元的人类基因组计划。人类基因组计划与曼哈顿原子弹计划和阿波罗计划并称为三大科学计划。被誉为生命科学的“登月计划”。,人类基因组计划,2000年6月26日,参加人类基因组工程项目的美国、英国、法兰西共和国、德意志联邦共和国、日本和中国的6国科学家共同宣布,人类基因组“草图”的绘制工作已经完成。序列错误率低于万分之一,覆盖95%的区域,每个Gap小于150kb。完成图于2003年左右公布,比预计提前2年。,全基因组鸟枪法,mate pair(3k, 8k, 20k),S75 raw reads,Contigs,Scaffolds,Super scaffolds,Fosmid ends(40k),raw reads,Fosmid,Super scaffolds,scaffolds,Assembly strategy,Chromosomes,Linkage map,完成参考基因组测序的动物,完成参考基因组测序的植物,最后的一根硬骨头:小麦基因组,异源六倍体17Gb的基因组80%为重复序列,小麦基因组测序计划,目前3B(法国)染色体草图初步完成,基因组学 参考基因组测序,基因组浏览器可视化,转录组和表观组,使用亚硫酸氢盐处理DNA结合鸟枪法测序已成为研究DNA甲基化的新方法:先将基因组DNA片段变性,然后用亚硫酸氢盐处理,可以将其中未甲基化的胞嘧啶(Cytosine,C)转换成尿嘧啶(Uracil,U),再通过PCR技术扩增后把尿嘧啶转换成胸腺嘧啶(Thymine,T)。相反,未转化的甲基胞嘧啶,最终以胞嘧啶形式被检测到。通过与参考基因组的比较分析,可以获得全基因组中不同时空下的甲基组化图谱.,RNA-Seq,BS-Seq,Human ENCODE project,DNA元件百科全书(英语:Encyclopedia of DNA Elements,简称为ENCODE计划)是一个由美国国家人类基因组研究所在2003年9月发起的一项公共联合研究项目,旨在找出人类基因组中所有功能组件。这是既完成人类基因组计划后国家人类基因组研究所开始的最重要的项目之一。所有在该项目中产生的数据都会被迅速的在公共数据库中公开。2012年9月5日,该项目的初步结果被整理为30篇论文并发表于自然、基因组生物学及基因组研究中。这些发表的论文显示人类基因组内的非编码DNA至少80%是有生物活性的,而非像之前认为的仅仅是“垃圾”。这个结果非常重要,因为人类基因组中98%的DNA是非编码的,意味着它们并不直接编码任何蛋白质序列。,ENCODE data in the UCSC Genome Browser,物种内部的遗传多样性,帮助我们获知很多生命活动的遗传机制;在医学和农学上有它的实际应用价值。,基因组重测序在生物领域的应用,通过了解人种差异及群体迁移等历史,驯化从野生种到农家种,A long-term selection experiment in a wide range of morphological and physiological traits.,Wild rice,Domestication,Land race,Elite varities,Genetic improvement,基因组重测序和基因分型,The next generation sequencing technologies,欢迎各位同学前来参观中国科学院植生所,物所,来参,位同,前来,Reference,Reads,观中,中国,Alignment,欢迎各位同学前来参观中国科学院植生所,物所,来参,位同,前来,观中,中国,Variation,生-物,其他复杂变异,转座子 一种可移动的遗传因子,The TE insertion in the Pigment Gene affect the Synthesis of the Purple Pigment .,Feschotte et al, Nat. Rev. Genet. 3 (5):329-341 (2002),转座子类型 DNA 转座子 逆座子 植物基因组 水稻: 40% 高粱: 60% 玉米: 80%小麦: 80%,A Local View of Transposon Insertion Polymorphisms (TIPs),序列变异类型和频率,Forward Genetics associate underlying genetic factors with a specific trait,Association mappingNatural population, e.g. ecotypes, landraces, cultivars,Linkage mappingA recombinant population from experimental crosses, e.g. F2, RIL,Traditional methodsPCRRFLPIRAPDDNA sequencingDNA chip,Genotyping,Genotyping is the process of determining differences in the genetic make-up (genotype) of an individual by examining the individuals DNA sequence using biological assays and comparing it to another individuals sequence or a reference sequence. It reveals the alleles an individual has inherited from their parents.,基因型鉴定方法,Huang and Han, 2014,Recombination populations,F2 Backcross(BC)Double haploid(DH)Recombinant inbred lines(RIL)Chromosome segment substitution lines(CSSL)Single segment substitution lines(SSSL)Near-isogenic lines(NIL),The basis for Mendels first genetic experiments 150 years agoThe key to the study of genes and genetic variation today in plant,重组自交系的图谱和连锁分析,QTL(数量性状位点)初定位,对多个性状同时进行QTL定位,定位分辩率主要取决于群体大小和基因型密度。对主效的几个QTL构建替换系后产生大样本进行图位克隆。,Chromosome Segment Substitution Lines (CSSLs),Xu et al. BMC Genomics 2010.,Recombination map of CSSL_i#C50,A large segment was substituted by Nipponbare genome on Chr6,Xu et al. BMC Genomics 2010.,CSSL_i and CSSL_j,1,163,670 SNPs between parents,QTLs,Plant height,Heading date,sd1,McCarthy et al. Nat Rev Genet, 9, 356-369 (2008),Genome-wide association analysis of fat mass identified three obesity genes.,Genome-wide association study in Human,HapMap,基因组变异与标签位点,大型矩阵:单倍体与变异位点,The pioneer work in human GWAS,7种常见病:躁郁症、冠状动脉病、局限性回肠炎、高血压、风湿性关节炎;1型糖尿病;2型糖尿病.每种病2000个病人和3000个正常人,对全基因组50万个SNP位点进行扫描和关联分析。7种病一共定位到了24个位点,2005年,Science杂志报道了第一篇GWAS研究年龄相关性黄斑变性,人类GWAS的发展历程,截至2010年底,单是在人类上就有1212篇GWAS文章被发表,涉及210个性状。,目前GWAS研究主要采用两阶段或多阶段方法:在第一阶段用覆盖全基因组范围的SNP进行对照分析,统计分析后筛选出较少数量的阳性SNP进行第二阶段或随后的多阶段中采用更大样本的对照样本群进行基因分型,然后结合两阶段或多阶段的结果进行分析。,GWAS最大的局限性:同一疾病由大量的、不同的低频变异决定;比如1万人得了同一种病,其中10人是由于基因A发生了变化,20人是由于基因发生了变化而统计学对低频变异毫无办法,唯有提高样本量。,复杂性状的GWAS极大的样本量,体重指数;34 万人;97个位点;总共解释2.7%的表型变异,Experimental design for GWAS in plant,Scheme A Deep sequencing for 1000 lines High-quality SNPs Genotype dataset with rare missing data Scheme B Deep re-sequencing for 30 lines Selection of 1M tag SNPs Design of genotyping microarray Genotyping of 1000 lines using microarray Scheme C Low-pass re-sequencing for 1000 lines A new analytical framework High-quality SNPs with few missing data,Genome-wide association study in Arabidopsis,A GWA study of 107 phenotypes was carried out in Arabidopsis thalianaAn example: allelic diversity of resistance to microbial infection,Atwell et al., Nature 465, 627-631 (2010)Todesco et al., Nature 465, 632-636 (2010),Arabidopsis 1001 genomes,The framework for rice GWAS,Rice germplasm,Re-sequencing,Discovery of common variants (SNPs),SNP Genotyping,Construction of haplotype map,Association Study,Finding the relationship between phenotype and genotype,Candidate gene capture,Selecting causal genes by re- annotation of associated loci,Validate the effect of candidate genes,Using genetic transformation or T-DNA mutant,Modern cultivars, traditional landraces,Germplasm collection,Genotype,Phenotype,Whole genome screening,Phenotype prediction through statistical modeling,Improved varieties,Validation in related samples with known genotypes and phenotypes,Molecular-designed breeding,Mining candidate genes through expression profiles or fine mapping,Validation through T-DNA mutants or genetic transformation,GM or MAS for validated genes,GWAS,Whole genome prediction,基因组的产业化应用:分子育种,紫花,白花,紫叶柄,绿叶柄,抗病,芝麻中复杂性状的遗传解析,a,c,b,芝麻品种材料的群体结构,1,2,3,4,5,6,7,8,9,10,11,12,13,14,15,16,Yield components,Morphological characteristics,Coloration and disease resistance,Growth cycle,Fatty acid composition,Oilseed compound,芝麻中56个农艺性状的全基因组关联分析,a,Lipase,SiPPO,LTP,LTP,SiNST1,Lipase,-Log(P),b,c,d,e,GWAS on oil content,SiPPO,SiNST1,High oil allele: ACA (Thr) Low oil allele: AAA (Lys),芝麻中控制油份含量的主要位点,b,c,a,Pearson r,Oil content,芝麻中控制脂肪酸含量的主要位点,One capsule per axil,Three capsules per axil,a,c,芝麻中控制蕨果数的主要位点,基因组,杂种优势现象,分子水平深入解析杂种优势的遗传基础,母本,杂交稻,父本,母本,杂交稻,父本,分子层面解析,杂种优势的高效利用为我国的粮食安全做出了巨大贡献,杂交水稻育种技术的成功是我国近几十年来取得的一项重要科技成就。杂交稻的高产来自对水稻杂种优势现象的利用。,品种1(父本),杂交稻(子一代),品种2(母本),水稻存有大量的品种材料,蕴含丰富的遗传多样性,子一代的产量表现超越双亲,这一现象称为杂种优势,水稻品种杂交形成的子一代具有杂种优势,高精度的水稻基因组变异图谱,1,2,3,4,5,6,7,8,9,10,11,12,染色体,遗传群体材料,亲本,破解水稻杂种优势之谜,全面、系统地鉴定出了控制水稻杂种优势的主要遗传位点,发现来自母本的少数等位基因通过不完全显性,改善了水稻植株的结实率

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论