华大基因讲座PPT课件.ppt_第1页
华大基因讲座PPT课件.ppt_第2页
华大基因讲座PPT课件.ppt_第3页
华大基因讲座PPT课件.ppt_第4页
华大基因讲座PPT课件.ppt_第5页
已阅读5页,还剩64页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

基于新一代测序技术的基因组学研究和系统育种策略 许姣卉博士华大基因研究院科研合作总监xujh 1 技术是科学发现与产业发展的源动力 2 1950 1960 1970 1980 1990 2000 2010 测序技术的跨跃式发展进程 DiscoveryofDNAstructure 1953 DevelopmentofSangerSequencing 1977 InventionofAutomatedFluorescentSequencer 1985 InventionofCapillarySequencer 1996 InventionofAppliedBiosystemsSolidSystem 2007 InventionofIlluminaGenomeAnalyzerSystem 2006 Inventionof454GS20Sequencer 2005 3 IlluminaSolexaFlowcell Flowcell Aflowcellcontainseightlanes Lane1 Lane8 Eachlanecontainsmultipletiles total100Eachtileisimagedfourtimespercycle oneimageperbase Imagefrom1tile 焦磷酸测序 边合成边测序 边连接边测序 4 1P 百万亿次 日新月异的生物信息技术 5 碱基产量和测序成本反向曲线 6 测序时间 费用的变化 7 NCBI数据的变化 8 新一代测序技术正在形成新的产业革命 9 传统分子育种的两条思路 10 新的系统育种策略 Traditionalfindingmethod 12 Themethodonre sequencing 13 部分案例 14 中国农业科学院蔬菜花卉研究所InstituteofVegetablesandFlowersChineseAcademyofAgriculturalSciences WorkPlan 15 15 1全基因组从头测序的应用 How BACtoBACWGS组装质量 测序序列长度构建片段长度测序深度三个阶段基因组调查 repeats GC genedistributions 框架图 contig 5kb scaffold 20Kb singlebaseerrorrate20Kb scaffold 300Kb singlebaseerrorrate 0 001 WhyGenome 一个物种基因组序列图的完成 就意味着这一物种科研和产业革命性的新开端 向仲怀院士 16 DataanalysisTools Genomeassembly RePSSOAP GenomeAnnotation BGFReAS ComparativeGenomics FGFKaKS CalculatorCAT 基因组生物信息分析 1 全基因组基因详细注释 基因组组分分析 编码基因预测 重复序列注释 Non codingRNA基因注释 microRNA基因注释 tRNA基因注释 假基因 Pseudogene 注释2 基因功能注释 GO注释 GeneOntology InterproScan注释 调控Motif预测 Pathway注释 3 比较基因组及分子进化分析 物种特有基因组区段检测 物种特有基因检测 快速进化基因检测 共线性分析 SyntenyBlock 基因家族分析 17 2基因组重测序的应用 WhyGermplasmgenomics 对有参考基因组的群体 个体基因组测序可以检测到各种序列水平的变异 例如SNPs Indels Structurevariations Copynumbervariations等 通过对核心种质进行重测序以及与表型的关联性分析 揭示作物品种的多数等位基因变异 18 SNP的检测 Deletion的检测 19 测10X深度 覆盖95 的基因组9311品系SNP的最低频率为1 5 2 kb 共获得80万SNP 日本晴 粳稻 品系SNP的最低频率为3 kb 获得100万SNP 两个水稻品系的SNP检测 个体水平研究 20 水稻等栽培植物的起源模式和驯化的群体遗传学基础利用多位点核基因序列 结合叶绿体DNA等标记 研究水稻和重要栽培植物 茄子 茭白和香蕉 的起源地和起源时间 探讨其野生近缘类群中的遗传变异和群体遗传结构 探讨栽培植物驯化过程中的群体遗传动态和人工选择的后果 重要家养动物的起源和驯化利用线粒体全基因组 Y Z 染色体以及核基因 阐明家鸡 猪 马 牦牛 黄牛 水牛 绵羊和山羊等家养动物的遗传多样性及群体分化 揭示其起源地 驯化时间及迁移分化模式 探讨驯化过程中的创群者数量及其地理分布 发展新的性染色体和常染色体遗传标记系统 建立家养动物群体基因组学研究方法和技术体系和大数据集的数据分析方法 49个水稻品系的SNP检测 群体水平研究 21 25representativecultivatedricelines 22 人工选择信号的鉴定 1 test 2 Tajima sD 23 WholegenomeSNPs SNPssurroundsh4 SNPssurroundprog1 脱粒基因 形态相关基因 3 Tree basedselectiontests 24 共鉴定出517个可能受人工选择的基因 25 E g 家蚕重测序 40silkwormvarieties 29domesticatedand11wild 3 foldcoverageforeach 群体水平研究 26 Phylogeneticrelationship Wildspecies domesticatedspecies 受选择信号的鉴定 27 华北类型 欧洲温室 日本少刺 美国加工 华南类型 美国鲜食 印度野生 西双版纳 100份核心种质资源重测序 葫芦科比较基因组 30 2 3 5 4 6 7 1 8 9 10 30 Casestudy CloningoftheMgene 26 682 基因组测序 45 遗传作图 8 3 1 关联分析 比较基因组学 数字表达谱 0 2cM 50个品种 甜瓜的信息 10个组织 基因 31 M 甘氨酸非极性弱亲水 半胱氨酸极性疏水 MM mm m 32 32 Importanttraitgenesincucumber 33 3转录组分析 RNA Seq 34 2020 1 8 35 TotalRNA RichmRNA polyARNA Fragmentation 200 700bp Oligo dT primedcDNAsynthesis Solexaadaptor Single end paired endSolexaSequencing RandomhexamerprimedcDNAsynthesis RNAfragment 200 700bp RandomhexamerprimedcDNAsynthesis ScheduleofExperiment 36 DeNovo Inreference 37 Inonecases ThreefishlinesGenomeSize 1 5GbInitialproject wecanuse1GbperfishlineGenenumberreachto3000 5000 length 1Kb DeNovo RNA seq快速获得参考基因库 38 ExampleII InsectGenomeSize 16Gor6GwithoutReferenceSequenceData 10GrawdataAssemblyResults Morethan15 000Scaffolds L 1k morethan15 000genesidentified DeNovo 39 更多深层次的应用领域 转录本结构研究UTR鉴定 Intron边界鉴定 可变剪接研究 Startcodon鉴定 RNA编辑研究 基因融合的发现等 非编码区域研究基因转录水平研究基因表达差异 进化分析等全新转录区域研究 Inreference 40 ExampleI Rice TranscriptomeGenomeSize 400MbwithReferenceData 10Gb sample twosamples Result For27 655highcoveredgenes 8923genesre defined include11 208newexons 9 784intronsand3 186exonskippingevents 41 Aschematicrepresentationofcancer specificalternativegenesplicing PLoSONE 2009 4 3 e4732 应用举例 42 Transcriptomesizeestimationonrice 43 4数字表达谱 DGE 用测序取代芯片的技术革命 44 基因表达研究进入数字时代 45 mRNA 产生标签 测序 表达量检测 比对 DGE的基本原理 46 通量高1次实验即可得到足够数据 TotalTagNumber ofgenesidentified 2M 4M 6M 8M 0 100 60 40 80 0 20 基本特点 数字信号 4 2 8 Tags 表达量 47 可重复性高 基本特点 48 测量准确度高 Solexaanalysis RealtimeqPCRanalysis 独特优势 49 检测低丰度基因 tHoen P A C etal Nucl AcidsRes 2008 36 e141 低丰度基因具有重要生物学功能 独特优势 50 检测新转录本 Chromosome9 独特优势 51 检测反义链转录本 独特优势 52 数字表达谱与芯片的比较 53 分析内容 54 表达模式聚类分析 相互作用网络分析 Pathway分析 GO功能分析 55 应用DGE发表的部分文章 Thedigitalgeneration Nature 2009 March Vol458 239 240 MorrissyAS etal Next generationtagsequencingforcancergeneexpressionprofiling GenomeRes 2009July Vol 19 No 8 Heged sZ etal Deepsequencingofthezebrafishtranscriptomeresponsetomycobacteriuminfection MolImmunol 2009September Vol 46 No 15 2918 30 PeterA C tHoenetal Deepsequencing basedexpressionanalysisshowsmajoradvancesinrobustness resolutionandinter labportabilityoverfivemicroarrayplatforms NucleicAcidsResearch 2008 October Vol 36 No 21 56 我们已完成的DGE项目 57 5小RNA测序分析 58 三种主要的小分子RNA 59 SmallRNA ahotpot Publication 1991 May1st 2008 siRNA 15 842miRNA 2 641 60 技术路线 DeNovoInreference 61 分析内容 sRNA与参考序列比对sRNA与rRNAetc的比对包括rRNA tRNA snRNA snoRNA等non codingRNAsRNA与repeat的比较sRNA与mRNA exon intron的比较预测新的miRNAmiRNA差异表达分析靶基因预测 62 成功案例 AnalyzeexpressionprofileofparalleledsamplesIdentifymiRNAmarkerinthediagnosisofsomedisease Sample1 case Sample2 control Sample SolexaSequencing miRNAexpressionprofileindifferentsamples 63 元基因组研究 Metagenomics 64 www icugi org瓜类分子育种和生物研究的数据资源 含有域的公共和私人用户 信息分析数据存储数据库开发培训 咨询服务器搭建服务 生物云计算 65 百千万 基因组计划100个植物物种基因组 覆盖从单细胞藻类到开花植物的各个进化分支 包含60种最重要的农作物 绘制出每一个基因家族演化的连续过程 从进化角度解读植物

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论