版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
总体工作流程概 实验流 生物信息分析流 结 数据概 2组概 3组组 3.1成 重复序 非编码 4功能分 分泌蛋 比较 物种进 信息挖掘推 方 原始数据的质 组 3组组 3.1成 重复序 4功能分 分泌蛋 比较 物种进 ............................................................................................................................分析结果文件列 常用数据格式介 BLAST 进化分 8................................................................................................................................... 真菌组Denovo结题报概述:通过IlluminaHiseq2000平台,样品1产出xxMb数据。基于数据组装得到样品1组大小为xxxMb,GC含量xx%,共xx个scaffold,xx个contig。组组分rRNAxx个。总体工作流程概述1实验流程。DNA样品被接收后,对样品进行检测;然后用检测合格的样品构建文库:首先采用超声法Covaris或者Bioruptor将大片段DNA(如组DNA、BAC或长片段PCR产物)随机打断并产生主带小于800bp的一系DNA片段,然后用T4DNAPolymerase、KlenowDNAPolymeraseT4PNK将打断形成的粘性末端修复成平末端,再通3'端加碱基“A”DNA3'端带有“T”碱基的特殊接头连接,用电泳法选择需回收的目的片段连接产物,再使用PCR技术扩增两端带有接头的DNA片段;最后,用合格的文库进行cluster和。生物信息分析流程图2信息分析流程图。(1)数据过滤:对原始数据下机数据进行过滤,获得CleanData;(2)组装:使用SOAPdenovo1.05软件对CleanData进行组装;(3)组组分分析,包括(a)成分;(b)重复序列分析,包括RepeatMasker,RepeatProteinMasker,Denovo和TRF四种方法;(c)非编码RNA分析:包括rRNA、tRNA,sRNA、snRNA和miRNA;(4)功能分析,包括(a)通用功能注释:使用GO、KEGG和Swiss-Prot,以及NR和COG数据对的ORF进行功能注释:(b)病原真菌分析:包括CAZy、PHI、P450数据库注释;(c)分泌蛋白;(5)比较组学分析,包括(a)结构变异(共线性);(b)共有和特有;(c)物种进化,包结 Mb数据
样品样品
Lowquality
说明:InsertSize,插入片段长度;ReadsLength,reads长度;RawData,原始数据大小;Adapter,接头所占比例;Duplicaiton,相同reads所占比例;Totalreads,总的reads条数;Filteredreads,过滤掉reads所占百分比;Lowqualityfilteredreads,低质量reads所占百分比;CleanData,交付数据大小。结果:Samplename/1.Cleandata/2组概组装前通过K-mer分析初步判断样品的组大(参考实际以组装结果为准杂合情况和重复序列信息,结果显示:样品1组大小约为xxxMb,详细如下图所示图2- 布,而在实际数据中,由于错误的存在会导致低深度的K-mer数目占非常大的比例,同时,对于某些
%, 个表2-1样品1组组装结果统 TotalNum(#)TotalLength(bp)N50(bp)N90MaxLength(bp)MinLength(bp)SequenceGCScaffold在N处打断之后的Contig图2- GC含量与深(Depth)关联分析统计图。横坐标是GC含量,纵坐标是平均深度3组组 bpC 个 个组组分分析后发现,样品2的组含有xx个,总长度为xxbp,其中外显总
bpCDS
tRNAxx个,rRNAxx个。表3-1组组分结果统 GenomeSize(Mb)GCContent(%)NumberofGeneExons(#)CDS(#) LengthofGeneCDS(bp)Intron(bp)AverageLengthofGeneCDS(bp)Intron(bp)TotalLengthofRepeatSize(bp)RepeatSize/Genome(%)tRNANumber(#)rRNANumber(#)sRNANumber(#)snRNANumbermiRNANumber3.1成表3-2样品1预测统计Gene Exons CDS Introne说明:GeneStat:的总体情况;ExonsStat:外显子的总体情况;CDSStat:CDS的总体情况;IntroneStat:内
两类,后者主要包括长散在重复序列(LongInterspersedElements,LINE)和短散在重复序列(ShortInterspersedElementsSINE)两类。我们使用四种方法对以上重复序列进行预测,结
bp3-31 Repeatsize %in说明:Type:预测重复序列的方法;RepeatSize:重复序列的总长;%inGenome重复序列占组的百分比。Total是三种方法找到的重复序列去冗余后的总的结果。
Length %in Length %in Length %in Length %in数据库预测出的转座子的结果统计;ProteinMaskTEs:用RepeatProteinMasker的预测结果;Denovo:使用Denovo方法的预测结果;CombinedTEs:综合两种方法的去冗余后结果。Total是几类转座子去冗余后的综非编码sRNA、rRNA、tRNA、snRNAmiRNA等,其中:sRNA:sRNA在微生物三个生物界中在细菌中被发现的较长度在5SrRNA四种;nt(ORF,snRNA(small(spilceosome)的主要成3-51RNA %ingenomerRNA(bydenovo说明:从左到右分别为ncRNA的类型、ncRNA的个数、ncRNA的平均长度、ncRNA的总长度、占组结 :Sample 4功能分通用功能注释GO数据库注GO的全称是GeneOntology,1988年由本体创立本体论数据库,其分为ComponentFunctionProcess KEGG数据库注KEGG全称为KyotoEncyclopediaofGenesandGenomes1995年由KanehisaLaboratories数据库将生物通路划分为八大类,每一大类下还有细分,每一类均标示上与之相关的, Swiss-Prot数据库注释COG数据库注COG,全称是ClusterofOrthologousGroupsofproteins,由NCBI创建并的蛋白数据库,根据细菌、藻类和真核生物完整组的编码蛋白系统进化关系分类构建而成。通过比对可以将某个蛋白序列注释到某一个COG中,每一簇COG由直系同源序列构成,从而可以推测该序列的功能。COG数据库按照功能一共可以分为二十五类,其统计结果如下图: 功能注释COG功能分类NR数据库注并,其特点在于内容比较全面,同时注释结果中会包含有物种信息,可作物种分类用。结 病原真菌致病性研究病原与宿主互作数据库(PHI)注PHIPathogenHostInctions,病原与宿主互作数据库,其内容经过实验验证,主碳水化合物相关酶(CAZy)数据库注释CAZyCarbohydrate-ActiveenZYmesDatabase,碳水化合物酶相关的专业数据库,内容包括能催化碳水化合物降解,修饰,以及生物合成的相关酶系。其包含四个主要分还包含与碳水化合物相关的modules(Carbohydrate-BindingModules,CBMs。4-1134细胞色素P450数据库注释真菌细胞色素P450数据库,来源113个真菌以及卵菌,共8,731个P450,根据基InterPro数据库中的位置,一共分为16tribe-MCL2,579类。结 :Samplename/4.Genome_Function/Pathogen_Fungus_ 比较结构变异(共线性够显示序列的插入、缺失等信息。通过该项析可以获得菌株间组在进化过程中所发生结构性变异情况(重排等,比如具有类似功能的簇在不同菌株中位置的变化等。图5-1样品1与参考序列xx核酸线性共线性图。图中横轴是所测组,纵轴是参考物种组。图中颜色较浅的水平或垂直的直线表示各个scaffold之间的分割。红色线条为比对结果最优的序列在两个组上结 共有和特有分析比较不同菌株(3-4个)的序列,共同拥有的为共有(多数为菌株生表5-1CorePan结果统Core- Pan-#Gene #Gene Totalsize 图5-2所有菌株稀释曲图5-3去除Core后的热结 (MP,(ML,TreeBeST,PHYLIP等,这里我们使用TreeBeST构建系统发育树。5-4结 :Samplename/6.结 :Samplename/6.信息挖掘推荐数据库数据注释结果的初级应用GOInterproquickGO数据库,因此,该数据库结果产果以*.iprscan.go结尾,因为GO数据库三大类之间互有,所以对于同时注释上多个GO ;DNAbinding;MolecularFunction ;DNABiologicalFunction学途径(BiologicalProcess;分子功能上其与DNA结合有关,而在生物学途径上则与DNA甲基化有关;由此说明,该与DNA甲基化过程中的DNA结合有关。KEGG数据我们关注丙氨酸代谢通路相关,这时我们可以通过关键字在*.kegg.list.anno中寻找含有 4e-126tbi:Tbis_0822 K00259ald alaninedehydrogenase Metabolism;AminoAcidMetabolism;Alanine,aspartateandglutamatemetabolism[PATH:ko00250]Metabolism;MetabolismofOtherAminoAcids;Taurineandhypotaurinemetabolism[PATH:ko00430] mau:Micau_2216K00135E1.2.1.16,gabDsuccinate-semialdehydedehydrogenase(NADP+) Metabolism;CarbohydrateMetabolism;Butanoatemetabolism[PATH:ko00650]Metabolism;AminoAcidMetabolism;Alanine,aspartateandglutamatemetabolism[PATH:ko00250]Metabolism;AminoAcidMetabolism;Tyrosinemetabolism[PATH:ko00350]级来看,其属于氨基酸代谢中的丙氨酸、天冬氨酸和谷氨酸代谢(Alanine,aspartateandglutamatemetabolism,因此,该通路即是我们所需要寻找的通路。之后我们查看*. Gene001368,K13821,1.5.99.81.5.1.12情况,可以打开KEGG_MAP 下的map00250.png文件即可。Swiss-Prot数据库Swiss-Prot较其他库的优点在于其结果通过了人工验证,可信度较高。比如某GO,KEGG以及Swiss-Prot数据库注释结果如下: ;membrane;CellularSwiss-Prot:{Y6609_RHOSRUPF0060membraneproteinRHA1_ro06609OS=Rhodococcussp.(strainRHA1)GN=RHA1_ro06609PE=3SV=1}由上面可见,Swiss-Prot的注释结果最为完整,不仅说明了该的功能,还说明了验name,GN1:Evidenceatproteinlevel2:Evidenceattranscriptlevel3:Inferredfromhomology4:5:COG数据GGGOCOGNR:{UspA-containingprotein[JonesiadenitrificansDSMCOG:{COG0589UniversalstressproteinUspAandrelatednucleotide-bindingproteinsTSignaltransductionmechanisms;}GO:IPR006016;由上面注释结果可以看出,KEGG注释结果缺失;COG注释到了与应激、核苷酸结合相关的蛋白,其属于信号转导机制中的一部分;Swiss-Prot结果也验证了该与应激相COG功能分类有其自身特点,能够弥补其他两个分类数据库(KEGG,GO)注释结果不确NR识,因此需要结合其他数据注释结果进行确定。另外,NR库因为在建立之初就包含有物种依然用Swiss-Prot使用的举例,其在NR库注释结果为:{hypotheticalproteinBcav_0666BeutenbergiacavernaeDSM12333]},在没有其他数据库参考下,仅知道其为假定中注释到的物种不一致,因此NR库的物种注释结果也仅作为参考。PHI数据(PH:XXX(TX:XXXCAZy数据GH55分EC编码,但是有部分酶类的功能来源于文献描述,这时候注释结果中就是显示NCBI的PMID信息。不同类型真菌组分析推病原真菌致病性研究动物病原真菌致病性研究易被清除,为致病提供前提条件。如Blastomycesdermatitidis的cellwalladhesionWI-1蛋白通过非共价键相互作用,调节真菌细胞壁与单核巨噬细胞的“complementtype3receptors”的绑渗透和散播阶段:动物病原真菌侵染后,通过邻近组织连续或进入血液进行散播。植物病原真菌致病性研究effector蛋白(其氨基酸的长度与其功能也有一定2个转运系统。工业酵母表型关联分析不同的酵母菌株在同样的培养条件下有不同的表型(比如高产、耐受乙醇、是否可以直接利用木质维素水解发酵等型的差异。为了找到与表型相关的组改变,首先通过组获得不同表型的酵母菌株通较全差NP和InDel合的排。参考文献:SwinnenS,SchaerlaekensK,PaisT,ClaesenJ,HubmannG,etal.(2012)Identificationofnovelcausativegenesdeterminingthecomplextraitofhighethanoltoleranceinyeastusingpooled-segregantwhole-genomesequenceysis.GenomeRes22:975-984.PartsL,CubillosFA,WarringerJ,JainK,SalinasF,etal.(2011)Revealingthegeneticstructureofatraitbysequencingapopulationunderselection.GenomeRes21:1131-1138.Greene,J.P.,F.Morandi,etal.(2012).Whatisyourdiagnosis?InfectionwithdimorphicBlastomycesdermatitidis.JAmVetMedAssoc240(8):945-946.Mayer,F.L.,D.Wilson,etal.(2013).Candidaalbicanspathogenicitymechanisms.Virulence4(2):119-128.Islam,M.S.,M.S.Haque,etal.(2012).Toolstokill:genomeofoneofthemostdestructiventpathogenicfungiMacrophominaphaseolina.BMCGenomics13:493.Pedersen,C.,E.V.vanThemaat,etal.(2012).Structureandevolutionofbarleypowderymildeweffectorcandidates.BMCGenomics13(1):694.Rafiqi,M.,J.G.Ellis,etal.(2012).Challengesandprogresstowardsunderstandingtheroleofeffectorsinnt-fungalin ctions.CurrOpin ntBiol15(4):477-482.方原始数据的质控平台上产生的原始数据(RawData)存在一定比例低质量数据,为了使得后续分析 read1
bp
去除质量值连续≤2的碱基数达到一定程度的reads(默认40%,设置为xx个 去除adapter污(默认adapter序列与read序列有15bp的overlap,设置 去除duplication上述的处理方式均同时对read1read2操作。该处理一般情况下会去除10%~20%的数据(小片段文库数据。大片段文库数据由于duplication比较高,去除数据量会比较多,没有处理后的数据称为CleanData。组再根据readspaired-endoverlap关系,对组装结果进行局部组装和优化。软件:SOAPdenovo;版相关:常用参数设置:–k*p8FM2d1-Ru-k*-o参考文献:Lietal(2010).Denovoassemblyofhumangenomeswithmassivelyparallelshortreadsequencing.GenomeResvol.20(2).Lietal(2008).SOAP:shortoligonucleotidealignmentprogram.BioinformaticsVol.243组组3.1成Homology(同源预测)是通过组序列和参考蛋白集进行比对来确定位置的,预测的结果特点是数目少,但是准确率很高。通过genewise软件预测,用此方法需要提软件:genewise[1];版本-- SNAP也是通过隐模型工作的,自身是没有现成的训练集的,需要参考物种进行训练集的构建。如果要使用这个两个软件,必须寻找一个参考物种,得到它的组序列和位置信息的gff文件,自己来构建训练集来进行预测。<genome.fa> -- gram.hmm--prefix Augustus运用隐模型,隐马模型abinitio预测。基本要素包括两个状态(观察状态、隐含状态)和三个概率(初始概率、转移概率和两态对应概率DNA序列和置信息的gff文件,自己来构建训练集来进行预测软件:Augustus[3];版 -- --GeneMarkes是通过隐马模型工作的,但是它不需要参考物种,是自身训练的,不需要软件:Genemarkes[4];版相关: 参考文献:BirneyE,ClampM,DurbinR(2004).GeneWiseandGenomewise.GenomeMay;14(5):988-Johnson,A.D.,Handsaker,R.E.,etal(2008).SNAP:Aweb-basedtoolforidentificationandannotationof SNPsusingHapMap.Bioinformatics,24(24):2938-2939.OliverKeller,MartinKollmar,etal(2011).Anovelhybridgenepredictionmethodemployingproteinmultiplesequencealignments.Bioinformatics,:10.1093/bioinformatics/btr010.Ter-HovhannisyanV.,LomsadzeA.,etal(2008).Genepredictioninnovelfungalgenomesusinganabinitioalgorithmwithunsupervisedtraining.GenomeResearch,Dec18(12):1979-90.Denovo方法来查找转座子序列。具体RepeatMasker软件(Repbase数据库、RepeatProteinMasker软件(使用RepeatMasker自带的转座子蛋白库)Denovo(buildXDFDatabase软件以自身序列建软件:Repeatmasker[1];版本:3-3-相关: –liblib文相关: 参考文献:SuryaSaha,SusanBridges,etal(2008).Empiricalcomparisonofabinitiorepeatfindingprograms.NucleicAcidsResearch,Feb.G.Benson(1999).Tandemrepeatsfinder:aprogramto yzeDNAsequences.NucleicAcidsResearch,Vol.27,No.2,pp.573-580.非编码RNA预测tRNA区域和tRNA的二级结构;通过Infernal软件,与Rfam[3]数据库进行比对得到sRNA*注:通过比对方法找到的rRNA较为准确但是不够全面,尤其是在缺少近缘物种rRNA作为参考序列的情况下,就只能使用rRNAmmer软件进行从头预测。软件:RNAmmer相关常用参数设置:–s –m –gff*. –f相关 –o*.tRNA–f*相关常用参数设置:–p –W –e –v –b –m –i 参考文献:Lagesenk,HallinP.F,RødlandE,etal(2007).RNAmmer:consistentandrapidannotationofribosomalRNAgenes.Nucl.AcidsRes,35(9):3100-3108.LoweT.M,EddyS.R(1997).tRNAscan-SE:AProgramforImprovedDetectionofTransferRNAGenesinGenomicSequence.Nucl.AcidsRes.25(5):0955-964.GardnerP.P,DaubJ,TateJ.G.,etal(2009).Rfam:updatestotheRNAfamiliesdatabase.Nucl.AcidsRes.37(suppl1):D136-D140.4功能分成,提供的BLAST结果为M8格式,同时还提供部分数据库的注释结果汇总。KyotoEncyclopediaofGenesandGenomes(KEGG1][2][3];版本:59ClusterofOrthologousGroupsofproteins(COG4][5];版本:GeneOntologyGO7]PathogenHostIn ctionsPHI)[8];版本:3.2FungalCytochromeP450Database[9];版本:1.1(参考文献:KanehisaM,GotoS,KawashimaS,OkunoY,HattoriM(2004).TheKEGGresourcefordecipheringthegenome.NucleicAcidsRes32(Databaseissue):D277–80.KanehisaM(1997).Adatabaseforpost-genomeysis.TrendsGenet13(9):KanehisaM,GotoS,HattoriM,Aoki-KinoshitaKF,ItohM,KawashimaS,etal.(2006).Fromgenomicstochemicalgenomics:newdevelopmentsinKEGG.NucleicAcidsRes34(Databaseissue):TatusovRL,KooninEV,LipmanDJ(1997).Agenomiconproteinfamilies.Science.Oct24;278(5338):631-7.TatusovRL,FedorovaNDetal.(2003).TheCOGdatabase:anupdatedversionincludeseukaryotes.BMCBioinformatics.Sep11;4:41.Magrane,M.andUniProtConsortium(2011).UniProtKnowledgebase:ahubofintegratedproteindata.Database(Oxford),bar009.BardJ,WinterR(2000).GeneOntology:toolfortheunificationofbiology.NatGenet.25:25-nVargasWA,MartínJMetal(2012).tdefensemechanismsareactivatedduringbiotrophicandnecrotrophicdevelopmentofColletotricumgraminicolainmaize.ntPhysiol.2012n,M.,etal(2007).TheCytochromeP450EngineeringDatabase:anavigationandpredictiontoolforthecytochromeP450proteinfamily.Bioinformatics.23,2015-2017.CantarelBL,CoutinhoPM,RancurelC,BernardT,LombardV,HenrissatB(2009).TheCarbohydrate-ActiveEnZymesdatabase(CAZy):anexpertresourceforGlycogenomics.NucleicAcidsRes37:D233-238(cTPmTPSPother功能注释。other(cTP参数:Lscore>0,Lscore=-918.235-123.455*(MeanS 软件:TMHMM,版本:2.0参考文献:Klee,E.W.andL.B.Ellis(2005).Evaluatingeukaryoticsecretedproteinprediction.BMCBioinformatics6:256.EmanuelssonO,BrunakS,etal(2007).LocatingproteinsinthecellusingTargetP,SignalPandrelatedtools.NatProtoc.2007;2(4):953-71.比较结构变异(共线性P1P2P2P1BLASTp比对,对库中的每个蛋白选取最好的比对结果,得到蛋白对(besthit);最后两次比对一致的蛋白对保留,该蛋白对的一致值为两次比对一致值的均值。将2中得到的蛋白对,根据其位置信息,按相同比例缩小后标到图上。常用参数设置设置:-b200c65extendl参考文献:[1]S.Kurtz,A.Phillippy,A.L.etal(2004).Versatileandopensoftwareforcomparinglargegenomes.GenomeBiology,5:R12.共有和特有首先取参考菌株的集为Reference集,选取剩余样品中的一个样品Query集与Reference集进行BLAST比对,根据比对的长度与identity值过滤比对结果,然后如果在Reference与Query中的BCR值均小于设定的阈值,则认为Reference与Query为非同源,将Query加入到Reference集中,构成一个新的Reference集。依次取样品,重复进行上述步骤,最后得到多个样品的非冗余的Reference集即为多个样品的Pan集。Reference与Query的BCR值计算如下:注:其中Match为二者比对有效长度Length(R)为Reference长度Length(Q)为Query长度将每个样品的集与最终的Pan集进行比对,计算Pan集中每个在每个软件:BLAST;版本常用参数设置设置:-pblastnm8FFa3e1e-5参考文献:[1]Qin,J.,R.Li,etal.(2010).Ahumangutmicrobialgenecatalogueestablishedbymetagenomicsequencing.Nature464(7285):59-65.SNP矩阵构建系统进化树。对于每一株菌,按照相同顺序将SNPfasta格式的序列(其中一个为参考序列,作为输入文件。用TreeBeST[1]的PHYML(最大似然法)算法构建系统进化树,bootstraps参数设置为1,000。软件:TreeBeST,版本:treebest-常用参数设置:treebestphyml-b1000参考文献:[1]TannisthaNandi,CatherineOng,ArvindPratapSingh,etal(2010).AGenomicSurveyofPositiveSelectioninBurkholderiapseudomalleiProvidesInsightsintotheEvolutionofAccidentalVirulence.PLoSPathogens6:1-15.采用Muscle软件[1][2]对聚类的进行多序列比对后,将蛋白质比对结果转化为CDS区域的氨基酸多序列比对结果;使用TreeBeST软件[3]对Muscle多序列比对结果采用NJ法进行的建树分软件:Muscle 常用参数设置设置:-inoutmaxiters软件:TreeBeST,版本:treebest-: -b参考文献:Edgar,R.C.(2004)MUSCLE:multiplesequencealignmentwithhighaccuracyandhighthroughput.NucleicAcidsRes.32(5):1792-1797Edgar,R.C.(2004)MUSCLE:amultiplesequencealignmentmethodwithreducedtimeandspacecomplexityBMCBioinformatics,(5)113.TannisthaNandi,CatherineOng,ArvindPratapSingh,etal(2010).AGenomicSurveyofPositiveSelectioninBurkholderiapseudomalleiProvidesInsightsintotheEvolutionofAccidentalVirulence.PLoSPathogens6:1-15.分析结果文件列表||--Sample|||--[过滤后的数据|| |--|| |--|| |--*.Rawdata.[处理前碱基分布图|| |--[处理前碱基质量分布图|| [处理后碱基分布图|| [处理后碱基质量分布图|| |--|||--[组组装结果|| |--[组装结scaffold文件|| |--[组装结contig文件|| |--|| |--[组装结果统计|| |--[kmer分析图|| [GC与深度分布图|| [组组分分析结果|| |-- [组组分统计|| |--[预测结果|| |--[预测的GFF3格式文件|||||--[预CDS序列|||||--[的蛋白序列|||||--[长度分布图|||||--[的结果统计||||-[重复序列分析结果|||||--|||||--|||||--[RepeatProteinMasker的初始结果|||||--|||||--|||||--|||||--[重复序列的统计结果|||||--[转座子的统计结果|||||--[串联重复序列的统计结果||||-|||||--|||||--|||||--|||||--|||||--|||||--|||||--|||||--|||--[注释结果|| [功能注释结果||| |--||| |--[与GO数据库的对应情况||| |--[与wego的对应情况||| |--[与IPR的对应情况||| |--[所对应的GO的二级分类统计直方图||| |--||| |--||| |--||| |--[KEGG代谢通路图注释上的信息||| |--||| |--||| |--||| |--||| |--||| |--||| |--||| |--||| |--||| |--[整合所有注释结果的表格文件|||[致病真菌分析||| |--|||||--|||||--|||||--|||||--|||||--|||||-- |--6. [比较组分析|||[共线性分析的结果|||||--[共线性图|||||--[两个物种蛋白集的比对结果列表|||||--[两个物种蛋白集的比对结果统计||||--[构建系统发育树|||||--*.|||||--*.|||||--*[用SNP序列构建的系统发育树||||--[分析的结果|||||--[的聚类结果|||||--[聚类结果的统计||||[单拷贝列表||||[单拷贝的统计|||||--*[各内两两间的Ka/Ks结果|||||--*[的序列、比对及系统发育树等信息||||--[共有-特有分析的结果|||||--[共有序列文件|||||--[共有在每个样品中分布矩阵|||||--[非共有序列文件|||||--[非共有在每个样品中分布矩阵|||||--[所有非冗余序列文件|||||--[所有非冗余在每个样品中分布矩阵|||||--[统计结果文件|||||--[非共有在每个样品聚类分布热图|||||--[共有溶解曲线图|||||--[所有溶解曲线图|||||--[聚类|||||--[菌株特异统计文件|||||--[菌株特异分析结果|||||--*.core-[菌株共有-特异的常用数据格式介绍1read1fastq文件x1.fq中第一条reads:+abb_aab_aa`a^aba^D[`a_`aaaa`_a_`aread2fastq文件x2.fqreads:+行说1@Reads23ReadsID(ReadsID可省略42 C469_1 C483_1 scaffold5 scaffold5 scaffoldyespaired-列 说组成目标序列的contig或gap序片段类型(W-contig或N-片段ID或gap片段起始位置或gap类片段
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2026年河池市农村信用社联合社秋季校园招聘笔试备考题库(浓缩500题)附答案详解(轻巧夺冠)
- 彭水苗族土家族自治县农村信用社联合社秋季校园招聘笔试备考题库(浓缩500题)含答案详解(达标题)
- 2026年阜阳市农村信用社联合社秋季校园招聘笔试备考题库(浓缩500题)附答案详解
- 许昌市农村信用社联合社秋季校园招聘笔试备考题库(浓缩500题)及1套完整答案详解
- 2026年淮南市农村信用社联合社秋季校园招聘笔试备考题库(浓缩500题)附答案详解(综合题)
- 2026年杭州市农村信用社联合社秋季校园招聘笔试备考题库(浓缩500题)及1套参考答案详解
- 2026年来宾市农村信用社联合社秋季校园招聘笔试备考题库(浓缩500题)附答案详解(轻巧夺冠)
- 东营市农村信用社联合社秋季校园招聘笔试备考题库(浓缩500题)含答案详解(典型题)
- 云南省农村信用社联合社秋季校园招聘笔试备考题库(浓缩500题)含答案详解(基础题)
- 荆门市农村信用社联合社秋季校园招聘笔试备考题库(浓缩500题)附答案详解ab卷
- 鸿蒙教学课程课件
- 2025年航空光电吊舱行业当前发展趋势与投资机遇洞察报告
- 2025年变电运行工值班员测试试题含答案
- 2024年衢州职业技术学院单招《语文》能力检测试卷附参考答案详解【基础题】
- GB/T 34399-2025医药产品冷链物流温控设施设备验证性能确认技术规范
- 2024株洲市辅警招聘考试真题
- 船舶载运锂电池安全技术要求解读及实施策略
- 农业技术推广方式
- 混改公司管理办法
- 2024年秋新沪科版九年级上册化学全册教学课件(新教材)
- 现代生物技术概论教案-明东风
评论
0/150
提交评论